Текст
                    МАТЕМАТИКА
В ТЕХНИЧЕСКОМ УНИВЕРСИТЕТЕ
У = /(Хп Х2, Хп)
А.Н. Канатников, А.П. Крищенко,
В.Н. Четвериков
ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
Издательство МГТУ имени Н.Э.Баумана
Комплекс учебников из 20 выпусков
Под редакцией В. С. Зарубина и А. П. Крищенко
I.	Введение в анализ
II.	Дифференциальное исчисление функций
одного переменного
III.	Аналитическая геометрия
IV.	.Линейная алгебра
V.	Дифференциальное исчисление функций многих переменных
VI.	Интегральное исчисление функций
одного переменного
VII.	Кратные и криволинейные интегралы. Элементы теории поля
VIII.	Дифференциальные уравнения
IX.	Ряды
X.	Теория функций комплексного переменного
XI.	Интегральные преобразования и операционное исчисление XII. Дифференциальные уравнения математической физики
XIII. Приближенные методы математической физики XIV. Методы оптимизации
XV. Вариационное исчисление и оптимальное управление XVI. Теория вероятностей
XVII. Математическая статистика
XVIII. Случайные процессы XIX. Дискретная математика XX. Исследование операций
А.Н. Канатников, А.П. Крищенко, В.Н. Четвериков
ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
Под редакцией
д-ра техн, наук, профессора В.С. Зарубина и д-ра физ.-мат. наук, профессора А.П. Крищенко
Допущено
Министерством образования Российской Федерации в качестве учебника для студентов высших технических учебных заведений
Москва Издательство МГТУ им. Н. Э. Баумана 2000
УДК 517.5(075.8)
ББК 22.161
К19
Рецензенты: акад. РАН А.Т. Фоменко, проф. В.И. Елкин
К19 А.Н. Канатников, А.П. Крищенко, В.Н. Четвериков.
Дифференциальное исчисление функций многих переменных: Учеб, для вузов / Под ред. В.С. Зарубина, А.П. Крищенко. - М.: Изд-во МГТУ им. Н.Э. Баумана, 2000. -456 с. (Сер. Математика в техническом университете; Вып. V).
ISBN 5-7038-1682-3 (Вып. V)
ISBN 5-7038-1270-4
В пятом выпуске подробно рассмотрены основополагающие понятия предела и непрерывности функций многих переменных, свойства дифференцируемых функций, вопросы поиска абсолютного и условного экстремумов функций многих переменных. Отражена связь дифференциального исчисления функций многих переменных с дифференциальной геометрией. Рассмотрены методы решения систем нелинейных уравнений.
Теоретический материал изложен с применением методов линейной и матричной алгебры и иллюстрирован разбором примеров и задач. В конце каждой главы приведены вопросы и задачи для самостоятельного решения.
Содержание учебника соответствует курсу лекций, который авторы читают в МГТУ им. Н.Э. Баумана.
Для студентов технических университетов. Может быть полезен преподавателям, аспирантам и инженерам.
Ил. 71. Табл. 1. Библиогр. 41 наэв.
Выпуск книги финансировал Московский государственный технический университет им. Н.Э. Баумана
УДК 517.5(075.8)
ББК 22.161
© А.Н. Канатников, А.П. Крищенко, В.Н. Четвериков, 2000
ISBN 5-7038-1682-3 (Вып. V)
ISBN 5-7038-1270-4
© Московский государственный технический университет им. Н.Э. Баумана, 2000
© Издательство МГТУ им. Н.Э. Баумана, 2000
ПРЕДИСЛОВИЕ
Представляем пятый выпуск серии „Математика в техническом университете44. Книга содержит материал по курсу функций многих переменных, читаемый в МГТУ во втором семестре, а также дополнительный материал по прикладным аспектам функций многих переменных (численные методы решения систем нелинейных уравнений, многомерные сплайны, теория поверхностей). Кроме того, в книгу включена глава, в которой изложены элементы теории многообразий. Этот материал может быть положен в основу спецкурса, ориентированного на студентов старших курсов.
Книга, как и другие выпуски серии, имеет развитый аппарат, поиска информации, позволяющий использовать книгу как справочник. Любое ключевое понятие в месте определения выделено полужирным курсивом. Первое упоминание ключевого понятия в каждом параграфе дано светлым курсивом. Для удобства цитирования определения, теоремы, замечания, формулы и т.п. снабжены двойной нумерацией. Например, теорема 2.1 — это первая теорема в главе 2, (2.1) — первая формула в главе 2, рис. 1.5 — пятый рисунок в главе 1.
В тексте книги используются ссылки, которые указывают номер главы или параграфа и могут относиться как к данной книге, так и к другим выпускам серии. Например, (см. 1.2) отсылает читателя ко второму параграфу первой главы этой книги, тогда как [1-7.5] — к пятому параграфу седьмой главы в первом выпуске*.
‘Детальные ссылки с указанием параграфа даются только на первый выпуск серии и относятся к изданию: Морозова В.Д. Введение в анализ: Учеб, для вузов. М.: Изд-во МГТУ им. Н.Э.Баумана, 1996. В остальных случаях приводится лишь номер выпуска, а нужное место в книге можно найти при помощи предметного указателя.
6
ПРЕДИСЛОВИЕ
Все ключевые понятия приведены в предметном указателе, помещенном в конце книги. Они следуют в алфавитном порядке по существительному в именительном падеже. Ссылки предметного указателя разделяются на основные (даны шрифтом прямого начертания) и неосновные (даны курсивным шрифтом). Основная ссылка указывает, где введено понятие, неосновная ссылка указывает место в книге или другом выпуске серии, где имеются дополнительные сведения о ключевом понятии. Ссылки на термины, введенные в других выпусках серии, содержат номера этих выпусков. Например, ссылка 1-215 означает страницу 215 первого выпуска, а ссылка II — второй выпуск (соответствующее место в этом выпуске можно найти по его предметному указателю).
Большинство используемых обозначений помещены в перечне основных обозначений. Для каждого обозначения наряду с краткой расшифровкой указаны разделы этого или других выпусков серии, в которых оно было введено. В книге приведены написание и русское произношение букв латинского и греческого алфавитов.
Перед чтением этой книги предлагаем в целях самоконтроля выполнить некоторый набор заданий. В тексте этих заданий прямым полужирным шрифтом выделены ключевые термины, значение которых должно быть известно читателю, а в конце каждого задания указана ссылка на номер выпуска серии, в котором можно найти соответствующие разъяснения.
Задания для самопроверки
1.	Что понимают под критерием некоторого утверждения? [1]
2.	Из каких этапов состоит доказательство по методу математической индукции? [I]
3.	Сформулируйте определение взаимно однозначного отображения двух множеств. Чему равна композиция прямого и обратного отображений двух множеств? Что
I
понимают под областью определения и областью значений отображения? [1]
4.	Может ли пересечение множеств совпадать с объединением этих множеств? [1]
5.	Является ли множество натуральных чисел подмножеством множества действительных чисел? [I]
6.	Что называют окрестностью точки на числовой прямой? Что понимают под проколотой окрестностью Точки? [1]
7.	Сформулируйте теорему о связи функции действительного переменного, ее предела и бесконечно малой. В каких случаях бесконечно малая функция является бесконечно малой более высокого порядка, чем другая бесконечно малая? Какова связь между бесконечно малыми и бесконечно большими функциями? [I]
8.	Какие свойства имеют действительные функции одного действительного переменного: а) непрерывные в точке и на отрезке; б) непрерывно дифференцируемые в интервале? Привести пример монотонных в интервале функций, сумма которых не является монотонной в этом интервале. [1], [II]
9.	Составьте уравнение касательной и нормали к окружности х2 + у2 = 25 в точке М(3;4). [II]
10.	В чем состоит геометрический смысл производной функции действительного переменного в точке? [II]
II.	Вычислите первую и вторую производные периодической функции y = sin4.r. Дифференцируема ли эта функция в точке х = 0? в интервале (-тг, тг)? (‘©впадают ли ее односторонние первая и вторая производные в точке х = тг? Сформулируйте необходимые и достаточные условия дифференцируемости функции действительного переменного. Приведите пример вычисления производной сложной функции. [II]
12.	Найдите направляющий вектор касательной к графику функции у = ж3 - Зж в точ ке (-1; 2). [II]
8
ПРЕДИСЛОВИЕ
13.	Для действительных функций действительного переменного запишите: а) теорему Лагранжа; б) формулу Тейлора; в) формулу Маклорена. Что называют остаточным членом формулы Тейлора и в каком виде он может быть записан? [II]
14.	Есть ли у функции у = ж2-|-я локальные экстремумы? В каких точках отрезка [—10,10] эта функция достигает наибольшего и наименьшего значений? Сформулируйте необходимые и достаточные условия существования локального экстремума функции действительного переменного. [II]
15.	Может ли ранг квадратной невырожденной матрицы быть меньше количества ее базисных строк (столбцов)? [III]
16.	Что утверждает теорема о базисном миноре? [III]
17.	Привести пример верхней (нижней) треугольной матрицы, у которой максимальное число линейно независимых строк не равно максимальному числу ее линейно зависимых столбцов. [III]
18.	Как перейти от матричной записи системы линейных алгебраических уравнений (СЛАУ) к ее векторной и координатной записям и наоборот? Как неизвестные СЛАУ разбивают на зависимые (базисные) и независимые (свободные)? [III]
19.	Какие свойства имеют решения СЛАУ и решения соответствующей ей однородной СЛАУ? Что утверждает теорема Кронекера — Капелли о совместности и несовместности СЛАУ и связана ли ее формулировка с матрицей СЛАУ? [III]
20.	Что можно утверждать об определителе матрицы: а) обратной к транспонированной; б) обратной к противоположной; в) являющейся невырожденной? [111]
21.	Доказать, что определитель диагональной матрицы равен произведению ее диагональных элементов. [III]
22.	Какие размеры имеют блоки блочно-диагональной матрицы? [III]
9
23.	К какому типу матриц относятся: а) матрица-строка; б) матрица-столбец; в) квадратная матрица? [III]
24.	Найдите ортогональную проекцию вектора Зг — ~2i4-& на направление вектора i4-J, где i, J, k — орто-нормированный базис в Кз- [HI]
25.	Составьте линейную комбинацию векторов г, j, k с коэффициентами 3, -1, 2. [III]
26.	Перечислите свойства скалярного, векторного, смешанного произведений векторов в пространстве. Как проверить, являются ли два вектора коллинеарными? три вектора компланарными? [Ill]
27.	Как вводится декартова (аффинная) система координат на плоскости и в пространстве? Что такое прямоугольная система координат? [III]
28.	Найдите декартовы (аффинные) координаты точки, являющейся ортогональной проекцией точки Л/(3; —1; 2) на плоскость, заданную общим уравнением х 4- у — z 4- 2 = 0. Составьте векторное уравнение этой плоскости и укажите ер нормальный вектор. [III]
29.	Найдите угол между прямой в пространстве, заданной каноническими уравнениями х - 1 = у 4- 1 = z + 2, и координатной плоскостью хОу прямоугольной системы координат Oxyz. [Ill]
30.	Найдите координаты вершин и полуоси эллипса ®2/4 + ?/2/9= 1. [П1]
31.	Является ли поверхность х2 4- 3$/2 4- 3z2 - х = 0 поверхностью вращения? [III]
32.	Запишите канонические уравнения поверхностей второго порядка: а) сферы; б) эллипсоида; в) эллиптического и гиперболического параболоидов; г) эллиптического конуса; д) кругового, эллиптического, гиперболического и параболического цилиндров. Что называют Направляющей и образующей цилиндрической поверхности? [Ill]
10
ПРЕДИСЛОВИЕ
33.	Как определить координаты вектора п-мерного линейного арифметического пространства Rw в стандартном базисе? [IV]
34.	Перечислите аксиомы скалярного умножения в евклидовом пространстве. Как вводится стандартное скалярное умножение в евклидовом арифметическом пространстве? [IV]
35.	Запишите матрицу квадратичной формы трех переменных ху - z2 и найдите ранг этой квадратичной формы. [IV]
36.	Является ли квадратичная форма xy — z2'. а) вырожденной; б) положительно определенной; в) неотрицательно определенной; г) знакопеременной? На какие из этих вопросов ответ можно получить с помощью критерия Сильвестра? [ IV ]
ОСНОВНЫЕ ОБОЗНАЧЕНИЯ
<4 и ► — начало и окончание доказательства
#	— окончание примера, замечания, теоремы без доказа-
тельства
V и 3	— квантор всеобщности (V;r — для любого ж) и кван-
тор существования (Зж — существует х) 1-1.5
— величины а и Ь приближенно равны 3.5 аЕА, АЭа — элемент а принадлежит множеству А (множество А содержит элемент а) 1-1.Г
А С В — множество А является подмножеством множества В (4 включено в В) 1-1.2
A U В, А А В, А \ В — объединение, пересечение, разность множеств А и В 1-1.4 п	п
U Ai и A Ai — объединение и пересечение множеств Aj, i=l	i=l
А2, ...,Ап 1-1.4
U Л; и П At — объединение и пересечение произвольного се-мейства множеств At, определяемого множеством индексов I 1.1
{ж 6 А: Р(ж)} — множество, состоящее из тех элементов х 6 А. которые удовлетворяют условию Р(х) 1-1.1
{tt-i 1 «2? • ••> «п} и {а} — конечное множество, состоящее из элементов ai, а-21 • • •, и, в частности, одноэлементное множество с единственным элементом а 1-1.1
А х В — Декартово произведение множества А на множество В 1-2.5
0	— пустое множество 1-1.1
N	— множество натуральных чисел 1-1.3
Й — множество целых чисел 1-1.3
12	____________ОСНОВНЫЕ ОБОЗНАЧЕНИЯ____________________
К — множество действительных чисел 1-1.3
—оо, +оо — бесконечные точки расширенной числовой прямой 1-1.3
п
22 О'к — сумма 77 слагаемых cq, ..., Щ;, ..., an 1-2.6 к=1
k = 1, п — число к принимает последовательно все значения из множества N от 1 до п включительно 1-2.6
min{ai,a2» ‘«чв»} и max{ai,a2,.a7i} — минимальное и максимальное из чисел си, Я2> •••>	1*3
(а, 6), [а, 6), [а, 6] — интервал, полуинтервал, отрезок числовой оси с концами а и b 1-1.3
Уз — линейное пространство свободных векторов в пространстве III
Rn — линейное арифметическое пространство 1.1
|ж|	— абсолютная величина (модуль) числа ж; длина век-
тора х в линейном арифметическом пространстве 1-1.3, IV
||х||	— норма вектора х в евклидовом пространстве IV
о
U(a,s) и U(a,s) — s-окрестность и проколотая s-окрестность точки а 6 Rn 1.1
Int/4 — внутренность множества А С Rn 1.1 дА, FM — граница множества А С Rn 1.1 Sn — zi-мерная сфера 11.1
— геометрический вектор с началом в точке А и концом в точке В III, 1.1
(а, Ь)	— скалярное произведение векторов а и Ь 3.1, III
axb	— векторное произведение векторов а и b III
abc — смешанное произведение векторов а, Ь и с III прьа — проекция вектора а на направление вектора b III п° — единичный вектор (орт) 5.1 (xi, хп) — координаты точки х 6 Rn 1.1
13
i (bi и — ортонормированный базис в Ц (правый ор-тонормированный базис в и в V3) III
£)ху, Oxyz — правая прямоугольная система координат на плоскости, в пространстве III
£	— касательный вектор к многообразию 11.4
дт — матрица, транспонированная к матрице А III djag(ai, ап) — диагональная матрица с диагональными элементами aj, .ап III
det Л — определитель матрицы А III
Rgyl — ранг матрицы А III
Д"1	— матрица, обратная к матрице А III
/: А —> В — отображение множества А в множество В 1-2.1 AcRn—>Rm — функция многих переменных, заданная на множестве А С Rn 1.2
/:-Rw~>Rm — функция многих переменных, заданная на каком-либо подмножестве в Rn 1.2
D\f) и R(f) — область определения и область значений функции / 1-2.1, 1.2
Г(/)	— график функции многих переменных f 1.2
F(4,Rm) — множество всех функций вида /: А С Rn R7n 1.2
f~l (с) — прообраз элемента с Е В при отображении /: А —> В, т.е. множество {ж Е A: f(x) = с} 1.2
тах/(я) и min f(x) — максимальное и минимальное значения хЕХ
функции /(ж) на множестве X 10.2
6= lim /(ж), f(x) -> b при х-^а — предел функции fix) в точ-А
ке а по множеству А 1.3
Ь= lim /(х), f(x) —> b при х —> а — предел функции f(x) в ТОЧ-аг—>а
ке а 1.3
fog — композиция отображений (функций) fug 1-2.4
14
ОСНОВНЫЕ ОБОЗНА НЕНИЯ
dxt ’
/'Да) — частная производная функции /(.т) в точке а по переменному .г\ 2.1
Дг/(а, A#t), At/(a), ДГ|/(а) — частное приращение функции многих переменных /(.т) по переменному з?г, соответствующее приращению этого переменного 2.1
/'(.?:)	— производная функции f(x) одного действительного
переменного в точке ж; матрица Якоби функции /(.г) многих переменных в точке х II, 2.1
df(a) — дифференциал функции многих переменных f(x) в точке а 2.7
d2f(x)	.
, fxtzj ~ частная производная скалярной функции мно-3 ‘ гих переменных /(.?:) второго порядка по переменным Xi и Xj 3.1
Ск(Х) (Ск(Х,R7n)) — множество всех скалярных (векторных) функций, у которых все частные производные до порядка к включительно непрерывны на X С R7i 3.2
С°°(Х) (C°°(X,R7n)) — множество всех скалярных (векторных) функций, у которых существуют частные любого порядка, непрерывные на множестве X С Rn; множество гладких функций на многообразии X 3.2, 11.3
dkf(x) — дифференциал скалярной функции многих переменных f(x) к-го порядка. 3.3
£/(а)	- .
— производная скалярной функции многих переменных f(x) по направлению вектора п 5.1
grad/(.i') — градиент скалярной функции многих переменных f(x) в точке х 5.2
£(/)	— производная функции /, заданной на многообразии,
по направлению касательного вектора £ 11.4
15
у(а;) -> extr — задача исследования скалярной функции f(x) на экстремум 6.4
ь
f f(x)dx — определенный интеграл функции f(x) по отрезку
*	[а, 6] VI
ТрМ — касательное пространство к многообразию М в точке Р 11.5
ТМ — касательное расслоение многообразия М 11.5
dFp — дифференциал гладкого отображения многообразий в точке Р 11.6
2>(М) — множество гладких векторных полей на многообразии М 11.8
[X, У] — коммутатор векторных полей X и Y 11.9
16
ОСНОВНЫЕ ОБОЗНАЧЕНИЯ
Буквы латинского алфавита
Начертание	Произношение	Начертание	Произношение
А а А а	a	N п АГ п	эн
В b В Ъ	бэ	О о О о	о
С с С с	ЦЭ	Р р Р р	ПЭ
D d D d	ДЭ	Q q Q q	ку
Е е Е е	e	R г R г	эр
F f F f	эф	S s S s	эс
G g G g	же	T t T t	тэ
H h H h	аш	U u и и	У
Uli	и	V v V v	вэ
J j J 3	йот	W w IV w	дубль-вэ
К k К к	ка	X x X x	икс
L 1 L I	эль	Y у Y у	игрек
Mm Mm	эм	Z z Z z	зэт
Представлен наиболее употребительный (но не единственный) вариант произношения (в частности, вместо „йот* иногда говорят „жи*).
Буквы греческого алфавита
Начертание	Произношение	Начертание	Произношение	Начертание	Произношение
А а	альфа	I L	йота	р р	ро
в 0	бета	К х	каппа	Е а	сигма
Г 7	гамма	Л А	ламбда	Т т	тау
Д 6	дельта	М р	ми	Т v	ипсилон
Е €	эпсилон	N у	ни	Ф	фи
Z <	дзета	н е	кси	X X	хи
Н 7?	эта	,0 о	омикрон	ф ф	пси
о	тэта	П 7Г	пи	Q си	омега
Наряду с указанным произношением также говорят „лямбда*, „мю* и „ню*.
ВВЕДЕНИЕ
В первом и втором выпусках серии „Математика в техническом университете14 основное внимание было уделено изучению действительных функций одного действительного переменного, которые можно рассматривать как отображения R -» R. 0бласти определения и значений этих функций являются множеством действительных чисел или его подмножествами. Однако этих функций недостаточно для описания многих величин и явлений. Простейшим примером является формула для вычисления площади S треугольника S = 0,5a6sin^>, где <р — угол между его сторонами а и Ь. Можно считать, что площадь S зависит от трех переменных a, b и у?, которые независимо друг от друга принимают различные значения (с учетом очевидных ограничений а > О, b > 0, 0 < <р < тг, поскольку речь идет о треугольнике). Следовательно, площадь треугольника можно рассматривать как функцию трех указанных независимых переменных.
Описание многих процессов нельзя представить с помощью только одной функции, даже если она является функцией нескольких переменных. Например, общепринятыми характеристиками погоды являются температура, атмосферное давление, влажность, т.е. несколько величин. На их значения влияют многие факторы. В этом случае есть несколько функций, зависящих от нескольких переменных, которые естественно изучать не раздельно, а вместе, как единый объект. Именно функции и их наборы, имеющие более одного независимого переменного, и изучаются далее.
Функцию f нескольких переменных ж-2, ..., хп записывают в виде	Значение такой функции определяет-
ся значениями всей совокупности переменных, которые в этом случае удобно рассматривать как упорядоченную совокупность
18
ВВЕДЕНИЕ
п чисел. Упорядоченные наборы чисел уже рассматривались как элементы линейного арифметического пространства Rn. Таким образом, функцию	можно интерпрети-
ровать как отображение из некоторого множества в п-мерном линейном арифметическом пространстве Rn в числовую ось R. Именно такой подход к понятию функции многих переменных и взят за основу в этой книге.
Изложение теории функций многих переменных проводится примерно так же, как и в случае функций одного действительного переменного. Сперва вводится понятие непрерывной функции многих переменных и анализируются соответствующие свойства, которые во многом аналогичны свойствам непрерывных функций одного действительного переменного. Затем обсуждается важнейшее понятие дифференцируемости функций многих переменных. В случае нескольких переменных появляются заметные отличия. Например, нарушается привычная связка между дифференцируемостью и существованием производной. Сам термин „производная“ заметно меняет свой смысл. Тем не менее сохраняются многие теоремы, известные в теории функций одного действительного переменного: связь между дифференцируемостью и непрерывностью, теорема Тейлора.
Основные приемы исследования функций многих переменных на экстремум базируются, как и в случае функций одного действительного переменного, на свойствах дифференцируемых функций. На функции многих переменных переносятся необходимое и достаточное условия локального экстремума. Но в этом разделе теории функций появляется совершенно новая задача — исследование функций на условный экстремум.
В предлагаемой книге, как и в других выпусках серии, серьезное внимание уделено численным методам решения задач и практическим приложениям теории функций многих переменных. Численным методам функций многих переменных посвящена отдельная глава, а к приложениям теории в той или иной
19
мере можно отнести четыре из одиннадцати глав книги. Особенно много внимания уделено геометрическим приложениям, в частности теории поверхностей.
Особо отметим последнюю главу книги, относящуюся к дифференциальной геометрии и посвященную одному из современных разделов этой области математики — теории многообразий. Эта теория теснейшим образом связана с дифференциальными свойствами функций многих переменных, что делает уместным ее появление в книге по функциям многих переменных.
1. ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ КАК ОТОБРАЖЕНИЯ
Тематику этой главы можно назвать так: топология ??.-мер-ного линейного арифметического пространства. Сюда относятся вопросы, связанные с близостью элементов Rn: расстояние в К”, окрестности, открытые и замкнутые множества. Изложение этих вопросов дано достаточно кратко, а более подробное изложение в общем случае метрического пространства можно найти в [1]. Понятие окрестности точки позволяет ввести понятие непрерывности функции многих переменных.
1.1. Открытые и замкнутые множества
Множество упорядоченных наборов (зг], з:2, .:гп) (кортежей) из п действительных чисел arj, з>2, • ••, есть n-я декартова степень Rn множества R действительных чисел. Такие наборы уже использовались как элементы линейного арифметического пространства, которое также принято обозначать через Rn. В этой книге упорядоченные наборы действительных чисел будут активно использоваться, но в несколько ином контексте. В рамках линейной алгебры [IV] элементы множества Rn часто называют арифметическими векторами и используют в линейных операциях. Мы не только будем рассматривать их как объекты линейных операций, но и оценивать степень их близости, характеризуя ее расстоянием в Rn. В таком контексте элементы Rn удобнее называть не векторами, а точками. Это соответствует традиции, согласно которой числа, т.е. элементы числовой оси, также называют точками. В этой книге элементы линейного пространства Rn мы в записи-
1.1. Открытые и замкнутые множества	21
мости от ситуации называем или арифметическими векторами, или точками: первый термин связан с операциями линейного пространства, второй — с топологическими аспектами в Rn. Как и в случае одного переменного, элементы Rn будем обозначать малыми буквами латинского алфавита: х, у, а, Ь, ... От этого соглашения мы в некоторых случаях будем отступать и обозначать точки „в стиле аналитической геометрии44 как Р, Q, отражая тем самым связь с точками пространства или плоскости.
Для элемента х = (ть #2, ..., яп) Е Rn числа Ж|, .т2, ..., хп будем называть координатами точки х в Rn. Это соглашение отражает аналогию с двумерным и трехмерным случаями: элемент (ац, х^) Е R3 можно рассматривать как набор декартовых (аффинных) координат точки в пространстве, если в нем зафиксирована некоторая декартова (аффинная) система, координат. Расстоянием р(х,у) между точками ;г = (.Т1, .г2, ..., хп) и у =(?/1,	Уп) назовем число
р(х,у) = \/(®1 - J/1 )2 + • • • + (ж„ - Уп)2-	(1.1)
Вспомним, что Rn — это евклидово арифметическое пространство со скалярным произведением
(ж,.у) =Х|1/! + Г-2У-2 + ... + Хпу„,
где х = (ж], ..., хп), у= (?/i, ..., уп). В евклидовом пространстве можно ввести евклидову норму
|г| = у/(г.,х)
и в соответствии с этой нормой расстояние
р(х,у)=\х-у\,
которое совпадает с расстоянием, введенным согласно формуле (1.1).
22 1. ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ КАК ОТОБРАЖЕНИЯ
Обозначим через а произвольную точку из Rn, и пусть Е — положительное число.
Определение 1.1. Множество LJ(a,e) тех точек из Rn, расстояние от которых до точки а Е Rn меньше г, Е > 0, т.е. множество
U(a,e) = {ж € Rn: р(ж,а) < г},
называют е-окрестностью точки а, а множество
U(a,e) = U(a,e) \ {а} = {ж € Rn: 0 < р(ж,а) < е} • —
проколотой е-окрестностью точки а.
Проколотая г-окрестность точки а состоит из всех точек ее е-окрестности, кроме самой точки а.
В случае п = 1 е-окрестность LJ(а,е) точки а € R представляет собой интервал (а - е, а + е) с серединой в точке а, имеющий длину 2е (рис. 1.1, а). Если п = 2, то е-окрестность U(a,e) точки а е R2 состоит из точек плоскости, которые лежат внутри окружности радиуса е с. центром в точке а (рис. 1.1,6). Если же п = 3, то ^-окрестность CJ(а,е) точки а состоит из точек, которые расположены внутри сферы радиуса е с центром в точке а (рис. 1.1, в). В общем случае множество точек ж € Rn+1, для которых р(ж,а) =£, называют п-мерной сферой радиуса е с центром в точке а, так что можно сказать так: ^-окрестность точки a 6 Rn — это открытый п-мерный шар радиуса е с центром в точке а, т.е. множество точек, лежащих внутри (п- 1)-мерной сферы радиуса е с центром в точке а.
• а
б
Рис. 1.1
1.1. Открытые и замкнутые множества
23
Отметим свойство вложенности ^-окрестностей одной и той же точки.
Теорема 1.1. Для любой точки a 6 Rn при £]	£2 ее
^-окрестность содержится в ее ^-окрестности.
< Пусть х — произвольная точка из -окрестности U(a,£i) точки а. Согласно определению 1.1, расстояние между точками х и а удовлетворяет неравенству р(х,а) < вр Так как £1	е2,
то и р(х,а) < £2- Значит, согласно определению ^-окрестности, точка х принадлежит ^-окрестности U(a,S2) точки а. Итак, доказано, что при £] ^£2 любая точка ^-окрестности точки а принадлежит ^-окрестности точки a: U(a,€i) С U(a,S“2)- ►
Определение 1.2. Точку а множества А С Rn называют внутренней точкой этого множества, если существует е-окрестность U(a,e) точки а, целиком содержащаяся в А: U(a,£) С А. Множество всех внутренних точек А называют внутренностью множества А и обозначают Int А. Если каждая точка множества А является его внутренней точкой, то само множество А называют открытым множеством.
Замечание 1.1. Пустое множество по определению считают открытым.
На рис. 1.2 множество А на плоско-сти ограничено сплошной и штриховой (	---
линиями. Подразумевается, что точки * р	|
сплошной линии принадлежат множе- _________J
ству А, а штриховой — нет. Точка
Р является внутренней точкой множе- ^ис’ 1,2 ства А, а точки лежащие на сплошной линии, например точка С, — нет. Это значит, что множество А не является открытым, так как содержит точки, не являющиеся для А внутренними.
Пример 1.1. Простейшими открытыми множествами в Rn являются е-окрестности точек [1-5.2]. Действительно, рассмотрим произвольную точку а 6 Rn и ее е-окрестность U(a,e). Если х € U(a,e), то по определению 1.1 имеем р(х,а) < е. Выберем
24 I. ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ КАК ОТОБРАЖЕНИЯ
положительное число s1 = f — p(.?:,a). Если точка у принадлежит -окрестности U(.r,f|) точки ,т, то р(у>х) < - г Согласно неравенству треугольника,
р(у,а) р(У^) + р(*л) <	4-p(.r,a) =f.
Значит, точка у принадлежит f-окрестности точки а. Поскольку точка у Е IJ(х,fj) может быть выбрана произвольно, заключаем, что U(ar,fi) С U(ft,f).
Рис. 1.3
Итак, любая точка х € U(a,e) имеет fj-окрестность U(a;,ei), целиком попадающую в U(a,f). Это означает, что точка х внутренняя для множества U(a,e), которое, следовательно, является открытым (именно поэтому е-окрестности точек в R” называют открытыми 71-мерными шарами). На рис. 1.3 приведена геометрическая иллюстрация доказательства при п = 2.
Пример 1.2. Интервал (.ti,.t2) числовой прямой можно рассматривать как f-окрестность точки а= (.ti + .т2)/2 € R, являющейся серединой этого интервала, при этом s = (.т2 - .t’l )/2. В соответствии с примером 1.1 интервал -- открытое множество. #
Свойство множеств быть открытыми может сохраняться при их объединении и пересечении [1-5.2].
Теорема 1.2. Пересечение конечного числа открытых множеств — открытое множество. Объединение любого числа открытых множеств — открытое множество.
◄ Докажем первое утверждение. Пусть множества U{, i= 1, п, открыты и п
с = О
1=1
LI. Открытые и замкнутые множества
25
Если множество U пустое, то оно открыто по определению. Для непустого множества U рассмотрим произвольную точку а € U. Согласно определению пересечения множеств, она принадлежит каждому из множеств (4, i — Так как эти множества открыты, то по определению 1.2 для каждого множества Ui существует такое число е, > 0, что ^-окрестность точки а содержится в 1Ц. Положим е = min{£],...,en}. Тогда при всех i = 1, п выполнены неравенства е Ег. Согласно свойству вложенности s-окрестностей (см. теорему 1.1), имеем [J(a,s) С U(a,£t) С i = 1, п. Поэтому е-окрестность U(a,e) содержится и в пересечении всех множеств т.е. в множестве {/, а это по определению 1.2 означает, что a — внутренняя точка для множества U. Поскольку в качестве точки а может быть выбрана любая точка множества [7, это множество открытое.
Для доказательства второго утверждения рассмотрим множество
V = U Vi,
где множества V’t С Rn, ?• € Д открытые, а / — некоторое множество индексов. В случае пустого множества. V утверждение очевидно, и мы будем считать, что V не пусто. Если точка a принадлежит множеству V’, то по определению операции объединения множеств точка а принадлежит множеству Vi хотя бы для одного значения индекса i = k. Так как 14 — открытое множество, то существует ^-окрестность U(a,e) точки а. содержащаяся в 14. Следовательно, эта окрестность содержится и в V. Но это значит, что a — внутренняя точка V*, а так как она может быть выбрана в V произвольно, множество С открытое. ►
Определение 1.3. Окрестностью точки a € Rn называют любое открытое множество U в Rn, включающее в себя эту точку. При этом множество С\{а} (т.е. окрестность точки, из которой удалена сама точка) называют проколотой окрестностью точки «.
26 I. ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ КАК ОТОБРАЖЕНИЯ
Как следует из примера 1.1, s-окрестность точки является ее окрестностью. Таким образом, понятие окрестности, введенное определением 1.3, обобщает понятие s-окрестности. С этой точки зрения s-окрестность есть окрестность стандартного (или канонического) вида. Определение 1.3 фактически означает, что открытое множество является окрестностью каждой своей точки.
Определение 1.4. Точку а Е Rn называют граничной точкой множества А С Rn, если любая s-окрестность точки а содержит как точки, принадлежащие множеству Л, так и точки, не принадлежащие этому множеству. Множество всех граничных точек множества А называют его границей и обозначают сМ (или РгЛ).
Пример 1.3. На числовой оси R полуинтервал А = [а?!,€ Е R имеет границу дА из двух точек Ж] и х2. Заметим, что точка .Т] принадлежит Л, а точка х2 — нет. На плоскости границей замкнутого круга
{(гь ж2): (®i -«О2+ (*2 “«г)2 5$ г2}
радиуса s с центром в точке а= (ai, а2) является окружность (it - ах)'2 + (ж2 - а2)2 = е2.
В пространстве границей замкнутого шара
{(«1, ж2, ж3): (аа - «1)2 + (ж2 — а2)2 +(жз - «з)2	е2}
радиуса s с центром в точке (аь а2, аз) является сфера
(ж] - ах )2 + (х2 - «г)2 + (#з - а3)2 = €2.
В R71 границей замкнутого п-мерного шара
1.1. Открытые и замкнутые множества
27
является множество
{а? 6 Rn: р(х,а) =г},
т.е. (п—1)-мерная сфера.
Определение 1.5. Множество А С RM называют ограниченным множеством, если существует такое положительное число г, нто r-окрестность точки 0= (О,	0) содержит мно-
жество А.
Поскольку 7'-окрестность точки 0 е Rn описывается неравенством р(х,0) = |т| < г, условие ограниченности множества А равносильно выполнению неравенства |я| < г, которое при некотором г > 0 верно для всех х € А. Отметим, что это неравенство можно заменить нестрогим неравенством |ж| г, так как из этого нестрогого неравенства следует, что |ж| < 2г = г'.
Определение 1.6. Множество, которое содержит все свои граничные точки (свою границу), называют замкнутым множеством. Замкнутое ограниченное множество в Rn называют компактным множеством, или компактом.
Замкнутый круг и окружность на плоскости, замкнутый Шар и сфера в пространстве являются замкнутыми и даже компактными множествами. Множество Л, изображенное на рис. 1.2, не является ни открытым, ни замкнутым, так как его граница, обозначенная сплошной и штриховой линиями, содержится в А лишь частично.
Замечание 1.2. Пустое множество считают по определению замкнутым. Таким образом, пустое множество одновременно и открыто, и замкнуто. #
Точку b € Rn называют внешней точкой множества если существует такая е-окрестность этой точки, которая не пересекается с множеством А (рис. 1.4). Множество всех Внешних точек множества А называют внешностью множества А.
28 /. ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ КАК ОТОБРАЖЕНИЯ
Рис. 1.4
Если точка b € Rn не принадлежит множеству А С Rn, то существую! две возможности: а) любая £-окрест-ность точки b содержит точки множества А и, следовательно, точка Ь является граничной точкой множества 4; б) некоторая е-окрестность
точки b не пересекается с А и, следовательно, точка b является внешней точкой множества А.
Любое отображение Т —> R71 промежутка Т числовой оси R в Rn можно записать в виде
SP(O = (¥’i(O М’гЮ •••
где i= 1, n, — функции одного действительного переменного £, определенные на промежутке Т. Если все эти функции непрерывны на Г, то отображение у? будем называть путем в Rn, а образ у>(Т) этого отображения — непрерывной кривой в Rn. Если Т = [а, 6] — отрезок, то точку у>(а) будем называть началом пути а точку </?(6) — концом пути <р.
В трехмерном случае (п = 3) отображение <^(/) можно интерпретировать как закон движения материальной точки, если аргумент t рассматривать в качестве времени. Это объясняе т термин „путь44, данный отображению
Пример 1.4. Отображение (-оо, +оо) —> R3 вида
х = W (О = у =	= sin /, z = у>з(/.) = t
задает непрерывную кривую в R3, представляющую собой винтовую линию (рис. 1.5).
Определение 1.7. Множество А С Rn, любые две точки которого можно соединить непрерывной кривой, целиком лежащей в этом множестве, называют линейно связным. Открытое линейно связное множество называют областью.
1.1. Открытые и замкнутые множества
29
Рис. 1.5
Следующие множества являются областями:
-	любая s-окрестность U(a,s) точки a € Rn; о
-	проколотая s-окрестность ll(n,s) точки a € Rn;
-	(открытое) кольцо в R2 с центром в точке (ai, «2) и радиусами г и /?, которое можно описать неравенствами
г2 < (X! - <1] )2 + (хг - a2)'2 < R2, (Х|, ж2) € R2;
-	множество
{(*ь *2) G К2: г < -ai| + |^2-fl2| < R},
где (aj, я2) € R2, 0 < г < R.
Рассмотрим последовательность {яд} элементов множества Rn (или просто последовательность в R71). Пусть существует такая точка я £ Rn, что для любой ее s-окрестности H(a,s) можно указать такой номер К € N, что для любого k > N верно соотношение яд. € U(fl,s). Тогда {яд} называют сходящейся последовательностью в Rn, а точку я — пределом Последовательности {яд.} в R71. Если указанной точки я не существует, то последовательность {яд} называют расходящейся последовательностью в R71.
Для предела последовательности в Rn сохраняются основные свойства числовых последовательностей, которые можно Рассматривать как частный случай последовательностей в R71
30 /. ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ КАК ОТОБРАЖЕНИЯ
при п—1. Например, можно показать (по-существу, повторив доказательство для одномерного случая) единственность предела последовательности в Rn. Так как Rn есть линейное пространство, элементы последовательностей в Rn, а значит.
и сами последовательности, можно складывать, вычитать и умножать на действительные числа. Как и в одномерном случае, для сходящихся последовательностей {fljt} и {Ьк} можно
утверждать, что
lini (ak±bk)= lirn ад.± inn bk, k->oo	к—>oo	fc—>oo
lirn (afl/t) = о lim a*, к—too	к-Ьоо
причем существование пределов в равенствах слева вытекает из существования пределов справа.
Для последовательностей bR’1 верен критерий Коши. Согласно этому критерию, последовательность сходится тогда и только тогда, когда она является фундаментальной последовательностью. В данном случае последовательность {ак} в R7‘ называют фундаментальной, если для любого числа в > 0 можно указать такой номер N С N, что для любых k > N и т > N выполняется неравенство	< €. Нетрудно увидеть, что
данное определение дословно повторяет определение фундаментальной числовой последовательности [1-6.5].
Замечание 1.3. Критерий Коши для последовательностей в Rn можно свести к одномерному случаю. Действительно, существование предела последовательности {а а,} с элементами ( (1)	(2)	(п)\	. r.
а-к = [“к 1 ак > •••’ ак )’	€ N, равносильно существованию
предела у каждой из п последовательностей* {aJjV}, •••< {«£П)}. Аналогично последовательность {ак} фундаментальна тогда и только тогда, когда фундаментальны все последовательности {ajV}, •••>
’Доказательство этого утверждения можно получить, изменив соответствующим образом доказательство теоремы 1.4.
1.2. Функции многих переменных
31
1.2. Функции многих переменных
Отображение вида /: А -> Rm, где А С Rn, n > 1, называют функцией многих переменных (функцией нескольких переменных}. В случае т = 1 значением такого отображения является действительное число (скалярная величина) и отображение называют скалярной функцией многих переменных. При m > 1 значением отображения является упорядоченный набор из т чисел, который можно интерпретировать двояко: как элемент линейного арифметического пространства или как элемент аффинного арифметического пространства. Пример первого рода дает поле скоростей текущей жидкости, когда в каждой точке некоторой области в пространстве задана скорость частиц жидкости, протекающих через эту точку. Пример второго рода дает перемещение частиц жидкости в пространстве: каждая частица жидкости перемещается из одной точки пространства в другую и результат перемещения можно рассматривать как отображение точек старого положения частиц жидкости в точки их нового положения. Ориентируясь в случае т 1 на первый вариант интерпретации отображения, будем называть такое отображение векторной функцией многих переменных. Это отображение часто называют векторной функцией векторного аргумента, нто подразумевает интерпретацию и области определения, и области значений как линейных пространств.
Замечание 1.4. Пусть L\ и L% — линейные пространства размерностей п и т. Зафиксировав в обоих линейных пространствах базисы, можно представлять векторы в них как Упорядоченные наборы координат. Это позволяет любое отображение /: L\ —> L} трактовать как отображение вида f: Rn —> ~»R7n, т.е. как функцию многих переменных.
Данные определения согласуются с определением функции действительного переменного, которое соответствует обще-МУ определению функции многих переменных в случае п= 1.
32 1. ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ КАК ОТОБРАЖЕНИЯ
Таким образом, понятие функции многих переменных можно рассматривать как обобщение понятия функции действительного переменного.
Упрощая изложение, в дальнейшем функции многих переменных часто будем называть просто функциями или скалярными (векторными) функциями. Будем также использовать и упрощенные обозначения таких функций. Вместо /: А —> R7n, .4 С Rn, будем писать так: /: А С Rn —> R7n. В тех же случаях, когда существенным является не множество 4, а лишь размерности линейных арифметических пространств, будем записывать функцию многих переменных следующим образом: /: Rn —> R™. Эта запись может иметь и другой смысл, обозначая функцию, для которой А = Rn, но этот случай будет оговариваться особо.
Множество D(f) = А точек из Rn, в которых определена функция /:4С Rn —> R771, называют областью определения (существования) функции f, а множество R(f) = = {у Е Rm: у = /(z), х Е D(f)} — областью значений (изменения) функции f. Подчеркнем, что термины „область определения“ и „область значений“ никак не связаны с термином „область14. Область определения функции и область ее значений могут и не быть областями в смысле определения 1.7.
Поскольку элемент линейного пространства Rm при т > 1 является совокупностью т действительных чисел, то векторную функцию многих переменных /: Rn —> Rw можно рассматривать как совокупность т скалярных функций /г, полагая, что
/М = (/1« Л(г) ЛпМ)Т,	(1.2)
Функции многих переменных /г, г = 1,тп, называют координатными функциями векторной функции /. Для представления векторной функции наряду с матричной формой записи (1.2) используют координатную форму записи
yi = fi(x), yi = f2(x), ym = fm(x), xeD(f).
1.2. Функции многих переменных
33
Пример 1.5. Пусть в пространстве расположено некоторое ело Плотность р этого тела зависит, вообще говоря, от положения точки. Выберем в пространстве прямоугольную систему кОординат (9xyz. Тогда плотность тела можно рассматривать как функцию трех переменных х, у и г, а именно р = p(x,y,z), где (я,	~) — точка рассматриваемого тела. Обозначив мно-
жество точек, принадлежащих телу, через V, можем записать р- V С R3—Аналогично температура Т этого же тела есть функция точки (х, у, z)y или функция T(x,y,z) трех переменных, которую мы можем записать в виде Т: V С R3 —> R. Пару функций р и Т можно рассматривать как векторную функцию трех переменных /: V С R3-> R2, которая в матричной форме имеет вид
f(x,y,z) = (p(x,y,z) Tlx.y.z)?, (x,y,z)ev.
Ее координатными функциями являются p(x,y,z) и T(x,y,z). #
Функции многих переменных могут использоваться как элементы матрицы. Пусть G’(x) = (gij(x)) — матрица типа, к х /, элементами которой являются скалярные функции многих переменных giji А С Rn —> R. Такую матрицу называют функциональной матрицей. Функциональная матрица G(r.) определяет отображение вида G: Rn —> A7/j(R) из 77-мерного линейного арифметического пространства в линейное пространство матриц типа к х /, которое называют матричным отображением или матричной функцией.
Так как множество матриц типа к х / есть линейное пространство размерности т = kl, которое естественно отождествить с 77г-мерным линейным арифметическим пространством, то любое отображение G: Rn —>	можно рассматривать
Как векторную функцию многих переменных видаС: Rn—>Rm. Наоборот, координатные функции векторной функции /: Rn —> *'* К”1 при туг = kl можно записать в матрицу типа к х I и тем Самым превратить векторную функцию в матричную. В частности, векторную функцию /: Rn —> R7n можно рассматривать
34 /. ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ КАК ОТОБРАЖЕНИЯ
как матричную типа т х 1, т.е. отображение, которое каждому х € Rn ставит в соответствие матрицу-столбец высоты т.
На множестве F(A,R7n) всех функций вида ft А С
—> R7n можно ввести операции сложения функций и умнож?< ния функций на действительные числа. Суммой функций многих переменных f,g€ F(A,Rm) называют такую функцию f + д € F(A,R7n), что для любого х 6 А верно равенство (/ + ^)(ж) = /(х)+у(х), в правой части которого стоит сумма значений векторных функций, являющихся элементами линейного пространства R7n.
Аналогично произведением функции многих переменных f € F(A,RW) на действительное число Л называют такую функцию (Л/) € F(A,R7n), что для любого х Е А верно равенство (Л/)(а:) = Л/(.т), в правой части которого стоит произведение вектора f(x) € R7n на действительное число Л.
Записав функции f,g€ F(A,R7n) в матричной форме
/(з:) = (/,(х) Мх) ...
g(x) = (gl(x) g2(x) ... gm(x))r,
мы можем представить введенные операции следующим образом:
f(x) + g(x) =
А/(г) =
A/i(x) \
^fm(x) )
Относительно введенных операций множество F(A,Rm) является линейным пространством.
Пример 1.6. Пусть заданы функции двух переменных /1	?/) = (^ 21/) и /2(^,1/) = (у2 Зя2) . Умножая первую функ-
цию на число 2 и складывая результат со второй функцией, получим линейную комбинацию f = 2j\ 4-/2 двух функций:
f(x,y) = 2fi(x,y) + /2(х,у) = (2х + у2 4i/ + 3i2)T. #
1.2. Функции многих переменных
35
В скалярном случае, т.е. при т = 1, можно также определить Перации умножения и деления функций. Произведением °£х.нКций многих переменных f,g Е F(A,R), А С Rn, называют функцию fg, значение которой в точке х Е А вычисляется по формуле (fg)\x) = f(x)g(x). Аналогично частным функ-ций многих переменных f,g Е F(A,R) называют функцию f/g, Для которой выполнено равенство (f/g)(x) - f(x)/g(x), х £ А. Областью определения произведения fg является множество А, а областью определения частного f /д — множество д за вычетом всех точек х, в которых д(х) = 0, т.е. D(f/д) =
= А\{хе А:д(х) = 0}.
Пример 1.7. Функция
f(x, у) =
\п(ху + у) + у2 у/х
есть частное двух функций f\(х,у) = 1п(я?/ + у) + у2 и f2(x,y) = = х/х. Отметим, что область определения частного двух функций есть пересечение областей определения делимого и делителя, из которого удалены точки, в которых делитель обращается в нуль. В данном случае область определения функции /1 описывается неравенством ху 4- у > 0, область определения функции /2 — неравенством х 0, пересечение областей есть множество {(ж, у) Е R2: х 0, у > 0}, а область определения частного — множество {(ж, у) Е R2: х > 0, у > 0}.
Определение 1.8. Графиком функции многих переменных /: Rn —>	называют подмножество Г(/) в Rn+m =
= Rn X Rm, которое задается следующим образом:
Г(/) = {(*, ?/)€Rn+Tn:z€D(/), y = f(x)}.
Это определение есть частный случай определения графика- произвольного отображения f:X—tY [1-2.5]. В случае т=1 оно приводит к понятию графика действительной функции действительного переменного, имеющего нагляд-Ное геометрическое представление в виде некоторой кривой
36 1. ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ КАК ОТОБРАЖЕНИЯ
7>	на плоскости [1-3.1]. Столь же наглядно
	можно представить график функции при п + 77i = 3. Например, графиком функции \	I f(x,y) = х2 + У2 (п = 2,т = 1) является по-
\	;	/ верхность, которая описывается уравне-
\	нием z = x2 + y2. Указанная поверхность
у"	!-1	представляет собой параболоид вращения
\	(рис. 1.6).
График функции /: R —> R2, которая
'Oi х задана соотношениями x(t) = cost, y(t) = рис J*.	= sin t, t E (—00, +oo), представляет собой
винтовую линию, рассмотренную в примере 1.4. Действительно, графиком этой векторной функции является множество
ПЛ = {(-т, У, Л С R3: х - t, у = cost, z = sint},
что после переобозначения осей координат приводит к образу отображения у из примера 1.4 (см. рис. 1.5).
Для графического представления функций многих переменных в случае небольших размерностей области определения и области значений могут использоваться и другие приемы. Рас
смотрим некоторые из них.
Определение 1.9. Пусть задана функция многих переменных /: Rn —> Rm. Множество {я Е Rn: f(x) = с}, где с Е R’" фиксированное, называют поверхностью уровня, соответствующей значению с.
Поверхность уровня функции многих переменных f — это множество всех точек из области определения функции, в которых она принимает данное значение с, т.е. прообраз f~l (с) элемента с Е R7n при отображении f.
Замечание 1.5. Слово „ поверхность“ здесь лучше было бы заменить словом „множество11. Во-первых, прообраз элемента при произвольном отображении может и не быть поверхностью
1.2. Функции многих переменных
37
бычном ее понимании. Во-вторых, в случае т = п — 1 это Вножество представляет собой множество решений системы из М_ 1 уравнений с п неизвестными и его, скорее, следовало бы назвать кривой, а не поверхностью. Отдавая дань традиции, мы будем называть множество /-1(с) линией уровня при п = 2, т = 1 и поверхностью уровня во всех остальных случаях.
Пример 1.8. Для функции трех переменных f(x,y,z) = = х2 + У2 + z2 уравнения поверхностей уровня имеют вид х2 + 2'2 = Легко увидеть, что они могут быть или пустыми множествами (с < 0), или точкой (точка (0, 0, 0) при с = 0), или сферой радиуса >/с с центром в начале системы координат (с>0).
Пример 1.9. Найдем линию уровня функции двух переменных f(x,y) = х2 + у2, которая проходит через точку М(3, 4). Согласно определению 1.9, уравнение любой линии уровня данной функции имеет вид х2 + у2 = с, с — const. Подставим координаты х = 3, у = 4 заданной точки М в уравнение линии уровня и вычислим соответствующее значение константы с. В результате получим 32 + 42 = с, откуда с = 25. Значит, точка М расположена на линии уровня, которая соответствует значению с= 25. Этой линией является окружность х2 4- у2 = 52. #
Связь между графиком функции многих переменных и ее поверхностями уровня наиболее наглядно просматривается в случае скалярной функции двух переменных z = f(x,y): линия Уровня f(x,y) = с совпадает с проекцией на координатную плоскость хОу сечения графика этой функции, т.е. поверхности f(*,y), плоскостью z = с. Именно на этом основан метод сечений, применяемый при исследовании вида поверхности в пространстве по ее уравнению.
Пример 1.10. Опишем все линии уровня функции двух переменных f(x,y) = х2 + у2. Уравнение линии уровня х2 + у2 = с при с < о задает пустое множество, поскольку это равенство, Рассматриваемое как уравнение относительно переменных х и
ЗУ I. ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ КАК ОТОБРАЖЕН!/;/
у, не имеет решений. Геометрически эго означает, что при ( плоскость z = (' не пересекается с графиком функции /. В чае с = 0 имеем равенство х2 + у2 = 0. которому удовлетворяв координаты единственной точки (0, 0). Следовательно. При
Рис. 1.7
с = 0 линия уровня, являющаяс я цР, ресечением плоскости z = 0 с параба лоидом вращения z = х2 4- у2. содер. жит единственную точку (0. 0). ь;г. ли с > 0, то линия уровня описывает, ся уравнением х24-у2 = с = г2 и пред, ставляет собой окружность радиуса г с центром в начале координат. Эта окружность есть проекция на коор. дннатную плоскость хОу пересечения плоскости z = г2 с параболоидом вращения z = x2 + y2 (рис. 1.7). #
При m > 1 поверхность уровня векторной функции многих переменных /: Rn-> RKi. соответствующая значению с = = (с|, .... сш) € R"'i состоит из тех точек, координаты которых удовлетворяют векторному уравнению f(x) = с. т.е. являются решением системы уравнений ft(x) = с», i= l,m. где /, координатные функции векторной функции /. Поэтому поверхность уровня векторной функции многих переменных является пересечением соответствующих поверхностей уровня ее координатных функций.
1.3. Предел функции многих переменных
Рассмотрим множество А С Rn. Точку а € RM называю^ предельной точкой множества 4. если в любой ее про*0* лотой окрестности есть точки из множества А. Предельна* точка множества может либо принадлежать этому множеств) • либо не принадлежать ему. Отметим, что если точка а
39
I 3. Предел функции многих переменных
"	11Я множества Д, то в любой окрестности U(a,e) этой
Лр-1Ь,,аЯг*>дер>кцТсЯ бесконечно много точек множества А.
llt(C<Ku а называют изолированной точкой множества |очку £ н суШестВует такая ее проколотая окрестность. еС' 11П гоаержит точек из множества .4. Отметим, что
которая м< •	.....
юГая точка а € 4 является либо предельной точкой 4, либо изолированной точкой А.
Пример 1.11- а- ВгР внутренние точки любого мно-жчетва .4 С г R" являются предельными точками этого множества.
6. Множество на плоскости, заданное соотношениями х2 - у2 = I. z -1, имеет изолированную точку (-1, 0). Все остальные точки этого множества, лежащие на правой ветви гиперболы, являются его предельными точками (рис. 1.8). #
Определение 1.10. Пусть заданы функция многих переменных /: R" -> R"‘, множество А С Р(/), включенное в область определения функции /, и предельная точка а множества 4. Точку b£ R’n называют пределом функции f в точке а по множеству Д, если для любой е-окрестности U(6,f) точки Существует такая проколотая ^-окрестность 1г(а.Л) точки а. ЧТо /(z) £ t!(6 v) При х £ б(а^)п Д, т.е.
Vl’IMcr 3U(u,<5) с R”
Vx € 1т(а.<5) П .4 : /(х) € Г(Ь.?). (1.3)
В
°М случае записывают 6= lim /(т), или f(x) -> b при (запись z—
читают так: .,х стремится к а по множеству Д4‘).
1 Магр|1в^а,,Ие I’®’ Условие, что точка а € R”. в которой рас-
Тгя предел функции по множеству Д С Rn. является
40 I. ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ КАК ОТОБРАЖЕНИЯ
предельной точкой .4, существенно. Действительно, если то» ка а не является предельной точкой Л, то в достаточно проколотой окрестности этой точки нет точек множества ,4 условие определения 1.10, хотя формально и остается корррм ным, теряет содержательный смысл. В дальнейшем, говоря пределе функции f в точке а по множеству Л, будем всегд предполагать, что точка а является предельной для Л.
Замечание 1.7. Данное определение является частным гл\ чаем общего определения предела отображения f : X У' точке а по множеству Л, где X и Y метрические прострт ства. В нашем случае X и Y — аффинные арифметически пространства, в которых введено расстояние между точк; ми (см. 1.1). Можно дать определение предела, в котором и используется понятие окрестности и которое базируется лиш на понятии расстояния в аффинном арифметическом простраг стве. Например, так: точка b есть предел функции f в точке по множеству Л С £>(/), если для любого числа £ > 0 существ} ет такое число 6 > 0, что для любой точки х 6 Л, для которо О < 1-г — а| < <£. верно неравенство |/(х) - 6| < £. #
Если зафиксировать некоторую (^-окрестность точки а, г точки множества Л, не попавшие в эту окрестность, не буду влиять на существование предела в точке а и его значение, та как в этом случае мы можем считать, что число 6 в определении 1.10 не превосходит до- Действительно, если для заданно! о
г > 0 выбрано некоторое 6 так, что при х Е ЛПН(а,6) вы пол няется соотношение f(x) Е П(М), то. положив 6' = min{6, <$<») о	о
заключаем, что U(a.6') С U(«,<$) и. следовательно,
(.4nU(M'))C (.4 П U(a.<5)).
Поэтому соотношение f(x) Е будет выполнено для любо о
точки х Е Л П Ufa, 6')-
Множество Л в определении 1.10 играет роль ограничителя учитываются значения функции только в точках этого множс
1.3. Предел функции многих переменных	41
Если а является внутренней точкой множества А, или по гтва-	МНожества Ли {а}, то А перестает играть огра-
ннаюшую роль. В этом случае можно выбрать проколотую ЗГокресТНОСТЬ точки а* целиком попадающую в А. Выбирая в о11ределении 1.10 число 8 $ 60, будем иметь ЛП1’(М) = U(M). Таким образом, если некоторая проколотая окрестность точки а содержится в множестве А (в частности, если точка а внутренняя для Л), мы можем считать, что Л = Rn. В этом случае мы будем говорить просто о пределе функции в точке а и обозначать его, опуская упоминание множества А:
b= lim f(x).
При этом определение предела упрощается: точка.b есть предел функции в точке «, если для любой ^-окрестности U(6.f) точки о
Ь существует такая проколотая о-окрестность U(a,£) точки а.
что f(x) е ЩМ) при х € U(a,5).
Пример 1.12. Рассмотрим функцию двух переменных
{су С^у’’
0.
х2 + J/2 / 0;
х = t/ = 0,
(1Л)
и исследуем ее на существование предела в точке а = (0. 0) в зависимости от множества Л.
Пусть множество Л есть прямая у = кх. Воспользуемся тем. что в точках этой прямой функцию / можно рассматривать как Функцию одного действительного переменного д(х) = f(x.kx). которая при х / 0 принимает постоянное значение:
.	. kx2 k
д(х) = f(x,kr) = r2 + k.li2 = -^2-
Поэтому при (z, у) -> (0, 0) по множеству Л существует предел, равный этому постоянному значению:
lim f(x,y) = - -5 . (г. о)	1 4- к*
42 I. ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ КАК ОТОБРАЖЕНИЯ
Прямую z = 0 (ось ординат) нельзя описать уравнением с угловым коэффициентом. Этот случай необходимо рассмотреть отдельно. Так как /(0,у) = 0, приходим к выводу, что по множеству z = 0 также существует предел, равный нулю. #
Связь между пределами по различным множествам и, в частности, между пределом и пределом по множеству аналогична тому, как для действительных функций действительного переменного связаны понятия предела функции в точке и одностороннего предела функции в точке. Например, правосторонний предел функции в точке а € R можно рассматривать как предел этой функции по множеству {я € R: .г > а}.
Теорема 1.3. Пусть а - предельная точка множеств .4, В С Rn и А С В. Ес ли существует предел функции f в точке а по множеству В. равный 6, то существует и предел этой функции в точке а по множеству .4. который также равен Ь.
◄ Пусть существует предел функции f при равный Ь. Это значит, что для произвольного числа е > 0 существует такая о
проколотая «^-окрестность U(«,6) точки а, что f(x) € U(6,^) при z 6 В А (’(а.<£). Так как 4 С В, то и (.4 П U(а,£)) С (В A U(«, Л)). Значит, соотношение /(т) € U (6. е) верно для любой точки х € о
€ .4П1Ца,6). Тем самым мы показали, что, каково бы ни было число г > 0. можно указать такое число 6 > 0, для которого /(т) € 1Ц6,е) при х£ .4 А 1>(п,6). Это, согласно определению 1.10, и означает, что функция f имеет предел b в точке а по множеству .4. ►
Следствие 1.1. Если функция /:R'*->RT,‘ определена в о
некоторой проколотой «^-окрестности U(a.«$o) точки а и существует ее предел в этой точке, равный 6, то для любого множества А С Rn, для которого точка а предельная, существует предел функции f при х-^а. равный Ь.
◄ Доказательство следует из теоремы 1.3 при В = Rn. ►
1.3. Предел функции многих переменных
43
Следствие 1.1 удобно использовать для доказательства того. что функция не имеет предела в заданной точке. Идея его использования сводится к следующему. Подбирают два множества А\ и Aq так. чтобы пределы функции в точке а по этим множествам были различны. Тогда на основании следствия можно утверждать, что функция не имеет предела в точке а. Действительно, если функция f имеет предел в точке а, равный Ь, то тот же предел она имеет в точке а и по каждому из множеств 4j и А2, а это противоречит условию.
Пример 1.13. Функция f(x,y), рассмотренная в примере 1.12, не имеет предела в точке (0, 0). так как эта функция имеет разные пределы по множествам А* = {(х, у) € R2: у = kx}. #
Исследование предела векторной функции многих переменных можно свести к исследованию пределов ее координатных функций.
Теорема 1.4. Векторная функция многих переменных /: .4 С R" -> R"1 имеет предел при равный b тогда и только тогда, когда существуют пределы ее координатных функций fi(x) при равные bt, i = 1. in, где
◄ Предположим, что существует предел lim f(x) = b. Выбе-
рем произвольное число в > 0. Согласно определению 1.10. для выбранного числа f существует такое число 6 > 0, что при ©
х € /10 U(a.d') выполнено неравенство \f(x) - 6| < f (это неравенство равносильно соотношению f(x) € U(6.f)). Так как в соответствии с введенным расстоянием в R"‘
S х/(/1(х)-6|)2 + ... + (/„.(х)-6т)2 = /(I) - 6|, i = М».
44 I. ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ КАК ОТОБРАЖЕНИЯ
то для тех же х 6 .4 П 1Ца,5) верно и неравенство |/,(jr) - 6,| • или /,(*) 6 1Ц6,,г), где V(6|,£j — г-окрестность точки Ь, н., числовой прямой. Но это и означает существование предел;, координатной функции /,(х) при х-$а, равного 6,.
Перейдем к доказательству обратного утверждения и пред, положим, что при х-*а существует предел каждой координат* ной функции Цх), равный 6,, t = l,m. Выберем произвольное число £ > 0. Для е' = е/\/м и каждого i = 1, in существует та о
кое число <5, > 0, что при х € Д П Н(а,6,) выполнено неравенств. |/,(х) -6,| < е/у/т. Пусть 6 = min(6j,...,<5Ш). Тогда С(М’) с ______________________________	о
С С(аД) для каждого i= 1,ш. Поэтому при ДпС(а.Л) одновременно выполняются неравенства |/ж-(х) - 6,| < _______	о
i = 1, т. Следовательно, при х € А П С(а,<5) имеем
|/(х) - 6| = vW*) "М2+ ••• + (/...И ~М2 <
<	4-... 4- £2/ш = x/f2 = s.
что означает существование предела векторной функции f (х•) при х равного 6. ►
Доказанная теорема фактически утверждает, что в случае векторной функции переход к пределу можно выполнять пою» ординатно (т.е. отдельно для каждой координатной функции). Если хотя бы для одной координатной функции предел не суще ствует, то не существует предел и самой векторной функции Напомним, что векторные функции можно трактовать как матричные функции, и в этом контексте теорема 1.4 приобретав несколько иную окраску: в функциональных матрицах такж< допустим поэлементый переход к пределу, т.е.
1.3. Предел функции многих переменных
•13
Пример
1.14. Рассмотрим предел матричной функции
Гпп (г.	О)
•г + I •п/ г2 + ?/2
3 соответствии с теоремой 1.4 этот предел можно рассматривать по элементам матрицы. Имеем
Пт 1 = 1, lim (j+1) = 1, Гпп у = 0.
(J, у)->(0. °)	<*• у)-М°« °)	(•»• J/)—*(О. 0)
во предел четвертой функции
.. ?У
Пт —------------
(г. у)-4(0. 0)	+
не существует (см. пример 1.13). Следовательно, и предел рассматриваемой матричной функции в точке (0, 0) также не существует. #
Функцию многих переменных /: .4 С Rn -» R™ называют бесконечно малой при х-^а (« — предельная точка множе-ства 4), если lim f(x) = 0 (в случае т > 1 символ „0“ обозначает
точку (0, 0, ..., 0) € R"*)- Из теоремы 1.4 следует, что векторная функция является бесконечно малой при х-^а тогда и только тогда, когда бесконечно малыми при х-^а являются все ее координатные функции. Например, из двух функций
/1*уУ) = (х т2+/ ху3) и у(х,у) = (j+1 х2+у4 х-у)
первая является бесконечно малой при (х, у) —> (0, 0). а вторая •— нет. Действительно, все координатные функции векторной функции f(x,y) имеют предел 0 в точке (0. 0), в то время как координатная функция д\ (х.у) = х 4- 1 векторной функции 9(х,у) имеет предел 1 (ненулевой) в точке (0, 0).
Для функций многих переменных остается в силе теорема ° связи функции, ее предела и бесконечно малой [1-7.5].
46 I. ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ КАК ОТОБРАЖЕНИЯ
Теорема 1.5. Для того чтобы существовал предел функпци /: .4 С Rn -> К?п при равный Ь, необходимо и достаточно чтобы эта функция имела представление f(x) = b 4- а(х), гДо
а: А —> К”г
бесконечно малая при х-^а.
◄ Необходимость. Предположим, что существует предрл Гни f(x) = b. Обозначим а(х) = f(x)-b и выберем произвола
нор число с > 0. Согласно определению 1.10, для выбранно-о
го £ существует такое число 8 > 0, что при х€ ЛНЩа.б) верно включение f(x) € П(Ь,£), что равносильно неравенству |/(аг) - 6| < £, или |п(j?)| < £. Но это означает, что существует предел Гпп а(х.) = 0. Следовательно, функция многих перемен-А
ных а(аг) является бесконечно малой при х-+а. Л
Достаточность. Пусть f(x) = b + а(х), х € 4, и функция а(х) является бесконечно малой при х-^а, т.е. существует предел lim а(х) = 0. Выберем произвольное число е > 0. В соот-ХА^П
ветствиии с определением 1.10, для выбранного числам можно о
указать такое число 6 > 0, что при х € Л A U(а, 6) верно неравен ство |а(т) - 0| < £, или |/(х) - Ь| < £. Следовательно, существует предел lim f(x) = b. ► Л
Понятие бесконечного предела, активно используемое для функций одного переменного, можно перенести на функции многих переменных. Однако заметим, что в векторном случае такое понятие используется крайне редко, а в скалярном случае оно встречается чаще. Поэтому под пределом векторной функции многих переменных мы будем понимать лишь то, что оговорено в определении 1.10, а для скалярных функций это определение несколько расширим.
Определение 1.11. Пусть задана скалярная функция /: А С Rn -> R и а — предельная точка множества А. Если для любого числа М > 0 существует такое число 8 > 0, что при о г € 4nU(a,<5) выполняется неравенство f(x) > М (/(я) < -М
1.3. Предел функции многих переменных
47
I f(x)\ > М), то говорят, что функция f(x) стремится к +оо ^Ответственно -оо или оо) при х-^а, и пишут
lim /(*) = +°°
lim f(x) = —оо
Тг+а Л
или lim f(x) = оо).
Во всех трех случаях функцию f(x) называют бесконечно большой при х-^а.
Функция f(x,y) = ——-
является беско-
Пример 1.15.
нечно большой при
(х, у) -» (0, 0). Функция д(х,у) =
стремится к -I-оо при (г,	(О, 0), если А — сектор, заключен-
ный между прямыми у = х и у= -х и расположенный в правой полуплоскости х > 0. В самом деле, в этом секторе |.у| < |х| и
поэтому
х х	1
x24-j/2 > 2х2	2х
Функция д(х,у) стремится к -оо при (х, у) д>(0, 0), если А — сектор, заключенный между прямыми у = х и у = -х и расположенный в левой полуплоскости х < 0, поскольку в этом секторе х < 0, |t/| < |ат| и
х х	1
х2 -Ь у2 < 2х2	2х ’
Если А = {(х, у): х = 0, у € R} — ось ординат, то д(х,у) = = 0 на А и функция д(х,у) является бесконечно малой при
У)д>(0, 0). #
Введем еще одно понятие. Функция многих переменных f- А С Rn—> ограничена на множестве А, если множество /(Д) = [у £ Rm. у _ г £ Д} ограничено. Эта функция ограничена при х-^а (локально ограничена в точке
Л если существует такая проколотая окрестность U(а,6) точ” а, нто функция ограничена на множестве Д AU(a,5).
48 1. ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ КАК ОТОБРАЖЕНИЯ
Определение предела функции многих переменных и по фор. ме, и по содержанию аналогично определению предела действц. тельной функции действительного переменного [1-7.1]. Поэто-му пределы, бесконечно малые и бесконечно большие функции имеют те же свойства, что и в случае функций одного пере, менного (т.е. при п = т = 1). Соответствующие формулировки и доказательства переносятся на функции многих переменных „почти без изменений“. Последние слова заключены в кавычки, так как в этих доказательствах, не изменяющихся по форме, изменяется смысл обозначения |а|: для числа а — это абсолютная величина, а для точки а 6 Rn — это евклидова норма элемента а в евклидовом арифметическом пространстве R71 (см. 1.1). По этой причине следующую теорему, устанавливающую связь между бесконечно малыми и бесконечно большими функциями многих переменных, а также свойства пределов функций многих переменных далее приводим без доказательства.
Теорема 1.6. Если функция /: Rw -> R бесконечно большая при то функция 1/f(x) бесконечно малая при х-^а. Если функция a: Rn —> R бесконечно малая при х-^а и отлична от нуля в некоторой проколотой окрестности точки а, то функция 1/а(я) бесконечно большая при [1-8.3]. #
Сформулируем основные свойства предела функции многих переменных [1-8.3].
1°. Если функция /: Rn —> RHl имеет предел в точке а € R'* по множеству А, то этот предел единственный.
2°. Если функция /:Rn—> Rm имеет предел в точке а по множеству А, то она ограничена при х-^а, т.е. существует Л
о
такая проколотая 6-окрестность U(a,6) точки а, что функция о
/ ограничена на множестве A AU(a,6). #
В случае скалярной функции здесь предполагается конечный предел, так как бесконечно большая при х-^а функция не ограничена ни в какой проколотой окрестности точки а.
1.3. Предел функции многих переменных
49
0 ЕслИ У функций /, g: А С Rn -> R,n существуют пределы
lim /(з*) — Ь, ХА*П
lim д(х) = d,
то сущ«‘ствУ,от И пРеделы
\\m(f(x)+g&)) = b + d' jnn (А/(т)) = ХЬ, Л € R.
4°. Если у скалярных функций /, д: А С Rn —> R существуют
пределы
lim f (я) = 6,
Л
lim д(х) = rf, •Г-т>л
Л
то существуют и пределы
iiin (f(x)g(x)) = bd. lim ~ □ (rf^0)- # г^а	д(х) а
Свойство 3° переносится на матричные функции. Если у матричных функций М: Rn -> AfP7(R) и N: Rn —> AfP7(R) существуют пределы
lim М(х) = М. lim N(т) = Л\
то существуют и пределы
Пт^М(х) + N(x)) = М + Л', lim (АМ(ж)) = АЛ/. А € R.
Свойство 4° в части произведения также можно перенести на матричные функции. Если у матричных функций A/:Rn ->
MPq(R) и N: Rn -> A/7r(R) существуют пределы
lim М(.г) = М, lim N(x) = 5Г,
То существует и предел
lim (M(x)N(x)) = MN.
50 I. ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ КАК ОТОБРАЖЕНИИ
5°. Если скалярная функция /: Л cRn->R имеет предР1 при х-^а, равный 6, и Ь> 0 (Ь < 0). то существует такая про.
о
колотая окрестность U(«,6) точки а, что в точках множеств* о
.4Hl.J(a,6) функция / положительна (отрицательна).
6°. Если у скалярных функций /, д: А С Rn -> R существуют пределы lini /(.г) = Ь. Гпп д(х) = d, причем b < d, то существует
Г.4*а О
такая проколотая окрестность U(«,<£) точки а, что при ./• с о
Е 4nU((U) выполнено неравенство f(x) < д(х).
7°. Если у скалярных функций /, д: А С Rn -> R существуют пределы lim f(x) = b, lim g(x) = d, причем существует такая
А	Д
о	0
проколотая окрестность I-(a,6) точки a, что при x £ А AU(M’) выполнено неравенство f(x) д(х), то b d.
S°. Если скалярные функции /, д, h: 4 С Rn R в некоторой проколотой окрестности точки а удовлетворяют неравенствам
/(•г) 5$ h(x) < д(х), х е .4,
и существуют пределы lim f(x) = Гпп д(х) = Ь, то существует и ТД*а
предел lim h(.г) = Ь.
А
9°. Произведение скалярной (векторной) функции, бесконечно малой при х-^а, на векторную (скалярную) функцию, ограниченную при х-^а, есть функция, бесконечно малая при х—^а. л
Пусть для функций /: А С R" —> R”1 и д: В С Rm —> Rr выполнено условие f(A) С В. Тогда определена композиция отображений д° f: А С Rn —> Rp, которая задается равенством (д° f)(x) = g(f(x)). Эта композиция тоже является функцией многих переменных, и ее обычно называют сложной функцией. Верна следующая теорема о пределе сложной функции аналогичная соответствующему утверждению для функций од-ного переменного.
1.3. Предел функции многих переменных
51
греОрема 1.7. Пусть функция /: А С Rn —>Rm имеет предел очке о € Rn ПРИ х 1~^а> Равный b Е R™, причем она не прини-8 значение b в точках множества А в некоторой проколотой Местности а. Пусть функция д\ В С R,n -> Rp, f(A) С В, име-
в точке b предел при y-gb, равный с Е Rp. Тогда сложная функция д° / имеет предел в точке а при х-^ау равный с. #
Свойства предела позволяют вычислять пределы функций многих переменных, если они существуют. Методы вычисления пределов повторяют те методы, которые использовались в случае функций одного действительного переменного [I], [II].
Пример 1.16. Рассмотрим предел
lim
(х, у)->(0, о)
sin (х3 + у3)
х2 + у2
Представим функцию f(x,y) под знаком предела как произведение двух функций
1(г3 + у3)_ х3 + 1/3
21 2	9\Х)У) о, 2 ’
х2 + у2	х2 + у2
где
sin(x3 + у3)
1,
0(*,.У) =
я + ?//0;
я4-г/ = 0.
Функция д(хуу) имеет предел в точке (0, 0), равный единице. Действительно, она имеет предел 1 по множеству Ai = = {(ж’ у)» х 4- у ф 0} как композиция двух функций /i(i) = и 1(х,у) = х3 4- у3. Функция д(х,у) имеет предел 1 и по множеству Ai = {(х, у): х 4- у = 0}. Следовательно, она имеет тот же пРедел в точке (0, 0) и по объединению этих множеств.
Второй сомножитель в представлении функции f(x,y) запишем в виде
х3 + у3 _ х2 у2
х2 4- у2 х2 4- у2 V х2 4- у2
52 1. ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ КАК ОТОБРАЖЕНИЯ
Каждое слагаемое представляет собой функцию, бесконечно малую при (^, у) -> (0, 0). Например, первое слагаемое р<-Гь произведение бесконечно малой в точке (0, 0) функции у?(.г, у) г2
= х и ограниченной функции	2- (се значении
заключены между нулем и единицей).
Итак, функция f(x,y) представлена в виде произведения двух функций, каждая из которых имеет предел при (х, у) -> -> (0, 0). Значит, существует предел функции f(x,y) в этой точке, равный произведению пределов сомножителей, т.е.
sin(x3 + у3 lim ---------тг~
(г,	0) Х2 + у*
1.4. Непрерывность функции многих переменных
Пусть задана функция многих переменных ft А С К71 -> R”‘. Каждая точка а Е А является либо предельной точкой множества .4, либо его изолированной точкой. В первом случае функция f может иметь в этой точке предел по множеству .4, что приводит к следующему определению.
Определение 1.12. Функцию многих переменных /: .4 С С Кп —> К”1 называют непрерывной в точке п 6 Д, предельной для множества .4, если существует предел функции f при х-^а, равный значению функции в этой точке, т.е. если
lim/(.г) =/(а).	(1.5)
.4
Как оговорено в определении, точка а не только принадлежит множеству .4, но и является его предельной точкой, поскольку рассматривается предел функции в точке а по множеству .4. Функцию /: .4 С Кп —> считают непрерывной в каждой точке а Е 4, которая является изолированной точкой множества .4.
I 4 Непрерывность функции многих переменных
53
Используя определение 1.10 предела функции, можно гфор-овать определение непрерывности функции в точке сле-МУю1ииМ образом. Функция /: А С R” -> Ктп непрерывна в точке А если Для любо“ ^-окрестности U(/(a),f) точки /(а) Е Л ктп суШествУеТ такая ^-окрестность 1Цн,д) точки а, что при веРно соотношение f(x) Е U(/(a),f). Наконец, можно ввести понятие непрерывности, не используя ни понятие предела, ни понятие окрестности. Функция f: А С Кп -> __4.R7n непрерывна в точке а Е .4, если для любого числа > 0 существует такое число 6 > 0, что при всех х Е А, удовлетворяющих неравенству |.г - а| < д', верно неравенство |/(z) - f(a)\ < f. Другими словами, бесконечно малому приращению аргумента в данной точке соответствует бесконечно малое приращение функции. Отметим, что эти формулировки включают в себя и случай изолированной точки множества А.
Функцию /: А С K?l -> R"1, непрерывную во всех точках множества Я, называют непрерывной на этом множестве.
Непосредственным следствием теоремы 1.4 является следующее утверждение.
Теорема 1.8. Для непрерывности векторной функции многих переменных в некоторой точке необходимо и достаточно, чтобы все ее координатные функции были непрерывны в этой Точке.
◄ Пусть функция /: 4cRMR”‘, /(х) = (/|(х) ... f,n(х))1, непрерывна в некоторой точке а Е Я, являющейся предельной Для Я. По определению. 1.12 непрерывности это означает, что сУЩествует предел Гни f(x) — J(a). По теореме 1.4 послед-нее равенство эквивалентно тому, что существуют пределы
i — 1,ш. Но это, в свою очередь, означает
•Я
непрерывность в точке а координатных функций /Дх), i = 1, т (ем. определение 1.12).
Обратное утверждение доказывается аналогично. Бели все Функции i= 1, уп, непрерывны в точке а, то в этой точке
54 I. ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ КАК ОТОБРАЖЕНИЯ
существуют пределы Гпп /(я) = /Да), ? = В этом случае хд+п
по теореме 1.4 существует предел lim f(x) = /(я), означающим
что векторная функция f(x) непрерывна в точке а. ►
Следующие так называемые локальные свойства непрерывных функций многих переменных вытекают из свойств 2° 6° предела функции многих переменных (см. 1.3).
1°. Если функции /,: А С R7i R7n, г = 1, Аг, непрерывны в некоторой точке а € Л, то любая их линейная комбинация непрерывна в этой точке.
2°. Если скалярные функции /, д: А С Rn —> R непрерывны в некоторой точке а € Л, то их произведение /г/, а при д(а) О и частное f / д непрерывны в этой точке.
3°. Если функция /: А С R71 -> R”1 непрерывна в точке a 6 .4, то она ограничена в пересечении множества А с некоторой окрестностью точки а.
4°. Если скалярная функция /: А С R71 —> R непрерывна в точке а и /(я) > 0 (/(а) < 0), то существует окрестность точки а, в которой функция / в точках множества А положительна (отрицательна).
5°. Если скалярные функции /, д'. А С R” R непрерывны в точке а € Л и /(я) < <у(а), то существует окрестность этой точки, в которой в точках множества Л выполнено неравенство /(*) < д(х).
Отметим, что в сформулированных свойствах упоминание о множестве Л можно опустить, если точка я является внутренней точкой множества А. Отметим также, что указанные свойства переносятся на матричные функции, так как на матричные функции распространяются соответствующие свойства предела функции многих переменных.
1.4. Непрерывность функции многих переменных
55
J* Если матричные функции Л/,: А С Rn -> Mn(R), i = 1, k, «иины в точке а Е А, то любая их линейная комбинация непреРы непрерывна в этой точке.
2*. Если матричные функции Afj: А С Rn -> Mpg(R) и
• А С Rn Mqr(R) непрерывны в точке а е А, то и их произведение MiM2: А С Rn-> Afpr(R) непрерывно в точке а.
3*. Если матричная функция М: А С Rn -> Mpg(R) непрерывна в точке а Е А, то для любой нормы ||-|| в Mpg(R) скалярная функция ||М(х)|| непрерывна в точке а.
4*. Если матричная функция М: А С Rn —> A/P(R) непрерывна в точке а Е А, матрица М(а) невырожденная, то матрица М(х) невырождена в некоторой окрестности точки а, причем матричная функция (М(х))~1 непрерывна в точке а.
5*. Если матричная функция М: А С Rn—> Afp(R) непрерывна. в точке а Е А, матрица М(х) симметрическая в некоторой окрестности точки а и матрица М(а) положительно (отрицательно) определена, то матрица М(х) положительно (отрицательно) определена в некоторой окрестности точки а.
Замечание 1.8. Свойства 1* и 2* матричных функций повторяют аналогичные свойства для функций многих переменных. Свойство 3* также не связано со спецификой матричных функций. Поясним, откуда вытекают свойства 4* и 5’.
Определитель матричной функции может быть представлен в виде некоторого многочлена от элементов матричной функции, так как определитель числовой матрицы ость многочлен от ее элементов [III]. Поэтому, если матричная функция М(х) непрерывна в точке а Е А, то, согласно свойствам 1* и 2’ матричных функций, скалярная функция detAf(a) также непрерывна в точке а и сохраняет знак в некоторой окрестности ЗТон точки. Следовательно, существует такая окрестность U г°нки а, что матрица М(х) при х Е U невырождена.
Обратная матрица может быть записана с помощью присоленной матрицы. Из такой записи вытекает, что элементы
56 I. ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ КАК ОТОБРАЖЕНИИ
матричной функции	можно представить как мц0^
гочлен от элементов матричной функции М(х), деленный ца скалярную функцию det Л/(;г). Следовательно, если матричная функция М(х) непрерывна в точке а Е Д, то матричная функ-ция (Л/(.г)) 1 также непрерывна в этой точке.
Свойство 5“ можно доказать аналогично. Условие, что симметрическая матрица М(х) положительно определена при г = можно выразить в соответствии с критерием Сильвестра совокупностью неравенств ДДа) >0, Дп(а) > 0, где ДДж) угловой минор матрицы М(х) порядка i. Миноры непрерывной матричной функции, как и ее определитель, являются непрерывными скалярными функциями. Следовательно, они сохраняют знак в некоторой окрестности точки а Е А. Согласно критерию Сильвестра, матрица М(х) является положительно определенной для всех х из некоторой окрестности точки а.
Если симметрическая матрица М(х) отрицательно определена при х = а, то матрица —М(х) положительно определена в точке а. Поэтому свойство 5* верно и для такой матричной функции.
Для функций многих переменных, как и для функций одного переменного, верна следующая теорема о непрерывное i и сложной функции [1-5.7].
Теорема 1.9. Если функция /: А С К” —> К™ непрерывна в точке а Е 4, f(A) С В и функция д: В С К7П —> непрерывна в точке b = f (а), то сложная функция (д о f)(x) =g(f(x)), х Е /Е
непрерывна в точке а.
◄ Обозначим точку д(Ь) через с и фиксируем любую г-окрест-ность U(r,.r) СКР этой точки. Из непрерывности функции д в точке b следует, что существует такая (^-окрестность U(6,6j) С С точки &, что д(х.) Е U(c,f) при х Е В П U(6,), или, дру
гими словами,
д^ВОЩЬ^)) С U(c,£).
57
I 4. Непрерывность функции многих переменных
огИчно и3 непрерывности функции f в точке а АнаЛ уЖ<? выбранной окрестности U(Mi) точки чТ° такал 5-окрестность U(a,5) С Rn точки а, существу*
следует,
*>=/(«) что
/(AnU(M))GU(Mi),
а
так как f(A) С В, то в действительности
/(4nU(a,<5)) С BnU(Mi).
Следовательно,
(^o/)(AnU(a,5)) С д(В Г\ЩЬ,6Х)) С U(c,e).
Итак, для любой f-окрест ноет и U(c,f) точки с найдена такая 5-окрестность U(a,5) точки а, что
(<7»/)(Л nU(a,<S)) С U(c,e).
Согласно определению 1.12, это означает, что сложная функция до f непрерывна в точке а.
На рис. 1.9 приведена геометрическая иллюстрация доказа-
тельства теоремы. ►
Рис. 1.9
01	г.
Пример 1.17. Функция f(x,y) = е~у2!х2 определена всюду в К2, кроме точек прямой х = 0. В своей области onpe.de-^ния эта функция непрерывна как композиция непрерывных Функций и i — y2/x2 (см теорему 1.9). Функция t—у2 / т2-является непрерывной в области х / 0 как частное двух непрерывных функций (см. свойство 2° непрерывных функций).
58 /. ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ КАК ОТОБРАЖЕНИИ
В точках прямой х — 0 функция f(x,y) не определена, но, жет быть, ее можно доопределить в этих точках так, что Olia_ будет непрерывной в R2? Чтобы ответить на вопрос, возмо^ но ли такое доопределение, надо рассмотреть предел функции в точках прямой х = 0 по множеству А = {(х, у) € R2: Существование предела функции в некоторой точке (хц, уо) но. обходимо, чтобы в этой точке было возможно доопределение функции по непрерывности, т.е. такое доопределение, при котором функция будет непрерывной в точке (xq, уо).
Если уо / 0, то функция у2/х2 является бесконечно большой в точке (0, уо), а функция е~у имеет предел в этой точке по множеству А, равный нулю. Но в точке (0, 0) предел этой функции по множеству А не существует. Действительно, рассмотрим множества А^ = {(ж, у): у = kx, х / 0}. Нетрудно увидеть, что у2/х2 = k2 при (х, у) € А^. Следовательно,
lim f(x,y) = с~к2.
(*, уЫ(о, о)М
Лк
Предел функции f(x,y) в точке (0, 0) по множеству Аь зависит от выбора множества А*. Значит, в силу следствия 1.1 функция f(x,y) не имеет предела в точке (0, 0) (см. также пример 1.13).
Итак, функцию f(x,y) нельзя доопределить так, чтобы она было непрерывной в точке (0, 0). Но подобное доопределение
возможно в отношении других точек прямой х = 0, поскольку
функция
е-!/2/х2, о,
х 7^0;
х = 0.

определена в R2 и непрерывна всюду в R2, кроме точки (0, 0).
1.5. Линии и поверхности разрыва
Точки, в которых функция многих переменных f: А С R71 —> —>Rm определена, но не является непрерывной, называют точками разрыва этой функции. Напомним, что точки, в которых функция исследуется на непрерывность, относятся к
1.5. Линии и поверхности разрыва
59
определения этой функции. Точка разрыва функции ° Л С	должна быть точкой множества Д, являющейся
д предельной, так как в изолированных точках множества ^avhKHB-h f непрерывна всегда (см. 1.4). К точкам разрыва кции f часто относят и точки, которые являются предельными точками Д, но самому множеству не принадлежат.
Точки разрыва могут образовывать подмножества в Rn,
которые в зависимости от их вида называют линиями или поверхностями разрыва функции.
Мы не будем определять различные типы точек разрыва, как этд делают в случае действительных функций действительного переменного [1], а ограничимся разбором типичных ситуаций на примерах.
Пример 1.18. а. Исследуем на непрерывность функцию двух переменных f(x,y) = 1/(1 -хг/). Эта функция представляет собой частное двух непрерывных в R2 функций двух переменных (числитель — постоянная функция, а знаменатель -функция z(x,y) = 1 - ху). Поэтому, согласно свойству 2° непрерывных функций (см. 1.4), она непрерывна во всех точках, в которых знаменатель отличен от нуля, т.е. при 1 — ху / 0. Множество точек в R2, которое описывается уравнением 1 — ху = 0, является линией разрыва этой функции. В точках этой линии, являющейся равнобочной гиперболой, функция не определена.
б. Функция f(x,y) = sgn(xz/) определена всюду в R2, причем принимает всего лишь три значения: значение 1 в точках первого и третьего квадрантов плоскости, значение 0 на осях координат и значение -1 в точках второго и четвертого квадрантов. Точками разрыва этой функции являются точки на Осях координат, а оси координат в данном случае являются линиями разрыва функции.
Функция трех переменных
и =
1 — х2 - у2 —
60 1. ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ КАК ОТОБРАЖЕНИЕ
определена вне единичной сферы х2 + у2 4- z2 = 1 и в точк^ области определения эта функция непрерывна как частное дВу непрерывных функций. О единичной сфере в этом случ^ говорят как о поверхности разрыва функции и.
г.	У функции трех переменных
__________1_________
\/1 - Я2 - t/2 - Z2
область определения описывается неравенством х2 + у2 +	<
< 1. В этой области функция непрерывна как частное двух непрерывных функций. В точках единичной сферы и вне рр функция v не определена. Точек разрыва нет.
д.	Функция двух переменных
и = In .и;
определена в области ху > 0, т.е. в первой и третьей четвертях без осей координат. К точкам разрыва этой функции можно отнести точки осей координат.
Пример 1.19. Исследуем на непрерывность функцию
f
Дх,2/)=| *2 + у2’
х2 + у'2 #0; х — у = 0.
При х2 4- у2 0 функция f(x,y) является непрерывной как частное двух непрерывных функций. В точке (0, 0) и ее окрестности функция определена, но не является непрерывной в этой точке, так как она в ней не имеет предела (см. пример 1.12).
1.6. Непрерывность по части переменных
Предположим, что функция многих переменных f: Rn —> R"' определена в некоторой окрестности точки a = (aj, ..., аГ1)-Если функция
$(*1) =/(*1,a2,«3,-.,«n),
1.6. Непрерывность по части переменных
61
представляет собой функцию одного действительного K°Ti>MeHHoro «ь непрерывна в точке Я] =аь то функцию f пеРс ют непрерывной по переменному xi в точке а. ^Непрерывность функции / = f(x},x2, ...,«п) по переменно-точке а по определению означает, что существует му ** в
предел
lim f («1,	• • •, Пи) — /*(^1,02, • • • 1 ^п) 1
который можно рассматривать как предел в точке а по множеству
Л| = {(»!, In) 6 R"; х2 = а2,...,хп = ап}.
Аналогично вводят понятие непрерывности функции f(x) в точке а по остальным переменным: по г2, по х^ и т.д., а также по произвольному набору ее аргументов. Например, если функция двух переменных
0(«1,х2) = /(«ь«2,а3,...,лп)
непрерывна в точке xj = а\, х2 = «2» то функцию f(x) п переменных называют непрерывной в точке а по части переменных (по совокупности переменных) х2. Непрерывность по части переменных можно рассматривать как существование предела функции в точке а по соответствующему множеству. Например, непрерывность функции f(x\,x2,...,xn) по совокупности переменных Я|, х2 означает существование предела
lim f(x) = f(at,a2, х—>а Л12
где
^12	{(«1 » • • • 1 Хп) С Ж : «з — Из, • • • ’«п — ®п} •
Отметим, что из непрерывности функции многих переменных в точке а следует ее непрерывность в этой точке по лю-МУ Набору переменных, поскольку если выполнено равенство
62 I. ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ КАК ОТОБРАЖЕНИЕ
Inn f(x) = f(a), то, согласно следствию 1.1, для любого мно^ ства А С Rn, для которого точка а предельная,
lim f(x) = f(a).
х-^а
А
В то же время, даже если функция непрерывна в точке Q по любому неполному набору переменных, это вовсе не значит что функция непрерывна в этой точке. Так, функция f(x,y) Иэ примера 1.12 не является непрерывной в начале координат, «0 она непрерывна в этой точке по каждому из переменных, т.е. по г и по у, поскольку /(0,?/) = /(х,0) = 0.
Если функция многих переменных непрерывна по части своих переменных во всех точках некоторой области, то ее называют непрерывной в области по (этой) части переменных (совокупности переменных).
1.7. Свойства функций многих переменных, непрерывных на компактах
Приведем без доказательства свойства функций многих переменных, непрерывных на компакта^.
Теорема 1.10. Пусть скалярная функция f: К cRn->R непрерывна на компакте К. Тогда:
1)	функция f ограничена на К, т.е. существует такое число М > 0, что |/(ж)| < М, х Е К’;
2)	функция f достигает на компакте К своих наибольшего и наименьшего значений, т.е. существуют такие точки х„, х' € € К, что f(x*) f(x) f(x*), х Е К;
3)	если компакт К — линейно связное множество, то для любого числа р из отрезка [f(x*),f(x*]] существует точка х^ Е К, для которой /(жд) = р. #
*В [I] рассмотрен как более общий случай отображений, непрерывны* на компактах в метрическом пространстве, так и более частный случай функций действительного переменного, непрерывных на отрезке.
Вопросы и задачи
63
Приведенная теорема может быть обобщена на векторный случай.
Горема 1.11* Пусть функция многих переменных /: К С g«-»Rrn непрерывна на К. Если К — компакт в Rn, то и ______компакт в Rm. Если К — линейно связное множество, о и /(Ю — линейно связное множество. #
Получить теорему 1.10 из теоремы 1.11 несложно, если есть, что компакт на числовой оси — это замкнутое ограниченное множество, а линейно связное множество на числовой оси__промежуток. Действительно, если К — компакт, то и
/(Л') является компактом, т.е. ограниченным замкнутым множеством. Ограниченность множества f(K) равносильна ограниченности функции на множестве К. Замкнутость множества f(K) на числовой оси означает, что это множество содержит все свои предельные точки, в том числе точную верхнюю и точную нижнюю грани. Другими словами, точная верхняя и точная нижняя грани множества f(K) являются значениями функции, а это равносильно второму утверждению теоремы 1.10. Наконец, если К — компакт, являющийся линейно связным множеством, то и f(K) — линейно связный компакт, которым на числовой оси может быть только отрезок. Но если f(K) — отрезок, то его концами являются минимальное f(x*) и максимальное /(□?*) значения функции, а все точки отрезка также являются значениями функции. Следовательно, верно третье Утверждение теоремы 1.10.
Вопросы и задачи
1*1. Докажите, что расстояние р(х,у) в Rn удовлетворяет ^ДУ-кйцим аксиомам метрики [1-5.1]:
а)	о, причем р(х,у) = 0 тогда и только тогда, когда
* = !/;
б)	р(х,у) = р(у,х);
в)	P(x,y)^p(x,z) + p(z,y).
64 I. ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ КАК ОТОБРАЖЕНИЕ
1.2.	Для множества X = [а, 6) на числовой оси докажи^ что:
а)	множество X не является 6-окрестностью точки с = (а 4- 6)/2 ни при каком 6 > 0;
б)	множество X ограничено;
в)	множество X не является открытым;
г)	множество X не является окрестностью ни для какой точки;
д)	IntX = (а, 6);
е)	множество X не является замкнутым;
ж)	граница дХ множества X состоит из точек а и Ь;
з)	множество X не является компактом;
и)	точка 6+ 1 не является предельной точкой множества Л', но является внешней точкой этого множества (принадлежит внешности множества X).
1.3.	Докажите, что следующие множества открыты:
a)	{(ii, х2) € R2: г2 < z2};
б)	проколотая 6-окрестность точки а Е R";
в)	{(*1, х2) Е R2: ai < а2 < х2 < 62};
г)	{(^1, х2) € R2: £1 4-^2 < 1}-
1.4.	Докажите, что следующие множества являются замкнутыми:
а)	отрезок [а, 6] С R;
б)	пересечение любого числа замкнутых множеств;
в)	объединение конечного числа замкнутых множеств.
1.5.	Докажите, что граница любого множества является замкнутым множеством.
1.6.	Докажите, что дополнение замкнутого (открытого) множества в Rn является открытым (замкнутым) множеством-
1.7.	Приведите пример множества на плоскости (на прямой, в пространстве), совпадающего со своей границей.
Вопросы и задачи
65
g Докажите, что если a — предельная точка множества А Я то а также является предельной точкой множества В. я Л С
1 9 Приведите пример такого непустого множества, кото-Н*е имеет предельных точек.
1 10. На плоскости найдите все множества X, для кото-х верно заданное соотношение: a) IntX = X; б) ЭХ = X;
B)IntX = d*-
1.11.	Докажите, что следующие множества являются ком
пактами:
a)	{х € Rn: pfr.a) $<?};
б)	{я € Rn: “) = г} — сфера в Rn радиуса г с центром в точке а.
1.12.	Докажите, что следующие множества на плоскости являются областями:
а)	{(г> У) € R2: х > 1};
б)	{(г, у) € R2: х2 + у2/0};
в)	{(«, У) €R2: 1 < i2 + t/2 <2}.
1.13.	Докажите, что для любой точки а = (сц, ..., ап) открытого множества U С Rn существует такое число 8 > 0, что множество точек (a?i, ..., xn) Е Rn, удовлетворяющих соотношениям |г, - а*| <5, i = 1, п, целиком попадает в множество U.
1*14. Найдите область определения векторной функции
/(*»!/)= (у/х~У2 ~	•
’Jr	*
1.15.	Запишите объем V прямого кругового конуса как Функцию площади Sb его боковой поверхности и площади S ОсНования. Найдите область определения этой функции.
*•16. Найдите /(1,-3), если f(x,y) = *	.
I — у
66 1. ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ КАК ОТОБРАЖЕНИЯ
1.17.	Приведите примеры из механики, физики, химии, Ил люстрирующие понятия скалярной функции многих перемер ных, векторной функции многих переменных, графика функ. ции многих переменных, координатных функций, поверхностей и линий уровня функции многих переменных.
1.18.	Приведите геометрическое описание и нарисуйте по. верхности уровня функции /: R3 -> R2, где:
a)	f(x,y,z) = (x2+y2-z z) ;
б)	f(x,y,z) = (x2+z2 x2+y2)^.
1.19.	Определяется ли функция многих переменных полностью структурой своих поверхностей уровня или нет? Приведите примеры из различных областей знаний, в которых функция была бы задана или описана своими поверхностями или линиями уровня (например, в электростатике, картографии).
1.20.	Могут ли разные поверхности уровня одной и той же функции многих переменных пересекаться в какой-нибудь точке?
1.21.	Найдите уравнение поверхности (линии) уровня функции, проходящей через указанную точку Р:
a)	z(x,y) = x2 + 2ху + у2 -х + у, Р(1; 2);
б)	z(x,y) = х2 - у2 + 2х - 4у,	Р(2; — 1);
в)	u(x,y,z) = x2-у2 + z, Р(3; 2; 1);
г)	u{x,y,z) = x2 + y2 + z2 -2z, P(l; 2; — 1).
1.22.	Можно ли сферу {(z, t/, z) Е R3: x2 4- у2 + z2 = r2}, r > 0, рассматривать как график некоторой функции многих переменных?
1.23.	Докажите, что поверхности уровня любой функции многих переменных разбивают область определения этой функции на непересекающиеся подмножества. Выясните, когда это разбиение на подмножества для функции /: Rn —> R совпадает с аналогичным разбиением для функции: а) /2; б) /3; в) &/•
Вопросы и задачи
Ь7
«. rl f+ &, 6 е R; д) е) gf, где д: R” -> R — заданная к е R; г> J
функция-
1.24.	Найдите предел функции f(x,y) при (г, у)-^(0, 0), если
2^2
Л={(х,!/):®У2>-4, ху/0}, f(x,y) = —,	
V
1.25.	Покажите, что функция z(x,y) =
не имеет преде-
ла при У) -> (0» 0)- Для люб°го числа 6/0 найдите такую функцию у = а(ж), а(0) = 0, непрерывную при х € [-1,1], что функция одного переменного u(x) = z(a?,a(a;)) будет иметь предел при х -► 0, равный Ь.
1.26.	Докажите, что функция
/(®,у) =
х2у Х<+!/2’ о,
х2 4- у2 / 0; х = у = 0,
непрерывна по переменному х, непрерывна по переменному у, но не является непрерывной в точке х = 0, у = 0.
1.27.	Исследуйте на непрерывность следующие функции:
а)/(*>!/) х2 + 2у2 + 2х-3;
б)/(х,у)=	1	;
sin (ж 4- У) 1 х2 4- у2 — z2
1 sin z — 1
в) /(®.у) =
1.28.	Докажите, что если существуют пределы lim f(x) = с В1"?Л®) = с, то существует предел lim /(я), который тоже Р&вен с.
68 1. ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ КАК ОТОБРАЖЕНИЯ
1.29.	Существуют ли пределы
lim /(z,у),	limi lim /(z,у), lim lim/(z,у)
(x, y)->(0, 0)	r->-0 J/-4-0	y->0 r—>0
для функций:
a)	f(x,y)- ^—~3' + У'5
6)	f(x,y) =
1.30.	Вычислите пределы:
.	sin x — sin у
a)	hm ----------------;
(x,	*) x — y
..	\/z2+y2 -1
6)	hm n t------------- - —
(г, у)->(i, о) — I)2 4- y2
.	1 — cos(x 4-2y) — 2xy
e) hm ----------------1 - ----------
(x, уH(o, o) x2 4- 4j/2
1.31. Проверьте, являются ли непрерывными в R2 функции
а)	/(жл)= <
б)	f(x,y) = <
z4-t//0;
х4-3/ = О;
х2 4-у2
€	X ±у\
О, х = у.
2. ДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ
Эта глава посвящена понятию дифференцируемости функции. Определение дифференцируемой функции без труда переносится на случай функции многих переменных. Но понятие производной, введенное для функций одного действительного переменного и связанное с понятием дифференцируемости, переносится на случай функции многих переменных не столь очевидным образом. Глава начинается с исследования функций многих переменных с помощью методов, разработанных для функций одного действительного переменного.
2.1. Частные производные
Пусть скалярная функция многих переменных f: Rn —> R определена в некоторой окрестности точки а= («1.ап) 6
€Rn. Тогда в некоторой окрестности точки гц Е R определена функция	= f(xi,ai,. ,.уап), которая получается из функ-
ции f(x) при фиксированных значениях всех аргументов, кроме первого. Производную функции <^(.Т|) в точке «] ER называют частной производной функции многих пере-ленных f в точке а по переменному X]. Аналогично можно определить частные производные функции / и по другим переменным.
Мастную производную функции f в точке а по переменному обозначают следующим образом:
Г/ / X или Л‘(а)-
Вычисление частных производных скалярной функции сво-ДИТся ж дифференцированию функции одного действительного
70 2. ДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ
переменного, когда все переменные функции, кроме одног0 „замораживаются “.
Пример 2.1. Функция двух переменных =
4- вху - у3 имеет две частные производные: fz(x,y) = 2ж 4- 6^ fy(x,y) = 6х - 3t/2. Аналогично для функции д(х,у) = ху, х > о находим ^(г;у) = угу-1, ?'(х,у) = яИп®. #
Пусть функция /: Rn -> R™ определена в 5-окрестности U(a,5) точки а € Rn. Обозначим через Дж,- такое приращение независимого переменного х± в точке а, при котором точка а = = (ai, ..., a,-i, а,+Дж,-, a»+i, ***, ап) принадлежит U(a,5). Для этого достаточно, чтобы выполнялось неравенство |Дж,- | < 6. Тогда определена разность значений функции /, соответствующая приращению Дж;:
(®»	— /(®11 • • •»1,	4”	»• • • 1 ®n)	/(®1 v 1 ®n)*
Эту разность называют частным приращением функции многих переменных f в точке а по независимому переменному xi. Частное приращение обозначают также через Д;/(а) или ДХ|/(а).
В соответствии с определением частная производная скалярной функции f в точке а по переменному х^ есть предел
lim
Да?, -40
(2.1)
отношения частного приращения функции по переменному х; к приращению Дж,- этого же переменного при Дж,- -> 0. Существование этого предела означает существование частной производной, т.е. он приводит ко второй формулировке определения частной производной. Эта формулировка удобна тем. что без проблем переносится на общий случай функции многих переменных.
2.1. Частные производные
71
- еделение 2.1. Если для функции многих переменных ВЛ определенной в окрестности точки а, существует ^ел (-2.1)» тоэтот предел называют частной производной JI€WO2tlX пеРеменных f в точке а по переменно-
му *«•
Теорема 2.1. Для того чтобы векторная функция
/(*) =
Ж — (Х] , • • •, ®п),
(2-2)
имела частную производную в точке а € Rn по переменному Xir необходимо и достаточно, чтобы все ее координатные функции имели частную производную в точке а по тому же переменному
4 Пусть As, — приращение независимого переменного Xi в точке а. Тогда соответствующее приращение функции / в точке а можно записать в виде
— /(®1» .-. •, ai-1,а, -|- Axt’, ,..., ап) ,..., ап) —
(fi (®1, • • •», ai 4- Дз?х, Ot+i,..., ап) \	/ f\ (fl) \
fm, (®i, • • • i a*—1J 4~	, fl»4-i ।..., ®n) /	\ fm (a) J
(/i(fli)...,flt_i,at*4~Axi,flt'^.i,...,fln) /1(0) \	/	(a)
4“ ДЯ'йОг-М vi®n) fm(a) J
Согласно определению 2.1 частной производной, имеем
дх^
lim
Доч-Н) Дж,
= lim Дх, —>0
/ Д,Л(а) \
I	I
72
2. ДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ
Используя теорему 1.4, получаем
df(a) дхх
что и требовалось доказать. ►
При доказательстве теоремы установлена формула, соглас-но которой частная производная векторной функции /(ж) рав. на векторной функции, координатными функциями которой являются соответствующие частные производные координатных функций для /(ж). Следовательно, вычисление частных производных векторной функции сводится к вычислению соответствующих частных производных ее координатных функций, которые являются функциями скалярными.
Если функция /: Rn —> Rw в точке х € Rn имеет частные производные по всем независимым переменным ж^ ..., жп, то из этих производных (а точнее, из частных производных координатных функций /1 (ж), ..., fm(x)) можно составить матрицу (dfi(x)/dxj) типа т х п, где i соответствует номеру строки матрицы, a j — номеру столбца. Эту матрицу называют мат-рицей Якоби* функции / и обозначают
(2.3)
Часто используют запись матрицы Якоби в виде блочной матрицы-строки
W)\ дхп )
*К. Якоби (1804-1851) — немецкий математик, сделавший немала открытий в теории чисел, дифференциальных уравнений, алгебре, интег ральном исчислении и других разделах математики.
п 2 Геометрическая интерпретация частных производных
блочной матрицы-столбца
***	/	к
дх
(2-5)
I dfm(x) j ' Эх '
последнем случае каждый блок представляет собой матрицу Якоби соответствующей координатной функции.
Пример 2.2. Для векторной функции
f(x,y) = (хе~у х2у3 у)Г
двух переменных х и у найдем все частные производные и запишем матрицу Якоби.
Данная функция имеет три координатные функции и(х у} = = хе-У, v(x,y) = x2y3 И w(x,y) = y. Вычисляем частные прою-водные этих функций:
u'x(x,y) = e-v, = 2®j/3, w£(*,i0 = 0,
u'v(z,y) = -Xe~v, v'y(x,y) = 3X2y2, w'y(x,y) = l.
Составляем из вычисленных частных производных матрицу Якоби:
/4(ж,у)	/ e~v
/'(»,») =	= I 2хУ3
\w'x(x,y) w'y(x,y)/	\ О
—хе у \ Зх2у2 | .
1 /
2.2.	Геометрическая интерпретация частных производных
Пусть функция двух переменных f(x,y) определена в не-^•Рой окрестности точки а= («1, 02) Е R2. Графиком этой пункции в пространстве является поверхность, которая в пря-МоУгольной системе координат (9xyz описывается уравнением
74
2. ДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ
z = f(x,y). Обозначим линию пересечения этой поверхности с плоскостью у = а.2 через у. Выберем на этой кривой точки Р(яь аг, /(дьДг)) и ф(я1+Дж, «2, /(«1 + Дж,я2)), азатем через эти точки проведем прямую L.
Пусть при стремлении точки Q по кривой у к точке Р прямая займет некоторое предельное положение. Соответствующую этому положению прямую называют касательной к кривой у в точке Р (рис. 2.1).
Докажем, что касательная к кривой у в точке Р существует, если функция f имеет в точке («ц, Я2) частную производную по переменному ж, причем угол а между касательной и положительным направлением оси Ох определяется формулой
tg®=
Действительно, угол который прямая L, проходящая через точки Р и Q, образует с положительным направлением оси Ох, вычисляется по формуле
tg</> =
Дд/(Д1,Д2) Дж
Если существует частная производная функции f в точке (Я1, Я2) по переменному ж, то существует предел
lim tgy? = lim Дг->0	Дх->0
Дх/(Д1?Д2) _ ^/(ДьДз)
Дж	дх
2.3. Дифференцируемость функции многих переменных
75
Поскольку функция arctgz непрерывна в области определения, то существует и предел
а= lim <р= lim arctg(tg</>) = arctgl lim tg</>). Дх-М) Да;->0	\ Дя?->0	/
Следовательно, прямая L имеет предельное положение при Дя —> 0, примем тангенс соответствующего угла а равен частной производной /'(«i,a2)-
Замечание 2.1. Можно также показать, что если определена касательная к кривой у в точке Р, причем а / ±тг/2, то в точке (ai, а2) существует частная производная функции f по переменному х. Если же а = ±7г/2, т.е. касательная имеет вертикальное положение, то величина tg</> стремится к оо при Дж-»0. Это соответствует бесконечной частной производной: = °0’
Аналогично, если существует частная производная /' (ai, а2), то в точке Р существует касательная к линии пересечения поверхности z = f(x,y) с плоскостью х = причем значение частной производной /'(ai,a2) равно тангенсу угла, который эта касательная образует с положительным направлением оси Оу.
Приведенная геометрическая интерпретация частных производных функции двух переменных аналогична соответствующей интерпретации производной действительной функции одного действительного переменного [II].
2.3.	Дифференцируемость функций многих переменных
Пусть функция /: Rn Rm определена в некоторой окрестности точки х € Rn и Дх = (Дж1 ... Дяп) — такой вектор пРйращений независимых переменных, что точка х 4- Дж то-^е принадлежит этой окрестности. В этом случае определено
76
2. ДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ
полное приращение функции f
= f(x + Дз:) ~ f(x)<
соответствующее приращению Дж переменных в точке х. Полное приращение функции /(ж) = (/1(ж) ... /п(ж)) в точке .г можно выразить через полные приращения координатных функций /1(ж), ..., fn(x):
(Д (х 4- Дж)
fmfa “Ь Д®) /
/1(ж + Дж)-/1(ж)
fm(x “Ь А®) “ fm(x)
A/m(x)
Кроме того, напомним, что |Дж| = \/(Дж1)2 + ...+ (Джп)2.
Определение 2.2. Функцию /: Rn -> Rm, определенную в некоторой окрестности точки ж, называют дифференцируемой в точке ж, если ее полное приращение в окрестности этой точки можно представить в виде
Д/(ж) = ЛДж + а(Дж)|Дж|,
где А — матрица типа т х п, элементы которой не зависят от Дж, а функция а(Дж) является бесконечно малой при Дж—>0.
Функцию f называют дифференцируемой в области X С Rn, если она дифференцируема в каждой точке этой области.
При т = 1 равенство (2.6) упрощается. В этом случае функция f скалярная, и в равенстве (2.6) матрица А является строкой длины п, т.е. А = (а\ аз ••• ап), а функция а(Дж) это бесконечно малая при Дж —> 0 скалярная функция. Значит, при т= 1 соотношение (2.6) можно представить в виде
Д/(ж) = Д1Дж1 4-02^24-... +апДжп+ <*(Дж)|Дж|.	(2.7)
2.4. Необходимые условия дифференцируемости
( I
Следующая теорема сводит исследование дифференцируемости векторной функции к скалярному случаю.
Теорема 2.2. Векторная функция /: Rn —> Rm дифференцируема в точке х тогда и только тогда, когда в этой точке дифференцируемы все ее координатные функции.
4 Доказательство фактически состоит в переходе от матричной формы записи условия (2.6) дифференцируемости векторной функции к его записи в координатной форме. Действительно, в равенстве (2.6) положим /(ж) = (/1(ж) ... /П1(ж)) , а(Дх) = (oi(Ax) ... ат(ж)) и 4 = (atJ). Тогда (2.6) можно записать следующим образом:
(ж, Дх)
Ощ » Ах)
|Дх|,
или в Координатной записи
Afi(x) = а,1Дх1 + ... +а^Дхп + Oi( Ах) |Дх|, г = 1,ш, (2.8)
где а, (Дж) —> 0 при Дж -4 0.
Итак, соотношение (2.6) эквивалентно (2.8), но представление (2.6) по определению означает дифференцируемость векторной функции /(ж), а представления (2.8) — дифференцируемость координатных функций Л(х), i = 1, т. ►
2.4.	Необходимые условия дифференцируемости
Теорема 2.3. Если скалярная функция /: Rn дифференцируема в точке х, то у этой функции в точке ж существуют Все частные производные i— 1,п, причем коэффициен-
78 2. ДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ
ты di в представлении (2.7) равны значениям соответствующих частных производных в точке х:
<4 = fx,№, i = T~n.
◄ Для дифференцируемой в точке х функции f представление (2.7) верно для любого приращения Дж. В частности, это представление верно, если приращение Дж имеет вид
Дж = (0 ... О Дж, 0 ... 0)Т, Дж,-/О,
где номер i выбран произвольным образом и зафиксирован. В этом случае |Дж| = |Дж,|, соответствующее полное приращение Af(x) функции /(ж) сводится к ее i-му частному приращению &if(x), а равенство (2.7) принимает вид
Д/(ж) = Д,/(ж) = а,-Дж, + а(Дж)|Дж,|.
Разделив последнее равенство на Дж,- и перейдя к пределу при Дж,- -4 0, получим
д,-/(ж)	,.	/ /л ч|Дж»|\
hm — v  = ai + hm I а(Дж)\г—-) = a,, Дг,-И) Дж,	Дг,->0 \ Дж,- /
поскольку функция а(Ах) бесконечно малая при Дж,- 4 0, а отношение ^-^- = ±1 ограничено, так что последний предел равен нулю (см. 1.3, свойство 9° предела функции многих переменных). Следовательно, производная в т°чке ж существует и равна а,-. ►
Следствие 2.1. Если скалярная функция /: Rn -4 R дифференцируема в точке ж, то в этой точке ее полное приращение Д/(ж) можно представить в виде
Д/(®) = fXl (х) Дх1 +	(х) Дх„ + а( Дх)| Дх|,	(2.9)
где а(Дж) -4 0 при Дж -4 0.
2.4. Необходимые условия дифференцируемости
79
Следствие 2.2. Если функция /: Rn—>Rm дифференцируема в точке ж, то в этой точке существуют частные производные этой функции по всем переменным, определена ее матрица Дкоби и в окрестности этой точки полное приращение дДх) можно представить в виде
Д/(ж) = f'(x)Ax + а(Дж)|Дж|,	(2.10)
где а(Дж) -> 0 при Дж -> 0.
4 При т = 1 утверждение следствия вытекает из следствия 2.1. Поэтому остановимся на случае т > 1. Согласно теореме 2.2, из дифференцируемости функции/(ж) = (/1 (ж) ... /т(ж)) в точке ж следует дифференцируемость в этой точке всех ее координатных функций fa. При этом в представлении (2.8) коэффициенты есть значения частных производных координатной функции fa в точке ж по соответствующим переменным:
ДЛ(») = ^^Дг1 + ... + ^^Дгп + а,(Дх)|Дг|.	(2.11)
ОЖ1	ожп
'Значит, в представлении (2.6) матрица А есть матрица, составленная из значений частных производных координатных функций в точке ж, т.е. матрица Якоби /'(ж), а векторная функция а(Дж) имеет своими координатными функциями функции аДДв). Так как все функции а»(Дж) являются бесконечно малыми при Дж —> 0, то и векторная функция о(Дж) является бесконечно малой при Дж -4 0. ►
Следствие 2.3. Если векторная функция дифференцируема в некоторой области, то во всех точках этой области существуют частные производные ее координатных функций
следовательно, в области существует ее матрица Якоби.
Как и в случае действительных функций одного действи-тельного переменного, есть еще одно необходимое условие дифференцируемости функции многих переменных, связанное с ее йецрерывностью.
80
2. ДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ
Теорема 2.4. Если функция многих переменных дифференцируема в некоторой точке, то она непрерывна в этой точке. ◄ Пусть функция /(ж) = (/1(ж) ... /т(я))Т дифференцируема в точке а. Тогда по теореме 2.3 все ее координатные функции fi(x) дифференцируемы в точке а, а их полные приращения в точке а можно записать в виде
Д/.(а) = Е + МД*)1 Дх|, дхк
где аДДж) —> 0 при Дж -> 0. Из этого представления следует, что существует предел
lim Дfi(a) = V lim Дж*+ lim (аДДж)|Дж|) = 0, Дх->о	“ &хк Дх-*° Дг-юч	'
означающий, что функции /Дж), г = непрерывны в точке а. Действительно, полагая Дж = ж - а, заключаем, что /Дж) = = /Да) + Д/Да). При ж -> а имеем Дж —► 0 и, следовательно, Д/Д®) 0- По теореме 1.5 имеем /Дж) -4 /Да) при ж -> а, что и означает непрерывность координатной функции /Дж) в точке а.
Так как все координатные функции /Дж) непрерывны в точке а, то по теореме 1.8 и векторная функция /(ж) непрерывна в точке а. ►
Следствие 2.4. Если функция многих переменных дифференцируема в некоторой области, то она непрерывна в этой области.
Следующие два примера показывают, что необходимые условия дифференцируемости, о которых говорится в теоремах 2.3 и 2.4, не являются достаточными условиями дифференцируемости, т.е. обращения соответствующих теорем неверны.
Пример 2.3. Функция двух переменных

ху
х2 + у2' о,
®2 + у2/0;
х = у = 0,
2.4. Необходимые условия дифференцируемости	81
0 начале координат имеет частные производные. При этом у-/(0,0) = °’	= °’ так как = ° и = °- Всли
эта функция была дифференцируемой в точке (0, 0), то по теореме 2.4 она была бы непрерывной в этой точке (0, 0). Одна-коэто не так (см. пример 1.19). Следовательно, функция f(x,y) де дифференцируема в точке (0, 0), хотя и имеет частные производные в этой точке.
Пример 2.4. Функция двух переменных f(x,y) = |х| + |t/| непрерывна в точке (0, 0), но в этой точке не существуют ее частные производные /'(0,0) и /'(0,0). Поэтому данная функция не может быть дифференцируемой в точке (0, 0). #
Два необходимых условия (непрерывность в точке и существование частных производных) также не гарантируют дифференцируемость функции в точке.
Пример 2.5. Функция двух переменных
(„2., Г у
о,
х2 + у2 / 0;
х = у = 0,
непрерывна при х2 + у2 /0 как отношение двух непрерывных функций. Эта функция непрерывна и в точке (0, 0), поскольку из двойного неравенства
0
X2 у
X2 + у2
и свойства 8° предела функции многих переменных (см. 1.3) бедует существование предела
lim -^Ц=0 = /(0,0).
(г, у)-4(0, 0) Т2 + у2
Следовательно, функция f(x,y) непрерывна в R2.
82 2. ДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ
Рассматриваемая функция имеет частные производные всюду в R2. Действительно, при х2 4- у2 ф О
Г (Х „) = 2*У3	f (Х v) = Х'г^2-У2)
/А,У>	(х2 + у2)2'	}»',V)	(х2 + у2)2'
В точке (0, 0) частные производные тоже существуют, причем /£(0,0) = 0, /'(0,0) = 0 (см. пример 2.3). Отметим, что частные производные не являются непрерывными в точке (0, 0), так как, например, f'x(x,y) ->1/2^0 при (х, у) -> (0, 0) по множеству у = х.
Докажем, что функция f(x,y) не дифференцируема в точке (0, 0). Полное приращение функции f(x,y) в точке (0, 0). соответствующее приращениям Да: и Ду переменных, имеет вид
Д/(0,0) = /(0+Дж, 0+Д1/) - /(0,0) =
Да:* 4- Ду*
Если бы функция была дифференцируемой в точке (0, 0), то. учитывал значение частных производных, мы имели бы равенство вида (2.9):
л У2 = Л(Дг' ДУ) \/Дг2 + Ду2, Да:* 4- Ду^
где а(Да:, Ду) -> 0 при (Да:, Ду) -> (0, 0). Но последнее равенство при Ду = Да: принимает вид
^Дх = \/2|Дх|а(Да:, Да:), 4М>
откуда при Да: 0 имеем |о(Да:, Дх)| = \/2/4, а это проти-воречит тому, что а(Да:,Ду) является бесконечно малой при (Да:, Ду) -> (0, 0).
2.5. Достаточное условие дифференцируемости
2.5. Достаточное условие дифференцируемости
83
В случае действительных функций одного действительного переменного дифференцируемость функции в точке эквивалентна существованию в этой точке конечной производной функции [И]. Однако уже для функций двух переменных существование частных производных в точке не означает, что функция дифференцируема в этой точке (см. пример 2.3). Существование частных производных является необходимым, но не достаточным условием дифференцируемости. Чтобы при наличии частных производных гарантировать дифференцируемость функции многих переменных, нужны дополнительные условия.
Теорема 2.5. Если скалярная функция /: Rn —> R в некоторой окрестности точки а определена и имеет частные производные по всем переменным, причем все производные непрерывны в самой точке а, то функция f дифференцируема в точке af
◄ Упрощая выкладки, докажем утверждение теоремы для частного случая функции двух независимых переменных, т.е. при п = 2. В общем случае доказательство аналогично.
Пусть задана точка а = (ж, у) € R2. Согласно условию теоремы, можно выбрать такое число 6 > 0, что функция f(x,y) будет иметь частные производные в любой точке (я + Дж, + при |Дх| < 5 и |Ду| < 6. Полное приращение функции f(x,y) Удобно представить как сумму двух слагаемых:
&f(x,y) =	+ Az,у + Ду) - f(x,y) =
= (/(z +Az,у+Ду)-/(z,y+Ду)) +
+	+ Л») - /(*>«/)) = &xf(x,y + Ay) + A„/(z,y).
Каждое из этих слагаемых есть частное приращение функции, к°Торое можно интерпретировать как приращение функции од
84
2. ДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ
ного переменного. Например, Ах/(ж,у4- Ау) есть приращение функции
«тЧО = /(<>«/ +Ду)
в точке t = я, соответствующее приращению Ах независимого переменного /, так как
&xf(x,y + At/) = f(x + Дя,у4- Ay) -f(x,y+ Ду) =
= <p(x 4- Аж) — <r>(x).
Функция ip(t) на интервале (ж -6, x 4- 6) непрерывна и диффе ренцируема, поскольку при t € (ж - 6, х 4- £) точка (t, у 4- Ау) удовлетворяет условиям |i - я| <6, |Ду| < 6 и существует производная = f'x(t,y + &y).
На отрезке [я, х 4- Ааг] (или [я 4-Аж, я] в случае Дя < 0) функция <p(t) удовлетворяет условиям теоремы Лагранжа [II]. Следовательно, существует такое число i?i € (0, 1), что
</?(я 4- Дж) - у?(я) = <р'(х 4- # 1 Дж) Дя,
или с учетом конкретного вида функции <p(t)
Дт/(ж,у 4- Ay) = <р'(х 4- Дж)Дя = /'(я 4- Аж,у 4- Ду)Дя.
Аналогично (с помощью функции ^(t) = f(x,t)) можно пока зать, что существует такое число $2 € (0, 1), для которого
= /'(*,j/ + fl2At/)Ay.
Значит,
Д/(ж,у) = fx(x + Дж,у 4- Ау)Аж 4- /'(ж,у 4- ^2Ду)Ду-
Применяя в окрестности точки а к функциям fT и /' теорем) 1.5 о связи функции, ее предела и бесконечно малой, а также учитывая, что частные производные являются непрерывными функциями в точке а, заключаем, что
/'(z + tf I Az,j/+At/) = fT(x,y) + ii, /'(z,y+tf2Aj/) = fy(x,y) + - •
2.5. Достаточное условие дифференцируемости
85
рде 0 =	и 7 = 7(Дг/) — бесконечно малые функции
при (Д^ &у)	(°’ °)- Следовательно,
Д/(ж, у) = (f'x(x,y) +а)Ьх+ (fy(x,y) +7)Дг/ =
= Л(г,»)Дж + 4(ж,2/)Ду+Мж + 7Д.у. (2.12)
Обозначим |(Дж, Ду)| = ^/(Дх)2 + (Ду)2 через р. Тогда
|М* + 7Ду| |^||Д£! + | | |Ду| |ZJ| + |7| 0 р	р р
при р -> 0, так как |&х\/р 1, |&у\/р 1, а Д, 7 -> О при р -> 0. Следовательно, ДДя + 7Д1/ = ар, где а -> 0 при р -> 0. Итак,
д У (ж, .у) = /' (ж, у) Дх + /' (ж, у) Ду + ар,
где а —> 0 при р —> 0. Поэтому, согласно определению 2.2, функция f дифференцируема в точке (х, у). ►
Следствие 2.5. Если векторная функция f имеет матрицу Якоби всюду в некоторой окрестности точки а, причем все элементы матрицы Якоби непрерывны в самой точке а, то эта функция дифференцируема в точке а.
◄ Из условий следствия заключаем, что каждая координатная функция fi векторной функции f имеет в окрестности точки а все частные производные, непрерывные в точке а. Значит, все Функции fi дифференцируемы в точке а. Согласно теореме 2.2, векторная функция f дифференцируема в точке а. ►
Для произвольной области X С Rn через С^Х) обозначают Множество всех скалярных функций /: X —> R, имеющих в X* непрерывные частные производные по всем переменным. Аналогичное множество векторных функций /: X —> Rm, имеющих й X непрерывные частные производные по всем переменным, ^означают C1(X,Rm). Для дифференцируемости скалярной Функции / в области X достаточно, чтобы она принадлежала
86
2. ДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ
множеству функций С^Х). Аналогично для дифференцируемости векторной функции в области X достаточно, чтобы / бСЦЛ^К™). Функции из множеств С1 (X) и C!(X,Rm) называют непрерывно дифференцируемыми в области X.
2.6. Дифференцируемость сложной функции
На функции многих переменных можно распространить правило дифференцирования сложной функции, установленное для функций одного действительного переменного [II]. Но при этом в формуле дифференцирования производные функций одного действительного переменного, образующих сложную функцию, следует заменить матрицами Якоби функций многих переменных.
Теорема 2.6. Если функция многих переменных f: Rn -4 -> Rm дифференцируема в точке а, а функция многих переменных g: Rw —> R* дифференцируема в точке 6= /(а) 6 R™, то сложная функция до f: Rn—>R* дифференцируема в точке а и выполнено равенство
(Н)'(«)=0Ш(4	(2.13)
◄ Пусть функция д определена в окрестности 11(6, а) точки Ь. Так как функция f дифференцируема в точке а, она определена в некоторой окрестности этой точки и является н( -прерывной функцией в точке а. Значит, согласно определению непрерывности, существует такая окрестность U(a,6) из области определения функции /, для которой /(U(a,6)) С U(6,a). В окрестности U(a,6) определена сложная функция до f.
Пусть х — произвольная точка в U(a,6) и у = f(x), z = д(у)-Обозначим Да; = х - а, Дг/ = у - 6, Дг = z - с, где с — д(Ь). В силу дифференцируемости функции f в точке а имеем представление
Ду = f'(a)Ax + а(Да;)|Да;|,	(2.14)
2.6. Дифференцируемость сложной функции	87
где а(Дя) —> 0 при Дя —> О. В силу дифференцируемости д в точке b имеем аналогичное представление
Дг = у'(Ь)Ду + ^(Ду)|Ду|,	(2.15)
где /3(Ду) -> 0 при Ду -> 0. Подставив (2.14) в (2.15), получим
Д(?°/)(“) = Дг =
= д'(ь) (f'(a)&x + «(Дж) | Дж|) + /3( Ду) | Ду| =
= у'(6)/'(в)Д* + 7(Д®)|Д*1. (2.16) где
7(Дж) = д'(Ь)а( Дж) + /3(Д/(а))|/'(а)1'(Дж) + а( Дж) |,
" = Й’
Функция /3(&у) бесконечно малая при Дг/ -> 0, причем на представление (2.15) не влияет значение этой функции при Ду = 0. Поэтому можно считать, что /3($) = 0 и что функция 0(Ду) непрерывна при Дг/ = 0. Но тогда функция /?(Д/(а)) непрерывна при Дя = 0 как композиция непрерывных функций и, следовательно, является бесконечно малой при Дя —> 0. Функция 1/(Дя) является ограниченной: |р(Дя)| = 1. Следовательно, функция
/3(Д/(а))|/,(а)р(Дя) + о(Дя)|
является бесконечно малой, так как представляет собой произведение бесконечно малой функции /?(Д/(а)) на ограниченную Функцию |/'(а)г/(Дя) + а(Дя)|. В результате заключаем, что 7(Дя) -> 0 при Дя —> 0. Согласно определению 2.2, представление (2.16) означает, что функция gof дифференцируема в Точке а. При этом произведение g'(b)ff(a) двух матриц Якоби является, согласно (2.16), матрицей Якоби сложной функции
т.е. имеет место равенство (2.13). ►
Композицию (до f)(x) = g(f(x)) двух функций /: Rw —> Rm й 9- RTn —> R* часто задают в виде z = д(у). у = f(x), вводя
88 2. ДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ
дополнительный набор переменных у € Rm. Переменные в наборе у € Rm называют промежуточными переменными, подчеркивая роль, которую они играют при задании сложной функции. Указанная роль проявляется и при вычислении частных производных сложной функции. Используя координатные функции /1, /2, • ••, frn И Р1, д2, Як Функций многих переменных fug, равенство (2.13) матриц Якоби можно записать в координатной форме
dzi dxj
у-' 9gj df, _ dgj dfa dys dxj ~ dyi дх^
3— I
, dgi dfm ._т-е _т—
’’’+dymdxj’	(2.1/)
Получены формулы для вычисления частных производных координатных функций сложной функции. Отметим, что частные производные в (2.17) вычисляются в соответствующих точках, а именно:	и — в точке а, а в точке 6 = f(a).
’	дх} дх}	’ ду,	J '
В равенствах (2.17) следует обратить внимание на то, как в них входят промежуточные и остальные переменные. Запись частных производных сложной функции в виде (2.17) называют правилом дифференцирования сложной функции или. иногда, цепным правилом.
Рассмотрим некоторые частные случаи дифференцирова-ния сложных функций при различных значениях 7г, т и к. Бу дем предполагать, не оговаривая этого специально, что условия теоремы 2.6 выполнены для этих функций в соответствующих точках.
Если 7i= 1 (или 77i= 1), то у функции f (соответственНО д) будет всего лишь один аргумент и частная производная будет фактически обыкновенной производной. Это должно быть отражено в обозначениях производных. Например, если х = д(у), У = f(t) = (fi(t) •••	где гей, t € R, у~
== (j/ь •••, Ут) € К"1, то сложная функция z = g(f(t)) зависит
2.6. Дифференцируемость сложной функции
89
dg dfin dym dt '
(2.18)
только от одного переменного t и
dz _	dg dfs _ dg df\
dt	dys dt ду\ dt
5=1
где частные и обыкновенные производные вычисляются в соответствующих точках.
Производную сложной функции z = g(f(t)) в случае п = 1,
1 (т.е. действительной функции действительного переменного), вычисляемую по формуле (2.18), называют полной производной функции g(f(t)).
У сложной скалярной функции t/(u,v), и = u(t), v = v(J), один аргумент i, как и у функций u(t) и v(t) (т.е. в данном случае n= 1). Согласно (2.18), находим
dy(t) _ ду(щи) du(t) dy(u,v) dv(t) dt
du dt dv dt
dy(u.v)
где частные производные - и 7 вычисляются в точке tx = u(i), v = v(t).
Пусть z = g(u) — скалярная функция одного переменного и, а и= f(x,y) — функция двух переменных х и у. Тогда z есть сложная функция переменных х и у. z = z(x,y) =g(f(x,y)), причем и — единственное промежуточное переменное. В данном случае п = 2, m = k = 1 и мы имеем две формулы вида (2.17):
dz(x,y) _ dg(u) 9f(x,y)	9z(x,y) _ dg(u) 9f(x,y)
dx du dx ’ dy
гДе производная вычисляется в точке и = f(x,y). du
Пусть п = m = к = 2, т.е. /: R2 —> R2, f = (/] /2)^ Я- К2 “> '^1^2>Я = (д\ 92) • Тогда для сложной функции z = g(f(x},x2)) Равенство (2.13) в матричной форме при обозначениях z = g(y), V = f(xi,x2), y= (yi, y2) имеет следующий вид:
(^i)i2\/(<?i)'yi (<7i)U\ / (/i)x, (fiYxA
\ (^)i, (^)i2 )	\ (<72)'ш (<72)^ ) \ (/2)^ (/2)U ) ’
du ду
90
2. ДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ
Перемножая матрицы в правой части этого равенства, получаем
dzt _ dgt dfa 9gi df2 dxi dyt 9xt dy2 dxi ’
dz2 _ dg2 df\ dg2 df2 dx\ dyi dx\ dy2 dxi ’
dzt _ dgt dfi dgt df2 dx2 dyi dx2 dy2 dx2 ’
dz2 _ dg2 9fi dg2 df2 dx2 dyi dx2 dy2 dx2'
dfj dzk	/	\
где частные производные вычисляются в точке з>2)<
а частные производные — в точке	У2(х\»ж2))-
Пример 2.6. Докажем, что сложная скалярная функция двух переменных z(x,t) = <7(u), u = x-at, гдеg — произвольная дифференцируемая в R функция действительного переменного, является решением дифференциального уравнения в частных производных первого порядка
Для этого достаточно убедиться, что заданная функция обращает данное уравнение в тождество. Поскольку z(x,t) удовлетворяет условиям теоремы 2.6, то при вычислении частных производных z[(x,t) и z^X't) можно воспользоваться цепным правилом, согласно которому
dz(x,t) _ dg(u) дх du

= g’(x-at}, u=r—at
dz(x,t) _ dg(u) dt du
du(x,t) ,
—— - -ag (m)
u=r—at	ul
= — ag'(x - at). u=x—at
Подставляя найденные частные производные в уравнение, убеждаемся, что в результате оно обращается в тождество 0 = 0.
Пример 2.7. а. Найдем полную производную сложной функции z — f(t,x,y), x = s\nt1 t/ = cosi, предполагая, что функция многих переменных /: R3 —> R дифференцируема в R3.
2.7. Дифференциал функции многих переменных
91
В данном случае промежуточных переменных два, но удоб-йо ввести третье промежуточное переменное w = t и рассмотреть сложную функцию z = /*(w,х,у), w = t, х = sin t, у = cost. Используя правило дифференцирования сложной функции, находим
dz__df_div	df_dx^	д/ _ д/	д/	df .
dt dw dt	dx dt	dy	dt dw	dxC°S	dySin	*
где частные производные функции f вычисляются в точке (/, sint, cost).
б. Найдем частные производные сложной функции z(x,y) — = f(u,v,x),u = u(x,y), v = v(x,y).
Вводя, как и выше, промежуточное переменное w = x и записывая сложную функцию z(x,y) = /(u,u,w), u = u(x,y), v = = v(x1y)1 w = x, находим
dz_dfdu df dv dfdw_dfdu df dv df
dx du dx dv dx^ dw dx du dx dv dx^ dw'
dz df du df dv df dw _ df du df dv
dy du dy dv dx^ dw dy du dy + dv dy'
где частные производные функции f вычисляются в точке u = tt(a?,t/), v = v(x,y), w = x.
2.7. Дифференциал функции многих переменных
Пусть функция многих переменных f: Rn —> Rm определена в окрестности точки х = (х\, ..., хп) и дифференцируема в этой точке. Тогда, согласно следствию 2.2, полное прира-Щсние этой функции в точке х в зависимости от приращения Да: = (Дал ... Д^П)Т независимых переменных можно представить в виде
&f(x) = f'(x)kx 4- а(Да:)|Д2:|,
92
2. ДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ
где f(x) — матрица Якоби функции /(ж), а функция а(Дж) является бесконечно малой функцией при Дж —> 0. Как и в случае функций одного переменного [II], можно ввести следующее понятие.
Определение 2.3. Линейную относительно Дж часть полного приращения функции /(ж), дифференцируемой в точке ж. называют (полным) дифференциалом функции f и обозначают через df(x).
Итак, дифференциал функции многих переменных, диффе ренцируемой в точке ж, вычисляется по той же формуле, что и в случае функции одного переменного: df(x) = f(x)Ax. Правда, в многомерном случае f'(x) обозначает не производную функции, а ее матрицу Якоби.
Дифференциалы независимых переменных ж,, г=1,п, как и для функции одного переменного, по определению равны приращениям этих переменных: dxi = Ах{. С учетом этого дифференциал функции f можно записать в виде
df(x) = f(x) dx, dx = (dx\ ... dxn)T.	(2.19)
Для полного приращения дифференцируемой функции многих переменных имеем равенство
Д/(ж) = df(x) + а(Дж)|Дж| = f(x)dx + а(Дж)|Дж|, (2.20)
где dx = (dx} ... dxn)^ и а(Дж) —> 0 при Дж -> 0.
В случае скалярной функции	ее матрица Якоби
f(x) в точке ж является матрицей-строкой, а равенство (2.19) можно записать следующим образом:
d/(I) = fx, (*) dxi + dx2 + . . + /'„(г) dxn,
X = (Z| x2 ... x„) .
Слагаемые /'t dxi в правой части равенства называют частными дифференциалами функции /(ж) в точке ж. Каждое
2.7. Дифференциал функции многих переменных
93
слагаемое dxi представляет собой линейную часть частного приращения Aif(x) функции f(x) в данной точке.
Пример 2.8. Найдем дифференциал dz дифференцируемой скалярной сложной функции двух переменных z = f(u,v), где u = j + v = xy.
В данном случае dz = z'dx + z'dy, где
4 = Л 4+Л4 = fu+Лу.	4 = 44+44 = Л + fa.
а частные производные функции /(u,v) вычисляются в точке (я + t/, ху). Таким образом,
<к=(Л+Лу)<**+(Л+Л*)4л #
Дифференциал функции многих переменных, как и функции одного действительного переменного, имеет свойство, которое называют инвариантностью формы записи дифференциала.
Пусть функция /: Rn —>RW дифференцируема в точке а € Rn. а функция g: Rm -> R* дифференцируема в точке 6= /(а). Согласно теореме 2.6, композиция до f двух функций дифференцируема в точке а, а ее дифференциал в точке а в соответствии с правилом дифференцирования сложной функции имеет вид
d(g °f) = (9° fY(a) dx = g'(b)f'(a) dx = g'(b) dy,
где dy = f(a)dx — дифференциал функции /. Но точно такой же вид имеет дифференциал функции д(у). Вводя набор промежуточных переменных у = f(x), запишем композицию Р°/ в виде z = д(у), у = f(x). Мы видим, что дифференциал dz Ложной функции z = g(f(x)) выражается через дифференциал *У промежуточных переменных так же, как и в случае, когда ЭТи переменные являются независимыми. Другими словами. вСли z = g(y), то dz = д*(у) dy и эта формула не зависит от Т°ГО, каковы переменные t/, промежуточные или независимые.
94
2. ДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ
Это свойство дифференциала и называют инвариантностью его формы записи.
Замечание 2.2. Для дифференциала функции многих переменных сохраняются свойства дифференциала функции одного переменного. Например, для дифференцируемых функций /, д: Rn -> Rm и произвольного действительного числа с верны равенства d(cf) = cd/, d(f ± д) = df ± dg. Кроме того, в случае скалярных дифференцируемых функций / и д справедливы еще два равенства: d(fg) = fdg + gdf и d(f/g) = (gdf - fdg)/g2 (в точках, где д 0).
Вопросы и задачи
2.1. Пусть функция /: R” -> Rw определена в окрестности точки х и имеет в этой точке матрицу Якоби /'(х). Пусть функция д\ Rm -4 R* определена в окрестности точки у = f(x) и дифференцируема в точке у. Докажите, что сложная функция <?<>/: Rn—>R* имеет в точке х матрицу Якоби, причем (дЧУМ = д'(у)Г(х).
2.2. Найдите все частные производные следующих функций многих переменных:
a) z(x,y) = х2 - ху + Зу2 - х + у - 1; б) z(x,у) = \/1 - я + t/2;
в) z(x,y)=	; г) u = sin(z + j/3 + S^);
х* + у£
д)	г = Р(0- где/ = г2-!/2;
е)	z = д(х,у), где х = cosZ, у = sinД;
ж)	z = g(u,v), где и = х - у2, v = у - х2\
з)	z = g(x,y,t), где х = е"2\ г/ = Зе—Д.
2.3.	Найдите матрицу Якоби следующих функций многих переменных:
a)	f(t) = (acosi asini f)T;
6)	f(x) = Ax, где A € Mn(R) — числовая матрица, x G Rn;
в)	f(x,y)= (x2-2y3 xy y/x)T.
Вопросы и задачи
95
2,4.	Найдите дифференциалы следующих функций многих переменных:
а)	и(®,У,г) = г2ул3; б) z(x,y) = у/1-х2-у2; в) z(x,y) -
г)	z = h(x,y), где z = cos2t, у = sin2t;
д)	z=.g(u,v), где u = xy, v = y + x1\
е)	z = g(x,y,t)y где z = sint, у = cost;
ж)	z = y2 + zf(x + y,xy);
з)	г = arctgp где и = 1п(г + у), v = ху.
2.5.	Имеет ли функция f(x,y) = ^4 — z2cosy частную производную gf в точке (2, 0)?
2.6.	Существуют ли частные производные заданной функции в точке (0, 0) и дифференцируема ли функция в этой точке, если функция задана следующим образом: a) z(x,y) = \/х4 -|- г/2; б) z(x,y)= \/х4 +у3; в) z(x,y) = >/|г|3+|у|3?
2.7.	Найдите и если z = еху. у = х + arctgx. ox dx
2.8.	Пусть у(и) — произвольная дифференцируемая функция действительного переменного. Докажите, что функция z(x1y) = ху>(ху) удовлетворяет дифференциальному уравнению
dz dz dx у dy
3. ПРОИЗВОДНЫЕ И ДИФФЕРЕНЦИАЛЫ ВЫСШИХ ПОРЯДКОВ
Эта глава по содержанию близка аналогичной главе выпуска [II], посвященного дифференциальному исчислению функций действительного переменного, и даже названа так же. Ее основные темы: производные и дифференциалы высших порядков и теорема Тейлора. Под производными в данном случае мы понимаем частные производные.
3.1.	Частные производные второго порядка
Предположим, что скалярная функция /: Rn -» R во всех точках в некоторой окрестности U(a,^) точки а имеет частную производную Эта частная производная сама является функцией многих переменных, определенной в окрестности U(а, 5), и может оказаться, что она имеет частную производную в точке а, например по переменному Xj. Частную производную
д (df(x)
Ixj \ dxi
х=а
функции fXt(x) называют частной производной второго порядка функции f(x) в точке а по переменным Xi и Xj и
обозначают*
d2f(a) dxjdxi
или	(а).
’Иногда используют другой порядок переменных в обозначении частных производных, а именно
д	= ^/(х)
дх, \ дх, / дх,х}
3.1. Частные производные второго порядка
97
Производные в связи с этим называют частными производными первого порядка.
Всего у скалярной функции /(a?i,...,a:n) п переменных в заданной точке а может быть п2 частных производных fxiXj(a) второго порядка. При их называют смешанными. При j = i используют обозначения
92f(a) дг? ’
Г^(а) или Ц(а).
Если для скалярной функции /= /(з:1,...,з:п) в точке х существуют все частные производные второго порядка, то из них можно составить квадратную матрицу порядка п

Зх,	дх13x2
d2fa(z) 32/2(х) дхгдх\ Зх|
3xi3xn э2Л(х) 3X2Зхп
дхпдх\
d2fm(x) дхпдх2
dxi /
которую называют матрицей Гессе*.
Пример 3.1. У функции трех переменных и = ху + уг + 4-1п(я,г) в первом октанте, т.е. в области
{(г, у, г) € R3: х > 0, у > 0, г > 0} ,
существуют все частные производные первого порядка:
и'х = уху 1 -f- i, и' =xy\nx + zyz \ u'=/lny+i. х *	z
Эта функция в первом октанте имеет и частные производные второго порядка, которые вычисляются как частные производите первого порядка от уже найденных производных.
Л.О. Гессе (1811 — 1874) — немецкий математик.
98
3. ПРОИЗВОДНЫЕ ВЫСШИХ ПОРЯДКОВ
Вычисляя частные производные первого порядка функции и'х по переменным ж, у и z, находим
«"г = У^У - I)**-2 - -7,	= xv~i + ух*~1\пх, и"г = 0.
Аналогично, используя частные производные и'у и и'2, получаем
UyX = уху~} In ж Ч’^”1, иу2 = xy\n2x + z(z- I)/”2, = уг~' + zyz-t In у
« .
u"x = 0, u"v = zyz ’lny + y' *, u"3 = y’ln2y-—.
z
Отметим, что смешанные производные во всех точках первого октанта удовлетворяют равенствам
~ Ч	Л.Ч	..Ч	Л.Ч	л.ч	//
иух	^ху,	^xz	uzx'	^zy	^yz’
Пример 3.2. Найдем все частные производные второго порядка для функции двух переменных f(x,y) = Зх2у + у2 + 5 и запишем для нее матрицу Гессе.
Решение имеет вид
Обратим внимание на то, что в ответе получилась симметрическая матрица, т.е. в данном случае (как, кстати, и в примере 3.1) значение смешанных производных второго порядка не зависит от порядка дифференцирования (последовательности, в которой вычисляются частные производные первого поряд-ка). #
Как показывают рассмотренные примеры, в некоторых случаях смешанные производные, которые отличаются лишь порядком дифференцирования, совпадают. Следующая теорема
3.1. Частные производные второго порядка
99
дает достаточные условия для такого совпадения, т.е. условия, при выполнении которых значение смешанной производной не зависит от порядка дифференцирования.
Теорема 3.1. Пусть скалярная функция f(x\,...,xn) (n> 1) п некоторой окрестности точки а € Rn имеет частные производные первого порядка /'t и	а также смешанные
производные fx.Xj и fXjXt. Если эти смешанные производные являются непрерывными в точке а функциями по части переменных Xi и Xj, то в этой точке их значения совпадают, т.е.
4 При доказательстве теоремы значения всех переменных, кроме Xi и Xj, можно считать фиксированными. Поэтому можно вести речь о функции, имеющей только два аргумента Xi и Xj, которые удобно переобозначить: xt; = х, Xj = у. Итак, пусть скалярная функция f = f(x,y) в некоторой окрестности U точки (р, q) имеет частные производные первого порядка и смешанные производные fxy, fyx, причем обе смешанные производные непрерывны в самой точке (р, q). Покажем, что в этой точке смешанные производные равны.
Выберем такое число 6 > 0, что при |Дх| < 6, |Др| < 6 точка (р+Дх, р + Др) попадает в окрестность U. Тогда в квадрате |Дэ?| < 6, | Др| < 6 определена функция
д(Дх, Др) = /(р4-Дх, р+Др) - f(p+Дх,q) - f(p,q+Лу) + /(р,q).
Для функции <р(х) = f(x,q + Др) - f(x,q) имеем
р(Дх,Др) = <р(р +Дх) -<р(р).
Функция <р(х) на отрезке [р, р+Дх] (или [р+Дх,р] при Дх < 0) имеет производную
/(*) = ЛСм+Ду) -
и потому непрерывна на этом отрезке. Следовательно, к Функции <р(х) на указанном отрезке можно применить теорему
100 3. ПРОИЗВОДНЫЕ ВЫСШИХ ПОРЯДКОВ
Лагранжа [II]. Согласно этой теореме, существует такое число д е (0,1), что
<р(р + Дж) - <р{р) = <р'(р 4- $Дж)Дж =
= [/' (р + Дх, q + Ду) - (р + 0Д®, 9)] Д*.
Итак,
у(Дх, Ду) = <р(р + Дх) - <р(р) =
= [Л(Р+0Д:М + ДУ)- Л(р+0Д*,»)]Да:.
Выражение в квадратных скобках представляет собой приращение функции А(у) =/'(р4-$Дя,у) одного переменного на отрезке [у, q + Ду] (или [у 4- Ду, у] при Ду<0):
А(у 4- Ду) - А(у) = /' (р 4- #Дж,у4- Ду) - f'x(p + №x,q).
На отрезке [у, q 4- Ду] функция А(у) имеет производную
А'(у) = /"(р4-0Дж,у)
и является поэтому непрерывной на этом отрезке. Значит, и к этой функции на указанном отрезке можно применить теорему Лагранжа. Мы приходим к выводу, что
А(д+ Ду) - А(у) = А'(у 4- 0) Ду)Ду = /"у(р4- 0Дя,у 4- Ду)Ду.
где 6 (0,1) — некоторое число. В результате находим, что
у (Дж, Ду) =	(р + 0Дж, q 4- Ду) Дж Ду.	(3.1)
Равенство (3.1) было получено в результате двукратного применения теоремы Лагранжа, причем сперва она применялась по переменному ж, затем — по переменному у. Но те же рассуждения можно повторить, поменяв лишь порядок пе-ременных. Тогда получим равенство, аналогичное (3.1), но
3.1. Частные производные второго порядка	101
включающее другую смешанную производную. Действительно, если функцию у(Дх,Ду) представить в виде
у(Дх, Ду) = 0(9 + Ду) - 0(9)>
где 0(У) = /(Р +Д®>У) -/(Р.У)> то получим
д(Дх, Ду) = 0'(9 + $2 Ду) Ду =
= [/'(р + Дх,9+ 02Ду) - fy(p,q + 2Ду)] Ду,
где $2 € (0» 1)- Повторно применяя теорему Лагранжа к разности в квадратных скобках, приходим к равенству
у(Дх, Ду) = fyX(p+ 03Дх,9 + 02 Ду) ДуДх,	(3.2)
где 0з € (0,1).
Соединяя равенства (3.1) и (3.2), а затем сокращая на произведение ДжДу, получаем
/"у(р + 0 Д®. 9 + 01 Ду) = fyx (Р + 0зДя, 9 + 02 Ду)-
Переходя в этом равенстве к пределу при (Дх, Ду) —> (0, 0), заключаем, что f"y(p,q) = fyX(p,q), так как 110 условию теоремы смешанные производные и непрерывны в точке (р, q). ►
Условие непрерывности смешанных производных в доказанной теореме нельзя опустить: при нарушении этого условия смешанные частные производные могут отличаться.
Пример 3.3. Покажем, что смешанные частные производные второго порядка функции двух переменных
2	2
*2 + У2/0;
0, г = у = 0, Различны в точке (0, 0).
/(*,!/) =
102	3. ПРОИЗВОДНЫЕ ВЫСШИХ ПОРЯДКОВ
Найдем частные производные первого порядка:
( v (+	.	2 / j
f'x(x,y) = < \*2 + У2 (s2 + y2)2/
(	0,	х = у = 0,
((X2 — у2 4х2у2 \	2 . 2 у
X (	“ / 2T~2i2 ) ’ Х + У / '
\*2 + У2 (х2 + г)2/
0,	х = у = 0.
При у / 0 имеем (0, г/) = -у, откуда
*у у->о	у
Аналогично /'(ж,0) = х при х / 0, и поэтому «р
х
Следовательно, f*y(0,0) / (0,0), что связано с нарушением условия непрерывности смешанных производных в точке (0, 0). Разрыв смешанных производных вытекает из теоремы 3.1 (согласно этой теореме, в случае непрерывности смешанных производных в точке (0, 0) они в этой точке совпадали бы). Но в этом можно убедиться и непосредственно. Действительно, в области х2 + у2 / 0 функции fx и fy имеют непрерывные частные производные первого порядка по переменным у и т соответственно, которые равны между собой:
Однако, например, при у = kxy х / 0, имеем z/ 1 - к2 ( Ък2 \ + (1 + к2)2) ’
и предел этой производной при х —> 0 зависит от к, т.е. является функцией, разрывной в точке (0, 0).
3.2. Частные производные высших порядков	1U3
__
3.2.	Частные производные высших порядков
Частные производные высшего порядка вводятся так дсе, как и частные производные второго порядка. Частную производную k-ro порядка (к > 1) функции многих переменных определяют как частную производную первого порядка от некоторой частной производной (fc-l)-ro порядка этой функции.
Например, для функции f = f(x,y) двух переменных могут существовать следующие частные производные третьего fl" — fill fUt — fill fill fill — fill fin — fm a порядка.
J XXX — Jx31 Jxxy — J x2y} Jxyx* Jyxx — J yx2 ’ Jyyx — Jyix n т.д., всего восемь частных производных.
Порядок производной в верхнем индексе указывают соответствующим количеством штрихов, если он невелик (не выше трех-четырех), а в общем случае натуральным числом. При этом используют как римские обозначения натуральных чисел, так и арабские (в круглых скобках). Например, f"fxy =	,
fim = f№ — fIV
Jxxyy х2у2 ^х2у2'
Пусть X — область в Rn. Через Ск(Х) обозначают множество тех скалярных функций /: X С Rn —> R, у которых все частные производные до порядка к включительно являются непрерывными на множестве X функциями. Аналогичное множество векторных функций, у которых все частные производные до порядка к включительно у всех координатных функций непрерывны в X, обозначают Ck(X,Rm). Можно сказать, что Ск(Х,К"») — это множество таких векторных функций, все координатные функции которых принадлежат Cfc(X). Множества Ck(X,Rm), Ck(X) называют классами и говорят, что скалярная (векторная) функция принадлежит классу Ск в Области X, если она является элементом множества Ск(Х) (C*(X,Rm)). О функции /€С*(Х) (/€C*(X,Rm)) также говорят, что она имеет fc-й порядок гладкости в области X Или что она является k раз непрерывно дифференцируем м°й в области X. В этих обозначениях допустим случай к = оо, означающий, что соответствующая функция имеет непрерыв-
3. ПРОИЗВОДНЫЕ ВЫСШИХ ПОРЯДКОВ
104
НЫе частные производные любого порядка. Такую функцию °бычно называют гладкой* или бесконечно дифференцируй функцией.
Для функций k-vo порядка гладкости в некоторой области 3йаЧение частной производной порядка не выше к не зависит от Последовательности, в которой выполняется дифференци-Р^ние. Например, при к = 4 равенство f™yxy = fxxyy можно Усматривать как равенство частных производных по пере-^Нйому у функций f™x и f'£yi или дху и g'Jx, где д = f'x. °	= так как эти частные производные, являющиеся
ч^ными производными функции непрерывны. Значит.
и fv =
1 JxxV Jxyxy Jxxyy
Свойство независимости частных производных от порядка Дифференцирования, которым обладают функции классов Ск. Позволяет в обозначениях частных производных группировать °Дни и те же переменные и тем самым упрощать запись. Напри-
Для скалярной функции	частные производные
г*г° порядка обозначают следующим образом:
"	“ дх\1...дх%'
Г^е а = (ii, ..., in) и г = |а| обозначает сумму ij +... + in всех ИнДексов.
3.3.	Дифференциалы высших порядков
Пусть скалярная функция /: Rn —> R дифференцируема в Местности точки х. Тогда ее дифференциал
ся *^еРмин „гладкий" в математической литературе не имеет устоявшего-с*<Ь1сла. В разных областях математики этот термин может обозначать
понятия.
3.3. Дифференциалы высших порядков
105
как функция от х может оказаться дифференцируемой функцией в точке х. В этом случае выражение
(»)) — 5Z dx; dXj “5312dxidxidXidXj' (3-3) j=l J	j=l1=1 J
представляющее собой дифференциал от дифференциала функции /(#)> называют дифференциалом второго порядка функции f(x) в точке х и обозначают d2f(x). В этой связи дифференциал df(x) называют дифференциалом первого порядка функции /.
Из теоремы 2.3 следует, что для существования в точке х дифференциала второго порядка функции f необходимо существование всех частных производных второго порядка этой функции в точке х. Достаточным же условием существования дифференциала является условие, что указанные производные являются непрерывными функциями в точке х (см. теорему 2.5).
Если дифференциал первого порядка является линейной функцией переменных dx = (dx^ ... dxn) , то дифференциал второго порядка, согласно представлению (3.3), является квадратичной формой относительно этих переменных. В матричной записи дифференциал второго порядка имеет вид
d2f(x) — dxT f"(x) dx,
гДв ff,(x) — матрица Гессе функции /.
Итак, если f Е С2(U), где U — некоторая окрестность т°чки х € Rn, то в этой окрестности существуют непрерывные частные производные первого и второго порядка, а значит, в существуют как дифференциал первого порядка df, так и Дифференциал второго порядка d2f.
Дифференциал второго порядка, зависящий от набора независимых переменных х и вектора их приращений dx (диффе-^иЦиалов независимых переменных), может оказаться диффе-
106
3. ПРОИЗВОДНЫЕ ВЫСШИХ ПОРЯДКОВ
ренцируемой функцией по совокупности переменных х. Повто ряя последовательно процесс вычисления дифференциалов, приходим к дифференциалу функции к-го порядка, который является дифференциалом первого порядка от дифференциала (А:-1)-го порядка функции /:
dkf(x) = d(dk~'f(x)).
Достаточным условием существования дифференциала fc-го порядка в области X является k-и порядок гладкости функции в этой области, т.е. условие /€ Ск(Х).
С помощью оператора
д	д J
— dx\ 4-...+ з—dxn дх\	дхп
д \* дх &Хп/
dkf(x)
дифференциал fc-ro порядка функции f еСк удобно записывать в виде
иХ\
Здесь выражение в скобках возводится в степень к по обычным
алгебраическим правилам, причем полагают, что
д . \т ) их ।	/
дт . т —   dr™
дх? ' ’
где использовано обозначение dx™ = (dxt)m.
Пример 3.4. В случае функции двух независимых переменных z = f(x,y) € С2 имеем
dz = ffrdx + fydy,
поэтому
d2z = d(f'xdx + f'ydy) =
= (f'xdx + /' dy)'xdx + (f'xdx + fvdy)'ydy =
= f':zdx2 + 2f^dxdy+f"ydy2.
3.3. Дифференциалы высших порядков
107
Это же выражение для дифференциала второго порядка функции ДВУХ переменных получается и по формуле (3.4):
/ /} Л \ 2
d2f(x,y) = \^dx+Q^dy) f{x^) = f"xdx2jr‘if"vdxdy+fwdy2-
Так, для функции z — x2j/3 ее второй дифференциал имеет вид
d2z = 2y3dx2 + \2xy2dxdy 4- &x2ydy2.
Пример 3.5. Найдем второй дифференциал сложной функции z = eu4-u, и = х2 + у2. Первый дифференциал этой функции можно найти, используя инвариантность формы записи дифференциала. Имеем
dz = d(eu 4- и) = (ew 4-1) du.
где
du = d(x2 + y2) = 2xdx + 2ydy.
Дальнейшее дифференцирование дает
d2z = d(eu 4-1) du 4- (e* 4-1) d2u =
= ew (du)2 4- (eu 4- l)d(2xdx + 2ydy) =
= eu (2xdx+ 2ydy)2 + (eu + l)(2dx24-2dj/2) =
= (4eu x2 + 2eu 4-2)dx24-8euxydxdj/4- (4eu y2 + 2eu 4-2) dy2, где и по-прежнему обозначает функцию и(х,у) = х2 + у2.
Вычислим, например, второй дифференциал функции вточ-ке х = у = о. В этой точке имеем и(0,0) = 0. Следователь-8о1 в выражение для дифференциала необходимо подставить * == У = и = 0. В результате получаем
d2z(0,0) = 4 dx2 4- 4 dy2.
Тот же ответ можно получить, вычислив производные вто-Р°го порядка функции z = ех2+1/2 4-я2 4-у2. Отметим, что диф-^Ренциал второго порядка не обладает свойством инвариантами формы записи даже в случае функций действительного
108
3. ПРОИЗВОДНЫЕ ВЫСШИХ ПОРЯДКОВ
переменного. Если бы это свойство имело место, мы могли бы записать d2z = z"2du2 = eudu2. Но, сравнивая с предыдущими вычислениями, легко увидеть, что мы при этом теряем слагае мое fud2u, которое в нашем случае равно (eu + l)(2dx 4-2dt/) и не обращается в нуль.
3.4.	Формула Тейлора
Напомним, что если у действительной функции действительного переменного g(t) в интервале (0,Т) существует конечная производная (тп+1)-ео порядка, то при любом t 6 [0.7] имеет место формула Тейлора (а точнее, формула Маклорена г остаточным членом в форме Лагранжа) [II]:
s(t) = <?(0)+^rt+
g"(oh,	. g(m)(Q).m . g(m+1)(^),m+l
2!	m! (m+1)!
где д £ (0,1) — некоторое число. В частности, при t = 1 (если
Т 1) имеем
9\ 1) = <7(0)4- -уг + “21-
g<w>(0)
т! (тп+1)!
Следу ющая теорема обобщает формулу Тейлора на случаи скалярной функции многих переменных.
Теорема 3.2 (теорема Тейлора), Пусть скалярная функ-ция многих переменных f определена в некоторой окрестности U точки а € Rn, причем f С С’т+1(£/). Если отрезок, соединяю-щий точки а = (аь ..., ап) и а + Дх= (aj 4-Дх>, .... ап 4-ДаЛ содержится в U, то для функции f(x) имеет место формул6 Тейлора
f(a + Ax)
^dkf(a) kl k=0
dm+lf(a + #Ax) (m4- 1)!
3.4. Формула Тейлора
109
где 4? € (0,1) — некоторое число, a d°f(a) = f(a) по определению.
4 рассмотрим действительную функцию действительного переменного
р(0 = /(а + *Дх),	(3.7)
определенную на отрезке [0,1]. Эта функция тп-h 1 раз непрерывно дифференцируема на отрезке [0,1], и потому для нее справедливо равенство (3.5). Покажем, что это равенство для функции вида (3.7) можно преобразовать в равенство (3.6). Действительно,
, Р(о) = /(a) = d°
Для вычисления производных функции g(t) рассмотрим ее как сложную функцию g(t) = f(x)> х = а-НДя. Согласно свойству инвариантности формы записи дифференциала первого порядка,
/ д	д	\
dg(t) = df(x) = (— dii + • • • + 5— dxn) /(х) = \UX\	охп	/
f	д	д	\
= (-x—Axidt+ ...+ -—Axndt)f(x) \дх।	дхп	/
/ д А	д
— ( п—Д®1 + •• • + д— \дх\	дхп
так как при фиксированных а и Дх имеем dxi = d(at -НДя») = i = 1,п. Повторяя процесс дифференцирования, находим

d2g(t) = d(df(x)) = (/-Дх, +...+ ^-Дхп)2/(х)Л2, \иХ{	дхп /
*kg(t) = d(dk~'f(u)) = (^-Дх, + ... + ^-^Xn)kf(x)dtk, \ох\	дхп /
110
3. ПРОИЗВОДНЫЕ ВЫСШИХ ПОРЯДКОВ
Из найденных дифференциалов функции g(t) при t = 0 (что равносильно х = а) получаем
<7<fc)(0) =	+ ...+f(a) = dkf(a), k = TJn,
\OXi	ихп /
и при к = т + 1 и t = д € (0, 1)
Л ‘-М'П ихп
дх\
Заменяя в (3.5) производные функции g(t) согласно полученным формулам, приходим к равенству (3.6). ►
Как и в случае функций одного переменного, при а = 0 формулу Тейлора (3.6) часто называют формулой Маклорена. Число rn, определяющее количество слагаемых в формуле Тейлора, называют порядком формулы Тейлора. Последнее слагаемое в формуле Тейлора (3.6) называют остаточным членом в форме Лагранжа. Остаточный член можно также записать в виде
о(|ДхГ)	(3.8)
(читается: „о малое от |Дх|т“), и тогда его называют остаточным членом в форме Пеано. Таким образом, формула Тейлора с остаточным членом в форме Пеано имеет вид
™ л* f(T\
/(х + Дх) = 52Ц^ + о(|ДхГ).	(3.9)
Л •
*=0
Пример З.в. Запишем формулу (3.6) для функции двух переменных f(x,y) в случае т = 2:
f(x + Дх,у+ Ду) = f(x,y) + /'(х,у)Дх + /'(х,у)Ду+
+ | (/^(х,у)(Дх)2 + 2/''у(х,у)ДхДу + /"2(х,у)(Ду)2} +
1 •>
+ —ld3f(x + '&&x,y+№y).
3.4. Формула Тейлора
111
Замечание 3.1. Формула Тейлора (3.9) с остаточным членом 0 форме Пеано справедлива при более слабых предположениях о функции /, чем формула Тейлора (3.6) с остаточным членом в форме Лагранжа: она справедлива, если функция f имеет непрерывные частные производные до порядка т включительнов окрестности точки х и частные производные порядка т +1 в окрестности точки х, непрерывные в самой точке х.
Замечание 3.2. Формула Тейлора (3.6) с остаточным членом в форме Лагранжа не распространяется на случай векторной функции. Например, для функции y?(t) = (cost sint t) (см. пример 1.4), имеющей непрерывные производные любого порядка, формула Тейлора нулевого порядка (т = 0 в формуле (3.6)) на отрезке [0,2тг] (а = 0, Дх = 2тг) должна иметь вид ^(2тг) = v?(0) + dy?(t?-27r). Но у?(2тг) - у?(0) = (0 0 2тг)т, в то время как = (-sint cost I)7dt. Легко понять, что в любой точке t € [0,2тг] хотя бы одна из первых двух координат дифференциала d<p(t) не обращается в нуль. Поэтому ни в одной точке t6 [0,2тг] значение d<p(t) не может быть равно у?(2тг) - у?(0).
Замечание 3.3. При т = 1 формула Тейлора (3.9) с остаточным членом в форме Пеано в окрестности точки a 6 Rn имеет вид
/(а + Дх) = /(а) -4- df(a) -4- о(|Дх|) = /(а) 4- /'(а) dx + о(| Дх|).
Отбрасывая в этой формуле остаточный член, получаем приближенное представление // функции f в окрестности точки а. Его обычно записывают в виде
M*) = /(a) + /'(a)(x-a) или /Дх) =/(а) +/'(а)£, (3.10)
рДе С = х - а, и называют линейным (или первым) приближением функции f в точке а.
Линейные приближения (3.10) функций широко используют пРи изучении локальных свойств (т.е. в окрестности заданной
112 3. ПРОИЗВОДНЫЕ ВЫСШИХ ПОРЯДКОВ
точки) математических моделей объектов, которые описываются сложными функциональными зависимостями. Наиболее широкое применение линейные приближения нашли в теории дифференциальных уравнений [VIII], приближенных методах решения задач математической физики [XII], [Х111], методах оптимизации [XIV], теории случайных процессов [XVIII] и др.
Формула Тейлора с остаточным членом в форме Лагранжа порядка т = 0 имеет вид
/(а + Да) =/(а) 4-/'(а 4-6 Да) Да, 0 < $ < 1,
или
f(a + Да) - f(a) = /'(а4-0Да)Да, 0<$<1, и известна как формула конечных приращений.
3.5. Дифференциалы в приближенных вычислениях
Дифференциалы функций многих переменных и формула Тейлора для функций многих переменных могут использоваться в приближенных вычислениях примерно так же, как и в случае действительных функций одного действительного переменного. Применение аппарата функций многих переменных предпочтительнее, когда в вычисляемом выражении есть несколько величин, которые могут меняться независимо друг от друга. Покажем это на нескольких примерах.
Пример 3.7. Вычислим приближенное значение
v/12,012 + 4,982.
Это выражение можно рассматривать как значение функции f(x,y) = \/х2 + у2 в точке с координатами х = 12,01, у = = 4,98. Полагаем а = 12, b = 5, Дж = 0,01, Ду = -0,02. Тогда
/(®>у) = /(“ + Д®,6 + Ду)« f(a,b) + /'(а,6) Д® + /'(а,6) Ду.
3.5. Дифференциалы в приближенных вычислениях 1 13
р точке (12, 5) значение функции равно у/Г22 + 52 = 13. Вычисляем частные производные функции:
ГЛ'^у) =	= -7Т=^’
4	7 «Г \/Хг + у*
fy(x,y) = (у/х2 + У2) =	, •
4	'У	х/х2 + у2
В результате получаем
02,О12 + 4,982 «
« \/122 + 52 +
12
\/122 + 52
0,01 -
5 \Л22 + 52
0,02 =
— 13 4-
12 1300
1300 13 + 6.50
13,0015.
Полученное значение отличается от точного лишь в пятом знаке после запятой. Если необходимо оценить точность R полученного приближения, можно использовать формулу Тейлора с остаточным членом в форме Лагранжа. В рассматриваемом случае
- ^2 + у2)3/2 . /ту(х,У) = - х2 + у2)3/2' х2
/у1(х,У) = ^х2 + у2)3/2-
Поэтому
« =	+	+ М„) =
2	2(xJ 4- у*)Л11
"Де х = a + 9&х, у = b + дАу, 0 <9 < 1. Используя неравенства
13, у <; 5 в числителе дроби и оценивая снизу знаменатель ДРоби с помощью неравенства \/z2 + у2 > 12, получаем
Ц < g5(Ai)2 + 130|ДгДу| + 169(Ау)2
'	2 -123
961
2 • 123
• 1(Г4
0,3 -10-4.
114 3. ПРОИЗВОДНЫЕ ВЫСШИХ ПОРЯДКОВ
Отметим, что значение Я, вычисленное при х = 12, у = 5, которое, очевидно, можно рассматривать как приближенно остаточного члена в форме Лагранжа, равно 0,19 10“4. Это близко к полученной нами оценке сверху. #
Дифференциалы функций многих переменных могут иг пользоваться для анализа чувствительности функций на изме-нение тех или иных аргументов.
Пример 3.8. Плоская деталь имеет форму равнобедренного треугольника с боковой стороной 100 мм и углом при вер шине 45°. Насколько изменится расход материала, требуемого для изготовления детали, если угол при вершине увеличится на 1°, а боковая сторона уменьшится на 1 мм?
Площадь равнобедренного треугольника с боковой стороной I и углом при вершине равна = 0,5/2sinip. Полагая Д/ = -1 мм, Д<^ = тг/180, получаем
р	125
= /(sin у?) Д/ + — (cos<^) Д<^ = -50\/2 4- —- 7г\/2 -9,004.
£	*7
Таким образом, площадь, пропорциональная количеству расходуемого материала, уменьшится на 9мм2.
Вопросы и задачи
3.1.	Найдите все частные производные первого и второю порядка для заданных функций:
a) z = arcsin-; б) u = cosfzt/2).
2/
3.2.	Найдите матрицу Гессе f'(x,y) функции
f(x,y)=(x* Ух)г.
Вопросы и задачи
115
3.3.	Найдите функцию Л(х,?/), при которой функция и = j;- y^sin - является решением уравнения
37
2 du du ..	.
х d~x+xydTh{x'y}-
3.4.	Покажите, что при любых действительных А и Л функция u = 4sin(Aa:)cos(Aat) удовлетворяет волновому уравнению [XII]
d2u _ 2®2u
dii~a d&'
3.5.	Покажите, что при любом А € R функция
и = А—т=ехр
(д ~ Др)2 4a21
удовлетворяет уравнению теплопроводности [ХП]
du 2d2u — = (г----.
dt	dx2
3.6.	Найдите все частные производные второго порядка сложной функции z = u2 - uv2, u = z + v^y-x.
3.7.	В точке (1,0) найдите все частные производные первого и второго порядка для функции z(x>y) = /(In(х = у), егу), гДе / — некоторая дважды дифференцируемая функция.
3.8.	Найдите дифференциалы первого и второго порядка в точке х = 1, 1/ = 0 для сложной функции z = u2 + v2, u = sin(zt/), V== x2 cosy.
4. НЕЯВНЫЕ ФУНКЦИИ
Рассмотрим систему уравнений
(1.1)
/1	113>2’ • • • 5 ^n+m ) —
/2(^1, X'i* • • •»^n+»n) ~ О»
где функции /1(я), ...» fm(x) определены в некоторой оат-сти X С Rn+m. Предположим, что эта система разрешима относительно части переменных, например х„+], ..., Разрешимость системы в данном случае следует понимать в широком смысле как существование для любых значений ....
хп единственного решения системы относительно переменных £«+1, •••> Тогда определена функция многих переменные у = h(x), которая точке х = (х|, хп) € Rn ставит в соответствие точку у = (Яп+Ь • • • > Sn+m) € Rm Так, ЧТО в СОВОКУПНОСТИ переменные £|,..., хп±т составляют решение рассматриваемой системы. В этом случае о функции h(x) говорят как о неявной функции, или неявно заданной функции. Отметим* что термин „неявная функция“ относится не к виду или структуре функции, а лишь к способу ее задания.
В математическом анализе важную роль играют условия-при выполнении которых система уравнений вида (4.1) pa:ip(V шима относительно части переменных. Отметим, что весьма не просто определить, разрешима ли система в заданной обла* сти. Условия же локальной разрешимости системы (4.1). « с ее разрешимости в некоторой окрестности заданной точк>1-достаточно просты и связаны в первую очередь с дифферент”' альными свойствами функций .... /ш.
4.1. Случаи уравнения с двумя неизвестными	1 17
При изучении системы вида (4.1) удобно использовать векторные способы записи. Подобную систему будем записывать в 0||де /(х,у) =0, где х € Rn объединяет переменные, значения которых задаются произвольно (свободные переменные), у С объединяет переменные, относительно которых решается система (зависимые переменные), а /: Rn+m -> Rm — некоторая, вообще говоря, векторная функция многих переменных. Изучение вопроса начнем с частного случая, когда п = т = 1, т.е. переменные х и у являются скалярными.
4.1.	Случай уравнения с двумя неизвестными
Пусть Z — f(x,у) — функция двух переменных. Уравнение f(x,y) = 0 будем называть уравнением с двумя неизвестными. Остановимся на вопросе о том, при каких условиях это уравнение определяет переменное у как неявную функцию переменного х. Рассмотрим несколько примеров.
Пример 4.1. Уравнение Зх2 - у 4- 20 = 0 может быть записано в эквивалентном виде т/ = Зх24-20, и мы видим, что это уравнение задает переменное у как функцию переменного х. Выполненное преобразование уравнения — это фактически ею решение относительно переменного у (мы выразили у через х).
Пример 4.2. Из уравнения х2 4- у2 - 9 = 0 тоже можно выразить у через х: у = ±\/9 - х2. Однако в этом случае каждому значению х Е (-3,3) соответствуют уже два значения у. Мы получаем из уравнения не одну, а две функции, определенные На отрезке [-3,3]:	(х) = \/9 — х2 и h2(x) = -\/9 - х2.
Пример 4.3. Уравнение х2 4- у2 4- 1 = 0 не имеет решений н потому не задает ни одно из переменных как функцию от Другого.
Пример 4.4. Задает ли уравнение еу 4- у - х 4- In х = 0 ПеРеменное у как функцию переменного х или переменное х функцию переменного у? Ответить на этот вопрос сложно.
118
4. НЕЯВНЫЕ ФУНКЦИИ
так как не ясно, каким образом одно из переменных можно выразить через другое, преобразуя это уравнение. #
Приведенные примеры показывают, что не так-то просто, исходя из вида уравнения f(x,y) = 0, выяснить, задает оно неявную функцию или нет. Как отмечено выше, ответить на этот вопрос можно в окрестности заданной точки> если использовать дифференциальные свойства функции двух переменных /(«. у)-
Теорема 4.1 (теорема о неявной функции). Пусть уравнение f(x,y) = 0, ж, у € R, удовлетворяет следующим трем условиям:
1)	координаты точки (а, Ь) удовлетворяют уравнению, т.е. /(*,*) = 0;
2)	функция f(x>y) определена в некоторой окрестности U точки (а, Ь) и непрерывно дифференцируема в U, т.е. f € С1 (Г);
3)	частная производная функции f{x,y) в точке (а, 6) по переменному у отлична от нуля, т.е. f!AaJ>) / 0.
Тогда на плоскости существует такой прямоугольник Р, определяемый неравенствами |х — а| < 6Xi 11/ - 6| < имеющий центр симметрии в точке (а, 6), что в Р уравнение f(x,y) = 0 разрешимо относительно переменного у и тем самым задает функцию у = ¥>(х), х € Т = (а - а + 6х). При этом функция у = непрерывно дифференцируема на Г, а ее производная может быть вычислена по формуле
(4.2)
!/=<?(*)
◄ Будем для определенности считать, что fy(a,b) > 0, так как в противном случае вместо функции f(x,y) можно рассмотреть функцию -f(x,y). В силу непрерывности частный производных существует такое число Д > 0, что при |аг - а| и |j/ - 6| Д точка (я, у) попадет в U и будет верно неравенстве
4.1. Случаи уравнения с двумя неизвестными
119
f(x^y) > 0- Тогда при фиксированном х € [а - Д, a 4- Д] функция яАу) — f(x*y) одного переменного у определена на отрезке р- Д, Ь + Д] и на этом отрезке возрастает, так как имеет положительную производную [II]. При этом для х = а функция 0х(у) обращается в нуль в точке Ь отрезка [6 - Д, 6 4- Д]. Следо-
детально, /(а,6 - Д) = дЛ(Ь - Д)
Отметим, что функция двух переменных f(x,y) имеет непрерывные частные производные в U. Значит, она дифференцируема и непрерывна в U. Поэтому можно указать такое число 6, 0 < 6 Д, что при |ж - а| 8 будем иметь /(ар, 6 - А) < 0 и /(я, Ь + Д) > О (рис. 4.1).
Выберем произвольное значение х 6 [а - 6, a 4- <5] и зафиксируем. Функция дх(у) = f(x}y) на отрезке [6 - Д, 6 + Д] непре
рывна, возрастает, причем на концах отрезка имеет значения разных знаков. Следовательно, на этом отрезке существует единственное значение у, при котором функция дх(у) принимает нулевое значение. Иначе говоря, при х Е [а - 6, a 4- <$] уравнение f(x,y) = 0 на отрезке [6 — Д, Ь 4- Д] имеет единственное решение относительно у, т.е. на отрезке г С [a - d, a 4-6] определена однозначным образом функция у = удовлетво ряющая соотношению f(x,<p(x)) = 0. Тем самым доказана разрешимость уравнения /(я,2/) = 0 относительно у в некотором прямоугольнике Р. В качестве 8Х и 8У следует взять соответственно 8 и Д.
Отметим, что функция у = <р(х) непрерывна в точке а, в которой значение функции равно 6, т.е. <р(а) = Ь. Действительно, приведенные выше рассуждения верны при любом сколь угодно малом значении Д > 0. Это на самом деле означает, что любого числа Д > 0 существует такое число 6 > 0, что при $ 8 уравнение f(x,у) = 0 разрешимо относительно у, при
120
/. иияннын функции
чем значение у попадает в отрезок [—А, Д]. Но уменьшение Д приведет не к изменению функции а лишь к сужению е<« области определения. Значит, при - а| <5 мерно неравенство |^(.г) - 6| = |у - 6| А. А это и есть условие непрерывности функции у~<р(х) в точке а.
В качестве точки (а, Ь) можно взять л кэбу ю точку в пря моугольнике Р на графике функции у = ^(г) и повторить в< <• рассуждения. Мы получим, что функция у = непрерывна в любой точке х интервала (а - 6т,а + <$, ).
Выберем в прямоугольнике Р произвольную точку (г. у). для которой у = ^(т), или, по-другому, /(*, 3/) =0. Обозначим Д.г = х - «, Ду = у — Ь. Тогда
А?/ = У - b = ^(х) - у?(л) = ^(а 4- А.г) - уф/).
Функция /(.с,у) имеет непрерывные частные производные в Р. Поэтому к ней можно применить теорему Т< ii.topa при т = О. В результате получаем
0 = f(x.y) - f(a.b) = f'.(a + 0Д.г,6 4- i?Ay)A.r 4-
+ /;(«4-i9Aj-.6 + i7Ai/)Ay. i?€(0, I).
откуда, учитывая, что f /0 в прямоугольнике Р. находим
где х = а 4- ?7Д.г. у = b 4- Ду.
Если .г устремить к значению а (х -4 а), то в силу непрерывности функции у = ^(т) будем иметь у —> 6, откуда заключи ем, что точка (т, у) на плоскости будет стремиться к точке («, 6). Но тогда Дт -4 0, Ду —> 0 и (х. у) —> («. Ь). В силу непрерывности частных производных функции f(jr,y) отношение можно представить в виде У
4.1. Случаи уравнения с двумя неизвестными
121
где о(А.т) бесконечно .малая функция при Д.г —> 0. Унтом это представление в равенстве (4.3):
^(а + А.г) - ^(«) = Д.у = ~	-^т + о(Дг) Д.г.
Полученное соотношение по определению означает, что функция одного переменного у = ^(.т) дифференцируема в точке а. При этом
Ясно, что вместо точки (а, Ь) можно взять любую точку в прямоугольнике Р, лежащую на графике функции i/ = ^(.r). и повторить рассуждения. Мы приходим к выводу, что функция у = дифференцируема в интервале (а — а + д'г), а её производная может быть вычислена по формуле (4.2). Наконец, отметим, что правая часть формулы (4.2) представляет собой композицию непрерывных -функций: отношение частных производных есть непрерывная функция двух переменных как отношение непрерывных функций (при этом Д(с,,у)/0 в прямоугольнике /’), а переменное у есть непрерывная функция .V = v(-t) переменного .г. Следовательно, функция ^(.г) непрерывна в интервале (а - a + ^т). ►
Отметим, что прямоугольник /’. построенный в доказательстве теоремы 4.1, выбран так, что график функции у = ^(.г) Расположен внутри этого прямоугольника и соединяет две точки на противоположных вертикальных сторонах прямоугольника.
Пример 4.5. Уравнение f(.i\y) = л'2 + у2 - 9 = 0 из при-МеРа 4.2 задает окружность радиуса 3. Условия теоремы 4.1 Вь«полнены во всех точках окружности, кроме точек (3. 0) и ("3, 0), в которых /' = 0. Для любой точки (л, Ь) окруж-и9сти в верхней полуплоскости существует прямоугольник Р.
122
4. НЕЯВНЫЕ ФУНКЦИИ
Рис. 4.2
в котором уравнение разрешимо o i носительно у: у = >/9-ж2 (рис. 4.2). В качестве такого прямоуголыпь ка подходит любой прямоугольник в верхней полуплоскости со сторо нами, параллельными осям коорди нат, центром в точке (а, 6), та кой. что окружность пересекаете я с его боковыми сторонами. Для точек окружности в нижней полуплоскости в соответствующем прямо* В окрестности точек (3, 0) и (-3, 0) относительно у. Например, возьмем 3 уравнение не имеет реше
3 оно имеет два решения, т.е. в окрестности этои
угольнике у = -уу-х4. уравнение неразрешимо точку (3, 0). Тогда при любом х ний, а при х
точки уравнение не определяет у как функцию х. Отметим, что в этих особых точках касательные к окружности вертикальны.
Пример 4.6. Функция f(x,y) = су А-у - х + In х из примера 4.4 удовлетворяет условию fy(x,y) = су + 1 >0 всюду в правок полуплоскости ;г > 0. Значит, если это уравнение имеет хотя бы одно решение (а, 6), то в окрестности этого решения уравнение* разрешимо относительно переменного у и задает у как функ цию переменного х. Например, это справедливо и для точки (1, 0), поскольку /(1,0) = 0. Согласно теореме 1.1, в некотором прямоугольнике с центром в точке (1,0) рассматриваемое* уравнение неявно задает функцию у = ^(х), причем эта функ ция имеет непрерывную производную
/М = -
4- I

Подставив координаты точки (1, 0) в найденное выраже* ние производной, заключаем, что <р'(1) = 0. Следовательно, в точке х = 1 неявно заданная функция у = <?(х) может иметь экстремум. Поэтому продолжим исследование поведения это»’
4.1. Случай уравнения с двумя неизвестными
функции в окрестности точки х — 1. Найдем вторую производную неявной функции у = <р(х), дифференцируя ее первую производную как сложную функцию:
где у = у' = <//(я). В точке х = 1 находим </'( 1) = 0,5 > 0. Следовательно, неявно заданная функция у = <р(х) в точке т — 1 имеет минимум, а ее график в окрестности точки (1,0) является выпуклым вниз (рис. 4.3).
Итак, не имея явного выражения для функции <^(г)> мы смогли ее исследовать в окрестности точки х= 1. Отметим, что функция f(x,y) = е.у + у - х + \пх при фиксированном х монотонно возрастает как функция переменного у на всей числовой оси. При этом f(x,y) -> +оо при у -> 4-оо и f(x,y) -> -оо при у -> —оо. Значит, уравнение f(x,y) при любом х > 0 относительно у имеет решение, и притом единственное. Таким образом, рассматриваемое уравнение неявно задает переменное У как функцию переменного х при х > 0 и в данном конкретном случае в качестве прямоугольника Р можно взять любой прямоугольник в правой полуплоскости х > 0 со сторонами, параллельными осям координат, нижние вершины которого Расположены в нижней полуплоскости, а в верхних вершинах Функция f имеет положительные значения. Из найденного выражения для производной определяем, что неявная функция Убывает при 0 < х < 1 и возрастает при х > 1.
124
4. НЕЯВНЫЕ ФУНКЦИИ
4.2.	Общий случай
Теорему 4.1 несложно обобщить на случай одного уравнении с п + 1 неизвестными.
Теорема 4.2. Пусть в окрестности V' точки (а, 6), а Е R". b € R, задана функция f(x,y) от и. + 1 переменных (х Е R''. у Е R), удовлетворяющая условиям:
а)	/(а,6) = 0;
б)	функция f(x.y) непрерывно дифференцируема в V-,
в)
&
Тогда точка (а, 6) имеет окрестность вида
{(х, у) Е RM+1: х Е ('(«Л), 11/ - Ь| < М 1
где U(a,6x) — ^-окрестность точки х Е Rn, в которой уравнение f(x,y) = 0 разрешимо относительно у, т.е. в U(a,6j.) определена скалярная функция <р(х), удовлетворяющая тождеству = 0. При этом функция <р(х) непрерывно дифференцируема в Г(а,<5г), а ее матрица Якоби может быть вычислена по формуле (4.2), в которой под f'T(x,y) следует понимать матрицу Якоби функции f(x,y) по части переменных х, т.е. матрицу Якоби этой функции при фиксированном переменном ?/, рассматриваемой как функция векторного аргумента х.
◄ Доказательство сформулированного утверждения повторяет доказательства теоремы 4.1 с единственным уточнением: вместо частной производной по переменному х в теореме 4.1 и< пользуется матрица Якоби функции f по части переменных х. При этом в доказательстве встречается деление матрицы Як<> би на. ненулевое действительное число (частную производную по переменному у), под которым следует понимать умножение матрицы на обратное число. ►
Опираясь на этот более общий вариант теоремы 4.1, можп<’ доказать теорему о неявной функции для системы уравнений, используя метол математической индукции.
'1.2. Общий случай
125
Пусть F: R,n+n-»Rw — векторная функция т + п перемен-ных. Запишем эту функцию в виде F(.r,?/), где х Е R" обозначает группу из п переменных (х = (z]...хм)), а у Е R”1
группу из оставшихся т переменных (у= (у1у ..., ут)). Тогда дляфункции F(x,.y) = (/1(x,t/) ... /Ш(х,1/))Г векторное уравнение F(x,?/) = 0 равносильно системе уравнений
f\ (% J,..., Хп, У\
Поставим вопрос: при каких условиях эта система разрешима относительно переменных уу, .... у1п в окрестности данной тонки (a, b) Е R’l+w? В формулировке и доказательстве через = и = dFfa^ будем обозначать соответственно матрицы Якоби функции F по части переменных х и
по части переменных у, т.е.
Эг\
дг\
д/\(г,У) di2 df2(r,y) дт.2
дМ^У) Э1'2
^fl(x.y) c)r1t df2(x,y) fan
и
> dfm(x,y)
' дг\
dfnM &r,i
dfi(x,y)		dfi(r,y)
dt/i	&У2	&Ут
	<^f2(x,y)	
ду\	&У2	дуги
dfm(T,y)	dfm(*,y)	()fm(l,y)
ду\	&У2	дут
Отметим, что матрица Fy(x,y) является квадратной порядка а матрица Якоби F'(x,y) по всей совокупности переменных м<>Жет быть записана как блочная матрица (F^.(x,y) F^(x,y)).
126
4. НЕЯВНЫЕ ФУНКЦИИ
Отметим также, что определитель квадратной матрицы Якоби (по части переменных или по всем переменным — неважно) называют якобианом.
Теорема 4.3 (теорема о неявной функции). Пусть система т уравнений F(x,y) = 0, х Е Rn, у Е Rw\ удовлетворяет следующим трем условиям:
1)	координаты точки («, 6) Е Rn+w удовлетворяют уравнению, т.е. F(a,6) = 0;
2)	функция F(x,y) определена и непрерывно дифференцируема в некоторой окрестности V точки (а, 6), т.е. F Е C’JV):
3)	матрица Якоби функции F(x^y) в точке (а, 6) по части переменных у невырождена, т.е. det F'(a,6) /0.
Тогда в R,i+”‘ найдется окрестность U точки (а, 6), определяемая неравенствами |т — a| <	11/ - Ь| < 6у, в которой си-
стема уравнений F(x,y) = 0 разрешима относительно группы переменных у и тем самым задает функцию у = <t>(x), х Е F, = = {хЕ Rw: I* -a| < 6Г}. При этом функция у = ф(х) непрерывно дифференцируема в области IJT, <р(а) = 6, а ее матрица Якоби может быть вычислена по формуле
/(*) = -((^(*>2/)) 1 ^(*-2/))

◄ Доказательство теоремы проведем индукцией по количеству уравнений системы, т.е. по параметру т. При т= 1 мы имеем одно уравнение с п + 1 неизвестными и утверждение теоремы сводится к утверждению теоремы 4.2.
Предположим, что утверждение теоремы верно для случая т- 1 уравнений, и рассмотрим систему F(x,t/) = 0 с т уравнениями, которая удовлетворяет условиям теоремы. В точке (а, Ь) матрица Якоби Fy(x,y) является невырожденной. Следовательно, последняя строка этой матрицы, состоящая из частных производных	j = 1, тп, имеет хотя бы один не-
"!/j
4.2. Общий случай
127
нулевой элемент. Не теряя общности, можем считать, что это последний элемент строки, т.е. ~^(а,Ь)^0. Тогда уравнение = 0, где у* = (х/i, ..., в некоторой окрестности U*(a,b) точки (а, Ь) вида
[7ж(а,Ь) = {(х,^, 2/m)6Rn+w:
|х-а|<^1, \y*-b*\<62, |t/m-Ьт| < <$з}|
b (^*1 Ьт) — (Ь|, ..., 6т_], &7п),
согласно теореме 4.2, разрешимо относительно переменного ут и может быть представлено в виде ут =	где функция
непрерывно дифференцируема в окрестности U*(a,b*) точки (а, 6*). С помощью этой функции можно исключить из системы F(x,y) =0 неизвестное у1п и перейти к эквивалентной системе Е.(х,1/Ж) = 0, где функция F„(x,y*) имеет координатные функции
Эти функции являются непрерывно дифференцируемыми в окрестности точки (а, 6*) Е RT‘+m-1, и для системы уравнений F*(x,y+) = 0 выполняются условия теоремы. Согласно предположению математической индукции, система /ч.(х,2/*) = 0 разрешима относительно переменных уж в окрестности точки К Ь„) и может быть представлена в виде у* = Ф*(х). Но тогда система
{у* = (Мя), Ут = ^>(х,г/>*(х))
Эквивалентна системе F(x,y) = 0. Другими словами, система ш Уравнений F(x,t/) = 0 разрешима относительно переменных у и в некоторой окрестности точки (а, 6) может быть предста-Влена в виде у = ^(я), где функция <^(х) = (тЩх) ib(x,i/\(x))) Непрерывно дифференцируема в окрестности точки a Е Rn.
НЕЯВНЫЕ ФУНКЦИИ
Так как функция <^(я) дифференцируема в окрестности точки а, функция F(x,y) дифференцируема в окрестности точки (а, 6), то сложная функция G(x) = F(x^(x)) дифференцируема в некоторой окрестности точки а. Согласно правилу дифференцирования сложной функции,


Но в то же время в силу выбора функции <р(х) имеем G(x) = О в некоторой окрестности точки а. Значит,
F^{x)) + F^^(x))^(x)=0
в этой окрестности точки а. Отметим, что матрица Якоби Fy(a,b) невырожденная. Поэтому матрица Fy(x,y) являете я невырожденной в некоторой окрестности
С(а.&) = {(х, у): |х -а| < £|, |у-6| < £-2)
точки (а, Ь). Число £| можно взять настолько малым, что при |z - «| < £| будет выполняться соотношение |<^(z) - 6| < г 2. В этом случае матрица Fy(x^(x)) при I# - «| < f| является невырожденной, и мы приходим к формуле
/(х) = -(Р'(х,<р(х)))-'/-;(х^(х)),
равносильной (4.4). ►
Теоремы 4.1-4.3 содержат три условия, которые являются достаточными для локального существования неявной функции и ее дифференцируемости. В случае нарушения хотя бы одно го из этих условий применение указанных теорем невозможно и следует искать другие подходы к выявлению разрешимости системы нелинейных уравнений. Покажем на примерах, что при нарушении условий теоремы о неявной функции ее утверждение в одних случаях верно, а в других нет.
‘1.2. Общий случай
129
Пример 4.7. а. Рассмотрим уравнение t/2/3 — х = 0. Оно разрешимо относительно переменного х. и определяет функцию х~у2!3 (рис. 4.4). Ясно, что в окрестно- у сти точки (0, 0) рассматриваемое уравне-	/
ние не разрешимо относительно переменно-	/
го У у так как любому значению х > 0 соот-ретствуют два противоположных по знаку	►
значения у, в то время как при х < 0 урав- 0	х
нение вообще не имеет решений. Такая	\
ситуация указывает на нарушение условий	\
теоремы 4.1. Действительно, в точке (0, 0)	'
выполнено первое условие теоремы, но на- рис 4 4 рушены второе и Третье условия, так как в точке (0, 0) не определена частная производная функции f(x,y) = у2/3 - х по переменному у.
б. Уравнение у2 -х.3 = 0, как нетрудно увидеть, эквивалентно предыдущему уравнению у2/3 - х = 0, но ему соответствует функция F(x,y) = х3 - t/2, непрерывно дифференцируемая на всей плоскости. Новое уравнение по-прежнему не разрешимо в окрестности точки (0, 0) относительно переменного у (так как оно эквивалентно прежнему). Теорема 4.1 не применима, и единственной причиной этого в данном случае является нарушение третьего условия теоремы. Отметим, что в других точках в R2, удовлетворяющих уравнению у2/3 - х = 0 (или У - аг = 0), условия теоремы 4.1 выполнены, а уравнение в области а: > 0 задает неявную функцию у = х3^2 для точек выше оси абсцисс и у — -х3!2 для точек ниже оси абсцисс.
Пример 4.8. Уравнению (у — х)2 =0 соответствует функция F(x,y) = (у-х)2, непрерывно дифференцируемая всюду в В точке (0, 0) выполнены первое и второе условия теоремы 4*1» однако третье условие нарушено, так как F'y(x,y) = 2(у - х) И ^(0,0) = 0. Тем не менее уравнение разрешимо относительно переменного у и задает функцию у = х, определенную и прерывно дифференцируемую всюду в R. В данном случае
130
4. НЕЯВНЫХ ФУНКЦИИ
утверждение теоремы (в части существования неявной функции) верно, хотя применение этой теоремы невозможно из-за нарушения ее условий.
Пример 4.9. Рассмотрим систему уравнений
и2 - 2л’4-т/2 = 1«
V2 - 2уи + х2 = 0 к	*
(4.5)
в окрестности точки (т. у, w. г) = (0. 1. 0. 0). Векторная функция
и2 - 2xv 4- у2 - 1 \
V2 - 2уи 4-х2 /
Г(х, у,и, v) =
является дифференцируемой в R4 и удовлетворяет условии» /?(0,1,0,0) = (0 0) . Вычислим ее матрицу Якоби:
m.v) =
-2v 2х
2у 2и — 2х
-2и -2у 2v
В точке (0. I, 0. 0) значение матрицы Якоби равно
Е'(0,1.0.0) =
0 2 0 0
0 0-20
Видно, что матрица Якоби Е'(0,1,0,0) имеет единственный ненулевой минор второго порядка, соответствующий переменным у и и:
/W0,1,0.0) =(*
Следовательно, согласно теореме 4.3, в окрестности pare мат-риваемой точки систему уравнений (4.5) можно разрешить ОТ' носительно переменных у и и. т.е. система определяет в окрестности точки х = 0, и = 0 функции y = y(x,v)< ц = ц(х,и), для
4.2. Общий случай	131
которых F(x,y(x,v),v(x,v),v) = (О 0)T. Эти функции, согласно теореме 4.3, дифференцируемы, но можно показать, что на самом деле они дважды непрерывно дифференцируемы.
Найдем первый и второй дифференциалы функций y(x,v) и u(X'V) в точке (0, 0). Дифференцируя уравнения системы, после сокращения на 2 находим
u du — х dv — v dx + у dy = 0, v dv — у du — u dy + x dx = 0.
(4-6)
Полученная система двух уравнений является линейной относительно дифференциалов переменных х, у, «, v. В точке (0, 1, 0, 0) она приобретает особенно простой вид
dy = 0, du = 0.
Таким образом, функции y(x,v) и u(x,v) имеют нулевой дифференциал при х = v = 0.
Еще раз дифференцируем систему (4.6), учитывая, что dx и dv — это дифференциалы независимых переменных, a dy и du — это дифференциалы неявно заданных функций. В результате получаем
du2 + ud2u - dxdv - dvdx 4- dy2 + у di2у = 0, ^2	2	2	2	(4.7)
dv — dydu - yd u — dudy - ud у + dx = 0.
В точке (0, 1, 0, 0) имеем du = dy = 0. Поэтому система (4.7) в этой точке принимает вид
- 2dxdv + d2y = 0, dv2 — d2u + dx2 = 0.
В
° Результате получаем вторые дифференциалы функций t/(x,v) И v) в точке (0, 0): d2y = 2dxdv, d2u = dx2 + dv2.
132
'I. НЕЯВНЫЕ ФУНКЦИИ
4.3. Обратная функция
Рассмотрим вопрос, при каких условиях функция многих п(-рсменных G: Rn -> Rn имеет обратную функцию G’-1, а также' вопрос о том, дифференцируема ли обратная функция. Соответствующие условия в окрестности фиксированной точки можно получить с помощью теоремы о неявной функции.
Теорема 4.4 (теорема об обратной функции). Пусть функция G: Rn -> Rn удовлетворяет условиям:
1°. Функция G(x) непрерывно дифференцируема в некоторой окрестности V точки а, т.е. G € C’(V).
2°. Матрица Якоби функции G(x) в точке а невырождена, т.е. detG'fa) 0.
Тогда найдется такая окрестность U точки b = G(a), что:
1*. В U определена функция G~i(y), обратная к функции G(x)y т.е. G~l(y) eV при у е U и G(G~l(y)) = у, у eF.
2*. Функция G’"1 (у) непрерывно дифференцируема в F (в частности, непрерывна в (/), а ее матрица Якоби связана < матрицей Якоби функции G(x) равенством
.г=Г,-’(у)
◄ Рассмотрим функцию F: R2,‘ -> R”, определяемую равенством F(x,y) = G(x) - у. Эта функция непрерывно дифференцируема в окрестности точки (a, b) € R2m, а множество решении системы п уравнений F(z,?/) = 0 представляет собой график функции G(x). т.е. множество точек (а у), удовлетворяющих условию y = G(x). В частности, F(a,b) = 0. Так как detG’^r/) 5^0, то матрица Якоби F^(a.b) = G^a) невырождена. Таким образом, для функции F(x,y) в окрестности точки (а, Ь) вЫ' полнены условия теоремы 4.3 о неявной функции. Это значит что система уравнений F(x,y) = 0 в некоторой окрестности П
4.3. Обратная функция
133
вида Ж = {(т, у) G R2n: |.т - а| < \у - Ь\ < 6У } разрешима относительно переменных х. т.е. существует такая функция ^(у). определенная в окрестности |у - 6| < точки Ь. что
F(^(y),y) = 0,
(1.9)
причем функция <р(у) непрерывно дифференцируема, а ее матрица Якоби равна
/(.v) =	ГуМу).у)- (1.10)
Так как F(x,y) = G(x) - у, тождество (4.9) означает, что = У. т.е. функция <р(у) является обратной к функции б7(ж). Кроме того, матрица Fy(x,y) совпадаете матрицей -Е. противоположной единичной матрице Е. Поэтому равенство (4.10) сводится к равенству ^(у) = (6'г(у?(у)))~\ равносильному (4.8) ►
Пример 4.10. а. Рассмотрим отображение 6*: R2-> R2. заданное уравнениями 5] = :Г| -Н•Г2, z-i — С1 — х^. Это отображение непрерывно дифференцируемо всюду в R2. Его матрица Якоби в произвольной точке (z|, х^\ € R2 имеет вид
/ j ^2 \
\ < 1 -1 /
•аопределитель матрицы Якоби
det ./(.rj.Tj) = -1 - (••|‘»+г2
обращается в нуль ни в одной точке в R2. Согласно теореме °6обратной функции, в любой точке b € R2. b = G(a), существу-
окрестность, в которой определено обратное отображение 1, причем 6'“’ (6) = а.
б. Для отображения G: R2 —> R2, заданного уравнениями
= JTj + .Т2,	52 = 2.7?!,
(1.11)
134
I. НЕЯВНЫЕ ФУНКЦИИ
найдем те точки множества в области значений отображения, в окрестности которых определено обратное отображение G~'. Для это воспользуемся теоремой об обратной функции. Отображение G непрерывно дифференцируемо в R2, а его матрица Якоби имеет вид
,, ' (1 2*Л \	£	V /
Вычисляем определитель матрицы Якоби: det./(j?i,x2) = -4т2. Отсюда заключаем, что матрица Якоби невырождена во всех точках (Т|, Х}), для которых хч / 0. Таким образом, во всех точках (xi, x-i), удовлетворяющих условию хч 0, можно при менить теорему об обратной функции. Точки (xj, хч)у в которых матрица Якоби вырождена, удовлетворяют условию х2 = 0 и в совокупности составляют прямую — координатную ось Oxj. Найдем ее образ при отображении G. Для этого в уравнения (4.11) отображения G подставим Хч = 0. В результате находим образ координатной оси Ох^:
{(3|, г-2): 5| =Л|, 32 = 2Ж|},
или г2 = 2с।.
Итак, обратное отображение С/-1 определено в окрестности любой точки (С|. г2), принадлежащей области значений отображения G и не лежащей на прямой Z\ = 2г2. Теорема об обратной функции не позволяет ответить на вопрос, существует ли обратное отображение 6’"1 в окрестности какой-либо точки прямой С| = 2з2. Для ответа на этот вопрос нужно использовать другие методы. В данном случае уравнения (4.11) можно разрешить относительно переменных х\ и х2 и тем самым получить аналитическое представление функции 6’"1:
4.3. Обратная функция
135
Это представление показывает, что областью значений отображения G является полуплоскость z^ 3-2/2. Каждая внутренняя точка z — (si, z-j) этой полуплоскости является образом при отображении G двух точек « = (01,02) и а = (аь -02), отличающихся знаком второй координаты. В окрестности каждой точки z = (зь *2)1 *1 > существуют два обратных отображения, первое удовлетворяет условию G~'(z) = а, а второе условию 6'"1!:) = а. Оба отображения определены в области 3] > *2/2.
В каждой точке z° = (z®, z^) на прямой z\ = z2/2 не существует окрестности, в которой определено обратное отображение 6’”1, и тому есть две причины. Во-первых, такие точки не являются внутренними точками области значений отображения G. Во-вторых, каждая такая точка z° является образом единственной точки а:0 в области определения отображения, но при этом в любой окрестности точки можно выбрать такие две точки, в которых отображение G принимает одинаковые значения.
Замечание 4.1. Доказательство теоремы 4.4 показывает, что теорема об обратной функции сводится к теореме о неявной функции. Любопытно, что можно делать и наоборот: теорему о неявной функции выводить из теоремы об обратной функции. В самом деле, систему уравнений F(x,y) = 0, хЕ Rn, у 6 Rm, можно трактовать как частный случай системы уравнений Р(х, у) = z при фиксированном z. Рассмотрим отображение
Которое получается добавлением новых п координатных функций, Это отображение дифференцируемо в окрестности точки to» 6), а его матрица Якоби может быть записана как блочная "Матрица
( Е 0	\
Н (^’2/) “In// ч Ct (	\ / ’
\WU) Fy(xyy} J
136
4. НЕЯВНЫЕ ФУНКЦИИ
в которой символ 0 обозначает нулевой блок соответствующего типа, а Е единичную матрицу соответствующего порядка. Видно, что det = det Е • det Fy(a.b) / 0 и для функции Н выполнены все условия теоремы об обратной функции в окрестности точки (а, 6), причем Я(«,6) = (а, 0). Значит, по теореме об обратной функции в окрестности точки (а, 0) существует обратное отображение H~x(x,z), которое можно представить в виде
где <p(x,z) — совокупность первых п координатных функций, а i/>(x,z) - совокупность оставшихся т координатных функций. Тождество Н(//“’(x,z)) = (т, г) в блочной форме имеет вид
Г(^(г,г), ф(х,-))
Отсюда находим, что = * и
F(v>(r,s),	= F(x, = г.
Но последнее тождество и означает, что уравнение F(x,y) = : разрешимо относительно переменных у и может быть представлено в виде у = v(xyz). В частном случае с = 0 получаем разрешимость уравнения F(x,y) = 0. Используя правила операций с блочными матрицами [III], можно из формулы (•!.*) для матрицы Якоби обратной функции получить формулу (1.1) для матрицы Якоби неявной функции. Действительно, нетрудно убедиться, что для невырожденной квадратной матрицы И порядка т и матрицы А типа т х п
Е 0 \ 1 _ / Е 0 \
A BJ	В~')'
Вопросы и задачи
137
так как
Е ^ \(Е 0 \ -В~ХА В~х )\А В)~
ЕЕ+О'А
-В~х АЕ А-В~х А
ЕО + ОЯ \ (Е 0\ -В-'А В+В-'В)	\0 EJ'
а аналогичное равенство с другим порядком перемножаемых матриц устанавливается тем же способом (в приведенных равенствах символ 0 обозначает нулевые блоки соответствующих типов, а Е — единичную матрицу соответствующего порядка). Исходя из этого, заключаем, что, согласно теореме об обратной функции,
Щх,у) Гу(^У)
Е
-(Fy(x,y))~l F^(x,y)
О
Следовательно,

В частном случае z = 0 для функции V’(*,0), неявно заданной Уравнением F(z,t/) = 0, получаем ф'х(х,0) = - (F^(z,y))-1 Е*(х,у), что соответствует формуле (4.4).
Вопросы и задачи
4.1.	Пусть функция одного переменного у = д(х) задана неявно с помощью уравнения f(x,y) = 0. Что можно сказать об экстремумах этой неявно заданной функции? Где они расположены? Где неявно заданная функция возрастает (убывает)? Дэ-йте ответ на аналогичные вопросы для точек перегиба, выпуклости вверх (вниз) графика неявно заданной функции. Приедите соответствующие примеры и исследуйте их.
13Я
4. НЕЯВНЫЕ ФУНКЦИИ
4.2.	Найдите дифференциал ds функции двух переменных z = 2(Х'У), заданной неявно уравнением
4- </- - I» (л* 4- ~) = 0.
4.3.	Найдите все частные производные второго порядка функции двух переменных с = z(x,y). заданной неявно уравнением
х + у + z + z5x = 0.
4.4.	Верно ли утверждение, что „уравнение yz - х2 = 0 задает х как функцию от у и зи? Какое уточнение сделает это утверждение верным?
4.5.	Для функции z(x,y) двух переменных, неявно заданной уравнением f(yz,x+z) = 0, где J(u, v) - произвольная непрерывно дифференцируемая функция, найдите частные производные z'r и z'y.
4.6.	Найдите z* и с', если z = arctg(w 4- г), и 4- (ujr = у*. ьч/4-sin г = х.
* с) **
4.7.	Покажите, что у-^г - с-1 = 0. если функция z(x.u) двух Bjt <)у
переменных неявно задана уравнением ^(2х 4- yl/z. z) =0, где — произвольная дифференцируемая функция.
4.8.	Для функции z(x,y), заданной уравнением х2 + у2 4-с2 = = я2. найдите первый и второй дифференциалы.
4.9.	Для функции г(х,у) двух переменных, неявно заданной уравнением sin(*3) 4- cos(yz) = 1. найдите первый и второй дифференциалы в точке х = у = 1. z = 0.
5. ГЕОМЕТРИЧЕСКИЕ ПРИЛОЖЕНИЯ
5.1.	Производная по направлению
Пусть скалярная функция многих переменных f: Rn —> R определена в некоторой окрестности точки а € Rw и задан вектор п О. Обозначим через п° единичный вектор, имеющий то же направление, что и вектор п:
П = |—7 = (и....i/n).
|п|
Определение 5.1. Производной функции /:Rn—>R в точке а € Rn по направлению вектора п называют число
д/(а)	/(а + sn0)-Да)
~ Дъ---------;---------	(5-1)
если этот предел существует.
Из этого определения и содержащегося в нем соотношения (5.1) легко сделать вывод о том, что производная по направлению вектора представляет собой скорость изменения значений Функции / в точке а в направлении вектора п.
Теорема 5.1. Если функция f:Rn->R дифференцируема в точке а € Rn, то в этой точке она имеет производную по направлению любого ненулевого вектора п, причем
дДа)
1=1
п» =	1/п) = п/|п|.
140
5. ГЕОМЕТРИЧЕСКИЕ ПРИЛОЖЕНИЯ
4 Рассмотрим функцию g(s) = /(а + яп°) одного действительного переменного s. Поскольку функция многих переменных f(x) дифференцируема в точке а= (ан ап), то сложна» функция g(s) =	где .c(s) = а + дифференцируема
в точке .$ = 0 и
dg(s) ds
s=0
ds
s=0

дх.
~ 2^, >)r.
4=0	i-| UJ<
В то же время, согласно определению производной функции действительного переменного, имеем
<1д(*}	_ ljnl <?(»•) - У(0) _ |i|n /(« + «n°)~ /(«)
ds	S->0 S	5-40	.S’
s=u
Из существования последнего предела вытекает и существование равного ему одностороннего предела при s —>4-0. Поэтому
<lg(s)	f(a + sn°) - f(a) _ i)f(a)
ds o s-2+о a	On
w
Приравнивая правые части полученных равенств, получаем утверждение теоремы. ►
Пример 5.1. Скалярная функция двух переменных f(x,y) •-= cJ‘y имеет частные производные fT(x,y) = yeiy. fy(x.y) = .п '' являющиеся непрерывными функциями. Поэтому она, согласи” теореме 2.5, дифференцируема в каждой точке плоскости. В точке (1,0) функция f(x^y) имеет производную но любому направлению. Взяв вектор
/	7Г	. 7Г\
п = I cos —, sin -- ) = х	4	4 /
5.2. Градиент
111
удовлетворяющий условию ||n|| = 1 и направленный под углом к оси абсцисс, получим
3/(0,0) дп
5.2.	Градиент
Определение 5.2. Пусть скалярная функция многих переменных /:Rn —в точке х имеет все частные производные первого порядка. Вектор
grad/(г) =	£„(*)),
составленный из частных производных первого порядка функции f(x) в точке ,т, называют градиентом функции f в точке х.
Понятие градиента позволяет упростить запись формулы (5.2) для вычисления производной по направлению вектора п дифференцируемой в точке х функции. Используя стандартное скалярное умножение в Rn, формулу (5.2) можно записать в виде
= (grarl/(i), п°).	(5.3)
on
Пример 5.2. Найдем производную скалярной функции и = х2 — 2у3 4-cos г~ трех переменных .г, у и z в точке Л/(2; 1:0) по направлению вектора п = (-1, 2, 2).
Функция u(x,y,z) дифференцируема в любой точке в R3. Найдем ее частные производные первого порядка в произвольной точке (х. у, z):
и, = 2х - г si и tz, и'у = -6?/2. /Л = -.г sin xz.
р
Радиент функции u(x,y,z) существует в любой точке и имеет вид
grad u(x,y,z) = (2ж - ^sin.7.c, -6i/2, -.гsinxz).
112
.5. ГЕОМЕТРИЧЕСКИЕ ПРИЛОЖЕНИЯ
Подставляя в это выражение координаты точки Л7(2; 1:0). находим grad«(2.1.0) = (4, -6, 0).
Для заданного вектора п вычисляем единичный вектор nQ < тем же направлением. Так как |п| = 3. то п° = (-1 /3, 2/3, 2/3). Воспользовавшись формулой (5.3), окончательно получаем
—%’1	= (gra<l и(2, 1.0), п°) = 4 • (-^) + (-6) • + 0• 1	.
дп	\ 3/	3	3	3
Замечание 5.1. Непосредственно из определения вытекает, что при изменении направления вектора п на противоположное, т.е. при замене вектора п вектором -п. производная по направлению дифференцируемой функции меняет знак.
Замечание 5.2. Пусть вектор п задает направление, совпадающее с направлением одного из векторов стандартного базиса в Rn (в R3 или R2 такое направление совпадает с направлением соответствующей координатной оси). Например. п = (0, ..., 1, ..., 0), где единица стоит на t-м месте. Тогда в соответствии с определением 5.1 производной по направлению вектора получаем
()/(*) _ ..	.......Л-ЬЛ+ *.*+!.••••*»)-/И _	)
On »Д+О	,Ч	drt
Таким образом, производная по направлению базисного вектора совпадает с соответствующей частной производной. Однако обратим внимание на то. что производная по направлению определяется односторонним пределом, а частная производная — двусторонним. Поэтому возможна ситуация, когда производная по базисному направлению существует, а соответствующая частная производная — нет. Учитывая изложенное, можно сказать, что производная по направлению вектора обобщает понятие частной производной первого порядка, распро-страняя это понятие на случай произвольного направления в заданной точке.
5.2. Градиент
143
Замечание 5.3. Производная по направлению имеет простую геометрическую интерпретацию. Рассмотрим, например, функцию двух переменных f(x,y) в окрестности точки (а, Ь) й некоторый вектор п = (р, q). Единичный вектор п° в этом случае имеет координаты (cosa, sin а), где а — угол между вектором и осью абсцисс, а производная по направлению вектора п в точке (а, Ь) равна
df ..	/(a + /cosa, 6-Hsina)
- 1,111  --------7----------’
on f->+o	t
т.е. совпадает с правосторонней производной функции <p(t) = = /(«+ /cos а, 6 +/.sinа) в точке t = 0. График функции <p(t) можно представить как сечение поверхности z = У(яг, т/) вертикальной плоскостью, пересекающей координатную плоскость хОу по прямой L, заданной параметрическими уравнениями
х = a + /cos а, у = a + /sin а, z = 0
(рис. 5.1). А тогда односторонняя производная функции <р(/) представляет собой тангенс угла наклона $ односторонней касательной в точке Р к сечению графика функции z = /(ж, у) указанной плоскостью. Поскольку производную действительной Функции одного действительного переменного в точке интер-
Рис. 5.1
144
5. ГЕОМЕТРИЧЕСКИЕ ПРИЛОЖЕНИЯ
претируют как скорость роста функции, производную функции f(x,y) по направлению вектора п можно трактовать как скорость роста этой функции в направлении этого вектора.
Замечание 5.4. Для векторной функции многих переменных f’.Rn-+R'\ f(x) = (f\(x) ...	, строки матрицы
Якоби f'(x) в точке х представляют собой градиенты координатных функций в этой точке. Следовательно, матрицу Якоби можно записать в блочном виде с использованием градиентов координатных функций:
(grad/i (ж)
grad/m(x)
Замечание 5.5. Определение производной по направлению вектора можно было бы с помощью соотношения (5.1) распространить на векторные функции многих переменных. Однако такое обобщение не нашло применения и в литературе не встречается.
Остановимся на некоторых свойствах градиента функции.
Свойство 5.1. Если скалярная функция /: RM —> R дифференцируема в точке х Е Rn, то в этой точке
^^ = пРп8га<1/(а:)-	(Г)|)
ип
где прьа — проекция вектора а на направление вектора Ь.
◄ В случае п = 2 или 3 соотношение (5.4) эквивалентно (5.3) в силу формулы связи между ортогональной проекцией и скалярным произведением двух векторов [III]:
(®, у) = |®| прт»,
(5.5)
в которой надо взять х = п°, у = grad f(x) и учесть, что |п°| = 1 • При п > 3 формулу (5.5) следует трактовать как определений
5.2. Градиент
145
ортогональной проекции вектора у на направление вектора х.
Это также позволит записать равенство (5.3) в виде (5.4). ►
Свойство 5.2. Если функция f: Rn->R дифференцируема
з точке х € Rn, п = grad f(x) ф 0, то
0/Ы I , ч|
-^- = |grad/(x)|.
< Если n = grad/(х), то п° =
и, согласно (5.3),
д}(х) дп
grad/(г) \ = I grad у (Ж j Г |grad/(r)|/ I grad f(x)\
Свойство 5.3. Если скалярная функция /: Rn -> R дифференцируема в точке х € Rn, то в этой точке вектор grad f(x) указывает направление наибольшего роста функции f(x).
4 В силу неравенства Коши -- Буняков скоро для любого вектора п
^4^ = (grad/(z),n°) < |grad/(i)| |n°| = |grad/(z)|. СгП
причем несложно убедиться, что в случае, когда п = grad/(х), приведенное неравенство превращается в равенство. Действительно, тогда п° = A grad f(x), где A= l/|grad f(x)\, и
(grad/(ж), n°) = A|grad/(x)|2 = |grad/(.r)|.
Докажем, что никакое другое направление не является набавлением наибольшего роста. Отметим, что для несовпадающих единичных векторов П| и nj в силу легко проверяемого т°Ждества
2 (nj , П2) = |nj |2 + |П2|2 - |П] - п2|2 = 2 - |П! - п2|2
146
5. ГЕОМЕТРИЧЕСКИЕ ПРИЛОЖЕНИЯ
верно неравенство (П|.П2) < 1. Поэтому если единичный век тор п° имеет то же направление, что и grad f(x). a m° любой другой единичный вектор, то с учетом свойства 5.2 имеем
7PV = (grad /(х), т°) = итп°
= |gra<l/Ml < |grad/(x)| =	>
Свойство 5.4. Если скалярная функция f: Rw -> R дифференцируема в точке х, то в этой точке вектор -grad f(x) задает нанравление наибольшего убывания функции f(x).
◄ Как было отмечено выше (см. замечание 5.1), при изменении направления вектора на противоположное производная диффе ренцируемой функции по направлению меняет знак. Поэтому если вектор п указывает направление наибольшего убывании функции, то вектор -п указывает направление наибольшего возрастания функции. В самом деле, если функция f(x<y} возрастает в направлении некоторого вектора а быстрее, чем в направлении вектора -п, то она и убывает в направлении вектора -а быстрее, чем в направлении вектора п. Но это противоречит выбору вектора п как вектора, определяющего направление наибольшего убывания функции. Согласно свойству 5.3, вектор —п имеет то же направление, что и вектор grad f(x). Следовательно, вектор п по направлению совпадает с вектором -grad /(ж). ►
Свойство 5.5. Если скалярная функция /: Rn -> R диффС' ренцируема в точке х, то наибольшая скорость роста (убывания) функции f(x) в этой точке равна |grad f(x)\ (-|grad/(.r)|)-
◄ Согласно свойствам 5.2 и 5.3, производная функции по направлению вектора grad f(x) (направлению наибольшего роста) равна |grad/(я)|. Производная по противоположном.' направлению, определяющая наибольшую скорость убывай и* функции (см. свойство 5.4), отличается лишь знаком и равна -|grad/(x)|. >
5.3. Касательная плоскость и нормаль	147
Пример 5.3. Найдем в точке М(2; 1) наибольшую скорость роста функции двух переменных z(x,y) = х2у - 2у3.
Поскольку функция дифференцируема в точке М, то наибольшая скорость ее роста в этой точке равна модулю ее градиента в этой точке. Находим градиент данной функции в произвольной точке:
gradz = (2жт/, х2 - бу2).
Вычисляем значение градиента в заданной точке М(2; 1):
grad z(2,1) = (4, -2).
И наконец, находим искомую скорость:
|gradz(2,l)| =	+ (-2)2 = \/20 = 2\/5.
5.3. Касательная плоскость и нормаль
Рассмотрим некоторую поверхность* S в пространстве. Пусть точка М принадлежит поверхности S и существует такая плоскость тг, проходящая через точку М, которая содержит касательные, построенные в точке М ко всем кривым, лежащим на поверхности S и проходящим через точку М. Плос-
кость тг называют касательной плоскостью к поверхности S в точке М (рис. 5.2). Пря-МУК> L, проходящую через точку М и перпендикулярную плоско-СТи тг, называют нормалью к п°оерхности S в точке М.
Рис. 5.2
Уравнения касательной плоскости и нормали к поверхности $ в Точке М на этой поверхности найдем в предположении, что
Поверхности и их свойства детально рассмотрены в 8. Здесь же мы ^Раемся на интуитивное понимание термина „поверхность
148
5. ГЕОМЕТРИЧЕСКИЕ ПРИЛОЖЕНИЯ
в пространстве задана прямоугольная система координат Oxyz и выполнены следующие четыре условия.
1°. Поверхность S задана уравнением F(x,y,z) =0.
2°. Известны координаты а, 6, с точки Л4.
3°. Функция F(x,y,z) дифференцируема в точке Л/.
4°. Градиент функции F(x,y,z) в точке М отличен от нуля, т.е. grad Г(а,6,с) / 0.
Рассмотрим кривую 7, лежащую на поверхности 5 и прохо дящую через точку Л/. Зададим эту кривую параметрическими уравнениями
Ж = ¥’(<), .V = V’(0> * = х(0	(•>-*>)
так, чтобы значение параметра / = 0 соответствовало точке Л/, т.е. чтобы
9?(0) = a, V’(O) = 6, X (0) = с.
Предположим, что в точке I = 0 функции	xW имеют
производные, не обращающиеся в нуль одновременно.
При сделанных предположениях
F^(t),^t),xW) = ^	(5.7)
причем сложная функция в левой части тождества дифферен цируема в точке t = 0. Поэтому, дифференцируя (5.7) в точке t = 0 по правилу дифференцирования сложной функции, получаем
,'(») - О-
ох	оу	OZ
Записанное равенство означает, что вектор т = (/(0),	/(0)),
называемый касательным вектором к кривой у в точке М, ортогонален вектору
grad f'(а,6,с) =	Fy(a,b,c), Г!.(а,Ь,с)),
не зависящему от выбора кривой 7.
5.3. Касательная плоскость и нормаль	149
Итак, все касательные векторы в точке М 6 S всевозможных кривых, лежащих на поверхности S и проходящих через точку М, ортогональны градиенту grad F(a,6,c) функции F(x,y,z). Построим плоскость тг, проходящую через точку Л/ и имеющую нормальный вектор grad F(a,b,с}. Тогда касательный вектор любой кривой, лежащей на поверхности S, в точке М будет параллелен плоскости тг. Согласно определению, плоскость тг является касательной плоскостью к поверхности S в точке Л1.
Зная координаты а, 6, с точки Л/, через которую проходит плоскость тг, и координаты нормального вектора grad F(a,6,r) этой плоскости, можем записать общее уравнение плоскости тг:
- а) + F'(aJ>,c)(y-b) + F'(a,6,c)(; - с) = 0. (5.8)
Нормаль в точке М поверхности S определяется той же трчкой М и тем же вектором grad F(a,6,с), который является направляющим вектором этой прямой. По этим данным можно записать уравнения нормали к поверхности S в точке М как канонические уравнения прямой:
х — a y — b _ z-с F^(ayb,c) Fy(a,b,c) Ff.(a,b,c)'
(5.9)
Замечание 5.6. Уравнения (5.8), (5.9) получены в предположении, что выполнены условия 1°-4° в отношении поверхности S и точки € S. Значит, эти условия являются достаточными условиями существования касательной плоскости и нормали поверхности 5 в точке М.
Замечание 5.7. Из приведенных рассуждений вытека-ет важное свойство градиента функции F(x,y,z): в точке Vo; Zq) дифференцируемости функции F(x,y,z) ее градиент 8radF(x0)^0ir0) ортогонален поверхности уровня F(j:.y,z) =f Где f = F[X(hyQ' ~0)	з самом деле, вектор grad F(.t0, i/o«~o)
яМяется нормальным вектором касательной плоскости к по-^РХности F(x,y,z) -С = 0 в точке (адад ~о)-
150
5. ГЕОМЕТРИЧЕСКИЕ ПРИЛОЖЕНИЯ
Пример 5.4. Найдем уравнения касательной плоскости и нормали к сфере х2 -f-у2 4? = 9 в точке М( 1; -2:2).
Легко убедиться, что, рассмотрев функцию F = х2 +у2+ + z2 - 9, мы обеспечим выполнение условий 1°-4° в данной задаче. Значит, касательная плоскость и нормаль к сфере в точке М существуют. Для построения их уравнений определяем частные производные первого порядка функции F: Ffx(x,y,z) = = 2х, Fy(x,y,z) = 2у, F!.(x,y,z) = 2z. Вычисляем значения частных производных в точке Л/(1; —2; 2):
F'(l,-2,2) = 2, F'(l,-2,2) = -4, К (1,-2,2) = 4.
Находим уравнение касательной плоскости в точке Л/
2(z-1)-4(2/ + 2)4-4(2-2) = 0
и уравнения нормали в этой точке
зг-1 у + 2	z-2
2	-4 ~ 4 ’ *
Пусть поверхность S задана уравнением z = f(x,y), где функция f(x,y) дифференцируема в окрестности точки AY(а: Ь]. Найдем уравнения касательной плоскости и нормали в точке (а: 6: с), где с= /(а,6).
Поверхность S следует описать уравнением вида F(x,y,z) = = 0 с дифференцируемой функцией F(x<y,z). В качестве этой функции можно взять F(x,y,z) = f(x,y) - z. Тогда условия 1°- 4° будут выполнены, и, следовательно, в точке Л/ существуют касательная плоскость и нормаль к поверхности S. Уравнения касательной плоскости найдем по формуле (5.8). Так как Fj(a,6,c) = /{.(a.6), F'(a,6,c) =F'(a,b,c) =-1, то уравнение касательной плоскости имеет вид
f'r(a,b)(x - a)+fy(a,b)(y- b) - (г - с) = 0.	(5.Ю)
5.3. Касательная плоскость и нормаль
151
Аналогично по формуле (5.9) находим канонические уравнения нормали
x-a _ y-b _z-c
Л(а,Ь) f'(a,b)	-1 ’	1	'
Пример 5.5. Рассмотрим поверхность z = x2/2 + y2/4 (это эллиптический параболоид). Найдем точку на этой поверхности, нормаль в которой параллельна прямой
х -2 _ у _ z 4-1
1	Г-’
и запишем уравнение касательной плоскости к поверхности в этой точке.
В нашем случае f(x, у) = х2/2 4- з/2/4, f'x = х, fy = у/2, так что направляющий вектор нормали к поверхности в произвольной точке (х, j/, z) имеет вид (х, у/2, -1). По условию нормаль в искомой точке параллельна заданной прямой. Критерием параллельности двух прямых в пространстве является коллинеарность их направляющих векторов [III]. В результате, записывая критерий коллинеарности двух векторов, получаем соотношения
х _ у/2 _ -I
1-1 1 ’
Из этих соотношений находим координаты точки Р, в которой нормаль к поверхности параллельна заданной прямой: х = -1, У'= 2, z — х2/2 4- у2/4 = 3/2. Остается записать уравнение касательной плоскости в найденной точке исходя из координат этой точки и нормального вектора плоскости:
(* +1) - (у-2) 4- (z - 3/2) = 0, или 2х - 2t/4-2z 4-3 = 0.
Пример 5.6. Найдем уравнения касательной плоскости
Нормали к графику функции f(x,y) — х2 4- ху 4- у2 в точке 0;1;3).
152 5. ГЕОМЕТРИЧЕСКИЕ ПРИЛОЖЕНИЯ
Функция f(x,y) является дифференцируемой в точке (1: 1). Поэтому в соответствующей точке графика этой функции существуют касательная плоскость и нормаль к этому графику. Уравнения касательной плоскости и нормали можно получить с помощью формул (5.10) и (5.11). С учетом равенств /].(1,1) = /'(1,1) = 3 получаем уравнение касательной плоскости
3(я- 1) + 3(у- 1) - (z - 3) = 0
и канонические уравнения нормали
Понятие касательной плоскости позволяет дать геометрическую интерпретацию дифференциалу функции многих переменных. Пусть функция z = f(x.y) двух переменных дифференцируема в точке (а. Ь). Тогда ее дифференциал dz в этой точке равен
dz = /'(а, 6) dx + fy(a,b) dy.	(5.12)
В то же время уравнение z — f(x.y), рассматриваемое в прямоугольной системе координат Oxyz, задает поверхность в пространстве, и эта поверхность в точке («;6;/(а,6)) имеет касательную плоскость, уравнение (5.10) которой можно записать в виде
с-с = /;(а,6)(я-а) + />,6)(у-6).
Обозначив х - а = Дя. у — b = Ду. z - е = Дс, перепишем это уравнение в виде
A.’ = /;(a,6)Az + /'(«.6)Aj/.	(5.13)
Сравнивая (5.12) и (5.13), заключаем, что дифференциал d: совпадает с Дг, так как приращения Дя и Ду независимы* переменных я и у в точке («: 6) в то же самое время я вл я ютея
5.4. Касательная и нормаль кривой на плоскости	153
дифференциалами этих переменных. Другими словами, дифференциал функции двух переменных есть приращение в точке М аппликаты точки на касательной плоскости, соответствующее приращениям dx, dy независимых переменных (рис. 5.3).
Рис. 5.3
5.4. Касательная и нормаль кривой на плоскости
Рассмотрим на плоскости хОу кривую Q и точку М на этой кривой. Найдем уравнения касательной и нормали к кривой Q в точке М в предположении, что выполнены следующие четыре условия.
1°. Кривая Q задана уравнением f(x,y) = 0.
2°. Известны координаты а, b точки М.
3°. Функция f(x,y) непрерывно дифференцируема в точке Л/.
4°. Градиент функции f(r,y) в точке (а, Ь) отличен от нуля. т-е‘ grad f(a, b) ± О-
Напомним [II], что если кривая Q на плоскости является гРафиком некоторой действительной функции действительного переменного <^(а?), то касательная к этой кривой в точке а’ <р(а)) определяется уравнением
t/ = (/(a)(.r-a)+y?(a),
(5.14)
154
5. ГЕОМЕТРИЧЕСКИЕ ПРИЛОЖЕНИИ
а достаточным условием существования касательной является дифференцируемость функции в точке «.
В данном случае функция f(xyy) является дифференцируемой в точке Л/(«;6), причем grad/(а,6)= (Гх((цЬ), /'(а,6)) / 0. Значит, одна из частных производных функции f(xyy) в точке» М отлична от нуля. Пусть, например, /£(«,&) ^0. Тогда выполнены условия теоремы о неявной функции. Согласно этой теореме, уравнение f(x,y) = 0 в некотором прямоугольнике />< центром в точке Л/ задает дифференцируемую функцию <^(./-). х € Iй +	6 > 0. Иначе говоря, часть кривой Q внутри
прямоугольника Р является графиком функции </?(.?:), и мы можем записать уравнение касательной к кривой Q в точке М в виде (5.14). Учитывая выражение (4.2) для производной неявной функции «^(а-) и равенство <^(я) = 6, находим
У-Ь
откуда получаем
fx(«’Ь)(х - а) + f'y(а, Ь)(у - Ь) = 0.	(5.15)
Поскольку нормаль к кривой в точке М проходит через эту точку и перпендикулярна касательной, то ее уравнение имеет вид
т - n i; - 6	tr и х
(5J
Если /'(я,6) = 0, но /'(а,6)/0, то, поменяв местами переменные z и у и повторив рассуждения, получим те же уравнения касательной и нормали.
Итак, условия 1°-4° являются достаточными для того, чт<>-бы в точке (а, Ь) существовали касательная и нормаль к кривом Q, которые в этом случае задаются уравнениями (5.15) и (5.16). Можно показать, что это утверждение остается верпы4 и тогда, когда условие 3° заменено более слабым условием дифференцируемости функции в точке (а, 6).
5.4. Касательная и нормаль кривой на плоскости
155
Пример 5.7. Найдем уравнения касательной и нормали к эллипсу х2/3 4- у2/6 = 1 в точке Л7( 1; 2).
Легко убедиться, что в данной задаче при выборе функции fix, у) = х2/3 + у2/6 — 1 достаточные условия 1°-4° существования касательной и нормали выполнены. Для построения уравнений касательной и нормали вычислим частные производные первого порядка функции f(x,y): f^x^y) = 2х/3. f'y(x,y) = у/3. Их значения в точке Л/(1; 2) равны
Л(1.2) = |,

Зайисываем уравнение касательной
1) +-j(y-2) = О, ♦5	о
или
и нормали
или
х + у - 3 = О,
х - 1 _ у - 2 2/3 ~ 2/3 ’
х - у 4-1 = 0.
Пример 5.8. Найдем точки, в которых касательная к кривой у3 — ’Зху 4- х3 = 3 параллельна оси Оу.
Нормальным вектором касательной рассматриваемой кри-в произвольной точке (х, у) является вектор (/{., /') = 25 (*“3t/4- Зх2, 3t/2-3x). Касательная кривой параллельна оси Оу» если ее нормальный вектор параллелен оси Ох, т.е. колли-н*аРён вектору (10). Записывая условие коллинеарности двух ^Кторов на плоскости, получаем уравнение
-Зу 4- Зх2 _ З?/2 - Зх
1
1
0
156
5. ГЕОМЕТРИЧЕСКИЕ ПРИЛОЖЕНИЯ
которое равносильно уравнению 3t/I 2 - Зх = 0. Таким образом координаты точки кривой, в которой касательная параллельна оси Оу, подчиняются уравнению х - у2 = 0. Так как координа-ты точек кривой удовлетворяют также уравнению этой кривом, получаем систему двух уравнений с двумя неизвестными:
X - у2 = 0, у3 - Зху + х3 = 3
Не составляет труда найти два решения этой системы: zj = I, у\ = -1 и х-2 = х/9, У2 = ^3- Так как в этих точках градиент функции не обращается в нуль, обе точки — искомые.
Вопросы и задачи
5.1. Докажите, что формула (5.2) неверна в точке (0;0) для функции
I 0, х = i/ = 0.
5.2. Существуют ли касательная плоскость и нормаль к конусу х2 + у2 = z2'. а) в начале системы координат; б) в точке (3; 4; 5); в) в точке (1; 2; 1)?
5.3. Найти уравнение той касательной плоскости к эллиптическому параболоиду z = х2/2 4- у2, которая перпендикулярна радиус-вектору точки (Г, 1; —3).
5.4. Найти точки, в которых градиенты функций двух переменных z = х2 4- у2 и z = ху коллинеарны (перпендикулярны). Что можно сказать об относительном расположении линий уровня этих функций в найденных точках?
5.5. Выясните, дифференцируема ли в точке М = (0. 0) заданная функция:
2	2
а) Дг,у)= <
0, z = y = 0:
Вопросы и задачи
157
б) f(x,y) = у/х2 + у2;
в) f(z,y) = у/з:2 + у2.
По каждому ли направлению существует производная за
данной функции в точке М? Если существует производная функции в точке М по направлению вектора где N = (1, 1), найдите ее.
5.6.	По каждому ли направлению существует производная функции u(x,y,z) — х3 4- 3xz + у3 - z3 в точке Л/ = (0, 1, 2)? Если да, найдите ее наибольшее значение в указанной точке.
5.7.	Для функции и(х, т/, z) = arctg в точке М = (0, 1, -1) найдите производную по направлению, образующему с осями координат равные тупые углы.
5.8.	Найдите наибольшую скорость убывания и направление наибольшего убывания функции u(x,y,z) = x2z + '2ху - 3y2z2 в точке (1, 0, -1).
5.9.	Найдите точки поверхности ху2 -zx + zy — y = 0, в которых касательная плоскость поверхности параллельна плоскости xOz, и составьте уравнения таких касательных плоскостей.
5.10.	Найдите углы, которые нормаль поверхности z = xy в точке (1, —1, 1) образует с осями координат.
5.11.	Покажите, что эллипс 4х2 + (у — 2)2 4- z2 = 5 и гиперболоид х2 - у2 4- z2 = 3 в точке (0, 1, 2) касаются друг друга, т.е. обе поверхности проходят через эту точку и имеют в ней общую касательную плоскость.
6. ЭКСТРЕМУМ ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ
6.1.	Необходимое условие экстремума
Определение 6.1. Говорят, что скалярная функция многих переменных /: Rn —> R, определенная в некоторой окрестности точки а € Rn. имеет в этой точке локальный максимум (минимум), если существует такая проколотая окрестность о	о
U(a,e) точки а, что для любой точки х € Г(а,€) выполнено неравенство f(r) /(a), (f(x)	/(а)). Понятия локальною
минимума и локального максимума функции объединяют пол общим названием экстремум функции.
Если неравенства в определении 6.1 являются строгими, то говорят о строгом экстремуме функции.
Теорема 6.1 (необходимое условие экстремума функции). Пусть скалярная функция f: Rn -> R имеет в точке а € R?i экстремум. Если функция f(x) (x = (xi, ..., хп)) имеет в точке а частную производную первого порядка по переменному xt. 1 i п, то эта частная производная равна нулю: fXi(a) = 0. ◄ Пусть а = (а|, ..., ап). Рассмотрим действительную функцию
5^(0 - f (®1 1 • • • 1	1 1	5 * * * 1
одного действительного переменного /, которая получается, если у функции f(x) зафиксированы все переменные, кроме ?-го. равного /. Функция g(t) в точке t = ах имеет локальный экстремум. В самом деле, пусть, например, f(x) имеет в точке а локальный максимум. Тогда существует такая про-о
колотая окрестность U(a,e) = {z6 Rn: 0 < |х - а| < е} точки «• о	.
что f(x) f(a) при х € U(a,e). Но в таком случае g(t) $ g(aJ
6.1. Необходимое условие экстремума
159
при 0 < |t - at| < что соответствует определению локального максимума функции одного переменного [II].
функция g(t) дифференцируема в точке / = а,, так как функция f(x) имеет в точке а частную производную по переменному Xi, При этом g'(ai) = /',(«). Согласно необходимому условию локального экстремума для функции действительного переменного [II], выполнено равенство g'(ai) = 0. Следовательно, /;,(«) = «•►
Следствие 6.1. Пусть скалярная функция /: Rn —> R имеет в точке а 6 Rw экстремум. Тогда:
-	если в точке а определен градиент функции f(x), то он равен нулю: grad/(a) = 0;
-	если функция дифференцируема в точке а, то df(a) = 0.
4 Утверждения следствия сводятся к следующему: если в точке а экстремума функция f(x) имеет все частные производные, то эти частные производные равны нулю. Действительно, градиент — это вектор, координатами которого являются значения частных производных функции первого порядка в данной точке, а коэффициентами дифференциала первого порядка являются те же значения частных производных. ►
Из теоремы 6.1 вытекает, что точки экстремума скалярной функции f(x) надо искать либо среди точек, в которых grad/(ж) = 0 (т.е. среди стационарных точек функции). либо среди точек, в которых градиент не определен (не существует одна или несколько частных производных). Все точки в которых градиент функции равен нулю или не определен, вызывают точками, подозрительными на экстремум, или критическими точками функции.
Пример 6.1. Функция двух переменных f(x,y) = е*2 + (У + 2)2 — 1 дифференцируема на всей плоскости. Значит, в соответствии с необходимым условием экстремума (см. также бедствие 6.1) точки экстремума этой функции надо искать с^Ми ее стационарных точек. Найдем частные производные
160 б. ЭКСТРЕМУМ ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ
функции и приравняем их нулю:
2
Л = 2ге* =0,	/; = 2(у+2) = 0.
Мы получили систему двух уравнений относительно неизвестных х и у. Единственным решением этой системы уравнений является х = 0, у = -2. Поэтому функция f(x,y) может иметь экстремум только в точке (0, -2).
Необходимое условие экстремума функции не позволяет определить, действительно ли в точке (0, -2) функция f(x,y) имеет экстремум. Оно лишь выделяет относительно небольшое количество точек, в которых экстремум может быть. Дальнейшее исследование на экстремум предполагает анализ каждой критической точки. В данном случае нетрудно увидеть, что в точке (0, -2) функция /(я,у) имеет локальный минимум, так как слагаемое ех имеет наименьшее значение при х = 0, а слагаемое (у 4- 2)2 — при у = -2.
Пример в.2. Покажем, что у функции д(х,у) = х2 - у2 нет экстремумов (в этом, кстати, можно убедиться, изобразив в прямоугольной системе координат в пространстве график этой функции).
Функция д(х,у) дифференцируема на всей плоскости. Поэтому ее точки экстремума могут быть лишь среди стационарных точек. Вычислим частные производные функции и запишем систему уравнений, приравняв частные производные нулю:
д'х = 2х = 0, д'у = -2у = 0.
Эта система имеет единственное решение х = 0, у = 0. Значит, функция д(х,у) может иметь экстремум лишь в точке (0, 0). Однако при у = 0 функция одного переменного д(х,0) = т2 в точке х = 0 имеет строгий локальный минимум, так как p(z,0) = х2 > 0 = (/(0,0), х 0, а при х = 0 функция одного переменного 0(0,0) при 0 = 0 имеет строгий локальный максимум-так как 0(0,0) = -у2 < 0 = 0(0,0), у £ 0. Поэтому точка (0, 0) не может быть точкой экстремума функции д(хуу). #
6.2. Достаточное условие экстремума
161
Отметим, что при исследовании функции на экстремум ^ожно не рассматривать те критические точки, в которых хотя и не все частные производные существуют, но существует jjo крайней мере одна частная производная, не равная нулю. Действительно, такие точки в силу теоремы 6.1 не могут быть точками экстремума функции.
Пример 6.3. Функция двух переменных h.(x,y) = |яг| 4- у2 дифференцируема во всех точках плоскости хОу, кроме точек оси Оу- При этом hx(x,y) = 1 при х > 0 и hx(x,y) = -1 при х < 0. Значит, точки экстремума могут располагаться только на оси Оу, в точках которой не существует частная производная hx. Обратим внимание, что частная производная функции h(x,y) по переменному у существует во всех критических точках, но обращается в нуль только при у = 0, т.е. в начале координат. Поэтому единственная точка, в которой может быть экстремум функции, — это точка (0, 0). Дальнейшее исследование поведения функции в окрестности этой точки можно проводить так же, как и в примере 6.1. Слагаемое |х| имеет строгий локальный минимум при х = 0, а слагаемое у2 — при у — 0. Следовательно, в точке (0, 0) функция h(x,у) имеет строгий локальный минимум.
6.2.	Достаточное условие экстремума
Исследование стационарных точек функции многих переменных на экстремум, как и в случае функций одного переменного, можно проводить, анализируя дифференциал второго порядка. Напомним, что дифференциал второго порядка Функции многих переменных представляет собой квадратичную форму относительно приращений (дифференциалов) неза-ннсимых переменных.
Теорема 6.2 (достаточное условие экстремума Функции). Пусть скалярная функция /: Rn —> R определена
162	6. ЭКСТРЕМУМ ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ
в окрестности U(a) точки а, дважды непрерывно дифференцируема в U(а) и df(a) = 0. Тогда:
1)	если квадратичная форма d2f(a) в точке а положительно определенная, то в этой точке функция f(x) имеет строена локальный минимум;
2)	если квадратичная форма d2f(a) в точке а отрицательно определенная, то в этой точке функция f(x) имеет строена локальный максимум;
3)	если квадратичная форма d2f(a) в точке а знакопеременная, то в этой точке функция f(x) не имеет экстремума.
◄ Введем следующие обозначения. Через Дх = (Дх1 ... Дхп)т обозначим ненулевой вектор приращений независимых переменных, а через I/ = Дх/|Дх| — единичный вектор с тем же направлением, что и вектор Дх. Второй дифференциал d2f(a) функции /(х) в точке а является квадратичной формой от вектора приращений Дх, которую можно записать с помощью матрицы Гессе fH(a) функции /(х), вычисленной в точке «, следующим образом:
d2f(a) = ДхТ f" (а) Дх = i=i j=i
d2f(a) dxidxj
Ах, Дх;.
Воспользовавшись формулой Тейлора с остаточным членом в форме Пеано для функции /(х) в точке а, получим
/(а + Дх) - /(а) = df(a) + |d2/(a) + о(|Дх|2) =
= 1</2/(а) + о(|Дх|2).
Пусть &(Дх) — запись квадратичной формы d?f(a) как функции вектора приращений Дх: &(Дх) = Дхтf"(а)Дх. Тогда &(Дх) = &(|Ax|i/) = k(v)|Дх|2, где k(v) = t/T/"(a) 1/, и
f(a+Дх) - /(a) = ^d2/(a)+o(| Дх|2) = -	+л) | Дх|2, (<’• 11
где a —> 0 при Дх —> 0.
6.2. Достаточное условие экстремума
163
Поскольку к(у) — квадратичная форма, то она непрерывна при всех t/, в том числе и на множестве Sn~l = {у € Rn: |t/| = 1}. Множество Sn~l С В” ограничено и замкнуто (это (п— 1)-мер-яая сфера), т.е. является компактом. Поэтому функция к(у), будучи непрерывной на компакте Sn-1, согласно теореме 1.10, достигает на этом множестве своего наименьшего т» и наибольшего т* значений.
Пусть значения т* и т* функция к(у) принимает соответственно в точках j/* и у* сферы Sn-1. Возможны следующие четыре случая.
Случай 1 . Если тпж > 0, то к(у) т* > 0 при |t/| = 1. Значит, k(Ax) = k(v)|Дя|2 > 0 при Ах / 0, т.е. квадратичная форма d2f(a) положительно определенная. В силу того, что a -> 0 при Ах —> 0, для е = ш*/2, можно выбрать такое число 8 > 0, что |а| < € = т»/2 при 0 < |Дя| < 6. Но тогда в силу представления (6.1) находим, что
~1 7П* “ 9Ш
2 > о,
если 0 < |Дх| < 6.
Таким образом, при > 0 в точке а функция f(x) имеет строгий локальный минимум, а ее второй дифференциал является положительно определенной квадратичной формой.
Случай 2. Если т* < 0, то к(у) т* < 0 при |у| = 1. Значит, к(Ах) = Л:(1/)|Да:|2 < 0 при Ах / 0 и квадратичная форма d2f(a) отрицательно определена. Выбирая е = |т*|/2, Заключаем, как и выше, что для достаточно малого числа 6 > 0 «ри 0 < |Дя| < 6 выполнено неравенство |а| < |т*|/2. В силу представления (6.1) находим, что
f(a + Ax)-f(a)<
т‘ + |га‘|)IД*|2 = |т’|Д®|2 < о,
®ели 0 < |Дг| < <5.
164	6. ЭКСТРЕМУМ ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ
Итак, при т* < 0 в точке а функция f(x) имеет в точке а строгий локальный максимум, а ее второй дифференциал в этой точке является отрицательно определенной квадратичной формой.
Случай 3. Пусть т* < 0 < Тогда = тп* > О, А~(г/Ж) = тп* < 0. Значит, квадратичная форма k(y) = утf"(«)у (она же d2f(a)) знакопеременная. Выберем £ =	► .
Тогда существует такое число 8 > 0, что |а| < тп*/2 и |а| < < |тп*|/2 при 0 < |Дж| < 5. Поэтому при Дж =	0 < t < I,
имеем
/(« +Дж) - /(а)
x(m* - 5W*) 1^х12 = т771*!^!2 > о. Л X	w '	
так как в этом случае |а| < тп*/2. Аналогично при Дж = ty.8. 0 < t < 1, имеем
/(«4-Дж) - /(а)
-?п»|Дж|2 < 0.
m
Следовательно, в любой окрестности точки а есть значения функции /(ж), большие /(а), и есть значения, меньшие /(а).
Итак, в данном случае точка а не является точкой локального экстремума функции /(ж), а ее второй дифференциал в этой точке является знакопеременной квадратичной формой.
Случай 4. Если тп* = 0 или тп* = 0, то квадратичная форма к(у) является неотрицательно определенной, неположительно определенной или вообще тождественно равна нулю (если тш = т* = 0). В этом случае вид квадратичной формы нс позволяет сделать какое-либо заключение о характере точки в этой точке может быть экстремум, а может и не быть. при этом квадратичная форма d2f(a) не является ни знакоположительной, ни знакоотрицательной, ни знакопеременной, т.е-он не подпадает ни под одно из трех утверждений теоремы.
£.3. Достаточные условия экстремума функции двух переменных 165
Итак, каждый из первых трех случаев соответствует одному из утверждений теоремы, а четвертый случай не соответствует ни одному из ее утверждений. Это завершает доказательство теоремы. ►
Напомним, что тип квадратичной формы d2f(a) можно определить с помощью критерия Сильвестра или приведением ее к каноническому виду [IV].
Пример 6.4. Функция f(x,y) = х2 + у4 двух переменных дифференцируема во всей плоскости хОу, и ее точки экстремума следует искать среди стационарных точек. Вычислив частные производные, заключаем, что у функции только одна стационарная точка (0, 0). Так как функция дважды непрерывно дифференцируема, для исследования характера этой точки можно использовать теорему 6.2. В силу равенств
^1-^2
9x2	Эхду ’	9у2 ~ У
второй дифференциал функции f(x,y) в точке (0, 0) имеет вид d2/(0,0) = 2dx2. Это вырожденная квадратичная форма, сохраняющая знак. Значит, теорема 6.2 в данном случае ничего не дает. Однако нетрудно заметить, что в точке (0, 0) функция f(xby) имеет локальный минимум.
Функция двух переменных д(х,у) = х2 - у4 также имеет единственную стационарную точку (0, 0), причем второй дифференциал этой функции в точке (0, 0) совпадает с d2/(0,0) = %dx2. Но при этом функция д(х,у) не имеет в точке (0, 0) экстремума, так как она в этой точке достигает максимума при Фиксированном х = 0 и минимума при фиксированном у = 0.
6.3.	Достаточные условия экстремума функции двух переменных
В случае функции двух переменных достаточное условие 3*стремума функции в сочетании с критерием Сильвестра приводит к простым правилам проверки.
166	б. ЭКСТРЕМУМ ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ
Предположим, что функция f(x,y) дважды дифференцируй ема в окрестности точки Р(а, Ь) и в этой точке выполнено необходимое условие экстремума функции^ т.е.
Л(О) = /;<«,6) = 0.
В точке Р матрица Гессе f"(a,b) функции f(x,у), представляющая собой матрицу квадратичной формы d2/(a,6), имеет вид
J (а' >	\f"v(a,b)
Для частных производных в фиксированной точке часто используют обозначения:
А = &(а,Ь), В =	С = (ayb).
С помощью этих обозначений дифференциал второго порядка функции f(x^y) в точке Р и матрицу Гессе можно записать следующим образом:
d2f(a,b) = Adx2 + 2Bdxdy + Cdy2, /"(<i,6) = „ \ в
Применим к исследованию матрицы Гессе критерий Сильвестра. Согласно этому критерию, второй дифференциал d2f(a,b) является положительно определенной квадратичной формой, если А > 0 и det /"(а,6) = АС - В2 > 0. Второй дифференциал является отрицательно определенной квадратичной формой, если А < 0 и АС - В2 > 0. Он является знакопеременной квадратичной формой, если АС - В2 < 0. Наконец, квадратична* форма d2f(a,b) вырождена, если АС - В2 = 0.
Используя полученные факты, можно переформулировать утверждения теоремы 6.2 в случае двух переменных следующем образом:
1)	если А > 0 и АС - В2 > 0, то в точке Р(а, Ь) функи1,й f(x>y) имеет строгий локальный минимум;
6.4. Исследование функции на экстремум
167
2)	если А < 0 и АС - В2 > О, то в точке Р функция f(x^y) йМеет строгий локальный максимум;
3)	если АС - В2 < 0, то функция f (х,у) не имеет в точке Р экстремума.
Приведенные утверждения не охватывают случай АС = В2. g этом случае квадратичная форма d2f(a,b) вырождена, но сохраняет знак, так как квадратный трехчлен
d2/(a,6) = Adx2 + 2В dx dy + С dy2
по переменному dx (при А 0) или переменному dy (при С 0) имеет нулевой дискриминант и потому представляет собой полный квадрат. Например, при 4^0 имеем
(В \2 + — dy) .
При АС= В2 функция может иметь в точке (а, 6) локальный экстремум, а может и не иметь его (см. пример 6.4).
6.4.	Исследование функций на экстремум
Задачу исследования скалярной функции многих переменных /: Rn R на экстремум часто записывают в виде
f(x) -> extr.
Такйе задачи решают в два этапа. На первом этапе с помощью необходимых условий экстремума отбирают точки, подозрительные на экстремум (критические точки). На втором Зтапе каждую отобранную точку исследуют на наличие в ней функции. Это исследование может выполняться ^Ибо с помощью различных достаточных условий экстремума • 6.2 и 6.3), либо с помощью непосредственного анализа по-"енИя функции в окрестности исследуемой точки (см. 6.1).
168	6. ЭКСТРЕМУМ ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ
Пример 6.5. Рассмотрим задачу
х3 4- 2ху + у2	ext г.
Функция f(x,y) = х3 4- 2ху + у2 является бесконечно диффг. ренцируемой, т.е. f € C°°(R2). Поэтому ее точки экстремума это стационарные точки, которые можно найти, приравняв нулю частные производные, функции первого порядка:
I fy(^y) = 0.
В нашем случае f'x(x,y) = Зт2 4- 2у, f'y(r,y) = 2;г 4- 2у, и мы получаем систему двух уравнений с двумя неизвестными:
(Зх2 4- 2у = 0,
<	Л	(6.2)
|2z 4-2у = 0.
Из второго уравнения находим, что х = -у, и после подстановки в первое уравнение получаем Зу2 4-27 = 0. Следовательно, система (6.2) имеет два решения
Л „	2	2
2/1=0, ;ti=0 и у2 = --,х2 = -.
Значит, функция f(x,y) имеет две стационарных точки Pi(0. 0). Р2(2/3, -2/3).
Воспользуемся достаточным условием экстремума для функции двух переменных. Для этого найдем частные производны* второго порядка функции f(x,y):
f"t(x,y) = 6x, f'^x,y) = 2, ft(x,y) = 2.
Подставляя в эти производные координаты точки находим .4 = 0, В = 2, С = 2. Отсюда АС - В2 < 0, и, согласно достаточным условиям экстремума функции двух переменных, в точке Р](0, 0) функция f(x,y) экстремума не имеет. Аналогичны*'
Вопросы и задачи
169
вычисления для точки Р2 дают следующее: А = 4 > О, В = *2, ^ = ‘2, АС — В2 >0. Значит, в точке Л^(2/3, -2/3) функция f(x>y) имеет строгий локальный минимум. Значение функции в точке Р-2 равно /min = -4/27.
Обратим внимание на то, что у функции f(xyy) есть значения, меньшие fmin. Например, /(-10,0) =-1000. Это говорит о том, что минимум в точке Р2 носит локальный характер, а не абсолютный: значение /(2/3,-2/3) является наименьшим лишь в некоторой окрестности точки Р2, но не во всей плоскости.
Вопросы и задачи
6.1.	Докажите, что функция двух переменных f(x,y) = = с-у2(1 + /2) имеет единственную критическую точку (0, 0). но не имеет локального экстремума в этой точке.
6.2.	Докажите, что функция двух переменных f(xyy) = = еу2(1 4-х2) имеет единственную критическую точку (0,0), которая является точкой локального минимума.
6.3.	Определите, при каких значениях параметра а функция z(xyy) = х3 + у3 4- 4ху - 1х - 7у 4- a(x - I)2 4- a(y - I)2 в точке (1, 1): а) имеет максимум; б) имеет минимум; в) не имеет экстремума.
6.4.	Исследуйте на экстремум заданную функцию:
a)	u(z,y) = 2хг(1 - у) + у2;
б)	u(x,y,z) = :г2 + 2у2 + г2 - xz — 2yz — 4y.
6.5.	Исследуйте на экстремум функции u(xyv) и y(xyv), неявно заданные системой нелинейных уравнений (4.5) в окрестности точки (0, 0).
7. УСЛОВНЫЙ ЭКСТРЕМУМ
В приложениях часто встречаются задачи поиска экстремумов функций многих переменных при дополнительных ограничениях на возможные изменения переменных. Такие ограничения могут иметь различный характер. Например, значения переменных должны удовлетворять одному или нескольким уравнениям или неравенствам. Как ограничение можно рассматривать условие попадания точки n-мерного линейного арифметического пространства в заданную область, или, наоборот, точки некоторого множества в Rn не принимаются в расчет. Далее мы остановимся на случае, когда аргументы функции подчиняются ограничениям в виде одного или не скольких уравнений, часто называемых уравнениями связи.
7.1.	Общая постановка задачи
Пример 7.1. Рассмотрим задачу определения прямоугольника с заданным периметром наибольшей площади. Обозначив через х и у длины сторон прямоугольника, через 2р
его периметр, мы придем к задаче поиска максимума площа-ди прямоугольника S(x,y) = ху при дополнительном условии (ограничении) 2(х + у) = 2р, что кратко можно записать следующим образом:
S(x,y) = ху шах, 2(х + у) = 2р.	(7.1)
Нас интересует решение задачи в области х > 0, у > 0.
В данном случае решение задачи легко можно найти, выразив из уравнения связи 2(х + у) = 2р одно из переменных и подставив найденное выражение в функцию S(x,y). В результате мы придем к задаче поиска минимума действительной функции одного действительного переменного. Например, из уравнения
7.1. Общая постановка задачи
171
свдзи находим у = р — х. Тогда площадь прямоугольника при заданном ограничении можно представить как функцию только временного х: S(x) = х(р- х). Исходя из естественных ограничений х > 0, у > 0, находим область изменения переменного д.: Q < х < р. Функция $(х) достигает максимума в интервале (О,?) ПРИ х = Р/2» что Д^ет решение рассматриваемой задачи: /==^ = р/2. Итак, среди всех прямоугольников с заданным периметром наибольшую площадь имеет квадрат.
Отметим, что функция двух переменных S(x,y) = ху не
имеет экстремумов, а у рассмотренной задачи решение существует. Это связано с тем, что для задачи (7.1) не играют роли значения функции S(x,y) в тех точках, которые не удовлетворяют ограничениям. В задачах такого типа все зависит от поведения функции лишь на части ее области определения, а
именно на множестве тех точек в области определения, которые подчиняются установленным ограничениям.
Определение 7.1. Говорят, что функция /: Rn —>R в точке а € Rn достигает условного локального максимума (минимума) при условии <р(х) = 0, где Rn —> RTn	некоторая,
вообще говоря, векторная функция многих переменных, если о
существует такая проколотая окрестность U (а) точки а, что о
для всех точек х € U(a), удовлетворяющих условию <р(х) = О, верно неравенство
(/(*)>/(«))•
(7.2)
Понятия условного локального максимума и минимума объединяют под общим названием условный экстремум функции. Если в определении 7.1 неравенства строгие, то говорят ° строгом условном экстремуме функции.
Задачу исследования функции /: Rn —> R на условный экстремум при ограничениях 9?(ж) = 0, заданных с помощью функции Rn —> Rw, часто записывают в виде
f(x) —> extr, V?(x) = О
(7.3)
(7.4)
172
7. УСЛОВНЫЙ ЭКСТРЕМУМ
и называют задачей на условный экстремум. При этом функцию f(x) называют целевой функцией. Условие (7.4) ц общем случае представляет собой систему нелинейных уравнений — уравнений связи.
Метод решения, использованный в примере 7.1, может применяться лишь в простейших ситуациях. Распространение этого метода на общий случай наталкивается на трудности, связанные с исключением части переменных из аргументов целевой функции при помощи уравнений связи. Такой подход приводит к необходимости решать систему нелинейных уравнений, а это, как известно, — сложная задача. Отметим, что исключение неизвестных с помощью уравнений связи приводит затем к задаче поиска локального экстремума функции многих переменных, т.е. к решению еще одной системы нелинейных уравнений, которые получаются приравниванием нулю частных производных. Исключение неизвестных нужно лишь затем, чтобы вычислить эти частные производные, но частные производные можно также вычислить и с помощью теоремы о неявной функции. В этом случае исключение неизвестных фактически уже не нужно, и решение задачи упрощается. Развитию этого подхода на основе теоремы о неявной функции мы и уделим внимание, начав с более простой задачи для условного экстремума функции двух переменных.
7.2.	Необходимое условие условного экстремума
Остановимся на простейшем случае функции двух переменных.
Теорема 7.1 (необходимое условие условного экстремума). Пусть /: R2 R и R2 -> R — функции двух переменных, определенные и непрерывно дифференцируемые в окрестности точки Р(а\Ь). Если функция f(x,y) имеет в точке Р условный экстремум при условии у>(х,у) = 0, причем
7.2. Необходимое условие условного экстремума
173
grad<^(M) 7^0’ то существует такое число Л, которое вместе с коордииатами а и b точки Р удовлетворяет системе уравнений
Л(г.*/) + А^(г,у) = 0, /^(®.у) + А^(х,у) = 0, ^(г,у) = 0.
(7.5)
4 Поскольку gradv?(a,6) 0, то одна из частных производных первого порядка функции <р(х,у) в точке Р отлична от нуля. Пусть, например, </^(а,6) / 0. По теореме J.1 о неявной функции в некотором прямоугольнике
U = {(^, у): |х — а| <<51, |t/-6| < <$2}
уравнение <р(х,у) = 0 разрешимо относительно переменного у. т.е. задает неявную функцию y = h(x), непрерывно дифференцируемую в окрестности точки а, причем
(7.6)
y=h(r)
В прямоугольнике U точки, удовлетворяющие условию <р(х,у) = = 0, имеют вид (х;А(а?)), где х € (а - $i, а-Mi)- Значит, если функция f(x,y) имеет в точке Р условный экстремум при условии <р(х,у) = 0, то функция д(х) = /(я,h(x)) одного переменного имеет в точке а локальный экстремум. Эта функция, как композиция дифференцируемых функций, является дифференцируемой в точке а. Следовательно, в силу необходимого условия локального экстремума [11] верно соотношение д'(а) = 0. Согласно правилу дифференцирования сложной функции и равенству (7.6), находим
д'(а) = f'z(a,b) + fy(a,b)h'(a) = f'x(a,b) - f^a.b)^^ =
= /'(a,6)-4^^(“^) = 0-
7. УСЛОВНЫЙ ЭКСТРЕМУМ
Введем обозначение Л = -/у(а,Ь)/<^(а,6). Тогда
Г/;(«,Ь) + Л^(«,6) = О, |/;(а,6) + Л^(«,6) = 0,
где первое из этих уравнений вытекает из условия д'(а) -= 0, а второе эквивалентно равенству, определяющему числе» А. Добавив к этим уравнениям равенство = 0, которое» должно выполняться в точке условного локального экстремума, получим систему уравнений (7.5).
Доказательство теоремы в случае, когда	0, прово-
дится аналогично. ►
Систему уравнений (7.5) можно записать в виде
grad/(х, у) = -Agrad^(2?,?/), ?(х,у) = О
и придать ей следующую геометрическую интерпретацию: если в точке условного экстремума выполняются условия теоремы 7.1, то линия уровня целевой функции касается кривой, заданной уравнением связи. На рис. 7.1, а показано, почему в этом случае необходимое условие не может нарушаться в точке Р условного экстремума. Представлены линии уровня f(x) = С|. f(x) = С2 и f(x) = с3. В изображенной ситуации С] < с2 < с3 (это определяется направлением градиента функции f(x,y), являющимся направлением ее роста) и функция f(x,y) на кривом V(x,y) = 0 не может иметь экстремума. На рис. 7.1, б показа
а
Рис. 7.1
7.2. Необходимое условие условного экстремума	175
но поведение функции в окрестности условного максимума Р. 0 соответствии с указанным направлением градиента функции y(x,t/) имеем н < сг < сз, что и обеспечивает локальный максимум в точке Р на кривой <^(х,?/) = 0. На рис. 7.1, в изображена ситуация, при которой необходимое условие условного экстремума выполнено, но экстремума тем не менее нет (в соответствии с направлением grad f в точке Р имеем Ci < сг < сз)-
Введем функцию
L(x,y,X) = f(x,y) + Xp(x,y),	(7.7)
которую называют функцией Лагранжа, где А — множитель Лагранжа. Тогда система (7.5) будет иметь вид
L'x(x,y,X) = 0, L'(x,y,X} = 0, L'x(x,y,X) = 0.	(7.8)
ZF
Таким образом, задача на условный экстремум
f(x,y) ->extr, у>(г,у) = 0
при выполнении условий теоремы 7.1 сводится к поиску стационарных точек функции Лагранжа (7.7) и их анализу.
Пример 7.2. Найдем точки, подозрительные на условный экстремум, в задаче
f(x, у) — хуextr, 2(х + у) = 2р, х > 0, у > 0,
сформулированной в примере 7.1.
Функции f(x,y) = ху и (р(х,у) = 2(х + ?/) - 2р удовлетворяют Условиям теоремы 7.1, поэтому решать задачу можно при помощи функции Лагранжа.
Составим функцию Лагранжа (7.7):
Цх,у,Х) = ху + Х(х + у- р).
176
7. УСЛОВНЫЙ ЭКСТРЕМУМ
Необходимые условия (7.8) условного экстремума приводят к системе уравнений
^(®.уД) = у + А = 0,
А) = х + Л = О,
L\(x,y,X) = х + у - р = 0.
Выражая х и у из первых двух уравнений и подставляя эти выражения в третье уравнение, находим -2А-р = 0, откуда А = -р/2 и х = у = р/2. Следовательно, условный экстремум в рассматриваемой задаче может быть только в точке Р(р/2; р/2) (рис. 7.2). #
Необходимое условие для задачи общего вида (7.3), (7.4) может быть получено по той же схеме, что и в частном случае двух переменных. В задаче (7.3), (7.4) функция Лагранжа по определению имеет вид
т
Цх, А) = f(x) + А^(г) = f(x) + ^2 -Wil®).
1=1
(7.9)
где А = (Ai ... Am), <р(х) = (<£>i(ж) ... y?w(x))r. При этом числа At, i = называют множителями Лагранжа в этой задаче.
7.3. Достаточные условия условного экстремума	j 77
Теорема 7.2. Пусть функции /: Rn —> R и R71 —> R’" 0ПределенЬ1 и непрерывно дифференцируемы в окрестности точки a £ Rn, причем Rg</(a) = m. Если в точке а функция /(;/•) имеет условный локальный экстремум при условии <^(х) = 0, то существует такой вектор А = (А1? ..., Aw), который вместе с координатами точки а удовлетворяет системе уравнений
дЦх.х) дх\
дМ*,А)_п дхп
^(дг,А)
(7.10)
дЦх,х) дХт
◄ Доказательство этой теоремы, опирающееся на теорему 4.3 о неявной функции, в основном повторяет доказательство теоремы 7.1 (случай п = 2, тп= 1) и потому не приводится. ►
7.3.	Достаточные условия условного экстремума
Достаточные условия условного экстремума в задаче (7.3). (7.4) можно сформулировать с помощью функции Лагранжа. Пусть в задаче на условный экстремум функции /:Rn-»R При условии <^(я) = 0, заданном функцией р: Rn —> Rm, в точке п € Rn выполнено необходимое условие условного экстремума. И этом случае в точке а определен вектор Аа множителей Ла-гРанжа. Зафиксируем в функции Лагранжа Цх,Х) значения Множителей Лагранжа, представив ее как функцию только пе-^Менных х: L(x) = L(x,Xa). Чтобы выяснить, является ли
178
7. УСЛОВНЫЙ ЭКСТРЕМУМ
точка а точкой условного экстремума рассматриваемой фуцк. ции, нужно проанализировать дифференциал второго порядка d2L(a) функции L(x) в точке а. Рассмотрим этот дифферент циал как квадратичную форму (РЦа)н на линейном подпр<>. странствс Н в Rn, заданном системой линейных уравнений d<p(a) = 0 (или, по-другому, <p'(d)dx = 0).
Теорема 7.3. Пусть функции f: Rn 4 R и <р: RM -> R"* дважды непрерывно дифференцируемы в окрестности точки а € Rn, <»?(«) = 0’ Rg’/M — и координаты точки а вмес то с некоторым вектором А удовлетворяют системе уравнений (7.10). Тогда:
1)	если квадратичная форма (12Ь(а)н положительно определенная. то функция f(x) имеет в точке а строгий условный локальный минимум при условии <у?(х) = 0;
2)	если квадратичная форма d2L(a)n отрицательно определенная, то функция f(x) имеет в точке а строгий условный локальный максимум при условии <^(х) = 0;
3)	если квадратичная форма д2Ца)ц знакопеременная, то функция f(x) в точке а не имеет условного экстремума.
◄ Ранг матрицы Якоби ср'(а) функции <р(х) равен т, и в этой матрице можно выделить базисный минор порядка ш, равною количеству строк матрицы. Для упрощения выкладок предположим, что этот базисный минор расположен в последних т столбцах. Обозначим х = (хь ..., zw), z = (xj, ..., xn_„J. У= (^n-m+ь •••, жп)- Тогда функции / и с,? можно представить в виде f(z,y) и <у?(г,1/). При этом матрица Якоби <Ру(Ь,с) функции <р(х,у) по части переменных у в точке а = (6, с) являетс я невырожденной. Следовательно, в этой точке можно приме нить теорему 4.3 о неявной функции. Мы заключаем, что в некоторой окрестности точки (а, Ь) уравнение <p(z,y) = 0 неявно задает у как функцию г, т.е. уравнение ip(z,y) — 0 эквивалентно уравнению t/ = /i(z), где h(z) — непрерывно дифференцируемая функция в окрестности точки а € Rn“w. Матрица Якоби h'( r^
7.3. Достаточные условия условного экстремума
179
функции h(x) может быть вычислена по формуле
/i'(r) = -(/(2,J/)) 'tfi'.lz.y) .
y=h(r)
Нетрудно увидеть, что система линейных алгебраических уравнений d<p(b,c) = 0, или <^(6,c)dz + ^(6,c)d?/ = O, эквивалентна системе линейных алгебраических уравнений h'(b)dz- dy = ~ 0, так как первая система сводится ко второй умножением на невырожденную матричную функцию (<p'y(z,y))~' • Другими словами, чтобы рассмотреть дифференциал второго порядка d2L(b,c) функции Лагранжа L(z,y), вычисленный в точке (6, с), на линейном подпространстве Я, заданном системой d^(a) = 0, достаточно в этой квадратичной форме выразить группу дифференциалов dy с помощью уравнения dy = h'(b)dz через набор дифференциалов dz. Полученная при этом квадратичная форма от набора переменных dz и будет сужением d2L(b,c) на линейное подпространство Н.
По построению функция Лагранжа на множестве точек, удовлетворяющих уравнениям связи y>(z,y) = 0, совпадает с функцией f(z,y). Поэтому в утверждениях теоремы 7.3 о существовании экстремума функцию f(x,y) можно заменить функцией Лагранжа. Отметим, что любой точке (г, у) условного экстремума функции Лагранжа при условии <p(z,y) = 0 соответствует точка z экстремума функции L(z,h(z)), так как Уравнения связи можно записать в виде y = h(z). Убедимся в том, что в условиях теоремы для функции g(z) = L(z,h,(z)) в Точке b € Rn-m выполнены достаточные условия экстремума. Для этого вычислим дифференциалы первого и второго поряд-к^Этой функции.
Согласно свойству инвариантности формы записи диффе-Р€*циала первого порядка,
dg = Uz dz 4- L'y dy,
180
7. УСЛОВНЫЙ ЭКСТРЕМУМ
где dy = h'(z) dz. Запишем это равенство в координатной форме п
dg = L'x> dxt. 1=1
Отметим, что, согласно равенствам (7.10), dg(b) = 0, т.е. н точке b функция g(z) удовлетворяет необходимым условиям экстремума.
Теперь вычислим дифференциал второго порядка, имея в виду, что в данном случае переменные хп_гл+|, ..., xzl< входящие в набор у, являются промежуточными переменными:
п	п
d2g='^/L"iXidxidxj+	Lxd2Xi.
i.j=\	i=n-m+!
Так как в силу условий теоремы 7.3 в точке (6, с) выполнены равенства (7.10), то
п
<?9(b) = '^L'XiXdxidxJ.	(7.11)
1=1
Чтобы получить окончательный вид дифференциала второго порядка функции g(z) в точке 6, нужно исключить набор промежуточных переменных JZ=(xn-m+i, •••i^n), т.е. в правой части равенства (7.11) выполнить замену dy = hf(b)dz. Но это означает, что дифференциал второго порядка функции g(z) = L(z,h(z)) в точке z = b совпадает с сужением d2L(b, с)ц на линейное подпространство Н дифференциала второго порядка функции Лагранжа L(z,y). Применение достаточных условий экстремума для функций многих переменных завершает доказательство теоремы. Например, если квадратичная фор' ма d2L(b,c)n положительно определенная, то и d2g(b) является положительно определенной квадратичной формой. Согласно теореме 6.2, функция g(z) = L(z,h(z)) имеет в точке b локаль-ный минимум. Это равносильно тому, что функция L(z.y} (а
7.3. Достаточные условия условного экстремума	IS |
зНачит, и функция f(z,y)) имеет в точке а = (Ь, с) условный локальный минимум при условии y = h(z) (или <p(zyy) = 0). ►
Теорема 7.3 утверждает, что для проверки точек, подозрительных на условный экстремум, необходимо проанализировать квадратичную форму d2L(a), т.е. дифференциал второго порядка функции Лагранжа, при значениях приращений Да:, которые удовлетворяют системе линейных уравнений
d<pi =	Atj = 0, г=1,т.	(7.12)
j=i
Матрица этой системы линейных алгебраических уравнений совпадает с матрицей Якоби <р'(а) функции <^(г) в точке а, ранг которой по условию теоремы 7.2 равен т. Следовательно, система (7.12) позволяет выразить т приращений через оставшиеся п - т приращений. Зафиксируем известные значения множителей Лагранжа (координат вектора Л). Рассматривая функцию Лагранжа Цх) как функцию только переменных X], хп, вычислим ее дифференциал второго порядка d2L в точке а. Исключим из квадратичной формы d2L указанные гп дифференциалов. Получим квадратичную форму относительно п-т дифференциалов. Если эта квадратичная форма является положительно определенной (отрицательно определенной, знакопеременной), то в точке а функция f(x) имеет условный локальный минимум (условный локальный максимум, не имеет условного локального экстремума). Если указанная квадратичная форма от п - т переменных вырождена, но сохраняет знак (неположительно или неотрицательно определена), то в точке а Функция f(x) может иметь условный локальный экстремум, а Может и не иметь. В этом случае по виду второго дифференциала в точке выявить поведение функции f(x) нельзя и нужны Другие методы исследования.
Пример 7.3. В примере 7.2 уравнение d<p = Q дает dx + dy = ^О, откуда можно, например, выразить dx через dy: dx = —dy.
182	7. УСЛОВНЫЙ ЭКСТРЕМУМ
--‘
Дифференциал второго порядка функции Лагранжа L(x,y,X) при фиксированном значении А = -р/2 в точке (р/2; р/2) имеет вид d2L — 2dxdy. Исключая из второго дифференциала dx, получаем квадратичную форму 2(-dy)dy = -2(dt/)2, которая отрицательно определена. Следовательно, в точке (р/2; р/2) мы имеем условный локальный максимум.
Пример 7.4. Исследуем на условный экстремум функцию f(x.y) = х2 + у2 при условии х2/а2 + у2/Ь2 = 1, где а > Ь.
Функция f(x,y), как и функция <р(х,у) = х2/а2 + у2/Ь2 ~~ |. является по крайней мере дважды непрерывно дифференцируемой на всей плоскости. Составим функцию Лагранжа
М*-!/) = f(x,y) +	= (1 + ^)*2 + (1 + jj)j/2 - А.
Запишем систему (7.10) необходимых условий условного экстремума:
.	/ Л \
LT(x,y) = 2( 1 + )* = о,
< L\/(xiy) = 2^\ + ^)р = 0,
г2 у2
---I- — = 1.
<а2±Ь2
Из первого уравнения находим, что либо х = 0, либо Л= -а2. В первом случае (а* = 0) из третьего уравнения вытекает, что у = ±6 / 0, а из второго — что А = — Ь2. Во втором случае (А = -а2) из второго уравнения сразу получаем, что у = О-Окончательно, используя третье уравнение, заключаем, что есть четыре точки, подозрительные на условный экстремум:
*1.2 = 0, у1'2 = ±Ь, Х=-Ь2;
*з,4 = Уз а = 0, А = -а2.
Исследуем эти четыре точки, применяя достаточное условие условного экстремума. Рассмотрим два случая.
7.3. Достаточные условия условного экстремума	183
в первом случае, когда Л = -62, дифференциал второго порядка функции Лагранжа имеет вид
/ Ь2 \
d2L(x,y) = 2(1----) dx2.
Подпространство в точке (О’ &) описывается уравнением
^(0,6) dx 4- <f>' (0, b) dy = 0,
•Ж
или с учетом равенств ^(0,а) = 0,	(0,Ь) = 2/Ь
dy = Q.
В точке (0, -Ь) подпространство Н описывается тем же уравнением. Легко увидеть, что квадратичная форма
k(dx) = d2L(0,±b)
dy—O
= 2(1 - ^-\dx2, \ a1 /
являющаяся сужением d2£(0,6) (или d2L(0,-6)) на подпространство Я, положительно определена, так как a > b. Значит, точки (0, Ь) и (0, —6) являются точками условного минимума.
Во втором случае, когда Л = —а2, в точках («, 0) и (-а, 0) второй дифференциал i2L функции Лагранжа имеет вид
/	а2\
d2L(±a,0) = 2(1 - 77 )dt/2,
а подпространство И описывается уравнением
dx = 0.
Так как а > 6, квадратичная форма d2L(±«,0) на подпространстве Я (т.е. при dx = 0) отрицательно определена, и поэтому Тонки (а, 0) и (-«, 0) являются точками условного локального Максимума.
Этот пример является иллюстративным, и приведенное ре-^еНие в данном случае не самое лучшее. Действительно.
184
7. УСЛОВНЫЙ ЭКСТРЕМУМ
ограничение х2/а2 4- у2/Ь2 = 1 можно записать параметриЧ(1 ски в виде х = acos£, t/ = 6sini, t € [0,2тг]. Это позволь ет заменить исследование функции f(x,y) двух переменных на условный экстремум исследованием на экстремум функции /(acosl, 6sint) одного переменного. Кроме того, поставлен.
ная задача имеет простую геометрическую интерпретацию. Кривая <р(х,у) = 0 в данном случае представляет собой эллипс
с полуосями а и Ь. А линии уровня функции f(x,y) — это
концентрические окружности, причем значение функции на
каждой такой окружности равно квадрату радиуса (рис. 7.3). Максимальный радиус окружности, пересекающей эллипс, равен большой полуоси эллипса. При этом окружность пересекает эллипс в его вершинах, расположенных на большой оси. Минимальный радиус окружности, пересекающей эллипс, равен малой полуоси эллипса, а точками пересечения будут оставшиеся две
вершины эллипса.
Пример 7.5. Рассмотрим следующую задачу наэкстремум:
!х 4- 2у 4- z —> extr, 2х2 4- У2 - z2 = 2, у2 4- z2 = 2.
Целевая функция задачи и обе функции, задающие уравнения связи, являются по крайней мере дважды дифференни руемыми. Поэтому решение задачи можно искать с помощью функции Лагранжа. В данном случае функция Лагранжа имеет вид
L(x,y, z, А,р) = х 4- *2у 4- z 4- А(2s2 4- у2 - z2 - 2) 4- р[у2 4- z2 - 2)-
7.3. Достаточные условия условного экстремума
185
фсодимые условия экстремума приводят к системе уравне-
Не°
ний
1 -Ь 4Ая = О,
2 4- 2Лу 4- 2дз/ = О,
< 1 — 2 Ас 4- 2y.z = О, 2х2 4- у2 - z2 = 2, У + г2 = 2.
(7-13)
Из первых трех уравнений заключаем, что
А/0, А4-Д/0, А-д/0.	(7.14)
Кроме того, находим
1 1 1
4А’ У~~Х + ц' г- 2(A-/t)’
(7-15)
Вычитая из четвертого уравнения системы (7.13) пятое и сокращая на 2, получаем х2 = z2, что приводит к двум случаям x = z и х = -z. Однако последний случай невозможен, так как иначе из равенств (7.15) будет следовать, что 4А = 2(А —д) и А4-Д = 0, а это противоречит неравенствам (7.14).
Итак, х = z. Учитывая это, из равенств (7.15) находим, что д = ЗА и у =	= х, т.е. х = у = z. Используя четвертое
или пятое уравнение, получаем два решения рассматриваемой системы:
(	,	.	1	3
I = j/ = z=i, * =	/« = -7
I	4	4
I	- . 1 з
^ = j/=z=-l, А=-, д = -.
Необходимые условия экстремума привели к двум точкам. Подозрительным на экстремум. Исследуем эти точки, исполь-3Уя достаточные условия экстремума. Вычисляем дифферен-Циад второго порядка функции Лагранжа:
d2L = 4Xdx2 4-2(А 4- д)<й/24-2(д - X)dz2.
186
7. УСЛОВНЫЙ ЭКСТРЕМУМ
В точке (1, 1, 1) с учетом Л = —1/4 и д = -3/4 дифференциал принимает вид
d2L = -dx2 - 2dy2 — dz2,
а в точке (—1, —1, —1) будет отличаться знаком:
d2L = dx2 + 2dy2 4- dz2.
Видно, что в первом случае второй дифференциал является отрицательноопределенной квадратичной формой, а во втором — положительно определенной квадратичной формой. Это свойство сохранится и на подпространстве Н, которое в данном случае определяется уравнениями 2dx 4- dy - dz = 0, dt/ + dz = 0. Учитывая это, заключаем, что точка (1, 1, 1) является точкой условного максимума, а точка (-1, -1, -1) — точкой условного минимума.
7.4. Нахождение наибольшего и наименьшего значений
Напомним, что поиск наибольшего и наименьшего значений действительной функции одного действительного переменного на заданном отрезке сводится к поиску всех критических точек функции и к сравнению значений функции в критических точках и на концах отрезка [И]. Скалярная функция многих переменных, непрерывная на компактном множестве К, достигает на этом множестве наибольшего и наименьшего значений, но определение точек множества Л', в которых достигаются эти значения, — более сложная задача, так как компактное множество в Rn в отличие от отрезка числовой осн может иметь границу очень сложной структуры. В таких ситуациях исследовать поведение функции весьма непросто.
Пусть скалярная функция f(x) непрерывна на компактном множестве К СЙП и достигает своего наименьшего и наиболЬ' шего значений соответственно в точках х* G К и ж* € К. ТогДа
7.4. Нахождение наибольшего и наименьшего значений
187
вЫПОлняются неравенства
fM $ С /(*"), * € К.	(7.16)
Чтобы проанализировать способы поиска точек т, и х*, рас-смотрим некоторые частные случаи.
Пример 7.6. При п = 1 и К = [а, Ь] для поиска точек и х* можно поступить, как уже отмечено, следующим образом:
-	в интервале (а, Ь) отобрать все критические точки функции f(x)]
-	к критическим точкам добавить граничные точки а и 6;
-	во всех отобранных точках вычислить значения функции /(ж) и по этим значениям выделить те точки х, и я*, в которых значение функции является наименьшим наибольшим.
Пример 7.7. В случае п=2 рассмотрим функцию f(x.,y), непрерывную на компакте К, который ограничен тремя кривыми gi(x,y) = 0, д2(х,у) = 0,д3(х,у) = 0 (рис. 7.4). Будем считать, что функции gi(x,y), i= 1,3, непрерывно дифференцируемы, а компакт К описывается неравенствами
gi(x.y)^ 0, д2(х,у)^0, дз(х.у)^0.
^ибольшее (наименьшее) значение функции может достигать-
** Или во внутренней точке множества К, или на одномерной
188
7. УСЛОВНЫЙ ЭКСТРЕМУМ
границе (на одной из дуг АС, АВ, ВС), или в угловых точ% ках границы (А, В или С), являющихся точками пересечецця дуг. Поэтому для поиска точек с наибольшим (наименьшие) значением функции можно действовать следующим образом:
-	находим все критические точки функции котор^ являются внутренними для компакта К (они удовлетворяют неравенствам д\ > 0, д2 > 0, дз > 0);
-	среди точек, подозрительных на условный экстр ему.в каждой из трех задач
' f(x,y)-text.r, ffi = 0;
f(x,y) ->extr, 9г = 0;
'f(x,y) -+extr, 03 = 0
отбираем те, которые лежат на соответствующей дуге АС. ВС, АВ, т.е. удовлетворяют соответствующим неравенствам:
92(®,г/)>0, дз(х,у)>0;	9i(x,y)>0, дз(х,у)>0;
9i(x,y)>0, д2(х,у)>0;
-	к указанным точкам добавляем точки А, В, С, являющиеся решениями систем уравнений
9i(x,y) = 0, р2(х,у)>0, Рз(г.у) =0;
9\ (х,у) > 0, д2(х,у) = о, дз(х,у) = 0;
'gi(x,y) = o, * 92(х,у) = 0,
,дз(х.у) > 0;
-	во всех отобранных точках вычисляем значения функции и по этим значениям выделяем две точки и х*, в которых значение является соответственно наименьшим и наибольшим-
В общем случае при вычислении наименьшего и наибольшего значений функции f(x) п переменных на компактном множестве Л', которое задано, например, т условиями gi(x) 0. i = l,m, задачу можно решать аналогично. Отбираются то4' ки в которых может достигаться наибольшее или наименьшсГ
Вопросы и задачи
189
ачение: а) среди внутренних точек множества /<; б) на всех ^А?)"мерных частях границы (к =	в) все нульмерные
Цементы границы (такие, как точки Д, Ву С в примере 7.7). фтбор точек внутри К приводит к задаче на локальный экстремум, отбор точек на (п-Л)-мерных частях границы приводит К задаче на Условный локальный экстремум, как правило, с к уравнениями связи. Затем во всех отобранных точках вычисляются значения функции и выбираются точки с наименьшим Я наибольшим значением.
реализация предложенной схемы опирается ческое представление компакта Л’“. В самом
такая схема часто оказывается очень сложной и трудной в применении. В таких случаях более выгодными могут оказаться численные методы конечномерной оптимизации [XIV].
на „геометри-общем случае
Вопросы и задачи
7.1.	Определите условный локальный минимум функции /(ж,у) = х2 + ху + у2 при условии х + 2t/= 1.
7.2.	Найдите все точки условного локального экстремума функции f (ху у) = х + 2у при условии х2 + ху 4- у2 = 1.
7.3.	Найдите прямоугольник наибольшей площади, вписанной в полукруг радиуса R так, что одна из сторон прямоугольника лежит на диаметре, а две вершины противоположной ^Тороны лежат на окружности.
7.4.	Для цилиндрического бака заданного объема V найдите диаметр d и высоту h так, чтобы он имел минимальную Площадь поверхности.
7.5.	Докажите, что центр симметрии (а, Ь) произвольной Алгебраической кривой второго порядка f(x,y) = 0 удовлетворяет условиям /'(а, 6) = 0, fy(a,b) = 0.
У казан ие: докажите, что точка (а, Ь) является стационарной точкой функции f(x,y).
190
7. УСЛОВНЫЙ ЭКСТРЕМУМ
7.6.	Докажите неравенство средних
Я1 +	+ ••• + £п . п/------- ----------------
у X । Х2 • • • *^п, Х{ 0j I — If 711
П
в котором равенство достигается только при Xi = ... = хп = g
У казание: исследуйте функцию
f(Xi,X2,...,Xn) = XXX2..-Xn
на условный экстремум при условии
х\ + х2 + ... + хп = сп.
7.7.	Найдите наибольшее и наименьшее значения функции /(х,т/) = хт/2 в круге х2 + у2 $ 1.
7.8.	Найдите экстремум функции f(x,y,z) = х2 4- у2 + г2 при условии х2/а2 4- У2/Ь2 + z2/c2 = 1 в случае: а) а > b > с; б) а > b = с.
7.9.	При каких значениях а, 6, с (а2 4- Ь2 + с2 / 0) функция f(x,y,z) = ху + z2 имеет точки условного локального минимума (максимума) при ограничении ах 4- by 4- cz = 1?
7.10.	Найдите наибольшее и наименьшее значения функции f(x,y) = х2 4- 2ху - 2у2 - 4х 4- 2у в прямоугольнике 0 х 2. 0 О С2.
7.11.	Найдите наибольшее и наименьшее значения функции f(x,y) = (х - а)3 - Зх 4-у2 на множестве, заданном неравенствами 4х2 4- у2 ^16, у 4, если: а) а = -2; б) а = 0; в) а = 7/3.
7.12.	В условиях задачи 7.11 выясните, при каких значениях параметра а наибольшее (наименьшее) значение функции достигается: а) во внутренней точке множества; б) на гравии? множества; в) в угловой точке границы множества.
7.13.	Решите следующие задачи на экстремум:
х 4- 2у 4- z -> extr, 2х2 4- у2 - z2 = 2.
8. ГЕОМЕТРИЯ ПОВЕРХНОСТЕЙ
Одним из приложений теории функций двух переменных является геометрия поверхностей в пространстве. Каждую поверхность локально, в окрестности фиксированной точки. Можно рассматривать как график функции двух переменных. во такая интерпретация оказывается неудобной из-за сложности и бессистемности получающихся формул. Более продуктивен групповой подход, впервые четко сформулированный К.Ф. Клейном*. Главную роль в этом подходе играют группы преобразований пространства, сохраняющие исследуемые свойства объектов. Если некоторое свойство объекта сохраняется при преобразованиях из данной группы преобразований, то это свойство называют инвариантным, или инвариантом. Именно инвариантные свойства используют для описания исследуемых объектов. При этом стараются выделить такой минимальный набор инвариантных свойств, который определяет объект однозначно.
В случае поверхностей в пространстве такую группу преобразований образуют движения пространства, т.е. такие его преобразования, при которых сохраняются расстояния между точками. Можно показать, что любое движение пространства — это либо поворот, либо преобразование симметрии относительно плоскости, либо параллельный перенос, либо композиция указанных преобразований**. Таким образом, мы различаем поверхность S и поверхность 5j, полученную из $ поворотом, симметрией или параллельным переносом.
Для описания свойств поверхности вводят две квадратичные формы I и Q, инвариантные относительно движений про-
*К.Ф. Клейн (1849-1925) — выдающийся немецкий ученый, внесший значительный вклад в развитие современной математики.
С?м., например: Дубровин Б.А., Новиков С.П., Фоменко А.Т.
192
8. ГЕОМЕТРИЯ ПОВЕРХНОСТЕЙ
странства. Эти формы однозначно определяют поверхность т.е. две поверхности, имеющие одинаковые формы / и Q, цр0 образуются одна в другую движением пространства.
Квадратичные формы / и Q меняются при переходе от точ~ ки к точке. Для их записи, так же как и других объектов на поверхности вводят координаты. Под координатами ца поверхности понимают любое правило, которое каждой точ-ке поверхности ставит в соответствие пару чисел, называемых координатами этой точки. Квадратичные формы / и Q имеют по три коэффициента и, следовательно, в совокупности определяются шестью функциями указанных координат. Это позволяет для изучения поверхности использовать свойства функций двух переменных. Математическая дисциплина, в которой геометрические объекты изучают с помощью методов дифференциального исчисления, названа дифференциальной геометрией. Геометрия поверхностей — это один из разделов дифференциальной геометрии.
8.1.	Гладкая поверхность
Термин „поверхность44 широко используют в математике и технических науках и при этом ему придают различное толкование. Из курса аналитической геометрии [III] известны алгебраические поверхности, в частности, такие поверхности второго порядка, как эллипсоид, гиперболоиды, параболоиды, цилиндры второго порядка. К поверхностям часто относят плоскости, а также графики функций двух переменных. В некоторых случаях слово „поверхность” используют в ином смысле, почти как синоним слова „множество44 (например, в рамках термина поверхность уровня функции). Эти расхож Д^ ния в трактовке термина „поверхность” отражают, с одной стороны, сложившиеся традиции в математике, а с другой сто" роны, особенности методов исследования в различных раздела* математики. В дифференциальной геометрии термину .J10' верхность” дают свое толкование.
8.1. Гладкая поверхность
193
фиксируем в пространстве прямоугольную систему коорди-
0xyz с ортонормированным базисом г, у, к и прямоуголь-систему координат Ouv на некоторой плоскости. Выбран-
на* НУ10
йь1е системы координат позволяют сопоставить каждой точке ее координаты и интерпретировать пространство как R3, а „лоскость — как R2.
Если функция многих переменных ft А С Rn —> Rw являет
ся инъекцией, то на множестве В = f(A) определено обратное отображение f~x: В —> А, представляющее собой функцию многих переменных. Если обе функции f и /-1 непрерывны в своих областях определения (т.е. на множествах А и В соответственно), то функцию / называют гомеоморфизмом. Пусть U С R2 — открытое множество на плоскости, Ф: U -> ->R3 — некоторый гомеоморфизм. Будем говорить, что этот
гомеоморфизм задает в пространстве поверхность S = Ф((/) (рис. 8.1).
Рис. 8.1
Каждая точка РЕ S является образом только одной точки Мр Е U. Координаты и, v точки Мр = Ф“,(Р) в системе Координат Ouv будем называть координатами точки Р на поверхности S или внутренними координатами точки Р* Если х, у, z — координаты точки Р, то
Ж = х(ц,и), y=y(u,v), z = z(u,v), (и, v) Е Р, (8.1)
^Aex(«,v), y(u,v), z(u,v) являются координатными функциями Функции Ф: U —> R3. Уравнения (8.1) называют параметра-Некими уравнениями поверхности S. Поверхность S
194
8. ГЕОМЕТРИЯ ПОВЕРХНОСТЕЙ
можно также задать векторным уравнением г = Ф(и,г)( ли значение функции Ф в точке (и, и) интерпретировать радиус-вектор точки P(x\y\z).
Пример 8.1. Каждой непрерывной функции двух пер^ менных	область определения которой есть открытое
множество D, соответствует векторная функция трех перемен-ных Ф(я,у) — (х у f(x,y)) , определенная в D. Эта функция непрерывна, так как непрерывны ее координатные функции.
Образ этого отображения есть поверхность z| e	S (рис. 8.2), являющаяся графиком функции
/' S	/(s, г/). Действительно, в данном случае
г множество U совпадает с областью опреде-У ления D функции Ф, а обратное отображе-............ ние Ф71: S —> D есть ортогональная проек-Рис 8 2 ЦИЯ гРаФика Функции на плоскость z — 0 и поэтому тоже непрерывно. При этом координатами на S являются две координаты х и у из трех пространственных координат. Параметрические уравнения поверхности .9 в данном случае имеют вид
х = и, у = ц, z = /(w,v), (и, и) € D.
Пример 8.2. Конус х2 + у2 = z2 (рис. 8.3) без своей вершины (0, 0, 0) распадается на верхнюю (z > 0) и нижнюю (z < 0) части. Верхняя часть описывается параметрическими
уравнениями
Рис. 8.3
ar = tz, y = v, z=yu2-H2,
(«, v) € R2\{(0, 0)}, а нижняя — параметрическими уравнения' ми
х = иу y = Vy z=—yu2 + v2,
(«, v)€R2\{(0, 0)}.
8.1. Гладкая поверхность
195
Если, например, к верхней части конуса добавить его вер-т0 эта часть по-прежнему будет поверхностью, так #аК бУДет ЯВЛЯТЬСЯ графиком непрерывной функции f(x,y) = у\ (х, у) € R2. Но конус в целом поверхностью не является* из-за особенностей строения его в окрестности вер-
щияы.
Действительно, выберем произвольную €-окрестность точки (О, 0, 0) и рассмотрим множество Se С R3 точек конуса, попадающих в выбранную г-окрестность. Предположим, что .S'f является поверхностью, т.е. существует гомеоморфизм Ф: (/ ->
Sgy где множество U С R2 открыто. Так как Se — линейно связное множество, а отображение Ф-1 непрерывно, то и множество (7, являющееся образом множества Se при отображении Ф”1, линейно связно (см. теорему 1.11). Множество U \ {Ф-1 (0,0,0)} открыто и линейно связно, но его образ $г\{(0, 0, 0)} при непрерывном отображении Ф не является линейно связным. Значит, предположение о существовании гомеоморфизма Ф неверно, множество Se не является поверх
ностью.
Пример 8.3. Предположим, что G С R3 — область, а скалярная функция многих переменных H.G —> R непрерывно дифференцируема, причем Z/(zo,t/o,zo) = 0. Если grad H(xo,yQ,zo) / то по крайней мере одна из частных производных
Hyt Н'г в точке (го, З/о» 2о) отлична от нуля. Пусть, например. Н»(х<ъУ(ьХо) / 0- Тогда уравнение
Н(х,у, г) = 0,
(8.2)
^гласно теореме 4.2, в окрестности точки (xq, уо, 2о) разреши-Мо относительно переменного z, т.е. эквивалентно уравнению ^/(ж/з/). Множество решений этого уравнения в окрестности ' °’ Уй) z0) представляет собой график функции f(x,y), или в
раз напомним о специальной трактовке термина м поверхность11 в Дифференциальной геометрии. Конус, разумеется, есть алгебраи-С1сая поверхность второго порядка.
196
8. ГЕОМЕТРИЯ ПОВЕРХНОСТЕЙ
соответствии с примером 8.1 поверхность. В рассматриваем^ случае говорят о поверхности, заданной неявно уравноци ем (8.2). #
В этой главе мы будем изучать только локальные свойства поверхности, т.е. свойства той части поверхности, которая лежит в достаточной близости от заданной точки. Это позволяет рассматривать поверхность по частям, представляя каждую часть в виде образа своего гомеоморфизма.
Пример 8.4. Рассмотрим прямой круговой цилиндр х2 + у2 = R2 (рис. 8.4). Этот цилиндр без прямой х = R, у = q можно задать параметрическими уравнениями
x = Rcosy>, y — Rsintp, z = ty € (0, 2тг), / £ R. (8.3)
Чтобы рассмотреть ту часть цилиндра, которая содержит прямую х = Л, у = 0, можно взять те же уравнения (8.3), изменив область изменения координат:	(—тг, тг), t 6 R.
Пример 8.5. Функция двух переменных Ф: R2 —> R3 видя Ф(и,1’) = (и2 и3—и. г) , u, v € R, имеет следующие координатные функции:
x(u,v) = u2, y(u,v) = и3 - U, Z(U'V) = V.
8.1. Гладкая поверхность
197
Данная функция не определяет поверхность в пространстве, граК каК она не является инъективной: прямые и = 1 и и = -1 оТображаются в одну прямую х = 1, у = 0 в пространстве. Однако в аналитической геометрии образ этой функции рассматривается как поверхность, а именно как цилиндрическая поверхность с направляющей х = и2, у = и3 - и и образующими, параллельными оси Ог. Исключая из уравнений направляющей параметр и, приходим к уравнению у = ±(х/? - \/х). Это уравнение позволяет построить направляющую в плоскости хОу, а вместе с ней и саму поверхность (рис. 8.5). Сужая область определения функции Ф сперва на область и > -1/2, а затем на область и < 1/2, получаем две новые функции, каждая из которых задает поверхность в пространстве, так как в указанных областях функция Ф(щи) является инъективной, непрерывной, причем обратная функция тоже непрерывна. Две эти поверхности имеют линию пересечения (при и = +1 и при и = — 1) и общую часть —1/2 < и < 1/2.
Образ Ф((/) при отображении Ф, показанный на рис. 8.5, относят к поверхностям с самопересечением. #
Поверхность S будем называть гладкой, если она определяйся функцией Ф: U С R2 —>R3, дважды непрерывно дифференцируемой на множестве U. Например, если f(x,y) € С2(1 то уравнение z = f(x,y) определяет гладкую поверхность. Поскольку соответствующая функция Ф(и,о) = (и, v, Дважды непрерывно дифференцируема в U.
198
8. ГЕОМЕТРИЯ ПОВЕРХНОСТЕЙ
Точку (хо, уо, zq) гладкой поверхности S называют реа^ ллрной точкой этой поверхности, если в точке (u0, v0) = Ф”1 (x0,y0,z0) ранг матрицы Якоби Ф'(ио^о) функции ф задающей эту поверхность, равен двум. В этом случае вектору частных производных
(Zu(WO,Vo)\	/ 4(uo,vo)\
2/L(mo,Vo) I, ru(ttO,vo)= I ?/[(u(hVo) , <(uo,vo) /	\^(uo,vo) /
совпадающие co значениями частных производных Фи(ио,го) и Фу(ио^о) функции Ф(и,и) в точке (uq, vq) и соответствующие двум столбцам матрицы Якоби Ф'(и,и) этой функции в точке (uo, vq), линейно независимы.
Регулярной поверхностью будем называть гладкую поверхность, у которой все точки регулярные. У поверхности, не являющейся регулярной, точки, в которых нарушено условие регулярности, составляют, как правило, незначительную часть. Удаляя их, мы получаем регулярную поверхность.
Пример 8.6. Рассмотрим какую-либо пространственную кривую 7, заданную дважды дифференцируемой векторной функцией действительного переменного и:
f(u) = (x(u) у(и) z(u))T.
Найдем векторную функцию поверхности, составленной из касательных к этой кривой. Векторное уравнение касательной к кривой г = f(u) в точке со значением параметра имеет вид
I
Г- f(u0) + tf'{u0),
где t — параметр касательной. Таким образом, функция
Ф(и,ц) = /(и) + и/'(и)
при фиксированном и задает прямую, касательную к кривой 7 в точке f(u). Эта функция определяет поверхность, содержащую
8.2. Касательная плоскость и нормаль к поверхности
199
такие касательные, если, конечно, она является инъектив-а обратная к ней функция непрерывна. Так как ее частные
производные равны

вТочках v = 0, т.е. на самой кривой 7, векторы Ф(, и Ф(, коллине-арны- Следовательно, точки кривой являются нерегулярными для поверхности. Если векторы f(u) и /"(и) не коллинеарны, то точки поверхности при v / 0 будут регулярными. Удалив кривую 7, мы получим регулярную поверхность
г = Ф(и, v) = f(u) + v/'(u), v / 0.
Замечание 8.1. Одна и та же поверхность S может быть задана двумя гомеоморфизмами Ф: U —> 5 и Ф^ U\ —>5. Отображение Н = Ф~1 офъ как композиция двух гомеоморфизмов, является гомеоморфизмом открытого множества U\ С R2 в открытое множество U С R2. Мы имеем представление Ф1 = Ф°Я, которое можно интерпретировать как замену исходных параметров u, v в параметрическом представлении поверхности или переход от одной системы координат на поверхности S к Другой. Если функции Ф(и,и) и Ф1(и,и) дважды непрерывно дифференцируемы, то гомеоморфизм Н = Ф”1 оф| также является дважды непрерывно дифференцируемой функцией. В этом случае мы будем говорить о гладкой замене координат.
8.2.	Касательная плоскость и нормаль к поверхности
Напомним, что касательная плоскость к поверхности S н точке Р 6 S — это плоскость, проходящая через точку Р, вторая содержит все касательные к кривым, проходящим
200 8. ГЕОМЕТРИЯ ПОВЕРХНОСТЕЙ
через точку Р и лежащим на поверхности .S’. Нор.ца :1Ь поверхности S в точке Р 6 S — это прямая, проходящая чрр^ Р и перпендикулярная касательной плоскости.
Под кривой 7 на поверхности S мы понимаем такое подмножество S, которое описывается уравнениями вида
x = x(t), y = y(t), z=z(t), <€[tl,t2],
т.е. представляет собой параметрически заданную кривую. Так как любая точка на поверхности S однозначно определена своими координатами и и v, кривую на поверхности можно задать уравнениями
u = u(t), v=v(t), t 6 [^,/2].
В этом случае вектор-функция f(t) = (x(t) y(t) z(/))T представляет собой композицию двух функций: f = фор, где />(/) = = (u(t) v(t)) , а функция Ф задает поверхность 5.
Пусть функция Ф(и,г), задающая поверхность 5, н(прерывно дифференцируема в точке (uo, vq), точка Р = Ф(и0.р0) является регулярной точкой поверхности, а функция р(/) непрерывно дифференцируема в точке tQ, где uq = p(to), Vq = Тогда функция f(t) дифференцируема в точке to, а касапкль-ный вектор /'Go) к кривой у в точке Р = согласно правилу дифференцирования сложной функции, может быть найден по формуле
/Go) = ^(^OiVoJp'Go)»
где Ф'(«о,ио) — матрица Якоби функции Ф(и,г), вычисленная в точке (uq, ио)- Касательный вектор к кривой является направляющим вектором касательной в этой же точке.
Матричное равенство (8.5) может быть записано следующим образом:
/'(to) = aru(u0,v0) + 0r„(uo,vo),	(8-»>)
где « = u'(«o), Ч = v'(t0), r„(u0,v0) = Ф'и(«о, Ч)), г„(ио,’’о) = = Ф^(ио^о). Мы видим, что любой касательный вектор в точке
8.2. Касательная плоскость и нормаль к поверхности
201
р К кривой, лежащей на поверхности S, является линейной ^мбинацией двух векторов ru(uQ,vQ) и rv(uo,vo). Отметим.
0 при любых а и 0 вектор агп(«оЛо) + 0rv(uQ,vq) является дательным вектором в точке Р к некоторой кривой, лежащей * поверхности 5, а именно к кривой, которая описывается
уравнениями
U =	+ V = V0 + /it.
Теорема 8.1. Касательная плоскость к поверхности S в ее регулярной точке Р существует. Уравнение этой плоскости имеет вид
(г - ro)ru(«o, Vo)rv(uo,v0) = 0,	(Я.7)
где хУг — смешанное произведение векторов ж, г/, z\ г — радиус-вектор произвольной точки; го — радиус-вектор точки Р; ио, Vo — координаты точки Р.
4 Согласно представлению (8.6), любой касательный вектор /'(to) в точке Р к кривой, лежащей на поверхности 5, ортогонален вектору n = ruxrv. Поэтому плоскость с нормальным вектором п, проходящая через точку Р. содержит все возможные касательные, проведенные в точке Р к кривым, лежащим на поверхности S. Векторное уравнение такой плоскости имеет вид
(г - го)п = 0
и эквивалентно уравнению (8.7). ►
Вектор
n = ru(uo,vo)xrv(uo,vo)	(8.8)
называют нормальным вектором к поверхности в точке Ф(“о, Vo).
Замечание 8.2. Из теоремы 8.1 следует, что в регулярной Точке Р векторы ги и rv образуют базис в линейном пространстве векторов, параллельных касательной плоскости к поверхности S в точке Р. Числа а и /3 мы будем называть внутренними координатами касательного вектора arи + [3rv.
202
8. ГЕОМЕТРИЯ ПОВЕРХНОСТЕЙ
Существование нормали к поверхности S в данной точке Р Е S напрямую связано с существованием касательной плог. кости в этой точке. Поэтому мы можем сказать, что дЛя поверхности S в любой ее регулярной точке существует нор. маль. Направляющим вектором нормали является нормальный вектор касательной плоскости, т.е. вектор n = ruxrv. Вектор, ное уравнение нормали может быть записано в виде
г = r0-H(ruxrv),
где го — радиус-вектор точки Р\ г — радиус-вектор произвольной точки в пространстве.
8.3.	Первая квадратичная форма поверхности
Задание поверхности S с помощью гомеоморфизма Ф: I/ -> -> R3, U С R2, и введение в связи с этим координат точки на поверхности S позволяют описывать и решать задачи без использования пространственных координат. Кривая на поверхности S может быть описана двумя уравнениями (8.4) при помощи двух функций u(t) и v(t). Точка Р поверхности S определяется своими координатами u, V.
Рассмотрим следующие три задачи:
а)	вычисление длины кривой на поверхности;
б)	вычисление угла между двумя пересекающимися кривыми на поверхности;
в)	вычисление площади некоторой области на поверхности.
Эти задачи можно решать, используя описание кривых или области во внутренних координатах и, и, а также определенную характеристику самой поверхности, заданную в каждой ее точке. При таком подходе реальное положение поверхности и пространстве не является существенным.
Рассмотрим гладкую кривую у на регулярной поверхности S, заданную во внутренних координатах уравнениями (S.-0* Предположим, что поверхность S определена гомеоморфизм0*1
8.3. Первая квадратичная форма поверхности
203
(°’ и) € Тогда положение кривой 7 в пространстве характеризуется уравнением г = f(t), t € [h, t2L где f(t) = ф(и(<) »v(0) — композиция двух функций многих переменных* Известно [11], что дифференциал ds длины дуги кривой 7 в данном случае можно записать в виде
ds(t) = \f'(t)\dt.
Согласно представлению (8.6), получаем
ds2 = |/'(012^2 = |гУ(0 + rvv'(t)\2 dt2 =
= (|ru|2 (u'(0)2 + 2rurv u'(t) v'(t) + |rv|2 (u'(0)2}dt2,
где ru = Ф'и(«(0л(0)’ rv = Ф'Ди(г),и(г)). Используя дифференциалы du = u'(t)dt и dv = v'(t)dt функций u(t) и v(t) и свойство инвариантности формы записи дифференциала, приходим к представлению квадрата дифференциала длины дуги в виде квадратичной формы
ds2 = Edu2 + *2Fdudv + Gdv2,	(8.9)
где Е = г*, F = rurv, G = r*.
Определение 8.1. Квадратичную форму (8.9), представляющую квадрат дифференциала длины дуги кривой на регулярной поверхности S как функцию дифференциалов внутренних координат поверхности, называют первой квадратичной Формой поверхности S.
Коэффициенты Е, F, G при du2, dudv и dv2 в формуле (8.9) коэффициенты первой квадратичной формы) зависят т°лько от точки поверхности, в которой рассматривается диф-^Ренциал длины дуги, и никак не связаны с какой-либо кри-лежащей на поверхности. Мы на самом деле имеем не ^Дратичную форму, а семейство квадратичных форм, опре-Ке^ЯеМОе Двумя Действительными параметрами: в каждой точ-п°верхности своя квадратичная форма.
204
8. ГЕОМЕТРИЯ ПОВЕРХНОСТЕЙ
Замечание 8.3. Из определения первой квадратичной ф0^ мы следуют ее простейшие свойства: а) в каждой регулярку точке поверхности первая квадратичная форма положительно определена; б) первая квадратичная форма является инвариац, том относительно движений пространства.
Действительно, для доказательства первого из сформулиро-ванных свойств достаточно заметить, что квадрат дифферец. циала длины дуги кривой неотрицателен и равен нулю только тогда, когда dx — dy — dz = 0. Дифференциалы переменных связаны соотношением
= rudu+rvdv.
Следовательно, равенства dx = dy = dz = 0 означают, что rudu + rvdv = 0. А так как векторы ги и rv в силу регулярности поверхности не коллинеарны, то du = dv = 0.
Второе свойство верно в силу того, что длина любой кривой при движениях пространства не изменяется, следовательно, ир изменяется и дифференциал длины дуги. #
Пусть поверхность S задана гомеоморфизмом Ф: (7 -> R?. а гомеоморфизм Н\ U\ —> V, V\ С R2, определяет замену координат u, v поверхности координатами и\, U|. Выясним, как изменяется первая квадратичная форма при переходе от координат u, v к координатам vj. В рассуждениях используем матричную форму записи первой квадратичной формы:
где Е - г*, F = rurv, G - г*.
Теорема 8.2. Пусть регулярная поверхность S задана гомеоморфизмом Ф(и,и) и (и v) = Н(и\,щ) — замена ко<>Р' динат поверхности, заданная дифференцируемой функцией И-
8.3. Первая квадратичная форма поверхности
205
'роГДа коэффициенты Е, F, G первой квадратичной формы в ^ординатах u, v связаны с коэффициентами Fi, /4, G\ этой ^радратичной формы в координатах uj, vi соотношением
(Ег!	(Е E\h'(ux,Vi), (8.10)
где	— матрица Якоби функции Я, вычисленная в
«точке с внутренними координатами uj, Vp
4 Вейлу инвариантности формы записи дифференциала функции многих переменных имеем
Поэтому
откуда получаем соотношение (8.10). ►
Формула (8.10) преобразования матрицы первой квадратичной формы похожа на формулу преобразования матрицы квадратичной формы при переходе к новому базису в линейном пространстве [IV]. Но если в формуле для линейного пространства используется матрица перехода^ то в формуле для первой квадратичной формы фигурирует матрица Якоби функции И. Задающей замену координат. Схожесть формул преобразования имеет более глубокий смысл, чем могло показаться на Верный взгляд. Действительно, рассмотрим произвольный век-Т°Р а в касательной плоскости к поверхности S в точке Р.
206 8. ГЕОМЕТРИЯ ПОВЕРХНОСТЕЙ
Пусть в базисе ru, rv координаты вектора а равны а и /J.
тор а можно рассматривать как касательный вектор в тонко Р к некоторой кривой 7, лежащей на поверхности S и заданцОц уравнениями (8.4), т.е. можно считать, что а = и'(to), /3 = где u(t) и v(t) — координатные функции кривой на поверхно сти S, a to — значение параметра t, соответствующее точке Р. Переход к новым координатам V] вызывает замену базиса ru, rv на касательной плоскости новым базисом rh], г где	r„, = (Ф«Я)'1,1(и|,у1). В силу прави-
ла дифференцирования сложной функции многих переменных имеем
г„, = Ф'(и, 1’)^, («1, ^1) =
= Ф'и (и, 1>) и'И1 + Ф'„(и, v) v'„, =	ги + v'U| rt„
г„, = Ф'(и,и)Я'1(м1,и)) =
= Ф'„ (и, г)й'„, + Ф'„(«,	гц + и', г„.
где
Видно, что матрицей перехода от базиса ru, rv в касательной плоскости к базису rU1, rV1 является матрица Якоби функции Я, вычисленная в точке (щ, i?i) 6 U\, которой на поверхности соответствует точка Р.
Проведенные рассуждения с учетом теоремы 8.2 показы ва ют, что первую квадратичную форму в данной точке Р можно рассматривать как квадратичную форму в линейном пространстве векторов касательной плоскости к поверхности, построенной в точке Р. Нетрудно увидеть, что эта интерпретация первой квадратичной формы имеет простой геометрический смысл: значение квадратичной формы на векторе касательной плоскости есть не что иное, как квадрат длины этого вектора-
8.3. Первая квадратичная форма поверхности
207
Теорема 8.3. Если точка Р поверхности S является регулярной, то справедливо равенство
|ruxrv| = у/EG - F2,
ЕУ F,G — коэффициенты первой квадратичной формы.
4 Согласно свойствам векторного и скалярного произведений, для любых двух векторов х и у в пространстве имеем
|«Х»| = |®| |у| Sin <f> = |г| |у I х/1 -cos2y> =
\/|®121»12~ (|as||»|cos^>)2 = у/х2у2 - (®у)2,
где ф — угол между векторами х и у. Учитывая, что Е = rj, F = rurv, G — rj, получаем утверждение теоремы. ►
Введение первой квадратичной формы позволяет решить три задачи, сформулированные в начале параграфа.
Длина кривой. Если кусочно гладкая кривая 7, лежащая на поверхности S, задана уравнениями (8.4), то ее длина может быть вычислена по формуле
<2
I \/E(u'(t))2 + 2Fu'(t)v'(t) + <7 (v'(t))2 dt,
(8.11)
<1
гДе Коэффициенты первой квадратичной формы Е, F, G вычисляются в точке (u(t), v(0) и рассматриваются как функции переменного t.
Действительно, длина кусочно гладкой кривой 7, заданной параметрически функциями г(0, y(t), z(t), t 6 [tj, t2], равна [VI]
t2	h
L, = jds(t) = j \r'(t)\dt,	(8.12)
208
8. ГЕОМЕТРИЯ ПОВЕРХНОСТЕЙ
где r'(t) — касательный вектор к кривой в точке с радиус вектором r(t). В нашем случае дифференциал дуги ds = *'(l)dt может быть записан с помощью первой квадратичной формЬ(:
ds = |r'(0\dt = у/Еdu2 + 2F du dv + Gdv2,
где и = u(t), v = v(t) — уравнения кривой в системе внутренних координат. Это представление дифференциала дуги и пр и во.
дит к формуле (8.11).
Угол между кривыми. Угол между гладкими кривыми 71 и 72, лежащими на регулярной поверхности S и поре.
секаюшимися в точке Р € S,
Рис. 8.6
равен углу между их касательными векторами в этой точке (рис. 8.6). Если эти кривые заданы парами уравнений и = = v = V{(t), i =1,2, то производные ttJ(Jo), цФо) в точке пересечения, которой соответствует параметр /о, представ
ляют собой координаты касательных векторов r, (Zq) и г2(1о] в касательной плоскости относительно базиса ru, rv. Угол между
двумя векторами можно вычислить через скалярное произведение, а скалярное произведение через координаты векторов в произвольном базисе можно найти, зная матрицу Грама для этого базиса. В нашем случае базисом является ru, rv, а матрица Грама Г представляет собой матрицу первой квадратичной формы:
Г - (	’•«nA _ ( Е FX
\rurv г2 ) \F G/'
Используя формулу вычисления скалярного произведения через матрицу Грама [IV], находим
|т-' |2 =	+ G(v',)2,
r\r2 = Eu/1«2 4-F(u'1V2 + u2v{)+Gv]v2,
l^l2 = E (u'2)2 + 2Fe£t4 + G(v2)2.
8.3. Первая квадратичная форма поверхности
209
результате получаем формулу
Г'1Г2 е08<р_ кЖГ
Eu\u'2 + FJu'jVj 4- «2^1) -hG’vJv^
Eu',2 + 2Fu'. v' + Gv\2 Jeu'2 + 2Fu'v'+Gv'2 ’ 1	11	1 \f	Л»	it it	L
в которой коэффициенты первой квадратичной формы Еу F, G вычисляются в точке пересечения кривых, а производные
и «2» v2 — ПРИ значениях параметров кривых, соответствующих точке пересечения.
Площадь поверхности. Площадь о регулярной поверхности S, заданной отображением с областью определения U С R2, может быть вычислена по формуле
о
EG - F2dudv.
и
Действительно, разобьем область U на части прямыми линиями и = v = Vk (рис. 8.7). Тогда линии г(и,,и) и г(н,и^) разобьют на части поверхность S. Выделим в области U произвольный прямоугольник Uik. На поверхности S ему отвечает криволинейный четырехугольник Sik, который мало отличается от параллелограмма^ со сторонами, определяемыми векторами r'u(ui,Vk)&Ui и rfv(ui,Vk)Avk. Этот параллелограмм лежит
Рис. 8.7
210
8. ГЕОМЕТРИЯ ПОВЕРХНОСТЕЙ
в касательной плоскости яг поверхности S в точке (ut-,vj.). |£Го площадь равна
Oik = |г^Д«<хг^,Ди*| = |»4х1<|Д«,Дгк.
Возьмем за приближенное значение площади криволиней-ного четырехугольника Sik площадь &ik параллелограмма Тогда сумма
vt)xr'(«i,vfc)|AuiAv* i,k i,k
даст нам приближенное значение площади поверхности S.
Определим площадь а поверхности S как предел сумм
при стремлении к нулю величин Ди,- и Ди^. Так как векторы гп и rv являются непрерывными функциями, то их векторное произведение также является непрерывной функцией. А значит, такой предел, как предел интегральных сумм, существует и равен двойному интегралу по области U [VI!]:
а = УУ |r^xry|dudv.
и
Используя теорему 8.3, получаем отсюда нужную формулу.
Итак, зная первую квадратичную форму поверхности, можно вычислять длины кривых на поверхности, углы между кривыми и площади областей на поверхности, не обращаясь к уравнению поверхности. Совокупность геометрических фактов, относящихся к поверхности, которые можно получить при помощи ее первой квадратичной формы, изучают в рамках внутренней геометрии поверхности (см. ниже). Поверхности, У которых при некотором выборе систем координат первые квадратичные формы совпадают, называют изометричными.
Пример 8.7. Плоскость является частным случаем поверхности. Действительно, выберем систему координат х. У-
8.4. Вторая квадратичная форма поверхности
211
2 в пространстве так, чтобы уравнение плоскости было 2 = 0. ^орда векторная функция Ф(и, v) = (u v 0) , (u, v) 6 U = R2, задает* рассматриваемую плоскость.
Вычисляя коэффициенты Е, F, G первой квадратичной формы, получаем
Гц =$„=», Ги = Ф'„=],
E = r2 = l, F = r,X = 0, G' = r’=l.
и поэтому ds2 = du2 + dv2.
Пример 8.8. Если прямой круговой цилиндр задан параметрическими уравнениями (8.3), то
Поэтому
Е = г£ = Д2, F = rv,rt = 0, G = r{=l.
Следовательно, первая квадратичная форма имеет вид / = = R2d<p2 4- dt2. Перейдя к новым координатам и = Rip, v = t, получим, как и в случае плоскости, I = du2 4- dv2. Таким образом, прямой круговой цилиндр и плоскость изометричны.
8.4.	Вторая квадратичная форма поверхности
Из примеров 8.7 и 8.8 следует, что плоскость и цилиндр име-*°т одинаковые первые квадратичные формы, т.е. они изомет-Ричны. Но эти поверхности нельзя совместить друг с другом с Помощью движений пространства. Это говорит о том, что Первая квадратичная форма не определяет поверхность однозначно. Первая квадратичная форма позволяет выявлять все свойства поверхности, которые связаны лишь с измерениями
212
8. ГЕОМЕТРИЯ ПОВЕРХНОСТЕЙ
на самой поверхности (длины кривых, площади, углы). Однако она не определяет пространственной структуры поверхности взаимного расположения ее частей в пространстве. Деиствц. тельно, можно представить себе поверхность, сделанную нерастяжимого материала. Тогда при деформировании этой поверхности (если она возможна) длины кривых, площади и т.п. не будут меняться, но поверхность при этом может изгибаться. Например, цилиндрическая поверхность может быть получена из плоскости в результате такого деформирования.
Рассмотрим поверхность S, заданную дважды непрерывно дифференцируемой функцией Ф(и,и). Пусть Р = Ф(и<ьЦ)) регулярная точка поверхности. В касательной плоскости тг к поверхности S, построенной в точке Р, выберем вектор х. Этот вектор является касательным вектором к некоторой кривой у, лежащей на поверхности S и проходящей через точ-
Рис. 8.8
ку Р: если кривая у задана век-тор-функцией r(t) и Р = г(До), то х = г'(До)* Рассмотрим функцию Q(x), которая вектору х ставит в соответствие проекцию вектора г"(До) на направление вектора ruxrv, где гм = Ф'м(и0,у0), г,_ = = Ф,и(ио,У0) (рис. 8.8).
Вектор х касательной плоскости тг может быть касательным вектором разных кривых, лежащих на поверхности .S'-Покажем, что значение Q(x) на самом деле не зависит от выбора кривой 7 и функция Q определена корректно.
Теорема 8.4. Если х = aru + /3rv, то Q(x) = La2 + 2Л/о^ + + N02, где
, Гуи^у	N=	)
x/EG-F2 VEG-F2 x/EG-F2
Е, F, G — коэффициенты первой квадратичной формы в точке Р, гии = Ф"и(«о,Уо), ги„ = Ф"и(“о^о), гто =
Ги = Ф'и(«о>«о), ГУ = Ф'и(°О>«о)- Р = Ф(«о,«о)-
8.4. Вторая квадратичная форма поверхности
213
рассмотрим произвольную кривую у на поверхности 5, заданную уравнениями u = u(i), v = v(t), t € (a, 6), проходящую через точку Р € S. Пусть точке Р соответствует значение параметра io- Тогда векторное уравнение кривой в пространстве определяется вектор-функцией r(t) = Ф(и(£),v(i)), так что карательный вектор кривой равен
г'(*о) =ф^(ио,«'о)и'(*о) + Ф'1,(ио,«'о)«''(<о) =
= гим'(<о)+г„у'(М- (8.14)
Пусть u'(to) = «, v'(to) = 0, т.е. г'(to) = х. Вычислим проекцию вектора г"(to) на направление вектора n = ruxrv, используя скалярное произведение:
Q(x) =
r"(tp)n _ r"(to)(rttxrv) |n| ” |ruxrv|
r"(to)rurv kuXrJ
(8.15)
Знаменатель полученной дроби, согласно теореме 8.3, равен у/EG — F2, а в числителе стоит смешанное произведение векторов r"(io), ти и rv.
Так как rf(t) = Ф'и(и,и)и'(1) + Ф{,(и,и)и'(£), то
«•"(to) = ^(Ф'„(«,”)“'(0 + <K(u,v)v'(0)	=
Л С	t=to
= Ф,и,и(ио,ио)(и,(^о))2 + 2Ф,и^(«о,и0)1£,(^о)и,(<о) +
4-ФСи«о^о)(^,(0)24-Ф,и(но,Уо)и,,(^о)4-Фи«о,Уо)^о) =
= ruu0t2 + 2ruva$ 4- rvvfi2 + rvu"(io) + rvv"(io) •
Умножая полученное представление вектора r"(fo) скалярно на вектор ruxrv и учитывая, что rururv = rvrurv = 0, получим
г"(Мгиг* = ruururva2 + 2ruvrurva(3 + rvvrurvB2.
Подставляя это представление смешанного произведенеия в (8.15), приходим к утверждению теоремы. ►
214
8. ГЕОМЕТРИЯ ПОВЕРХНОСТЕЙ
Из доказанной теоремы вытекает, что значение функции Q(x) зависит лишь от внутренних координат вектора х, но не от выбора кривой, касательным вектором которой он является Кроме того, из теоремы следует, что функция Q(x) определяется квадратичной формой с коэффициентами L, Л/, N:
Q(x) = La2 + 2Ма0 + N02.
Определение 8.2. Функцию Q(x), которая определена в линейном пространстве векторов касательной плоскости, построенной в данной точке Р, называют второй квадратичной формой поверхности S. Величины L, М, 7V, вычисленные по формулам (8.13), называют коэффициентами второй квадратичной формы.
Как и в случае первой квадратичной формы, вторую квадратичную форму можно записать в дифференциалах переменных координат u, v:
Q = Ldu2 + ‘2Л/ dudv + N dv2.	(8.16)
Коэффициенты L, M, N второй квадратичной формы зависят от точки поверхности и представляют собой функции координат u, v на поверхности. При движениях пространства сохраняются расстояния и углы, а следовательно, не меняют ся скалярное, векторное и смешанное произведения векторов. Поэтому движения пространства не изменяют вторую квадратичную форму поверхности, или, другими словами, квадратичная форма поверхности не зависит от положения поверхности в пространстве.
Замечание 8.4. Формулы (8.13) можно переписать в виде
L = ruun°, M = ruvn°, N = rvvn°, где О ruxrv п - I---------------------------1	~
|ruxrv|
единичный нормальный вектор к поверхности.
8.5. Классификация точек поверхности	215
Пример 8.9. Вторая квадратичная форма плоскости рав-НУЛЮ- Действительно, это очевидно для плоскости z = 0 (см. пример 8.7). Но любую плоскость в пространстве можно совместить с плоскостью z = 0 движением, а при движениях вторая квадратичная форма не меняется. Поэтому для любой плоскости Q — 0.
Пример 8.10. В случае цилиндра (8.3) имеем
Следовательно, Q — -R2d<p2. Значит, вторая квадратичная форма цилиндра не обращается в нуль ни в одной точке, и с помощью замены координат на поверхности ее нельзя свести ко второй квадратичной форме плоскости, которая равна нулю во всех точках. #
Отметим, что если первая квадратичная форма в каждой точке поверхности положительно определена, то вторая квадратичная форма может иметь значения произвольного знака. Она, например, может быть вырожденной, как в примере 8.10, тождественно равной нулю, как в примере 8.9, или знакопеременной.
8.5.	Классификация точек поверхности
При изучении поверхности S в окрестности ее регулярной Почки Р удобно в качестве прямоугольной системы координат Oxyz использовать ту, начало координат О которой совмещено с точкой Р, а координатная плоскость хОу — с касательной Плоскостью. Такую систему координат мы будем называть связанной с касательной плоскостью поверхности S в Точке Р.
216	8. ГЕОМЕТРИЯ ПОВЕРХНОСТЕЙ
I
Теорема 8.5. Пусть Р — регулярная точка гладкой поверх ности S, a Oxyz — система координат, связанная с касатр.ц». ной плоскостью поверхности S в точке Р. Тогда в некоторой окрестности точки Р поверхность S совпадает с графиком некоторой функции f(x,y). При этом /(0,0) = 0, df(O,O) = 0. а дифференциал второго порядка функции / в точке (0, 0) совпа-дает со второй квадратичной формой поверхности S в точке Р, т.е. коэффициенты L, М, N второй квадратичной формы в точке Р можно вычислить по формулам
#7(0,0)	#7(0,0) N #7(0,0)
дх2 ’	дхду ’	ду2
(8.18)
◄ Пусть поверхность 5 задана гомеоморфизмом Ф(и,и), (и, г) £ Е U СК2, &х = x(u,v), у = у(и, v), z = z(u,v) — соответствующие параметрические уравнения поверхности в системе координат Oxyz, связанной с касательной плоскостью в точке Р, имеющей координаты uq, vq. Обозначим через Н ортогональную проекцию на координатную плоскость хОу, т.е. функцию Н (х, у, z) = (ж, у), отображающую пространство в касательную плоскость. Композиция //оф — это непрерывная функция, отображающая множество U в касательную плоскость х(9у поверхности S в точке Р. Так как Р — регулярная точка, то векторы ги = Ф^(«о,^о) и rv = Ф{,(«о>Ц)) не коллинеарны. Значит, rnxrv 0 0. Но в выбранной системе координат Оху? векторы ги и rv параллельны координатной плоскости хОу. Поэтому их векторное произведение ruxrv коллинеарно оси Oz. а условие ruxrv / 0 равносильно условию
x'u(u0,V0) г/С(«о,”о) 4 (“о, «о) ’/'„(“О, Wo)
/0.
т.е. матрица Якоби функции Н <>Ф в точке (wq, ио) невырождс-на. По теореме об обратной функции существуют окрестность Uo точки (wq> Vo) € окрестность Vg точки Р на плоскости хОу
8.5. Классификация точек поверхности
217
^прерывная функция Ф: Vq —> Uq, обратная к функции ЯоФ. 0тметим, что в силу гладкости поверхности функция Н °Ф важды непрерывно дифференцируема. Поэтому и обратная функция дважды непрерывно дифференцируема в некоторой окрестности точки Р.
функция Ф о ф является гомеоморфизмом как композиция двух гомеоморфизмов. Она задает в пространстве поверхность, представляющую собой часть поверхности 5, попавшую в некоторую окрестность точки Р. Эта функция точке в плоскости х(9у с координатами хну, попавшей в окрестность Vo. ставит в соответствие ту точку поверхности S, которая проектируется в точку (х, у), т.е. функция фоф имеет вид
(фоф)(х,?/) =
где f(x,y) — некоторая непрерывная функция двух переменных. Из этого представления вытекает, что часть поверхности S, которая определена гомеоморфизмом Ф°Ф, есть график функции f(x,y). Так как функции Ф и Ф дважды непрерывно дифференцируемые, то и функция f является дважды непрерывно дифференцируемой. Учитывая, что точка Р на поверхности S имеет координаты (0, 0, 0), заключаем, что /(0,0) = 0.
Итак, поверхность S в окрестности точки Р представляет собой график некоторой функции f(x,y) и может быть задана гомеоморфизмом Ф(х,у) = (х у f(x,y))\ (х, у) Е Vo. Найдем вторую квадратичную форму поверхности. В данном случае
/ i \	~	/	°	\
= Ф'х(х,у) = I 0	), гу = Фу(х,у) =	1 I
[гхх = Ф^о,о) = лио>о)*>
^Г!/ = Ф"г(0,0) = /;;(0,0)Л,	(8.19)
(ryj/ = ^r(0,0) = ^(0,0)fe.
218
8. ГЕОМЕТРИЯ ПОВЕРХНОСТЕЙ
Векторы гх, Гу параллельны касательной плоскости хОу. довательно, /'(0,0) = 0, /'(0,0) = 0 и d/(0,0) = 0. Кроме тог0 тххту = ixj = k и n° = k. Согласно замечанию 8.4 и равен,’ ствам (8.19), получаем формулы (8.18). ►
Если две поверхности Si и S2 проходят через точку Р и име
ют в этой точке общую касательную плоскость тг, то Si и $2
называют поверхностями, kq, сающимися в точке Р. Восстановим перпендикуляр в произвольной точке А касательной плоскости тг до пересечения с поверхностями Si и S2 в точках Pj и Р2 соответственно (рис. 8.9).
Тогда для некоторых значений г 1 верно соотношение
\PiP2\ = o(\PA\r), А-ьР
(8.20)
(во всяком случае это соотношение верно при г = 1). Точную верхнюю грань таких значений г назовем порядком касания поверхностей Si и S2 в точке Р. Отметим, что если для поверхностей Si и S2 в их общей точке Р существует такая плоскость тг, что при некотором г 1 верно соотношение (8.20), то поверхности Si и S2 касаются в этой точке с порядком касания не менее г, а их общей касательной плоскостью в точке Р является плоскость тг.
Теорема 8.6. Предположим, что две поверхности Si и Si проходят через точку Р, регулярную для каждой из поверхностей, и имеют в этой точке общую касательную плоскость. Пусть Oxyz — система координат в пространстве, связанная в точке Р с этой касательной плоскостью, а поверхности Si и S? в окрестности точки Р являются графиками функций /i(^d/) и /2(2 ,у). Поверхности Si и S2 касаются в точке Р с порядком не менее г в том и только том случае, когда
~ f2(x,y) = o{(x2 + y2)r/2).	(8.21)
8.5. Классификация точек поверхности	219
0 системе координат, связанной с касательной плоскостью, ^стояние между поверхностями S\ и 5г по перпендикуляру £ касательной плоскости равно разности аппликат двух точек й может быть записано в виде \fa(x,y) - /2(г,1/)|, где х и у — ^ординалы точки А в плоскости хОу (см. рис. <8.9). Поэтому определение касания поверхностей порядка не менее г может буть записано в виде
1/1 (х,у) - f2(x,y)\ = о((Уж2 + !/2)г),
что равносильно (8.21). ►
Пример 8.11. Поверхность и касательная плоскость касаются с порядком не менее 1. Действительно, в системе координат, связанной с касательной плоскостью, поверхность S есть график такой функции z — f(x,y), что /(0,0) = 0 и #(0,0) = о, а касательная плоскость тг есть график нулевой функции h(x,у) = 0. По формуле Тейлора первого порядка f(x,y) = о((т2 4- У2)1/2)- Согласно теореме 8.6, поверхность S Я плоскость тг касаются в точке касания с порядком не менее 1. #
Пусть S — регулярная поверхность, тг — ее касательная плоскость в точке Р, а п° — единичный нормальный вектор к поверхности S ватой точке, вычисляемый по формуле (8.17). В каждой точке А касательной плоскости тг построим перпендикуляр и отложим на нем отрезок APi длиной, равной половине Модуля значения квадратичной формы Q на векторе Р%. Отрезок расположим по одну сторону с вектором п° относительно Касательной плоскости тг, если значение Q(P%) положительно, и по разные стороны, если это значение отрицательно. Множество точек Р\ для различных А Е тг образуют поверхность, Которую называют соприкасающимся параболоидом по-*ергности S в точке Р.
Из этого определения следует, что в системе координат ^Xyz, связанной с касательной плоскостью поверхности S в
220
8. ГЕОМЕТРИЯ ПОВЕРХНОСТЕЙ
точке Р, соприкасающийся параболоид совпадает с графи к функции
д(х,у) = ^Lx2 + Mxy+-Ny2,
Ом
т.е. является эллиптическим или гиперболическим параболой дом, если вторая квадратичная форма невырождена, и пара, болическим цилиндром, если вторая квадратичная форма вц, рождена, но тождественно не равна нулю. Если квадратичная форма тождественно равна нулю, соприкасающийся параболоид совпадает с касательной плоскостью.
Из определения соприкасающегося параболоида также легко получить его векторное уравнение:
r = r0 + aru + 0r„ +
где г — радиус-вектор произвольной точки в пространстве: го — радиус-вектор точки Р; а, $ — координаты вектора в базисе ru, rv; — вторая квадратичная форма. Числа о и /3 можно рассматривать как координаты на соприкасающемся параболоиде.
Теорема 8.7. Поверхность S и ее соприкасающийся параболоид в точке Р касаются в этой точке с порядком не менее 2. ◄ Из теоремы 8.5 следует, что в системе координат, связанной с касательной плоскостью, поверхность S в окрестности точки Р совпадает с графиком некоторой функции f(x,y), причем /(0,0) = 0, <//*(0,0) = 0, a d2/(0,0) есть вторая квадратичная форма поверхности S в точке Р. В этой же системе координат соприкасающийся параболоид совпадает с графиком половины второй квадратичной формы, т.е. функции z = 0,5d2/(0,0). гДс dx = х, dy = у. Из формулы Тейлора второго порядка получаем f(x,y) - d2/(0,0) = о(я2 + у2). Используя теорему 8.6, приходим к утверждению теоремы. ►
Как уже было отмечено, соприкасающийся параболоид яв-1Я' ется поверхностью второго порядка. Тип этой поверхно< И’
8.5. Классификация точек поверхности
221
дрвделяется типом квадратичной формы. Так как соприка-^рщийся параболоид касается поверхности 5 с порядком не ецее 2, в окрестности точки Р поверхность S во многом ^ределяется своим соприкасающимся параболоидом. Поэтому явственно различать точки поверхности по типу соприкаса-щегося параболоида.
Точку Р поверхности S называют эллиптической, если
прикасающийся параболоид в этой точке есть эллиптический ^раболоид. Точка Р гиперболическая, если соприкасающий-। параболоид в этой точке есть гиперболический параболоид, аконец, точка Р параболическая, если соприкасающийся деаболоид есть параболический цилиндр.
Тип точки можно определить по дискриминанту D = LN - М2 второй квадратичной формы. При D > 0 точка (липтическая, при D < 0 она гиперболическая, а при D = О L24-N2/0 — параболическая. В эллиптической точке со-
эикасающийся параболоид располагается по одну сторону от нательной плоскости. В гиперболической точке соприкаса-щийся параболоид, являясь гиперболическим параболоидом, преходит с одной стороны касательной плоскости на другую,
фесекаясь с ней по двум прямым. В параболической точке три касающийся параболоид расположен по одну сторону от нательной плоскости, но пересекается с ней не в одной точке,
нс в случае эллиптической точки, а по прямой.
Отдельно выделим случай, когда вторая квадратичная фор-1 в точке Р поверхности 5 равна нулю. В этом случае точку называют точкой уплощения. В точке уплощения сопри-1сающийся параболоид поверхности совпадает с касательной Юскостью.
Пример 8.12. У эллипсоида и двуполостного гиперболо-U все точки эллиптические, у однополостного гиперболоида ‘еточки гиперболические. У любого цилиндра (эллиптическо->, гиперболического, параболического) все точки параболиче-
222
8. ГЕОМЕТРИЯ ПОВЕРХНОСТЕЙ
ские. Рассмотрим, например, одну из вершин А эллипсоид (рис. 8.10).
Эллипсоид в некоторой прямоугольной системе координат задается каноническим уравнением х2 у2 z2 	1- — Ч-= 1 а2------------------------------Ь2	с2-’
причем эту систему координат можно выбрать так, что рассматриваемая вершина А будет находиться на положительной части оси Oz, т.е. будет иметь координаты (0, 0, с). В окрестности точки А эллипсоид можно считать графиком функции
/1 х2 у2 у а* о2 а касательной плоскостью к эллипсоиду в точке А является плоскость z = с. Значит, система координат AxiyiZi, связанная с касательной плоскостью, получается из первоначально выбранной системы координат Oxyz параллельным переносом, при котором начало координат совмещается с точкой А. В системе координат 4xiyiZi эллипсоид в окрестности точки Л определяется уравнением
Ь2
8,5. Классификация точек поверхности
223
£0рдасно теореме 8.5, имеем
дх2 a2R3/2 ’
М = 0 Zx = СХ'Ух дх^ду! a2b2R3/2'
TV = ——- =  ------—-
dyi b2R3/2 ’
Рде R = 1 “ ж?/®2 “ 2/i Л2- Вычисляя дискриминант, находим
LN _ д/2 =	1 - ж1/°2 - У1Z62 = с2 > о
м a2b2 R3	a2b2R,2 > °’
Следовательно, точка А является эллиптической.
Замечание 8.5. В эллиптической точке поверхности касательная плоскость лежит по одну сторону от поверхности (точнее, от ее части в некоторой окрестности точки, рис. 8.11, а). А если точка гиперболическая, то касательная плоскость расположена частично с одной стороны поверхности, частично с другой, пересекаясь с поверхностью по двум кривым (рис. 8.11, б}. Такой вывод можно сделать на основании теоремы 8.5.
Действительно, в системе координат, связанной с касательной плоскостью, поверхность S в окрестности заданной точки Р совпадает с графиком некоторой функции f(x,y), причем tf/fO,0) = 0, a d2/(0,0) совпадает со второй квадратичной формой поверхности в точке Р. Если точка Р эллиптическая, то ^/(0,0) является положительно или отрицательно определенно! квадратичной формой. Согласно достаточному условию экстремума, функция f(x,y) имеет в точке (0, 0) экстремум,
224
8. ГЕОМЕТРИЯ ПОВЕРХНОСТЕЙ
поэтому ее график (т.е. поверхность S) расположен с одной г роны от касательной плоскости.
Если же точка Р гиперболическая, то квадратичная форм rf2/(0,0) является знакопеременной, а поэтому точка (0, о) является точкой экстремума функции f(x,y). ГеометричеСКи это означает, что график функции частично расположен ниже касательной плоскости, а частично выше.
В параболической точке Р (или в точке уплощения) квадро тичная форма </2/(0,0) является вырожденной. В этом случае точка (0, 0) может быть точкой экстремума, а может и не быть таковой (см. пример 6.4). Поэтому график функции может находиться с одной стороны от касательной плоскости, а может и пересекать ее.
8.6.	Нормальная кривизна поверхности
Рис. 8.12
В регулярной точке Р поверхности S построим плоскость, проходящую через точку Р параллельно нормальному вектору п к поверхности и заданному вектору I в касательной плоскости. Эта плоскость пересекает поверхность S по некоторой кривой 7/, которую называют нормальным сечением поверхности S в точке Р в направлении вектора I (рис. 8.12), а кривизну нормального сечения в точке Р называют нормаль-ной кривизной поверхности S в точке Р в направлении вектора I. При этом кривизну бе
рут со знаком плюс (по модулю), если направление главного нормального вектора vi кривой 7/ совпадает с направлением нормального вектора к поверхности, который вычисляют по формуле (8.8). В противном случае нормальная кривизна имеет отрицательное значение.
8.6. Нормальная кривизна поверхности
225
рдарный нормальный вектор 1// нормального сечения 7/ ор-дален касательному вектору к этой кривой и лежит в ^^ости кривой 7/, содержащей нормальный вектор поверх-Л’ который тоже °Ртогонален касательному вектору вой« Поэтому два вектора 1// и п коллинеарны. Задав на по-ерхности внутренние координаты, мы тем самым однозначно оП редел им и выбор единичного нормального вектора к поверхности в каждой ее регулярной точке.
Если кривая 7 на поверхности S не является нормальным сечением, то ее кривизну можно вычислить через нормальную кривизну в направлении касательного вектора кривой 7.
Теорема 8.8. Пусть 7 — гладкая кривая, лежащая на регулярной поверхности S, имеющая в точке Р единичный касательный вектор т, главный нормальный вектор 1/ и кривизну k. Тогда для нормальной кривизны kn поверхности S в точке Р в направлении т верна формула
kn = Q(t) = knQv,
где п° — единичный нормальный вектор к поверхности S в точке Р.
◄ В качестве параметра кривой 7 выберем натуральный параметр 8 этой кривой, и пусть точке Р соответствует значение so параметра s. Тогда из теории кривых [II] имеем г'($о) = т.
= kv. По определению значение Q(r) второй квадратичной формы поверхности S на векторе т равно проекции вектора на направление вектора п°. Отсюда с учетом единичной длины п° получаем
Q(t) =	= kvri°.
В частном случае, когда кривая 7 является нормальным Учением, мы имеем ту же формулу, но при этом единичные Некторы I/ и п° коллинеарны, т.е. их скалярное произведение Равно ±1. Знак этого скалярного произведения совпадает
226 8. ГЕОМЕТРИЯ ПОВЕРХНОСТЕЙ
со знаком нормальной кривизны. Поэтому для нормального сечения
Q(t) = |fcn|^n° = kn. ►
Теорема 8.9. Кривизна кривой 7, лежащей на поверхности
S, в точке Р может быть вычислена по формуле Менъе*
cost?’
где kn — нормальная кривизна поверхности S в точке Р в направлении касательного вектора кривой 7 в этой точке, а х) — угол между главным нормальным вектором 7 и нормальным вектором к поверхности в точке Р.
4 Согласно теореме 8.8, имеем равенство
t/n° ’
где у — главный нормальный вектор кривой 7 в точке Р. Так как векторы у и п° являются единичными, то t/n° =cosi?. Подставляя это соотношение в формулу, получаем утверждение теоремы. ►
Замечание 8.6. И главный нормальный вектор у кривой 7 в точке Р, и нормальный вектор п° к поверхности в этой же точке ортогональны касательному вектору кривой т
Рис. 8.13
(рис. 8.13). Поэтому угол *0 между векторами у и п° — это угол между соприкасающейся плоскостью кривой 7 в точке Р и плоскостью нормального сечения поверхности S в этой же точнедействительно, соприкасающаяся плоскость параллельна касательному и главному нормальному векторам кривой, а плоскость
Ж. Менье (1754-1793) — французский математик.
8.6. Нормальная кривизна поверхности
227
сального сечения параллельна тому же касательному век-кривой и нормальному вектору плоскости. Отметим, что плоскости задают два смежных угла, один острый, другой ТУПОЙ* Угол межДУ векторами и и п° равен одному из вух углов. Заменяя угол $ в формуле Менье острым углом меЖДУ плоскостью нормального сечения поверхности и соприкасающейся плоскостью кривой, получаем формулу Менье
в следующем виде:
k=
cost?
Теорема 8.10. Нормальная кривизна kn поверхности S в точке Р в направлении вектора I касательной плоскости к поверхности S может быть вычислена по формуле
_ La2 + 2Ma(3 + N02 n “ Ea2 + 2Fa0 + G02 ’
(8.22)
где a, 0 — координаты вектора l в базисе ru, rv, a E, F, G И L, M, N — коэффициенты соответственно первой и второй квадратичных форм поверхности S.
◄ Обозначим через т единичный вектор с тем же направлением, что и вектор I:
I т-|/Г
Согласно теореме 8.8, учитывая свойства квадратичных форм [IV], получаем
I \ _ Q(l)
IV RP ’
fcn = Q(r) = Q
Так как |/|2 = /(/) — значение первой квадратичной формы на Векторе /, приходим к формуле (8.22). ►
228
8. ГЕОМЕТРИЯ ПОВЕРХНОСТЕЙ
8.7.	Главные направления и главные кривизны поверхности
Теорема 8.11. В регулярной точке поверхности нормаль* ная кривизна достигает своего наименьшего и наибольшего значений.
◄ В регулярной точке Р поверхности S нормальная кривизна кп в направлении вектора Z, согласно формуле (8.22), равна кп = Q(l)/I(l). Из определения следует, что нормальная кривизна не зависит от длины вектора I. Поэтому нормальные кривизны можно вычислять, предполагая, что I — единичный вектор. Тогда 1(1) = 1 и kn = Q(l). Вторая квадратичная форма Q, как непрерывная функция, достигает на замкнутом ограниченном множестве {/€ R2: |/| = 1} наибольшего и наименьшего значений (см. теорему 1.10). ►
Замечание 8.7. Нетрудно показать, что произвольная квадратичная форма Ф(х,у) = Ах2 + 2Вху + Су2 на единичной окружности х2 + у2 = 1 либо постоянна, либо имеет ровно два максимума, достигаемых в симметричных точках окружности, и ровно два минимума, также достигаемых в противоположных точках окружности. Значит, и вторая квадратичная форма Q(l) либо постоянна на множестве 1(1) = |l| = 1, либо имеет два максимума и два минимума, достигаемых на противоположных векторах. Следовательно, в данной точке поверхности либо нормальная кривизна одинакова во всех направлениях, либо существуют два направления, в первом из которых она достигает наименьшего значения, а во втором — наибольшего значения.
Регулярную точку поверхности, в которой нормальная кривизна имеет одно и то же значение в любом направлении, называют омбилической (или точкой округления). Остальные точки будем называть неомбилическими. Наибольшее и наименьшее значения к\ и нормальной кривизны в данной точке называют главными кривизнами поверхности в этой точке. В омбилической точке к\ = kt. В неомбилической точке
3.7. Главные направления и главные кривизны поверхности 229
hi и направления, в которых нормальная кривизна до-сТигает своих наибольшего и наименьшего значений, называют ззавкылси направлениями в данной точке.
Следствие 8.1. В неомбилической точке поверхности существуют ровно два главных направления, причем эти направления взаимно перпендикулярны.
4 О том, что в неомбилической точке ровно два главных направления, уже сказано выше (см. замечание 8.7). Отметим, что первая квадратичная форма представляет собой квадрат длины вектора в касательной плоскости, а потому в любом ортонорм и рован ном базисе на касательной плоскости имеет канонический вид: /(?,<?) = р2+ <72. Вторая квадратичная форма определена также в линейном пространстве векторов касательной плоскости. В этой плоскости существует такой ортонорми-рованный базис, в котором вторая квадратичная форма имеет канонический вид: Q(p,q) = Aip2 + ^q2, где А] и А2 — собственные числа матрицы второй квадратичной формы. Нетрудно показать, применяя необходимое условие условного экстремума, что А] и А2 дают наибольшее и наименьшее значения функции Q(p,q) при условии I(p,q) = 1, т.е. являются главными кривизнами поверхности в рассматриваемой точке. Соответствующие главные направления определяются векторами орто-нормированного базиса и поэтому перпендикулярны. ►
В омбилической точке поверхности будем называть главными любые два взаимно перпендикулярные направления. Кривую на поверхности, в каждой точке которой направление касательной совпадает с главным направлением на поверхности в этой точке, называют линией кривизны.
Теорема 8.12. Главные кривизны поверхности S в регулярной точке Р являются корнями уравнения
L-kE M-kF
М-kF N-kG
= 0,
(8.23)
230 8. ГЕОМЕТРИЯ ПОВЕРХНОСТЕЙ
где Е, F, G — коэффициенты первой, a L, М, N — ка*Ффц циенты второй квадратичных форм поверхности в точке р Координаты си, 0 в базисе ru, rv вектора главного направлю ния со значением главной кривизны k{ удовлетворяют систем^ линейных алгебраических уравнений
' (L-kiE)a + (M-ktF)0 = O, \ (М - kiF)a + (ЛГ - kiG)(3 = 0.
(8-24)
◄ Отметим, что однородная квадратная система линейных алгебраических уравнений имеет ненулевое решение в том и только в том случае, когда матрица системы является вырожденной. Поэтому, если координаты о и 0 вектора главного направления удовлетворяют системе (8.24), то выполняется и равенство (8.23). Следовательно, достаточно доказать, что координаты о и 0 вектора главного направления являются решением системы (8.24).
Главные направления можно искать как точки условного экстремума функции Q(l) при условии 1(1) = 1 (см. доказательство теоремы 8.11 и замечание 8.7). Функция Лагранжа в этой задаче на условный экстремум имеет вид
£(«,£, А) = Q(a,f}) - Х(Ца,0) - 1) =
= (L - АЕ)а2 + 2(М - XF)a0 + (N - AG)/32 + А,
где а и 0 — координаты вектора I. Применяя необходимое условие условного экстремума, получим систему уравнений
I(L-XE)a + (M-XF)0 = O, (М -XF)a+(N-XG)0 = Q,	(8.25)
Ea2 + 2Fot0 + G02 = 1,
в которой первые два уравнения повторяют уравнения системы (8.24) с заменой ki на множитель Лагранжа Л. Пусть найден0 решение этой системы о, 0, А. При подстановке этих значении
8.7. Главные направления и главные кривизны поверхности 231
^систему все три уравнения превращаются в тождество. Умно-^иМ первое уравнение на а, второе уравнение на (3 и сложим, долучим
(L - XE)a2 + 2(М - XF)a/i + (N - AG)/?2 = О,
La2 + 2Ма/? + N02 = Х(Еа2 + 2Fa0 + G02).
Значит,
La2 + 2Ма0 + /V/?2
Еа2 + 2Fafi + G/?2 ’
т.е. множитель Лагранжа Л, согласно теореме 8.10, совпадает <с нормальной кривизной kn поверхности, соответствующей направлению I с координатами а и (3. Условие А = kn означает, что первые два уравнения системы (8.25) совпадают с уравнениями системы (8.24), т.е. значения а и /?, соответствующие главной кривизне fc,, удовлетворяют системе (8.24). ►
Теорема 8.13. Координатные функции u(t) и v(t) линии кривизны на поверхности удовлетворяют дифференциальному
уравнению
dv2 Е L
-dudv du2
F	G
M	N
(8.26)
где E, F, G — коэффициенты первой, a L, Af, N — коэффициенты второй квадратичных форм поверхности.
Внутренние координаты а и /3 вектора, определяющего главное направление, удовлетворяют системе (8.24). Выразим ki из первого и второго уравнений этой системы. В результате Получим
_ La + Mfi _ Ma + N/3
1 = Ea + F0 “ Fa + G/3 ’ откуда
(LF - МЕ)а2 + (LG - NE)a0 + (MG- NF)/32 = 0.
232
8. ГЕОМЕТРИЯ ПОВЕРХНОСТЕЙ
Если функции u(t) и v(t) задают линию кривизны, то дЛя любого значения t в точке с координатами n(t), v(t) значоцця a = u'(f), 0 = v'(t) определяют главное направление. Значит для всех значений t выполняется равенство
(LF-М E)(u'(t))2+(LG-N E)u'(t)v'(t) + (MG - N F)(v'(t))2
которое после умножения на dt2 сводится к следующему:
(LF-ME)du2 + {LG-NE)dudv+{MG-NF)dv2 = 0.
Нетрудно убедиться в том, что это же уравнение получается и после раскрытия определителя в соотношении (8.26). ►
На регулярной поверхности S, заданной гомеоморфизмом Ф(м,и), (и, v) € U С R2, определены два семейства кривых и = = Ci и v = C2, где С\ и С-2 постоянные. Эти семейства покрывают всю поверхность S, причем через каждую точку проходит в точности одна кривая каждого семейства. Указанные семейства кривых называют сетью координатных линий. Если координаты u, и введены так, что каждая координатная линия и = const или и = const является линией кривизны, то эти координаты называют главными. Можно показать*, что главные координаты существуют в окрестности любой точки, не являющейся омбилической точкой.
Теорема 8.14. Пусть на регулярной поверхности S заданы главные координаты и, и. Тогда в неомбилических точках F = О, М = 0, а числа
,	L	t N	,о
*1 = 7;, ki=—	(8.2i)
Cj	О
есть главные кривизны в направлениях ги и rv соответственно.
◄ Рассмотрим произвольную точку поверхности. В этой точке вектор ги касается координатной линии и = const и поэтому
’См.: Позняк Э.Г., Шикин Е.В.
8.7. Главные направления и главные кривизны поверхности 233
ПреДеляет главное направление. Подставляя его координаты
1, /3 = 0 в систему (8.24) и заменяя ki на &i, получаем
уравнения
£-^£ = 0, M-fciF = 0.
(8.28)
диалогично для координатной линии it = const получаем уравнения
M-A:2F = 0, N-k2G = 0.	(8.29)
вычитая второе уравнение (8.28) из первого уравнения (8.29), приходим к равенству (&i -Ar2)F = O. В неомбилической точке
к2. Значит, в такой точке F = 0, а потому и М = 0.
Так как F = 0, первая квадратичная форма 1 имеет вид / = Edu2 + Gdv2. Поскольку эта квадратичная форма положительно определена в любой точке, заключаем, что Е > 0 и G > 0. Из первого уравнения (8.28) и второго уравнения (8.29) получаем соотношения (8.27). ►
Итак, в главных координатах первая и вторая квадратичные формы имеют наиболее простой вид (F = 0, М = 0). Главные координаты имеют и другие интересные свойства.
Теорема 8.15 (теорема Родрига*). Пусть на регулярной поверхности S заданы главные координаты it. v. Если п(и,и) — единичный нормальный вектор поверхности S в точке с внутренними координатами и, v, a ky и k2 — главные кривизны в направлениях ги и rv соответственно, то в произвольной неомбилической точке
п'и = -kyru, n'v = -k2rv.
Если вектор-функция f(t) удовлетворяет условию 1/(01 = Ь Или f2(t) = 1, то, дифференцируя скалярный квадрат f2(t), Случаем
2/(i)/'(t)=0,
*Б.О. Родриг (1794-1851) — французский математик.
234
8. ГЕОМЕТРИЯ ПОВЕРХНОСТЕЙ
т.е. при произвольном значении t вектор f(t) ортогон аде вектору f(t). В данном случае |n(u,v)| = 1. Следователь^ частные производные п'п и n'v ортогональны п, а параллельны касательной плоскости и представляются
п°тоМу в вИдР
линейной комбинации векторов ги и rv:
n'u = aru + brv, n'v = cru + drv.	(8.30)
Умножая оба равенства (8.30) скалярно на ги и rv и учитывая формулы для коэффициентов первой квадратичной формы, получаем
n'uru = аЕ + bF, n'vru = сЕ + dF, n'urv = aF + bG, n'vrv=cF + dG.
Поскольку и, v — главные координаты, то F = 0, так что
n'uru — aE, n,vru = cE, n'urv = bG, n'vrv = dG. (8.31)
Дифференцируя тождества гип = 0, rvn = 0 по переменным и и и, получаем
ГиПи + гииП = $,
Tvn'u + rvun = 0,
ru< + rttvn = 0, rvn'v + rvvn = 0,
откуда, учитывая замечание 8.4 и равенство М = 0, верное в главных координатах, находим
run'u = -L, rvn'u = run'v = 0, rvn'v = -N.	(8.32)
Из равенств (8.32) и (8.31) заключаем, что 6 = с = 0, так
как коэффициенты Е и G первой квадратичной формы, являю-
щейся положительно определенной, не обращаются в нуль.
равенств (8.32) и (8.31) также получаем, что а = d = -
Е
Из
Л'
—•
G
Отсюда и из формул (8.27) следует, что а = -к\, d = -къ. ПоД
ставляя найденные выражения для 6, с, а и d в (8.30), получаем
утверждение теоремы. ►
Д.8.1. Внутренняя и внешняя геометрии поверхности 235
Дополнение 8.1. Внутренняя и внешняя геометрии поверхности
До сих пор обсуждение геометрии поверхностей касалось свойств поверхности в окрестности фиксированной точки, ее локальных свойств. Совокупность локальных свойств поверхности часто называют геометрией поверхности в малом. Свойства же поверхности, характеризующие поверхность как единое целое, составляют геометрию поверхности в целом.
В данном параграфе остановимся на геометрии поверхности в целом. В отличие от геометрии в малом геометрия в целом разработана гораздо меньше, и результаты в этом направлении достигаются лишь с помощью достаточно сложных методов. Наше изложение ориентировано на первое знакомство с основными понятиями и методами геометрии в целом и дано кратко. Более детально с проблематикой этого направления можно познакомиться в специальной литературе, ссылки на которую приведены в тексте.
Начнем с разделения геометрии поверхности на две части: внутреннюю и внешнюю геометрии.
Пусть Р\ и Р2 — точки поверхности S. Расстоянием по поверхности между точками Pi и Р2 называют наименьшую из длин кривых, лежащих на поверхности S и имеющих концы в точках Р\ и Р2. Изгибанием поверхности называют такое ее отображение в другую поверхность, при котором не изменяются расстояния по поверхности между любыми двумя ее точками. Иначе говоря, изгибание — это деформация поверхности без сжатий и растяжений.
Внутренней геометрией поверхности называют совокупность геометрических свойств поверхности, сохраняющихся при ее изгибаниях. Например, внутреннюю геометрию плоскости изучает планиметрия.
У разных поверхностей внутренняя геометрия различна. Например, можно ввести понятие окружности на поверхности, имея в виду геометрическое место точек поверхности,
236
8. ГЕОМЕТРИЯ ПОВЕРХНОСТЕЙ
отстоящих от фиксированной точки на одно и то же расстоя ние по поверхности. Окружность на сфере радиуса R являетСя окружностью в общепринятом смысле, но длина окружности радиуса г на плоскости равна 2тгг, а длина окружности тог0 же радиуса на сфере — 2?r/?sin причем должно выполняться условие г 7гЯ.
Длины кривых на поверхности вычисляются при помощи ее первой квадратичной формы, потому что первая квадратичная форма совпадает с квадратом дифференциала длины дуги кривой. Следовательно, первая квадратичная форма однозначно определяет внутреннюю геометрию поверхности. Действительно, пусть на поверхностях Si и S2 существуют внутренние координаты, в которых их первые квадратичные формы совпадают. Это предполагает, что поверхности Si и S2 можно задать гомеоморфизмами Ф: U —> Si и Ф1: U —> S2, определенными в одной области U С R2. Если первые квадратичные формы Z1 и I2 поверхностей в этих координатах совпадают, т.е.
Zi = /2 = E(u,v)du2+ 2F(u,v)dudv + G(u,v)dv2, (и, v) 6 U,
то отображение Ф1 оф”1: Si —> S2 отображает точку поверхности Si с координатами и, и в точку поверхности S2 с теми же координатами и, v. Кривой 71 на поверхности Si будет соответствовать кривая 72 на поверхности S2 той же длины, так как для вычисления длины этих кривых используется идентичное представление их в координатах и, v и одна и та же первая квадратичная форма. Следовательно, две поверхности с одинаковыми первыми квадратичными формами имеют одинаковые внутренние геометрии.
С другой стороны, изгибания сохраняют длины дуг, а значит, длины касательных векторов к кривым на поверхности-Квадрат длины касательного вектора к поверхности равен значению первой квадратичной формы на этом векторе. Следовательно, первая квадратичная форма не изменяется при изгибаниях и является понятием внутренней геометрии поверхности-
Д.8.1. Внутренняя и внешняя геометрии поверхности 237
образом, все геометрические факты о поверхности, ко-и'ОрЫ® можно получить при помощи ее первой квадратичной аппМЫ» и только они, составляют внутреннюю геометрию поверхности. Внутренняя геометрия поверхности составляет то, ч1Го можно изучать без выхода с поверхности в объемлющее пространство, и для этого достаточно знать только первую квадратичную форму поверхности.
Свойства поверхности, связанные с взаимным расположением ее частей в объемлющем пространстве, называют внешней геометрией поверхности. К внешней геометрии относят pee свойства поверхности, которые не изучаются в рамках внутренней геометрии, в частности искривленность поверхности.
Остановимся теперь на понятиях, которые характеризуют поверхность.
Теорема 8.16*. Поверхность однозначно определяется своими первой и второй квадратичными формами. Точнее, если на двух поверхностях можно выбрать координаты, в которых первая и вторая квадратичные формы первой поверхности совпадают соответственно с первой и второй квадратичными формами второй поверхности, то эти две поверхности можно совместить движением пространства. #
Так как внутренняя геометрия поверхности определяется первой квадратичной формой, то, согласно приведенной теореме, внешняя геометрия определяется второй квадратичной формой.
Пример 8.13. Сворачивание плоскости в цилиндр является изгибанием. Таким образом, плоскость и цилиндр имеют Одинаковые внутренние геометрии (см. примеры 8.7 и 8.8). Внешние геометрии плоскости и цилиндра различны, так как эТи поверхности нельзя совместить движением. Это следует из
’Это утверждение вытекает из более общей теоремы, доказанной в ^Нйге: Позняк Э.Г., Шикин Е.В. (теорема 4 из §6 главы 2).
238
8. ГЕОМЕТРИЯ ПОВЕРХНОСТЕЙ
того, что у плоскости и цилиндра разные вторые квадратичны^ формы (см. примеры 8.9 и 8.10). #
Коэффициенты первой и второй квадратичных форм опре_ деляют поверхность, но не являются произвольными функции ми координат на поверхности. Для того чтобы функции Е, р G, L, М, N переменных и и v были коэффициентами первой и второй квадратичных форм некоторой регулярной поверхно-сти с внутренними координатами и и и, необходимо, чтобы они удовлетворяли трем дифференциальным, уравнениям*, называемым уравнениями Кодацци — Гаусса**.
Значения коэффициентов первой и второй квадратичных форм в точке меняются при переходе к новым координатам, т.е. эти коэффициенты не являются функциями точки поверхности. В геометрии более удобно использовать инвариантные функции, значения которых в каждой точке не зависят от выбора системы координат. Инвариантные функции характеризуют собственно геометрический объект (в данном случае поверхность), а не его представление в данной системе координат. Такими инвариантными функциями являются гауссова (или полная) кривизна, равная произведению главных кривизн K = k\k2, и средняя кривизна, равная полусумме главных кривизн Н = |(&i 4- &2).
Теорема 8.17. Гауссова и средняя кривизны поверхности выражаются через коэффициенты первой и второй квадратичных форм следующим образом:
LZV-M2	1EN-2FM + GL
~ EG-F2' “2 EG - F2 ' #
*См.: Позняк Э.Г., Шикин Е.В.
**Д. Кодацци (1824-1873) — итальянский математик. К.Ф. Гаусс (1777-1855) — выдающийся немецкий математик, труды которого оказали большое влияние на развитие алгебры, теории чисел, дифференциальной ге0' метрии. Ему принадлежат также фундаментальные исследования в астр0' номии и геодезии.
Д.8.1. Внутренняя и внешняя геометрии поверхности
239
Теорема 8.18. Тип точки поверхности определяется знаком гауссовой кривизны:
1)	в эллиптических точках поверхности К > 0;
2)	в гиперболических точках поверхности К < 0;
3)	в параболических точках поверхности и точках уплоще-
Поверхность является плоскостью в том и только в том случае, когда во всех точках поверхности К = 0 и Н = 0. #.
Кривую 7, лежащую на поверхности 5, называют геодезической линией, если главная нормаль кривой у в каждой точке, где кривизна кривой отлична от нуля, совпадает с нормалью поверхности S в этой точке.
Можно доказать следующие два важнейших свойства геодезических*.
1. Экстремальное свойство геодезических: через любые достаточно близкие точки Р\ и Р^ поверхности S проходит геодезическая линия, ее длина является наименьшей среди длин спрямляемых кривых, лежащих на поверхности S и соединяющих точки Р\ и Ръ.
2. Существование и единственность геодезических: через любую точку регулярной поверхности в любом направлении проходит геодезическая, и при том только одна.
Пример 8.14. Геодезические линии плоскости — прямые, геодезические линии сферы — окружности ее больших кругов. #
К внешней геометрии поверхности относятся понятия соприкасающегося параболоида, нормального сечения, нормаль-кривизны, главных кривизн, главных направлений, главных координат и средней кривизны. Интересно, что главные кривизны ki и &2 являются понятиями внешней геометрии, а их
Доказательство этих свойств, а также другие факты о геодезических ^°Жно найти, например, в книге: Позняк Э.Г., Шикин Е.В.
240
8. ГЕОМЕТРИЯ ПОВЕРХНОСТЕЙ
произведение (гауссовакривизна) есть понятие внутренней метрии, так как это произведение не меняется при изгибами^ Это следует из уравнений Кодацци — Гаусса *.
Геометрия поверхностей находит свое применение в разлив ных приложениях, например в теории минимальных поверх^ стей и в теории оболочек.
Пусть сосуд заполнен двумя не перемешивающимися жид. костями. Так как жидкости не перемешиваются, то определена граница раздела жидкостей. Предположим, что система находится в равновесии. Тогда границу раздела жидкостей можно представить как двумерную поверхность. Поверхность разде. ла возникает также в системе „жидкость — газ“ (например, в случае капли жидкости в газовой среде или газового пузырька в жидкой среде).
Условие равновесия системы из двух сред (двух жидкостей или жидкости и газа) накладывает сильное ограничение на геометрию поверхности S раздела этих сред. Согласно закону Лапласа**, разность давления р\ с вогнутой стороны поверхности S и давления р% с выпуклой стороны этой поверхности связана со средней кривизной Н поверхности S равенством Р\ — Pi = 2о7/, где ст — поверхностное натяжение на границе раздела сред**ж.
Итак, средняя кривизна границы раздела двух сред постоянна. Рассмотрим два случая: 1) средняя кривизна равна нулю; 2) средняя кривизна отлична от нуля. Оба случая хорошо моделируются в опыте с мыльными пленками. Возьмем водный мыльный раствор, опустим в него замкнутый проволочный контур и извлечем его обратно. Тогда на контуре повиснет мыльная пленка. Ее можно трактовать как границу раздел»
*См.: Позняк Э.Г., Шикин Е.В.
**П.С. Лаплас (1749-1827) — выдающийся французский астроном. Ф11' зик, математик. Основные труды по небесной механике, математике математической физике.
”*См., например: Фоменко А.Т.
Д.8.1. Внутренняя и внешняя геометрии поверхности
241
газовых сред с одинаковыми постоянными давлениями р] Это Дает реализацию первого случая.
Второй случай можно реализовать так. Опустим в мыльный аствор тонкую трубку и выдуем через нее мыльный пузырь. qh оторвется от трубки и начнет плавно падать, приобретая форму сферы. Здесь мы имеем две среды: внутренний объем вОздуха с давлением р\ и внешний объем воздуха с давлением р2. Ясно, что р\ > р2, а система находится в равновесии благодаря тому» нто силы поверхностного натяжения на мыльной пленке компенсируют избыток внутреннего давления по сравнению с внешним. В этом случае средняя кривизна отлична от нуля.
Поверхность, которая в каждой своей точке имеет нулевую среднюю кривизну, называют минимальной поверхностью. Такое название объясняет следующая теорема.
Теорема 8.19. Если поверхность S минимальна, то существует такое число € > 0, что любая поверхность Si, отличающаяся от S лишь в е-окрестности какой-либо точки пространства, имеет площадь, превышающую площадь S. #
Примером минимальной поверхности является плоскость. Укажем еще две минимальные поверхности.
Пример 8.15. В результате вращения вокруг оси Ох Цепной линии у = ach(x/a) образуется поверхность вращения, называемая катеноидом (рис. 8.14). Эта поверхность является Минимальной.
Пример 8.16. Рассмотрим в пространстве две прямые и ^2» пересекающиеся под прямым углом. Фиксируем прямую а прямую /2 будем перемещать вдоль /1 с постоянной скоростью ц, одновременно вращая вокруг прямой /1 с постоянной Угловой скоростью и. Возникающее при этом винтовое движение прямой /2 образует поверхность, называемую прямым *е*икоидом (рис. 8.15). Эта поверхность также является минимальной.
242
8. ГЕОМЕТРИЯ ПОВЕРХНОСТЕЙ
Рис. 8.14
Поскольку теория минимальных поверхностей теснейшим образом связана с изучением границ раздела физических сред, оптимальных форм мембран и пр., то она находится в центре постоянного внимания огромного числа исследователей*.
Еще одно приложение геометрия поверхностей находит в теории оболочек**. Оболочка — это тело, состоящее из отрезков одинаковой длины, средняя точка которых лежит на заданной регулярной поверхности 5, при этом каждый такой отрезок перпендикулярен этой поверхности. Поверхность S называют срединной поверхностью оболочки, а отрезки — прямолинейными элементами оболочки. Согласно гипотезе Кирхгофа —Ллва***, при деформировании оболочки прямолинейные элементы остаются прямолинейными и нормальными к деформированной срединной поверхности, а также сохраняют свою длину.
Анализ деформации оболочки в предположении, что верна гипотеза Кирхгофа — Лява, сводится к изучению деформации срединной поверхности. При этом все функции, характеризу' ющие деформацию, оказываются функциями двух переменных.
*См.: Фоменко А.Т.
"См.: Филин А.П.
***Г.Р. Кирхгоф (1824-1887) — выдающийся немецкий физик. А. (1863-1940) — английский механик.
Вопросы и задачи
243
V/гобно взять в качестве этих переменных главные координаты ёдинной поверхности до ее деформирования. Вид деформи-Соранной срединной поверхности определяется шестью функ-циЯЦИ, связанными тремя дифференциальными уравнениями, ^пример, в качестве шести функций можно взять коэффициенты первой и второй квадратичных форм, а в качестве дифференциальных уравнений — уравнения Кодацци — Гаусса.
Гипотеза Кирхгофа — Лява верна, как правило, для тонкостенных конструкций. Поэтому теорию оболочек используют в машиностроении (корпуса машин, улитки турбин), приборостроении (мембраны, тарельчатые пружины), строительстве (покрытия, перекрытия и козырьки), кораблестроении (корпу-сасудов), авиастроении (фюзеляжи и крылья самолетов) и т.п.
Вопросы и задачи
8.1.	Составьте уравнения касательной плоскости и нормали к прямому геликоиду (см. пример 8.16) в его произвольной точке.
8^2. Покажите, что прямой геликоид (см. пример 8.16) и катеноид (см. пример 8.15) локально изометричны.
8.3.	На геликоиде
£ = vcosu, у = vsinu, z = и
задан криволинейный треугольник 0 v shu, 0 u uq. Найдите: а) площадь этого треугольника; б) длины его сторон; в) углы этого треугольника.
8.4.	Найдите первую квадратичную форму эллипсоида вращения
я2 У2 + z2 _
а2 + 62
8.5.	Пусть /(») и <р(®) — квадратичные формы. Докажи-Tei что если квадратичная форма <^(®), х € К”, положительно
244 8. ГЕОМЕТРИЯ ПОВЕРХНОСТЕЙ
определена, то квадратичная форма f(&) либо постоянная множестве = 1, либо имеет на этом множестве ровно условных локальных максимума, достигаемых на противопо. ложных векторах, и ровно два минимума, также достигаемых на противоположных векторах.
8.6.	Покажите, что у треугольника на сфере, составленного из дуг больших окружностей, сумма углов больше 2тг.
8.7.	Поверхность образована вращением вокруг оси Ог кривой х = f(u) >0, у = 0, z = д(и) . Для этой поверхности найдите: а) первую и вторую квадратичные формы; б) главные координаты; в) регулярные, эллиптические, гиперболические и параболические точки.
8.8.	Решите предыдущую задачу, если:
а)	поверхность получается перемещением кривой г = f(u) в направлении вектора а;
б)	поверхность образована касательными к кривой г = /(и).
Найдите в главных координатах первую и вторую квадратичные формы для этих поверхностей, а также гауссову кривизну.
8.9.	Тором называют поверхность, образованную вращением окружности радиуса а с центром в точке (6; 0) (Ь > а) плоскости хОу вокруг оси Оу. Вычислите площадь поверхности тора.
8.10.	Найдите уравнение кривой на сфере, которая пересекает все меридианы под заданным углом а. Используйте сферические координаты.
8.11.	Выведите для второй квадратичной формы поверхности формулу, аналогичную формуле (8.10).
8.12.	Выразите гауссову и среднюю кривизны поверхности, образованной касательными к некоторой кривой, через кривиз-ну и кручение этой кривой.
Вопросы и задачи
245
8.13.	Найдите гауссову и среднюю кривизны поверхности /(«)+?(!/)•
8.14.	Поверхность образована касательными к кривой г = f(u) с кривизной к(и). Докажите, что если изгибать кривую с сохра*нением k(u), то поверхность будет изгибаться с сохранением первой квадратичной формы.
8.15.	Докажите, что длина окружности радиуса г на сфере радиуса Я, г тгЯ, равна 2тгjRsin
8.16.	Выведите формулы теоремы 8.17 из уравнения (8.23), используя теорему Виета о коэффициентах квадратного уравнения.
8.17.	Докажите теорему 8.18.
8.18.	Покажите, что все точки минимальной поверхности являются гиперболическими или точками уплощения.
8.19.	Докажите, что плоскость, катеноид (см. пример 8.15) И прямой геликоид (см. пример 8.16) являются минимальными поверхностями. Для удобства вычислений на геликоиде введите „полярные координаты
8.20.	Запишите уравнения касательной плоскости и соприкасающегося параболоида поверхности х = ch u cos и, у = = chusin ц, z = shu в точке (о,	5).
8.21.	Составьте уравнения катеноида — поверхности, образованной вращением цепной линии z = ach(a?/a) вокруг оси Ох. Найдите уравнения касательной плоскости, нормали к этой поверхности в точке I 0, -^=, --ys I, а также уравнение сопри-Касающегося параболоида,
8.22.	Поверхность образована касательными к некоторой Пространственной кривой 7. Докажите, что во всех точках Фиксированной касательной к кривой 7 эта поверхность имеет °Дйу и ту же касательную плоскость.
246 8. ГЕОМЕТРИЯ ПОВЕРХНОСТЕЙ
8.23.	Докажите, что нормаль поверхности вращения совПа дает с главной нормалью меридиана и пересекает ось вращения
8.24.	Для поверхности, образованной главными нормалями данной кривой, вычислите: а) первую квадратичную форму поверхности; б) гауссову и среднюю кривизны.
8.25.	Найдите гауссову и среднюю кривизны поверхности образованной бинормалями данной кривой.
8.26.	Первая квадратичная форма поверхности имеет вид ds2 = du2 + (1 + u2) dv2. Найдите:
а)	периметр криволинейного треугольника, образованного пересечением кривых и = и2/2, и = — v2/2, v = 1;
б)	углы этого криволинейного треугольника;
в)	площадь криволинейного треугольника, образованного пересечением кривых и = и, и = —v, v = 1.
8.27.	Найдите угол между координатными линиями поверхности.
8.28.	Для поверхности
х = (а 4-6 cos v) cos и , у = (а + 6cosv)sin u, s = 6sinu
вычислите в произвольной точке вторую квадратичную форму, главные направления и главные кривизны, гауссову и среднюю кривизны, определите типы точек поверхности.
8.29.	Для поверхности из задачи 8.28 определите нормальную кривизну в точке (а 4-6, 0, 0) в направлении 1= (I, 2).
8.30.	Пусть Н — средняя кривизна поверхности S в точке Р, k(ip) — нормальная кривизна поверхности S в точке Р в направлении, которое составляет угол у? с фиксированным касательным вектором I. Докажите формулы:
2 я
а) Н =	k(<p)d<p; б) Н =	4-+
о
9.	ЧИСЛЕННЫЕ МЕТОДЫ РЕШЕНИЯ СИСТЕМ НЕЛИНЕЙНЫХ УРАВНЕНИЙ
На практике часто встречается задача решения системы й3 п нелинейных уравнений с п неизвестными (нелинейной системы):
/1 (*^1 >• • • 1 *£п) —О»
=0,	м
fn(%\ 1 ®2? • • •, ®п) — 0*
Эта система не всегда имеет точное аналитическое решение, а если и имеет, то это решение может выражаться слишком громоздкими формулами. В таких случаях ставят задачу приближенного решения системы с использованием одного из известных численных методов.
Функции fi в левых частях уравнений системы (9.1) удобно рассматривать как координатные функции векторной функции многих переменных F(x) = (f\(x) ... /п(я)) . Тогда задача сводится к отысканию таких точек х Е Rn, для которых F(x) = 0. т.е. нулей векторной функции. В этой главе из соображений удобства мы будем элементы Rn обозначать полужирным курсивом и писать х вместо z, а функции многих переменных мы будем называть отображениями, допуская тем самым такие словосочетания, как непрерывное отображение, дифференцируемое отображение и т.п. Далее будем предполагать, Ито отображение F, определяющее систему нелинейных уравнений, непрерывно в своей области определения.
248
9. ЧИСЛЕННЫЕ МЕТОДЫ
9.1.	Итерационные методы решения
Многие численные методы решения нелинейных систем я в-ляются итерационными (ср. [IV]). Процесс вычисления решения представляет собой построение некоторой итерационной следовательности сходящейся к решению х* системы, В качестве приближенного решения выбирают один из элементов этой последовательности, достаточно близкий к точному решению Сходимость последовательности элементов линейного арифметического пространства рассматривают относительно какой-либо нормы, заданной в этом пространстве. Далее будем предполагать, что в качестве такой нормы выбрана евклидова норма ||-|| в Rn.
Применение k-шагового итерационного метода сводится к решению трех задач:
1)	выбору к начальных приближений х°, ..., хк~х;
2)	построению последовательности, в которой каждый очередной элемент определяется исходя из к предыдущих членов последовательности;
3)	выбору критериев останова, по которым можно решить, является ли последний вычисленный элемент итерационной последовательности приемлемым приближением точного решения.
Решение нелинейной системы — сложная задача. Это проявляется в том, что для ее численного решения нет универсального метода. Любой предложенный метод в некоторых ситуациях будет плохо работать (т.е. приведет к медленно сходящейся итерационной последовательности) или не будет работать вообще. Большое значение для конкретного метода имеет выбор начальных приближений. Одни методы дают сходящуюся итерационную последовательность, если начальные приближения выбраны достаточно близко к неизвестному решению-Такие методы называют локально сходящимися метода-ми. Другие методы дают сходящуюся итерационную последо-
9.1. Итерационные методы решения
249
цельность при произвольном выборе начальных приближений крайней мере, при их выборе в достаточно обширной ^дасти вокруг неизвестного решения. Это глобально схо-д^щиесл методы. Применение локально сходящихся методов 0ПравДывает выс°кая скорость сходимости соответствующей итерационной последовательности. На практике приходится комбинировать оба типа методов. Тот или иной глобально сходящийся метод используют для получения хороших начальных приближений, а затем переходят к применению локально сходящегося метода, чтобы ускорить сходимость итерационной последовател ьности.
Простейшие одношаговые методы можно представить в канонической форме одношагового итерационного мето
да
BN^	+ F(xN) = о,	(9.2)
TN+1
где<ЫВдг+1 /0, iV = 0,1,... Если отображение F(x) имеет вид F(x) = Ах — 6, где А — линейный оператор, b 6 Кп, уравнение (9.2) совпадает с канонической формой одношагового итерационного метода для системы линейных алгебраических уравнений (СЛАУ) [IV]. Конкретный метод определяется выбором матриц Bjv+i и значений итерационного параметра.
Если итерационная последовательность {я^} сходится к некоторому пределу хж, то мы можем в уравнении (9.2) перейти к пределу. В результате получим, что F(x*) = 0, т.е. предел итерационной последовательности является решением системы (9.1).
Разрешая уравнение (9.2) относительно a?v+1, находим
®лг+1 = xN - rN+1BNi+xF(xN).
(9.3)
«Та формула показывает, что построение итерационной после-Аовательности связано с обращением матриц B/v+i- Как и в ^Учае СЛАУ, различают явные итерационные методы,
250
9. ЧИСЛЕННЫЕ МЕТОДЫ
для которых £?дг+1 при любом N совпадает с единичной рицей Е, и неявные итерационные методы, для которц B/v+i Е. Если Вн+\ и тдг+1 на самом деле от N не завися^ то метод — стационарный, иначе — нестационарный.
Обращение матриц может выполняться при помощц некоторого итерационного метода, не связанного с метод0м решения нелинейной системы. В таких случаях следует разди. чать внутренние итерации, реализующие обращение В^^ и внешние итерации, определяющие метод решения нелинейной системы.
Для стационарного итерационного метода (т.е. при 5 = В, t/v+i = т) сходимость итерационной последовательности, построенной согласно уравнению (9.2), может быть установлена, например, в силу принципа сжимающих отображений [1-Д.8.2]. Запишем уравнение (9.3) в виде = S(xN), где S(x) = x-rB~'F(x).
Теорема 9.1. Пусть отображение 5: Rn —> Rn, определенное на множестве
U(а, г) = {х € Rn: ||® - а|| $ г}, а 6 Rn, является сжимающим отображением с постоянной q < 1:
||5(®') - S(x")|| $ дЦ®' - ®"||, х', х" € U(а,г), и, кроме того, удовлетворяет соотношению
||5(а)-аК(1-9)г.	(9.4)
Тогда на множестве U(a,r) существует единственная неподвижная точка отображения S (т.е. решение уравнения х = S(x)), а последовательность {®N}, заданная рекуррентным соотношением ®/v+l = S(xN), при любом начальном приближении х° Е U(а,г) сходится к хж.
◄ Множество U(a,r) замкнуто и поэтому является полный метрическим пространством с метрикой
/’(«,») = II® — »||-
9.1. Итерационные методы решения
251
леем, что отображение S переводит множество U(a,r) в Действительно, для любого х € (7(а,г)
ц5(®) - «|| = ||S(®) - S(a) + 5(a)- а||
115(0,) -5(а)||+||5(а)-аК
^9||a:-a|| + (l-<7)r^gr + (l-9)r=r,
те. вектор S(x) попадает в множество l/(a,r). Согласно принципу сжимающих отображений [1-Д.8.2], отображение S имеет B[7(a,r) единственную неподвижную точку, а из доказательства принципа сжимающих отображений вытекает, что итерационная последовательность при любом начальном приближении ®° € U(а,г) сходится к этой неподвижной точке. ►
Дифференцируемая функция многих переменных S: Rn —>Rn будет сжимающим отображением, если для матрицы Якоби S'(x) в некоторой окрестности точки х* будет выполняться неравенство ||5,(®)|| q < 1 относительно нормы матриц, согласованной с нормой линейного арифметического пространства. Это можно показать, используя следующее утверждение.
Лемма 9.1. Пусть отображение S: Rn —> Rn дифференцируемо в области D С R” и отрезок, соединяющий точки a, b € D, Целиком содержится в D. Тогда на указанном отрезке существует такая точка £, что
||5(Ь) -S(a)K ||5'(4)||||Ь-в||,
гДе ||5,(f)|| — норма матрицы Якоби 5z(f), согласованная с евклидовой нормой в Rn.
При S(b) = 5(a) доказываемое неравенство очевидно. Потому далее будем предполагать, что 5(b)	5(a). Отрезок.
с°единяющий точки а и Ь, можно задать параметрическим Уравнением х = а 4- t(b - a), t Е [0,1]. Выберем произвольный
252
9. ЧИСЛЕННЫЕ МЕТОДЫ
вектор у € Rn. Функция <p(t) = (S(a + t(b - где (., j стандартное скалярное произведение в Rn, представляет со^ действительную функцию одного действительного перемен^ го, которая, как композиция дифференцируемых отображений является дифференцируемой на отрезке [0,1]. Согласно форМу ле конечных приращений,
= <р'(0), <>€(0,1).
Вычислим Производную функции <p(t) как производную СЛОЭ^С. ной функции:
/(t) = (S'(a + t(b-a))(6-a),3/).
Подставляя найденное выражение производной в формулу конечных приращений и используя неравенство Коши — Буня-ковского, находим
|(S(b)-S(a),»)| = М1)-у,(0)| =
= | (S'(f)(Ь - а), у) | ||5'Ю(Ь - а) || ||j/||,
i
где { = а +	- а) — точка на отрезке, соединяющем точки а
и Ь. Так как норма матриц согласована с евклидовой нормой в Rn, то
||SW-a)KI№l| ||Ь-а||.
Поэтому
|(S(b)-5(a),»)|^||S'({)|| ||Ь-«*|| ||»||-
Наконец, учтем, что вектор у был выбран произвольно. Пол»' гая у = S(b) - 5(a), получаем
||S(b) - S(a)||2 sC ||S'(€) || ||6 - a|| ||S(b) - S(o)||,
откуда, сократив на положительный сомножитель ||S(b)~5(a)ll’ приходим к утверждению леммы. ►
9.1. Итерационные методы решения
253
отображение S(x) непрерывно дифференцируемо в естиости неподвижной точки х* и ||5'(Ж*)Н = Яо < 1, то, вы-0 произвольное число q € (go, 1), заключаем, что в некоторой ° минутой окрестности Ц(а?»,е) верно неравенство ||S'(x)|| $ < 1- Согласно лемме 9.1, в U(x*,s) отображение S(x) явля-сжимающим:
||S(«') - S(x")|| $ ||S'(£)|| ||х' - ®"|| с 9II®' - ®"||.
Кроме того, при a = х* верно неравенство (9.4), так как S(x*) = Следовательно, если начальное приближение х° взято из замкнутой окрестности U(х*,е), то итерационная последовательность х^+1 = S(xN), согласно теореме 9.1, будет сходиться к точке х*. Другими словами, условие ||S'(x*)|| < 1 является достаточным для сходимости соответствующего локального метода.
Рассмотрим некоторые из одношаговых итерационных методов.
Метод релаксации. Если в уравнении (9.2)	= Е,
tw+i = т, мы получим метод релаксации. Для этого метода 8(х) = х — tF(x). Метод дает сходящуюся итерационную последовательность при начальном приближении, близком к решению хж, если норма матрицы S'(x*) = Е- rF'fx*) меньше единицы.
Метод Ньютона. В уравнении (9.2) положим Bjv+i = ^F\xN)y tjv+1 = 1. Тогда это уравнение принимает вид
F'(xN)(xN+l - xN) + F(xn) = О
й приводит к методу Ньютона. Левая часть этого уравнения представляет собой значение в точке xN+l линейного приближения функции F(x) в точке xNу а в качестве следующего элемента итерационной последовательности выбирается Нуль линейного приближения.
254
9. ЧИСЛЕННЫЕ МЕТОДЫ
Для использования метода Ньютона необходимо, чтобЬ1 матрица Якоби Г'(а?ж) была невырожденной. Тогда в слу^ непрерывной дифференцируемости отображения F(x) она бу дет невырожденной и в некоторой окрестности решения $ В методе Ньютона S(x) = х- (F'fir))- F(x). Далее показано (см. 9.2), что метод Ньютона при достаточно общих предполо, жениях локально сходится, причем с высокой скоростью.
Метод Бройдена. В этом методе r/v+i = 1, а матрица B/v+i получается из предыдущей матрицы пересчетом по формуле
||ДаЛ2
Bn+i = Вн
где
Axn = xN - a?N-1, &yN = F(xn) - F(xN~l).
Метод требует не одного, а двух начальных значений итерационной последовательности. Второе начальное значение может быть найдено с помощью иного метода.
Метод Бройдена можно рассматривать как обобщение метода секущих, применяемого для решения одного нелинейного уравнения. Действительно, линейная функция L(x) = =	- xN) + F(xn), в которой матрица Б/v+i выбрана
по методу Бройдена, удовлетворяет соотношениям L(xN~x) = = F(xn~x) и L(xn) = F(xn), так как ЦДа^Ц2 = (Д®^)тSxN н
L(a>7V-1) = -BN+i &xN + F(xn) =
= -BNbxN -	+ F(xn) =
= -BnA.xn -	+ Bn&xn + F(xn) =
= ~(F(xN) - F(xn~')) + F(xN) = F(xn'})-
В одномерном случае (n = 1) два этих условия полностью опр^ деляют B/v+i, но при п > 1 это уже не так. Метод Бройдена
9.1. Итерационные методы решения
255
ИШЬ один из вариантов определения матрицы Bw+i, удовле-^роряюшей соотношению секущих
Bn+i&xn = ДзД
Строго говоря, метод Бройдена, как и другие методы секущих, является двухшаговым, так как очередное значение ®ЛГ+1 зачисляется с использованием двух предшествующих значений
и xN~l • Это позволяет обойтись без использования частных производных, которые нужны в методе Ньютона (они входят в матрицу Якоби F'(xN)). Но при этом матрицы Bjv+i в методе пройдена можно рассматривать как некоторую аппроксимацию матриц Якоби F^x14), и с этой точки зрения метод удобно интерпретировать как одношаговый.
При выполнении определенных условий метод Бройдена является локально сходящимся, но скорость его сходимости, как правило, ниже, чем скорость сходимости метода Ньютона.
Нелинейные методы. Одношаговые методы, описываемые канонической формой (9.2), на каждой итерации приводят к решению системы линейных алгебраических уравнений, что связано с обращением матриц B/v+j. Такие методы называют линейными. Для решения нелинейных систем используют также нелинейные методы, в которых очередное приближение ищется как решение нелинейной системы, более простой по сравнению с исходной.
В нелинейном методе Якоби для получения очередного приближения xN+l решают п независимых нелинейных уравнений. Каждая координата вектора а^+1 представляет собой решение уравнения
= 0, k = l,n.
Для решения такого уравнения можно применить один из итерационных методов решения нелинейных уравнений [II], при-для разных уравнений можно применять разные методы.
256
9. ЧИСЛЕННЫЕ МЕТОДЫ
В нелинейном методе Зейделл поступают аналог Ичц0 но в качестве известных аргументов уравнения использу^' уже найденные кординаты (N + lJ-ro приближения, т.е. координата х^+1 вектора представляет собой решена уравнения
fk(^+',...,x^,x^+\x^+i,...,x^)=0, k= 17n.
В нелинейных методах Якоби и Зейделя, как и в ряде линейных методов, каждая отдельная итерация, в которой определяется очередное приближение а^+1, может представлять собой итерационную процедуру. Например, в нелинейных методах Якоби и Зейделя каждая координата очередного приближения находится из нелинейного уравнения, которое может решаться итерационным методом. В таких случаях, как уже отмечалось, различают внешние итерации, состоящие в последовательном построении членов итерационной последовательности, и внутренние итерации, из которых состоит отдельная внешняя итерация. Очередной член итерационной последовательности можно вычислять с невысокой точностью, так как этот член — лишь очередное приближение к искомому решению. Поэтому в итерационных методах обычно ограничивают количество внутренних итераций (от одной до нескольких). Проигрыш в точности очередного приближения компенсируется сокращением объема вычислений на одной внешней итерации.
Обратим внимание на то, что в методах Ньютона и Пройдена внешняя итерация состоит в решении системы линейных алгебраических уравнений и для этого можно использовать линейные методы Якоби и Зейделя [IV]. В этом случае внешние итерации будут соответствовать методу Ньютона или Пройдена, а внутренние — линейному методу Якоби или Зейделя-Наоборот, в нелинейном методе Якоби или Зейделя нелинейное уравнение для определения координаты очередного приближения может решаться методом Ньютона или секущих. В этом случае внешние итерации соответствуют методу Якоби или Зейделя, а внутренние — методу Ньютона или секущих.
9.1. Итерационные методы решения
257
Подготовительный этап. Приступая к решению некото-ой нелинейной системы, следует провести ее предварительное Р сЛеДОЭание- Это исследование необходимо не только для выбора наиболее удобного и эффективного метода ее решения. 0но может оказать помощь в определении начального принижения, хотя такая цель на практике не всегда достижима, й для задания начального приближения могут понадобиться численные методы (см. 9.3). Кроме того, анализ уравнений системы позволяет выбрать более удобный порядок уравнений в системе, провести нормировку уравнений, а также согласовать масштабы неизвестных. Все это существенно влияет на эффективность применяемых численных методов решения нелинейной системы.
Пример 9.1. Пусть задана нелинейная система
я? - *2 = О, _ *2 “ Х1 ~ °-
(9.5)
При ее решении методом Якоби полезно изменить порядок уравнений в системе:
f ®2-11 =°-
1 Zj — Х-2 = 0.
(9.6)
Тогда итерационная последовательность по методу Якоби определяется явными формулами

(9.7)
и Процесс, вычислений можно построить без внутренних итераций.
Рассматриваемая система проста и легко решается аналитически исключением неизвестных: х% = х?, х* — Xi = 0. Она
258
9. ЧИСЛЕННЫЕ МЕТОДЫ
имеет два решения ж* = (О О)Т и ®жж = (1 1)Т. Запишем сип му (9.7) в виде a?yv+1 =S(xN), где S(x)= (х2 х,)Т. Так как
s'W'G". 25’)' s'i°-<»=G О- у<1'1>=(°
спектральная норма матрицы Якоби отображения 5(a) в точках а?ж и а?жж равна ||5'(0,0)|| = 0 и ||5'(L 1)11 = 2 соответственно Поэтому отображение S(x) является сжимающим в некоторой окрестности точки а?ж, а итерационная последовательность метода Якоби сходится к этой точке, если начальное приближение достаточно близко к ней. Напротив, в точке ®жж достаточное условие локальной сходимости итерационного метода нарушается. Можно показать, что итерационная последовательность метода Якоби не будет сходиться к точке а?жж независимо от того, насколько близким к а?жж взято начальное приближение. Например, если х° = ($ 19) , 0 < ft < 1, то, как нетрудно увидеть, xN = (i?2* $2*)т —> а?ж при N —> оо.
Итак, для вычисления решения ®жж системы (9.5) итерационная последовательность метода Якоби, построенная согласно формулам (9.7), не годится. В этом случае можно воспользоваться методом Ньютона, так как матрица Якоби функции т
F(x\1X2) = (а?! ~	х\~~х2) ) соответствующей системе (9.6),
в окрестности решения ®жж невырождена:
det F'(l, 1) = -3 ± 0.
9.2.	Метод Ньютона
Метод Ньютона очень эффективен для уточнения решения, так как он обладает высокой скоростью сходимости вблизи решения. Чтобы это обосновать, докажем следующие две леммы.
9.2. Метод Ньютона
259
Демме 9.2. Пусть ||<|| — некоторая кольцевая норма в ценном пространстве квадратных матриц A/n(R) порядка 710 Если ||А|| q < 1, то матрица Е-+ А невырождена, причем
рассмотрим последовательность матриц
Хк = Е- А +А2 - ... +(—1)кАк, А: = Т7оо.
Докажем, что эта последовательность сходится по норме, к некоторой матрице X и при этом (Е 4- А)Х = Х(Е+ А) = Е. Выберем произвольные натуральные числа к и р. Тогда
к+р	к	к+р
Хк+Р-Хк=^(-1}тАт-^(-1)тАт= £ (-l)m4m.
тп=0	т=0	7п=/с+1
Поэтому, учитывая, что норма кольцевая (т.е. ||4В||	||.4||||В||
для любых матриц А и В), получаем
HXt+p - Х*|| =
Е (-1)"мт
т=к+1
к+р
тп=&+1
*+Р	к+р	. р
Е 1И1Г < Е 9т=’*+,т~7
тп=&+1	т=к+1
1-9
Для произвольного числа е > 0 выберем &о так, чтобы gfco+1 < < е(1 — q). Тогда для любых чисел k > ко и р
д*о + 1 l|Xt+p - Xt|| < Ч— < в.
т>е. последовательность {Л\} фундаментальна в конечномер-ном линейном пространстве Mn(R). Согласно критерию Коши, ^та последовательность сходится к некоторой матрице X. Ответим, что
||(Е+ А)х - (Е+ А)Х*|| = ||(Е+ А)(Х - Х*)|| $
$||Е + 4||||Х-Х,|Н0
260
9. ЧИСЛЕННЫЕ МЕТОДЫ
при к —> оо, т.е. последовательность (Е + А)Хь сходится к (Е+А)Х. Но
(Е+ А)Хк = Хк + А - А2 + ... + (- l)*4t+I = Е+ (- 1)*М*+1 -> Р
- 1
так как ||А*+1|| 1ИН*+1	-> 0 при k -> оо. Поэтому
(Z? + A)X = Е, и матрицы Е + 4 и X невырождены, причем (Е+ A)“l = X [III]. При этом
||(Е + Д)-,|| = ||Х|| \\Х-Х*|| + ||Х*|1 =
= ||*-**Н +
к 52(-1ГАт тп=0
к
||Х - Xt|| + £ ||А’"||
т=0
р - Xfc|| + £ g-5! ||Х - Xt|| +
откуда с учетом ||X — Л\|| —> 0 при к -> оо получаем неравенство
Лемма 9.3. Пусть функция F непрерывно дифференцируема в некоторой окрестности U(zw,r) = {ж Е Rn: ||а? - а?ш|| < г} точки ж,, а ее матрица Якоби удовлетворяет в этой окрестности условию Липшица
||Ff(xx) — F'(x2)|| $ 7 Ца?1 - sb2||	(9.8)
относительно нормы матриц, согласованной с евклидовой нормой в Rn. Тогда для любых точек ®,®° Е	верно
неравенство*
II и®) - F(®°) - F'(®°)(® - ®°)|| 7II® - ®°||2.
*На самом деле верно более сильное неравенство
Доказательство этого утверждения см.: Деннис Дж. (мл.), Шнабель Р (с. 98).
9.2. Метод Ньютона
261
. рассмотрим функцию L(x) = F(x) - F(®°) - F'(xQ)(x - ж0), йепреРЫВН0 Дифференцируемую в U(®*,r). Отрезок, соединяющий точки ®°,® € U(®*,r), целиком лежит в U(®w,r), так как длй произвольной точки £ = х° + $(® - а?0), О < $ < 1, согласно неравенству треугольника, имеем
||£-®*|| = ||(1 -$)(®°-®*) + $(®-®*)|| ч
(1 — $) ||®° — ®*|| + $||® — ®*)||	(1 -$)Г + $Г = Г.
Следовательно, согласно лемме 9.1,
||F(®) - F(®°) - F'(®°)(® - ®°)|| = ||L(x) - Ц®°)||
||L'(«)||||®-®0|| = ||F'(f)-F'(x°)||||®-®0||,
где точка £ = ®° + $(® - ®°), 0 < $ < 1, принадлежит окрестности U(®*,r). Используем условие Липшица (9.8):
||F(®) - F(®°) - F'(®°)(® - ®°)|| 7 ||f - ®°|| ||® - ®°|| •
Так как
||£ — ®°|| = ||$(® - ®°) || = $ ||® — ®°|| < ||® - ®°||,
окончательно получаем
||F(x) - F(x°) - F’(x°)(x - ®°)|| $ 71|« - ®°|Г •
Теорема 9.2. Пусть функция F непрерывно дифференцируема в некоторой окрестности U(®*,r) = {® Е Rn: ||®—®ж|| < г} точки ®*, причем F(®*) = 0, а матрица Якоби F'(x) функции F(®) в и(®ж,г) удовлетворяет условию Липшица (9.8) относительно нормы матриц, индуцированной нормой в Rn. Пусть, Кроме того, матрица Якоби F'(®*) в точке ®* невырожде-и /3 — некоторое число, удовлетворяющее условию /3
||(F'(®*))-11|. Тогда существует такое число е > 0, что для
262
9. ЧИСЛЕННЫЕ МЕТОДЫ
любого начального приближения аг° € U («»,£) итерационна последовательность {а?^}, определяемая соотношением
®"+1 = xN - (F'(xN))-iF(xN),	(э.9)
корректно определена и сходится к точке причем
||авЛГ+1 -®.|| ^270||a:;v-a:.||2, W = 0,l,...	(9.10)
◄ Под корректностью определения итерационной последовательности понимается то, что для каждого натурального N элемент последовательности xN попадает в область определения функции F(x) (значит, имеет смысл выражение F(xN)), а матрица Якоби	невырождена и имеет обратную мат-
рицу.
Выберем число е — min{r, (2^7)“!) и докажем, что матрица Якоби F'(®) является невырожденной в каждой точке х с € U(®*,f). Действительно,
F‘(x) = F’(x.) + (F'(®) - F’(xJ) =
= F'(x.)(E+ (F'(®.))-1 (?(*) - ?(**))) =
= F'(®*)(E+Л), (9.11)
где
Согласно выбору числа /3 и условию Липшица (9.8) для матрицы Якоби, имеем
||(F'(a;,))-I|| ||/^(®) - F'(a:,)||	}
В силу леммы 9.2 матрица Е 4- А имеет обратную матрицу, причем ||(Е+Л)“1|| ^2. Из равенства (9.11) находим
(F'(®))'1 = (F'(a:.)(E+4))'1 = (E + 4)-1(F'(®.))‘1.
9.2. Метод Ньютона
263
л* я Адовател ьно,
||(F'(a:))-1|| ||(Е +Д)_,|| ||F'(o:.)_,|| <20.
Выберем произвольную точку х° € U(®*,e) и построим точ-д»1 согласно соотношению (9.9) при N = 0. Тогда
а?1 — ®*|| ~
х°-х.~ (F'(x°))~lF(x°)
(F'(®°)) ”’ (~F(x°) - F'(®°)(®. - x0)) <
(F'(z0))-1
F(x.) - F(x°) - Fl{x°)(x. - x°)
и, согласно лемме 9.3,
II®1 - ®.|| $ ||(Fz(®0))-1 II? ||®. - X° 1Г 2011|®° - х.|Г •
Тем самым доказано соотношение (9.10) для N = 0. Так как ||х°-®*|| < (2/З7)”1, заключаем, что
Следовательно, точка ж1 остается в окрестности U(®*,e).
Итак, исходя из произвольной точки ®° 6 U(®*,e), мы в соответствии с равенством (9.9) находим следующее приближение ж1, которое принадлежит U(®*,e) и удовлетворяет неравенству (9.10). Повторяя процедуру, мы получаем последовательность {®^} точек в окрестности U(®*,e), подчиняющуюся (9.10). При этом выполняются неравенства
Следовательно, согласно (9.10),
ЦаЛ+i .^*11 27/З Ц®77 - ж,||2 <
< (27/31|®° - ж*||) ||®N -®ж|| = g||®7V — ®*||,
264
9. ЧИСЛЕННЫЕ МЕТОДЫ
где g = 27$||®° - ®*|| < 1. Поэтому последовательность сходится к точке х*. ►
Замечание 9.1. Показатель степени 2 в неравенстве (9.1Q) справа определяет высокую локальную скорость сходимости итерационной последовательности. Если итерационная носЛр_ довательность удовлетворяет неравенству (9.10), то говорят что имеет место квадратичная сходимость. Таким образом, теорема 9.2 утверждает, что при достаточно общих пред, положениях о функции F(x) метод Ньютона для нелинейной системы F(x) = 0 обладает локальной квадратичной сходимостью.
Замечание 9.2. Утверждение теоремы 9.2 остается верным, если в неравенстве (9.10) коэффициент 2у(3 заменить меньшим коэффициентом* у(3. Утверждение теоремы можно перенести на случай, когда вместо матрицы Якоби F'(®) в формуле (9.9) используется ее конечно-разностная аппроксимация. Полагая
_ F(xN + hNej) - F(xN) . _ -— TV )j	i	i J 11 71,
/l/V
где ej, ..., en — стандартный базис в Rn, приходим к итерационной последовательности
— xN - F(xn),
где 4/v = ((4/v)i	... M/v)n) — матрица, представляю-
щая собой конечно -разностную аппроксимацию матрицы Якоби F'(xn) (она записана в виде блочной матрицы)-Эта последовательность сходится медленнее, чем итерационная последовательность метода Ньютона, и замедление можно уменьшить, если последовательность {/i/v} достаточно быстро сходится к нулю. В частности, если \h]y\ $ с||®лг - ®»|| или |^|$г||Г(^)||, N = 0, 1,2,..., то последовательность {®Л} имеет квадратичную сходимость**.
*См.: Деннис Дж. (мл.), Шнабель Р.
**См.: там же.
9.3. Проблема глобальной сходимости
265
Пример 9.2. Рассмотрим систему ' 2(^1 4- *2>2 + (^1 - ^г)2 -8 = 0, 5я? + (*2-3)2-9 = 0.
каждое уравнение является алгебраическим уравнением второго порядка и яа плоскости XiOx2 описывает эллипс (рис. 9.1). Видно, что система имеет два решения, одно из которых легко яаходится: £1 = х2 — 1 (точка R2 на рис. 9.1).
Выбрав в качестве начального значения Xj = -1, х% = 1 (точка Д на рис. 9.1), согласно (9.9), последовательно получаем следующие значения:
	-1,0000	-1,2857	-1,1895	-1,1835	-1,1835
Х2	1,0000	1,7143	1,5905	1,5868	1,5868
Найдено приближенное значение % (-1,1835 1,5868)Т для другого решения заданной системы (точка R\ на рис. 9.1).
Взяв в качестве начального приближения х^ = 2, х% = 2 (точка В на рис. 9.1), получим другую итерационную последовательность, сходящуюся к решению системы жж* = (1 1) (точка R2):
	2,0000	1,3182	1,0431	1,0009	1,0000	1,0000
х2	2,0000	1,1818	1,0078	0,9999	1,0000	1,0000
9.3. Проблема глобальной сходимости
Рассмотренные выше методы являются локальными, т.е. °йи сходятся к решению, если начальное приближение находится уже достаточно близко к этому решению. На практике.
266
9. ЧИСЛЕННЫЕ МЕТОДЫ
однако, такого хорошего приближения нет и серьезной
« /	—	v	«\	Ро-
блемои (может быть, самой важной) является поиск хорощ^ начального приближения.
В решении этой задачи могут помочь приемы, расширь щие область сходимости локального метода, т.е. мно^е. ство тех начальных приближений, из которых итерационна# последовательность сходится к решению. Здесь мы остановимся на методе Ньютона и способах расширения его области сходимости.
Вспомним, что для метода Ньютона итерационный пара, метр тдг+1 равен единице. Одна итерация метода Ньютона состоит в перемещении из текущей точки xjy в следующую причем вектор смещения (ньютоновский шаг) определяется текущим значением и текущей матрицей Якоби по формуле = - (F'(xn)) 1 F(xN). Введение итерацион
ного параметра означает, что сохраняется направление перемещения (шага), но изменяется его величина. Основная причина
неудачного ньютоновского шага состоит в том, что он оказался слишком велик и на таком расстоянии линейное приближение функции, построенное в точке xN, недостаточно точно. Поэтому основной стратегией здесь является уменьшение ньютоновского шага, т.е. введение в каноническую форму одношагового итерационного метода итерационного параметра < 1.
Чтобы реализовать указанную стратегию для системы (9.1), необходимо оценивать, насколько удачным оказался очередной шаг. В качестве критерия оценки используют величину ||F(aj^)||, вычисленную по какой-либо норме. Мы остановимся на случае евклидовой нормы. Выбор такой оценки, по существу, означает, что вместо поиска нуля векторной функции F(x) ищется минимум скалярной функции <^(®) = ||F(®)||".
Отметим, что
9.3. Проблема глобальной сходимости
267
де — координатные функции векторной функции F(®).
Поэтому
Производная скалярной функции <р(х) в направлении ньюто-ровского шага, вычисляемого по формуле з = -(Г'(ж))~lF(x)<
равна
¥=’'WS - Vw(F'M)-'fW =
2(F(x))rF(x) = 2||f(ae)||a М 1И1
Это значит, что в направлении ньютоновского шага функция <р(&) убывает (такое направление в теории конечномерной оптимизации называют направлением спуска).
Итак, можно использовать следующую стратегию поиска решения нелинейной системы.
1.	В очередной точке xN вычисляем ньютоновский шаг з* = ~[F,(xN))~iF(xN) и полагаем = 1.
2.	Выбираем точку 2c/v+1 = xN 4- tn+isn .
3.	Если ||F(aj/v+1)|| < ||F(xN)||, то оставляем точку ®ЛГ+1 в качестве окончательного результата текущей итерации. Иначе уменьшаем параметр r/v+i, например вдвое, и повторяем попытку (п. 2) с новой величиной шага.
Предложенная процедура носит название метода линей-^ого поиска. В этой процедуре можно применять различные Приемы уменьшения итерационного параметра. Выбор такого Приема играет важную роль. Если величина шагов завышена (а Точнее, недостаточно уменьшена величина ньютоновского ша-то эффект от модификации метода Ньютона, возможно, Сбудет достигнут и полученная итерационная последовательность не будет сходиться. Это можно наблюдать даже в од
268
9. ЧИСЛЕННЫЕ МЕТОДЫ
Рис. 9.2
номерном случае: на рис. д. видно, что из-за большой /
1 Щк
личины ньютоновских Шаг0& итерационный процесс „пр^ скакивает“ несколько нуд^ функции.
Застраховаться от подо^
ной неприятности можно, увязав величину уменьшения
= 9?(®yv+1) - y(xN) минимизируемой функции = ||/*’(г)||2
со скоростью ее убывания в выбранном направлении спуска
например, согласно формуле
¥>(хл'+1) -	*Wi ||sw|| =
=-2ar/V+1ss(a:/v), (9.12)
где а € (0,1], a sN — вектор ньютоновского шага. В этой формуле величина уменьшения	-<p(xN) функции <р(ж) на
текущей итерации в расчете на единицу длины итерационного шага, равной r/v+i ||з^||, ограничена снизу фиксированной долей производной по направлению. Приемлемая доля указывается параметром а. Поскольку, согласно определению производной функции по направлению вектора,
9?(®^+1) — <p(xN)	dip(xN)
tn+i Н^П dsN
TN+\ 0,
условие (9.12) задает верхнюю границу возможного значения параметра т^+\ и тем самым ограничивает величину шага на каждой итерации.
На качество итерационной последовательности влияет и занижение величины шага итерации. Если величина шагов занижена, то итерационная последовательность может сходиться к точке, не являющейся решением системы. Действительно, если очередной шаг вдвое меньше предыдущего, то последователь' ность точек будет сходиться к точке, находящейся от началь'
9.3. Проблема глобальной сходимости
269
Приближения на расстоянии, не превышающем удвоенно-** первого шага- При этом на сходимость никак не влияет ведение функции. Даже если построенная итерационная по-/^давательность и сходится к истинному решению, занижение ВЛ0Ч-ИНЫ шага ведет к замедлению сходимости итерационной иасдедовательности и в конечном счете к увеличению объема вуЧИСЛвНИЙ.
Чтобы избежать этой опасности, можно учесть, что в точке минимума дифференцируемая функция <р(х) (если дифференцируема векторная функция F(x)) имеет нулевые частные производные. Это делает понятным следующее условие на выбор очередного шага, препятствующее сходимости итерационной последовательности не к точке минимума функции:
д^)> 0^
dsN * dsN ’	1 ъ
Здесь, как и выше, = xN + r^+]SN — следующий элемент итерационной последовательности, sN — ньютоновский шаг на
итерации.
Наконец, поскольку изложенный глобальный метод решения системы F(x) = 0 — это метод минимизации функции
= ||F(®)||2, может возникнуть еще одна проблема. Нули F(x) являются точками минимума но функция <р(х) может иметь также точки минимума, не являющиеся нулями F(x). Этот эффект проявляется даже в одномерном случае. Действительно, точками локального минимума функции F2(x) являются нули функции F(x), а также точки локального минимума с положительным значением функции и точки локального Максимума с отрицательным значением функции. Например. Функция F(x) — х3 — Зх -|-18 имеет единственный нуль х = -3. а Функция F2(x) = (х3 - Зх -I-18)2 имеет две точки локального Минимума Z] — — 3 и Х2 = 1.
Указанное несоответствие между нулями функции F(x) и Очками локального минимума функции <р(х) = ||F(®)||2 озна-что построенная итерационная последовательность мо
270
9. ЧИСЛЕННЫЕ МЕТОДЫ
жет сходиться к точке минимума но не давать рещр^ нелинейной системы. Способов достаточно общего характ^ ра, позволяющих обходить такие ловушки, по-видимому, нет* Единственное разумное решение в данном случае — сменит^ начальное приближение и повторить метод решения еще раз.
Итак, метод Ньютона можно модифицировать с помощЬ1о итерационного параметра таким образом, что область сходимости метода заметно расширится и модифицированный метод станет фактически глобально сходящимся методом**. Такой подход имеет одно явное преимущество: он дает метод, который, с одной стороны, является глобально сходящимся, а с другой стороны, обладает высокой скоростью сходимости вблизи решения. Такие свойства метода являются следствием того, что на каждой итерации для первой попытки выбирается ньютоновский шаг.
Отметим, что предложенные приемы расширения области сходимости не являются универсальными: в конкретных ситуациях они могут оказаться неэффективными и в таком случае нужно использовать другие модификации метода Ньютона. По-видимому, методов, обеспечивающих глобальную сходимость в любых ситуациях, не существует.
Рассмотрим другую стратегию выбора укороченного шага. Этот вариант выбора очередного шага можно назвать методом доверительной области. Основная его идея заключается в том, что в текущей точке xN строят доверительную область {z € Rn: ||z — а^Ц $ £/v }. В этой области функцию F(x) заменяют ее линейным приближением
= F(xn) + F'(xn)(x - xN),
а тогда функция <p(x) = ||F(®)||2 получает квадратичную »п' проксимацию
mN(x) = ||m/v(®)||2.
*См.: Деннис Дж. (мл.), Шнабель Р. (с. 186).
"Область сходимости глобального метода достаточно широка, но мо*еТ не охватывать все возможные варианты начального приближения.
9.3. Проблема глобальной сходимости
271
а доверительной области, т.е. при ||я — £jv, ищут точку как точку минимума полученной аппроксимации mjv(z).
Эффективность метода доверительной области зависит от вы-^ораее размера, определяемого параметром £уу, а также от выбора метода решения возникающей оптимизационной задачи.
После выбора стратегии поиска в решении нелинейной си
стемы, следует определиться и с условиями останова, т.е. с условиями, на основании которых текущее приближение xN можно рассматривать как приближенное решение задачи. При точном решении задачи таким условием могло бы быть равенство
= О. Но на практике оно неприемлемо по двум причинам. Во-первых, значение функции вычисляется приближенно и даже в нуле функции ее значение может быть хотя и близким к нулю, но не нулем. Во-вторых, решение ищется как предел последовательности и, значит, в конечном счете в качестве решения будет рассматриваться его некоторое приближение.
Обычно в качестве условия останова используют неравенство 11^(35^)11 или неравенство Ця^*1 - ®N|| ^6, или их комбинацию. Первый критерий ориентируется на значения функции F(x) в окрестности решения. Отсюда легко увидеть его главный недостаток. Если функция меняется мало в окрестности решения то условие F(x) «О может выполняться в достаточно обширной области вокруг этого решения. Второе условие говорит о том, что итерационная последовательность начинает „стопоритьсят.е. величины итерационных шагов становятся малыми. Это может быть следствием приближения к решению ®*. Однако отметим, что это может быть и следствием недостатков алгоритма или низкой скорости сходимости итерационной последовательности.
Основная проблема в критериях останова — это выбор пороговых значений € и 8. Слишком большие значения пороговых параметров дадут приближение низкой точности. Но и слишком малые их значения тоже приводят к трудностям, в частности, к зацикливанию алгоритма из-за того, что значимыми ^Мовятся ошибки вычислений.
272
9. ЧИСЛЕННЫЕ МЕТОДЫ
Параметр е нужно выбирать исходя из типичных значений координатных функций векторной функции F(®), а параметр 8 — исходя из значений координат точки ж*. Может оказаться что координатные функции векторной функции F(x) принимают значения разного масштаба. Например, первая координатная функция имеет значения порядка 103-104, а вторая -порядка 10~4-10~3. В этом случае в используемых оценках которые строятся с помощью нормы в Rn, влияние координатных функций будет заметно различаться. Это, скорее всего, приведет к большим ошибкам в решении по некоторым координатам. Кроме того, большие различия в масштабах координатных функций могут быть причиной плохой обусловленности [IV] матрицы Якоби. Это приводит к трудностям при решении систем линейных алгебраических уравнений в методе Ньютона. Точно так же на эффективность итерационного метода отрицательно влияют большие различия в значениях неизвестных в системе нелинейных уравнений (аргументов функции F(x)).
Избежать отмеченных проблем можно, если при постановке задачи на решение нелинейной системы проанализировать функции в левых частях уравнений и, если необходимо, изменить масштаб координат как в области определения, так и в области значений векторной функции F(x).
Пример 9.3. Некоторую иллюстрацию проблем, связанных с глобально сходящимися методами решения нелинейных систем, дает система уравнений из примера 9.2. В зависимости от выбора начального приближения итерационная последовательность метода Ньютона или его модификация с методом линейного поиска может сходиться к одному из двух решений, но может и не сходиться вообще или сходиться слишком медленно. Поведение итерационных последовательностей при различных начальных приближениях отражено на рис. 9.3. Векторы, построенные в системе координат, указывают направление ньютоновского шага. На рисунке явно просматриваются три области, приводящие к разнотипным итерационным последо-
Вопросы и задачи
273
дельностям. Линией разграничения этих областей является глперб°ла 5^1 + 12а: i Х2 ~ ^2 +	+ 3^2 = 0, в точках которой
кобнан векторной функции равен нулю.
Рис. 9.3
Вопросы и задачи
9.1. Определите количество корней системы нелинейных уравнений и найдите одно из решений системы методом Ньютона с заданным начальным приближением:
(«*-2/4-4 = О, , _4 „ _ 9.
а)р-у+з = о, *о-4,и>--2,
<' х3 + у3 - вху = О, г2 + 4у2 - 4 = 0;
хо = 3, у0 = 4;
(х2+ 2у2)2-7(х2— 2у2) = 0, Зх2 + 4у2 -14 = 0;
®о= 1,2/о = 1-
9*2. Систему нелинейных уравнений из предыдущей задали решите модифицированным методом Ньютона. Сравните скорость сходимости двух методов.
10. ИНТЕРПОЛИРОВАНИЕ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
10.1. Интерполяционные сплайны первой степени
Рассмотрим задачу восстановления функции двух переменных по известным значениям в заданных точках. Иначе говоря, задача состоит в том, чтобы построить функцию f(x,y), для которой f(x{,yi) = fa, i = О, N. Отметим, что в общем случае определить однозначно функцию по ее значениям в конечном наборе точек нельзя, и речь может идти лишь о некотором приближенном восстановлении функции.
На плоскости хОу построим многоугольник М, вершинами которого является часть точек Pt. При этом предполагаем, что те точки Pi, которые не являются вершинами, расположены внутри многоугольника М. Такой многоугольник можно выбрать не единственным способом (рис. 10.1).
Рис. 10.1
Соединяя подходящим образом точки Pi отрезками, мно гоугольник М можно разделить на некоторое количество тр^ угольников. Это можно сделать так, что вершинами треугольников будут точки Pi, и только они. Описанное разделений
10.1. Интерполяционные сплайны первой степени
275
^рроугольника М на треугольники называют триангулл-^ей многоугольника. На рис. 10.2 показаны возможные триангуляции многоугольника, изображенного на рис. 10.1, б.
Рис. 10.2
Пусть для заданного множества точек	выбраны
многоугольник М и триангуляция этого многоугольника, состоящая из треугольников Ay, j = 1, К. Тогда на многоугольнике М можно задать такую функцию s(x,j/), которая на каждом треугольнике Ду является линейной функцией, т.е.
s(x,y) = a]x + bJy + c1, (г;у)бДр j=l,K, (10.1)
где Aj — замкнутое множество, ограниченное треугольником Ау (т.е. внутренность треугольника плюс сам треугольник), и удовлетворяет условиям s(xi^yi) = ft, i = О, /V. Графиком этой
функции является поверхность в пространстве, составленная
из треугольников с вершинами в точках p*(zt; yi\ fi) (рис. 10.3). Отметим, что функция s(x,y) непрерывна на многоугольнике М. Ее называют интерполяционным сплайном пер
вой степени двух переменных.
терполяционного сплайна зависит °т того, как выбран многоугольник М и как выполнена его триангуляция. При заданном многоугольнике М и его триангуляции Интерполяционный сплайн первой Степени определен единственным Образом.
Очевидно, что вид ин-
Рис. ю.з
276
10. ИНТЕРПОЛИРОВАНИЕ ФУНКЦИЙ 	й
Чтобы вычислить значение $(я, у) интерполяционного спл^Й на в произвольной точке (т; у) € М, нужно определить вершЙЙЬ1 Pk, Ph Рт треугольника Aj, в который попала точка (х;у} а затем вычислить значение s(x,y) согласно формуле (10.1)’ используя заданные значения Д, //, fm для определения эффициентов a;, Cj в (10.1). Остановимся на описанной процедуре подробнее.
Отметим, что площадь S треугольника Р\РзРз в плоскости хОу с вершинами У») может быть вычислена по формул
5 = 0,5|А(Р1,Р2,Р3)|,где
2/1 1
Д(Л}Р2)Рз)= Х2 У2 1
Хз Уз 1
При этом знак определителя указывает на направление обхода точек Pi, Р2, Рз в плоскости хОу: если А(Р1,Р2,Рз) > О, то обход трех точек в последовательности Pi, Р2, Рз совершается против часовой стрелки. Действительно, рассмотрим в пространстве тетраэдр с вершинами ^(я»; t/4; 0), г = 1,2,3 и
Рис. 10.4
Q(0;0;-l) (рис. 10.4). Основанием этого тетраэдра является треугольник PiP2P3, а его высота, опущенная на это основание, равна единице. Поэтому его объем V равен трети произведения площади основания S на высоту, т.е. численно
равен трети площади основания. В то же время объем тетраэдра можно записать с помощью смешанного произведения трех векторов, направленных по трем смежным ребрам те-траэдра: V -	• qX|- Так как оЯ = {ж,; 1}, i s
1,2,3, то, используя представление смешанного произведения в прямоугольных координатах, получаем V = 1|Д(Р1,Р2,Рз)1' Следовательно, S = 3V = 0,5|Д(Р1,Р2,Рз)|. Отметим, что если обход точек Pj, Р2, Рз совершается против часовой стрелки. т°
10.1. Интерполяционные сплайны первой степени
277
тройка векторов Ц//1, урь ч/Р? является правой, а смешанное о0Язведение положительно. А если точки Pi, Pj, Р3 обходятся 0 расовой стрелке, то тройка векторов QPy, QP2, QP3 является девой и смешанное произведение этих векторов отрицательно.
Упорядоченную тройку точек (Pi, Р2, Р3) в плоскости хОу,
че лежащих на одной прямой, назовем правой тройкой то-если обход этой тройки совершается против часовой
стрелки.
тройкой
В противном случае эту тройку назовем левой точек. Если тройка точек (Pi, Р2, Р3) являет-
ся правой, то проверить, попадает ли точка Р(х\у) внутрь треугольника Р1Р2Р3) можно следующим образом. Точка Р попадает в треугольник Р1Р2Р3 тогда и только тогда, когда все три тройки точек (Р, Р2, Рз), (Pi, Р, Рз), (Pi, Р2, Р) являются правыми (рис. 10.5).
Рис. 10.5
Для данного набора точек Pi(xi;yi)} i = Q,N, фиксируем многоугольник М и его триангуляцию, задавая тройки номеров вершин каждого треугольника PtP/Pm. При этом порядок
вершин треугольников установим так, что они будут обходиться против часовой стрелки (т.е. обход вершин треугольника ^kPiPm в порядке Pt, Р/, Рт совершается против часовой стрелки). Произвольная точка Р(х\у) € М попадает лишь в один из треугольников заданной триангуляции (если не оказывается ив границе между треугольниками). Этот треугольник можно выявить, проверяя для каждого треугольника PkPiPm триангуляции неравенства
Д(ЛР,Рт)^0, A(Pt,P,Pm)^0, Д(Рь,Р/,Р)^0. (10.2)
Отметим, что если эти неравенства выполнены для некоторых индексов fc, Z, т, причем одно из неравенств на самом Деле является равенством, то точка Р попадает на сторону
278 10. ИНТЕРПОЛИРОВАНИЕ ФУНКЦИЙ
треугольника. Например, если A(flb,P/,P) = 0, то точка Р ходится на стороне PkPi-
Точки Qi{xi\yi\Zi), г = 1,2,3, и Q(x\y\z) лежат в одной плоскости тогда и только тогда, когда векторы QxQ^ и Q1Q3 компланарны, т.е.
х-хх у-ух z-zx Х2-Хх 2/2 “ 2/1 Z2-ZX Хз-Хх Уз-У\ Z3-ZX
Нетрудно увидеть, что значение определителя в левой части равенства совпадает со значением определителя
х-хх	У~У\	z-zx	О
Z2-*i	2/2 - 2/1	z2 - zx	О
*3-^1	2/з-2/1	*3-*i	О
а?1	1/1	zx	1
Этот определитель четвертого порядка можно преобразовать, выполняя операции над его строками. Прибавляя последнюю строку последовательно к первой, второй и третьей строкам, а затем переставляя строки, приходим к следующему критерию принадлежности четырех точек Qi, Q2, Q3 и Q одной плоско-
сти:
X	У	Z	1	
Хх	2/1	Zx	1	= 0.
Х2	2/2	Z2	1	
хз	2/з	Z3	1	
(10.3)
Если точка Р(х;у) попадает в треугольник PkPiPm выбранной триангуляции многоугольника Л/, то значение s = s(x,y) интерполяционного сплайна в этой точке можно определять исходя из условия, что точки Qi(xi\ уц fi), i = fc, /, тп, и Q(x; y\$) лежат в одной плоскости. Используя условие (10.3), после соответствующей перестановки столбцов определителя получаем
10.1. Интерполяционные сплайны первой степени
279
уравнение
S	X	У	1	
/к	Xk	Ук	1	— 0
fl	Xl	yi	1	— и.
		Ут	1	
С помощью разложения определителя в левой части уравнения ид первому столбцу, приходим к следующему уравнению:
$Д(Рь Pl,Pm) ~ fkA(P, Pl)Pт) +
+ fl&(P,Pk,Pm) ~ fm^PPk.Pl) = 0.
Из этого уравнения следует, что
Отметим, что значение Д(Рь,Р/,Рт), равное удвоенной площади треугольника PfcP/Pm, отлично от нуля.
Нетрудно убедиться прямой проверкой, что равенство (10.4) дает искомое представление интерполяционного сплайна первой степени. Действительно, правая часть в (10.4) определяет линейную функцию координат х и у точки Р, так как линейными относительно переменных х и у являются выражения Д(Р,Р/,Рт), Д(РьР,Рт) и Д(Р*,Р/,Р). Эта функция в точках
Р/, Рт имеет заданные значения. Например,
\	Pl' ^m) f ।
( *>»*)- д^ ^ р^ Л +
, A(Pfc,n,Pm) f , Д(РьЛ.П) , =f + Д(Рь Р/, Рт) " + Д(Р*, Pl, Рт)Im Jk'
как &(Pk,Pk,Pm) = 0 и &(Pk,Pi,Pk) = 0 (эти определители ^Меют две одинаковые строки).
280
10. ИНТЕРПОЛИРОВАНИЕ ФУНКЦИЙ
Обратим внимание на то, что выявление треугольника который попадает заданная точка Р, и вычисление значенц интерполяционного сплайна в этой точке основаны на одних и тех же величинах. Поэтому два этапа вычисления интерподя ционного сплайна можно объединить в одну процедуру.
Если интерполяционный сплайн первой степени строится для приближения некоторой функции f(x,y) по ее известным
значениям, то естественным является вопрос о погрешности такого приближения. Пусть точка Р(х\у) попала в треугольник PkPiPm- Тогда площадь Spkptpm треугольника РкРРт равна сумме площадей трех треугольников:
= SpPlPm + SPkPPm + SPkPtP-
Из этого равенства, умножая его на два, получаем
Д(РьРьРт) = А(Р,РьРт) + А(РьР,Лп)+Д(РьР/,Р),
так как все рассматриваемые тройки точек являются правыми. Следовательно,
так как Д(РЬ Р/, Рт) / 0.
Используя равенство (10.5) и условие, что все рассматриваемые тройки точек являются правыми, получаем оценку
1Ф,У) -	=
ЮЛ. Интерполяционные сплайны первой степени
281
в <*>(/) — колебание функции /, соответствующее заданной триангуляции многоугольника Л/, которое определяется следующим образом. На каждом треугольнике P^PiPm вычисляется к<>лебание w(f,PkPiPm) функции f(x,у):
<j(f,PkPiPm) = max{|/4- /(г,у)|, |/( - /(ж,у)|, |/m - f(x,y)\},
где Максимум берется по всем точкам Р(х-, у) внутри треугольника PkPlFm и на его границе. Колебание о>(/), соответствующее заданной триангуляции многоугольника М, равно максимальному из колебаний функции на отдельных треугольниках триангуляции. Колебание функции f(x,y) на заданной триангуляции не превосходит величины
ММ) = max с1/(*ьУ1) - f(x2,
Pl Г2\<Ь
где максимум берется по всевозможным парам точек t/i) и Рг(^2'ч 2/2), расстояние |PiР2| между которыми меньше 6, а в качестве 6 выбран максимальный диаметр среди треугольников триангуляции.
Итак, точность приближения функции f(x,y) с помощью интерполяционного сплайна первой степени определяется колебанием функции на выбранной триангуляции. Следовательно, триангуляцию многоугольника М следует выбирать так, чтобы сделать колебания функции на отдельных треугольниках возможно меньшими (точнее, нужно стремиться к тому, чтобы максимальное колебание функции на треугольниках выбираемой триангуляции было минимальным). Если о функции f(x,y) Ничего не известно кроме того, что она непрерывна и имеет заданные значения fi в заданных точках РДя,; t/J, i = О, JV, то «определить колебание функции на треугольниках выбираемой триангуляции нельзя. В этом случае целесообразно триангуляцию выбирать так, чтобы минимизировать максимальный из Диаметров треугольников в триангуляции.
282
10. ИНТЕРПОЛИРОВАНИЕ ФУНКЦИЙ
10.2.	Билинейные интерполяционные сплайны
На плоскости хОу рассмотрим прямоугольник
Q = [а, 6] х [с, d\ = {(ж; у): а х 6, с у d}
и на нем сетку, порожденную разбиениями Тх = {жо, Ж1,..., а?п) Л = Xq < Ж1 < ...< Хп = 6, И Ту = {j/o> У1» • • •» 2/тп}» с = Уо < Уу < ... <	= d. Эта сетка состоит из вертикальных х = х, й
горизонтальных у = у$ прямых и разделяет прямоугольник Q на меньшие прямоугольники Qij = [а?«—i,а?»] х [t/j-i, t/j], i = T^n, j = 1, m (рис. 10.6). Пусть в узлах (ж,; yj) сетки заданы значения fij неизвестной функции /(ж,у).
Интерполяционным сплайном степени (1,1) (билинейным интерполяционным сплайном) si^(x,y) называют функцию, удовлетворяющую условиям:
1)	функция 51д (ж, у) непрерывна на прямоугольнике Q;
2)	на каждом прямоугольнике Qij, i = 1, n, j = 1, тп, функция si,i (ж,у) совпадает с некоторым многочленом, имеющим первую степень как по переменному ж, так и по переменному 2/, т.е.
«1,1 (я, 2/) = <4j + bijx + Cijy + dijxy, (ж; у) € Q»j;
3)	в узлах сетки функция $1,1(ж,1/) имеет заданные значения» т.е. si,i(xi,yj) = fa, i = Q~n,j = Q^rn.
Функцию si,i(ж,у), удовлетворяющую этим требованиям» естественно рассматривать как приближенное представление
10.2. Билинейные интерполяционные сплайны
283
^известной функции f(x,y). Но при этом возникает вопрос, ^сегДа ли существует такая функция и единственна ли она.
Отметим, нто сплайн si,i(^,t/) на каждом прямоугольнике ф.. однозначно определяется своими значениями в вершинах прямоугольника, являющихся узлами заданной сетки. Действительно, коэффициенты многочлена Pij(я,у) =	+ bijx + Cijy 4-
с котоРым совпадает сплайн в клетке удовлетворяют системе линейных алгебраических уравнений
(Oij 4"bijXi-i -|-Cijyj^i -|-dijXi^iyj-\ = fi—ij—i, aij 4~ bijXi 4- Cijyj—i 4“ dijX^yj—i = aij 4" bijXi-i + Cijyj -|- dijXi-^yj = /i-ij,
4" bijXi 4- Cijyj 4- dijXiyj = fij.
Эта система имеет решение, и притом единственное, если матрица системы имеет ненулевой определитель:
1	1 Уд—1
1 Xi yj-i
1 *t-i yj
1 Xi yj
Xi-iyj-l Xiyj-i Xi-iyj Xiyj
/0.
Нетрудно убедиться в том, что определитель в левой части равен (xi - Xi~i)2(yj - yj—i)2 и не равен нулю, так как xt_i < ж,
Итак, существует единственный многочлен Pij(x,y) первой степени по каждому из переменных, имеющий в вершинах клетки Qij заданные значения. Этот многочлен можно представить в следующем виде:
(х - Xj-^yj - у)	(Xi-x)(y-yj-l)
(®» — х1—1)(Уз ~ Уз—1 )	(*« — xi—l)(Vj “ Уз—1)
(х-х^)(у-у^)
284
10. ИНТЕРПОЛИРОВАНИЕ ФУНКЦИЙ
Очевидно, что записанный многочлен имеет первую степень По каждому из переменных, а в вершинах клетки Qij принимав заданные значения	/ij-i, ft-ij, fij-
Рассмотрим функцию «i,i(«,!/), которая на каждой клетке Qij заданной сетки совпадает с многочленом Pij(x,y). Убедим* ся, что эта функция непрерывна в прямоугольнике Q. От-
метим, что эта функция непрерывна в каждой точке (z; у} попавшей внутрь одной из клеток так как в этом слу-
чае в некоторой окрестности точки (ж; у) функция совпадает с многочленом. Функция также непрерывна и в точках границы прямоугольника Q, не совпадающих с узлами сетки, т.е. в точках (ж; у), для которых х = а или х = 6, а у / j = 0, тп, и в точках (ж; у), для которых у = с или у = d,&x^Xi, i = 07n.
Пусть точка (z; у) находится на смежной стороне х = Xi двух
соседних клеток Qij и Qt+ij (рис. 10.7). Тогда имеем
Р^(х,у) = Рц(хьу) =
Уз - Уз-i Уз ~ Уз-'
т.е. значения многочлена Pij(x,y) на прямой х = Xi определяются только двумя значениями и Д в узлах сетки. Аналогично
Pi+l,j(xi,y) — fij-l
Уз - Уз
f У-Уз-1
Jlj	»
Уз - Уз-1
и два многочлена Pij(x,y) и Pi+ij(x^y) имеют одинаковые значения на прямой х = z^, по которой граничат клетки Qij и Qi+ij. Это значит, что функция si,i(z,t/) непрерывна во всех точках (z; у), для которых z = zt, t/j-i <у <yj, i=l,n - 1-j = 1, m. Точно так же заключаем, что эта функция непрерывна и в точках горизонтальных прямых сетки, т.е. в точках (х\ у)< для которых Zj-i < х < zt-, у = t/j, i = 1, n, j = 1, m — 1.
10.2. Билинейные интерполяционные сплайны	285
функция	(ж, у) непрерывна и в узлах сетки. Рассмот-
например, внутренний узел (ж»;^), 0 < г < n, 0<j< Этот узел является общей вершиной четырех клеток
Qi,j+i’ Qi+iJ+i- Функция »1,1(г,у) имеет предел при (aCrtf)	по множеству Qij, так как на этом множестве
совпаДает с непрерывной функцией/^(ж,у). Анало-Гйчно убеждаемся, что существует предел «и(ж,у), равный fa, при (ж; у) -> (xnyj) по множествам Qi+ij, Qtj+i, Qi+iJ+i-д0 это и означает, что функция	непрерывна в точке
(«<»!/>)’ так как ее значением в этой точке является число fy.
Замечание 10.1. Представление (10.6) многочлена/^ (ж, t/), появившееся как бы „с потолка44, можно получить из следующих соображений. Для каждого фиксированного у € [j/j-i , у3] многочлен Pij(x,y) является линейной функцией переменного ж, а потому однозначно определяется по своим значениям в точках и (xi>y) согласно формуле
3! — Я ’	3? — X * 1
Рц(*,у) =	~ +	,	(10.7)
““ 37^	37| ““ 3/£_ 1
которая представляет собой частный случай интерполяционного многочлена Лагранжа. Функции Pij(xi-i,y) и Pij(xi^y) переменного у также являются линейными и определяются однозначно своими значениями в точках yj—\ и у^:
+ Pij(xi-hyj) »
Уэ—х—Уэ	yj Уз-l
^ij(xi>y) =	-----h Pij(xi,yj) ~ i
yj-1-yj	yj-yj-1
Подставляя эти равенства в представление (10.7), приходим к представлению (10.6). #
Остановимся на вопросе о погрешности приближения не-пРерывной функции f(x,y) ее интерполяционным многочленом 8м(®,3/).
286
10. ИНТЕРПОЛИРОВАНИЕ ФУНКЦИЙ
Положим
x-Xi-1	y-yj-1
и =---------, v =---------,
®г—1	У) yj — 1
у) € Qij'
Тогда 0<tt<l,0<v<l,a представление (10.6) можно записать следующим образом:
Pij(x,y) = (1 - U)(1 - «)/.-! J-1 + + м(1 -	+ (1 -	j + uv/y .
Кроме того, отметим очевидное тождество
= (1 - м)(1 - и)/(г,у) +
+ м(1 - v)f(x,y) + (1 - u)vf(x}y) + uvf(x,y}.
Вычтем из первого равенства второе. В результате получим оценку
|P.j(х,у) - f(x,$01 $ (1 - u)(l -	- f(x,у)I +
+ «(1 -	- f(x,у)I + (1 - «)v|/i-i,j - f(x,y)\ +
+ uv\fij- f(x,y)\^ ((l-«)(l-v) +
+ m(1 - v) + (1 - «)v + uv)wij(/) =w,>(/), где Uij(f) — колебание функции f(x,y) на множестве Qij:
= max , „ 1/(®1.»1)-/(а:2.й)1-
Итак, погрешность приближения функции f(x,y) интерполяционным сплайном «и(ж,у) не превосходит максимального колебания функции на сетке, т.е. величины
«(/)= _п?ах_____
t=l, n, j=l,m
10.3. Кубические сплайны одного переменного
287
10.3.	Кубические сплайны одного переменного
Напомним основные факты, которые относятся к кубиче-сКйМ сплайнам одного переменного [II].
Выберем некоторое разбиение Т отрезка [а, 6] точками a = — хо <	< ... < zn = 6. Полиномиальным сплайном одного
переменного называют функцию sm(x), которая удовлетворяет требованиям:
1)	sm(z) непрерывна и имеет непрерывные производные на отрезке [а, 6] до порядка р включительно;
2)	на каждом из частичных отрезков >, яч] разбиения Т функция sm(z) совпадает с некоторым многочленом степени т.
Точки Xi называют узлами сплайна. На практике предполагают, что р < т, так как при р = т поставленным требованиям удовлетворяют только многочлены*. Число т-р называют дефектом сплайна.
В приложениях используют, как правило, сплайны невысоких степеней. Широкое распространение получили кубические сплайны, т.е. полиномиальные сплайны третьей степени дефекта 1 или 2. Кубический сплайн вз(ж) на частичном отрезке [sj-i, zt] заданного разбиения Т можно представить следующим образом:
з
5з(ж) =	z,_i) , х Е [х,—1, zt*].	(10.8)
к=0
Одно из применений сплайнов — интерполирование функций. При этом наиболее распространенным случаем является тот, при котором узлы интерполяции совпадают с узлами сплайна. Остановимся на задаче построения сплайна зз(ж) де-
‘Производная такой функции порядка т = р, с одной стороны, непрерывна, а с другой, кусочно постоянна как т-я производная многочлена степени т. Значит, эта функция имеет постоянную m-ю производную на °Трезке [а, Ь], а потому является многочленом.
288
10. ИНТЕРПОЛИРОВАНИЕ ФУНКЦИЙ
фекта не выше 2, который в узлах Xi имеет заданные знаменця и заданные значения производной. Такой сплайн £'з(аг) удовло. творяет условиям
S3 (Xi) = <л, s'3(xi) = ¥?;, i = ОГп.
Чтобы найти коэффициенты в представлении (10.8) сплайн^ б’з(ж) на частичном отрезке [zi-i, я;], запишем заданные условия в точках 2?t-i и хе.
e3(x,-i)=¥>,_1, s3(x,) = <?,-, «з(х,_1 ) = ¥>$_!, si(zi) = s='.
В результате получим систему линейных алгебраических уравнений относительно неизвестных коэффициентов к = ОГЗ:
Ц»0 — <Pi— 11
«i0 + Oil Д,- +	Д’ + а.з д? =
а(1 + 2«,2Д, + За,-3Д’ =
где Д,- = х, - х,_1, i = 1, п.
Нетрудно убедиться, что определитель системы отличен от нуля, и, следовательно, система имеет решение, и притом единственное.
Положим и = (х - Х{_\)/&{. Тогда 0 и 1. Используя кубический интерполяционный многочлен Эрмита, сплайн $з(.г) на частичном отрезке [ж«—i, ж,] можно представить в виде
8з(х) = a(u)<pi-i +0(u)<pi + 7 (и)	1 + 6(ц)<^,	(Ю.9)
где
a(u) = (1 - ц)2(1 + 2u),	= ц2(3 - 2и),
7(ц) = ц(1 - ц)2Д,, 6(ц) = —ц2(1 - ц)Д,.
Из условий построения сплайна «з(я) ясно, что этот сплайн имеет непрерывную производную, а вторая производная мож?1’
10.3. Кубические сплайны одного переменного
289
еТЬ разрывы первого рода. Значит, дефект сплайна $з(ж) равен двум.
г В практических задачах значения производных аппроксимируемой функции могут быть неизвестны. В этом случае роль производных могут играть их приближения, полученные с помощью разделенных разностей. Например, полагают
i = 1, n— 1,
/ Hi	<М2-<М1
<мо — U + Mi)—т------mi —т—’
ZAl	Z12
/	/1	I	\	%	<Mn-l“V?n-2
<Mn = (1 + An-l)---X-----An-1-----A------
An	1
где
\	^t+i	,	i	i
Mi — — ——	, A, — i a — 1 — Мй г — 1, w — 1.
At + ^t+l	At + Zbt+i
Распространенной задачей является построение сплайна дефекта 1, который имеет в узлах сетки заданные значения. Отметим, что кубический сплайн сп + 1 узлом имеет 4/г коэффициентов. Условие, что дефект сплайна равен единице, означает, что во внутренних узлах сплайна совпадают односторонние первая и вторая производные. Это дает 2п — 2 уравнений. Известное значение во внутреннем узле сплайна дает два Уравнения на коэффициенты сплайна в двух примыкающих к Узлу частичных отрезках. Значит, имеем еще 2п - 2 уравнений. Наконец, значения на концах отрезка [а, 6] добавляют еще два Уравнения. Таким образом, всего есть 4п - 2 уравнений, т.е. на Два меньше количества неизвестных коэффициентов сплайна. Для однозначного определения коэффициентов нужны дополнительные условия. Обычно используют два дополнительных Условия, влияющих на поведение функции на концах отрезка 1^4- Наиболее распространенными являются следующие дополнительные условия.
290
10. ИНТЕРПОЛИРОВАНИЕ ФУНКЦИЙ
1.	Если из условий прикладной задачи следует, что аппрОк симируемая функция является периодической, то естественНо добиваться совпадения первых и вторых производных на кон. цах отрезка, т.е. можно потребовать, чтобы
У(а) = У(6), з"(а) = з"(Ь).	(10.10)
2.	Часто считают известными производные на концах от. резка, т.е. требуют, чтобы
s'(a) = ¥>o, «'(&) = У’п.	(10.11)
где и известны.
3.	Можно также зафиксировать на концах отрезка вторые производные
«"(«)= ¥>о', з"(Ь) = <£.	(10.12)
При отсутствии всякой информации о поведении аппроксимируемой функции на концах отрезка можно использовать условия s"(a) = 0, s"((b) = 0, которые называют естественными краевыми условиями. Полученный с учетом этих условий сплайн называют естественным кубическим сплайном.
Теорема 10.1. Интерполяционный кубический сплайн дефекта 1, удовлетворяющий одной из пар (10.10)-(10.12) дополнительных условий, существует, и притом единственный.
◄ Интерполяционный кубический сплайн s(x) дефекта 1 является частным случаем сплайна дефекта 2, и поэтому его можно записать в виде (10.9). Введем обозначения
s,(xi) = mi> i = 0,n.	(10.13)
Тогда, согласно представлению (10.9), на отрезке [х,-ь имеем
s(x) = (1 - u)2(l + 2u)v?j-i 4- u2(3 - 2u)<pi +
+ iz(l - u)2At-7nt_i - u2(l - м)Д,тг-, (10.H)
10.3. Кубические сплайны одного переменного
291
где, яайомним’ u=	Ai = st -zt-i. Функция s(x),
интерполяционный сплайн дефекта 1, непрерывно диффе-внднрУема на [я> Ч при любых значениях коэффициентов mi £ имеет заданные значения ipi в узлах Xi сплайна. Покажем, за счет выбора значений коэффициентов mt можно добить-
& того, что этот сплайн будет иметь непрерывную вторую Ороизводную и удовлетворять выбранной паре дополнительных условий. Другими словами, выбор значений коэффициентов определяется условиями непрерывности второй производной во внутренних узлах сплайна и дополнительными условиями на концах отрезка [а, 6].
Используя представление (10.14), а также соотношение и'х = ssl/Дй находим, что на отрезке [я»-1, zt]
. 6-12u	-4 + 6u -2 + 6u
s (ж) = (w - W-i) д? + m*-i д. +	—*
В узле Xi вычисляем вторые производные слева и справа:
s"(x - 0) - -6—_+ 2m‘~' + 4—
S ( • 0) b Д? + Д; +4Д;’
s"(x. + 0) =	- 4 mi - 2TO|'+I
+	д?+1	4д.+1	^д.+)-
Условия непрерывности второй производной сплайна во внутренних узлах, т.е. уравнения s"(xi - 0) = s"(xi + 0), имеют вид
AiTnt_] + 2mt + щт{+\ = е», i = 1, n - 1,
(10.15)
тде
<A+1 “ Vi
292
10. ИНТЕРПОЛИРОВАНИЕ ФУНКЦИЙ
К этим условиям следует добавить дополнительные услови что приводит к системе из п 4-1 уравнений с п4-1 неизвест’ ными. Рассмотрим эту систему для конкретных вариант^ дополнительных условий.
Для условий периодичности (10.10) система линейных алге^. раических уравнений имеет вид
2тп1 4-Mim2 4- Aimn = ei,
< AtTnt_i 4- 2mt- 4-	= e,-, i = 2, п - 1,
k 4- Anmn_i 4- 2mn = en.
В этой системе первое уравнение получено из равенства (10.15) при i = 1 с учетом равенств то = тп (это равносильно условию s'(a) = и <ро = 4>п (это условие также выполняется для периодической функции). Последнее уравнение системы отражает условие $"(а) = s,z(^)i которое можно записать в виде (10.15) с i = п, причем в силу периодичности следует считать, ЧТО Дп+1 = Д1, ТПп+1 = 7П1 И <^n+i = ф\.
Для дополнительных условий (10.11) имеем систему вида
т0 = <?о.
А^т;_1 +2т, +д,т1+1 = et-, i= l,n- 1, тп = </„,
а в случае дополнительных условий (10.12) — систему вида
’9т	3(^1 - у>0) Aj „
ZTRq 4- ТП\ —
< A,mt_i 4-2mt4-= et, i = l,n- 1,
1 "Ь 2mn —	4~ q
Во всех трех случаях матрица системы является матрицей диагональным преобладанием, причем в двух случаях из тр<?х матрица трехдиагональная. Следовательно, эта матрица невЫ' рождена, а система линейных алгебраических уравнений имерт
10.4. Бикубические сплайны двух переменных
293
доение, и притом единственное [III]. Отметим, что решение ^е<геМЫ в случае трехдиагональной матрицы можно найти с до^ощью метода прогонки. ►
10.4. Бикубические сплайны двух переменных
рассмотрим в плоскости хОу прямоугольник Q = [а, 6]х[с, d] й сетку на нем, порожденную разбиениями Тх = {xq,x}, . ..,жп}, гдеа=*о< хг < ...< хп = Ь, и Ту = {t/0,t/i,ym}, где c = yQ < < 1/1 < ••• < У™ = Функцию $з,з(я»2/) называют бикубическим сплайном (дважды кубическим сплайном), если она удовлетворяет условиям:
1) функция $з>з(х,у) имеет непрерывные частные производные первого порядка в прямоугольнике Q\
2) в каждой клетке Qij = xt] х [yj-i, yj] заданной сетки функция §з,з(х,у) совпадает с многочленом, имеющим степень не выше 3 как по переменному ж, так и по переменному у, т.е. ее можно представить в виде
з з
«з,з(*,з/) =	(Ю.16)
k=01=0
где ЖЕ	уе [^-1, у}].
Точки (zt; 2/J), i = 0, n, j = 0, т, называют узлами бикубического сплайна. Отметим, что при фиксированном переменном, например у, бикубический сплайн является кубическим сплайном по переменному х.
В задачах интерполирования функций двух переменных *Ц-иболее распространенными являются сплайны, узлы которых Совпадают с узлами интерполяции. В качестве примера рассмотрим две задачи интерполяции.
1. Пусть требуется интерполировать функцию <р(х,у), ру-^Водствуясь ее значениями и значениями частных производных	в узлах (xt-; yj) некоторой сетки, заданной
294 10. ИНТЕРПОЛИРОВАНИЕ ФУНКЦИЙ
разбиениями Тх = {х0,х}, ...,хп} и Ту = {y0,yi, ...,ут}. В ка честве приближающей функции возьмем бикубический сплайн узлы которого совпадают с узлами интерполяции дем обозначения
9	=^3' ’,« = 0,1; г = о“п; j = 0Г»п.
oxruys
Тогда задача сводится к построению бикубического сплайна зз,з(^2/) с узлами (xt; t/j), удовлетворяющего условиям
^«3,з(х,-.У,) _	rs_01. i = O- 7 —0~Ш
dxrdys	r,s — v,i, г — и, n, j — и, тп.
Решение поставленной задачи сводится к одномерному случаю. Так как бикубический сплайн является кубическим сплайном по каждому из переменных, то его можно построить, например, для фиксированных значений у = yj, j = 0, тп. Действительно, функция $з,з(я»2/}) является кубическим сплайном с узлами a?i, i = 0, п, для которого в узлах заданы значения функции и значения производной. По этим данным кубический сплайн восстанавливается однозначно. Используя кубический интерполяционный многочлен Эрмита, можно записать
«з,з(г,%)=а(м)¥’“1,;( + /3(и)^?° + 7(м)^’21,;+г(и)^, (10.17)
где и = (х - ж,_1)/Да:г-, Azt = Х{ - Zj-i, а функции а(и), /3(и). 7(и), 5(и) вычисляются по формулам
oi(u) = (1 - u)2(l + 2и), /3(и) = и2(3 - 2и), у(и) = u(l - u)2Axi, 6(и) = -и2(1 - и)Ах{.
Частная производная ^$з,з(я>2/) при фиксированном у явлЯ' ется кубическим сплайном относительно переменного х, к0'
торый при значениях у = yj может быть записан с помощь10
10.4. Бикубические сплайны двух переменных
295
^бического интерполяционного многочлена Эрмита:
~-е3,з(х,Уз) =	j +	+
+ 7(u)rf- i,j +	(10.18)
-£ frt-i, ж»], а также значения частной производной
Зная значения функции $зз(х,у) в точках (ж; yj-i) и (ж; yj), д а^53’3’ С доМбщыо интерполяционного многочлена Эрмита можно восстановить сплайн для точек (ж; у) при у 6 [yj-^yj]:
азз(х,у} = a(v)s3,3(z,«/_,_]) + /?(г)8з,з(г,!/7) +
+ 7(t’)^S3.3(a;,W-1) + ^(v)^S3,3(«1Vj)> (Ю.19)
где v = (у - ^_!)/Д^, &у, = yj - у,_ь а функции a(v), /3(v), ?(и), 5(v) имеют тот же вид, что и выше.
Нетрудно показать, что построенная таким образом функции S3t3(x,y) имеет непрерывные частные производные первого порядка на прямоугольнике Q, а потому является бикубическим сплайном. Из проведенных рассуждений следует, что других бикубических сплайнов, удовлетворяющих заданным условиям, нет. Построенный таким образом бикубический сплайн называют интерполяционным эрмитовым бикубическим сплайном.
2. Другой задачей является интерполирование функции в прямоугольнике Q только по значениям этой функции в уз-интерполяции, т.е. при неизвестных частных производных. В этом случае, как и при одномерной интерполяции, недостаток условий можно восполнить дополнительными требованиями гладкости: решение можно искать в классе бикубических сПдайнов, имеющих непрерывные частные производные второго Порядка. Это приводит к системе уравнений, отражающих
296
10. ИНТЕРПОЛИРОВАНИЕ ФУНКЦИЙ
равенство односторонних частных производных в узлах сплай-на. Однако, как и при одномерной интерполяции, этих урав. нений для однозначного определения сплайна все-таки недоста, точно. Поэтому в систему уравнений, определяющих сплайн, вводят дополнительные условия, связанные с поведением сплайна на границе прямоугольника Q.
В каждой клетке Qij заданной сетки сплайн определяется 16 коэффициентами, входящими в представление (10.16). Следовательно, всего в определении сплайна участвуют 16т?г коэффициентов. Но решение системы уравнений относительно 16тпп коэффициентов — трудоемкое занятие. Непросто даже записать соответствующую систему из 16пгп уравнений для определения этих коэффициентов.
Строить интерполяционный сплайн в рассматриваемой задаче нужно с учетом специфики этой задачи. Напомним, что дважды непрерывно дифференцируемый бикубический сплайн является дважды дифференцируемым кубическим сплайном по каждому переменному. Поэтому построение бикубического сплайна можно свести к одномерному случаю. Действительно, фиксируем, например, переменное у, положив у = у3. где yj — узел разбиения по переменному у. Тогда функция sj(x) = = $з,з(х,у^) является кубическим сплайном с известными значениями в точках х = Xi, i = 0, п, непрерывными первой и второй производными. Его можно определить однозначно, указав дополнительные условия одного из трех ранее рассмотренных типов, относящиеся к точкам (xQ\yj) и	Таким обра-
зом, бикубический сплайн определен на серии прямых у — Уг j = 0, т.
При фиксированном переменном х функция s^fay) является дважды дифференцируемым кубическим сплайном по не-ременному у. Такой сплайн однозначно определяется своими значениями «з1з(ж12/})> j = 0, m, а также дополнительными условиями в точках (ж;уо) и (х\ут). Пусть, например, в вершинах (х0;у0),	(хп;уо) и (zn;2/m) прямоуголЫ'11'
10.4. Бикубические сплайны двух переменных
297
ил Q заданы значения смешанных производных „  S3 3, а в К"	охоу ’
граничных узлах (я»; i/о) и	i = 0, п, заданы значения
частной производной ^5з,з- Частная производная ^зз.з^З/о) Ари фиксированном переменном у = уо является дважды дифференцируемым кубическим сплайном с заданными значениями в точках х = i = Q,n, и с заданными значениями производной на концах отрезка [zo? хп]. Такими данными он однозначно определяется, т.е. однозначно определяются значения частной производной J“s3,3(x,2/) бикубического сплайна при фиксированном значении у = уо. Аналогично эта частная производная определяется и при у = ут. Тем самым оказывается известной производная кубического сплайна $33(3,1/) (я фиксировано) на концах отрезка [г/о> ут], т.е. этот сплайн однозначно определяется по известным значениям в узлах и дополнительным
условиям второго типа.
Итак, для полного и однозначного определения бикубического сплайна, дважды дифференцируемого по каждому переменному, нужно задать дополнительные условия в граничных узлах сплайна, а в вершинах прямоугольника Q дополнительно задать значения смешанной производной второго порядка. Построение сплайна сводится к вычислению трех массивов неизвестных
Ч?=^з.з(*й!б). ™°/ = ^3з(*..%). n'j =^s3.3(xi,yj)-Вычисляемые значения удобно записывать в виде серии прямоугольных таблиц. В табл. 10.1 внутренняя часть содержит известные значения сплайна во всех его узлах, две крайних строки и два крайних столбца отражают дополнительные Условия (известные значения частных производных), при этом ^тыре угловых элемента — это известные значения смешан-производных соответствующего порядка в вершинах пря-^бурольника Q. По записанным в табл. 10.1 значениям строят сНлайны 5зз(х,2/7), j = 0, т, по строкам таблицы. Для этого
298
10. ИНТЕРПОЛИРОВАНИЕ ФУНКЦИЙ
вычисляют значения промежуточных переменных и запод. няют новую таблицу, аналогичную исходной, но без граничны* столбцов. Граничные строки новой таблицы будут содержат^ значения неизвестных mJ®, i = 0, n, j = 0, т.
Таблица 10.1
¥>0т	Л ‘Plm	 <Рпт	¥>nm
• • ¥>01 ¥>Й)	<pQm	фХт	•••	Фпт •	•	• • •	• •	•	• • •	• •	•	• • •	• ¥>oi	¥?и	•••	¥>ш ¥>оо	¥>io	• • •	¥>по	<Рпт 9 • ¥>;°1 ¥>по
¥>00	¥>оо	¥>?о	• • •	¥>°о	¥>по
По столбцам второй таблицы строят кубические сплайны по переменному у, вычисляя значения m}j смешанных производных в узлах сплайна. Наконец, по исходной таблице (см. табл. 10.1) вычисляют неизвестные т^. Совокупность найденных значений тп™, где г и s принимают значения 0 или 1, позволяет с помощью формул (10.17)—(10.19) (с заменой в них на mJJ) восстановить искомый сплайн как эрмитов бикубический сплайн.
10.5. Приближение кривых и поверхностей
При работе со сложными кривыми или поверхностями в процессе конструирования или обработки необходимо иметь их математическое описание с помощью достаточно гладких и простых функций, обеспечивающее необходимую точность. Такое описание можно получить с помощью сплайнов. Мы остановимся на варианте поставленной задачи, когда кривая или поверхность определяется некоторым множеством своих точек, т.е. на задаче интерполирования кривых и поверхностей-
10.5. Приближение кривых и поверхностей
299
Рис. 10.8
Будем исходить из того, что информация о кривой или по-рврхности эаДана в виде декартовых координат у порядочен подмножества точек кривой (поверхности). Сперва остановимся интерполяции кривых.
Пусть на некоторой кривой заданы сдоими координатами точки Pq, А, •••, рп. Координаты точки Pt- обозначим Xi, Uh z<- Простейшим приближением кривой в этом случае является ломаная pQpp-.Pn, вписанная в аппроксимируемую кривую (рис. 10.8). Для аналитического описания этой ломаной вычислим
расстояния между соседними вершинами Д-i и Рг ломаной:
dj = \J(г, - Zi-i)2 + (j/; - j/t-i)2 + (z; - Zi-i)2, г = T“n, и в соответствии с ними выберем разбиение Т отрезка [0,1] точками 0 = т0 < л < ... < тп = 1, полагая
,	i
i = 1, n.
п
п
fc=l
Тогда ребро Pi-iPi ломаной можно задать уравнениями
sx(r) = (l-tt)a:t_i + tt:rt,
sz(r) = (l-u)zi-i + uzi,
(10.20)
т €
где
Ц = дг. > Ат, = г, - 7,-1,	г=1,п.
Формулы (10.20) соответствуют интерполяционному сплайну Первой степени.
Для приближения кривой можно также использовать эрмитовы интерполяционные сплайны. Для этого кроме значений координатных функций аппроксимируемой кривой в узлах ин-^рполяции необходимо использовать и значения производных
300 10. ИНТЕРПОЛИРОВАНИЕ ФУНКЦИЙ
х'т, у'т, z'T этих функций, вообще говоря, неизвестные.
вестные значения производных заменяют разделенными разИ(к стями по формулам
/	xWi-Wo W2 - W]
w0=(l+Mi)A---------Mi-V"—-	(Ю.21)
ZXTi	IAT2	1
. Wt+1 - Wj . Wi-Wi-I	-----г
w; = д,— -----+ А,-—------, «= 1, n - 1,	(10.22)
I , x	.	W„_i^Wn_2
«„-(l + An-j)	An_(	,	(10.23)
где _ Art+i	&Tj
Ari + Ari+i’ Д77 + Дт,+1’ a Wi есть значения соответствующей координатной функции (я(т), у(т) или z(r)) в узлах интерполяции.
Указанные формулы используют, если кривая не является замкнутой. Если же кривая замкнута, то Pq = P/v и вместо формул (10.21), (10.23) используют формулу
,	, Дгп Wi-Wo Ди Wn-Wn-l
wn = w_ =----------------4-------------------. (10.24)
0 n Дт! + Дтп Ди ДТ14- Дтп Дтп
Можно также использовать дважды дифференцируемые кубические сплайны, дополняя значения координатных функций дополнительными условиями (см. 10.3). Если производные, необходимые для постановки дополнительных условий, неизвестны, то используют разделенные разности, как и в случае эрмитовых интерполяционных сплайнов.
Применение сплайнов для приближения поверхностей в целом осуществляется по той же схеме, но при этом необходимо преодолеть несколько трудностей. В конечном счете решение такой задачи сводится к аппроксимации кривых сплайнами оД' ного переменного, причем тип аппроксимации (аппроксимация линейным сплайном, кубическим сплайном, кубическим эрмй' товым сплайном) в данном контексте не является существен' ным и зависит от таких характеристик результатов аппроксИ'
10.5. Приближение кривых и поверхностей
301
1даДЯИ, как точность аппроксимации, гладкость аппроксимирующей Функции, трудоемкость вычислений и т.п.
Поставим задачу следующим образом- Дать аналитическое описание поверхности, если известно некоторое множество точек ; з<), i = ^Ofn, лежащих на этой поверхности (рис. 10.9). В основе аппроксимации
Поверхности лежит ее параметрическое описание в виде
х = x(u,v)y
z = z(u, и)
и сведение задачи к аппроксимации координатных функций z(uyv). Выбор параметрического представления поверхности не является однозначным и может значительно варьироваться. Естественно стремиться к выбору такого параметрического представления, при котором область изменения координат и и и на поверхности является прямоугольником [а, 6] х [с, </], а точкам Pi отвечают значения ut- и и: в этом прямоугольнике, образующие прямоугольную сетку. Если имеет место описанная ситуация, то задача аппроксимации поверхности сводится к простой интерполяции координатных функций.
На практике такой параметризации поверхности, как правило, нет, т.е. нет никакой информации о том, как точкам Р следует сопоставлять значения щ и v,. Такую параметризацию йужно воссоздавать в процессе построения аппроксимации поверхности.
Параметрическое описание поверхности можно рассматривать как задание на этой поверхности криволинейных координат, а криволинейные координаты характеризуются двумя семействами координатных линий u = const и v = const. Потому при аппроксимации поверхности ставят задачу провести ^ерёз заданные точки Pi набор таких кривых на поверхно
302 10. ИНТЕРПОЛИРОВАНИЕ ФУНКЦИЙ
сти, которые можно было бы рассматривать как координатные линии в некоторой системе криволинейных координат на по. верхности. Семейство кривых можно интерпретировать как семейство координатных линий, если никакие две кривые се. мейства не пересекаются. Для точности аппроксимации также важно, чтобы соседние кривые (т.е. кривые, между которыми нет других кривых семейства) были близки друг к другу.
Построив одно семейство кривых, затем можно построить второе семейство координатных линий, соединяя точки уже построенных линий. В результате поверхность разделится на части, которым в соответствующих криволинейных координатах u, v отвечают прямоугольники. Тем самым в координатах u, v возникает сетка, а дальнейшее решение сводится к интерполяции сплайнами двух переменных координатных функций по построенной сетке.
Изложим кратко схему реализации описанного метода аппроксимации поверхности с помощью сплайнов. Будем предполагать, что часть точек лежит на границе поверхности. Выберем на границе поверхности четыре точки Л, В С, D из числа заданных (они будут образами вершин прямоугольника в координатах и, и). Выбор этих точек нужно делать с таким расчетом, чтобы на участках границы между ними оставалось примерно одинаковое количество известных точек. Точки, не
лежащие на границе поверхности, разделим на группы так, чтобы через каждую группу точек можно было провести кривую, соединяющую дугу АВ границы поверхности с дугой DC (значит, в каждой группе точек должна быть одна точка на дуге АВ и одна точка на дуге DC). Такие кривые не должны пере-п	секаться. Допустимо, чтобы часть
/л У^У/^х^с заданных точек поверхности не по-
/ f /f / У пала ни в одну группу. В эти грУп" Z Z-Z /	пы включим множество точек н»
А	в	дуге AD границы области и множе-
Рис. 10.10	ство точек на дуге ВС (рис. 10.10)-
10.5. Приближение кривых и поверхностей
303
По каждой из отобранных групп точек построим интерпо-ционную кривую, которую обозначим L*, k = 0, п, причем ивая Lo обеспечивает приближение дуги 4D, а кривая Ln — йближение дуги ВС. Все построенные кривые можно рас-атривать как интерполяцию некоторых реальных кривых, йсащих на поверхности. Каждая кривая Lk представляет бой набор из трех сплайнов $хДт), $уДт), sZtk(r) с обла-ью определения [0,1] (т.е. т € [0,1]). На практике следует едиться, что построенные интерполяционные кривые не пе-секаются.
На отрезке [0,1], который является областью изменения раметра построенных кривых, сначала выберем некоторое збиение Т = {v0) Vi, •••, vm}, где 0 = v0 <	< ... < vm = 1, и
пислим на кривой Lk координаты точек Pkj, соответствую-ах точкам Vj разбиения Т:
J = 0, Ш, k = 0, П.
Далее, для каждого индекса j по точкам Pkj строим ин-рполяционную кривую Lj, которая описывается тремя ин-{рполяционными сплайнами	Syj(u), sz^(u)y u € [0,1].
встроенные кривые не должны пересекаться. Тогда они будут [ределять второе семейство координатных линий. На отрез-> [0,1] как области изменения параметра кривых Lj выбираем ©биение Т с точками 0 = uq < щ < ... < un = 1 и вычисляем юрдинаты точек
sy,j(ui)i	i i = 0, П, j = 0, Tfl.
На последнем этапе в плоскости uOv на прямоугольнике == [0,1] х [0,1] выбираем сетку с узлами (u,; Vj). По этой ^Ке строим три сплайна двух переменных, которые в узлах имеют значения координат точек Pij. Три этих сплайна Задают искомое приближение рассматриваемой поверхности.
304
10. ИНТЕРПОЛИРОВАНИЕ ФУНКЦИЙ
Описанная схема аппроксимации поверхности дает хорошие результаты, если на поверхности задан достаточно большой набор точек, расположенных в плоских сечениях этой поверхности, которые плавно изменяются. Эта схема применима также к поверхностям типа цилиндра, тора или сферы. При этом специфику поверхности следует учесть при построении сплайнов, имея в виду, что кривые одного из двух семейств, строящиеся на поверхности, будут замкнутыми (для поверхности типа сферы или тора оба семейства состоят из замкнутых кривых). Это реализуется выбором дополнительных условий периодического типа при построении сплайна.
Вопросы и задачи
10.1.	В плоской области D в точках с целочисленными координатами заданы значения функции двух переменных Постррйте интерполяционный сплайн двух переменных первой степени и вычислите его значение в точке А:
a,) D= {(г, у): |х|	1, |у|	1}, f(x,y) = х2 + 2у2 + ху.
4(0,5; 0,5);
б)	D= {(г, у): х2 + у2 ^6}, f(x,y) =2 + 1п(1 + х2) + х2у2. 4(0; 0,5);
в)	D={(x, у}:х2 + ху + у2 $6}, f(x,y) = 1п(1 Ч-х24-у) +Л 4(-1,2;-1,2).
10.2.	В плоской прямоугольной области D в точках с целочисленными координатами заданы значения функции двух переменных /(я,у). Постройте билинейный интерполяционный сплайн и вычислите его значение в точке А:
a.) D= {(х, у): |х| $ 1, |у| 1}, f(x,y) = х2 + 2у2 + ху, 4(0,5; 0,5);
б)	£> = {(*, у): |х|$2, |у|^1}, /(x,y)=2 + ln(l+x2) + xV-4(0; 0,5);
в)	О = {(х, у)-. |х| ^2, |у|^2}, f(x,y) = 1п(1 + х2 + у) + 4(-1,2;-1,2).
Вопросы и задачи
305
10.3.	Постройте приближение заданной кривой эрмитовым интерполяционным сплайном по значениям координат точек Кривой А,(1;0; 0), А2(0,697; 0,717; 0,8), Л3(-0,666;0,746;2,3), Д4(-1,00; 0,04; 3,1), А5 (-0,654; 0,757; 4,0), Ав(0,709; -0,706; 5,5).
10.4.	Постройте приближение заданной поверхности эрмитовым интерполяционным сплайном по значениям координат ее точек
Ai (-1,031; 3,086; 0,563), А3(-0,993; 3,039;-0,568), А5(0,039; 2,001; 0,001), А7(1,148; 3,232;-0,540), Аэ(1,089; 3,284; 0,713), Ап (4,001; 8,288; 0,401),
А2(-1,159; 3,062; -0,011), А4(0,026; 2,000; —0,013), А6(0,042; 2,002; 0,026), А8( 1,283; 3,258; 0,089), Аю(3,650; 8,208;-1,582), А|2(3,330; 8,369; 2,327).
11. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ НА МНОГООБРАЗИЯХ
Теория поверхностей (см. 8) распространяется на общий случай n-мерного арифметического пространства как теория „многомерных поверхностей*, или многообразий. В принципе вполне естественно в развитие теории поверхностей ввести понятие многомерной поверхности как образа функции многих переменных. Такой подход позволил бы объединить и теорию поверхностей, и теорию кривых в пространстве, но у него есть один недостаток. Уже в случае поверхностей мы столкнулись с тем, что такую „заурядную* поверхность, как сферу, целиком не удается представить с помощью функции двух переменных, т.е. сфера как единое целое не укладывается в рамки теории. Выход состоит в том, чтобы с поверхностью ассоциировать не одну функцию, а некоторый набор функций, каждая из которых представляет лишь часть поверхности. Этот подход является развитием идеи, связанной с введением координат па поверхности, которые в теории многообразий являются, вообще говоря, локальными, т.е. действуют в некоторой окрестности заданной точки. Применение функций многих переменных для построения локальных координат позволяет использовать всю мощь дифференциального исчисления, которое, заметим-ориентируется на исследование локальных свойств функций.
11.1.	Определение гладкого многообразия
Под системой координат на произвольном мно^е' стве М понимают правило, которое устанавливает взаимн° однозначное соответствие между точками множества М и Уп°'
11.1. Определение гладкого многообразия
307
^доменными наборами чисел Xi, хп фиксированной длины. Разеваемыми координатами на множестве М. Упоря-оченный набор чисел х\, .хп можно рассматривать как ^pt^McemuuccKud вектор (элемент п-мерного линейного ариф-^щинеского пространства Rn). Таким образом, координаты
на множестве можно ввести с помощью некоторого отображения Л* М “* Rn> являющегося инъекцией (рис. 11.1). Отметим. что, поскольку отображение h является инъекцией, оно имеет обратное отображение hr1: G —> Л/, где G = h(M) С Rn —
область изменения отображения h.
Укажем на некоторое расхождение в основных понятиях теории поверхностей и рассматриваемой в этой главе теории многообразий. В теории поверхностей (см. 8) поверхность задают отображением плоскости в пространство. В теории многообразий оперируют обратными отображениями, т.е. в Данном случае отображением некоторого множества М в пространстве на плоскость. Это различие несущественно, так как и и другие отображения предполагаются инъективными. Оно лишь отражает сложившиеся традиции в этих теориях.
В этой главе под функцией на множестве М будем по-нИмать произвольное отображение множества М в числовую °сь R. Если на множестве М введены координаты с помощью отображения h: М -+G, G С Rn, то каждой функции f на Множестве Л/ соответствует скалярная функция многих перечных foh-'-.G^R (рис. 11 .2), которую можно рассматривать как представление функции f в заданных координатах
308
II. ТЕОРИЯ МНОГООБРАЗИЙ
на множестве. Отметим, что любая скалярная функция мно. гих переменных д: G -+ R является представлением некоторой функции на множестве М, а именно функции g°h.
Рис. 11.2
Везде далее под гладким отображением Rn в R™ будем понимать функцию многих переменных, имеющую непрерывные производные всех порядков*. Отображение /: М —>R множества Л/, на котором заданы координаты А: Л/ —> G, G R7‘. будем называть гладкой функцией (непрерывной функцией) на множестве М, если на множестве G гладкой (непрерывной) является скалярная функция
Замечание 11.1. Обратим внимание на то, что о природе множества М ничего не сказано, и в качестве этого множества может быть множество любой природы. В частности, можно рассмотреть множество М С Rm. Но в этом случае понятие непрерывной функции уже было определено ранее (см. 1-4)-Естественно в этой ситуации добиваться того, чтобы оба понятия непрерывной функции совпадали. Нетрудно показать-что для такого совпадения достаточно, чтобы отображение h: М —> G, G С Rn, задающее на М координаты, было го-М0* морфизмом, т.е. являлось непрерывным на М и имело обратное
*Вся излагаемая далее теория распространяется и на случай, косДа под гладким отображением понимается отображение, г раз непрерь,вН° дифференцируемое. См., например: Мищенко А.С., Фоменко А. Т.
11.1. Определение гладкого многообразия
309
о*гобРажение’ непрерывное на G (это вытекает из теоремы 1.9 о непрерывности сложной функции).
Аналогичен более общий случай, когда множество М является метрическим пространством: в метрических пространствах также введено понятие непрерывного отображения. В ситуации, когда среди функций на множестве М уже тем или иным способом выделен класс непрерывных функций, будем рассматривать, специально не оговаривая это, только такие координаты, при введении которых не возникает разночтений в отношении непрерывных функций. В частности, для множеств д/ С Rn ограничимся лишь координатами, задаваемыми с помощью гомеоморфизма h.
Сказанное относится и к понятию гладкости. Если М — открытое подмножество в Rn, то мы имеем две интерпретации понятия гладкого отображения: как функции многих переменных, определенной на открытом множестве, и как функции на множестве, на котором введены координаты некоторым отображением h. Обе эти интерпретации не различаются, если отображение h и обратное к нему отображение h~x являются гладкими.
Пример 11.1. В качестве множества М выберем окружность радиуса R. В плоскости окружности введем прямоугольную систему координат с началом в центре окружности. Кажется естественным в качестве координаты на рассматриваемой окружности взять угол ср, отсчитываемый от оси абсцисс Против часовой стрелки (рис. 11.3, а). Декартовы координаты Точки окружности связаны с соответствующим углом у? соотношениями
{х = Rcos<p.
(11.1) у = Hsin
Зт« соотношения определяют отображение д, взаимно однозначно отображающее полуинтервал [-7Г, 7г) в R2. Отображение непрерывно, однако обратное к нему отображение h не являйся непрерывным в точке Р(-1;0), так как точкам верхней
310
//. ТЕОРИЯ МНОГООБРАЗИЙ
полуокружности в окрестности точки Р соответствует угол близкий к тг, а точкам нижней полуокружности — угол, близкий к —тг. Одну карту на всей окружности Л7 ввести не удается.
Рис. 11.3
Выкидывая точку Р, т.е. сужая отображение (11.1) на интервал (-7г,7г), получаем гомеоморфизм, и окружность с выколотой точкой оказывается гомеоморфной интервалу прямой. На самом деле выбор выбрасываемой точки не является существенным. Например, окружность без точки Q(l, 0) оказывается гомеоморфной при рассматриваемом отображении интервалу (0,2тг), а если выкинуть точку (0, 1), то для получения гомеоморфизма нужно рассмотреть отображение (11.1) на интервале (лг/2,5тг/2). Таким образом, хотя нам не удалось ввести одну систему координат на всей окружности, мы можем оперировать двумя системами координат, например выбирая угол € (-тг, тг) для всех точек окружности, кроме Р. и угол Е (0,2тг) для всех точек окружности, кроме точки Q (см• рис. 11.3,6). Две системы координат в совокупности накрывают всю окружность. #
Этот пример, как и аналогичный пример с цилиндро*1 (см. пример 8.4), показывает, что не следует рассчитывать на построение координат, единых на всем множестве М. Нужно ориентироваться на набор из нескольких систем координат» действующих в разных частях множества. Такой подход не
11.1. Определение гладкого многообразия
311
мешает в исследовании локальных свойств, т.е. в окрестности заданной точки, но позволяет, например, окружность рассматривать как единый объект. Правда, при этом возникает ситуация, когда в некоторых частях множества М одновременно действуют несколько систем координат. В этой ситуации нужно уметь переходить от одних координат к другим, или, как говорят, пересчитывать координаты. Итак, в этой главе мы будем рассматривать множество М в совокупности с системами координат на ее частях (рис. 11.4).
Рис. 11.4
Предлагаемый подход используется в географии, когда земную поверхность представляют в виде атласа карт. Географическую карту с геометрической точки зрения можно трактовать как систему координат на той части земной поверхности, которую она изображает.
Если на подмножестве U С Л/, заданы две системы координат отображениями h: U -*О\ С Rn и k: U —С Rn, то функция /, определенная на множестве (7, может быть представлена в координатах двумя способами. Естественно считать, что ®сли функция представлена как непрерывная в одних координатах, то ее представление в других координатах также должно быть непрерывным. Иными словами, функция f о Л-1: О\ —> R Непрерывна тогда и только тогда, когда непрерывна функция fQk~l: О2 ->R (рис. 11.5). В качестве функции / можно взять Координатные функции отображений h и к. Например, i-я координатная функция отображения h в координатах, определяемых этим отображением, имеет вид ^(a?i,...,zn) = zt- и является Непрерывной. Значит, она непрерывна и в координатах, опре-
ЗГ2
11. ТЕОРИЯ МНОГООБРАЗИЙ
деляемых отображением к. Отсюда приходим к условию, что композиция h<>k~x, представляющая собой функцию многих ременных, отображающую О2 в <?i, должна быть непрерывной. То же заключение получаем и относительно „симметричного1* варианта k<>h~x.
Аналогично можно рассуждать и относительно гладких функций. Нас будут интересовать прежде всего гладкие функции на множестве М. Поэтому естественно ограничиться только такими координатами на множестве М, область изменения G которых является областью в Rn. Эти рассуждения приводят к следующим определениям.
Определение 11.1. Картой (локальной системой координат} на множестве М называют пару (t7, Zi), где U подмножество М, a h — взаимно однозначное отображение U на некоторую область пространства Rn. Подмножество U называют областью определения (или носителем) карты, число п — размерностью карты, а координаты точки h(P) б Rn — координатами точки Р € М в локальной системе координат (U,h).
Иногда картой мы будем называть только отображение h. имея в виду, что это отображение, вообще говоря, является частичным и само задает свою область определения U.
Определение 11.2. Карты (U,h) и (У, к) на А1, носители которых пересекаются по непустому множеству W = U О V *
11.1. Определение гладкого многообразия
313
называют согласованными, если множества h(W) и &(W) являются открытыми в Rn, а взаимно обратные функции многих переменных k<>h~l и hok~x являются гладкими (рис. 11.6). Карты, носители которых не пересекаются, также будем считать согласованными.
Рис. 11.6
Если карты (U,h) и (V,k) согласованы, то функции многих переменных koh~x и hok"1 являются гладкими и отображают область на область. Из этого следует, что размерности карт совпадают (хотя доказать это непросто). Функции многих переменных и h<>k~l в теории многообразий известны как отображения перехода, а их координатные функции — как функции перехода. Бели координаты точек в системе координат (U,h) обозначить через :q, ..., хп, а в системе координат (V,k) — через ..., уп, то отображения перехода можно записать в виде
t/t — J/t (*^1, • • • । *^п) ।	® — 1»
^ = 2:t(t/i,...,t/n), г = Т7п.
Здесь функции Х{(у\,...,уп) и yi(x\,...,xn), связывающие две системы координат, и есть функции перехода. Отметим, что Каждая карта согласована сама с собой, так как в этом случае отображение перехода есть тождественное отображение.
Определение 11.3. Набор карт (Г7аЛл) на множестве Л/ Называют атласом этого множества, если все карты набора
314
11. ТЕОРИЯ МНОГООБРАЗИЙ
согласованы, имеют одинаковую размерность, а их носители н совокупности накрывают множество М, т.е. Ut7a = М.
or
Пример 11.2. Рассмотрим отображение д: Rm -> Rn, т < < п, из линейного арифметического пространства R™ в линейное арифметическое пространство Rn, т < п, которое определяется системой уравнений
+ Цц£1 “Ь •••*{" ®lm^m» < ..........................
k Хп = ®nl^l “Ь • • • “I" ^пт^т?
(11.2)
где (£ь tm) 6 Rw, (xi, ..., zn)eRn.
Записанная система уравнений представляет собой систему линейных алгебраических уравнений относительно координат £1, tm в области определения отображения. Это отображение инъективно, если ранг матрицы системы максимален и равен т [IV]. Если д инъективно, то множество М = </(Rm) при т > 1 будем называть т-мерной плоскостью в Rn. а при m= 1 — прямой в Rn. При этом систему уравнений (11.2) будем называть параметрическими уравнениями т-мер-ной плоскости (прямой при т= 1), а переменные £i, .... tm — параметрами т-мерной плоскости.
В случае m = 1 система параметрических уравнений (11.2) упрощается:
Х\ = Xi + ct\t^
Ей можно придать простой геометрический смысл. Свободные члены г= 1,п, в правой части определяют точку, через которую проходит прямая, а коэффициенты а{ задают вектор, называемый направляющим вектором прямой.
11.1. Определение гладкого многообразия
315
Рассмотренный пример можно расширить следующим образом. Система линейных алгебраических уравнений
(&ц£1 + + .............................. (11.3) Ьк1 4" • • • “Ь Ъкп^п =
ранг матрицы которой максимален и равен к (в предположении, что к < п), задает в Rn (п-&)-мерную плоскость (прямую при п-к = 1). Действительно, общее решение системы (11.3) имеет вид (11.2), где т = п - к. При этом (ж?,...,х°) будет частным решением системы (11.3), а арифметические векторы а, = (ан, ..., апг), г = 1, тп, — фундаментальной системой решений соответствующей однородной системы. Систему уравнений (11.3) естественно назвать общими уравнениями m-мерной плоскости (прямой при п — к = 1). Таким образом, преобразование общих уравнений m-мерной плоскости (прямой) в параметрические сводится к поиску общего решения системы линейных алгебраических уравнений. Свободные переменные, выбранные при решении системы, становятся параметрами m-мерной плоскости, и их можно выбрать в качестве координат этой плоскости.
Параметрические уравнения (11.2) m-мерной плоскости М легко позволяют ввести на этой плоскости атлас из одной карты. Рассмотрим карту (Л1,Л), где h — отображение, обратное отображению д'. Rm -> Л/, заданному параметрическими уравнениями. Эта карта накрывает m-мерную плоскость. Можно показать, что отображение h непрерывно. Непрерывность отображения д = Л-1 очевидна.
Пример 11.3. Обозначим через жо, «ь ..., хп координаты в Rn+1 и рассмотрим множество Sn точек, координаты которых Удовлетворяют уравнению
Яо + Ж1 + ... + ** = !•	(Н-4)
Множество Sn представляет собой п-мерную сферу. Введем в стереографические координаты. Рассмотрим в Rn+1
316
11. ТЕОРИЯ МНОГООБРАЗИЙ
п-мерную плоскость xq = 0. Отметим на сфере Sn. север. ный полюс N, имеющий координаты (1, 0, ..., 0), и юле. ный полюс S с координатами (-1, 0,	0). Пусть Р —
= (^о* xii •••’ хп) — произвольная точка сферы, отличная от N. Проведем через точки N и Р прямую, которая будет иметь направляющий вектор — (жд- 1 ж? ...	. Параметри-
ческие уравнения этой прямой имеют вид
ж0= 1 + (ж£- l)t,
I Tt Tl	I
Поставим точке Р в соответствие точку Q пересечения прямой NP с плоскостью xq = Q. Эта точка определяется значением параметра t = (1 - «§) 1 прямой, и ее координаты имеют вид
Отбрасывая первую нулевую координату, получим точку в Rn. Таким образом, задано отображение h: U —> Rn, где V = = Sn \ {/V]. Нетрудно показать, что это отображение является взаимно однозначным и тем самым вводит на п-мерной сфере Sn карту (U,h) размерности п (на рис. 11.7 изображен двумерный случай). Эта карта не покрывает всю сферу, так как за пределами ее носителя осталась точка JV. Построим аналогичным образом карту (V,fc), заменив северный полюс N южным S. В этом случае V = 5П\{5}. Две карты (U,h) и (V,fc) в совокупности покрывают п-мерную сферу и образуют ее атлас. Однако, чтобы это можно было утверждать, необходимо доказать согласованность этих карт.
Чтобы доказать согласованность двух карт (U,h) и (УЛ) нужно найти пересечение их носителей W = U О V, убедиться-что образы множества W при отображениях huh являются открытыми, найти функции перехода, проверить их на гладкость
11.1. Определение гладкого многообразия
317
Рис. 11.7
В данном случае W = Sn\ {S, N}. Образом множества IV при любом из двух отображений является множество Rn\{0), открытое в Rn. Точки множества W характеризуются своими координатами a:0, a?i, хп в Rn+1 и в то же время координатами т/i, ..., уп в карте ((/, h) и координатами z\, ..., zn в карте (V,k). Из структуры отображения h, описанной выше, видим, что оно описывается уравнениями --------------------------------------
t/t = ---, г =1,71.
1 — Xq
Для отображения ку соответствующего стереографической проекции из южного полюса, имеем аналогичное представление
Добавив к полученным уравнениям уравнение сферы, получим систему
•Р»	-=-
t/, = -----, г=1,п,
1 — xq
Z,’ —	, l — 1, 7Z>,
1 +
Xq + ®1 +- + »J= 1.
318
11. ТЕОРИЯ МНОГООБРАЗИЙ
связывающую все три группы координат. Из этой системы необходимо исключить переменные ®о, •••, хп. Из первой группы уравнений находим х, = од(1 - жо), i = 1, п. Подставив найденные выражения переменных хг в последнее уравнение системы, получаем
О -хо)2 £у? = 1 -®о-»=1
откуда
Возвращаясь к исходной системе, из первой и второй групп уравнений находим
1	2? О ------
г1=У1Т~,---’ г=1’П’
1+^0
Учитывая равенство (11.5), делаем вывод, что
yi . -j— , t=l,n.
Еу2
1=1
Аналогичным образом можно получить и обратные функции перехода & =	, г = 1,п.
Е^ 1=1
Итак, функции перехода найдены. Отметим, что они распространяются на все точки n-мерной сферы, кроме двух ее п
полюсов. Это означает выполнение неравенств £ t/f О и п	*=1
52 *1 0, так как нулевые значения всех координат yi соот-i=i
ветствуют южному полюсу, а нулевые значения всех координат Zi — северному полюсу. В области Rn\ {0}, которая описывает-
11.1. Определение гладкого многообразия
319
СЯ каждым из этих неравенств, все функции перехода являются бесконечно дифференцируемыми. Следовательно, карты (U,h) л (V,fc) согласованы и образуют атлас на сфере Sn. #
Пусть М — множество с заданным на нем атласом. Для произвольной точки Р 6 М можно выбрать карту ((/, А), в носитель второй входит точка Р. Множество h(U) в Rn является областью и потому открыто. Рассмотрим некоторую окрестность О С h(U) точки h(P). Полный прообраз h~x(O) множества О назовем окрестностью точки Р на множестве М.
Введение понятия окрестности на множестве с атласом позволяет распространить на такие множества и некоторые другие термины. Подмножество G С М назовем открытым множеством на М, если оно вместе с каждой своей точкой целиком содержит и некоторую окрестность этой точки. Подмножество А С М будем называть замкнутым множеством на Л/, если дополнение М \ А этого подмножества является открытым на Л/.
Отметим, что понятие открытого (замкнутого) множества в определенном смысле не зависит от выбора карты. Если (U,h) и (V,fc) — две согласованные карты, накрывающие точку Р, то достаточно малая окрестность точки Р, построенная с помощью карты ((/,/i), является окрестностью и в карте (V,k). Действительно, отображение k<>h~x является непрерывным и взаимно однозначным отображением открытого множества h(W) на открытое множество Ar(W), где W = U А V. При этом лю-бре открытое подмножество G С fc(W) имеет полный прообраз при отображении k<>h~x, являющийся открытым множеством. Таким образом, окрестности точки Р, целиком попавшие в W, будут окрестностями и в карте и в карте (V\k).
Пример 11.4. На плоскости R2 рассмотрим два непе-Ресекающихся множества: прямую Mi = {(а:, у): t/ = 0} и луч 4={(т, у): у = 1, х 0}. На их объединении М = Mi U Mj Введем атлас, состоящий из двух карт (С7, Л) и (V,fc). Пусть ^ = Mi, Л(х,0) = г, V — объединение луча Мг с множеством
320
11. ТЕОРИЯ МНОГООБРАЗИЙ
точек прямой Mi, имеющих отрицательную абсциссу (х < 0). к сопоставляет точке множества V ее абсциссу, т.е. к(х,у) = .?• (рис. 11.8).
Рис. 11.8
Легко увидеть, что две введенные карты покрывают множество М, а отображения koh~l и	представляющие
собой тождественное отображение отрицательной части числовой прямой в себя, являются гладкими. Поэтому карты ((/,/?) и (V,k) согласованы и образуют атлас на множестве М.
Обратим внимание на то, что в рассмотренном множестве с атласом нарушаются некоторые представления, привычные в рамках дифференциального исчисления и непрерывных функций. Действительно, если у двух различных точек Р\ = (0, 0) и Р2 = (0, 1) взять окрестности в М, то эти окрестности будут иметь общую часть, состоящую из точек с отрицательной абсциссой. Функция, непрерывная на М, обязана в точках Р\ и Ръ принимать одно и то же значение. #
Последний пример показывает, какие ситуации при построении атласа являются нежелательными. Такие ситуации не возникают, если множество М с атласом удовлетворяет усло-
вию отделимости, гласящему, что любые две точки множества М /	м ___ X.	_
Z	X X имеют непересекающиеся окрест-
I \р) к 07 7 ности (точки Р и Q на рис. 11.9)-
Точки, имеющие непересекающиеся окрестности, называют отде~
Рис. 11.9	лимыми точками. Таким обра~
11.1. Определение гладкого многообразия
321
зом, условие отделимости на множестве М означает, что любые две точки этого множества являются отделимыми.
Замечание 11.2. Так как любые две точки в Rn отделимы, то условие отделимости на множестве с атласом может нарушаться только для тех пар точек, которые нельзя накрыть одной картой атласа. Действительно, если на множестве Л/ задан атлас и точки Р, Q принадлежат носителю U карты (P,/i) из заданного атласа, то в области h(U) в Rn точки h(P) и h(Q) имеют две непересекающиеся окрестности Gp и Gq. Тогда множества h~x(Gp) и h~x(Gq) будут непересекающимися окрестностями точек Р и Q на множестве М. Отсюда, в частности, следует, что условие отделимости выполняется в случае, когда атлас состоит из одной карты.
Предположим, что множество М является подмножеством Rm при некотором т. Тогда условие отделимости для атласа {(Ua,ha)} на М выполняется, если каждое отображение Л,,, как отображение множества из Rm в некоторое множество из Rn, является гомеоморфизмом. Действительно, пусть Р и Q — две различные точки множества Л7, точка Р попадает в карту а- точка Q — в карту	Так как в R7n вы-
полняется условие отделимости, то в Rm точки Р и Q имеют непересекающиеся окрестности VJ и V2. Покажем, что множества Vi A Ua и V2 A Up являются окрестностями точек Р и Q на множестве М. Можно доказать, что при гомеоморфизме образ любого открытого множества является открытым Множеством. Поэтому, так как отображение ha является гомеоморфизмом, образ hQ(V\ QUa) первого множества является открытым в Rn. Значит, само множество Ц A Ua является окрестностью точки Р в М. Аналогично множество V2 A U^ является окрестностью точки Q в М. Поскольку Ц A V2 = 0.
и (Vi A Ua) A (V2 A Up) = 0. Таким образом, точки Р и Q Имеют непересекающиеся окрестности в М и потому являются °тДелимыми на множестве Л/.
322
11. ТЕОРИЯ МНОГООБРАЗИЙ
Определение 11.4. Множество М с заданным на нем конечным или счетным атласом*, удовлетворяющее условию отделимости, называют (гладким) многообразием. Размер ность п карт атласа, заданного на Л/, называют размерностью многообразия М. При этом М называют п-мерным многообразием.
Согласно этому определению, окружность с атласом из двух карт (см. пример 11.1), тп-мерная плоскость с атласом из одной карты (см. пример 11.2), n-мерная сфера с атласом из двух карт (см. пример 11.3) являются соответственно одномерным, 77г-мерным и n-мерным многообразиями.
На многообразии помимо карт из заданного атласа можно вводить и другие карты. Например, вместо карты ((/,/i) можно использовать карту ((/,Л), где U — открытое подмножество ( ah — сужение отображения h на подмножество U. Очевидно, что такая замена не играет сколько-нибудь существенной роли.
Среди карт, которые можно ввести на множестве Л/, есть карты, которые согласованы со всеми картами заданного атласа, а есть карты, которые с картами атласа не согласованы. Если карта (U.h) согласована со всеми картами заданного атласа многообразия Л/, то мы будем называть ее картой на многообразии М. Множество всех карт на многообразии Л/ образует атлас, который содержит в себе как часть изначально заданный атлас. Совокупность всех карт на многообразии мы будем называть максимальным атласом этого многообразия или гладкой структурой. Отметим, что максимальный атлас не является счетным. Например, в R в качестве карт можно рассматривать любые пары (/,id/), где / — интервал, а id/ — тождественное отображение этого интервала. Очевидно, что все эти карты согласованы между собой, но их множество несчетно.
* Атлас называют конечным (счетным), если он, как множество карт-есть конечное или счетное множество.
11.2. Примеры многообразии
323
11.2. Примеры многообразий
Существует много примеров многообразий. Так, само линейное арифметическое пространство Rn является многообразием, если выбрать атлас из единственной карты, заданной тождественным отображением на всем Rn. Многообразием также будет и любая область в Rn, единственную карту на которой также можно задать тождественным отображением. Очевидно, что в каждом из этих случаев выполняется условие отделимости, так как атлас состоит из единственной карты (см. замечание 11.2). Остановимся на более сложных примерах многообразий.
Пример 11.5. Регулярная поверхность S в пространстве, заданная гладкой функцией F: U С R2 —> S, есть двумерное многообразие. Функция F в соответствии с определением регулярной поверхности является гомеоморфизмом. Атлас на поверхности можно выбрать из одной карты F~l:S—с областью определения S. Условие, чтобы карты атласа были согласованы, в данном случае тривиально. Также очевидно, что поверхность с указанным атласом удовлетворяет условию отделимости (см. замечание 11.2). #
Во многих случаях многообразия возникают как множество решений некоторой системы, вообще говоря, нелинейных уравнений. Нельзя утверждать, что произвольная система нелинейных уравнений определяет многообразие: множество решений такой системы может состоять из нескольких точек или вообще является пустым. Чтобы система нелинейных уравнений определяла многообразие, левые части уравнений должны Удовлетворять определенным условиям. О них — следующая Теорема.
Теорема 11.1. Пусть F: Rm -> Rfc, т > к, — гладкое отображение и М С Rm — непустое множество решений системы Уравнений F(x) = 0. Если в каждой точке множества М ранг
324
11. ТЕОРИЯ МНОГООБРАЗИЙ
матрицы Якоби отображения F максимален и равен fc, то множество М является гладким (т-А’)-мерным многообразием.
4 Для фиксированной точки д?о € Л/ в матрице Якоби F'(zo) выберем базисный минор. Для упрощения изложения будем предполагать, что этот минор, в который входят все строки матрицы Якоби, расположен в последних к столбцах этой матрицы. Группу из первых т — к координат точки х 6 обозначим через z, группу последних к координат — через у, а отображение F(x) запишем в виде F(z,y). Тогда условие, что минор в последних к столбцах является ненулевым, можно записать в виде det F'(zo,t/o) / 0» где (zq, уо) = xq. Согласно теореме о неявной функции, существует окрестность U С R'" точки XQ, в которой система уравнений F(z,t/) = 0 разрешима относительно группы переменных у, т.е. множество А/ПГ точек (z, у) можно описать в виде t/ = <p(z), где функция многих переменных дифференцируема в некоторой окрестности точки zq 6	Согласно той же теореме, матрица Якоби
функции <yp(z) имеет вид
т.е. частные производные координатных функций y?(z) выражаются с помощью арифметических операций через композиции частных производных координатных функций F(z,y) с функцией <p(z). Используя это обстоятельство, с помощью метода математической индукции можно показать, что в случае гладкого отображения F(z,y) отображение y?(z) является гладким.
На множестве U = М П U рассмотрим проекцию h(z,y) = которая на U является непрерывным отображением. Так как координаты точки (z, у) рассматриваемого множества связаны соотношением y = <p(z) с помощью гладкого (значит, непрерыв-ного) отображения то обратное к h отображение
= (z, <^(z)) непрерывно. Таким образом, определена кар'Га (F,/i), причем соответствующее отображение является гомр0' морфизмом. Такая карта может быть построена в окрестное!’”
11.2. Примеры многообразий
325
любой точки множества М. Можно показать, что из множества всех таких карт можно выбрать Не более чем счетное подмножество согласованных карт, в совокупности накрывающих М. Значит, на множестве М можно задать не более чем счетный атлас из карт рассмотренного вида.
Докажем согласованность любых двух построенных карт. Пусть в окрестности точки xq заданы две карты	и
((/гЛг)* Предположим, что отображение, обратное h\, имеет вид х = (z, <Х2))- Тогда отображение перехода можно представить в виде h,2(zy^>(z)). Отметим, что, согласно построению карт, отображение I12 является ограничением на U2 некоторой проекции /: RTn —> Rm“\ являющейся гладкой функцией многих переменных. Следовательно, композиция h2(z,ip(z)) = f(z,<p(x)) является гладкой функцией в силу гладкости функции <p(z). Аналогично можно показать, что и обратное отображение /цоД“1 является гладким. Для этого нужно лишь по-другому сформировать группы координат z и у точки х Е RTn.
Наконец, отметим, что множество Л4 с выбранным атласом удовлетворяет условию отделимости, так как отображение каждой карты атласа является гомеоморфным (см. замечание 11.2). ►
Следствие 11.1. Пусть F: Rm R*’, т > к, — гладкое отображение и R*. Непустое множество М = F-1(c) является многообразием размерности т — к, если во всех точках этого множества матрица Якоби F'(x) имеет максимальный ранг, равный к.
Действительно, достаточно к отображению F(x) = F(x) — с применить теорему 11.1. ►
Замечание 11.3. Как следует из доказательства теоремы Н.1, построение координат на многообразии, заданном системой уравнений, связано с решением этой системы относительно Насти переменных, причем решение такой системы строится в
326
11. ТЕОРИЯ МНОГООБРАЗИЙ
целом по той же схеме, что и решение системы линейных алгебраических уравнений. В заданной точке xq нужно вычислить матрицу Якоби и выделить в ней базисный минор. Этот минор позволяет разделить переменные на две группы: базисные (в доказательстве эта группа обозначена символом у) и свободные (группа переменных z). Каждая точка множества решений, достаточно близкая к точке xq, однозначно определяется значениями свободных переменных, т.е. свободные переменные и есть координаты точки на многообразии.
Пример 11.6. Теорема 11.1 выявляет обширный класс многообразий. Согласно этой теореме, три основные кривые второго порядка (эллипс, гипербола, парабола) являются одномерными многообразиями. Действительно, достаточно обратиться к каноническим уравнениям этих кривых и проанализировать их с точки зрения 11.1. Например, каноническое уравнение эллипса имеет вид
-+^=1
а2 Ь2 ’
или f(x,y) = Q, где функция
f(x,y)= ^2 + - 1
является гладкой в R2. Вычислим матрицу Якоби функции
Видим, что ранг этой матрицы является нулевым (меньше числа строк) лишь в точке (0, 0), которая не принадлежит эллипсу. Значит, все условия теоремы 11.1 выполнены и эллипс является гладким одномерным многообразием.
Пример 11.7. Аналогично предыдущему примеру заключаем, что поверхности второго порядка — эллипсоид, гиперболоиды, параболоиды, три вида цилиндров второго порядка
11.2. Примеры многообразий
327
являются двумерными многообразиями. Однако конус многообразием не является. Действительно, каноническое уравнение конуса имеет вид
х2 у2 z2 а2 + Ь2 с2
Девая часть этого уравнения — многочлен, определяющий гладкую функцию f(x,y,z). Матрица Якоби этой функции в произвольной точке (ж, г/, z) равна
2г\
s)
Ее ранг равен нулю в единственной точке (0, 0, 0), но эта точка находится на конусе, и условия теоремы 11.1 не выполняются.
Теорема 11.1 дает лишь достаточные условия того, что множество решений системы уравнений является многообразием. Поэтому нарушение этих условий еще не означает, что множество решений системы не является многообразием. Однако в случае конуса условия теоремы нарушаются именно в силу того, что конус не является многообразием: для любой сколь угодно малой окрестности точки (0, 0, 0) часть конуса, попавшая в эту окрестность, не является гомеоморфной какой-либо области в R2 (см. пример 8.2). Другими словами, в окрестности начала координат не существует карты (t/,/i), для которой отображение h является гомеоморфизмом
Пример 11.8. Если /: G С Rn -» Rm — гладкая функция многих переменных, заданная на открытом множестве G, то график этой функции является гладким многообразием. Действительно, график функции / описывается векторным Уравнением f(x) - у = 0, и в данном случае выполнены все условия теоремы 11.1. А это и значит, что график рассматриваемой Функции является многообразием.
Последний пример не просто частный случай доказанной Теоремы. Основная идея доказательства теоремы 11.1 как раз
328
И. ТЕОРИЯ МНОГООБРАЗИЙ
и состоит в том, что локально множество решений системы нелинейных уравнений при заданных условиях можно рассматривать как график некоторой функции многих переменных. Требование гладкости функции F в формулировке теоремы нужно для того, чтобы обеспечить возможность такого представления. Но в нашем случае мы уже имеем график функции и требование гладкости становится излишним. Действительно, если функция /: G С Rn -» Rm является непрерывной на открытом множестве G, то отображение h(x,y) = х, заданное на графике функции /, т.е. на множестве
Г(/)={(х, y)€Rn+m:y-/(x)},
является непрерывным и имеет обратное отображение h~x (ж) = = (ж, /(ж)), которое также непрерывно. Поэтому на Г(/) можно ввести атлас из единственной карты (Г(/),Л), задающий структуру гладкого многообразия.
Из приведенного рассуждения следует, что, например, полуконус х2 + у2 - z2 = 0, z 0, является гладким многообразием, хотя и не относится к гладким поверхностям (в точке (0, 0, 0) нет касательной плоскости). Таким образом, понятия „гладкое многообразие" и „гладкая поверхность" различаются.
Пример 11.9. Отображение F: R2—>R3, имеющее вид
((6 4- acosVO cos<^\
(b + acosil>)s\n<p I, 6>a>0, a sin V’	/
задает в пространстве mop (рис. 11.10, а). Это отображение является гладким, но не инъективным, так как оно периодическое по каждому из переменных и ф. Область определения можно было бы ограничить квадратом 0 $ $ 2тг, 0 $ ф 2ff или любым другим квадратом со стороной 2тг. Но отображение квадрата в тор не будет взаимно однозначным на сторонах квадрата. Устанавливая соответствие между точками тора и
11.2. Примеры многообразий
329
точками квадрата, видим, что противоположные стороны квадрата „склеиваются4* (стрелки на рис. 11.10, б указывают, как следует склеивать стороны квадрата: склеиваются стороны, обозначенные одной буквой, причем при склеивании стрелки совмещаются).
a	б	в
Рис. 11.10
Построим на торе атлас, превращающий тор в гладкое многообразие. В R2 рассмотрим четыре открытых квадрата (11.10, в), которые описываются неравенствами
Ох
О2 Оз
О4
0 < v? < 2тг, — 7Г < 9? < 7Г, 0 < ^ < 2тг, -тг < v? < тг,
0 < < 2гг, 0 < ф < 2тг, — 7Г < V’ < ТГ, — ТГ < ф < 7Г.
Ограничение отображения F на каждый квадрат Оп как функция многих переменных вида R2 R3, является гомеоморфизмом. Значит, для каждого г= 1,4 определено непрерывное отображение hi множества = F(Oi) в квадрат Oi € R2, обратное к ограничению отображения F на этот квадрат. Тем самым на торе определены карты ((4,/it), i = 1,4. Докажем согласованность любой пары этих карт. Из соображений симметрии Достаточно рассмотреть лишь одну пару карт. Пусть это бу-ДУт карты (f/i,/ij) и (U2J12). Обозначим W = lj\r\U2 и заметим, Нт° Ztj (W) = Оц U012, h2(W) = O12UO22, где Оц, O12, О22 -открытые не пересекающиеся прямоугольники, определяемые
330
П. ТЕОРИЯ МНОГООБРАЗИЙ
неравенствами
Он:
On :
O22 :
я < 92 < 2яг, 0 < ф < 2тг, О < </? < тг, 0 < < 2тг, -тг<<^<0, 0 < ^ < 2тг.
При этом отображение	оставляет на месте точки
прямоугольника 012, а точки прямоугольниками параллельно сдвигает в прямоугольник O22:
,)(¥’.^) = (v,-2’r> V») 6С>22-
Мы видим, что отображение /i2«/ii~’ гладкое. Аналогично доказывается гладкость обратного отображения. В результате заключаем, что две взятые карты являются согласованными.
Носители Ui четырех построенных карт в совокупности накрывают тор, так как они на плоскости рОф накрывают квадрат -тг < </? < 2тг, -тг < < 2тг, образом которого является весь тор (см. рис. 11.10, в). Условие отделимости выполняется согласно замечанию 11.2. Таким образом, тор является двумерным многообразием.
Пример 11.10. Конфигурационным пространством механической системы называют множество всех ее состояний. Такое множество, как правило, является гладким многообразием, размерность которого в механике называют числом степеней свободы системы.
Рассмотрим твердое тело в пространстве, закрепленное в точке О шарниром, способным поворачиваться в любом направлении. Положение тела определяется положением двух его точек А и В, которые можно выбрать любым способом, удовлетворяющим условию: прямая АВ не должна содержать точку О. Выберем А и В так, чтобы угол АОВ был прямым (рис. 11.11). С каждым положением треугольника ОАВ можно связать правый ортонормированный репер ei, ег, ез, где еу " единичный вектор, коллинеарный и сонаправленный с вектором
11.2. Примеры многообразии
331
Рис. 11.11
ортонормирован-
0А1 в2 — единичный вектор, коллинеарный и сонаправленный с вектором 0&, ae3 = eixe2.
Зафиксировав в пространстве некоторый правый ортонормированный базис, мы можем любому ортонорми-рованному базису поставить в соот-вествие матрицу перехода в этот базис из фиксированного базиса. Отметим, что матрица перехода от п
кого базиса к правому ортонормированному базису является ортогональной [IV], причем ее определитель равен единице. Множество всех квадратных матриц третьего порядка можно рассматривать как девятимерное линейное арифметическое пространство R9, в котором координатами вектора являются элементы матрицы, записанные, например, по строкам. Если матрица А = (яу) является ортогональной, то ее элементы удовлетворяют системе шести уравнений
' г ! + ж-2 + г-з = 1, 1 $ i $ 3;
+Xi2Xj2+xi3Xj3 = 0,	1 i < j 3.
(И-6)
Эту систему можно записать в виде F(x) = с, где координатными функциями отображения F: R9 -> R6 являются левые части уравнений системы, ас = (1, 1, 1, 0, 0, 0). Матрица Якоби отображения F в точке х имеет вид
/2жц	2*12	2з?1з	0	0	0	0	0	0 \	
0	0	0	2я21	2ж22	2^23	0	0	0	
0	0	0	0	0	0	2я31	2^32	2язз	
*21	*22	*23	*п	*12	*13	0	0	0	
*31	*32	*33	0	0	0	*и	*12	*13	
\ о	0	0	*31	*32	*33	*21	*22	*23 /	
Пусть	какая	-то линейная комбинация шести						строк ЭТОЙ	
м*трицы с коэффициентами ,..., ав равна нулю. Рассмотрим
332
11. ТЕОРИЯ МНОГООБРАЗИЙ
сначала только первые три элемента всех строк. Для них получим соотношения
2О1ХЦ + о4х21 +05X31 = О, 201X12 + 04X22 + 05X32 = О, 201Х13 + О4х2з + О5Х33 = 0.
Записанные соотношения означают, что линейная комбинация строк матрицы А с коэффициентами 2»i, о4, 05 равна нулю. Но матрица А невырождена, а потому ее строки линейно независимы. Значит, все три коэффициента о4, 05 равны нулю. Выбирая последовательно вторую и третью тройки элементов в строках матрицы Якоби, заключаем, что все коэффициенты «1,Об равны нулю. Значит, строки матрицы Якоби линейно независимы, а ее ранг равен шести [III].
Итак, множество ортогональных матриц можно рассматривать как подмножество элементов R9, координаты которых удовлетворяют системе уравнений F(x) = 0, причем левая часть системы, отображение F(x), имеет матрицу Якоби максимального ранга на решениях системы. Согласно теореме 11.1, множество ортогональных матриц третьего порядка представляет собой трехмерное многообразие, которое обозначают через
0(3).
Многообразие 0(3) распадается на два подмножества, соответствующих значениям определителя 1 и -1. Оказывается, что носитель любой карты (U,h) многообразия 0(3) либо целиком содержится в множестве
50(3) = {Де 0(3): det 4 = 1},
либо не пересекается с ним, т.е. целиком содержится в множестве 0(3) \ 50(3). Действительно, множество G = h(U), согла< но определению карты, является областью в R3, а значит, он<» линейно связно. Функция /(х) = det(/i“1(x)), х е О, является непрерывной в G как композиция непрерывных функций
11.3. Гладкие отображения многообразии
333
(см. замечание 11.1) и det А. Согласно теореме 1.11, образ множества (7 при отображении f(x) = det(/i-1 (г)) является линейно связным. Но определители матриц из 0(3) могут принимать лишь два значения 1 и -1. Следовательно, функция /(аг) постоянна на 67, а все матрицы из множества U имеют одно и то же значение определителя: либо 1, либо —1. Поэтому либо U С .90(3), либо U П .90(3) = 0.
Отобрав из атласа на многообразии 0(3) те карты, носители которых целиком включаются в .90(3), получим атлас на множестве .90(3). Это значит, что .90(3) является трехмерным многообразием. Таким образом, конфигурационное пространство твердого тела в пространстве, вращающегося вокруг неподвижной точки, является трехмерным гладким многообразием. И это многообразие совпадает с многообразием .5’0(3) ортогональных матриц с определителем 1.
11.3. Гладкие отображения многообразий
Пусть М и N — гладкие многообразия и F: М /V -некоторое отображение. Предположим, что существуют карта (U,h) на многообразии М, накрывающая точку Р, и карта (У,к) на многообразии N, накрывающая точку Q = F(P), для которых F(U) С V. Тогда в области h(U), содержащей точку Л(Р), определено „сквозное" отображение k°F<>lr\ которое, как нетрудно заметить, координатам точки в локальной системе координат (U,h) ставит в соответствие координаты ее образа при отображении F в карте (V',A:) (рис. 11.12). Если это отображение является гладкой (бесконечно дифференцируемой) Функцией многих переменных в некоторой окрестности точки Л(Р), то отображение F называют гладким отображением о точке Р. Отображение F называют гладким, если оно является гладким в каждой точке многообразия М.
Замечание 11.4. Из данного определения следует, что Необходимым условием гладкости отображения F в точке Р
334
11. ТЕОРИЯ МНОГООБРАЗИЙ
Рис. 11.12
является существование двух карт (U,h) и (V,fc), для которых F(L7) С V. Здесь нетрудно уловить знакомый мотив: для любой окрестности V точки Q = F(P) существует окрестность U точки Р, такая, что F(U) С V. И действительно, введение понятия окрестности на многообразии позволяет ввести и понятие непрерывного отображения. Фактически мы в определение отображения, гладкого в точке, включили и определение отображения, непрерывного в точке Р. Из определения гладкого отображения можно заключить, что отображение, гладкое в точке Р, является и непрерывным в этой точке. Условие существования карт ([/,h) и (V.k) в определении гладкого отображения в точке Р можно заменить условием непрерывности отображения в этой точке Р. #
С формальной точки зрения определение гладкого отображения корректно. Однако, для того чтобы это понятие имело практический смысл, нужно, чтобы координатное представление отображения, оказавшись гладким в одних координатах, оставалось таким и в любых других координатах. Ведь иначе, выяснив, что координатное представление отображения не является гладким в одних координатах, мы вынуждены проверять это во всех координатах выбранного атласа. В противном
11.3. Гладкие отображения многообразий
335
случае нельзя утверждать, что отображение не является гладким!
Итак, убедимся, что если отображение F: М -+ N является гладким в точке Р, то для любой пары карт (U,h) и (V,fc), накрывающих точки Р и F(P), координатное представление f = k<>Foh~l этого отображения является гладкой функцией многих переменных в точке h(P), Пусть заключение о гладкости F получено с помощью пары карт (17о,Ло) и (Vo,&o)-Это значит, что функция многих переменных /о = &о° F0 является гладкой в точке ho(P). В силу того, что отображения Л, к, ho, ко являются взаимно однозначными и имеют обратные отображения, можем записать
f = koFoh-' =
т.е. отображение f можно представить в виде композиции трех функций многих переменных: A: ofc"1, fcooFofc"1 и fco0^-1-Первая и последняя функции — это отображения перехода, и потому они гладкие. Вторая функция есть координатное представление /о отображения F, гладкое в точке ho(P) в силу выбора пары карт (1/оЛо) и (Vo,fco). Композиция всех трех функций, т.е. функция /, является гладкой в точке h(P).
Пример 11.11. Покажем, что ортогональная проекция
F: S1 L окружности S1 на прямую L, соединяющую диаме
трально противоположные точки Риф, есть гладкое отоб-
ражение. Для этого выберем на плоскости прямоугольную систему координат так, что ее начало совпадает с центром окружности, а точки Р и Q расположены на оси абсцисс, причем точка Р имеет положительную абсциссу (рис. 11.13). Для окружности S1 выберем атлас Из двух карт. Сперва выколем точку Р и на оставшейся части
336
1L ТЕОРИЯ МНОГООБРАЗИЙ
окружности рассмотрим отображение Л-i, которое точке окружности ставит в соответствие полярный угол, измеряемый н пределах от 0 до 2тг. Затем выколем точку Q и на оставшейся части 6Г2 окружности рассмотрим отображение /г2, которое точке окружности ставит в соответствие полярный угол в пределах от —тг до тг. Нетрудно показать, что эти две карты в совокупности накрывают окружность и являются согласованными. Условие отделимости выполняется в силу замечания 11.2. Таким образом, 51 — одномерное многообразие. Отметим, что
/ir1(y?) = (rcos^, rsin^), € (0, 2тг), ^2 ’М — (rcos<^, rsin<^), <^€(-тг,тг),
где г — радиус окружности.
Поскольку прямая L на плоскости оказывается совмещенной с осью абсцисс, естественно в качестве координаты на этой прямой выбрать абсциссу точки. Тогда проекция окружности на прямую в выбранных координатах записывается в виде 2r = rcos^. Так как в выбранных координатах отображение F представлено гладкой функцией, оно является гладким.
Теорема 11.2. Композиция гладких отображений многообразий есть гладкое отображение многообразий.
◄ Это утверждение следует из теоремы 2.6 о дифференцируемости сложной функции. ►
Диффеоморфизмом многообразия М на многообразие Л называют биективное гладкое отображение М на /V, обратное к которому также является гладким. Многообразия Л/ и 5 -для которых существует диффеоморфизм М на ЛГ, называют диффеоморфными.
Пусть многообразия М и N диффеоморфны и F: М -> N — диффеоморфизм. Если (U,h) — карта на многообразии
М, то (F(U),h о F*"1) является картой на многообразии Лг-Действительно, пусть (V,k) — карта из атласа ЛГ, для которой F(U) Q V / 0. Тогда отображение перехода из карты (F(U),h<>F-1) в карту (V,k) имеет вид koF°h~\ т.е. является
//.3. Гладкие отображения многообразий
337
координатным представлением отображения F для пары карт ((/,Л) и (К&)« Такое представление является гладкой функцией многих переменных. Поэтому и отображение перехода является гладкой функцией многих переменных. Аналогично можно показать, что и обратное отображение перехода является гладкой функцией.
Итак, диффеоморфизм многообразий устанавливает взаимно однозначное соответствие между картами двух многообразий. Это означает, что диффеоморфные многообразия с точки зрения их внутренней структуры не различаются. Поэтому их, как правило, отождествляют.
Гладкой функцией на многообразии М называют гладкое отображение из М в R. Отметим, что на числовой оси R есть естественный атлас из единственной карты. Поэтому координатное представление функции связывают не с парой карт (первая на многообразии М, вторая в R), а лишь с картой на многообразии М. Множество гладких функций на М будем обозначать через С°°(М). Операции сложения и умножения гладких функций дают вновь гладкие функции. Постоянные функции являются гладкими. Умножение функции f € С°°(М) на постоянную функцию д(х) = с, дающее гладкую функцию на Af, можно интерпретировать как умножение функции на действительное число. Легко проверить, что множество С°°(М) с операциями сложения функций и умножения функции на действительное число является линейным пространством. Наличие еще одной операции — умножения функций — наделяет это линейное пространство дополнительными свойствами.
Теорема 11.3. Операция умножения в линейном пространстве С°°(М) имеет следующие свойства:
1°. Ассоциативность (fg)h = f(gh).
2°. Коммутативность fg = gf.
3°. Дистрибутивность относительно сложения f(g + h) = ** fs+fh.
4°. Существование единицы /•! = /.
338
II. ТЕОРИЯ МНОГООБРАЗИЙ
◄ В каждой конкретной точке х £ М равенства, отражающий перечисленные свойства, являются числовыми и выражают одноименные свойства умножения действительных чисел. ►
Если в линейном пространстве дополнительно введена операция, удовлетворяющая свойствам 1°-4°, сформулированным в теореме 11.3, то такое линейное пространство называют алгеброй, а указанную операцию называют умножением алгебры. Любое подмножество алгебры X, которое само является алгеброй относительно операций в X, называют подалгеброй алгебры X.
Отображение р алгебры X в алгебру 4 называют гомоморфизмом алгебр, если это отображение является линейным оператором и, кроме того, удовлетворяет дополнительному условию
v(ab) = и(а)и(Ь).
Гомоморфизм алгебры X в алгебру 4, являющийся биекцией, называют изоморфизмом алгебр. Изоморфизм алгебр X и £ устанавливает такое взаимно однозначное соответствие между элементами этих алгебр, при котором результату любой операции в алгебре X соответствует результат аналогичной операции в алгебре £ и наоборот. По внутренней структуре изоморфные алгебры неразличимы.
Теорема 11.4. Если F: М —> /V — гладкое отображение многообразий М и N, то отображение F*:
определенное формулой F*(g) = g°F, есть гомоморфизм алгебр С°°(ЛГ) и С°°(М).
◄ Доказательство этой теоремы следует из определений гладкого отображения и гомоморфизма алгебр, а также из теоремы 11.2. ►
Отображение F* множества гладких функций на многообразии N в множество гладких функций на многообразии М* порождаемое гладким отображением F: М —> N, называют дуцированным отображением.
11.3. Гладкие отображения многообразий
339
Теорема 11.5. Для любых гладких отображений F : М N И G: N —> К имеет место тождество
(GoF)* = F*oG*.
4 Если g € С°°(/<), то в силу определений индуцированного отображения и композиции отображений имеем
(GToF)*((7)=^oGoF=(c;*)((7)oF=F-(c;*((7)) = (F%G*)(p). ►
Пример 11.12. Изучим структуру алгебры X гладких функций на прямом круговом цилиндре х2 4- г/2 = R2. С этой целью рассмотрим отображение F: R2 R3 с координатными функциями
= Fcosy?, t/(y>, t) = Fsin 9?, z(<p,t) = t.
Образ отображения F есть рассматриваемый цилиндр х2 4- у2 = = Я2, который мы обозначим через С. Атлас на цилиндре С можно задать двумя картами. Для построения карт достаточно ограничить отображение F на полосе у € (0,2тг), t € R для первой карты и на полосе € (—тг,тг), t € R для второй карты. Две карты на цилиндре будут определяться отображениями, обратными к указанным (см. примеры 8.4 и 11.9).
Отображение F: R2—>Сявляется гладким, и мы можем рассмотреть индуцированное отображение F*, которое каждой гладкой функции на цилиндре С ставит в соответствие гладкую функцию в R2, т.е. гладкую скалярную функцию двух переменных. Если f — функция на цилиндре С, то F*(f) — Функция от <р и /, периодическая по у? с периодом 2тг. Множество гладких функций /(уМ) на многообразии R2, периодических по у>, есть алгебра (подалгебра алгебры C°°(R2) всех Гадких функций на R2), которую мы обозначим £. Индуцированное отображение F* есть гомоморфизм алгебры X в Мгебру £. Нетрудно показать, что этот гомоморфизм обеспечивает взаимно однозначное соответствие между элементами
340
11. ТЕОРИЯ МНОГООБРАЗИЙ
двух алгебр, т.е. является изоморфизмом этих алгебр. Существование изоморфизма двух алгебр позволяет отождествить эти алгебры, и мы можем сказать, что алгебра функций на цилиндре С — это алгебра гладких функций на R2, периодических по первому аргументу с периодом 2тг. #
Пусть F: М —> N — гладкое отображение тп-мерного многообразия М в n-мерное многообразие N. Рассмотрим произвольную точку РЕ М, карту (£7,h) на многообразии Л/, накрывающую точку Р, и карту (V,k) на многообразии 2V, накрывающую точку Q = F(P). В окрестности точки Р отображение F имеет координатное представление Fhk = k°F°h-\ являющееся гладкой функцией многих переменных, определенной в окрестности точки /i(P) € Rm со значениями в Rn. Вычислим ранг матрицы Якоби функции Fhk в точке Л(Р): г = R%(FhkY(h(P)). Оказывается, что число г не зависит от выбора карт (U,h) и (V,fc). Действительно, если взять другую карту (£7i,Ai), накрывающую точку Р, и другую карту (Vj,fci), накрывающую точку F(P), то координатное представление Fh}k} отображения F в паре выбранных карт будет связано с координатным представлением Fhk следующим образом:
Fh,kt =kx°F°hil =
= (ki<>k~l)o(koF°h~l)o(h°h^l)=gkk> *Fhk*9hih-
где gkki и gh}h — отображения перехода из карты (V,fc) в карту (Vi,&i) и из карты (£71,/ц) в карту (£7,h). Отсюда следует, что
(/W(MP)) = (9kkt)'(k(Q)) (Fhk)'(h(P)) (д^'Ц^Р)).
т.е. матрица Якоби одного представления получается из матрицы Якоби другого представления умножением на две квадратные матрицы, являющиеся матрицами Якоби отображений перехода. В силу согласованности двух пар карт эти матрицы являются невырожденными. Но при умножении произвольной
11.3. Гладкие отображения многообразий	341
- -
матрицы А на квадратную невырожденную матрицу ранг матрицы А не изменяется [IV]. Поэтому
Ранг матрицы Якоби (Г^)'(Л(Р)) координатного представления Fhk гладкого отображения F называют рангом отображения F в точке Р.
Гладкое отображение F: М N ?п-мерного многообразия М в п-мерное многообразие N называют вложением многообразия М в многообразие /V, если оно удовлетворяет трем условиям:
1)	это отображение является инъекцией;
2)	обратное отображение F-1: F(Af) -> М непрерывно на множестве F(Af);
3)	ранг отображения в каждой точке Р € М равен т.
Пример 11.13. Если S — регулярная поверхность, заданная отображением F: G С R2 R3, то отображение F является вложением многообразия G (области в R2) в многообразие R3. #
Подмножество А многообразия Л/ называют подмногообразием многообразия М, если множество А является образом некоторого вложения F. Ранг вложения F, т.е. размерность области определения этого вложения, называют размерностью подмногообразия А.
Пример 11.14. В любом многообразии Л/ подмногообразием является произвольное открытое подмножество А в М. Действительно, можно показать, что атлас на множестве А Можно составить из некоторого набора карт многообразия М. При наличии такого атласа вложением А в М будет тождественное отображение id л: А А С М. #
До сих пор мы рассматривали функции, определенные на ^сем многообразии. Однако представляют интерес и функции.
342
11. ТЕОРИЯ МНОГООБРАЗИЙ
которые определены лишь в некоторой окрестности заданной точки многообразия. Таковы например, координатные функции отображения h, которое на многообразии М задает карту ((7, h) (такие функции в дальнейшем мы будем называть коор. динатными функциями карты (U,h)). В отдельных случаях гладкую функцию, заданную лишь в некоторой окрестности точки на многообразии, можно продолжить на все многообразие так, что продолженная функция будет гладкой на всем многообразии. В таких случаях функцию, заданную локально, можно рассматривать как элемент алгебры С°°(Л/).
11.4. Касательные векторы
Понятие касательного вектора к многообразию является важнейшим при построении дифференциального исчисления. Это понятие встречается в теории кривых и поверхностей и является в этой теории достаточно простым и интуитивно ясным. Однако в теории многообразий ситуация усложняется. Дело в том, что само понятие многообразия введено абстрактно, как некое множество, удовлетворяющее определенным требованиям, при этом природа множества никак не оговаривается (похожая ситуация возникает в линейной алгебре при введении понятия линейного пространства). Такая природа многообразия и понятию касательного вектора придает абстрактный характер, усложняющий его осмысление и использование на практике.
В литературе используют три подхода к определению касательного вектора к многообразию, приводящих к одному и тому же. Каждый подход отражает одну из сторон этого сложного понятия и более предпочтителен в определенной ситуации (вспомним два определения предела функции по Коши и по Гейне [1-7.3], в бдних случаях удобнее одно определение, в других — другое). Мы выберем для определения касательного вектора один из подходов, который условно можно назвать координатным. Два других подхода (геометрический и алгеб
11.4. Касательные векторы
343
раический) будут ниже сформулированы как разные интерпретации этого понятия.
Напомним, что в теории кривых [II] и в теории поверхностей (см. 8) понятие касательного вектора опирается на дифференциальные свойства кривых и в конечном счете сводится к касательному вектору к кривой. Чтобы распространить этот подход на многообразия, необходимо ввести понятие кривой на многообразии.
Гладким путем на многообразии М (или гладкой параметризованной кривой на многообразии М) будем называть гладкое инъективное отображение у: (ЬДг) -> М некоторого интервала (h,^) числовой оси в это многообразие. Образ такого отображения будем называть гладкой кривой на многообразии М.
При координатном подходе касательный вектор в точке многообразия вводят, задавая в каждой системе координат упорядоченный набор чисел (координатное представление касательного вектора), причем при изменении системы координат упорядоченный набор чисел меняется по определенному правилу. Подобным же образом определяется тензор в линейном пространстве. Мы исходим из того, что касательный вектор к многообразию можно рассматривать как касательный вектор к некоторой параметризованной кривой на многообразии, которую в заданной системе координат на многообразии можно записать как параметризованную кривую в Rn. Касательный вектор к параметризованной кривой в Rn в фиксированной точке и определяет тот набор чисел, который соответствует выбранной системе координат.
Возьмем произвольную точку Р на многообразии М и рассмотрим две карты (U,h) и (V,fc), накрывающие точку
Пусть задана параметризованная кривая 7: (a,b) —> М, Проходящая через точку Р, т.е. для некоторого io С (а, Ь) имеем 7(t0) = Р. Координатное представление параметризованной кривой 7 для карт (Р,Л) и (V,k) дают вектор-функции у к = ^°7 И ук = koy. Эти вектор-функции можно связать друг с другом
344
11. ТЕОРИЯ МНОГООБРАЗИЙ
отображением перехода:
7л = hoy-(hok~l)o(k'>y)=gkh<>7k, где gkh = b°k~x — отображение перехода из карты (V,k) в карту (U,h).
Пусть координатным представлением касательного вектора к параметризованной кривой у на многообразии М в произвольной системе координат (Ж 0 является набор координат касательного вектора к параметризованной кривой 7/= /07 в Rn. Тогда матрицы-столбцы 7д(<о) и 7д.(^о) дают координатные представления одного и того же касательного вектора. Но Ук = 9кК°Ук- Поэтому, согласно правилу дифференцирования сложной функции многих переменных, примененному к сложной функции yh(t) = (m°7*)(0 =m(7*W) при t = tQ, получаем
УкМ=9кк(хо)УкМ^	(П-7)
где xq = к(Р) = k(y(to)) = yk(to) — координатное представление точки Р в системе координат (V,k).
Обозначив координаты точки многообразия в системе координат (V,fc) через х = (жь хп)1 а в системе координат (UJi) через у = (t/i,	t/n), отображение g^h можем представить в
виде у = или в координатной записи:
У1
Уп — Уп(хъ,. . ,2П).
При такой записи матрица Якоби <7м(аЧ)) отображения дм в точке х0 = (а?У, имеет вид
&У\	\	\	< \\
е;(1о) - эг.ы
><'"> 
ОХ\ 0X2	охп
g'kh^o) =
дУп, ч дуп, . дуп _(жо) _(жо) ... _
П.4. Касательные векторы
345
Обозначив 7jt(i0) = (6 ... £П)Т и 7д(*о) = ('П1 ••• т/пЛ получаем координатную запись векторного равенства (11.7):
Ч< =	(*<№, i = Т“п.
j=l 3
Эти формулы и лежат в основе координатного подхода к понятию касательного вектора.
Определение 11.5. Касательным вектором в точке Р к n-мерному многообразию Л/ называют соответствие, которое каждой локальной системе координат в окрестности точки Р сопоставляет упорядоченный набор из п чисел. При этом если локальной системе координат xi, ..., хп поставлен в соответствие набор чисел (fi, ..., fn), а локальной системе координат !/ь • ••? Уп — набор чисел (?/], ..., т/п), то выполняются соотношения
j=l 3
где х?, х£ — координаты точки Р в системе координат Х1, ..., хп.
Итак, касательный вектор в точке Р — это соответствие, которое в каждой локальной системе координат xi, ..., хп в окрестности точки Р задает набор чисел (ft, ..., £п), при замене координат меняющийся согласно формулам (11.8). Точку Р, с которой связан касательный вектор, называют точкой приложения касательного вектора, набор чисел (£ь •••, ?п) — координатами касательного вектора в системе координат Xi,..., хп. Касательные векторы будем обозначать греческими буквами с надстрочным знаком „стрелка", Например
Хотя определение касательного вектора требует задания его координат в каждой локальной системе координат, на
346
П. ТЕОРИЯ МНОГООБРАЗИЙ
самом деле достаточно указать координаты лишь в одной локальной системе координат. Тогда его координаты в другой системе координат можно вычислить по формулам (11.8).
Рассуждения, приведенные выше, показывают, что касательный вектор можно задать следующим образом. Выберем на многообразии М какую-либо гладкую параметризованную кривую 7: (а, 6) -> Л/, проходящую через точку Р = 7(^0)- Для каждой системы координат (U,h) в окрестности точки Р рассмотрим набор координат вектора (Л°7),(^о) в Rn. Тогда получим соответствие между всевозможными системами координат и наборами из п чисел, причем при изменении системы координат набор чисел будет меняться в соответствии с формулами (11.8). Другими словами, любая гладкая параметризованная кривая, проходящая через точку Р, определяет в точке Р касательный вектор. Этот вектор называют касательным вектором к гладкой параметризованной кривой 7: (а, 6) —> М на многообразии М в точке Р.
Рассмотрим гладкую параметризованную кривую 7: (а, Ь) -> -> М и гладкую взаимно однозначную функцию /: (c,d) —> (a,b). Композиция 7°/: (c,d) —> М представляет собой вторую гладкую параметризованную кривую, образ которой совпадает с образом кривой 7. Переход от параметризованной кривой 7 к параметризованной кривой 7 = 7°/ будем называть заменой параметра кривой.
Замена параметра изменяет касательный вектор к параметризованной кривой в заданной точке Р. Действительно, рассмотрим параметризованную кривую 7: (а, Ь) —> Л/ на многообразии М и для нее замену параметра /: (c,d) —> (а, Ь). Пусть Р = 7(t0) и to = /(то). Если (U,h) — какая-либо система координат в окрестности точки Р, то касательный вектор в точке Р к параметризованной кривой 7 в этой системе координат представлен вектором (Л°7),(^о)« В результате замены параметра получаем параметризованную кривую 7 = 7°/, касательный вектор к ней в точке Р представлен вектором (ЬоуУ(го). В
11.4. Касательные векторы
347
силу правила дифференцирования сложной функции имеем
M'W = (Л’7’/)'(Я>) = (Л»7)'(«о)/'(’-о).
Следовательно, при замене параметра касательный вектор к параметризованной кривой умножается на действительное число и преобразуется в вектор, коллинеарный исходному. В частном случае, когда /'(то) = 1, касательный вектор остается неизменным.
Отметим, что ненулевой касательный вектор к параметризованной кривой можно преобразовать в любой коллинеарный вектор, подобрав соответствующую замену параметра. Действительно, если £ — касательный вектор к параметризованной кривой y(t) в точке Р, то касательный вектор является касательным вектором к параметризованной кривой 7(At)*
Теорема 11.6. Любой касательный вектор к многообразию М в точке Р является касательным вектором к некоторой параметризованной кривой на М в точке Р.
◄ Пусть £ — касательный вектор к многообразию М в точке Р. Выберем произвольную систему координат Ж),..., жп, определяемую картой (С7,Л), накрывающей точку Р, и пусть ж®, ..., ж° — координаты точки Р в выбранной системе координат, а — координаты касательного вектора £. Рассмотрим
Нектор-функцию v(t) вида
=z?+£it,
х„ = x°+fnt.
Значению параметра t = 0 соответствует точка в R” с коорди-натами ж}, ..., ж®, т.е. точка Л(Р). Так как h(U) — открытое Множество в Rn, содержащее точку Л(Р), то существует такой Интервал (ti, ^), содержащий нуль, образ которого при отображении v целиком попадает в А.(С7), т.е. v(t) € h(U) при t € (ti, h)-
348
11. ТЕОРИЯ МНОГООБРАЗИЙ
Композиция функций 7 = /i“1ov, рассматриваемая на интервале	представляет собой параметризованную кри-
вую на Л/, для которой 7(0) = Р. Так как v(t) — гладкая вектор-функция, эта параметризованная кривая является гладкой. В системе координат (U^h) параметризованная кривая представляется как вектор-функция v(t), а координатами касательного вектора к 7 в точке Р являются координаты вектора uz(t), т.е. {1, ..., fn. Значит, касательным вектором к 7 в точке Р является вектор f. ►
Пример 11.15. а. Пусть многообразие М есть область в Rm. Атлас на М можно выбрать из единственной карты (Л/, J), где J: М —> М С Rm — тождественное отображение. Рассмотрим произвольный касательный вектор £ в точке Р к многообразию М, По теореме 11.6 он является касательным вектором к некоторой гладкой параметризованной кривой 7:	—> М в точке P = 7(t0). Вектор (J °7)'(^о) является
координатным представлением вектора £ в системе координат (Af,J). Но поскольку отображение J является тождественным, то вектор f можно отождествить с производной 7'^0) вектор-функции 7. Таким образом, в рассматриваемом случае касательные векторы к многообразию М — это произвольные векторы в Rm.
6. Рассмотрим график Г(/) бесконечно дифференцируемой на интервале О = (zj, функции у = f(x) одного переменного. Согласно примеру 11.8, множество Г(/) является многообразием, атлас на котором можно составить из одной карты (Г(/),А)« где h — проекция множества Г(/) на ось Ох, т.е. h(x.y) = х. Согласно определению, любой касательный вектор f в точке Р € Г(/) в заданных координатах на многообразии представляется одним числом. В результате между множеством действительных чисел и множеством касательных векторов установлено взаимно однозначное соответствие.
Геометрическое представление функции графиком позволяет дать удобную интерпретацию понятия касательного вектора
11.4. Касательные векторы
349
к многообразию Г(/). Представим множество Г(/) как параметризованную кривую с помощью вектор-функции д(х) = = (ж, /(ж)), ж € О. Любой касательный вектор £ в точке Р = = (жо, /(жо)) можно интерпретировать как касательный вектор к гладкой параметризованной кривой 7 на Г(/), которая представляет собой отображение7: (й, $2) —► Г(/) в точке Р = 7(^0). В заданных координатах касательный вектор к этой кривой имеет представление $ = (hoу)'(to). Гладкость параметризованной кривой 7 на многообразии Г(/) означает, что гладким является отображение 7 как отображение интервала (tj,£2) в R2. Действительно, это отображение является композицией гладких отображений Л”1(ж) = д(х) и hoy (первое является гладким в силу бесконечной дифференцируемости функции f, второе — в силу гладкости кривой 7). При этом
7'(M = pW(/k>7)'(«o).
Поскольку вектор д'(хо) = (1 /'(жо))Т является фиксированным, естественно отождествить каждый касательный вектор, имеющий координатное представление (hoy)'(tQ), с вектором 7,(^о)-Но последний в силу свойств вектора (?'(жо) коллинеарен касательной к графику Г(/) функции у = /(ж) в точке Р.
Итак, мы заключаем, что касательный вектор к многообразию Г(/) в точке Р можно рассматривать как вектор, лежащий на касательной к графику функции у = /(ж) в этой же точке. Абстрактное понятие касательного вектора к многообразию приобрело вполне конкретную реализацию. Отметим, что такую интерпретацию можно распространить на более общий случай дифференцируемой функции. Однако если функция 2/= /(ж) не является дифференцируемой в точке жо € О, то ее график по-прежнему является гладким многообразием (см. пример 11.8), в то время как касательная к графику функции в Точке (жо, f(x)) не существует. В этом случае связь между Касательными векторами к многообразию и касательной к графику теряется.
350
11. ТЕОРИЯ МНОГООБРАЗИЙ
в. Регулярная поверхность S в пространстве, которая задана гомеоморфизмом F'.G-+ R3, где G С R2 — некоторая область, является многообразием (см. пример 11.5). Атлас на этом многообразии можно построить из единственной карты (Л/, Л), где М = F(G) и есть собственно поверхность 5, а Л = F-1 — отображение, обратное к отображению F. Как и в предыдущем случае, гладкая параметризованная кривая на многообразии является гладкой параметризованной кривой в R3. Поэтому касательный вектор в данной точке Р многообразия можно интерпретировать как касательный вектор к кривой в R3 (рис. 11.14). Все такие векторы расположены в касательной плоскости к поверхности S в точке Р. В этом случае мы можем отождествить понятия касательного вектора к многообразию и вектора в касательной плоскости к поверхности. #
Рис. 11.14
Из определения 11.5 трудно выяснить геометрические свойства касательного вектора. Например, касательный вектор к поверхности связан с линейным приближением поверхности касательной плоскостью, но из определения касательного вектора к многообразию такое заключение сделать трудно.
Две гладкие параметризованные кривые 71: (ai,&i) -> М и 72- (^2,^2) -4 Л/, проходящие через точку Р = 7j(ii) = 72(^2)-назовем соприкасающимися кривыми, если в какой-либо системе координат ((7, Л) в окрестности точки Р выполнено соотношение
|(/i°7i)(ti4-Ai)-(/io72)(t2+At)|=o(At) при Д£->0. (11-9)
11.4. Касательные векторы
351
Теорема 11.7. Две гладкие параметризованные кривые 7] и 72 на многообразии М, проходящие через точку Р, соприкасаются в этой точке тогда и только тогда, когда касательные ^векторы к кривым 71 и 72 в точке Р совпадают.
4 Пусть ti и t2 — значения параметра у параметризованных кривых 71 и 72, соответствующие точке Р. Выберем в окрестности точки Р некоторую локальную систему координат (U,h). Вектор-функции h о 71 и h о 72 представляют параметризованные кривые 71 и 72 в выбранной системе координат (U^h) и являются дифференцируемыми соответственно в точках t\ и 1%. Поэтому верны равенства
(fto7i)(ti + At) - (Л»71)(«1) = (/1<>71)'(Ь)Д« + <»1(ДОД<>
(fe°72)(t2 + Д«) - (Л°71)(Ы = (fc«7i)'(MAt + a2(A0At>
где а,(ДО и «2(Д0 — бесконечно малые вектор-функции при At —> 0. Вычитая из первого равенства второе и учитывая, что (Л ° 7i) (t 1) = (Л о 72) (t2) = Р, получаем
(Л ° 71) (h + ДО - (h о 72) (t2 + ДО =
= ((Л’71)'(0) - (Л»72)%))Д« + «(Д0Д() (Н-10)
где а(Д0 = ai(Ai) - ^(At) — бесконечно малая вектор-функция при At —> 0.
Если параметризованные кривые 71 и 72 имеют один и тот Же касательный вектор в точке Р, то (Л 0 71 )z(ti) = (^°72),(^) и, следовательно,
(Л°71)(0 + At) - (Л072)(*2 +ДО = а(Д0А<.
Значит,
|(Л°71)(й + ДО - (Л’72)(«2 +Д0| =
= |а(Д01|Д0 = о(Д0 при At—>0.
Следовательно, кривые соприкасаются в точке Р.
352
11. ТЕОРИЯ МНОГООБРАЗИЙ
Если кривые 71 и 72 соприкасаются в точке Р и для них верно равенство (11.9), то верно и равенство
(Л°71)(^1 + Д£) - (Л<>72)(^ +ДО = а(Д<)Д^
с некоторой бесконечно малой вектор-фу нкцией а(Д/). По тогда из равенства (11.10) вытекает, что при /V 0 0
(/i07i),(/i) - (hoyzYth) =<>(Д0 — cv(A<),
где левая часть равенства не зависит от AZ, а правая часть является бесконечно малой при Д/ -> 0. Такое равенство возможно лишь при
(ЛО71)Ш = (*О72)'(*2), т.е. когда касательные векторы к параметризованным кривым 71 и 72 совпадают. ►
Множество всех гладких параметризованных кривых на многообразии Л/, проходящих через точку Р, распадается на не пересекающиеся классы попарно соприкасающихся кривых. Параметризованные кривые из одного класса имеют один и тот же касательный вектор, в то время как параметризованные кривые разных классов не являются соприкасающимися и имеют разные касательные векторы. Касательные векторы к многообразию в точке Р оказались во взаимно однозначном соответствии с классами соприкасающихся кривых. Поэтому их можно отождествить. Напомним, что касательный вектор был определен как отображение, которое каждой карте в окрестности точки Р ставит в соответствие упорядоченный набор чисел. Такое отображение можно определять по-разному, например так. Выбираем класс соприкасающихся параметризованных кривых в точке Р и в нем некоторую кривую 7, для которой Р = 7(^о)« Каждой карте (U,h) ставим в соответствие вектор (^°7),(^о) € Rn. Нетрудно увидеть, что описанное соответствие определяет касательный вектор к многообразию М в точке Р-а именно касательный вектор к кривой 7 в точке Р. Итак.
11.4. Касательные векторы
353
можно сказать, что катательные векторы к многообразию Л7 в точке Р и классы параметризованных кривых, соприкасающихся в точке Р, — одно и то же. Интерпретация касательного вектора как класса соприкасающихся кривых составляет суть геометрического подхода к определению касательного вектора.
На многообразии Л7 рассмотрим касательный вектор £ в точке Р. Пусть f 6	— произвольная гладкая функция
на М. Выберем карту ((7, Л), накрывающую точку Р. Тогда в этой карте функция f будет представлена скалярной функцией многих переменных /д = f ° h~l, а вектор £ — некоторым n-мерным вектором Рассмотрим число
f'dzp)^	(11.11)
где f'h(xP) — матрица Якоби функции fh в точке xp = h(P). Это число можно было бы назвать производной функции / вдоль вектора Такая производная отличается от производной функции по направлению вектора & лишь числовым множителем |£/J (см. теорему 5.1). Оказывается, что число ffh(xp)£h, полученное по представлениям функции и вектора в карте ((/,Л), от выбора карты не зависит, а определяется лишь функцией f и касательным вектором Значит, это число можно записать в виде £(/). Действительно, вектор £ можно интерпретировать как касательный вектор к некоторой гладкой параметризованной кривой у, проходящей через точку
= 7(to)* В этом случае & = (hoy)'(tQ) и, согласно правилу Дифференцирования сложной функции,
)'(*₽)&=
= (foh-'Y(xp)(hn)'{t0) = (/07)'(М- (11-12)
Полученное представление не связано с выбором карты.
Обозначим координаты на многообразии М, заданные картой ((/,Л), через Xi,..., жп, и пусть Р= (ж°, ..., £„), а касательный вектор £ в точке Р к многообразию Л/ имеет координаты
354
//. ТЕОРИЯ МНОГООБРАЗИЙ
«ь ..., ап. Гладкую функцию f в координатах жь хп можно записать как функцию многих переменных: f(x\....,xn). Тогда. расписывая матричное произведение (11.11). получим
(11.13)
Число £(/), которое в заданной картеД(/,h) вычисляется по формуле (11.13), называют производной функции f вдоль вектора %. Операцию вычисления этой производной называют дифференцированием функции f вдоль вектора
Теорема 11.8. Операция дифференцирования функций на многообразии вдоль касательного вектора обладает следующими свойствами:
1°. £(А/ + Д0) = Ай/) + д4(<7), A./Z6R, /,реС°°(М).
2°. <(/<7)-/(Р)№)+€(/)р(Р), /леС“(м).
◄ Для доказательства утверждения достаточно ввести координаты в окрестности заданной точки Р, воспользоваться записью (11.13) производной функции вдоль касательного вектора £ и свойствами частных производных скалярной функции многих переменных. ►
Первое свойство в теореме 11.8 означает, что дифференцирование в точке вдоль вектора является линейной функцией в линейном пространстве гладких функций. Однако множество С°°(М) не только является линейным пространством, но имеет дополнительную операцию умножения функций. Свойство 2° в теореме 11.8 отражает связь операции дифференцирования вдоль касательного вектора с операцией умножения функций. Линейную функцию D на С°°(Л/), удовлетворяющую условию D(fg) = f(P)D(g) + D(f)g(P) для любых f,g € С°°(Л/), называют дифференцированием в точке Р. Таким образом-понятие дифференцирования в точке является обобщением п°' нятия дифференцирования в точке вдоль касательного вектора-
11.4. Касательные векторы
355
Оказывается, что это обобщение на самом деле фиктивное: дифференцирование в точке всегда является дифференцированием вдоль некоторого касательного вектора.
Теорема 11.9*. Пусть D — дифференцирование в точке Р на многообразии М. Тогда в точке Р существует, и притом единственный, касательный вектор для которого
Согласно сформулированной теореме, множество дифференцирований в точке Р многообразия М и множество касательных векторов в этой точке находятся во взаимно однозначном соответствии. Это значит, что можно те и другие отождествить и считать, что касательный вектор в точке Р и операция дифференцирования в точке Р — одно и то же. Указанное отождествление реализует третий подход к понятию касательного вектора, который естественно назвать алгебраическим.
Пусть Xi, ..., хп — локальные координаты, заданные картой, накрывающей точку Р многообразия М, £ — касательный вектор к многообразию М в точке Р, имеющий координаты
ап. Тогда операция дифференцирования в точке Р, опре-касательным вектором, может быть записана в
деляемая этим виде
Хп п
....*")-
— координаты точки Р в выбранной системе
где г?, ..., Координат. Опустим в этом равенстве упоминание функции /:
Эта запись имеет двоякий смысл. Во-первых, такая запись Указывает на интерпретацию касательного вектора как опе-
Доказательство этой теоремы см., например: Стернберг С.
356
11. ТЕОРИЯ МНОГООБРАЗИЙ
рации дифференцирования: обозначение т— используют для операции вычисления частной производной. В нашем случае
это обозначение указывает на операцию дифференцирования вдоль касательного вектора с координатами 0, ..., О, 1, 0, ..., О (единица отвечает i-й координате), т.е. базисного вектора в Rn, и соответствует вычислению частной производной скалярной функции. Во-вторых, рассматриваемую запись можно
интерпретировать как разложение вектора в базисе, элементы
которого обозначены через
д
dxt р'
Итак, освещены все три интерпретации касательного век
тора. Каждая из трех интерпретаций: координатная, гео
метрическая и алгебраическая — имеет свои преимущества. Конкретную интерпретацию выбирают исходя из особенностей решаемой задачи. Координатная интерпретация, взятая в качестве определения касательного вектора, удобна для непосредственных вычислений и позволяет установить связь с дифференциальным исчислением функций многих переменных. Геометрическая интерпретация придает понятию касательного вектора наглядный геометрический смысл и удобна при теоретическом анализе задачи. На основе этой интерпретации, как правило, вводят новые понятия. Наконец, алгебраическая интерпретация устанавливает связь теории многообразий с алгеброй, позволяет упростить формулы и удобна для доказательства различных утверждений.
Пусть N — некоторое подмножество многообразия М и Р 6 N. Будем говорить, что касательный вектор ( к М в точке Р является касательным к подмножеству N на многообразии М, если он является касательным вектором к некоторой параметризованной кривой, образ которой целиком лежит в множестве N. Остановимся на случае, когда подмножество N может быть задано как подмножество всех точек многообразия М, удовлетворяющих системе уравнении /t(Q) = 0, i= l,fc, где fi — гладкие функции на многообр*' зии М.
11.4. Касательные векторы
357
Теорема 11.10. Пусть подмножество N С М задано системой уравнений fi(Q) = 0, i = 1, fc, где — гладкие функции на многообразии М. Если касательный вектор £ в точке Р 6 М является касательным к подмножеству N, то £(/,) = 0, г = 1, к. Наоборот, если £(/,) = О, г=1,Лг, причем для некоторой системы координат (С/,h) в окрестности точки Р ранг матрицы Якоби системы функций	в точке h(P) €
€ Rn максимален и равен к, то вектор £ является касательным к подмножеству W.
4 Пусть касательный вектор £ касается подмножества N в точке Р. Тогда существует параметризованная кривая 7: (а,Ь) -> —> М на многообразии Л/, у которой образ включен в /V, а касательный вектор в точке Р = y(to) есть вектор £. Для произвольной функции /бС°°(М) на интервале (а, Ь) определена функция одного действительного переменного /07, причем эта функция дифференцируема и, согласно (11.12), £(/) = = (/°7)'(Z0). Так как кривая 7 целиком включается в /V, то fi°y = 0, i = 1, к. Отсюда заключаем, что
е(Л) = (л°7)Ш=о,
Доказательство обратного утверждения проще провести в „координатном“ стиле. По условию теоремы ранг матрицы — п)) дЛЯ системы функций в некоторой системе CzXj J
координат Xi, ..., хп в окрестности точки Р, имеющей координаты я*, ..., я°, равен к. Выберем в этой матрице базисный минор и для упрощения выкладок предположим, что он расположен в первых k столбцах матрицы. По теореме о неявной функции система уравнений /t(xi, . ..,яп) =0, i= 1Д, описывающая Подмножество /V, в некоторой окрестности точки (х?, ..., х®) Эквивалентна системе вида
= Si(хк+1, • • •» ®п) 1 1=1, к.	(11.14)
358
11. ТЕОРИЯ МНОГООБРАЗИЙ
Пусть аь ..., ап — координаты вектора £ в выбранной системе координат. Рассмотрим параметризованную кривую, которая в координатах Ж], ..., хп описывается системой
xi(t) = >	п	--------
[	Xi+dit,	г = «4-1,71.
Непосредственной проверкой убеждаемся, что эта кривая лежит на множестве ЛГ, проходит через точку Р (при t — 0) и касается вектора £. ►
Пример 11.16. На трехмерной сфере S3 рассмотрим множество касательных векторов в ее южном полюсе S (см. пример 11.3), касающихся пересечения сферы с трехмерной плоскостью, которая в координатах xq, xi, х2, хз пространства R4 описывается уравнением
яо + zi +а>2 + яз + 1 = 0.
(11.15)
Для этого возьмем в окрестности точки S стереографически координаты с центром в северном полюсе и найдем в этих координатах уравнение, задающее данное пересечение. Пусть точка (з?о,	, х-2, хз) Е R4 лежит в пересечении, и it/i, 3/2, Уз ~~
стереографические координаты. Согласно примеру 11.3, связь между координатами выглядит следующим образом:
х2
Х\	х2	хз
2/1 ~ 1—17’	^2 = ;—— ’ Уз = -——
1 Xq	1 Xq	1 Xq
Из равенства (11.5) находим, что
11.4. Касательные векторы
359
Следовательно,
— о I 1 ’	—	2 । 1 ’
а2 4-1 а2 4-1
где а2 = у2 + 2/2 + 2/з- Подставляя найденные выражения для координат го,	%з в уравнение трехмерной плоскости
(11.15), находим
У\ + У2 + 2/з + 2/1 +2/2 + 2/з = 0.	(11.16)
Это уравнение описывает в локальной системе координат множество точек на сфере, попадающих на заданную трехмерную плоскость. Иначе говоря, это уравнение в окрестности точки S описывает пересечение D сферы с трехмерной плоскостью. Левая часть уравнения есть гладкая функция /(2/ь2/2>2/з)» определенная в окрестности южного полюса, имеющего координаты J/1 =0, 2/2 = 0, j/з = 0. Мы тем самым описали множество D в окрестности точки S уравнением /(2/1»2/2» З/з) =0.
Чтобы найти все касательные векторы в точке 5, касающиеся множества £), нужно решить уравнение £(/) = 0 относительно неизвестного вектора Пусть этот вектор в системе координат 2/i, 2/2» 2/з имеет координаты ®2i «з. Тогда условие касания этого вектора множества D в точке S будет иметь вид
^(0,0,0)а1 + ^(0,0,0)а2+^(0,0,0)а3 = 0, ду\	дуг	&Уз
или
+ а2 + а3 = 0,
(11-17)
так как все три частные производные при у\ = уг = уз = 0 равны единице. Поскольку матрица-строка (/'	/'3) в
точке S (при т/i = 2/2 = 2/з = 0) имеет максимальный ранг, равный единице, условие £(/) = 0 является не только необходимым. Но и достаточным. Значит, вектор с координатами а>, аг, аз касается подмножества D тогда и только тогда, когда его Координаты удовлетворяют уравнению (11.17).
360
11. ТЕОРИЯ МНОГООБРАЗИЙ
11.5. Касательное расслоение и дифференциал
Рассмотрим множество всех касательных векторов к тг-мер-ному многообразию М в точке Р. В этом множестве можно ввести операции сложения двух векторов и умножения вектора на действительное число. Действительно, каждый касательный вектор можно трактовать как дифференцирование в точке Р. Рассмотрим два касательных вектора £ и ij в точке Р. Функция D(f), определяемая формулой
является линейной функцией, поскольку она задана как сумма двух линейных функций. Кроме того, используя то, что £(/) и 7?(/) являются дифференцированиями, получаем
D(fg) =((fg) + fj(fg) = (/(P)f(ff) + C(/)j(P)) +
+ (ДР) g{g) + ДДд(Р)) = ДР) (C(s) + g(g)) +
+ (W) + g(f)) g(P) = ДР) D(g) + D(f)g(P).
Следовательно, функция D(f) есть дифференцирование в точке Р. Этому дифференцированию соответствует касательный вектор, который мы назовем суммой касательных векторов и fj и обозначим £ + т/. Аналогично вводим произведение А£ касательного вектора £ на произвольное число А € R, трактуя касательный вектор как дифференцирование и по определению полагая
(Ч)(/) = >£(/), ИС°°(М).
Отметим, что, согласно равенству (11.13), сложение касательных векторов и умножение касательного вектора на число в координатах выполняется как сложение и умножение на число векторов n-мерного линейного арифметического пространства-Это значит, что введенные нами операции удовлетворяют аксиомам линейного пространства и тем самым превращают мно
11.5. Касательное расслоение и дифференциал
361
жество касательных векторов в точке Р в n-мерное линейное пространство. Это линейное пространство называют каса-тельным пространством к многообразию М в точке р и обозначают ТрМ (рис. 11.15).
Рис. 11.15
Пример 11.17. Многообразие Rn является п-мерным линейным пространством. Поэтому касательное пространство TpRn, Р Е Rn, можно было бы отождествить с Rn. Однако более удобна другая точка зрения. Касательный вектор к многообразию Rn в точке Р по аналогии с геометрическими векторами можно интерпретировать как связанный вектор. имеющий фиксированное начало Р, поскольку различаются любые касательные векторы с разными точками приложения. С этой точки зрения касательное пространство к многообразию М в точке Р представляет собой множество связанных векторов с общим началом Р.
Пример 11.18. Регулярная поверхность S является двумерным многообразием (см. пример 11.5). Касательное пространство к многообразиюS в произвольной точке PeS можно отождествить с линейным пространством векторов, коллинеарных касательной плоскости к поверхности S в точке Р (см. Пример 11.15).
Пример 11.19. Пусть F: G С Rm -> Rw-n — гладкая функция многих переменных, определенная в области G. Рассмотрим множество Л/ решений системы нелинейных уравнений
362
11. ТЕОРИЯ МНОГООБРАЗИЙ
F(x) = 0. Если ранг матрицы Якоби F'(x) функции F(x) всюду в Л/ максимален и равен т — п, то, согласно теореме 11.1. множество М является //-мерным многообразием. Касательное пространство к многообразию М в произвольной точке Р можно отождествить с n-мерной плоскостью в Rm, заданной системой уравнений
2=1	3
(II.IX)
где fi — координатные функции функции F, я,, координаты точки Р в Rm, а у\, ..., ут — координаты про извольной точки в Rm. Действительно, согласно теореме 11.10, вектор £ € R”1 является касательным к многообразию М, которое можно рассматривать как подмножество многообразия Rm, если 6,{{i) =0, i = 1, т-п. Но запись равенств £(/,) = 0. 1= \ ,т-п в координатах в R,n совпадает с (11.18).
Пример 11.20. Найдем двумерную плоскость в простран стве R4, с которой отождествляется касательное пространство в точке S к пересечению трехмерной сферы S3 и трехмерной плоскости (11.15) из примера 11.16. Это пересечение удобно представить как двумерное многообразие М, заданное в координатах то, хь .г-2, х.з пространства R4 системой уравнений
( *о + *1+г2 + г3=
I х0 + Х| + х2 + х3 + 1 = 0.
Используя результаты примера 11.19 для многообразия М и его точки Р = S = (-1,0,0,0), получаем систему уравнений
Уо 4-1 = 0,
Уо 4- 2/1 4- У2 4- Уз 4-1 = 0,
которая задает искомую плоскость. #
11.5. Касательное расслоение и дифференциал
363
Множество ТМ всех касательных векторов к многообразию М во всех его точках называют касательным расслоением этого многообразия. Касательное расслоение n-мерного многообразия М рассматривают как гладкое многообразие размерности 2п, вводя системы координат наТМ следующим образом. Пусть (U,h) — карта на многообразии М. Рассмотрим объединение TU = ^ТрМ касательных пространств по всем точкам носителя U карты. Отображение Я: TU ->R2n определим следующим образом:	=	..., хп, аь ..., ап), т.е. объ-
единив координаты Я],..., хп точки Р € U и координаты ai,..., an касательного вектора £ в этой точке, вычисленные в локальной системе координат ((7,h). Если (V,p) — другая карта, согласованная с ((7, Л), то из формул (11.8) следует согласованность соответствующих карт касательного расслоения. Таким образом, атлас многообразия М позволяет построить атлас касательного расслоения ТМ этого многообразия.
Ставя в соответствие каждому вектору £ € ТМ его точку приложения, получаем гладкое отображение iv.TM -4 М, которое называют естественной проекцией касательного расслоения на многообразие.
На случай гладкого отображения многообразий можно перенести понятие дифференциала функции многих переменных. Напомним, что если функция /: G С Rn -4 Rm, определенная в области G, дифференцируема в точке яо € 6’, то ее дифференциал в этой точке имеет вид dy = f(xQ)dx, где /'(xq) — матрица Якоби функции f в точке xq. Это равенство, по существу, представляет собой запись линейного оператора, который вектору dx ставит в соответствие вектор dy = /'(xojdx.
Пусть F: М -4 N — гладкое отображение гладких многообразий М и N. Выберем карты (U,h) и (V,k) на многообразиях М и /V, накрывающие точки Р € М и Q = F(P) € М. В Зтих картах отображение F будет записываться как гладкая Функция многих переменных Ры = к° F°h~l. Рассмотрим дифференциал этой функции в точке xQ = h(P). Этот дифференци
364
11. ТЕОРИЯ МНОГООБРАЗИЙ
ал определяет линейный оператор dFp, который касательному вектору £ € ТрМ с координатным представлением & в карте (U,h) ставит в соответствие вектор rje TqN, имеющий в карте (У,к) координатное представление fjk =
Оказывается, что построенный нами линейный оператор dFp из линейного пространства ТрМ в линейное пространство TqN, Q = F(P), не зависит от выбора карт (U,h) и (V,k). Действительно, произвольный касательный вектор £ € ТрМ можно интерпретировать как касательный вектор к некоторой гладкой параметризованной кривой у на многообразии М. проходящей через точку P = y(to). В этом случае координатное представление & вектора £ является касательным вектором (/io^)'(i0) к вектор-функции hoy. Поэтому, согласно правилу дифференцирования сложной функции,
% = (n*)'(«%= (Л’СоЛ-’)'(х0) (*•?)%) = (Л»Г«7)'(«о).
Полученное равенство означает, что арифметический вектор ifa. является координатным представлением касательного вектора к гладкой параметризованной кривой Fоу на многообразии Л в точке Q. Значит, касательному вектору к параметризованной кривой у в точке Р рассматриваемый линейный оператор ставит в соответствие касательный вектор к параметризованной кривой Fоу в точке F(P). Это заключение коротко можно выразить следующим образом: если отображение F „перетаскива-ет“ кривые с многообразия М на многообразие N, то линейный оператор переводит касательный вектор к параметризованной кривой в касательный вектор к ее образу при отображении F. Такая интерпретация линейного оператора dFp показывает, что он действительно не связан с выбором каких-либо координат на многообразиях М и ЛГ.
Линейный оператор dFp: ТрМ -+Tp(p)N, построенный выше, называют дифференциалом гладкого отображения Р (или касательным отображением) в точке Р (рис. ll.lt>)-
11.5. Касательное расслоение и дифференциал
365
Рис. 11.16
Теорема 11.11. Пусть F: М -ь N — гладкое отображение многообразия М в многообразие N. Тогда для любой гладкой функции f gC°°(N) верно тождество

(11.19)
4 Пусть касательный вектор £ € ТрМ является касательным вектором к гладкой параметризованной кривой у в точке Р = = y(to). Тогда касательный вектор ff=dFp^ является касательным вектором к параметризованной кривой F°y в точке F(P). Используя правило дифференцирования сложной функции, получаем
Ш) = (/» Fo7)'(«o) = ((/°F) O7)'(to)	►
Понимая касательный вектор как линейную функцию на алгебре гладких функций, можем утверждение теоремы 11.11 переписать в виде
dFP(=^F\	(11.20)
где F* — индуцированное отображение, порожденное гладким отображением F.
Формулы (11.19) и (11.20) означают следующее. Чтобы най-
производную функции f Е С°°(УУ) вдоль образа dFp£ касательного вектора £еТрМ при отображении dFp — дифференциале гладкого отображения F: М -4 N — достаточно продиф
366
11. ТЕОРИЯ МНОГООБРАЗИЙ
ференцировать вдоль касательного вектора £ образ функции / при индуцированном отображении F*, переводящем функцию f в гладкую функцию на многообразии М.
Пусть F: М N — гладкое отображение п-мерного многообразия М в m-мерное многообразие N. Тогда в каждой тонко Р £ М определено отображение dFp: ТрМ —>TqN, Q = F(P). Следовательно. мы имеем отображение dF:TM—>TN касательного расслоения ТМ в касательное расслоение TN. Запишем его с помощью карты (U,h) на многообразии М, накрывающей фиксированную точку Ро, и карты (V,k) на многообразии N, накрывающей точку Qq = F(Pq):
tfk = (FhkY(x)^
где & и fjk — координатные представления векторов £ € ТрМ и г/ С TqN> Q = F(P), х = Л(Р), Fhk = k<>F<>h~l — координатное представление отображения F в картах (U,h) и (V,k). Из этого представления видим, что отображение dF является гладким отображением многообразий ТМ и ТN. Его называют дифференциалом отображения F.
Теорема 11.12. Пусть F: М N и G: N К — гладкие отображения многообразий. Тогда
d(G°F) = dG°dF.	(11.21)
4 Это равенство достаточно проверить в фиксированной точке. Выберем произвольную точку Р и касательный вектор £ € € ТрМ. Существует гладкая параметризованная кривая т на многообразии М, проходящая через точку Р, для которой вектор £ является касательным в точке Р. Ее образом при отображении F является гладкая параметризованная кривая Fo7, а образом F07 ПРИ отображении G является гладкая параметризованная кривая GoFoy. Поскольку при гладком отображении касательному вектору к кривой соответствует касательный вектор к образу этой кривой, то заключаем, ’«то
11.6. Векторные поля на многообразиях
367
вектор dFf является касательным вектором к кривой F07, а вектор (dG<>dF)£ — касательным вектором к кривой G0F07, образу 7 при отображении G о F. Так как в то же самое время Кривая G ° F07 есть образ кривой Fо7 при отображении G, получаем равенство
d(G о F)( = dG(dF£) = (dG о dF)£.
Поскольку это равенство верно в любой точке Р для любого вектора £ € ТрМ, то верно равенство (11.21). ►
11.6. Векторные поля на многообразиях
Гладкую функцию на многообразии можно дифференцировать лишь вдоль какого-либо касательного вектора. Если мы хотим дифференцировать функцию во всех точках многообразия, мы должны в каждой точке многообразия задать касательный вектор. Так мы приходим к понятию векторного полл на многообразии.
Согласно сказанному, векторное поле есть отображение, которое каждой точке Р многообразия ставит в соответствие касательный вектор с точкой приложения Р (т.е. любой точке соответствует „свой* вектор). Это отображение можно записать в виде X: М -+ТМ. Условие, что точке Р соответствует касательный вектор из ТрМ, можно записать с помощью естественной проекции тг касательного расслоения в виде тг о X = в где idм — тождественное отображение многообразия М на себя. Если отображение X: М -ьТМ является гладким (и 7го% = idд/), то его называют гладким векторным полем ** многообразии М. Мы будем рассматривать только гладкие векторные поля. Множество всех гладких векторных полей
многообразии М будем обозначать через Т)(М). Значение векторного поля X в точке Р многообразия будем обозначать Через ХР.
368
11. ТЕОРИЯ МНОГООБРАЗИЙ
Пусть X — гладкое векторное поле на многообразии М и (U,h) — некоторая карта на этом многообразии. Обозначим через ..., хп координаты точки многообразия б локальной системе координат а через ..., ап — координаты касательного вектора. Тогда совокупность ..., хп, aj, будет представлять собой координаты точек касательного расслоения ТМ, принадлежащих множеству TU =	Век-
торное поле X как гладкое отображение из М в ТМ в указанных координатах будет записываться с помощью гладких координатных функций:
'XI = и1(аГ|,...,жп),
2?п — Un (#1,..., Хп)} «1 = Vl(xi,...,Zn),
, — М* !»•••» ) •
Условие 7г°Х = idjvr означает, что функции щ совпадают с координатными функциями карты, т.е. ut(zi,...,zn) = zt-, i = 1, п. Поэтому первые п координатных функций в координатной записи векторного поля являются фиктивными (несущественными), а векторное поле полностью определяется функциями ai, ..., ап, которые называют координатными функциями векторного поля X. Очевидно, что гладкость векторного поля равносильна гладкости его координатных функций.
На множестве U С М определены такие векторные поля Xt, i= 1,п, что векторное поле X, каждой точке P&U сопоставляет вектор, который в карте (U,h) имеет координаты (О, ..., О, 1, 0, ..., 0) (единица находится на i-м месте). Введем для таких векторных полей, заданных локально, лишь в рамках одной карты, обозначения X, = i = 1, п, и будем называть dxi
коорЭинатньмси векторными полями^ соответствующими
11.6. Векторные поля на многообразиях
369
карте (U,h). Тогда векторное поле X с координатными функциями в], ..., ап можно записать следующим образом:
„	,	\ д / ч д
X = fli(zb...,zn) — + а2(хъ...,хп)— + ...
д п	д
dn (z 1,..., хп)	=	di (zj,..., хп)	. (11.22)
п	»=1	1
Таким образом, векторные поля являются базисом во множестве всех гладких векторных полей в рамках фиксированной карты, а координатные функции векторного поля являются коэффициентами разложения по этому базису.
Пусть X — векторное поле, a f — гладкая функция на многообразии М. В каждой точке PtM можно определить производную Xp(f) функции f вдоль кисителъного векторе Хр. Производная функции по направлению касательного вектора — число. Поэтому мы получили новую функцию <р(Р) = Xp(f) на многообразии М, которую называют производной функции f вдоль векторного поллХ.
Выбрав некоторую карту (С/, А) на многообразии Л/, мы можем записать значение Xp(f) для точек P$U производной функции f вдоль касательного вектора Хр согласно представлению (11.12) в следующем виде:
Хр(/) = (/о/1-,)'(Л(Р))(Хр)Л,
гДе (Xp)h — координатное представление касательного вектора Хр. Из этого представления вытекает, что функция <р(Р) = ^Xp(f) является гладкой. Действительно, если zb ..., хп -координаты на многообразии М, порожденные картой ((7, А), то координатное представление Д = /оА-1 гладкой функции f есть гладкая функция переменных zb ..., zn, а векторное Коле X может быть записано с помощью гладких функций
370
11. ТЕОРИЯ МНОГООБРАЗИЙ
ai(xly...,xn) в виде
п
X —	* di (х ],..., хп)
1=1
д dxi
Поэтому функция
п
1 *^п) =	(*^ 1 ’ • • • ’
1=1
dfh дх^
являющаяся координатным представлением функции Хр(/), есть гладкая функция многих переменных. Значит, и сама функция Xp(f) на многообразии М является гладкой.
В карте для производной гладкой функции f вдоль векторного поля X имеем
п
Х(/) =
1=1
(11.23)
В частности, для координатного векторного поля Л\ = —
(/X I
получаем простую формулу
Xi(f) =
dfh
dxi ’

1
Эта формула и служит основанием для обозначения координатных векторных полей символом частной производной.
Теорема 11.13. Пусть X — векторное поле на многообразии М. Тогда следующие условия эквивалентны:
1)	X — гладкое векторное поле;
2)	в любой локальной системе координат Я], ..., хп векторное поле X определяется равенством (11.22), где i = 1, п, — гладкие функции;
3)	для любой гладкой функции f € С°°(М) функция X(D также является гладкой.
11.6. Векторные поля на многообразиях
371
4 Эквивалентность условий 1 и 2 уже была доказана выше. Выше также было отмечено, что для гладкой функции f и гладкого векторного поля X функция X(f) также является гладкой, т.е. что из условия 1 следует условие 3. Таким образом, остается доказать, что из условия 3 вытекает условие 1 или условие 2.
Итак, пусть выполнено условие 3. Выберем произвольную точку Р и докажем, что в некоторой карте, накрывающей точку Р, координатные функции векторного поля являются гладкими. Выберем произвольную карту (f/,/i), накрывающую точку Р. Тогда существует такое число е > 0, что замкнутая 2г-окрестность U(/i(P),2e) точки Л(Р) в Rn целиком попадает в область h(U) — образ множества U при отображении h. Можно показать, что существует такая бесконечно дифференцируемая действительная функция одного действительного переменного у>(£), которая удовлетворяет условиям <p(t) = 0 при t $ 0 и <p(t) = 1 при t 1 и является возрастающей. Функция д(х) = = р('2 -	х £ определена в Rn и является гладкой,
 \	в /
причем д(х) = 1 при х Е U(/i(p),s) и д(х) = 0 при х $ U(/i(p),2£).
Пусть Х|, ..., хп — локальные координаты, соответствующие карте (U,h), и V — прообраз окрестности U(/i(P), г) точки 4(Р) € Rn при отображении Л, т.е. V = h~x (U(/i(P), г)). Рассмотрим г-ю координатную функцию Х{ отображения h. Функция fi(Q) = Xi(Q)g(h(Q)) определена на множестве U, причем на множестве V она совпадает с функцией х^ а на множестве U\h~{ (U(/i(P), 2г)) она обращается в нуль. Можно показать, нто, доопределив функцию fi на M\U нулевыми значениями, мы получим гладкую функцию на многообразии Л/. Таким Образом, на многообразии М существует такая гладкая функция которая на множестве V совпадает с координатной Функцией Xi отображения h. В системе координат ..., хп На множестве V представление функции /t имеет вид (fi)h(xi,...,xn) = xt. Обозначив координатные функции векторного поля X через сц, ..., an, заключаем, что %(/,) = а.
372
11. ТЕОРИЯ МНОГООБРАЗИЙ
в окрестности V точки Р. По предположению, производная любой гладкой функции f вдоль векторного поля X является гладкой функцией. Значит, функции at , г = 1, п, являются гладкими в окрестности точки Р, Поскольку карта ((7, Л) и точка Р выбирались произвольно, приходим к выводу, что из условия 3 вытекает условие 2. ►
Теорема 11.14. Любое гладкое векторное поле X обладает свойствами:
1°. Х(А/ + Др) = АХ(/)+МХ(^), A,MeR, /,<7бС~(М).
2°. X(fg) = fX(g)+X(f)g, f,geC°°(M).
Любое отображение D: С°°(М)	обладающее ука-
занными свойствами, порождается некоторым гладким векторным полем X, т.е. функция £)(/) есть производная функции f вдоль векторного поля X.
◄ Первое утверждение теоремы вытекает из теоремы 11.8, так как речь идет о проверке свойств в каждой точке многообразия, которую можно считать фиксированной. Поэтому остановимся на доказательстве второго утверждения.
Любое отображение £): С°°(М) -> С°°(М) в каждой точке Р Е М определяет отображение Dp(f), которое функции f Е € С°°(М) ставит в соответствие число, равное значению функции D(f) в точке Р, т.е. Dp(f) = (£)(/)) (Р). Если отображение D обладает свойствами 1° и 2°, указанными в формулировке теоремы, то для любой точки Р Е А/ отображение Dp является дифференцированием в точке Р. Дифференцирование в точке, согласно теореме 11.9, есть дифференцирование вдоль некоторого касательного вектора в этой точке. Значит, в каждой точке Р Е М определен касательный вектор Хр Е ТрМ* т.е. на многообразии М задано векторное поле X, Условие, что отображение D любой гладкой функции ставит в соответствие гладкую функцию, означает, что производная X(f) любой гладкой функции вдоль векторного поля X является гладкой. Согласно теореме 11.13, векторное поле X гладкое. ►
11.6. Векторные поля на многообразиях
373
Отображение X:	-> С°°(Л/), обладающее свойства-
ми 1° и 2° из теоремы 11.14, называют дифференцированием алгебры	Свойство 1° означает, что дифференцирова-
ние алгебры является линейным оператором, действующим на этой алгебре. Свойство 2° определяет дополнительные свойства этого линейного оператора. Согласно теореме 11.14, понятие гладкого векторного поля на многообразии и понятие дифференцирования алгебры гладких функций на этом же многообразии можно отождествить, заменяя в случае необходимости одно ДРУГИМ.
На множестве гладких векторных полей на многообразии М можно ввести операции сложения векторных полей и умножения векторного поля на гладкую функцию. Суммой X + Y векторных полей X и У называют векторное поле, которое каждой точке Р € М ставит в соответствие касательный вектор Xp + Yp, т.е. по определению
(X + Y)p = XP + Yp.
Произведением fX векторного поля X на гладкую функцию f называют векторное поле, которое каждой точке РЕ М ставит в соответствие касательный вектор f(P)Xp, т.е. по определению
(fX)p = f(P)Xp.
Нетрудно убедиться, используя координатную запись, что сумма двух гладких векторных полей является гладким векторным полем, произведение гладкого векторного поля на гладкую функцию есть гладкое векторное поле. Более того, если в карте (U,h) векторные поля X и Y имеют координатные записи
374
11. ТЕОРИЯ МНОГООБРАЗИЙ
а функция feC<x>(M) представлена функцией Д(Х1,...,жп), то
П	п
,...,Хп) I
/ OXi
д dxi ’
п
/Х = ^(д(х„ :=1
т.е. при сложении векторных полей их координатные функции складываются, а при умножении векторного поля на функцию координатные функции умножаются на эту функцию.
Выясним, как связаны друг с другом векторные поля и гладкие отображения. Пусть F: М -> N — гладкое отображение, X — гладкое векторное поле на Л/. Для любой точки Р € М касательный вектор Хр € ТрМ касательным отображением dFp преобразуется в касательный вектор dFp(Xp) ETp^p^N в точке F(P) многообразия N. Естественно было бы рассматривать соответствие F(P) —> dFp(Xp) как векторное поле на многообразии N. Однако это не всегда возможно по двум причинам. Во-первых, возможна ситуация, когда две разные точки Pi и Р? при отображении F переходят в одну точку Q € N, но при этом касательные векторы Хр} и Хр2 отображением dF переводятся в разные касательные векторы к многообразию N в точке Q. В этой ситуации точке Q соответствует не один касательный вектор, а несколько. Во-вторых, отображение F может не быть сюръективным и тогда соответствие F(P) -> dFp(Xp) не будет определено на всем многообразии 2V.
Если для данного отображения F: М -> N и данного векторного поля X € Т>(М) две указанные трудности не возникают, т.е. отображение F сюръективно и из равенства F(P) = F(Q) следует равенство dFp(Xp) = </Fq(Xq), то на многообразии N получаем векторное поле Yq = dFp(Xp), где PcF"l(Q)-Остановимся на частном случае, когда отображение F является диффеоморфизмом. Такое отображение сюръективно, а равенство F(P) = F(Q) равносильно равенству P = Q, что означает и выполнение равенства dFp(Xp) = dFq(Xq).
J J.6. Векторные поля на многообразиях
375
Теорема 11.15. Пусть F: М -> N — диффеоморфизм. Тогда для любого гладкого векторного поля X на многообразии М корректно определено гладкое векторное поле dF(X) на /V, причем это векторное поле как дифференцирование на многообразии N может быть представлено в виде
dF(X) = (F-1)*o%oF*.
4 Как было отмечено, при диффеоморфизме F отображение dF переводит гладкое векторное поле X в некоторое векторное поле Y = dF(X). Покажем, что это векторное поле гладкое. Для любой функции f G C°°(/V), согласно теореме 11.11, имеем
(Y(f))(Q) = YQ(f) = XP(foF)
p=F-4Q)
(11.24)
Так как функция f°F гладкая, векторное поле X тоже гладкое, то и функция у>(Р) = Xp(foF) является гладкой. Следовательно, функция (Y(f))(Q) = ^(F”1^)), как композиция гладких функций, является гладкой. В силу теоремы 11.13 векторное поле Y гладкое.
Убедимся в верности представления векторного поля Y = — dF(X). Пусть f — произвольная гладкая функция на многообразии N. Тогда для произвольной точки Q € N, полагая, что Р= F~*(Q), и используя равенство (11.24), находим
(П/))(<?) = Xp(f°F) = XP(F*(f)) = (X(F*(/)))(P) =
= (X(F-(/)))(F-1(Q))=(((F-,)*oXoF’)(/))(Q). (11.25)
Отсюда следует, что функции Y(f) и ((F-1)* о X о F*)(f) совпадают. Следовательно, на множестве всех гладких функций на многообразии N совпадают отображения dF(X) и (F'^^XoF*. ►
Отметим, что диффеоморфизм любое гладкое векторное поле X на многообразии М переводит в гладкое векторное поле на
376
11. ТЕОРИЯ МНОГООБРАЗИЙ
многообразии N, а обратное отображение к диффеоморфизму переводит любое гладкое векторное поле на N в гладкое векторное поле на М. Тем самым диффеоморфизм устанавливает взаимно однозначное соответствие между гладкими векторными полями на многообразии М и гладкими векторными полями на многообразии N.
11.7. Фазовый поток векторного поля
Понятию векторного поля на многообразии можно придать физическую интерпретацию, представляя его как поле скоростей частиц потока жидкости. Предположим, что жидкость заполняет все многообразие, в каждой точке Р многообразия в каждый момент времени находится частица, которая движется со скоростью v(P). В разные моменты времени в точке Р могут находиться разные частицы, но скорость их движения будет одна и та же, т.е. скорость движения частиц определяется положением на многобразии и не зависит от времени (такое движение называют стационарным). Эта гидродинамическая интерпретация векторного поля приводит к новым геометрическим понятиям. Например, каждая частица жидкости, двигаясь по многообразию, проходит некоторую траекторию, которую можно рассматривать как параметризованную кривую (параметром кривой при этом является время). Множество таких траекторий характеризует векторное поле скоростей текущей жидкости. В геометрии многообразий под траекторией следует понимать некоторую гладкую параметризованную кривую, а под полем скоростей потока жидкости — произвольное гладкое векторное поле.
Гладкую параметризованную кривую у на многообразии М называют интегральной кривой векторного поля X, если касательный вектор к этой кривой в каждой ее точке Р совпадает с Хр (рис. 11.17). Это определение соответствует гидродинамической интерпретации векторного поля. Если
11.7. Фазовый поток векторного поля
377
параметр t кривой у интерпретировать как время, а точки кривой — как положение частицы жидкости в соответствующие моменты времени, то касательный вектор к кривой будет выражать мгновенную скорость частицы жидкости.
Рассмотрим на многообразии М гладкое векторное поле X. Пусть в локальной системе координат х\,..., хп это векторное поле имеет вид
v — V' (	\
X —
Если 7 — интегральная кривая векторного поля X, имеющая координатные функции x\(t), ..., xn(t), то касательный вектор к этой кривой в точке, соответствующей значению t параметра, имеет координаты ^(0, ..., x'n(t). Поскольку, согласно определению интегральной кривой, касательный вектор к этой кривой совпадает со значением векторного поля, то
•^1 (0 — (*^1 ’ • • • ’ *^п))
жп(^) — ап(^1 > • • •»*^п)*
Мы получили систему обыкновенных дифференциальных уравнений (систему ОДУ), которую можно записать кратко в виде ® = А(ж), где х = (a?i ... хп)Т, А(я) — функция многих переменных вида A: Rn —> Rn, координатными функциями которой являются координатные функции a;(xi,...,a:n) векторного поля
378
11. ТЕОРИЯ МНОГООБРАЗИЙ
X, a x(t) обозначает вектор-столбец производных x^t) координатных функций интегральной кривой 7, вычисленных при заданном значении t.
Итак, координатное представление x(t) любой интегральной кривой векторного поля X является решением системы ОДУ х = Д(ж). Очевидно, что верно и обратное: любое решение этой системы ОДУ представляет собой интегральную кривую векторного поля X. Открывшаяся связь теории многообразий с теорией дифференциальных уравнений оказывается очень глубокой и весьма плодотворной. В данном случае эта связь позволяет для исследования векторных полей привлечь методы теории дифференциальных уравнений. Отметим, что полученная нами система является нормальной автономной системой ОДУ, причем правые части уравнений системы являются гладкими функциями.
Задача определения интегральной кривой, проходящей через данную точку х° = (х\, ..., х°), сводится к поиску решения системы ОДУ, удовлетворяющего начальному условию х(to) = х°, т.е. к задаче Коши для нормальной системы ОДУ. Согласно теореме Коши существования и единственности решения системы ОДУ, эта задача имеет единственное решение. Параметрами этой задачи являются координаты точки х° и начальный момент времени to, который можно менять произвольным образом. Действительно, если y(t) является интегральной кривой, удовлетворяющей условию 'у(^о) = то y(t) = 7(^ + 0) также является интегральной кривой, причем эта интегральная кривая удовлетворяет условию 7(to - а) = Р. Если не различать параметризованные кривые, которые преобразуются друг в друга заменой параметра вида г = t + а (сдвигом параметра), то можно утверждать, что через каждую точку многообразия проходит единственная интегральная кривая, две интегральны^ кривые либо не пересекаются, либо совпадают.
Эти свойства интегральных кривых легко понять, исходя из гидродинамической интерпретации векторного поля. Интегральные кривые поля скоростей потока жидкости — это
11.7. Фазовый поток векторного поля
379
траектории движения частиц жидкости. Траектории не могут пересекаться, так как иначе в точке их пересечения у частицы жидкости было бы два варианта движения, а это противоречит физическому смыслу задачи.
Течение жидкости можно изучать, рассматривая положение ее части в различные моменты времени. Частица жидкости, находящаяся в точке Р € М в начальный момент времени t = О, к моменту времени t > 0 перейдет в другую точку (или была в другой точке при t < 0), которую мы обозначим через At(P). Положение Af(P) частицы является функцией как времени t, так и начального положения Р. При фиксированном моменте времени t мы получаем отображение М -> М, которое точку Р многообразия М переводит в точку At(P). Отметим, что при t = 0 отображение At сводится к тождественному. Кроме того, композиция At о As отражает изменения в положении частиц за период времени, равный t + s, т.е. совпадает с отображением At+S.
Описанные свойства потока жидкости на самом деле не связаны с физической интерпретацией и относятся к произвольным векторным полям. Рассмотрим векторное поле X на многообразии М. Выберем произвольную карту (U,h) на многообразии М. В области h(U) С Rn векторному полю X соответствует задача Коши х = А (ж), я(0) = х° (как условились, считаем, что i0 = 0). Для любой точки xQ € h(U) решение задачи Коши определено в некоторой окрестности точки t = 0 и является функцией как параметра t, так и начального положения х°. Это решение определяет интегральную кривую 7(t,Po) векторного поля X, проходящую через точку Pq = 7(0,Pq) с координатным представлением xQ в карте (U,h). Зафиксировав сопоставим точке Pq точку y(tyPo). Получим отображение At: М —> М. Таким образом, векторное поле X порождает семейство отображений {А<} многообразия М в себя. Отметим, Ито при заданном t отображение At может быть определено не На всем многообразии М. Однако для любой точки Р многообразия М можно выбрать такую достаточно малую окрест
380
П. ТЕОРИЯ МНОГООБРАЗИЙ
ность U(P) и такое 6 > 0, что при всех |t| < 6 отображение А( будет определено в окрестности U(P). Далее через Ut будем обозначать область определения отображения At, рассматриваемого при фиксированном t.
Пример 11.21. Рассмотрим векторное поле л = — в R. Задача Коши для определения интегральных кривых этого векторного поля имеет вид х = 1, х(0) = х°, а ее решение таково: x(t) = xQ -Ft, t € R. Таким образом, в данном случае At(x) = s + t, отображения At определены при любом t на всем многообразии.
Если то же векторное поле рассмотреть лишь на некотором интервале, например (0,1), т.е. положить, что Л/= (0,1), то получим то же представление для At, но при этом область определения отображения будет меняться с изменением t. При 0 < t < 1 отображение At определено на интервале (0,1 -1). При -1 < t < 0 оно определено на интервале (-t, 1), а при |t|	1
имеет пустую область определения.
Теорема 11.16. Семейство отображений At: Ut~+ М обладает свойствами:
1°. UQ = М, a Aq — тождественное отображение.
2°. Ut С Ua при 0 < s < t или при t < s < 0.
3°. U Ut = и Ut = м. t>o t<o
4°. At(Us) C l/a-t, где 0 < t < s или s < t < 0.
5°. At+S = A<oAs.
6°. A_t = (Af)-1.
7°. Ar Ut —> U-t — диффеоморфизм.
◄ Свойство 1° непосредственно следует из определения семей' ства {At}. При фиксированном Р параметризованная кривая 7(t) = Af(P) определена в некотором интервале (-а, $), держащем нуль. Согласно определению, точка Р принадлежит множеству Ut при t € (-а, 0) и не принадлежит ему пр11 t £ (—а, /3). Это значит, что если Р € Ut, то t € (—а, /?)•
11.7. Фазовый поток векторного поля
381
тогда и s € (—о, /3), если 0 < з < t или t < з < 0. В таком случае Р € Ua. Тем самым доказано свойство 2°.
Перейдем к доказательству свойства 3°. Пусть Р — произвольная точка М. Через точку Р проходит интегральная кривая 7(f) с областью определения (—а, 0). Выберем некоторое значение т € (-а, 0), и пусть у(т) = Q. Рассмотрим параметризованную кривую y(t) = 7(t + r). Как было отмечено выше, эта кривая является интегральной кривой векторного поля X, причем областью определения этой кривой является интервал (-а - г, 0 - г), содержащий нуль, и 7(0) = у(т) = Q. А это значит, что y(t) = At(Q). Так как At(Q) = 7(0) = Р при t = -г > 0, то точка Р принадлежит множеству Ut. Итак, для любой точки Р можно указать такое число f, что Ut. Следовательно, Р € VQUt- Аналогично доказывается равенство Р € *0^.
Докажем свойство 4°. Пусть Р € Us. Это значит, что интегральная кривая 7(f) = At(P) определена на интервале (-а, Д), который содержит точку з. Если t € (-а, /3), то через точку Q = At(P) проходит интеральная кривая AT(Q) = у(т + t) с областью определения (—о — f, Д - t). Ясно, что s - t € (—о — t,0-f). Таким образом, At(UtC\Us) С Us-t. В частном случае 0 < t < з или з < t < 0 имеем Us С Ut, что приводит к свойству 4°.
Докажем свойство 5°. Пусть Р tzUs и Q = А3(Р). Это значит, что интегральная кривая y(t) = At(P), проходящая через точку Р при t = 0, имеет область определения (-а, Д), которая содержит точку t = з. Эта интегральная кривая проходит и через точку Q при значении параметра t = з. Следовательно, интегральная кривая y(t) = y(t + s) проходит через точку Q при ^ = 0, а потому совпадает с At(Q). Областью определения интегральной кривой 7 является интервал (-о - з, 0 - з). Пусть значение t принадлежит этому интервалу. Тогда
At+s(P) = y(t + з) = 7(f) = At(Q) = At(As(P)) = (Л о AS)(P).
Поскольку точку Р МОЖНО выбрать произвольно, ТО At+s = 55 At о As, т.е. доказано свойство 5°.
382
И. ТЕОРИЯ МНОГООБРАЗИЙ
Перейдем к свойству 6°. Оно утверждает, что при фиксированном t отображение At является инъективным, областью значений этого отображения является множество (/_«, а обратным отображением является Пусть Рб Ut. Тогда интегральная кривая 7(5) = AS(P) определена на интервале (-a,/J), содержащем точку t. Значит, через точку Q = y(t) проходит интегральная кривая AS(Q) = 7(5) = 7(t + s) с областью определения (-а -1, /3 -t). Так как эта кривая определена при s = то Q = At(P) € U-t. Более того, A_t(Q) =7(0) = Р. Таким образом, если Р € Ut, то At(P) € U_t и A-t(Q) = Р = (A)"*1 (Q).
Поскольку At при любом t является гладким в области Ut, а обратное отображение является гладким в области U-t, то отображение At: Ut U-t является диффеоморфизмом. Свойство 7° доказано. ►
Семейство отображений At: Ut -> М, удовлетворяющее свойствам 1°-7° теоремы 11.16, называют локальной однопараметрической группой диффеоморфизмов (мы будем называть ее просто локальной группой). Теорема 11.16 утверждает, что с каждым гладким векторным полем X на многообразии М связана локальная однопараметрическая группа диффеоморфизмов. Такую группу (т.е. локальную однопараметрическую группу диффеоморфизмов, порожденную векторным полем) называют фазовым потоком векторного поля X.
На самом деле любая однопараметрическая группа диффеоморфизмов связана с некоторым гладким векторным полем. Действительно, если {AJ — локальная однопараметрическая группа диффеоморфизмов на многообразии М, то сопоставим каждой точке Р Е М касательный вектор Хр к параметризованной кривой y(t) = At(P). Можно показать, что это векторное поле является гладким, а его фазовым потоком будет локальная однопараметрическая группа диффеоморфизмов {А}• Таким образом, имеется взаимно однозначное соответствие между векторными полями на многообразии и локальными оД-нопараметрическими группами диффеоморфизмов, а понятия
11.7. Фазовый поток векторного поля
383
„локальная однопараметрическая группа диффеоморфизмов “ и „фазовый поток векторного поля“ оказываются равносильными.
Замечание 11.5. Если векторному полю X соответствует локальная группа {At}, то векторному полю -X соответствует локальная группа {А_<}. Действительно, в локальной системе координат параметризованная кривая At(P) записывается как решение x(t) системы ОДУ х = А(ж). Но в этом случае вектор-функция x(—t) является решением системы ОДУ X = — А(ж), соответствующей векторному полю —X. Но эта вектор-функция есть представление в локальной системе координат параметризованной кривой А_е(Р), которая оказывается интегральной кривой векторного поля -X.
Теорема 11.17. Если гладкому векторному полю X на многообразии М соответствует фазовый поток {At} и f — гладкая функция на М, то
Х(/) = ^(ЛГ(/)) и Х(4Г(/)) = ^(4;(Л) = 4Г(Х(Л).
(11.26)
◄ Выберем произвольную точку Р и зафиксируем. Параметризованная кривая y(t) = At(P) является интегральной кривой векторного поля X. Следовательно, вектор Хр — касательный вектор к этой кривой в точке Р, причем точке Р соответствует значение параметра t = 0. Значением функции X(f) в точке Р является производная функции f вдоль касательного вектора Хр. Поэтому
(Х(/))(Р) = Хр(/) = (/о7)'(0) = -£((ЛЛ)(Р)) UC	t—v
Композиция f о At есть функция, которая паре аргументов (t, Р) ставит в соответствие число. Эту композицию можно рассматривать и при фиксированной точке Р (как в последней формуле), и при фиксированном значении параметра t. В последнем
384
11. ТЕОРИЯ МНОГООБРАЗИЙ
случае At есть отображение многообразия на себя, которому с(к ответствует индуцированное отображение А* алгебры С°°(Л/) Согласно определению, Д*(/) = f°At. Поэтому можно написать (/о At)(P) = (AJ(/))(P). В результате получаем первое равенство.
Доказательство второго равенства проводится аналогично. Выберем точку Р Е М. В этой точке
(х(л;(/)))(Р) = ^((л;(/) о АТ) (Р)) |т=о=
= ^((/»Л)(Р)) = ^(Л;(/))(Р). (11.27)
В результате приходим к равенству
Далее, так как при Q = At(P)
А((/од(олт)(Р))|т=о = А((/олтоЛ()(р))|т=о =
= ^((/о at)(Q)) |т=о = XQ(f) = (X(/))(Q) =
= (Х(/))(Ле(Р)) = (Х(/) о Ае)(Р) = A*t(X(f))(P), с учетом равенств (11.27) получаем
(%(л;(/)))(Р) = л;(х(/))(Р),
X{A't(f)) = A;(X(f)).	►
Если гладкое векторное поле X таково, что в любой точке Р данного подмножества N С М вектор Хр является касательным к ЛГ, то X будем называть векторным полем, касающимся подмножества N.
11.8. Алгебра Ли векторных полей
385
Теорема 11.18. Пусть N является подмногообразием многообразия М, векторное поле X касается N. Тогда фазовый поток {At} поля X двигается по N, т.е. At(N) С N. Любая интегральная кривая поля X или не пересекает ЛГ, или лежит на N-
4 Из определений вектора, касательного к подмножеству на многообразии, и векторного поля, касающегося подмножества, следует, что если N — подмногообразие многообразия А/, то векторное поле, касающееся 2V, после его ограничения на N будет векторным полем на многообразии N. Ограничим векторное поле X на АГ. Обозначим полученное таким образом векторное поле на N через X
являются одновременно интегральными кривыми
. Очевидно, интегральные кри-
вые поля X
поля X. Поэтому, если Р 6 W, то At(P) лежит на интегральной кривой поля X
, а значит, At(P) 6 N. Отсюда At(/V) 6 N. N
Так как интегральные кривые поля X
то интегральные кривые поля X или не пересекают АГ, или являются интегральными кривыми поля X на N. ►
заполняют все N, N
, а значит, лежат лг
11.8.	Алгебра Ли векторных полей
На многообразии М рассмотрим два векторных поля X и Y. Будем их интерпретировать как дифференцирования алгебры т.е. отображения из алгебры	в себя, облада-
ющего свойствами, сформулированными в теореме 11.14. С помощью этих двух отображений составим новое отображение [X, У] = X о У - У оХ алгебры С°°(Л/) в себя.
Оказывается, что это отображение также является дифференцированием. Действительно, свойство линейности этого отображения (свойство 1° в теореме 11.14) очевидно. Прове-
386
П. ТЕОРИЯ МНОГООБРАЗИЙ
рим, как это отображение связано с произведением функций:
[X, У] (fg) = X(Y(fg)) - Y(X(fg)) =
= X(Y(f)g + fY(p)) - Y(X(f)g + fX(g)) =
= X(Y(f))g+Y(f)X(g) +X(f)Y(g) + fX(Y(g)) -
- Y(X(f))g —X(f)Y(g) - Y(f)X(g) - fY(X(g)) =
= X(Y(f))g-Y(X(f))g+fX(Y(g)) - fY(X(g)) =
= lX,Y](f)g+flX,Y](g).
Итак, с помощью векторных полей X и Y можно построить новое векторное поле, которое при интерпретации векторных полей как дифференцирований алгебры функций можно записать в виде
[X, Y] = X°Y-Y°X.
Векторное поле [X, У] называют коммутатором векторных полей X и У.
Выясним, как коммутатор векторных полей вычисляется в локальных координатах.
Теорема 11.19. Пусть в локальных координатах xi, хп на многообразии М гладкие векторные поля X и У имеют вид
Тогда
i dxj) dxi
(11.28)
◄ Чтобы вычислить координаты векторного поля [X, У], отме-тим, что для произвольного векторного поля X его значением
11.8. Алгебра Ли векторных полей
387
X(fi) на координатной функции fi(xy^...,xn) = Xi является i-я координатная функция X. Действительно,

Учитывая сказанное, выясним, как векторное поле [X, У] действует на координатные функции fi. Имеем
[X, У] (Л) = Х(У(Л)) - У(Х(Л)) = X(bi) - Y(ai) =
Отсюда по найденным координатным функциям векторного поля [Х,У] получаем равенство (11.28). ►
Пусть векторные поля X и Y в некоторой локальной системе координат X], ..., хп имеют координатные функции «ц, ..., ап и 61, ..., Ьп соответственно. Рассмотрим векторные функции многих переменных Х(х) = (ai(x) ... ап(ж)) и Y(x) = = (6i(x) ... bn(x)) , составленные из координатных функций векторных полей (здесь х = (xi, ..., хп)). Тогда для векторной функции Z(x) = (cj(ж) ... сп(х)) , составленной из координатных функций векторного поля [X, У], имеем
Z(x) = Y'(x)X(x) - Х'(х) У (ж),
(11.29)
где Х'(х) и У'(я) — матрицы Якоби функций Х(ж) и У(ж).
Теорема 11.20. Коммутатор векторных полей обладает следующими свойствами:
1°. [X, oiY + ftZ] = о[Х, У] + Д[Х, Z], a, ft е R (линейность).
2°. [X, У] = - [У, X] (антикоммутативность).
3°. [[Х,У], Z] + [[y,Z], X] + [[Z, X], У] = 0 (тождество
Якоби).
388
11. ТЕОРИЯ МНОГООБРАЗИЙ
◄ Доказательство каждого свойства состоит в проверке того, что левой и правой частям доказываемого равенства соответствуют равные дифференцирования алгебры гладких функций на многообразии. ►
Линейное пространство Л, в котором задана операция, удовлетворяющая свойствам 1°-3°, т.е. линейная, анти коммута
тивная, подчиняющаяся тождеству Якоби, называют алгеброй Ли. Сформулированная теорема утверждает, что линейное пространство гладких векторных полей на многообразии М с коммутатором векторных полей есть алгебра Ли. Примером алгебры Ли может также служить линейное пространство V3 свободных векторов с операцией векторного умножения.
Дадим геометрическую интерпретацию коммутатора векторных полей. Пусть X и Y — векторные поля на многообразии М и Р Е М. Обозначим через {4Т} и {Вт} фазовые потоки векторных полей X и Y. Пусть t — достаточно малое чис
ло. Построим в точке Р интегральную кривую 7j(t) = Ат(Р)
векторного поля X, из точки 7i(t) = At(P) проведем интег
ральную кривую 72 (r) = BT(At(P)) векторного поля Р. За-
Рис. 11.18
тем из точки 72(t) проведем интегральную кривую 7з(т) векторного поля -X. а из точки 7з(£) — интегральную кривую 74(г) векторного поля -У. Рассмотрим отображение, которое числу t2 ставит в соответствие точку 74 (t) (рис. 11.18). Это отображение задает на поверхности М параметризованную кривую ко-
торую с учетом замечания 11.5 можно представить в виде
7(t2) = (В_( о A-t о Bt о	(11.30)
Теорема 11.21. Вектор [Х,У]р является касательным вектором к параметризованной кривой y(t) в точке Р.
◄ Выберем гладкую функцию f на М и рассмотрим гладкую функцию одного действительного переменного <p(t) = 4*(/)(Р)-
U.S. Алгебра Ли векторных полей
389
Согласно теореме 11.17, верны равенства
¥>'(0) =	= X(f)(P),
01
<fi"(0) = ^A;(f)(P)	= ^д;(х(/))(Р)	=Х(Х(/))(Р).
ut£	е=о at	,к=о
Следовательно, формула Тейлора функции <p(t) в окрестности точки t = 0 второго порядка имеет вид
t2
A't(f)(P) = f(P)+tx(f)(P) + -ад/))(Р)+o(t2). (ii.3i)
Так как равенство (11.31) верно для любой точки Р € М и любой функции /, то мы можем записать следующее равенство отображений из С°°(М) в С°°(Л/):
t2
4* = 14- tX + — X2 -I- o(t2).
Отсюда и из теоремы 11.5 с учетом представления (11.30) получаем
/(7 (<2)) = /((B-i» 4-( ° В( о Д,)(Р)} =
= (в_, о д_( о в( о л)*(/)(р) = (д; о в;»д-_(»в:,)(/)(Р) =
= ((1 + tX + уX2 + о(12)) о (1 + tY + -Y2 + о(12)) о o(i-zx + <2x2+o(z2))o(l-ty+yy2+o(t2)))(/)(p). (11.32)
Раскроем скобки в последнем выражении равенства (11.32). Учитывая только слагаемые второго порядка малости относительно получим
/(7(«2)) = (1 + t2X о Y - t2Y о X + o(t2))(/)(Р) =
= f(P) + t2[X,Y](f)(P)+b(t2).
390
II. ТЕОРИЯ МНОГООБРАЗИЙ
Заменяя t2 на г, находим производную функции f вдоль касательного вектора £ к кривой у в точке Р:
ат т=о
Отсюда следует требуемое равенство £ = [Х,У] . ►
Согласно доказанной теореме, коммутатор векторных полей с геометрической точки зрения характеризует степень разомкнутости четырехугольника, получающегося при последовательном смещении на одну и ту же величину вдоль полей Х,У,-Х,-У (см. рис. 11.18).
Теорема 11.22. Пусть X и Y — гладкие векторные поля на многообразии М, причем векторному полю X соответствует фазовый поток {4*}. Тогда
◄ Фиксируем функцию f и, как при доказательстве теоремы 11.21, используем равенство отображений А* = 1 4- tX + o(t), которое следует из формулы Тейлора первого порядка для функции <p(t) = А*(/)(Р). Используя также теорему 11.15 и свойство 6° из теоремы 11.16, получаем
dAt(Y) = А1е о У о А* = (1 - 4- *(0)0 У 0 (1 4- £Х 4- о(0) = = У + /УоХ-гХоУ + о(0 = у + t[y, х] + o(t).
Отсюда следует утверждение теоремы. ►
Векторные поля X и У называют коммутирующими векторными полями, если [X, У] = 0.
Теорема 11.23. Векторные поля X и У коммутируют тогда и только тогда, когда коммутируют их фазовые потоки {4е} и {Bt}, т.е.
11.8. Алгебра Ли векторных полей
391
4 Пусть фазовые потоки {4J и {Bt} векторных полей X и Y коммутируют. Фиксируем точку Р. Вектор [X, У]Р является касательным вектором в точке Р к кривой 7, построенной по четырем фазовым потокам (см. теорему 11.21). Используя свойство коммутирования фазовых потоков A_t и для любого t получаем
7(t2) = (В_( о Л_( о Bt о At)(P) = (B-i о Bt о A_t о At)(P) = Р.
Отсюда следует, что касательный вектор к кривой 7 в точке Р есть нулевой вектор, т.е. [X, У]Р = 0. Так как точка Р Е М может быть выбрана произвольно, то [X, У] = 0.
Пусть теперь [Х,У] = 0. Согласно свойству 5° из теоремы 11.16 и равенству (11.21), имеем
id А, (У)	= id(Atao At-t^Y) _ =
dt	t—to dt	t—to
= i(dAt^dAt-t.)(Y) =dAdidAt-t<l(Y) \
Ctl	О*	t—-to j
Заменяя t - t$ на т и используя теорему 11.22, получаем
idAt(Y) =^dAdi-dAT(Y) )=<М(в([Г,Х]) = 0. dt	t=to	' uT	т=0/
Так как to — произвольное значение, то производная семейства полей dAt(Y) по t тождественно равна нулю. Следовательно, тождественно равна нулю производная функции y?(t) = = (</А/(У))(/)(Р) - У(/)(Р), где f — произвольная функция, Р — произвольная точка. Таким образом, функция y?(t) есть решение задачи Коши
4>W = 0,	Н0) = 0.	(11.33)
dt
Но эта задача Коши имеет единственное решение — нулевое [VIII]. Следовательно, <p(t) = 0. Поскольку функция f и точка
392 11. ТЕОРИЯ МНОГООБРАЗИЙ
Р произвольные, то dAt(Y) = Y. Значит, в силу теорем 11.5 и 11.15
д; о у = д; о dAt(Y) = д; о (д-1 р о у о д; =
= (4е-1оЛ<)шоУоД; = УоД7, (11.34) так как индуцированное отображение к тождественному отображению (Д^1 ° At) само является тождественным.
Вновь фиксируем функцию /, точку Р на М и число L Рассмотрим функцию
0(т) = (д о в1Т о д; о в;) (/) (Р) - др).
Используя (11.26) и (11.34), получаем
^(т) = ~(А-_, о в-_т о У о л; о в;)(/)(Р) +
+ (л’_(ов:тол;оуов;)(/)(р) = о.
Таким образом, функция V’(r) также является решением задачи Коши (11.33) (с заменой t наг), а значит, ip(r) = Q. Используя полученное тождество и теорему 11.5, выводим
(Л( о вт)-(/) = (А, о вту	о В'_т о а; о в;)(/)) =
= (Вт о At О В_т о А_( о At о BT)*(f).
Так как функция f произвольна, то из последнего равенства функций следует равенство отображений:
At о Вт = Вт о At о В_т о А-t0 At о Вт.
Отсюда, используя свойства 1° и 5° фазового потока (см. теорему 11.16), получаем
At О Вт = Вт 0 At О В_т О До О Вт =
= Вт 0 At о В_т о Вт = Вт 0 At О Bq = Вт 0 At-
Необходимость в утверждении теоремы также доказана. ►
11.8. Алгебра Ли векторных полей
393
Теорема 11.24. Если отображение F: М —> N — диффеоморфизм многообразия Л/ в многообразие jV, а X и Y — гладкие векторные поля на М, то
rfF([X, У]) = [dF(X), dF(Y)].	(11.35)
4 Согласно определению коммутатора векторных полей, [dF(X), dF(Y)] = dF(X) *dF(Y) - dF(Y) *dF(X), где векторные поля dF(X) и dF(Y) в правой части равенства трактуются как дифференцирования алгебры С°°(ЛГ). В силу теорем 11.5 и 11.15 имеем
dF(X)orfF(y,) = (F-1)*oXofo(F-1)*<>yoF’ =
= (F-1)'о X о (F-1 о F)* о У о F* = (F“‘)'о X о У о F“.
Аналогично
rfF(y)odF(X) = (F-|)'oyoXoF’.
Поэтому
[dF(X), dF(Y)] = (F-1)’ о X о У о F* - (F-1)*« У о X о F* = = (F_’)*o(Xoy-yoX)oF' = (F"’)'o[X,y]oF*. (11.36)
Снова используя теорему 11.15, заключаем, что
(F-’)’ о [X, У] о F- = dF([X, У]).	(11.37)
Сопоставляя равенства (11.36) и (11.37), приходим к утверждению теоремы. ►
Замечание 11.6. Равенство (11.35) остается верным и в том случае, когда гладкое отображение F не является диффеоморфизмом, но ставит гладким векторным полям X и Y в соответствие гладкие векторные поля dF(X) и dF(Y). Тогда отображение F векторному полю [X, У] ставит в соответствие гладкое векторное поле dF([X,y]), которое, согласно (11.35), совпадаете гладким векторным полем [dF(X),dF(Y)].
394
IL ТЕОРИЯ МНОГООБРАЗИЙ
11.9. Распределения и теорема Фробениуса
Умножая векторное поле X на гладкую функцию, мы получаем векторное поле с теми же образами интегральных кривых, что и поле X, так как умножению векторного поля на функцию соответствует замена параметра у интегральных кривых. Значит, образы интегральных кривых определяются скорее „полем прямых", чем полем векторов. Полезным оказывается рассмотреть более общий объект — „поле fc-мерных подпространств".
Говорят, что на многообразии М задано распределение (или дифференциальная система, или структура Пфаффа) 'J, если в каждой точке Р € Л/ задано линейное подпространство ‘Jp касательного пространства ТрМ (рис. 11.19).
Если размерность линейных подпространств ‘Jp постоянна для всех точек Р из некоторой окрестности точки Q ЕМ, то распределение ‘J называют регулярным в точке Q, а размерность каждого линейного подпространства ‘Jp называют размерностью распределения J в окрестности точки Q и обозначают dimiF.
Рис. 11.19
Пример 11.22. Рассмотрим в R3 функции
/(®)У.г) = *2 + у2 + Л g(x,y,z) = z.
Через каждую точку (жо, s/о, ^о) в R3 проходит поверхность уровня каждой из этих функций. Интерпретируя поверхно
11.9. Распределения и теорема Фробениуса
395
сти уровня двух функций как подмножества многообразия R3, рассмотрим в каждой точке (xq, уо, zq) множество векторов, касательных одновременно к двум поверхностям уровня f(x,y,z) = f(x0,y0,z0) и g(x,y,z) = g(xo,yo,zo)- Покажем, что это множество является линейным подпространством касательного пространства в точке (л?о, Уо, ^о) и что тем самым в R3 задано распределение.
В каждой точке (х0, yQ, г0) (0, 0, 0) градиенты функций f[x,y,z) и g[x,y,z) не обращаются в нуль. Следовательно, поверхности уровня обеих функций, проходящие через точку (яо> З/о, *о), в окрестности этой точки являются регулярными поверхностями, а множества векторов, касательных к этим поверхностям, есть множества векторов в касательных плоскостях к этим поверхностям (см. пример 11.15). Координаты ?/, £ вектора, касательного к обеим поверхностям уровня в точке (жо, Уо, z0), удовлетворяют системе уравнений
Г 2z0£ 4- 2уоу -Ь 2zo( = О,
(С = о.
Если ранг матрицы этой однородной системы линейных алгебраических уравнений равен двум, то множество решений представляет собой одномерное линейное подпространство. В точках (a?o, уо, zq), для которых зг0 = уо = 0, zo 0, ранг матрицы системы равен единице, а множество решений системы есть двумерное подпространство.
В точке (0, 0, 0) поверхность уровня функции f(x,y,z) вырождается в точку. Так как единственной параметризованной кривой, образ которой принадлежит одноточечному множеству {(О, 0, 0)}, является y(t) = (0, 0, 0) с нулевым касательным вектором, то множество векторов, касательных к поверхности уровня f(x,y,z) = 0, содержит единственный вектор — нулевой. Очевидно, что только этот вектор одновременно касается Двух поверхностей уровня в точке (0, 0, 0).
396
11. ТЕОРИЯ МНОГООБРАЗИЙ
Итак, функции f(x,y,z) и g(x,y,z) позволили построить распределение, которое:
-	точке (0, 0, 0) ставит в соответствие нульмерное линейное подпространство касательного пространства;
-	каждой точке (0, 0, zq), zq / 0, ставит в соответствие двумерное линейное подпространство касательного пространства, состоящее из векторов вида £
-	всем остальным точкам (а?о, Уо, zq) многообразия R3 ставит в соответствие одномерное линейное подпространство ка-сательного пространства, состоящее из векторов вида + (7Х
+1?^, для которых Хо< + УоЧ = о.
Отметим, что построенное распределение не является регулярным. #
Распределения можно задавать с помощью семейств векторных полей. Пусть на многообразии М задано семейство {Ха} векторных полей. Тогда в каждой точке Р € М определено множество {Ха|р} касательных векторов к многообразию М в точке Р, т.е. подмножество линейного пространства ТрМ. Сопоставив точке Р линейное подпространство 'Jp, являющееся линейной оболочкой span(Xa|p) множества {Ха|р}, получим распределение J на многообразии М. В этом случае мы будем называть семейство {Xft} семейством, порождающим распределение Т.
Наиболее распространенным является случай конечного семейства векторных полей Xt, г= l,fc. Если в каждой точке Р система касательных векторов Хх|р, г= 1Д, линейно независима, то dimJp = fc, Р € Л/, и мы имеем дело с регулярным распределением на многообразии М размерности k. Однако в практических приложениях возникают системы векторных полей Х:‘, линейно независимые на всем многообразии за исключением относительно небольшого (возможно, и конечного) множества точек, в которых свойство линейной независимости теряется. В этом случае система Xt, i = l,fc, порождав
11.9. Распределения и теорема Фробениуса
397
нерегулярное распределение. Это распределение становится регулярным, если его ограничить на открытом подмножестве многообразия, не содержащем точки нерегулярности.
Распределение Э“, порожденное семейством {%«} гладких векторных полей, называют гладким. Далее рассматриваются гладкие регулярные распределения.
Пример 11.23. Распределение 'J, построенное в примере 11.22, не является регулярным: соответствующее линейное подпространство касательного пространства нульмерно в точке (0, 0, 0), двумерно в остальных точках оси Oz и одномерно вне оси Oz. В области U = {(х, у, z): z/0}, полученной выбрасыванием точек оси Oz, распределение ‘J имеет постоянную размерность, равную единице. Нетрудно убедиться, что в этой области распределение описывается гладким векторным полем + Значит, распределение 'J в области U является ох оу гладким и регулярным. #
На n-мерном многообразии М рассмотрим некоторое fc-мер-ное подмногообразие N. Подмногообразие N имеет структуру гладкого многообразия, а касательное пространство TpN к многообразию N можно рассматривать как линейное подпространство касательного пространства ТрМ к многообразию Л/ в точке Р. Любое распределение на многообразии М порождает распределение на подмногообразии 7V, для которого Эр = ЗрПТрЛГ, PeN.
Если распределение 3“ на многообразии М и подмногообразие N многообразия М в любой точке Р € ЛГ связаны условием TpN С Jp, то мы будем называть распределение 'J по отношению к N распределением, касающимся подмногообразия N, а подмногообразие N по отношению к распределению 'J — интегральным многообразием. Интегральное Многообразие N распределения 'J будем называть максимальным интегральным многообразием^ если не существует Интегрального многообразия большей размерности, содержащего N.
398
11. ТЕОРИЯ МНОГООБРАЗИЙ
Регулярное распределение на многообразии М называют интегрируемым, если через каждую точку Р € М проходит максимальное интегральное многообразие размерности dim Jp, причем любые два таких многообразия, проходящих через точку Р, в некоторой окрестности этой точки совпадают (рис. 11.20).
Рис. 11.20
Пример 11.24. Распределение 'J из примера 11.22 на многообразии
М = {(ж, у, z) € R3: z / 0},
как показано в примере 11.23, является гладким и регулярным. Это распределение интегрируемо. Максимальными интегральными многообразиями в данном случае являются пересечения поверхностей уровня функций f(x,y,z) и g(x,y,z), т.е. окружности
X2 + у2 = С’1, г = С2,
где С\ > 0 и — произвольные постоянные. #
Будем говорить, что векторное поле X принадлежит распределению У, и писать X € JF, если Хр € 'Зр в каждой точке Р € М. Множество всех гладких векторных полей, принадлежащих данному распределению обозначим DfiF). На этом множестве определены операции сложения векторных полей и умножения векторного поля на гладкую функцию. Действительно, если X, Y € D(F), то в каждой точке Р € Л/ верны
11.9. Распределения и теорема Фробениуса
399
соотношения Хр € Jp и Yp € Jp. Следовательно, (X 4- У )р = = Хр 4- Yp € Jp и (fX)p = f(P)Xp € Jp, так как Jp есть линейное подпространство ТрМ. Таким образом, множество D(J) замкнуто относительно операций сложения векторных полей и умножения векторного поля на гладкую функцию. Это множество будем называть модулем распределения J.
Кроме операций сложения и умножения на функцию, для гладких векторных полей имеется еще одна операция — коммутатор векторных полей. Модуль распределения может быть не замкнут относительно коммутатора векторных полей, т.е. могут существовать векторные поля, принадлежащие распределению, коммутатор которых не принадлежит распределению.
Пример 11.25. На многообразии R3 рассмотрим двумерное распределение J, порожденное векторными полями
v	хд
X = — Y  --------к е —
дх' ду dz'
Непосредственный подсчет с помощью формулы (11.28) дает
|х. И =
Легко убедиться, что в каждой точке Р € R3 вектор [X, У]р не является линейной комбинацией векторов Хр, Yp, так как система из трех векторов Хр, Yp, [X, У]р линейно независима. Значит, векторное поле [X, У] не принадлежит распределению J, порожденному векторными полями X и У, т.е. [X, У] £ J.
Распределение J на многообразии М называют инволютивным, если его модуль 'В(З’) замкнут относительно коммутатора векторных полей, т.е. [X, У] € J для любых гладких векторных полей X € J и У € J. Модуль инволютивного распределения является алгеброй Ли.
Теорема 11.25. Если регулярное распределение интегрируемо, то оно инволютивно.
400
П. ТЕОРИЯ МНОГООБРАЗИЙ
◄ Пусть регулярное распределение 'J на многообразии М является интегрируемым. Выберем произвольную точку Р 6 М и рассмотрим максимальное интегральное многообразие N распределения проходящее через точку Р.
Выберем произвольные гладкие векторные поля X и У, принадлежащие распределению 'J. Поскольку Xq Е ‘Jq = TqN для любой точки Q € N, сужение Х|^ векторного поля Л' на множество N можно рассматривать как векторное поле на многообразии N. Аналогичное утверждение верно и для сужения У^ векторного поля У на N. Значения [X, У]Р и [Х|др y|N] двух коммутаторов на многообразиях М и N С Л/ в точке Р совпадают (это следует из теоремы 11.24). Но [X , У |JF € TpN. Поэтому [X, У]Р Е TpN = fJp. Поскольку точка Р € М может быть выбрана произвольно, то [X, У] Е iF. ►
Пусть гладкое распределение Т на n-мерном многообразии М порождено системой векторных полей Zi, Z2,..., Zjt, линейно независимых в каждой точке Р Е М. Тогда k п и любое гладкое векторное поле X С Т может быть представлено в виде
X — oi\Z\ + Q2Z2 + ...-+•
(11.38)
где ..., Qk — гладкие функции на многобразии М. Действительно, в каждой точке Р Е М имеем
Хр Е span(Zi|р, ^2|р, ..., Zjfe|p),
откуда
к
Хр = ^(Р)^р, :=1
где ог(Р), г=1,&, представляют собой коэффициенты разложения вектора Хр Е ТрМ по линейно независимой системе векторов Zt|p, г = 1,&, и определены однозначно. Остается показать, что коэффициенты а,(Р) являются гладкими функциями точки. Рассмотрим в окрестности точки Р некоторую
11.9. Распределения и теорема Фробениуса
401
систему координат xj, хп и запишем рассматриваемые векторные поля Zi и Л’ в этой системе координат:
п
п Ч
J=1	J
d ^dx;' J=1	3
Здесь все функции fj и atJ являются гладкими. Представление векторного поля X в виде (11.38) в выбранных координатах в произвольной точке Q записывается следующим образом:
П	Л n к	Q
j=i	3	>=1 i=i	3
Из этого равенства, приравнивая коэффициенты при координатных векторных полях, находим
1 (Q)<*i (Q) + • • • + a\k(Q)<*k(Q) = f\ (Q),
«П1 (<2)«i (<?) + ... + a-пк (0Ы0) = fn (Q),
т.е. коэффициенты «i(Q),..., (*k(Q) являются решениями неоднородной системы линейных алгебраических уравнений. Эти коэффициенты являются гладкими функциями, если все коэффициенты и правые части — гладкие функции. Действительно, эта система линейных алгебраических уравнений совместна в силу условия Xq € '3q, а ранг ее матрицы равен к, так как столбцы матрицы представляют собой столбцы координат линейно независимых векторов Zj|q, •••, %k\q и. следовательно, линейно независимы. Поскольку ранг матрицы системы равен количеству неизвестных, эта система имеет единственное решение. Выберем в точке Р базисный минор матрицы системы. Тогда он будет базисным и в любой другой точке Q из некоторой окрестности точки Р (этот минор остается ненулевым в некоторой окрестности точки Р в силу непрерывности определителя функциональной матрицы, а его порядок равен количеству столбцов, т.е. максимально возможный для рассматриваемой матрицы). Выбор базисного минора позволяет отбросить в
402
11. ТЕОРИЯ МНОГООБРАЗИЙ
системе линейных алгебраических уравнений небазисные уравнения, вытекающие из базисных. В результате мы приходим к квадратной системе линейных алгебраических уравнений с невырожденной матрицей. Единственное решение этой системы можно записать с помощью формул Крамера, т.е. каждый коэффициент &i(Q) в окрестности точки Р можно представить в виде отношения двух определителей, являющихся гладкими функциями своих элементов. Значит, каждая функция a,(Q) является гладкой в некоторой окрестности точки Р. А поскольку точку Р € М можно выбрать произвольно, то функции оц(Р}. i = 1,к, являются гладкими на многообразии М.
Отметим, что для гладких векторных полей X и Y и гладкой функции л имеет место тождество
[Х,аУ] = Х(а)У + а[Х, У],
в верности которого можно убедиться непосредственно, используя формулу (11.28) и свойства частных производных функций многих переменных. Используя это тождество для двух векторных полей
к	к
принадлежащих распределению J, получаем
к к	к к
[X, У] = Y.'EfazW) -	[Zi, z}].
1=1 j=l	1=1 J=1
Из этого представления видно, что для инволютивности распределения J необходимо и достаточно, чтобы распределению J принадлежали все векторные поля [Zi,Zj], т.е. чтобы существовали такие гладкие функции с™ на многообразии М, что
к
[Zi, Zj] = c™Zm, i,j =.].,к.	(11.39)
7П = 1
11.9. Распределения и теорема Фробениуса
403
Теорема 11.26 (теорема Фробениуса), Гладкое регулярное распределение ‘J интегрируемо тогда и только тогда, когда оно инволютивно.
◄ То, что из интегрируемости многообразия следует его инво-лютивность, составляет суть теоремы 11.25. Доказательство интегрируемости гладкого регулярного инволютивного распределения сложное и здесь не приводится*. ►
Теорему Фробениуса в литературе приводят с разными формулировками, зачастую мало похожими друг на друга. Известно**, что для любого к-мерного подмногообразия N многообразия М и произвольной точки Р € N в некоторой окрестности U точки Р существует система координат zi, ..., zn, в которой множество NnU описывается уравнениями
Zfc+1—0, ^4-2—0, ..., Zn—0.
В отношении максимальных интегральных подмногообразий интегрируемого распределения Т верно более сильное утверждение, суть которого в следующем. Если 5* — гладкое регулярное интегрируемое распределение, то для произвольной точки Р ЕМ в некоторой ее окрестности U можно выбрать такую систему координат z\,..., zn точки Р, что для любой точки Q € U и максимального интегрального многообразия распределения J, проходящего через точку Q, его часть, включенная в U, описывается уравнениями
= С/.4.1, ЗД4-2 — Ог+2,	•••)	= Сп,	(11.40)
где ci, ..., сп — координаты точки Q. Очевидно, что линейное подпространство TqN, совпадающее с является линей-« -о	д	;—г
нои оболочкой системы касательных векторов — , г = l,fe.
’Доказательство этой теоремы см., например, в книге: Стернберг С.
**См. там же.
404
11. ТЕОРИЯ МНОГООБРАЗИЙ
Значит, в окрестности точки Р распределение ‘J порождается векторными полями t = 1,&. Сформулируем это в виде теоремы.
Теорема 11.27. Гладкое регулярное Ar-мерное распределение 5* многообразия Л/ интегрируемо тогда и только тогда, когда для любой точки Р € М в достаточно малой окрестности этой точки существует такая система координат z\,..., zn, что распределение порождается координатными векторными полями г= l,fc. #
Предположим, что fc-мерное гладкое регулярное интегрируемое распределение Т на многообразии М порождается гладкими векторными полями Хь Xk- Согласно теореме 11.27, в некоторой окрестности U произвольной точки Р € М существует такая система координат zi,..., zn, что распределение Т д  Т~Г порождается координатными векторными полями —, г = 1,я. а максимальные интегральные многообразия распределения Т в окрестности U описываются уравнениями (11.40), в которых Cfc+i, ..., сп — некоторые постоянные. Как найти такую систему координат, решив тем самым задачу описания максимальных интегральных многообразий регулярного распределения Т?
Уравнения (11.40) означают, что координатные функции zn являются постоянными на каждом максимальном интегральном многообразии в U. Значит, часть координатных функций искомой системы координат следует искать среди гладких функций, постоянных на максимальных интегральных многообразиях распределения Т. Такие функции в системе координат zi, ..., zn имеют вид F(zfc+i,...,zn), где F— произвольная гладкая функция п - k переменных. Множество этих функций совпадает с множеством решений системы дифференциальных уравнений в частных производных
— = 0, г=1,Е dzi
(11.41)
11.9. Распределения и теорема Фробениуса
405
Учитывая, что распределение порождается и системой векторных полей Хг, t = l,fc, и системой векторных полей i= l,fc, заключаем, что система (11.41) эквивалентна системе уравнений
X,(u)=0, i = TJc.	(11.42)
Действительно, так как векторные поля Ха, i = 1, к, порождают распределение Т, любое векторное поле X, принадлежащее можно представить в виде линейной комбинации векторных полей X,, т.е.
X = aiXi + . .. + (*кХк'
Из этого равенства заключав^, что любое решение системы (11.42) удовлетворяет уравнению Х(и) = 0. В частности, любое решение системы (11.42) удовлетворяет и системе (11.41). Рассуждая аналогично, приходим к выводу, что любое решение системы (11.41) удовлетворяет системе (11.42).
Функцию /, которая для данного гладкого векторного поля X удовлетворяет уравнению X (/) = 0, называют первым интегралом векторного поля X. Мы можем теперь интерпретировать задачу описания максимальных интегральных многообразий интегрируемого распределения, порожденного системой векторных полей Х|,..., Хь как задачу поиска общих первых интегралов векторных полей Х\ X*.
Выберем в окрестности точки Р какую-либо систему координат Xi, ..., хп и запишем в координатах векторные поля Х\:
=	1=1Д.
Тогда система уравнений (11.42) примет вид
ди	ди
— + ••• + а1п^— — О, ОХ\	охп
(11.43)
ди	ди
«и Б-----Ь--- +	з— =	О,
u дх\	дхп
406
11. ТЕОРИЯ МНОГООБРАЗИЙ
т.е. искомые функции являются решением системы линейных однородных дифференциальных уравнений в частных производных первого порядка, коэффициентами которой являются гладкие функции.
Рассмотрим произвольную систему дифференциальных уравнений вида (11.43). В каких случаях такая система имеет решения? Ответ можно дать, связывая систему вида (11.43) с каким-либо многообразием. Пусть, например, функции atJ:Rn— определены в окрестности U некоторой точки х € Rn. Множество U можно рассматривать как n-мерное многообразие с атласом из одной карты, на котором определены гладкие векторные поля
п л
Эти векторные поля порождают распределение У, и процесс решения системы (11.43) можно рассматривать как построение интегральных многообразий распределения J.
Если распределение 7 инволютивно, регулярно и dimJ=Ar. то можно найти п - к функций ..., ип-ь постоянных на интегральных многообразиях, которые в некоторой системе координат являются координатными. Тогда любая постоянная функция на интегральном многообразии может быть записана в виде F(tii,...,tin_jt), где F — произвольная гладкая функция п - к переменных. Инволютивность распределения & равносильна выполнению условий (11.39). Записывая эти условия в координатной форме, подведем итог, сформулировав теорему.
Теорема 11.28. Если коэффициенты atJ системы дифференциальных уравнений (11.43) удовлетворяют условиям
darj
“"’ч /	0(lsj	3(lri \	'Г"' _	---г-	----
~ а*'~дх-) = 2^Crs(lm^ r,s = ]yk, ] = l,n.
= 1	*	*	m=l
где с™ — некоторые функции переменных zi, ..., хп, а функциональная матрица (atJ) имеет ранг к < п, то в некоторой
11.9. Распределения и теорема Фробениуса
407
окрестности U произвольной точки Р из области определения системы (11.43) существуют такие решения щ, иг, ..., un-k этой системы, что матрица ( —-), г = l,n-fc, j = 1,п, имеет \ дх^ /
ранг n-к, а любое решение системы можно представить в виде	где F— произвольная гладкая функция п-к
переменных.
Если распределение порожденное векторными полями (11.44), не является инволютивным, то нужно рассмотреть его инволютивное замыкание j, т.е. такое инволютивное распределение, что, во-первых, 'УрЭ&р в каждой точке Р € М, а во-вторых, для любого инволютивного распределения S, удовлетворяющего условию Sp Э выполняется включение Sp Э &р- Можно кратко сказать, что инволютивное замыкание распределения Э” — это наименьшее инволютивное распределение, включающее в себя распределение J.
Чтобы построить инволютивное замыкание распределения, порожденного гладкими векторными полями Ль ..., Xi, необходимо расширить систему векторных полей следующим образом. Сначала к системе векторных полей добавим коммутаторы [Х<, Xj], для которых нет представления вида
к
[х.,х^ = Х,с^х
7П=1
ТП •
Для пополненной таким образом системы повторим процедуру пополнения, добавляя коммутаторы векторных полей, входящих в систему, причем те коммутаторы, которые представляются в виде линейной комбинации исходных векторных полей, игнорируются. Процедуру пополнения системы векторных полей продолжаем до тех пор, пока на очередном шаге не окажется, что все коммутаторы векторных полей являются линейными комбинациями векторных полей последней пополненной системы.
408
11. ТЕОРИЯ МНОГООБРАЗИЙ
Распределение, порожденное пополненной системой векторных полей, является инволютивным, так как любой коммутатор векторных полей системы является линейной комбинацией векторных полей системы, а потому принадлежит распределению. Это распределение является наименьшим, поскольку инволютивное замыкание вместе с векторными полями Xi содержит и все их коммутаторы, а также коммутаторы этих коммутаторов и т.п.
Если система векторных полей X, соответствует системе линейных дифференциальных уравнений в частных производных вида (11.43), то пополненная система векторных полей соответствует системе дифференциальных уравнений, полученной из исходной добавлением новых уравнений. Отметим, что если Y(и) = 0 и Z(u) = 0, то
[Г, Z] (u) = Y(Z(u)) - Z(Y(u)) = Г(0) - Z(0) = 0.
Следовательно, множество решений исходной системы дифференциальных уравнений и множество решений пополненной системы дифференциальных уравнений совпадают. Но в случае пополненной системы дифференциальных уравнений можно использовать (при некоторых ограничениях) теорему 11.28, а это позволяет получить описание всех решений исходной системы дифференциальных уравнений.
Пусть векторные поля Л'ь ..., Х\ таковы, что для любого числа г = 1, Ат векторные поля X’i, ..., Хг порождают инволютивное регулярное распределение размерности г. Тогда общие первые интегралы векторных полей X], ..., Хь можно находить последовательно. Сначала определяются первые интегралы векторного поля Xi, затем общие первые интегралы пары векторных полей X], Хг, затем общие первые интегралы трех векторных полей и т.д. Пусть найдены общие первые интегралы векторных полей Xj, ..., Хг. Согласно теореме 11.28. можно выбрать такие функции щ, ..., цп_г, что любой об
11.9. Распределения и теорема Фробениуса
409
щий первый интеграл и векторных полей A'i, Хг имеет вид и = F(tt],...,izn_r), где F — произвольная гладкая функция. Подставляя это представление в уравнение Xr+i(u) = 0, приходим к линейному дифференциальному уравнению в частных производных относительно функции F. Каждому решению этого уравнения соответствует общий первый интеграл системы векторных полей A'i, Xr+j. Тем самым мы получаем множество общих первых интегралов векторных полей Xi, .... Xr+i. Последовательно применяя этот подход для r= 1, 2, .... k- 1, приходим к описанию общих первых интегралов векторных полей Хь ..., А\.
Пример 11.26. В R3 с координатами х, у, z исследуем на интегрируемость распределение Т, порожденное векторными полями
v d д	х д д
х = Т- - Z-, У = е — - 2у—.
дх uz	оу UZ
Поскольку векторные поля X и У гладкие, распределение IF гладкое. Матрица, составленная из координатных функций векторных полей, т.е. матрица
/ 1	0 \
° ет , -^у)
всюду в R3 имеет ранг 2. Следовательно, рассматриваемое распределение является регулярным. Вычислим коммутатор векторных полей X и У:
lA''y'l = ''S'2sK = 1'-
Из результатов вычисления заключаем, что распределение 'J инволютивно. Согласно теореме Фробениуса, это распределение интегрируемо.
410
11. ТЕОРИЯ МНОГООБРАЗИЙ
Определим максимальные интегральные многообразия этого распределения. Чтобы найти первые интегралы векторного поля X, используем симметричную форму записи системы ОДУ, соответствующей векторному полю X:
dx _ dy _ dz ~~~Q~~^z'
Из этих равенств получаем « dz dx Н--------------------= 0, dy = 0.
z
Отсюда легко найти первые интегралы системы ОДУ, или первые интегралы векторного поля X: р = zex, q = у. Множество первых интегралов и векторного поля X описывается формулой и = F(p,q), где р= zex, q = y, a F — гладкая функция двух переменных. Среди таких функций ищем первые интегралы векторного поля Y. Согласно правилу сложной функции, име-
ем
Оу
или
Итак, функция F(p,q) является первым интегралом векторного
д о д поля — ~2q—. dq др
Снова используем симметричную форму записи
соответствующей системы ОДУ:
dq dp ~ = ^2q'
Система состоит из единственного уравнения, решая которое находим его первый интеграл u = p+g2. Все множество первых интегралов и векторного поля - 2q^- описывается формулой dq др
и = G(p + q2), где G — гладкая функция одного действитель
11.9. Распределения и теорема Фробениуса
411
ного переменного. Подставляя вместо р и q найденные выше первые интегралы векторного поля X, получаем общие первые интегралы векторных полей X и У:
u = G(zex + y2).
Для описания максимальных интегрируемых многообразий достаточно взять один первый интеграл и = ге® + 1/2. Отметим, что матрица Якоби функции u(x,j/,z), равная (zex 2у е*), не обращается в нуль ни в одной точке в R3. Максимальные интегральные многообразия распределения Т, порожденного векторными полями X и У, описываются уравнением
zex 4- У2 = С,
где С — произвольная постоянная.
Пример 11.27. Решим однородную систему дифференциальных уравнений в частных производных
(11.45)
Введем в R3 векторные поля
v д д „ д д
Х = УГх+%' Y = y^ + Xd-z-
Тогда систему (11.45) можно записать в виде X (и) = О, У (и) = 0.
Найдем коммутатор векторных полей X и У:
[x'Y]=-y^+(z-x^+yTZ-
412
11. ТЕОРИЯ МНОГООБРАЗИЙ
Составим матрицу из координатных функций векторных полей [X, У]:
(У о	у \
z у z - х I . Ох	у /
Определитель этой матрицы равен (х2 + у2)у, т.е. обращается в нуль только в точках плоскости у = 0. Следовательно, при 1/^0 векторы Хр, Ур, [Х,У]р в точке Р = (я, г/, z) линейно независимы, а распределение J, порожденное векторными полями X, У, [X, У], вне плоскости у = 0 совпадает с касательным расслоением, т.е. Jp = TpR3. Значит, через такие точки проходит максимальное интегральное многообразие размерности 3. являющееся областью многообразия R3. Таких многообразий два: у > 0 и у < 0. Так как решение исходной системы постоянно на любом максимальном интегральном многообразии, то и постоянно в областях у > 0 и у < 0. Учитывая гладкость функции и, заключаем, что рассматриваемая система имеет только постоянные решения.
Замечание 11.7. Мы видели, что каждому векторному полю на многообразии в заданной локальной системе координат соответствует автономная нормальная система ОДУ. Эта связь позволяет для исследования автономных систем ОДУ использовать геометрические методы. Чтобы такую связь распространить на неавтономные системы, можно поступить следующим образом. Неавтономную систему ОДУ i = х 6 Rn, можно преобразовать в автономную систему добавлением одного нового переменного х&
( x-f(x0,x), io = !•
Если x(t) — решение исходной системы ОДУ с начальным условием x(Iq) = х°, то (t, x(t)) — решение преобразованной системы с начальным условием x(to) = ж0, яо(<о) = to, и наоборот.
11.9. Распределения и теорема Фробениуса
413
Указанное преобразование позволяет неавтономной системе сопоставить векторное поле на (п + 1)-мерном многообразии. Например, если исходная система i = /(t,x), f= (/i ... /п)т, задана в области М С Rn+1 (т.е. (t, х) 6 М), то ей можно поставить в соответствие векторное поле
Тогда интегральная кривая (я0(£), x(t)) векторного поля X, проходящая через точку (я{}, ж0), будет являться решением системы ОДУ х = /(жо,ж), xq = 1 с начальным условием xq^q) = = ж®, x(to) = ж0. Отсюда следует, что Xq(1) = (t - Iq) + Xq, a x(t) удовлетворяет системе ОДУ x = f{t - t0 + x®,x). Достаточно в качестве начального момента времени взять to = Xq, чтобы вектор-функция x(t) оказалась решением системы х = f(t,x) с начальным условием ж (to) = я0-
Автономные системы ОДУ можно рассматривать как частный случай неавтономных систем. Это позволяет системе х = /(ж), х 6 Rn, f = (/i ... /п) , ставить в соответствие векторное поле
V	£ f \
х =
1=1
в расширенном фазовом пространстве. Существенное отличие автономного случая от неавтономного состоит в том, что координатные функции векторного поля в автономном случае не зависят от переменного t. Это позволяет заменить векторное поле в расширенном фазовом пространстве Rn+1 его проекцией на фазовое пространство Rn, для чего в координатном представлении векторного поля достаточно отбросить первое слагаемое. При такой проекции интегральные кривые векторного поля в расширенном фазовом пространстве переходят в интегральные кривые векторного поля в фазовом пространстве.
414
И. ТЕОРИЯ МНОГООБРАЗИЙ
Дополнение 11.1. Системы линейных дифференциальных уравнений в частных производных
Рассмотрим систему дифференциальных уравнений вида
' ди	ди
a"dTt+-+aind^ = fl'
< ............................ (11.46)
ди	ди _
h • • • 4“ 0>mn	= fm 1
OX j	OXji
где i = 1,тп, j = 1,п, и i = 1,тп, — заданные гладкие функции переменных xj, хп, определенные в некоторой области М С Rn. Введем на Л/ гладкие векторные поля
v д	0	.	----
Xi = ац — + ... + ain—, г = 1, т. дх\	дхп
Тогда систему дифференциальных уравнений можно записать в виде
Xi(u) = fi, i=\,m.	(11.47)
Отметим, что подобную систему можно рассматривать на произвольном многообразии М, вообще говоря, не являющемся областью в Rn. Но в таком случае в разных локальных системах координат на многообразии мы будем получать разные системы дифференциальных уравнений.
Система дифференциальных уравнений (11.46) (или система (11.47)) в частном случае /, = О, i = 1, тп, является однородной системой линейных дифференциальных уравнений в частных производных, которую можно решить, используя инволютивные распределения (см. 11.9). Покажем, что решение неоднородной системы можно свести к однородному случаю. Для простоты остановимся на случае, когда n-мерное многообразие М является областью в Rn.
Д.11.1. Системы линейных уравнении в частных производных 415
Теорема 11.29. Гладкая функция u(si,...,a:n) на М является решением системы (11.47) в том и только в том случае, когда функция и(хо,х\у...^хп) = u(a?i,...,a:n) 4-является решением системы
Zj(v) = 0, г=1,ш,
где	= ^ - Л А.
В силу специального вида векторных полей Zi и функции v имеем
Zi(v) = Zi(u) + Zi(x0) =
= Xi(u> - fi^ + Х<(го) '	= X< W ’ fi'
UXq	OXq
Из равенства Zt(v) = Xt(u) - fi немедленно вытекает утверждение теоремы. ►
Теорема 11.30. Предположим, что гладкие векторные поля Xi, Хт в точке Р многообразия М линейно независимы и имеют место представления
т
[w¥j, Xj] =	i, j' = 1, ni,
fc=i
(11.48)
где c^j — гладкие функции на многообразии М. Тогда, для того чтобы система (11.47) имела решения в некоторой окрестности точки Р, необходимо и достаточно, чтобы в окрестности точки Р выполнялись условия совместности системы дифференциальных уравнений (11.47):
т
k=\
(11.49)
◄ Необходимость. Если и — решение системы (11.47), то
[Х:ЛЛМ=Х,(ХДи))-ХДХ,(и))==Х,(Л)-Х/Л), ij = l,m.
416
11. ТЕОРИЯ МНОГООБРАЗИИ
В то же время при выполнении условий (11.48) имеем
тп	т
[Xi. АГ>](u) = Y^Xklu) = Yrth.
fc=l	k=l
Сопоставляя эти равенства, получаем соотношения (11.49).
Достаточность. Пусть в окрестности U С Rri векторные поля Xi и функции fi удовлетворяют условиям (11.48), (11.49). Предположим, что в окрестности U заданы локальные координаты o?i, 2?2» • ••, хп- Рассмотрим в области U\ = = U xRcRn+1 с координатами xq, «и, ..., хп векторные поля Zj = Xi - fi-^-, i= 1, m, и распределение IF, порожденное эти-UXQ
ми векторными полями. Распределение IF гладкое, так как порождено гладкими векторными полями, и регулярное, так как векторные поля а следовательно, и векторные поля Zt линейно независимы. При этом в любой точке Q € U\ имеем dim3Q = 7n. Докажем, что распределение ‘J является инволютивным. Для этого вычислим коммутатор произвольной пары векторных полей Zi'.
По теореме Фробениуса распределение ‘J интегрируемо, а по теореме 11.27 в некоторой окрестности точки Р существует такая система координат у$, у\, ..., уп, что распределение 'J порождается векторными полями г = О, т-1. В этом случае система уравнений Zi(v) = 0, i = 0, m-1, равносильна системе
—— = 0, г = 0, т-1, dyi
Д. 11.1. Системы линейных уравнений в частных производных 417
а множество решений такой системы можно записать в виде v= F(ym,...,yn), где F — произвольная гладкая функция тг - тп 4-1 переменных. Можно показать, что среди таких функций v существуют функции, которые в системе координат х0, Ж1, хп имеют вид и = 2?о + м(я|,...,жп). Любой такой функции соответствует функция u(xi,...,a:n), являющаяся решением системы (11.47). ►
Пример 11.28. Найдем все решения системы дифференциальных уравнений
(2 du du _ zdTydl = ye ' du du du di+xy^+zd^=Q-
(11.50)
Обозначим в R4 координаты x, у, z, xg и рассмотрим векторные поля
Zi = zl^--y—-ye ~я~> dy dz dxQ
7	9	9	9
Zi = d-x+xyd-y + z¥z
Исходная система сводится к решению системы уравнений Zj(v) = 0, %2(v) = 0. Чтобы решить такую систему, необходимо найти инволютивное замыкание распределения, порожденного векторными полями Z\ и Z%. Для этого находим коммутатор двух векторных полей:
[Zi,Z2] = z2(x-2)^- + y(x-i)^- + ye Х(х- 1)^. оу	OZ	OXq
Определяем точки, в которых векторные поля Z], Z2, линейно независимы, для чего составляем матрицу из коорди-
418
11. ТЕОРИЯ МНОГООБРАЗИЙ
натных функций векторных полей:
/ О
г2
-у
\~уе~х
1 0	\
ху z2(x — 2) г	У(х-\)
О ус~х(х -	)
В точках, в которых векторные поля линейно независимы, ранг матрицы равен трем. Прибавив к третьему столбцу первый, умноженный на х - 1, получим, что ранг матрицы равен трем, если z2(2x - 3) / 0 и у / 0, что равносильно условию z2y{2x - 3) / 0. Итак, векторные поля Zi, Z2, [Z], Z2] линейно независимы в точках множества
М = {(ж, у, г, z0): г2у(2х - 3) / 0}.
Поэтому к системе двух уравнений необходимо добавить третье. В качестве третьего векторного поля Z3 можно взять коммутатор [Zi, Z2], но в данном случае удобнее его заменить определенной линейной комбинацией векторных полей Zi, Z2. [Zi, Z2]. В самом деле, нетрудно увидеть, что
ду
т.е. на множестве М векторное поле — является линейной комбинацией векторных полей Zi, Z2, [Zi, Z2]. В качестве третьего векторного поля Z3, пополняющего систему векторных полей Z| и Z2, удобнее взять именно это векторное поле. Итак, полагаем
ду
Теперь выясняем, возможно ли дальнейшее пополнение системы векторных полей. Имеем
0 -х ®	г, 1
+ е -— — —Z3------
oz дх0 у у
'2, %з] —	= ^Z3.
Д. 11.1. Системы линейных уравнений в частных производных 419
Следовательно, на множестве М векторные поля Zj, Z2, Z3 порождают трехмерное инволютивное распределение.
Отметим, что пара векторных полей Z\ и Z3 также порождает инволютивное распределение. Это указывает на то, что сперва следует искать первые интегралы этих полей. Посколь-ку Z3 = первые интегралы этого векторного поля имеют вид /(z,z,zo), где f — гладкая функция трех переменных. Подставляя это представление в уравнение Zi(v) = 0, получаем
UZ	UXq
Отсюда следует, что функция f является первым интегралом векторного поля
d dz
дхо
Так как в это векторное поле не входит слагаемое первым аа?
интегралом является функция х. Нетрудно найти еще один первый интеграл: р = z - етх0. Значит, первыми интегралами, общими для векторных полей Z\ и Z3, являются функции вида 0(я,р). Подставляя такую функцию в уравнение Z2(v) = О и используя правило дифференцирования сложной функции, находим
„ , , _ дд дд х . дд дд
Z2(9} ~ d~P(~e Xo+z} = d;+pd'p-Q-
Функция д является решением этого уравнения, если имеет вид д = д(х -1пр), поскольку д = я-1пр— первый интеграл векторного поля + Наконец, среди всех гладких функций g(q) ох ор
нужно выбрать те, для которых — Ь так как только функ-OXq
ции вида v(z,t/,z)+ а?о приводят к решениям исходной системы.
Мы имеем еще одно уравнение в частных производных:
dg _ , dq _ , ех _ , _ дхл	дхп	z — еххп	^q€	*
UXq	UXq	Z — е Xq
420
11. ТЕОРИЯ МНОГООБРАЗИЙ
Отсюда заключаем, что g(q) = —е_<? 4- С = xq - ze~x 4- С, где С — постоянная интегрирования. Следовательно, любое решение системы (11.50) на множестве М имеет вид
и = -ze~x 4- С, С = const.
Отметим, что в точках (ж, t/, -г), в которых z2y(2x - 3) = 0, найденные функции также являются решениями, что легко проверить непосредственной подстановкой в уравнения системы.
Пример 11.29. Докажем несовместность системы
' ди
< Тг=У' ди _ <ду~~ ‘
(11.51)
Для этого рассмотрим векторные поля
и перепишем систему в виде
Х} (“) = У, \х2(и) = 1.
Так как векторные поля Х\ и Х2 коммутируют, то условия (11.49) совместности системы имеют вид
*1(1)- X2(t/) = 0.
Нетрудно убедиться в том, что записанное равенство не выполняется. Следовательно, система (11.51) несовместна.
Д. 11.2. Приложения теории векторных полей и распределений 421
Дополнение 11.2. Некоторые приложения теории векторных полей и распределений
Теорема 11.31. Пусть Xj, ..., Хп — гладкие векторные поля на п-мерном многообразии М, Р € М и векторы Х\ |р, ....
Хп|р линейно независимы. Для того чтобы векторные поля
Xi,..., Хп в некоторой локальной системе координат t/i,. . в окрестности точки Р были координатными, т.е. Xi =
• 1 Уп д
ду, ’
г= 1,п, необходимо и достаточно, чтобы эти векторные поля коммутировали, т.е. [Xt-, Xj] = 0, i,j = 1, n.
◄ Необходимость. Если векторные поля Xi являются координатными в некоторой системе координат t/i, ..., уп, то непосредственным вычислением с помощью формулы (11.28) убеждаемся, что
[Х,, Xj] —
i,j=
Достаточность. Выберем произвольный номер j (1 $ $ j $ п) и рассмотрим систему линейных дифференциальных уравнений в частных производных

«/ У;
i = j,
i = 1, n,
(11.52)
считая неизвестной функцию yj. Нетрудно убедиться, что условия совместности для этой системы выполняются. Поэтому записанная система в некоторой окрестности Uj точки Р имеет решение. Выберем какое-либо решение, обозначим его через и повторим такой выбор для всех номеров j = 1, п. Все выбран-п
ные функции определены в окрестности U = П Ц. Покажем. i=i
что существует окрестность V С U точки Р, в которой отображение h = (t/i ... уп) определяет карту (V,h) на многообразии. Выберем некоторую карту (W,k), накрывающую точку Р. и обозначим через ®i, ..., хп локальные координаты в этой
422
И. ТЕОРИЯ МНОГООБРАЗИЙ
карте. Пусть в выбранной системе координат векторные поля Xi имеют координатное представление
п О
-Yj = 2 ^ik дх к ’	~	’
k=\
а отображение h — координатное представление h = h о k~[, h(x) = (у\(х) ... Уп(х)). Вводя функциональную матрицу А = = (aij), заключаем, что произведение этой матрицы на матрицу Якоби hf(x) функции h имеет вид Д/?(я)т = где
= =
С учетом формул (11.52) делаем вывод, что АК(х)Т = Е и dethf(x) / 0, т.е. матрица Якоби функции h является невырожденной. Согласно теореме об обратной функции и условию гладкости координатных функций векторных полей Xt, сужение функции h(x) на некоторую окрестность точки х = k(P) является диффеоморфизмом. Следовательно, для некоторой окрестности V С UC1W точки Р пара (V,h) является картой, а функции yj, j = 1, п, в этой карте есть координатные функции. Координатные функции векторного поля Xi в этой карте есть производные координатных функций yj вдоль этого векторного поля. В силу формул (11.52) векторное поле Xi имеет вид v д
At = —, т.е. является г-м координатным полем. ►
Пример 11.30. Рассмотрим на многообразии R2 векторные поля
у - —	г-4,
1 дх’ 2 дх Оу
В каждой точке (х, у) 6 R2 эти векторные поля независимы, поскольку матрица, составленная из координатных функций векторных полей, всюду в R2 невырождена:
1 О
41/
-1
= -1/0.
Д.11.2. Приложения теории векторных полей и распределении 423
Векторные поля X] и Х2 коммутируют, так как
[X, У] =
Л д4у 01 д4у 01\0 , дх 4у'дх+0' ду ( ^’ду)дх +
Согласно теореме 11.31, векторные поля Х\ и Х2 в некоторой системе координат являются координатными. Напомним, что производная координатной функции вдоль векторного поля совпадает с координатной функцией векторного поля. Поэтому, если векторные поля X} и Х2 в системе координат ц, v являются координатными, то
X1(«) = 1, Xj(v)=0, X2(u) = 0, X2(v)=l.
(11.53)
Из этих соотношений следует, что координатная функция и является первым интегралом векторного поля Х2, а координатная функция v — первым интегралом векторного поля Х\. Первые интегралы векторного поля Х\ в исходной системе координат х, у определяются уравнением
dx
Т
dy
о ’
равносильным уравнению dy = 0, откуда у = const. Значит, первым интегралом векторного поля Х\ является функция <р(х,у) = у,& все остальные первые интегралы в силу того, что размерность многообразия равна двум, имеют вид /(<р(я,т/)) = = /(t/), где f — произвольная гладкая функция.
Аналогично находим первые интегралы векторного поля Х2, записав соответствующее уравнение в системе координат х, у.
dx _ dy ty -Г
Записанное уравнение эквивалентно уравнению dx + Aydy = О, из которого находим х + 2у2 = const. Таким образом, все первые
424
11. ТЕОРИЯ МНОГООБРАЗИЙ
интегралы векторного поля X? имеют вид д(х + 2t/2), где д — гладкая функция.
Из первых интегралов f(y) векторного поля Х\ находим такую функцию и, что %2(v) = 1- Для этого в дифференциальное уравнение
dv dv
4удх ду 1
подставляем v = f(y) и приходим к уравнению относительно неизвестной функции /:
-/'(») = !•
Из этого уравнения находим f(y) = С\ - у и v = С\ - у. Аналогично для определения первого интеграла и = </(я + 2у2) подставляем его в дифференциальное уравнение %i(u) = 1:
^=g'(x + 2y2) = 1. их
Это равенство верно для любых значений переменных х и у и равносильно условию gf(z) = 1, откуда g(z) = z4- Ci- Значит. u = g(x+2y2) = х + 2у2 + С2.
Итак, функции и = х 4- 2у2 4- С*2 и v = С\ - у удовлетворяют условиям (11.53). Следовательно, в системе координат и, и, которая определяется заменой переменных и = х 4- 2у2 4- С'г, v = Ci - 1/, или х = и - 2(С] - и)2 - Сг, у = Ci - и, рассматриваемые векторные поля являются координатными:
Отметим, что система координат u, v введена на всем многообразии R2, так как отображение (u, v): R2 -> R2 является диффеоморфизмом R2 на R2. Отметим также, что решение найдено с точностью до аддитивных постоянных С\ и б’г-Это связано с тем, что при замене переменных х = х 4- CY
Д.11.2. Приложения теории векторных полей и распределений 425
у = у+6*2 с произвольными постоянными С\ и С’г координатные векторные поля не изменяются.
Пример 11.31. Векторные поля
v д д	д д
Xl = xfa+yd~y' Х2 = ~У¥х+ХТу
на многообразии R2 коммутируют всюду, так как [Х,У] = 0 в R2. Проверим, являются ли векторы Х\ |F, в произвольной точке Р линейно независимыми. Вычислим определитель, составленный из координатных функций векторных полей:
Видим, что векторные поля Х\ и Х2 линейно независимы в каждой точке в R2, кроме точки (0, 0). В окрестности этой точки векторные поля не могут быть координатными для какой-либо системы координат, так как координатные векторные поля линейно независимы в каждой точке, в которой действует система координат.
Для произвольной точки (жо, t/o) в R2 \ {(0, 0)} найдем систему координат, в которой заданные векторные поля являются координатными. Как и в предыдущем примере, ищем первые интегралы векторных полей. Для векторного поля Xj дифференциальное уравнение первых интегралов имеет вид
dx _ dy х у
Интегрирование этого уравнения приводит к соотношению у/х — С\ или х/у = С\. Поэтому первые интегралы векторного поля Xi можно записать в виде ч>(у/х) или <р(х/у). Первое представление можно использовать в окрестности точки (жо, t/o) при xq / 0, а второе — при уо / 0.
426
11. ТЕОРИЯ МНОГООБРАЗИЙ
Первые интегралы векторного поля Х2 описываются уравнением
dx dy
-У х ’
эквивалентным уравнению xdx 4- ydy = 0. Отсюда следует, что первыми интегралами Х2 являются функции вида ф(х1 2 4- у2).
Среди первых интегралов векторного поля Х\ находим функцию v = <p(y/x) (или v = <p(x/y)), удовлетворяющую дифференциальному уравнению Хч(и) = 1, которое в данном случае имеет вид
Отсюда заключаем, что
^'(г)=?тт
и = arctgz (постоянная интегрирования опущена). Следовательно, и = arctg(i//a:), если xq / 0. Аналогично находим, что v = - arctg(z/у) при уо ± 0-
Среди первых интегралов ${х2 4- у2) векторного поля Х2 ищем функцию и, удовлетворяющую уравнению Xi(u) = 1. Это уравнение приводит к дифференциальному уравнению относительно неизвестной функции
ф\х2 + у2}(2х2 + 2у2) = \.
Выполнив замену r = x2 + y\ получим = 1/(2г), откуда чЛ(г) = (1/2) In г (постоянную интегрирования опускаем). В результате получаем и = (1/2) 1п(а?2 4-у2)-
Итак, искомая замена переменных имеет вид
1	1/
и = -1п(ж2 4-1/2), v = arctg-	(11.54)
2	х
Д.11.2. Приложения теории векторных полей и распределений 427
в областях х > 0, х < 0 и
u= |ln(a:2 +I/2),
X
v = — arctg -
У
(11.55)
в областях у > 0, у < 0. Хотя на многообразии R2\ {(0, 0)} и существует атлас из одной карты, нет карты, накрывающей все многообразие, в которой векторные поля Х\ и Хг являются координатными. Действительно, отображения (11.54) и (11.55) даже определены не на всем множестве R2\ (0, 0). #
Систему уравнений х = f(t,x,u), где t 6 R, х € RnT u G Rm, a i(t) = x'(t), называют динамической системой с управлением (или просто системой с управлением). Решением такой системы является любая пара вектор-функций х'. R—>Rn и и: R—> Rm, удовлетворяющих условию x'(t) = f(t,x(t),u(t)). При этом значение x(t) вектор-функции х при заданном значении t называют состоянием системы в момент времени t, кривую х = x(t) — траекторией системы, а вектор-функцию и — управлением. Различают векторное управление, соответствующее случаю т > 1, и скалярное управление, соответствующее случаю т= 1.
Если функция f является гладкой, то при заданной гладкой функции и система с управлением х = f(t,x,u) имеет решение, подчиняющееся начальному условию x{Iq) = х0, и притом единственное [VIII]. Выбирая различные управления u(t), мы получаем различные решения x(t). Типичной задачей теории управления является такой выбор управления u(t), при котором решение (x(t), u(t)) обладает нужными свойствами.
Пример 11.32. Положение автомобиля можно охарактеризовать четырьмя параметрами: декартовыми координатами х, у середины Р задней оси автомобиля, углом д, который прямая, проходящая через середины Р nQ двух осей, составляет с осью абсцисс, и углом поворота колес передней оси относительно прямой PQ (рис. 11.21). При таком выборе параметров движе-
428
11. ТЕОРИЯ МНОГООБРАЗИЙ
ние автомобиля описывается системой дифференциальных уравнений
х = щ cost?, у = uisintf, 4> = и2,
• Щ
(11.56)
где ui — скорость автомобиля, и2 — угловая скорость поворота колес пе
редней оси, a d — расстояние между передней и задней осями
(т.е. между точками Риф).
Система (11.56) представляет собой систему с управлением,
причем в данном случае управление векторное и имеет две составляющие и\ и и2. Положение автомобиля характеризуется четырехмерным вектором состояний (х у <р д) . Значения переменных ж, у, $, tq, и2 имеют естественные ограничения.
Для данной модели поставим следующую задачу теории управления: найти управление, при котором автомобиль из заданного начального положения (xq j/o $о) в момент времени tQ перейдет в заданное конечное положение (з?1 t/i в момент времени t]. Это значит, что требуется найти такие функции ui(£) и u2(t)> при которых решение задачи Коши для нормальной системы ОДУ (11.56) с начальными условиями x(to) = *0, J/(^o) = J/o, ¥>(*o) = <Po, 0(*o) = удовлетворяет дополнительным условиям x(ti) = x^ y(ti) = yi, <p(tj) = <pi. ^i) = t?i. #
Задаче теории управления можно придать дифференциально-геометрическую интерпретацию. При заданном управлении u(t) система с управлением х = f(t,x,u) становится нормальной системой ОДУ, в общем случае не являющейся автономной. которую можно связать с векторным полем (см. 11.7). С этой точки зрения систему с управлением можно рассматривать как векторное поле, которое зависит от управления как параметра.
Д.11.2. Приложения теории векторных полей и распределении 429
При таком подходе задача теории управления состоит в том, чтобы выбрать управление, при котором интегральные кривые векторного поля будут обладать заданными свойствами.
Пример 11.33. Задачу теории управления из примера 11.32 можно переформулировать следующим образом: для векторного поля
д Л д . л d d и\ д
X = ^ + u)Cos^ + u1SIn^ + u2^ + 7tg^
найти такие функции u\(t) и U2(t), при которых векторное поле X имеет интегральную кривую, проходящую в два заданных момента времени to и t\ через две заданные точки. #
Две системы с управлением х = f(t,x,u) и у = g(t,y,v)y х,у € Rn, u,v Е Rm, назовем эквивалентными, если существует замена переменных y = y(t,x), v = v(t,z,u), при которой любое решение (x(t), u(t)) первой системы переходит в решение (i/(t,a:(t)), v(t,x(t),i4(t))) второй системы, причем эта замена переменных обратима и обратная замена переменных переводит любое решение второй системы в решение первой. Введенное понятие отражает возможность замены заданной системы с управлением другой, эквивалентной исходной. Действительно, если система у = g(t, t/, v) эквивалентна системе х = /(£, я, и), то по решениям первой системы можно найти решения второй и наоборот. Возникает задача описания систем с управлением, эквивалентных заданной системе, и задача выбора такой системы, эквивалентной исходной, которая имеет наиболее простой вид.
В дифференциально-геометрической интерпретации систем с управлением замена переменных представляет собой смену системы координат на многообразии, а задача выбора наиболее простой системы среди эквивалентных сводится к выбору такой системы координат, в которой векторное поле имеет наиболее простой вид.
430
II. ТЕОРИЯ МНОГООБРАЗИЙ
В качестве примера остановимся на случае автономной аффинной системы с управлением, имеющей следующий вид:
х = А(х) 4- Bt(x)i£t-,	(11.57)
t=i
где A, Bi, i = 1, т, — некоторые вектор-функции. Ограничимся случаем m= 1 и выясним, при каких условиях такая аффинная система эквивалентна простейшей аффинной системе
^1 —	1
Z2 = Z3, <.........
Zn— 1 = Zn, Jn=V.
(11.58)
При этом уместно ограничиться только такими заменами координат, которые не зависят от времени и при которых система остается аффинной, т.е. в данном случае заменами вида z = z(x), v = а(х) +/3(х)и (или х = х(г), и = tp(z) + ip(z)v). В такой замене функция многих переменных z = z(x) должна иметь обратную функцию (в частности, матрица Якоби zf(x) должна быть невырожденной), а функция ij)(x) не должна обращаться в нуль.
Вектор-функции А и В можно рассматривать как координатное представление двух векторных полей X и Y. Тогда аффинной системе х = А(х) 4- В(х)и с управлением будет соответствовать векторное поле X + uY. При замене переменных x = x(z), оставляющей управление неизменным, аффинная система преобразуется так, что сохраняется связь этой системы с векторными полями X и Y. Однако изменение управления вида и = <р(х) -I- V>(x)v приводит к изменению векторных полей. Действительно, при такой замене аффинная система х = А(х) + В(х)и преобразуется к виду
х = (А(х) + В(х)<р(х)) 4- B(x)tl>(x)v,
Д.11.2. Приложения теории векторных полей и распределении 431
т.е. векторное поле X с координатным представлением А(х) трансформируется в векторное поле X 4- <pY с координатным представлением А(ж) 4- В(х)<р(х), а векторное поле Y с координатным представлением В(х) трансформируется в векторное поле i/>Y с координатным представлением В(х\ф(х).
Введем обозначения
adx У = Y, ad* У = %, ad^-1 У

Теорема 11.32. Для того чтобы аффинная система х = = А(х) 4- В(х)иу х Е Rn, u Е R, в некоторой окрестности заданной точки Р была эквивалентна системе (11.58), необходимо и достаточно, чтобы в окрестности точки Р распределение порожденное векторными полями ad^y, fc = 0, п-2, было инволютивным, а векторы ad^ У|р, Аг = О, п-1, были линейно независимыми.
◄ Упрощая выкладки, докажем эту теорему для частного случая п = 3. Тогда формулировка теоремы такова. Для того чтобы аффинная система х = А(х) 4- В(ж)п, х Е R3, u Е R. в некоторой окрестности точки Р Е R3 была эквивалентна системе
21 =Z2,
— г3,
23 = V,
(11.59)
необходимо и достаточно, чтобы распределение {F, порожденное векторными полями У и [X, У], было инволютивным, а векторы Ур, [X, У]р и [X, [X, У]]Р были линейно независимыми.
Необходимость. Если система х = А(ж) + В(х)и эквивалентна системе (11.59), то линейную независимость и инволю-тивность векторных полей можно проверить в новой системе координат. Действительно, замену координат х = x(z), и = = a(z) 4- /5(2)v можно представить как повторную замену: сначала х = x(z), а затем и = <р(х) 4- il>(x)v, где <р(я) = а(2(з?)),
432
П. ТЕОРИЯ МНОГООБРАЗИЙ
<ф(х) = 0(z(x))y a z(x) — функция многих переменных, обратная x(z). Первая замена переменных не изменяет векторных полей, связанных с аффинной системой, а значит, не изменяет и условий инволютивности и линейной независимости. При второй замене (замене управления) векторные поля X и Y для управления и переходят в векторные поля X = X + ipY и Y = ^Y для управления v. Непосредственным подсчетом находим, что
[X, У] = [X + у>У, ФУ] = ф[Х, И + Х(ф)У -
- (фУ(<р) - ?У(ф))У = Ф[Х, У] + 7У,
где 7 = X(ф) - $Y-J- ipY(^) — гладкая функция. Следовательно, векторные поля Y и [Х,У] принадлежат распределению, порожденному векторными полями Y, [X, У]. В силу обратимости замены можно также утверждать, что и векторные поля У, [X, У] принадлежат распределению, порожденному векторными полями У и [Х,У]. Поэтому пары векторных полей У, [X, У] и У, [X, У] порождают одно и то же распределение а условие инволютивности этого распределения не зависит от выбора управления.
Далее,
[X, [X, У] ] = [X + <^У, ^[Х, У] + 7У] =
= ф[X, [X, У]] + 71 [[X, У], У] + 72 [X, У] + 7зУ,
где 71, 72 и 7з — некоторые гладкие функции (их конкретный вид не является существенным). Из этого представления видно, что если распределение Зг, порожденное векторными полями У и [X, У], инволютивно, то векторные поля У, [Х,У] и [X, [Х,У]] принадлежат распределению Зз, порожденному векторными полями У, [X, У] и [X, [X, У]]. Учитывая, как и выше, обратимость замены переменых, заключаем, что распределение, порожденное векторными полями У, [Х,У] и [X, [X, У] ], совпадает с распределением Зз. Условие линейной
Д.11.2. Приложения теории векторных полей и распределений 433 независимости векторов Ур, [У, Х]р и [[У, Х]уХ]р означает, что размерность линейного подпространства Зз|р равна трем. Ясно, что это условие не связано с выбором управления.
Итак, условия инволютивности распределения и линейной независимости трех векторов в формулировке теоремы сохраняются при замене переменных. Поэтому их можно проверить в системе координат z^y Z2, z$y v, в которой аффинная система имеет вид (11.59). В этой системе координат векторные поля X и У записываются следующим образом:
д	д
= z2^~ + z3fi—
OZ\	OZ2
д
Вычислим коммутатор векторных полей X и У:
[¥,Х]=-£-
Теперь определим двойной коммутатор:
[[К,Х], Х] = -5—
Видим, что три векторных поля У, [У, X] и [[У, X], X] являются координатными, а потому линейно независимы и коммутируют.
Достаточность. Докажем, что при выполнении условий теоремы существует такая замена переменных х = ж(з), и = а(ж) + ft(x)vy которая аффинную систему х = А(х) + В(х)и преобразует в систему (11.59). Рассмотрим систему
\[Х,У](«) = 0.
(11.60)
Согласно теореме 11.28, эта система имеет решения, причем можно выбрать такое решение z\y у которого не все частные
434
11. ТЕОРИЯ МНОГООБРАЗИЙ
производные в точке Р равны нулю. Векторы У, [X, У], [X, [X, У]] линейно независимы, а потому образуют базис в трехмерном линейном пространстве TpR3. Так как функция z\ является решением системы (11.60), то Yp(z\) = 0, [X, У]Р (zi) = = 0. Следовательно, функция д = [X, [X, У]] (zi) не равна нулю в точке Р. В силу гладкости эта функция не обращается в нуль в некоторой окрестности точки Р. Положим
z2 = X(z,), z3 = X(z3}
(11.61)
и рассмотрим управление и, которое связано с исходным управлением равенством и = а + /3v, где
_ *(*з)	1
r(z3)’ Р Y(z3y
(11.62)
Отметим, что
Y (z2) = Y (X(z,)) = [У, X] (z,) + Х(У(г,)) = 0, [У, X] (z2) = [У, X] (X(z,)) = [[У, X], X] (z,) + Х([У, X] (z,)) = д, У (z3) = У (X(z2)) = [У, X] (z2) + Х(У(г2)) = д / 0.
Поэтому функции а и /3 определены корректно. При переходе к системе координат zi, Z2, z$ с заменой управления и управлением v исходные векторные поля X и У переходят в векторные поля X = X 4-аУ, У = /3Y. Найдем координаты векторных полей X и У в системе координат zj, Z2, z3- Для этого достаточно вычислить производные вдоль этих векторных полей координатных функций. Имеем
X(z,) = X(zi)+ay(z,) = z2, X(z2) = X(z2) + ay(z2) = z3, X (z3) = X (z3) + аУ (z3) = 0
Д.11.2. Приложения теории векторных полей и распределений 435
Аналогично
д dz* ’
(последнее равенство вытекает из определения функции а).
~ д д X = z2— + z3—.
dz\ dz2
У(г1) = ДУ(^1)=0,
Y(z2) = 0Y(z2) = b,
Y(z2) = 0Y(z3) = 1,
Найденные представления векторных полей X
и У в системе координат zj, z2, z3 позволяют записать в этой системе координат рассматриваемую аффинную систему, и нетрудно увидеть, что она имеет вид (11.58). ►
Замечание 11.8. Доказательство теоремы 11.32 не только подтверждает возможность упрощения аффинной системы с помощью замены переменных, но и дает метод вычисления такой замены переменных. Действительно, функция zi может быть найдена как решение системы (11.60), функции z2 и z3 — по формулам (11.61), а функции а и /7, определяющие замену управления, — по формулам (11.62).
Пример 11.34. Выясним, каким требованиям должна удовлетворять действительная функция f одного действительного переменного, чтобы система
Х1 = f(x2) +&1 -|- 14ЯТЗ, х2 = и, ж3 = ж2
была эквивалентна системе (11.59). Для этого используем теорему 11.32. В данном случае
v	х д д „ d , д
436
11. ТЕОРИЯ МНОГООБРАЗИЙ
Используя запись коммутатора векторных полей в координатах, находим
[У, X] = (хз + ГМ - Xj) А + jL,
[[У, X], X] = (х3 + Г(х2) - 2х2)
Векторные поля У, [У, X], [[У, X], X] линейно независимы тогда и только тогда, когда определитель, составленный из их координат, отличен от нуля, т.е.
*з x3+f'(x2)-x2
1	О
О	1
хз+Р(х2)-2х2 О
= «з + f(x2) -2®2/0.
О
Так как
[У.[УЛ]] = (Г(х2)-2)^, условие инволютивности распределения, порожденного векторными полями У, [У, X], имеет вид
хз x3 + f'(x2) -х2
1	О
О	1
№)-2 О О
= f"(x2) — 2 = 0.
Таким образом, функция f должна иметь вид f(x2) = х% + + Cix2 + С2. В этом случае f(x2) = 2х2 4- С\ и условие линейной независимости трех векторов сводится к соотношению яз + C'i / 0.
Итак, рассматриваемая аффинная система сводится к аффинной системе (11.58), если функция f имеет вид f(x2) = = Хз + С1Х2 + С2, причем эквивалентность систем имеет место в окрестностях тех точек («х, х2, 2:3), для которых х3 ^С\. Найдем соответствующее преобразование переменных. Система
Вопросы и задачи
437
уравнений (11.60) в данном случае имеет вид
{<9-21 , дг, хзд^+&г2- '
(хз + /'(хг)-хг)^ + £. = 0.
Одним из ее решений является функция
«1 (®1, ®2,®з) = ®1 - ®2®3 - 1(®3 + С1 )2. £
Далее последовательно находим
Z2 = X (zi) = Х1 — Х2%3 +	г3 = + 6’1^2 + ^2»
_ а?1 +^2 4~^,1а?2~Ю2	a _	1
Яз + Cl	Жз + С1
Вопросы и задачи
11.1.	Докажите, что не существует непрерывного взаимно однозначного отображения окружности на часть прямой. Выведите из этого факта то, что на окружности не существует атласа из одной карты.
11.2.	Выясните, можно ли ввести гладкую структуру на следующих множествах:
а)	конус;
б)	остальные поверхности второго порядка;
в)	объединение прямой и точки вне этой прямой;
г)	множество квадратных матриц порядка п с определителем, равным единице;
д)	отрезок прямой;
е)	объединение двух координатных осей в R2.
11.3.	Используя теорему 11.1 о задании многообразий уравнениями, докажите, что n-мерная сфера Sn есть многообразие.
438
11. ТЕОРИЯ МНОГООБРАЗИЙ
Сколько карт в атласе Sn, построенном с помощью этой теоремы? Покажите, что сфера Sn с такой гладкой структурой диффеоморфна сфере Sn с гладкой структурой из примера 11.3.
11.4.	Аналогично примеру 11.9 введите гладкую структуру на следующих множествах: а) цилиндре; б) листе Мебиуса; в) бутылке Клейна; г) проективной плоскости. Эти многообразия могут быть получены из прямоугольника путем склейки его сторон, что символически изображено на рис. 11.22 (как и в примере 11.9, склеиваются противоположные стороны, маркированные стрелками, причем при склеивании стрелки должны быть совмещены).
а
Рис. 11.22
11.5.	Рассмотрим числовую ось R с атласом, состоящим из одной карты (R,/i) , где отображение Л: R —>R определяется равенством h(x) = х3. Докажите, что R с этим атласом диф-феоморфно стандартному многообразию R.
11.6.	Приведите пример гладкого взаимно однозначного отображения, не являющегося диффеоморфизмом.
11.7.	Пусть М и N — гладкие многообразия. На множестве М х N постройте гладкую структуру так, что проекции p:Mx/V—>Mh(?:Mx7V—будут гладкими отображениями.
11.8.	Диффеоморфны ли окружность и эллипс?
11.9.	Рассмотрим тор в R3, получающийся в результате вращения окружности (х - 2)2 + у2 = 1 вокруг оси Оу. Докажите, что функции ж, у, z на торе являются гладкими.
Вопросы и задачи
439
11.10.	Опишите аналогично примеру 11.12 алгебру гладких функций: а) на торе; б) на листе Мебиуса; в) на бутылке Клейна; г) на проективной плоскости.
11.11.	Покажите, что если кривые соприкасаются в одной системе координат, то они соприкасаются и в любой другой системе координат.
11.12.	Докажите следующие свойства операции дифференцирования функции на многообразии вдоль касательного вектора f:
l)£(A/ + w) = A£(/)+/,&), A,^€R,
2) f(fg)=f(P)C(g)+Ш)д(Р), f,ge
11.13.	Пусть гладкая функция f: R —> R удовлетворяет условию /(0) = 0. Покажите, что кривая
® = l-cos/(f), j/ = sin/(t), 2 = t24-l
касается сферы х2 4- у2 4- z2 = 1 в точке (0, 0, 1).
11.14.	Докажите, что линейное пространство ТрМ изоморфно арифметическому линейному пространству Rn, где п — размерность многообразия М.
11.15.	Используя пример 11.19, опишите касательное пространство к многообразию 50(3) (см. пример 11.10) в точке Е 6 50(3) (Е— единичная матрица) как трехмерную плоскость в R9.
11.16.	Покажите, что каноническая проекция ir.TM —> —> М — гладкое отображение.
11.17.	Докажите, что: а) многообразие TRn диффеоморфно R2n; б) многообразие TS1 диффеоморфно цилиндру.
11.18.	Докажите, что дифференциал гладкого отображения в точке есть линейный оператор.
440
11. ТЕОРИЯ МНОГООБРАЗИЙ
11.19.	Представьте векторные поля [fX+gY, У] (/ и д — гладкие функции) и [fX, gY] в виде линейных комбинаций векторных полей X, У и [X, У].
11.20.	Пусть подмножество N многообразия М определено системой уравнений fi(x) = 0, i = 1, k, где fi — гладкие функции на Л/, а векторные поля X и У касаются N. Покажите, что векторное поле [X, У] также касается N (используйте теорему 11.10 и метод ее доказательства).
11.21.	Используя задачу 11.20, докажите, что если распределение интегрируемо, то модуль этого распределения есть алгебра Ли.
11.22.	Пусть {4J и {Вт} — фазовые потоки векторных полей X и У. По аналогии с теоремой 11.21 покажите, что вектор Хр + Yp есть касательный вектор к кривой y(t) = = (Bt ° At)(P) в точке Р.
11.23.	Найдите фазовый поток векторного поля:
. д Э $ д ч д д a)zd-y-ydi'	в)х^ + ^-
11.24.	Докажите теорему 11.20.
11.25.	Найдите минимальную алгебру Ли, содержащую заданные векторные поля X и У:
, у о д д д
=	Y=ZTy~y^
д_ у_д_. дх +гду'	dz'
. v д д v д д
°}Х = Уд^-Хд-у' Y=XTx+yTy' . v д д ,г д д г}Х = д^ + худ^’ У = € Ъ + Уд~г-
Вопросы и задачи
441
11.26.	Найдите вид векторного поля X в системе координат u, v:
а)	X = у-----х—, u=Vz2 + 2T, v = arctg- (iz, v —
дх ду	х
полярные координаты);
б)	л = х— + у~х~, u, v — полярные координаты; дх ду
. v д д	у
ъ)Х = Уд~х~Хд-у' “ =
11.27.	Пусть ‘J — распределение на многообразии R4, которое в каждой точке Р задает касательное пространство к пересечению в этой точке поверхностей уровня функций
fi(x,y,z,t) = x2 + y2 + z2 + t\ f2(x,y,z,t) = х2 - у2 + z2 + t2.
Найдите область, в которой это распределение регулярно. Найдите векторные поля Z\ и Zj, порождающие это распределение в области регулярности. Покажите, что это распределение в области регулярности интегрируемо.
11.28.	Приведите пример гладкого распределения, для которого не существует конечного числа векторных полей, порождающих его сразу на всем многообразии.
11.29.	Пусть модуль распределения ‘J порождается одним векторным полем Z, т.е. любое векторное поле X Е имеет вид X = fZ< где f Е С°°(М). Что можно сказать об интегрируемости такого распределения?
11.30.	Покажите, что любое распределение на двумерном многообразии интегрируемо.
11.31.	Приведите пример распределения, не являющегося гладким.
442
11. ТЕОРИЯ МНОГООБРАЗИЙ
11.32.	Выясните, совместны ли следующие системы, и если совместны, найдите все решения:
9ди ->ди о ди ж л—У	+ 2 л
дх ду dz
ди ди
л“ + 2/Т’ = 0;
ду dz
ди ди
d~x+xyTy=Z'
_2 ди ди е —	= хи:
ду У dz
(ди ди ди .2 Xd~X-yTy+ZTz=Z гди ди
X----\-и— = Х1
Q 1 У о 1 ду dz
ди ди удГхдГх+ху-
ди ди Л z-—x-— = 2xz.
дх dz
2 , .,4
11.33.	Найдите системы координат, в которых следующие векторные поля являются координатными, или покажите, что таких систем координат нет:
.	# д .. , ч д .	. д
л}х=хд^+уы у={у+х^+(у-х}ы
. __ д д .. ,	. д д
б)Х = Х^ + у¥у' Y = {y + x^-xd~y-
11.34.	В R4 с координатами ж, г/, z, t найдите области, в которых распределение порожденное заданными векторными полями X и У, является гладким и регулярным; выясните, является ли это распределение интегрируемым; найдите максимальные интегральные многообразия инволютивного замыкания распределения J:
а) X =	- 2ty-^~ + yz^-, Y = 4tz-^~ - 2ty^~ + y2^-;
di dy dt	dX dz dt
v & д д „ д д , d dx y dy dt dx y dy dz
СПИСОК РЕКОМЕНДУЕМОЙ ЛИТЕРАТУРЫ
Учебники и учебные пособия
Архипов Г.И., Садовничий В.А., Чубариков В.Н. Лекции по математическому анализу. Учеб. 2-е изд., перераб. М.: Высш, шк., 2000. 695 с.
Бугров Я. С.., Никольский С.М. Высшая математика. Дифференциальное и интегральное исчисление. М.: Наука, 1984. 432 с.
Булдырев В.С.> Павлов Б. С. Линейная алгебра и функции многих переменных. Л.: Изд-во Ленингр. ун-та, 1985. 662 с.
Дубровин Б.А., Новиков С.П., Фоменко А.Т. Современная геометрия: Методы и приложения. М.: Наука, 1979. 760 с.
Зорич В.А. Математический анализ. 4.1. М.: Наука, 1981. 544 с.
Ильин В.А.> Позняк Э.Г. Основы математического анализа: В 2 т. Т. 1. М.: Наука, 1982. 616 с.
Ильин В.А., Садовничий В.А., Сендов Бл.Х. Математический анализ: В 2 т. Т. 1. М.: Изд-во МГУ, 1985. 662 с.
Кудрявцев Л.Д. Курс математического анализа: Учеб, для университетов и вузов: В 3 т. 2-е изд., перераб. и доп. М.: Высш, шк., 1988. Т. 1. 712 с.;Т. 2. 576 с.
Математический анализ в вопросах и задачах. Функции нескольких переменных: Учеб, пособ. для вузов / Под ред. В.Ф. Бутузова. М.: Высш, шк., 1988. 288 с.
Мищенко А.С., Фоменко А.Т. Курс дифференциальной геометрии и топологии. М.: Изд-во Моск, ун-та, 1980. 439 с.
Никольский С.М. Курс математического анализа: В 2 т. 4-е изд, перераб. Т. 1. М.: Наука, 1990. 528 с.; Т. 2. М.: Наука, 1990. 543 с.
Пискунов Н.С. Дифференциальное и интегральное исчисления: В 2 т. Т. 1. М.: Наука, 1985. 432 с.
Погорелов А.В. Дифференциальная геометрия. М.: Наука, 1969. 176 с.
Познлк Э.Г., Шикин Е.В. Дифференциальная геометрия: Первое знакомство. М.: Изд-во МГУ, 1990. 384 с.
Рудин У. Основы математического анализа / Пер. с англ. В.П. Хавина. М.: Мир, 1976. 320 с.
444
СПИСОК РЕКОМЕНДУЕМОЙ ЛИТЕРАТУРЫ
Стернберг С. Лекции по дифференциальной геометрии / Пер. с англ, под ред. А.Л. Онищика. М.: Мир, 1970. 412 с.
Фихтенгольц Г.М. Курс дифференциального и интегрального исчисления: В 3 т. М.: Наука, 1969.
Фоменко А.Т. Вариационные методы в топологии. М.: Наука, 1982. 344 с.
Фролов С.В., Шостак Р.Я. Курс высшей математики: В 2 т. Т. 1. М.: Высш, шк., 1973. 480 с.
Шилов Г.Е. Математический анализ, функции нескольких вещественных переменных. М.: Наука, 1972. 624 с.
Справочные издания и монографии
Алберг Дж., Нильсон Э., Уолш Дж. Теория сплайнов и ее приложения / Пер. с англ, под ред. С.Б. Стечкина. М.: Мир, 1972. 316 с.
Александрова Н.В. Математические термины: Справочник. М.: Высш, шк., 1978. 190 с.
Бронштейн И.Н., Семендяев К.А. Справочник по математике для инженеров и учащихся втузов. 13-е изд., испр. М.: Наука, 1986. 544 с.
Брус Дж., Джиблин П. Кривые и особенности / Пер. с англ, под ред. В.И. Арнольда. М.: Мир, 1988. 262 с.
Воднев В.Т., Наумович А.Ф., Наумович Н.Ф. Математический словарь высшей школы / Под ред. Ю.С. Богданова. Минск: Вышэйш. шк., 1984. 528 с.
Выгодский М.Я. Справочник по высшей математике. 13-е изд., стереотип. М.: Физматлит, 1995. 872 с.
Деннис Дж. (мл.), Шнабель Р. Численные методы безусловной оптимизации и решения нелинейных уравнений / Пер. с англ, под ред. Ю.Г. Евтушенко. М.: Мир, 1988. 440 с.
Корн Г., Корн Т. Справочник по математике (для научных работников и инженеров) / Пер. с англ, под ред. И.Г. Арамановича. М.: Наука, 1973. 832 с.
Математический энциклопедический словарь / Гл. ред. Ю.В. Прохоров. М.: Сов. энцикл., 1988. 848.с.
Сигорский В.П. Математический аппарат инженера. 2-е изд., стереотип. Киев: Техюка, 1977. 768 с.
Стечкин С.Б., Субботин Ю.Н. Сплайны в вычислительной математике. М.: Наука, 1976. 248 с.
445
Филин А.П. Элементы теории оболочек. Л.: Стройиздат. Ленингр. отд-ние, 1975. 256 с.
Фор Р., Кофман А., Дени-Папе н М. Современная математика / Пер. с франц, под ред. А.Н. Колмогорова. М.: Мир, 1966. 272 с.
Задачники
Виноградова И.А., Олехник С.Н., Садовничий В'.А. Задачи и упражнения по математическому анализу. Кн. 1. Дифференциальное и интегральное исчисление функции одной переменной. Учеб, пособ. / Под ред. В.А. Садовничего. М.: Высш, шк., 2000. 725 с.
Задачи и упражнения по математическому анализу для втузов / Под ред. Б.П. Демидовича. 11-е изд., стереотип. М.: Интеграл-Пресс, 1997. 416 с.
Лефор Г. Алгебра и анализ. Задачи / Пер. с франц. Е.И. Стечкиной. М.: Наука, 1973. 464 с.
Мищенко А.С., Соловьев Ю.П., Фоменко А.Т. Сборник задач по дифференциальной геометрии и топологии. М.: Изд-во МГУ, 1981. 184 с.
Моденов П.С. Сборник задач дифференциальной геометрии. М.: Учпедгиз, 1949. 323 с.
Сборник задач по дифференциальной геометрии: Учеб, пособ. / Под ред. В.Т. Воднева. Минск, Вышейш. шк., 1970. 376 с.
Сборник задач по дифференциальной геометрии. / Под ред. А. С. Фе-денко. М.: Наука, 1979. 272 с.
Сборник задач по математике для втузов. Ч. 1. Линейная алгебра и основы математического анализа: Учеб, пособие для втузов / Под ред. А.В. Ефимова и Б.П. Демидовича. 2-е изд. М.: Наука, 1986. 428 с.
предметный указатель
Алгебра 338
-	Ли 388
Аппроксимация конечно-разностная 264
Атлас 313
-	максимальный 322
Вектор арифметический 20
-	геометрический III, 361
-	главный нормальный II - касательный 342 -- к кривой 148 	параметризованной кривой
346
----подмножеству на многообразии 356
-	направляющий прямой III, 314
-	нормальный к поверхности 201
----единичный 214
-	- плоскости III
-	связанный III, 361
Величина скалярная 1-215, III
Вложение многообразия 341 Внутренность множества 1-185, 23
Реликоид прямой 241
Геометрия дифференциальная 192
-	поверхности внешняя 237
-	- внутренняя 235
Гипербола равнобочная III Гипотеза Кирхгофа — Лява 242 Гомеоморфизм 193
Гомоморфизм алгебр 338
Градиент функции 141
Граница множества 1-185, 26
Грань точная верхняя 1-87
-	- нижняя 1-88
График функции 1-80, 35
Группа диффеоморфизмов локальная однопараметрическая 382
-	локальная 382
Движение пространства 191
Дефект сплайна 287
Дискриминант квадратичной формы 221
Диффеоморфизм 336
Дифференциал второго порядка II, 105
-	гладкого отображения в точке 364
-	длины дуги кривой II, VI, 203
-	отображения 366
-	первого порядка II, 105
-	функции (полный) 92
-	- частный 92
-	к-го порядка II, 106
Дифференцирование алгебры 373
-	в точке 354
-	функции вдоль вектора 354
Доопределение функции по непрерывности 58
447
Задача Коши для нормальной системы ОДУ VIII, 378 - на условный экстремум 172 - теории управления 427 Замена координат гладкая 199 - параметра 346
Изгибание поверхности 235
Изоморфизм алгебр 338
Инвариант IV, 191
Инвариантность формы записи дифференциала II, 93
Интеграл первый векторного поля 405
Инъекция 1-74
Итерация внешняя 250
-	внутренняя 250
Карта 312
-	на многообразии 322
Карты согласованные 313
Катеноид II, 241
Класс Ск 103
Коммутатор векторных полей 386
Компакт 1-189, 27
Композиция отображений 1-76, SO
Конец пути 28
Координаты главные 232
-	касательного вектора 345
---внутренние 201
-	на множестве 307
-	стереографические 315
-	точки в локальной системе координат 312
-	- внутренние 193
-	- bR” 21
--на поверхности 193
Кортеж 1-79, XIX, 20
Коэффициент второй квадратичной формы 214
Коэффициенты первой квадратичной формы 203
Кривая гладкая II
-	кусочно гладкая II
-	на многообразии параметризованная гладкая 343
-	- поверхности 200
-	непрерывная в Rn 28
Кривизна поверхности гауссова 238
-	- главная 228
-	- нормальная 224
-	- полная 238
-	- средняя 238
Кривые параметризованные соприкасающиеся 350
Критерий Коши 30
Линия винтовая II, 28
-	геодезическая 239
-	кривизны 229
-	разрыва функции 59
-	уровня 37
-	цепная II, 241
]\4аксимум локальный условный 171
-	функции локальный II, 158
Матрица Гессе 97
-	Грама IV
-	присоединенная III
-	с диагональным преобладанием III
-	трех диагональная III
-	функциональная 33
-	Якоби 72
-	-по части переменных 124
предметный указатель
448
Метод Бройдена 254 - доверительной области 270 - Зейделя нелинейный 256 - итерационный неявный 250 - - одношаговый линейный 255 -- явный 249 - - ^-шаговый IV, 248 - линейного поиска 267 - нестационарный 250 - Ньютона 253 - прогонки III, 293 - релаксации 253 - секущих II, 254 - сечений III, 37 - стационарный 250 - сходящийся глобально 249 - - локально 248
-	Якоби нелинейный 255
Метрика 1-177
Минимум локальный условный 171 - функции локальный II, 158 Минор базисный III
Многообразие (гладкое) 322
-	интегральное 397 - - максимальное 397 - п- мерное 322
Многообразия диффеоморфные 336
Многочлен интерполяционный Лагранжа II
-	- Эрмита кубический II Множество замкнутое 1-186, 27, 319 - компактное 1-189, 27
-	линейно связное 28
-	ограниченное 1-183, 27
-	открытое 1-181 23, 319 Множитель Лагранжа 175, 176
Модуль распределения 399
Направление главное 229
-	спуска XIV, 267
Начало пути 28
Неравенство Коши — Буняковского IV
-	треугольника 1-177, IV
Норма IV
-	евклидова IV, 21
-	кольцевая IV, 259
Нормаль главная II - к кривой в точке II -- поверхности 147
Норма матрицы индуцированная IV - согласованная IV - спектральная IV Носитель карты 312 Нуль векторной функции 247
Область 28
-	значений (изменения) функции 1-70, 32
-	определения карты 312
-	- (существования) функции 1-70, 32
-	сходимости метода 266
Оболочка 242
Окрестность точки 1-182, 25 --на множестве 319 -- проколотая 1-251, 25 Окружность на поверхности 235 Оператор линейный IV Операции линейные IV Остаточный член в форме
Лагранжа II, 110
----Пеано II, 110
Отображение гладкое 333
-	- в точке 333
----R” 308
449
Отображение индуцированное 338
- касательное в точке 364
-	матричное 33
-	перехода 313
- сжимающее 1-315, 250
Параболоид вращения III, 36
-	поверхности соприкасающийся 219
Параметр итерационный IV, 249 - кривой натуральный II Параметры тп-мерной плоскости 314
Переменное промежуточное 88
Плоскость касательная 147
-	соприкасающаяся II, 226
-	т-мерная 314
Поверхности изометричные 210
-	касающиеся в точке 218
Поверхность 193
-	алгебраическая III
-	гладкая 197
-	заданная неявно 196
-	минимальная 241
-	разрыва функции 59
-	регулярная 198
-	срединная оболочки 242
-	с самопересечением 197
-	уровня функции 36
Подалгебра 338
Подмногообразие 341
Поле векторное касающееся подмножества 384
-	- координатное 368
-	- на многообразии 367
-----гладкое 367
-	- принадлежащее распределению 398
Полюс северный 316
-	южный 316
Порядок гладкости 103
-	касания поверхностей 218
-	уравнения 1П
-	формулы Тейлора 110
Последовательность в R” 29
----расходящаяся 29
----сходящаяся 29
-	итерационная IV
-	сходящаяся по норме IX
~ Фундаментальная 1-314, 30
-	элементов множества 1-71
Поток фазовый векторного поля 382
Правило дифференцирования сложной функции II, 88
-	цепное II, 88
Предел бесконечный 1-237, 4$
-	отображения в точке по множеству 1-295
-	последовательности в R” 29
-	функции в точке 41
----односторонний 1-260
----по множеству 39
Приближение начальное 248
-	функции линейное (первое) 111
Приращение функции многих переменных частное 70
-	- полное 76
Проекция естественная касательного расслоения 363
Произведение функции многих переменных на действительное число 34
-	функций многих переменных 35
Производная конечная II
-	по направлению вектора 139
-	смешанная 97
-	функции вдоль вектора 354
450
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
Производная функции многих переменных в точке частная 69, 71
-	- полная 89
-	частная второго порядка 96
—	высшего порядка 103
-	- первого порядка 97
-	n-го порядка II
Прообраз элемента при отображении 1-70, 36
Пространство конфигурационное механической системы 330
-	метрическое 1-177
-	- полное 1-315
-	фазовое VIII
-	- расширенное VIII
Прямая в R” 314
Путь 1-202, 28 - на многообразии гладкий 343
Радиус-вектор III
Разложение определителя по столбцу III
Размерность карты 312
-	многообразия 322
-	подмногообразия 341
-	пространства линейного IV
-	распределения 394
Ранг отображения в точке 341
Распределение гладкое 397
-	касающееся подмногообразия 397
-	регулярное в точке 394
Расстояние в R” 20
-	по поверхности 235
Свойство геодезических экстремальное 239
-	инвариантное 191
Семейство, порождающее распределение 396
Сетка 282
Сеть координатных линий 232
Сечение поверхности нормальное 224
Система динамическая с управлением 427
-	координат локальная 312 — на множестве 306
-	- связанная с касательной плоскостью 215
-	нелинейная 247
-	ОДУ VIII
-	- нормальная VIII
---автономная VIII
-	с управлением 427
Соотношение секущих 255
Сплайн бикубический 293
-	- интерполяционный эрмитов 295
-	интерполяционный билинейный 282
-	- первой степени двух переменных 275
-	- степени (1,1) 282
-	кубический II, 287
-	- дважды 293
-	- естественный II, 290
-	полиномиальный 287
Структура гладкая 322
Сумма интегральная II, VII - функций многих переменных 34 Существование и единственность геодезических 239
Сфера п-мерная 22
Сходимость квадратичная 264
451
Теорема об обратной функции 132 - о неявной функции 118, 126 - - связи функции, ее предела и бесконечно малой 45
-	Родрига 233
-	Тейлора 108
-	Фробениуса 403
Тождество Якоби 387
Тор 244
Точка критическая функции II, 159 - множества внешняя 27
-	- внутренняя 1-184, 23
-	- граничная 1-184, 26
-	- изолированная 1-184, 39
-	- предельная 1-185, 38
-	округления 228
-	отображения неподвижная 1-316, 250
-	поверхности гиперболическая 221 - - неомбилическая 228
-	- омбилическая 228
-	- параболическая 221
-	- регулярная 198
-	- эллиптическая 221
-	приложения касательного вектора 345
-	разрыва функции 58
-	стационарная функции II, 159
-	уплощения 221
Точки отделимые 320
Траектория системы 427
Триангуляция многоугольника 275
Тройка точек левая 277
-	- правая 277
Узел сплайна 287
-	- бикубического 293
Умножение алгебры 338
Управление 427
-	векторное 427
-	скалярное 427
Уравнение алгебраическое III
-	дифференциальное в частных производных VIII
-	обыкновенное дифференциальное (ОДУ) VIII
-	поверхности векторное 194
-	связи 170
-	с двумя неизвестными 117
Уравнения Кодацци — Гаусса 238
-	параметрические прямой 314
-	- т-мерной плоскости 314
-	поверхности параметрические 193
-	прямой канонические III
-	n-мерной плоскости (прямой) общие 315
Условие Липшица 260
-	отделимости 320
-	условного экстремума необходимое 172
-	экстремума функции достаточное 161
----необходимое 158
Условия совместности системы дифференциальных уравнений 415
С&орма записи системы ОДУ симметричная VIII, 410
-	каноническая одношагового итерационного метода 249
-	- вторая 214
-	- первая 203
Формула конечных приращений II, 112
452
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
Формула Маклорена II, НО - Менье 226 - Тейлора II, 108 Формулы Крамера III Функция векторного аргумента векторная 31
-	действительного переменного 1-71, 5/
-	заданная неявно 116 - инвариантная 238 - координатная 32, 342 - - векторного поля 368 - Лагранжа 175, 176 - линейная IV - матричная 33 - многих переменных 31 	бесконечно большая 47 	дифференцируемая 104 	малая 45 	векторная 31 	гладкая 104 	дифференцируемая в области 76 	ТОчке 76 	локально ограниченная в точке 47 	непрерывная в области по совокупности переменных 62 	части переменных 62 	точке 52 	по переменному 61 	 совокупности переменных 61 	части переменных 61 	на множестве 53 	ограниченная на множестве 47 	при 47 	скалярная 31
Функция на многообразии гладкая 337
-	- множестве 307
---гладкая 308
---непрерывная 308
-	непрерывно дифференцируемая 86
---к раз 103
-	нескольких переменных 31
-	неявная II, 116
-	обратная 1-75, 132
-	перехода 313 - сложная 1-76, 50 - целевая 172
Частное функций многих переменных 35
Число собственное матрицы IV - степеней свободы системы 330 Член остаточный в форме
Лагранжа II, 108
Шаг ньютоновский 267
Шар n-мерный замкнутый 26 - - открытый 22
«Экстремум функции 158
-	- локальный II, 158
-	- строгий 158
-	- условный 171
---строгий 171
Элемент прямолинейный оболочки 242
Якобиан 126
е-окрестность точки 1-179, 22 - - проколотая 22
ОГЛАВЛЕНИЕ
Предисловие	5
Основные обозначения	11
Введение	17
1.	Функции многих переменных как отображения	20
1.1.	Открытые и замкнутые множества............... 20
1.2.	Функции многих переменных.................... 31
1.3.	Предел функции многих переменных ............ 38
1.4.	Непрерывность функции многих переменных ....	52
1.5.	Линии и поверхности разрыва.................. 58
1.6.	Непрерывность по части переменных............... 60
1.7.	Свойства функций многих переменных, непрерывных на компактах................................. 62
Вопросы и задачи................................. 63
2.	Дифференцируемые функции многих переменных	69
2.1.	Частные производные..................... 69
2.2.	Геометрическая интерпретация частных производных	73
2.3.	Дифференцируемость функций многих переменных .	75
2.4.	Необходимые условия дифференцируемости....	77
2.5.	Достаточное условие дифференцируемости....	83
2.6.	Дифференцируемость сложной функции ............. 86
2.7.	Дифференциал функции многих переменных....	91
Вопросы и задачи......................... 94
3.	Производные и дифференциалы высших порядков	96
3.1.	Частные производные второго порядка..... 96
3.2.	Частные производные высших порядков ........... 103
3.3.	Дифференциалы высших порядков........... 104
3.4.	Формула Тейлора......................... 108
3.5.	Дифференциалы в приближенных вычислениях	...	112
Вопросы и задачи......................... 114
454 ОГЛАВЛЕНИЕ
4.	Неявные функции	116
4.1.	Случай уравнения с двумя неизвестными........... 117
4.2.	Общий случай.................................... 124
4.3.	Обратная функция................................ 132
Вопросы и задачи................................. 137
5.	Геометрические приложения	139
5.1.	Производная по направлению...................... 139
5.2.	Градиент........................................ 141
5.3.	Касательная плоскость	и	нормаль................. 147
5.4.	Касательная и нормаль кривой на плоскости...	153
Вопросы и задачи................................. 156
6.	Экстремум функции многих переменных	158
6.1.	Необходимое условие экстремума ................. 158
6.2.	Достаточное условие экстремума.................. 161
6.3.	Достаточные условия экстремума функции двух переменных ........................................... 165
6.4.	Исследование функций на экстремум .............. 167
Вопросы и задачи................................. 169
7.	Условный экстремум	170
7.1.	Общая постановка задачи......................... 170
7.2.	Необходимое условие условного экстремума....	172
7.3.	Достаточные условия условного экстремума....	177
7.4.	Нахождение наибольшего и наименьшего значений .	186
Вопросы и задачи................................. 189
8.	Геометрия поверхностей	191
8.1.	Гладкая поверхность............................. 192
8.2.	Касательная плоскость и нормаль к поверхности	199
8.3.	Первая квадратичная форма поверхности.......... 202.
8.4.	Вторая квадратичная форма поверхности .......... 211
8.5.	Классификация точек поверхности................. 215
8.6.	Нормальная кривизна поверхности................. 224
8.7.	Главные направления и главные кривизны поверхности 228
Д.8.1.	Внутренняя и внешняя геометрии поверхности . . .	235
Вопросы и задачи................................. 243
455
9.	Численные методы решения систем нелинейных уравнений	247
9.1.	Итерационные методы решения ................ 248
9.2.	Метод Ньютона............................... 258
9.3.	Проблема глобальной сходимости ............. 265
Вопросы и задачи............................. 273
10.	Интерполирование функций многих переменных	274
10.1.	Интерполяционные сплайны первой степени...	274
10.2.	Билинейные интерполяционные сплайны........ 282
10.3.	Кубические сплайны одного переменного...... 287
10.4.	Бикубические сплайны двух переменных....... 293
10.5.	Приближение кривых и поверхностей.......... 298
Вопросы и задачи............................. 304
11.	Дифференциальное исчисление на многообразиях	306
11.1.	Определение гладкого многообразия.......... 306
11.2.	Примеры многообразий....................... 323
11.3.	Гладкие отображения многообразий........... 333
11.4.	Касательные векторы ....................... 342
11.5.	Касательное расслоение и дифференциал...... 360
11.6.	Векторные поля на многообразиях............ 367
11.7.	Фазовый поток векторного поля.............. 376
11.8.	Алгебра Ли векторных полей................. 385
11.9.	Распределения и теорема Фробениуса......... 394
Д. 11.1. Системы линейных дифференциальных уравнений в частных производных............................ 414
Д.11.2. Некоторые приложения теории векторных полей и распределений .................................... 421
Вопросы и задачи............................. 437
Список рекомендуемой литературы	443
Предметный указатель	446
Учебное издание
Математика в техническом университете Выпуск V
Канатников Анатолий Николаевич Крищенко Александр Петрович Четвериков Владимир Николаевич
ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
Редактор Е.В. Авалова Художник С.С. Водчиц Корректор О.В. Калашникова
Оригинал-макет подготовлен в Издательстве МГТУ им. Н.Э. Баумана под руководством А.Н. Канатникова
Изд. лиц. №020523 от 25.04.97
Подписано в печать 04.10.2000. Формат 60x88 1/16. Печать офсетная. Бумага офсетная № 1.
Усл. печ. л. 28,5. Уч.-изд. л. 28,87.
Тираж 3000 экз. Заказ № 6885
Издательство МГТУ им. Н.Э. Баумана. 107005, Москва, 2-я Бауманская, 5.
Отпечатано в Производственно-издательском комбинате ВИНИТИ.
140010, г. Люберцы Московской обл., Октябрьский пр-т, 403. Тел. 554-21-86
SBN
5-7038-1682-3
785703
6820