Текст
                    М. ЛАПРБ1ПЬБ8 и Л.Ж1СТЕРНЮС
О С Н О В Ы
ВАРИАЦИОННОГО
ИСЧИСЛЕНИЯ
том первый
I
СШГИ • I1KTI1 • 183:»


М. ЛАВРЕНТЬЕВ и Л. ЛЮСТЕРНИК ОСНОВЫ В А РИА Ц ИОН НОГО ИСЧИСЛЕНИЯ ТОМ ПЕРВЫЙ ЧАСТЬ I ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ Допущено Парком просо и РСФСР е качестве учебника для унилерситетол ОБЪЕДИНЕННОЕ НАУЧНО-ТЕХНИЧЕСКОЕ ИЗДАТЕЛЬСТВО НКТП СССР ГЛАВНАЯ РЕДАКЦИЯ ОБЩЕТЕХНИЧЕСКОЙ ЛИТЕРАТУРЫ И НОМОГРАФИИ МОСКВА 1935 ЛЕНИНГРАД
TJKK >*> 66 Г. А. Сухомлинова. Оформление В, Л. Зазулъсьой. Л. Л. Лртюхоеоп. Наблюдал за выпуском J1. Ж. Волкоеич. Сдано в производство 7/1V 1935 г. Подписано к печати 3/VIH 1935 г. Печ. лист, в»/* Тираж 6000/ Авг. д. 12,35/ <Гормат 62X94'/^. ГТсч. зн. в 1 бум. л. 1G8.8GU. Заказ /* 471. 1л. ред. обшет. дисц. Л* 36. Еум. л. W^V Уполном. Гларлта Н Ъ-МаШ. тмкюгр. ОНТИ имегнн Евгении Соколовой. Ленинград, лроад. Кр. Командиров» 2Э,
ПРЕДИСЛОВИЕ К ПЕРВОЙ ЧАСТИ Задачи вариационного исчисления явл5потся развитием задач о нахо- нахождении экстремума функций конечного числа переменных. Поэтому свою книгу Yio вариационному исчислению мы предполагали начать с вводной главы, посвященной функциям конечного числа переменных и их экстре- экстремумам. Но поскольку она разрослась, мы выпускаем ее в виде отдельной книжки, вводной части „Основ вариационного исчисленш!", рассматривая ее как дополнительное пособие при прохождении курса анализа на млад- младших курсах университетов и педвузов. Мы начинаем с элементов л-мерной геометрии (глава I). Геометри- Геометрические методы являются настолько основными в анализе, что навыки к ним нужно воспитывать с самого начала прохождения курса анализа. n-мерная линейная и евклидова геометрия являются первым звеном в цепи геометрических обобщений, вызванных в значительной части потребно- потребностями анализа^ обобщений, которых нам придется коснуться в следую- следующих частях книги. Некоторые специальные вопроси «-мерной геометрии, с которыми приходится иметь дело в следующих частях „Основ вариационного исчис- исчисления", мы выносим в дополнения (в том числе теорему Врауэра об инвариантной точке при отображении я-мерного выпуклого тела). Глава 111 излагает теорию экстремума функций п переменных (в гео- геометрической трактовке), глава IV •—теорию квадратичных форм в связи с исследованием поведения функций в окрестности экстремальных точек. Мы остановились на тех вопросах, которые находят развитие или при- применение в вариационном исчислении (абсолютный экстремум, множители Лагранжа-Эйлера, достаточные условия экстремума и классификация стационарных точек, экстремальная теория собственных значений квад- квадратичных форм, треугольные преобразования и т. л.). М. Лаврентьев. Л. Люстерник.
ОГЛАВЛЕНИЕ Предисловие к первой части • 3 Глава I. Элементы п-мерной геометрии 1. Линейные многообразия 5 2. Векторы и линейные операции над ними 11 ?и Линейная зависимость векторов 15 4» Линейные преобразования 17 5. Примеры л-мерных линейных пространств 20 6. Евклидово г?-мерное пространство 25 7. Ортогональные преобразования 34 8. Предельный переход в л-мерных пространствах 38 Глава II. Функции точки в п-мерном пространстве 9. Функции и диференциал 43 10. Аналитические многообразия. Криволинейные координаты 47 11. Касательные многообразия 54 12. Функция как многообразие. Стационарные точки 56 Глава III. Экстремумы функций точки п-мерного про- пространства 13. Классификация экстремумов 62 14. Теоремы Вейерштрасса . 63 15. Необходимые условия экстремума 66 16. Условный экстремум 72 Глава IV. Квадратичные формы и второй биференциал 17. Билинейные и квадратичные формы 87 18. Классификация стационарных точек дли функций двух и трех пере- переменных -. 90 19. Преобразования квадратичных форм 95 20. Главные оси квадратичной формы (вековое уравнение) 99 21. Экстремальная теория собственных значений Фишера-Куранта ... * 105 22. Аналитический критерий положительности формы 109 23. Квадратичная форма на линейном многообразии И4 24. Преобразовавне к нормальному виду с помощью треугольных пре- преобразований 116 25. Достаточные условия экстремума. Минимаксы 120 26. Приближенное нахождение точек минимума 129 Дополнение I. Целочисленные сети 134 Дополнение П. Выпуклые тела • • 137 Дополнение III. Теорема Бряуэра 142 Указатель 146
ГЛАВА I ЭЛЕМЕНТЫ л-МЕРНОЙ ГЕОМЕТРИИ § 1. Линейные многообразия /г-мерное пространство. При изучении функций одного и двух переменных мы пользуемся изображением этих функций как линий и поверхностей в пространстве двух и трех измерений. Вполне есте- естественно поэтому распространить геометрические методы на теорию функций большего числа переменных, введя соответственно понятие пространства п измерений. Для того чтобы новое расширенное понятие пространства оказалось плодотворным, при его введении старались со- сохранить те свойства пространств двух и трех измерений, которые были особенно существенны в анализе и которые настолько привычны из нашего повседневного геометрического опыта, что позволяют нам свободно обращаться с их обобщениями. Укажем еще, что понятие евклидова пространства п измерений является первым простейшим обоб- обобщением понятия пространства в цепи обобщений, с которыми нам при- придется впоследствии иметь дело при использовании геометрического метода в вариационном исчислении. Ввести понятие пространства п измерений можно двумя существенно различными путями. Первый путь такой: дополнить систему аксиом трехмерного пространства по аналогии с теми дополнениями, которые мы имели при переходе от двухмерного к трехмерному пространству; этим самым будет построена синтетическая геометрия п измерений. Второй путь состоит в том, что обобщение ведут на базе аналитической геометрии трех измерений, где точку рассматривают как тройку чисел и где всем геометрическим понятиям придана чисто аналитическая форма. Для приложений к анализу более целесообразен второй путь, тем более, что он оказывается более коротким. Назовем точкой совокупность п действительных чисел: Числа лги л:2, ..., хп называются координатами рассматриваемой точки. Чтобы отметить, что точка М имеет координаты xv х2у ..., хп, усло- условимся писать: М (х1у х2, „.., хп) или короче: М (х^. Совокупность всех таких точек образует пространство п измерений или П'Мерное пространство. Две точки /z-мерного пространства считаются совпадающими тогда и только тогда, когда каждая координата одной точки равна соответ- соответствующей координате другой точки.
6 ЭЛЕМЕНТЫ /1-МЕРНОЙ ГЕОМЕТРИИ [ГЛ. I Линейные многообразия. Простейшими образованиями в геометрии двух и трех измерений, как известно, являются линейные образования, т. е. такие, которые являются геометрическими образами линейных урав- уравнений. Такими образованиями в пространстве двух измерений являются прямые, в пространстве трех измерений — прямые и плоскости. Изу- Изучение пространства п измерений мы начнем с введения аналогичных понятий. Линейным многообразием одного измерения или прямой я-мерного пространства мы назовем герметрическое место точек, у которых все координаты суть линейные функции одного параметра t *, = */ + «* (/=1, 2, ..., я), B) где /меняется от —оо до 4"°°» а *i СУТЬ произвольные действительные числа, удовлетворяющие единственному условию, что среди чисел кг суще- существует хотя бы одно отличное от нуля. Это условие эквивалентно нера- неравенству: 2V>°- Систему уравнений B) мы будем для краткости называть уравнением рассматриваемого многообразия. При п = 2 и « = 3 мы, очевидно, получаем обычную прямую в пространстве соот- соответственно двух и трех измерений. Линейным многообразием к измерений (к ^ п) /г-мерного простран- пространства мы называем геометрическое место точек, координаты которых суть, линейные функции к параметров tv /2, ..., tv% причем каждый из пара- параметров изменяется от —оо до -f-°°: */ = *i + ^'i + a*^ + --- + e<A (' = 1,2, ..., л)> C) где сй и Оу суть произвольные действительные числа, подчиненные един- единственному условию, чтобы положение точки многообразия зависело существенно от k параметров или, иными словами, чтобы много- многообразие не могло быть представлено при помощи меньшего числа параметров. Система C) называется уравнением многообразия,. Само пространство можно рассматривать как многообразие п изме- измерений. В самом деле, если бы координаты всех точек я-мерного про- пространства выражались линейно через к параметров, где k < /г, то между этими координатами существовали бы п — k линейных соотношений и координаты не были бы независимы. ТЕОРЕМА. Для того чтобы система C) была уравнением линей- линейного многообразия к измерений, необходимо и достаточно, чтобы по крайней мере один из определителей вида D) был отличен от нуля, т. о, чтобы ранг матрицы, составленной из элементов а^, равнялся k.
§ 1] ЛИНЕЙНЫЕ МНОГООБРАЗИЯ 7 Докажем сначала достаточность этого условия. Будем считать, что аи aV2 ... alh фО, D0 а к\ и предположим противное, т. е. что многообразие C) представлено при помощи /?<& параметров тх, т2> ..., ту: В силу совпадения многообразий C) и E) будем иметь: к V; О'=1>2> • •> «)• F) Так как по предположению условие D') соблюдено, то мы можем решить систему F) относительно tf 4 = 5,+^,+^+...+4*-, 0=1,2, ..., k). F') Отсюда, так как /? < &, то, когда ^ принимают все возможные значения, точка M[tv t2, ..., th) описывает лишь /7-мерное линейное многообра- многообразие в ^-мерном пространстве tv t2, , tj.\ параметры tj не принимают всех возможных значений. Но так как в силу C) каждой точке много- многообразия C) отвечает единственная совокупность параметров tj3 то сис- система E) при всех изменениях т^ дает лишь часть рассматриваемого многообразия. Мы пришли к противоречию. Докажем теперь необходимость условия. Допустим, что все определители вида D) равны нулю. В этом случае в силу известных свойств линейных уравнений существует не более к — 1 линейных форм: (/ = 1.2, ...9k— 1), через которые выражаются линейно все остальные линейные формы: к—г ««'i + *«А + - • - + aiA = 2 Ац Mi + %Ж + ... + aijkth). Отсюда, вводя новые параметры: - - + ^А U = U 2, . •., /' < k — 1), мы получим представление многообразия C) при помощи меньшею числа параметров zl9 Xg, ..., тг. Для случая п = 3 мы имеем многообразия одного и двух измерений — соот- соответственно прямые и плоскости. Поясним для случая п = 3, k = 2 роль дополнительного условия, которому подчиняются коэфициеиты а^ системы C). Система C) примет вид:
8 ЭЛЕМЕНТЫ /1-МЕРНОЙ ГЕОМЕТРИИ [ГЛ. I Равенство нулю всех определителей D) влечет за собой здесь пропорциональ- пропорциональность козфициентов: #12 а22 а$2 Пусть теперь, например, ап не равно нулю; тогда, полагая antt -J- ant2 = ъ получим: х Таким образом система B) определяет прямую, а не плоскость. Мы дали определение линейных многообразий уравнениями в пара- параметрической форме. В некоторых вопросах бывает целесообразнее за- задавать многообразия уравнениями, в которых фигурировали бы только координаты точек многообразия. Для того чтобы получить такие урав- уравнения, достаточно, очевидно, исключить из системы C) все параметры tv Для этой цели среди я уравнений C) выбираем k таких уравнений, чтобы соответствующий определитель D') был отличен от нуля, решаем полученную систему относительно параметров tt и найденные выра- выражения этих параметров через координаты х1 вставляем в остальные п — k уравнений. Таким образом получим: \ С) Итак, всякое многообразие k измерений может быть представлено как совокупность точек, координаты которых удовлетворяют системе G). Систему G) будем тоже называть уравнением данного многообразия, ТЕОРЕМА- Для того чтобы система G) была уравнением многооб- многообразия k измерений, необходимо и достаточно, чтобы ранг матрицы (8) '"л""'/ k2 равнялся я — k. В самом деле, если один из главных определителей матрицы (8) отличен от нуля, например, -к\ * " " /* кп-к то из G) мы можем выразить п — k координат через остальные k и, принимая эти k координат за параметры, мы представим изучаемое много- многообразие в форме C).
§ 1] ЛИНЕЙНЫЕ МНОГООБРАЗИЯ 9 Если же все главные определители матрицы (8) равны нулю, то или система G) несовместна или по крайней мере одно из уравнений этой системы будет следствием остальных. В первом случае система G) дает пустое многообразие (не содержит ни одной точки), во втором случае мы можем, не изменяя многообразия, отбросить одно из уравнений сис- системы G). Составим матрицу из коэфициентов при неизвестных для п—k—1 оставшихся уравнений. Если один из главных определителей этой системы отличен от нуля, то в силу доказанной части теоремы система G) дает многообразие k-\-1 измерений. Если все главные опре- определители равны нулю, то или уравнения несовместны или одно из них является следствием п — k — 2 других. Продолжая этот процесс, мы по- получим как формулированную теорему, так и следующую, более общую: ТЕОРЕМА- Если уравнения G) совместны, то измерение соот- соответствующего многообразия равно п—г (г—ранг матрицы системы). Взаимная принадлежность многообразий. Принадлежность одного многообразия другому понимается в обычном теоретико-множественном смысле. Данная точка принадлежит многообразию, если эта точка совпадает с одной из точек многообразия. Аналогично данное много- обряаие А принадлежит многообразию Вг если каждая точка, при- принадлежащая л4, принадлежит В. Многообразие А проходит через точку В (через многообразие В)} если В (или В) принадлежит А. Пересечением двух многообразий называется совокупность точек, при- принадлежащих одновременно каждому из рассматриваемых многообразий. Пользуясь введенной терминологией, разберем ряд задач. Задача 1. Провести прямую, проходящую через две данные точки Пусть /^ + (/=1,2, ..., п) есть искомое уравнение прямой. Не нарушая общности решения, мы можем предполагать, что точки Мо и Мх соответствуют значениям 0 и 1 параметра ? Подставив в уравнение прямой вместо t значения 0,1, а вместо координат х% соответственно координаты точек М^ Aflt получим систему 2л уравнений для определения ki% ct: ^k + (i = 1,2, ..., л). Таким образом искомое уравнение прямой будет (''=1,2, ..., л). (9) Решение задачи приводит нас к результату: через две различные точки можно всегда и притом единственным образом провести прямую. Исключив t из (9), получим уравнение прямой в виде: 1 — <*1 Х2 — а2 __ _ *п — < Задача 2. Построить линейное многообразие п—1 измерения, прохо- проходящее через данные п точек MJ{aXJt ау, ..., anj) (j = 1, 27 ..., n). Пусть уравнение многообразия имеет вид:
10 ЭЛЕМЕНТЫ Л-МЕРНОЙ ГЕОМЕТРИИ [ГЛ. 1 Тогда должны удовлетворяться равенства: п = 0 (i = l, 2, ..., п) A1) Обозначим через Д матрицу системы A1): «и •• «21 -• 1 ап1 ... ап Если ранг матрицы Д равен п, то существует единственная (с точностью до постоянного множителя) система значений Ь& bi% ..., ЬЦ9 удовлетворяющая уравнению (И), т. е. единственное (л—1)-мерное многообразие, проходящее через данные точки М3-. Если же ранг этой матрицы меньше л, то существует бесчисленное мно- множество (л — 1)-мерных многообразий, проходящих через точки My. Можно общее задачу поставить так: построить линейное многообразие р измерений, проходящее через р + 1 данную точку. Решение и исследование этой задачи приводится, очевидно, к изучению некоторой системы линейных уравнений; этой задачи мы коснемся несколько ниже. Задача 3. Определить пересечение двух данных линейных многообразий. Допустим, что данные многообразия имеют соответственно измерения knp, и пусть *<о + «a*i + д<2дг2 + ... + *<«*« «0 if te h 2, ..., л—k), A2) -«</*n = 0 (/=1,2, ..., n-p) A3) их уравнения; тогда в силу определения пересечения многообразий уравнение пересечения будет: • • - + «*•** = ° V = 1> 2* .... 2л — * — р), A4) где положено: «n—jtwtz=aj/»* Если при ft + /?> л один из главных определи те лей матрицы К) A5) отличен от нуля, то пересечение многообразий есть линейное многообра- многообразие k + /7 — л измерений. Вообще при ?+/*]> л, если ранг матрицы A5) равен т, то или 2n — k—р — т уравнений системы A4) являются следствием остальных и тогда измерение пересечения равно л — т или система A4) не- несовместна; тогда пересечение пустое. В последнем случае мы скажем, что дан- данные многообразия параллельны. Если при к -\-р = п определитель матрицы A5) отличен от нуля, то рассматриваемые многообразия пересекаются в точке. Если k-\-p<in, то рассматриваемые многообразия, вообще говоря, не пересе- пересекаются. Чтобы она пересекались, нужно соблюдение добавочных условий; например, при k-\-p = n — 1 для того, чтобы пересечение было непустым, необходимо и достаточно, чтобы определитель \atJ\ (if./ = 1,2, ..., л) был равен нулю. Вернемся к простейшему случаю. Пусть k -4- р > л; положим fc-f-P — п = т, тогда A4) есть уравнение линейного многообразия т измерений, если ранг матрицы A5) будет наивысшим. Вместе с тем многообразие A4) есть пересе- пересечение многообразий A2) и A<В). Отсюда получаем такой результат: каждое линейное многообразие т измерений можно представить как результат пе- пересечения многообразий qt и q2 измерений, где qx + q2 — л = т.
§ 2] ВЕКТОРЫ И ЛИНЕЙНЫЕ ОПЕРАЦИИ НАД НИМИ 11 Остановимся еще на одном частном случае. Пусть одно из многообразий есть линейное многообразие п — 1-го измерения простейшего вида: *„ = 0. A6) Пусть +A++ (/12К) A7) есть уравнение второго многообразия в параметрической форме. Докажем, что в случае параллельности многообразий A6) и A7) т. е. координата хл для всех точек многообразия, параллельного к многооб- многообразию хп = Ол есть величина постоянная. В самом деле, допустим, что в таком случае, полагая (У =Ь2, ..., k), амельного к мне , допустим, что 0-1,2, .... k); мы получим точку многообразия A7), принадлежащую многообразию A6), что противоречит гипотезе параллельности. Задача 4. Найти условие, при котором (п— k}-мерное многообразие Ln_kt заданное в п-мерном пространстве уравнениями: п 2<Vc/S5=0 (r = 1,2,..., k). (a) заключено в (л — 1)-мерном пространстве Ln _v заданном уравнением Из принадлежности многообразия Ln_k многообразию Ln_i следует, что если система *ов удовлетворяет всем k уравнениям (а), то она удовлетворяет также уравнению (Ь). Уравнение (Ь) есть следствие уравнений (а). Отсюда по- получаем, что коэфициенты уравнения (Ь) выражаются линейно через коэфи- циеиты уравнений (а). Искомое условие запишется з виде: k aj = 2 x«*tf G = 1.2, ..., л), (с) где ).j — некоторые постоянные числа. Можно записать его также в форме тождественного равенства линейных форм: § 2. Векторы и линейные операции над ними Пусть дана прямая L: и пусть точки А(аг) и B(bt) принадлежат этой прямой: где tl912 — значения параметра, соответствующие точкам Л, В. Допустим для определенности, что tx < ?>. При этих обозначениях совокупность
12 ЭЛЕМЕНТЫ Я-МЕРНОЙ ГЕОМЕТРИИ [ГЛ. I точек прямой ?, для которых ^<;/<:^2>мы назовем отрезком прямой^ соединяющим точки А и В. Точки А и В будем называть концами отрезка. Если отрезок АВ снабдить направлением, условившись счи- считать точку А началом, а точку В концом отрезка, то такой отрезок называется направленным отрезком и обозначается АВ. Понятие направленного отрезка оказывается чрезвычайно полезным во многих областях геометрии и анализа. Направленные отрезки можно рассматривать как самостоятельные величины — векториальные величины, и по аналогии с векторной алгеброй трехмерного пространства для этих величин можно создать специальную алгебру, чрезвычайно богатую при- приложениями. Мы сейчас изложим элементы линейной векторной алгебры н-мерного пространства. Направленный отрезок АВ в дальнейшем мы будем называть векто- вектором, точку А — началом, точку В — концом вектора. Для определения равенства двух векторов воспользуемся понятием параллельного перенесения. Пусть М — некоторое множество точек. Пусть координаты х1У х2, ..., хп каждой точки множества М полу- получают приращения hu h2, ..., hn: точка (xlf x%, .,•, лгп) множества М переходит в точку (х} -\-hv xrg--f &>, .. •, x^-j-hj, где hv h^ ..., hn — постоянные числа. Множество М перейдет при этом в новое множе- множество Л|г Такое преобразование множества М в М% называется napa~i- лельным перенесением. Прямая (г=1,2,..., ft) при параллельном перемещении перейдет в прямую (/=1,2,..., п) с равными (или пропорциональными) коэфициентами kc Легко доказать, что и обратно две прямые с равными (или пропорциональными) коэфициен- коэфициентами k4 получаются одна из другой путем параллельного перенесения. Два вектора АВ и АХВХ будем считать равными, если один из них переходит в другой путем параллельного перенесения. Пусть мы имеем четыре точки: А (аи а2, ..., ап), В (bv &>, .. ¦, ^п), Аг (а/, я/, ..., О, В, (*/, Vi ..., b'n). Условием оавенства векторов АВ и АХВХ будет: а( — я,— Ь/ — Ьг или bi—а% — Ь{ — а{ (/ — 1,2, ..., л). Каждому вектору АВ можно отнести равный ему вектор, начальная точка которого лежит в начале координат. Поэтому в дальнейшем мы без оговорок будем иметь в виду такие векторы. По аналогии с векторной алгеброй двух и трех измерений будем называть компонентами вектора ОА координаты его конца А (ах, я2, •.., ап) (начало этого вектора совпадает с началом координат)^
§ 2] ВЕКТОРЫ И ЛИНЕЙНЫЕ ОПЕРАЦИИ НАД НИМИ 13 Векторы обозначаются жирными латинскими буквами a, Ь> г, ... Символ а {а19 а%> ..., ап) означает вектор с компонентами а19 а2, ¦.., ап. Если рассмотреть совокупность векторов, имеющих начальные точки в начале координат, то концы этих векторов образуют «-мерное про- пространство, а компоненты этих векторов будут совпадать с координатами их концов. Это обстоятельство дает возможность трактовать я-мерное пространство с двух точек зрения: пространство как совокупность точек и пространство как совокупность векторов. Наличие при векторной точке зрения компактной символики и возможность непосредственно оперировать с векториальными величинами дает часто преимущества второй точке зрения на я-мерные пространства. Сложение векторов. Пусть даны векторы = a(av a29 ..., дл), Построим теперь вектор АС=ОВ — Ь, начало А которого совпадает с концом вектора ОА = а. Вектор ОС назовем суммой векторов а и b и будем писать: Ос=а-\-Ь. Очевидно, компоненты вектора ОС равны: <*,-!-*, ('"=1,2, ..., я). Вообще суммой т векторов av a2, ..., аш называется вектор а. ко- который является замыкающим полигон А^АХА^ . -. Ат, 1-е звено кото- которого равно вектору Вычитание друх векторов можно определить как операцию, обратную сложению. Разностью а — Ъдвух векторов назовем векторе, который, будучи прибавлен к вектору Ь, даст вектор а. Введем понятие нулевого вектора 0, как вектора, все компоненты которого равны нулю. Вектор 0 геометрически означает выродившийся в точку вектор, начало и конец которого совпали. Очевидно: а—а = 0. Умножение вектора на вещественное число — скаляр. Дадим сейчас определение другой линейной операции—умножения вектора на скаляр. Пусть р — целое число. Назовем вектором ра сумму р векторов, равных а. Введем следующие обозначения: 1) Если ;;А = а, то обозначим: 6 = ~а. о, ш /1 \ , 2) -csswl-el (т и р — числа целые и положительные). о\ т л ш 3) а = 0 — — а. ' Р Р
14 ЭЛЕМЕНТЫ /1-МЕРНОЙ ГЕОМЕТРИИ [ГЛ. I Таким образом мы определили операцию умножения вектора на ра- рациональные числа через операцию сложения. Заметим, что если а = (а1У а>, ¦.., дп), то ра = (раи ра2, ..., рап)у - а = \^ах, - я2, ..., - ан); отсюда т (mm т \ т ( т т л т Операция умножения вектора на рациональное число сводится к умно- умножению на это число всех его компонент. Операцию умножения на иррациональное число q нельзя уже опре- определить через операцию сложения. Из соображений непрерывности на- назовем вектором qa, где q — произвольное вещественное число, вектор Операции сложения и умножения векторов обладают законами ком- коммутативности: a -f- Ь = Ь -f- a, ассоциативности сложения: (a + ассоциативности умножения: и двумя дистрибутивными законами: т) а = 1а-\- та, Справедливость этих законов вытекает из того, что действия над векторами сводятся к аналогичным действиям над их компонентами. Вопрос о коммутативности умножения вектора на скаляр не ставится, поскольку оба множителя неравноправны. Единичные векторы. Обозначим через Ai точку оси Qxv имеющую i-ю координату, равную единице, а остальные координаты равные нулю. п векторов ^ = 04, (/=1,2, ..., л) называются единичными векторами^ а их совокупность — координат- координатным крестом. Всякий вектор а (аи а»у ..., а„) выражается линейно через еди- единичные векторы: В этом легко убедиться, заметив, что *-я компонента всех слагаемых равна нулю, кроме 1-го слагаемого агер для которого эта компонента равна at.
§ 3] ЛИНЕЙНАЯ ЗАВИСИМОСТЬ ВЕКТОРОВ 15 § 3. Линейная зависимость векторов Пусть дана система т векторов а19 а2, ..., ат. Мы скажем, что вектор а линейно выражается через данные т векторов, если суще- существуют т чисел ku k2> • • ¦» К> таких, что а = kxax -f k.2a2 -f- •. • Мы скажем, что данная система т векторов ад, а2$ ..*, ам линейно независима, если, каков бы ни был вектор этой системы, его нельзя выразить линейно через остальные векторы этой системы. Число т на- называется рангом этой системы. Если среди векторов данной системы можно выделить & < /я век- векторов таких, что через них линейно выражаются все остальные векторы системы, и если нельзя выделить меньшего числа векторов, обладающих тем же свойством, то мы скажем, что векторы системы линейно зави- имЫ; а система имеет ранг k. Найдем аналитический критерий линейной независимости данной сис- системы векторов. Будем считать, что каждый вектор системы задан его координатами. Итак, пусть *-й (/=1,2, ..., т) вектор аг системы имеет координаты Условие линейной зависимости векторов данной системы можно пред- представить так: + • • • + *«А. = 0, A8) где k€ — скаляры B^2>0)« Подставляя в уравнение A8) вместо каж- каждого вектора его выражение через единичные векторы, получим: 2 *А = 2 bfyfij =2B *i<0 ej = О * КЗ t i ИЛИ ?kAj = 0 (/=1,2, ..., п). A9) Таким образом, для того чтобы данная система векторов была линейна зависима, необходимо и достаточно, чтобы система линейных уравнений A9) имела относительно kx нетривиальное1) решение. Рассмотрим отдельно три случая: 1) m > л. В этом случае система A9) имеет всегда нетривиальное решение. В самом деле, составим определитель А ап 1п Если Д равен нулю, то, положив в A9) ?, = 0 при />я, получим однородную систему уравнений с определителем, равным нулю. Такая г) Решение нетривиально, если 2 k? =f 0,
16 ЭЛЕМЕНТЫ /1-МЕРНОЙ ГЕОМЕТРИИ [ГЛ, \ система имеет нетривиальное решение; в этом случае уже первые п векторов оказываются линейно зависимыми. Если Д не равен нулю, то мы подставим в A9) ?Л+1 =1, ?, = 0 при i>n-\-\. После подста- подстановки мы получим неоднородную систему уравнений с определителем, отличным от нуля, для определения остальных ?,. Здесь мы опять полу- получаем нетривиальное решение системы A9). Таким образом всякие п -\- 1 векторов в п-мерном пространстве линейно зависимы. Отсюда мы также получаем следующий важный результат: ТЕОРЕМА. Если нам дано п линейно независимых векторов в п-мерном пространстве, то любой вектор этого пространства может быть линейно выражен через п данных векторов. Иными словами: если нам дано п линейно независимых вектороа пи а.ъ .... ай, то любой вектор а можно представить в виде: 2) /я = я. Для того чтобы система A9) имела нетривиальное ре- решение, необходимо и достаточно, чтобы определитель этой системы Д был равен нулю. Таким образом А Ф 0 является необходимым и доста- достаточным условием линейной независимости рассматриваемой системы векторов. 3) m < п. В этом случае число уравнений больше числа неизвестных, и для наличия нетривиального решения необходимо и достаточно, чтобы п — m-f-1 уравнений системы были следствием остальных, т.е. чтобы ранг матрицы системы A9) был меньше т. Таким образом наличие одного отличного от нуля определителя m-го порядка матрицы системы есть необходимое и достаточное условие линейной независимости данной системы векторов. Совокупность векторов как многообразие. Рассмотрим много- многообразие /?vn, заданное, например, системой уравнений: т *.-= 2 *< j Обозначим через А точку А(а19 а2, ..., ап); далее обозначим через Cj вектор с компонентами (aijy a^ ..., ял;). Каждый вектор АМг конец М (х1г лг^ ..., хп) которого лежит на Rm выражается линейно через су. Векторы Cj линейно независимы, ибо ранг матрицы (а^) равен т (по- (поскольку Цт имеет т измерений). Пусть, обратно, дано т линейно независимых векторов: av a2, . • ¦, ат. Рассмотрим совокупность векторов, выражаемых линейно через данные: а = к,ах + Ms + • • • + Ьтат. A9') Если начала всех векторов а% считать в одной фиксированной точке Л, тогда при всех возможных значениях kg конец вектора а опишет иеко-
§ 4] ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ 17 торое линейное многообразие /?, содержащее данные т векторов. В силу предыдущего число измерений многообразия /?, содержащего т линейно независимых векторов, не меньше т. С другой стороны, число измерений R не превышает т, так как положение точки на нем определяется т пара- параметрами кг*). Итак, число измерений R в точности равно т. Любой вектор, принадлежащий этому многообразию, выражается линейно через векторы аи а2, ..., ат. Положение любой точки много- многообразия полностью характеризуется числами kv k2t • ••, km. Совокуп- Совокупность чисел (klf fcQ, ,.., km) можно мыслить как точку или как компо- компоненты вектора пространства т измерений. Из такого представления линейного многообразия можно сразу обобщить доказанную выше тео- теорему и линейной независимости системы векторов. Пусть даны т векторов аи а2, ..., ато. Образуем линейное много- многообразие /?, составленное из концов всех векторов начала которых лежат в фиксированной точке Л. При этих обозначе- обозначениях число линейно независимых векторов среди а, равно числу изме- измерений я, § 4. Линейные преобразования Допустим, что мы имеем в «-мерном пространстве п линейно неза- независимых векторов: av a2, •••, ал. В таком случае любой вектор r(xi9 x2t ..., хп) этого пространства может быть представлен в виде: г = или, обозначая через aiU ai2f ,.., ain компоненты вектора а,: *i=se«J'i + «iiVt+ •-• +^fVn(^==l,2, ...эл). B0) Соотношение B0) каждому вектору rr (yv y2t ..., yj относит определенный вектор г (х19 х2, ..., хп). Решая систему B0) (с определителем, отличным от нуля) относи- относительно yit получим: Л = **Л + *|Л+... + *йЛ. (*в1.2 п\ B1) где Ьи есть минор определителя \аи\% получаемый из него вычеркива- 4.1 к. нием /-Й строки и у-го столбца, взятый со знаком (—1)^~ и деленный на определитель \а^\. Соотношение B1) показывает, что каждому век- вектору г отвечает также вполне определенный вектор /. Таким образом соотношение B0) устанавливает взаимно-однозначное соответствие между векторами гиК или, считая начала всех векторов помещенными в начале координат, взаимно-однозначное соответствие точек (jclf Хъ,..., хщ) и точек (yv y2t. - -, yj. Систему (^0) (переход 1 Всякая точка многообразия R есть конец вектора A9') с фиксированным началом И.
lg ЭЛЕМЕНТЫ «-МЕРНОЙ ГЕОМЕТРИИ [ГЛ. I от ^-ов к д:-ам) мы будем называть линейным преобразованием, а опре- определитель системы B0) мы будем называть определителем преобразования. Если определитель преобразования обращается в нуль, то мы ска- скажем, что преобразование вырождено. (Во всем дальнейшем мы будем иметь дело с невырожденными преобразованиями.) Линейное преобразование B1) мы будем называть обратным к пре- преобразованию B0). Всякое невырожденное линейное преобразование обладает обратным преобразованием. Линейное преобразование можно интерпретировать двумя различ- различными способами. Во-первых, можно считать, что векторы гиг' при- принадлежат двум различным я-мерным пространствам, тогда наше преоб- преобразование дает взаимно-однозначное соответствие между точками этих пространств. Во-вторых, можно числа у19 у2, ..,, уп рассматривать как новые координаты точки (х1У х.1У ..., х„); в этом случае роль коорди- координатного креста ev е2, -.., е„ будет играть система векторов а„ а2,..., ап, если их начала будем считать помещенными в начале координат. При 0S = ei новая система координат совпадает с первоначальной, и линейное преобразование превращается в тождественное преобразование: Установим ряд общих свойств невырожденных линейных преобразо- преобразований. Допустим, что в пространстве (хи дг2, ..., х„) имеем линейное многообразие т измерений L: *ю + *«Л + *я**+ ¦¦• + **«** = 0 (|ввя11 2,..., п~т). B2) При преобразовании B0) этому многообразию в пространстве (Уи У** - • • 9 У«) будет отвечать также линейное многообразие Lu зада- задаваемое системой уравнений: Покажем, что Lx будет иметь т измерений. Так как L, задано системой п — т уравнений, то оно имеет не меньше т измерений. Допустим, что Lx имеет р > т измерений. Совершая преобразование, обратное B0), мы получим снова L, число измерений которого будет не меньше /?, т. е. во всяком случае больше самого L% что невозможно. Итак, при линейном невырожденном преобразовании B0) свойства многообразия быть линейным и обладать данным числом измерений остаются инвариантными. Отсюда как следствие мы получаем еще такой факт: k линейно независимых векторов переходят в k векторов, также линейно независимых. Произведение преобразований. Пусть мы подвергаем пространство (хц л2»..., х„) линейному преобразованию B0), а затем преобразо- преобразованное пространство (у1з у2, ..., уп) подвергнем вторично линейному преобразованию % (/-=1,2, ...,п). B3)
§ 4] ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ 19 Из B0) и B3) следует: или, полагая flf^ = 2 ^<лг*г> получим окончательно: «*,• B4> Таким образом результат двух последовательно примененных линейных преобразований есть снова линейное преобразование. Преобразование B4) мы назовем произведением преобразований B0) и B3). По теореме об умножении матриц определитель произведения будет равен произведению определителей преобразований B0) и B3): Таким образом произведение двух невырожденных линейных преобразо- преобразований есть невырожденное линейное преобразование. Если B0) и B3) взаимно-обратные преобразования, то их произведение есть тожде- тождественное преобразование. Группа преобразований. Введем теперь одно новое понятие. Группой преобразований некоторых математических объектов мы наюЕем систему пре- преобразовании этих объектов в другую, удовлетворяющую следующим условиям: a) В систему преобразований входит единственное тождественное преобра- преобразование Е (т. е. преобразование, не меняющее объекта, к которому оно применено). b) Каждому преобразованию А системы отвечает единстзеиыое обратное преобразование Л. Л" называется преобразованием обратным по отно- отношению к А, если оно объект Мь полученный из объекта М путем преобра- преобразования А, переводит обратно в М. c) Последовательное применение двух преобразований А и В нашей системы дает новое преобразование С нашей системы. С называется произведением А и J5. Обозначать это произведение будем так: С=АВ. d) Произведение преобразований Q^Aaex свойством ассоциативности: А (ВС) =- (АВ) С. Легко видеть, что совокупность линейных невырожденных преобразований сбладает свойствами а), Ь), с), d), т. е. образует группу. При рассмотрении линейных преобразований — преобразований коор- координат— мы ограничились случаем, когда начало координат остается неподвижным. Для того чтобы получить общий случай, очевидно, доста- достаточно к разобранным выше преобразованиям добавить преобразования вида: Эти преобразования соответствуют параллельному переносу координат- координатного креста. Общий случай преобразования пространства можно также получить непосредственно из записи преобразования в векторной форме; для этой цели достаточно считать, что векторы г, имеют начала в начале координат (как раньше), а векторы г/ — в некоторой произвольно фиксированной точке.
20 ЭЛЕМЕНТЫ Й-МЕРИОЙ ГЕОМЕТРИИ [ГЛ. I Треугольные преобразования. Частным видом линейного преобра- преобразования является так называемое треугольное преобразование: B5) Треугольное преобразование обладает следующими свойствами: 1. В случае треугольного преобразования, а,~0 при />/, ан=1. 2. Треугольное преобразование л-мерного пространства опреде- определяется п ~ параметрами, именно коэфициентами йф где / > /. 3. Треугольное преобразование преобразует ^-мерное линейное мно- многообразие в Af-мерное же многообразие 4. При тре^тольном преобразовании последние п — k новых коор- координат yhtV Ук+2> •••» ^» выражаются только через последние же п — k прежних координат хл+1, хк+2> •••» ^п- Поэтому можно сразу же убедиться, что преобразование, обратное треугольному, есть тоже треугольное. Непосредственная подстановка дает, что произведение двух треугольных подстановок образует тре- треугольное же преобразование. Итак, треугольные преобразования образуют группу — подгруппу группы невырожденных линейных преобразований. § 5. Примеры /z-мерных линейных пространств n-мерное пространство, рассматриваемое как пространство векторов, называется л-мерным линейным или векторным пространством. Мы часто встречаемся с совокупностями элементов, над которыми можно определить линейные операции, аналогичные линейным операциям над векторами в я-мерном пространстве. Естественно поэтому рассма- рассматривать эти элементы как векторы (или точки) /г-мерного линейного пространства. Пусть дана система элементов [а], между которыми определены опе- операции сложения а-\-Ь и умножения на вещественное число (скаляр) а • kf причем результаты операций принадлежат к той же совокупности {aj. Эти операции должны удовлетворять следующим шести аксиомам: 1) а+Ь=Ь+а, 2) (a + 6) + c = a-t-F-f с), 3) (ak)l — a(kl) (k и /—скаляры), 4) (a-f-b)k=ak-\-bk, 5) a(*4-0*=e*-f a/,
§ 5] ПРИМЕРЫ /2-МЕРНЫХ ЛИНЕЙНЫХ ПРОСТРАНСТВ 21 6) существует п элементов av 0%,..., а^ таких, что все осталь- п иые элементы { а} выражаются через них линейно: а = 2 #А и не существует меньшего числа элементов, обладающих тем же свойством. Элементы аи а2,.-., ап образуют базис совокупности {а}. По- Покажем, что элементы совокупности {а} можно изобразить векторами /г-мерного пространства. Для этого докажем прежде всего следующую теорему: ТЕОРЕМА. Если элементы av о^ • • •» ап образуют базис совокуп- совокупности (а), то всякий элемент а из {а} изображается линейно через элементы аг единственным образом. Допустим, что существует некоторый элемент а из {а}, который можно представить двумя различными линейными комбинациями эле- элементов а<: Пусть, например, kx ф lv Тогда п 2 т. е. ах выражается линейно через элемент Og, a8,..., а„. В таком слу- случае в выражении любого элемента из {а} через элементы а, элемент аг можно заменить его выражением через a2, a^..., ап, а это значит, что всякий элемент совокупности {а} выражается линейно через п—1 элементов л2, Оз>---> а„, которые, следовательно, образуют базис. Мы пришли к противоречию с предположением о том, что базис нашей совокупности состоит именно из п элементов. Итак, каждому элементу а из {а} единственным образом соответствует п чисел kv k2y ..., kn таких, что а = 2 я А- Мы можем элементам аи а2,..., пп базиса отнести единичные век- векторы я-мерного пространства; тогда элементу а отвечает вектор с ком- компонентами (ku &2,..., kn). Наоборот, каждому вектору в «-мерном про- пространстве с компонентами (lv /fl,..., /J отвечает элемент: Переходу от одного базиса аи а2%..., аш совокупности {а) к другому базису отвечает линейное преобразование соответственного пространства. Пример 1. Совокупность Рп_х = {?(•*)} полиномов п— 1-й степени удо- удовлетворяет всем шести аксиомам линейного /^мерного пространства, если мы будем понимать операции суммирования и умножения на вещественное число в обычном смысле. Эта совокупность образует я-мерное линейное простран- пространство. В качестве базиса мы могли бы принять, например, полиномы 1, х, л2,..., jc»»-1. В качестве других базисов мы могли бы принять полиномы 1,
22 ЭЛЕМЕНТЫ Л-МЕРНОЙ ГЕОМЕТРИИ [ГЛ. I (х — а), {х — лJ,..., (х — а)п~х\ полиномы 1, (х — 1), (х — 1)(х — 2),..., х — с );иопииомы || —__?. , где числа av a2,..., ап различные. Формула Тейлора: или формула Ньютона: или также формула Лагранжа: _ (х — я^) где <р(дс) — некоторый полином (п—1)-Й степени, a yt(x)~ || —. г дают нам разложения элементов линейного л-мерного пространства Pn_i через элементы его базисов. Совокупность Р^ всех полиномов удовлетворяет аксиомам 1—5 линей- линейного пространства, но, очевидно, не удовлетворяет аксиоме 6: она не обладает конечным базисом. Мы могли бы сказать, что Р^ обладает счетным базисом, линейной комбинацией элементов которого (базиса) образованы все полиномы. В качестве такого базиса мы могли бы принять, например, последовательность степеней {х — л). Пример 2. Совокупность функций, являющихся решениями линейного одно- однородного диференциального уравнения л-го порядка, образует л-мериое линей" ное пространство Qw. В самом деле, понимая операции сложения и умножения на скаляр в обыч- обычном смысле, мы получаем, что линейные операции над решениями такого уравнения дают нам снова решение. Все решения выражаются линейно через п независимых решений. Через меньшее число решений может быть линейно выражено не всякое решение. Совокупность же решений линейного однородного уравнения в частных производных удовлетворяет аксиомам 1—5, но не удовлетворяет аксиоме 6: она не обладает конечным базисом. Пространства P^_t и Qw являются простейшими примерами функцио- функциональных пространств, т. е. пространств, элементами которых являются функция. В дальнейшем мы расширим понятие линейного пространства, отказавшись от аксиомы 6. Пример 3. Замечательный пример трехмерного линейного пространства дает нам совокупность всех цветов. Под суммой двух цветов будем понимать цвет, обра- образованный нх смещением, под умножением цвета на положительное число k — увеличение в k раз интенсивности цвета, под умножением на — 1 взятие допол- дополнительного цвета. При этом оказывается, что совокупность всех цветов выра- выражается линейно через три цвета: красный, синий и желтый, т. е. образует трехмерное линейное пространство. (Точнее, некоторое тело в трехмерном про- пространстве, поскольку интенсивности цветов ограничены верхним порогом раз- дражения.) Исследование этого трехмерного тела всех цветов является важным орудием цветоведения.
§ 5] ПРИМЕРЫ «-МЕРНЫХ ЛИНЕЙНЫХ ПРОСТРАНСТВ 23 Простейшие тела /i-мерного пространства. Параллелепипед, те- тетраэдр. Перейдем теперь к определению и выявлению простейших свойств геометрических фигур л-мерного пространства. При этом ради краткости изложения мы в основу положим развитую выше теорию линейных преобразований. Единичным кубом л-мерного пространства (хи х2,..., хп) назовем совокупность точек, координаты которых удовлетворяют неравенствам: При я=2 мы получаем квадрат, при я = 3— трехмерный куб. Совокупность точек, принадлежащих кубу и одному из {п—^-мер- {п—^-мерных линейных многообразий xt = c (с = 0, 1; /«=1, 2,..., «), назовем (п — 1)-мерными гранями куба. Из этого определения следует» что (п —1)-мерная грань, например: хп = О, 0 ^ xt ^ 1, i ^ п — 1, есть (я — 1)-мерный куб пространства (п — 1) измерений. Совокупность точек, принадлежащих кубу и одному из 6-мерных линейных многообразий: Cj = 0, 1; ir ф ikf если г ф s), назовем k-мерными гранями куба; при k = I назовем их еще ребрами куба и при k = 0 — вершинами куба. 6-мерная грань, например есть 6-мерный куб соответственного А-мерного пространства. Легко подсчитать, что куб обладает 2/г (я — 1)-мерными гранями, 2П~&С* 6-мерными гранями, 2п"^1-« ребрами и 2п вершинами. Общее число всех граней /г-мерного куба всех измерений, от 0 до п—1 вклю- включительно, равно 3*—1. Например, при п — 2 квадрат имеет 4 вершины и 4 ребра, т. е. 8 = 3*—1 граней; при л = 3 куб имеет 8 вершин, 12 ребер и 6 дву- двумерных граней, всего З3 — 1 = 26. Единичным п-мерным симплексом или тетраэдром назовем сово- совокупность точек, координаты которых удовлетворяют неравенствам: При п = 2 л-мерный тетраэдр обращается в треугольник. При п = 3 получаем трехмерный тетраэдр. По аналогии с трехмерным тетраэдром и подобно тому как мы ввели понятие вершин, ребер и граней для «-мерного куба, мы можем ввести понятия вершин, ребер и граней 6-мерного тетраэдра или сим-
24 ЭЛЕМЕНТЫ Я-МЕРНОЙ ГЕОМЕТРИИ [ГЛ, I плекса. Вершинами единичного тетраэдра будут служить начало коорди- координат и концы координатного креста; /г-мерный симплекс обладает п-\*\ вершиной; (п—1)-мерными гранями будут являться части симплекса, принадлежащие следующим линейным многообразиям: д—0 («=1, 2,...,л) (а) S*i = l. (а') Симплекс обладает (п -[- 1)-й (п — 1)-мерной гранью. Общее, ^-мерная грань единичного тетраэдра есть совокупность точек, удовлетворяющих системе (п — k) уравнений из системы (а) и (ал). U1 Черт. 1. Дадим теперь общее определение параллелепипеда и симплекса. Пусть нам дано произвольное невырожденное линейное преобразование: ^( = ^ + Vi + V2+"-+Vn (i=l,2f...,я), B6) при условии: 1**1*0 (*,У=1, 2,-.., я). Это преобразование, как мы видели выше, устанавливает взаимно-одно- взаимно-однозначное соответствие между точками пространств (хи х&..., хп) и (fi* *2>-*-> 'п)- я-мерным параллелепипедом (симплексом) назовем сово- совокупность точек пространства (xlf x&. #., хп), в которые переходят при преобразовании B6) точки единичного куба (симплекса) пространства
§ 6] ЕВКЛИДОВО tt-MEPHOE ПРОСТРАНСТВО 25 Вершинами, ребрами, ^-мерными гранями параллелепипеда (сим- (симплекса) называются точки, отрезки, куски линейных многообразий, в которые при преобразовании B6) соответственно переходят вершины, ребра и грани единичного параллелепипеда (симплекса). В силу свойств линейных преобразований все ребра суть отрезки прямых, 6-мерные грани суть куски 6-мерных линейных многообразий, ограниченные (k—1)-мерными многообразиями. Для более наглядного геометрического представления л-мерного параллеле- параллелепипеда возьмем четырехмерный единичный куб и изучим его пересечения с се- семейством линейных трехмерных многообразий: xl + x2 + x3 + x4^k. B7) При каждом значении h многообразие B7) будет являться трехмерным пространством. Определим вид частей куба, которые будут попадать в эти про- пространства при различных значениях Л. При h = 0 начало координат будет един- единственной точкой куба, принадлежащей B6). При 0 < h <; — многообразие B7) будет пересекаться с четырьмя гранями куба; таким образом в сечении мы бу- будем получать тетраэдры, размеры тетраэдра будут увеличиваться с возраста- 1 3 нием h (черт. 1). При "о'<<С*<С~о" многообразие будет пересекаться с во- о семью гранями куба, в сечении получим октаэдры. При -д- <! h < 2 будем иметь снова тетраэдры, которые при h = 2 выродятся в точку. § 6. Евклидово я-мерное пространство До сих пор мы не вводили понятия расстояния между точками «-мерного пространства; предложения, доказанные в предыдущих пара- параграфах, не зависят от этого понятия. Понятие „расстояние между точ- точками41 л-мерного пространства („метрику" «-мерного пространства) можно ввести различными путями. Длина отрезка. Мы остановимся пока на так называемой евклидо- евклидовой метрике. Расстоянием г (Ау В) между точками А (а1ш а2,..., aj) и Я(* *2>'-м *«) мы будем называть число г (А, В) = V(PX - at Длиной отрезка АВ мы будем называть расстояние между его кон- концами, л-мерное пространство с такой метрикой называется евклидовым п-мерным пространством* Длина отрезка остается неизменной при параллельном перенесе- перенесении. В самом деле, если отрезок АВ переходит при параллельном пере- перенесении в отрезок AlB!\ где A(av flg,.,., то поэтому B9)
ЭЛЕМЕНТЫ П-МЕРНОЙ ГЕОМЕТРИИ [ГЛ. I Сфера, п-мерной сферой радиуса г с центром в точке 2 ¦• евклидова пространства называется совокупность его точек М(xv хъ.. .,*»)> расстояние которых от Л меньше г. Координаты *i> ^-••> хп точек такой сферы удовлетворяют неравенству: Граница этой «-мерной сферы, т, е. совокупность точек евклидова пространства, удаленных от точки А на расстояние г, называется (п — 1)-мерным сферическим многообразием. Координаты его точек удовлетворяют уравнению: Диаметр. Пусть М есть произвольное множество точек. Мы назы- называем диаметром множества М верхнюю границу расстояний между его точками. Для сферы диаметр равен удвоенной длине радиуса. Для куба — длине диагонали, соединяющей противоположные его вершины. Норма вектора. Длину вектора мы будем называть его нормой, В силу предыдущего нормы равных векторов равны между собою. Норма вектора а обозначается символом || а||. Если то В самом деле, если начало вектора а = О А находится в начале коор- координат О, то конец его А имеет координаты аи fl^,..., а.л и, следова- следовательно, его длина определяется формулой C1). Нормы векторов обладают двумя основными свойствами: 1. Норма суммы двух векторов не превосходит суммы их норм (одна сторона треугольника не превосходит суммы двух других) II <* + * ll^ll «II+ 1*|. C2) 2. При умножении вектора на вещественное число норма умножается на абсолютную величину этого числа: ВАв|| = |Л|- ||а|. C3) Второе свойство доказьгеается непосредственно. Первое вытекает из неравенства Шварца *): %x\*A\^}f %xa? -\f %*?- 1) Оно является частным случаем неравенства Минковского, доказанного ниже, см. задачу 5 § 16.
§ 6} евклидово п мерное пространство 27 В самом деле: <=1 *=l r <=1 <=1 П n n n Отсюда в силу неравенства Шварца Свойства 1—2 являются фундаментальными свойствами норм векто- векторов, поэтому при построении более общей метрики мы позаботимся о сохранении этих свойств. Углы между векторами. В евклидовой «-мерной геометрии мы мо- можем ввести также понятие угла между двумя прямыми. Пусть даны два вектора а и Ь, расположенные соответственно на прямых: >, (*=1, 2,..., я), C4) A=1, 2,...у п), C5) причем начала обоих векторов отвечают меньшим значениям параметра, а концы / —большим. При этих условиях углом между векторами а и Ь назовем угол <р, меньший или равный тг, косинус которого опреде- определяется по формуле: п cosъ = cos (а, Ь) =—r- *=1 . C6) Эта формула является естественным обобщением известной формулы из аналитической геометрии пространства двух и трех измерений. С формальной точки зрения такое определение возможно, ибо выраже- выражение, стоящее справа, при любых значениях kt и k/ заключено между — 1 и 1. Углом между прямыми C4) и C5) будем называть или угол о или его дополнение до тт. Если v — О или ? = я, то kt пропорциональ- пропорциональны ft/; прямые C4) и C5) параллельны, причем в случае <р = 0 будем говорить, что векторы одинаково направлены, а в случае о = ъ они противоположно направлены *). Если cos о — О, то мы будем говорить, чго наши векторы (прямые) взаимно-перпендикулярны. Таким образом условие параллельности будет: ftt = Ik/, I = const. и условие перпендикулярности будет: 1 !) Равные векторы можно определить как параллельные векторы, одинаково направленные и имеющие равные нормы.
28 ЭЛЕМЕНТЫ И-МЕРНОЙ ГЕОМЕТРИИ [ГЛ. I Задача 1. Через данную точку Л (аг) провести прямую, пересекающую под прямым углом прямую, заданную уравнением: x^kt+bt. C7) Пользуясь решением задачи 1 § 1, построим прямую, проходящую через точку А и через произвольную точку данной прямой JL Искомая прямая будет х, - а% = -с (*,* + Ъ% - с,), C8) где % есть текущий параметр для искомой прямой, a t есть значение параметра данной прямой, соответствующее той точке, через которую мы проводим пря- прямую. В самом деле, при х = 0 имеем х% *=atf прямая проходит через данную точку А; при <с = 1 имеем x%^kit-\-bit прямая проходит через точку прямой ?. Давая / в уравнении C8) всевозможные значения, мы получим все возмож- возможные прямые, проходящие через А и пересекающие JL Нам остается таким обра- образом найти то значение t, при котором прямая C8) будет перпендикулярна пря- прямой L. Для этой цели воспользуемся условием перпендикулярности: Решая это уравнение относительно U получим: SV ' Отсюда, вставляя найденное значение t в уравнение C8), получим уравнение искомой прямой: Замечание. Проделанные вычисления показывают, что разобранная за- задача всегда имеет единственное решение, кроме случая, когда точка А принад- принадлежит данной прямой L. В этом случае уравнение C8) дает или прямую L или теряет смысл (если t принимает значение, соответствующее точке А)* Если А принадлежит/-, то всякая прямая, проходящая через точку Л, будет пересекать L, благодаря чему одно условие задачи (искомая прямая пересекает L) отпа- отпадает и задача становится неопределенной. В самом деле» в этом случае любая прямая № + (/ = 1,2,..., л), C80 коэфициенты которой удовлетворяют условию 2W~<* C9) будет удовлетворять всем условиям задачи. / Найдем, что будет собою представлять совокупность прямых C8), удовле- удовлетворяющих условию C9). Допустим, что kv 4= 0, тогда из C9) найдем: *1 <2 Подставляя найденное выражение в систему C8), мы получим, считая ^з'» V» • • • 9 Кх произвольными, совокупность всех прямых, проходящих через точку А и перпендикулярных данной прямой L. Эта совокупность будет зави- зависеть от (п — 1) параметров. Для того чтобы определить геометрическое место этих прямых, достаточно в системе C8') считать ty = ?jr, 2<у<я за иеза. ьисимые параметры, тогда система C^)'будет уравнением искомого геометри- геометрического места — это будет линейное многообразие (я — 1) измерения, проходя-
§ 6) евклидово «-мерное пространство 29 щее через точку А и такое, что всякая прямая, ему принадлежащая, будет ортогональна к прямой L. Приведенное замечание можно положить в основу следующего важного определения: мы скажем, что данная прямая L ортого- ортогональна данному линейному многообразию Rn~x (л— \)-го измерения, если всякая прямая, принадлежащая Rn__lf будет перпендикулярна к прямой Lt Задача 2. Через данную точку А (а{) провести (п — 1)-мерное многообра- многообразие, ортогональное данной прямой: (/=*!, 2 /2). Допустим, что &Аф0, тогда в силу сделанною выше замечания уравнение искомого многообразия будет: 1 п ГЁ**-1+а19 (/-14. ...я) D0) где tyO^b 2,..., л— 1) суть параметры. Исключая из системы D0) пара- параметры у, мы получим уравнение искомого многообразия (л—1) измерения в следующей форме: 2 *|<*|-«¦>*=<>. Из решения этой задачи получается следующий критерий ортогональности прямой и (п — 1)-мерного многообразия: Для того чтобы прямая (/ = 1,2,..., п) была ортогональна многообразию: необходимо и достаточно, чтобы Задача 3* Определить углы, которые образует произвольная прямая Ел лг^/^ + б, (/=1, 2,..., л) с осями координат. Б силу формулы C6) получаем: cos (L, лг,) = -~-А 9 D1) Величины cos(L, x4) (/=1, 2,-,., п) носят название направляющих косинусов для L. Имеем: 2 со#11.хд = 1. D2 Пользуясь D2), по данным (п — 1) направляющим косинусам и знаку п-го можно определить л-й направляющий косинус. Заметим, что в силу D1) направляющие косинусы пропорциональны коэфи- цнентам kit поэтому уравнению прямой L можно придать иид: В этой форме параметр х имеет простой геометрический смысл. Если мы через В обозначим точку с координатами: ёи Ь9,..., Ъп, я через Вх — точку
30 ЭЛЕМЕНТЫ Л-МЕРНОК ГЕОМЕТРИИ [ГЛ, I прямой L, соответствующую заданному значению параметра т, то % есть длина отрезка прямой ВВ7, заключенного между точкой В и точкой #т. Задача 4* Определить угол yt между вектором a (av а2*..., ап) и осьюхг. Обозначим через А(аи а2 ан) конец вектора ОА~а. Уравнение пря- прямой, на которой лежит этот вектор, будет: *,= <!,* (i-=U 2,..., п) (точки О н А отвечают соответственно значениям параметров 0 и ]). В силу формулы D1): /у. D3) Проекции* Допустим, что в пространстве дана точка Л и прямая ?» Ортогональной проекцией или просто проекцией точки Л на пря- прямую ? называется точка пересечения прямой с линейным многообразием (я—1)-го измерения, проходящего через точку А и ортогонального к примой L. .—>. Допустим теперь, что дан вектор а — Аб и дана ось L, т. е. пря- прямая, снабженная направлением, Пусть Av Bx суть соответственно проек- --> ции точек Л, В на прямую ?,; проекцией вектора АВ на ось ?: АВ мы назовем длину отрезка AlBv взятую со знаком плюс или минус в зависимости от того, совпадает ли направление вектора АгВх с выбранным направлением на прямой L или ему противоположно. Отметим следующую важную формулу: npj-a —[a[;cos(jL, a\ D4) В самом деле, обозначая через с% и c%-\-k% координаты точек А я Ву через cl и ^/ -¦}-*/—координаты их проекций Л1 и /5Х на ?, мы получаем уравнение прямой, содержащей вектор а: и уравнение прямой L: Равенство D4), которое нам нужно доказать, примет вид Для доказательства этого равенства составим уравнения многообразий,, ортогональных к Л и проходящих соответственно через точки А и В: 2*/(*, — ^«О,^*/^ —** —*<) = ° 0"=1, 2s--m л)- Так как точки ^ (с/) и^^-f/i;/) принадлежат соответственно этим многообразиям, то 2 V (*«'— ^) == о,
§ 6] ВВКЛИДОВО Л-МБРНОЕ ПРОСТРАНСТВО Вычитая почленно из первого равенства второе, получаем: Это доказывает равенство D5). Задача 5- Найти проекции вектора a (at> а<^ ,.., ап) на оси xt> Обозначив через <?t угол между а и осью xtf получны (см. задачу 4): Следовательно, Компоненты вектора а суть его проекции на оси коордншт. Основной теоремой в теории проекций является предложение о про- проекции полигона. Пусть нам даны т некторов, расположенных так, чта конец /-го вектора совпадает с началом /-j-1-го, т. е. данные т век- векторов образуют пространственный полигон. Если через Л обозначить начало вектора аи а через В обозначить конец вектора ат, то век- вектор ЛВ мы будем называть замыкающей данного полигона. При этих обозначениях имеет место следующая теорема: ТЕОРЕМА. Сумма проекций векторов, образующих полигон, на произвольную ось равна проекции замыкающей на ту же ось; Мы не приводим доказательства этой теоремы, ибо оно почти пол- полностью совпадает с обычным доказательством этой теоремы для случая ппостраиства трех измерений, В приложениях теории проекций часто приходится иметь дела с проектированием векторов не только на прямые, но также на линей- линейные многообразия разного числа измерений. Мы ограничимся здесь лишь простейшим случаем проектирования на многообразия (п—1)-го измерения. Проекцией тонки А на данное линейное многообразие/, (п—1)-го измерения называется точка пересечения данного многообразия L с прямой, проходящей через точку А и ортогональной многообразию L. Геометрической проекцией вектора АВ на данное линейное много- многообразие L называется вектор А^Би начало Л1 и конец Вг которого суть соответственно проекции на L начала А и конца В данного век- вектора. Норма пектора AtBx называется длиной проекции или просто проекцией. Внутреннее произведение векторов. По аналогии с векторной алгеброй двух и трех измерений определим для двух векторов «-мер- «-мерного пространства операцию внутреннего умножения. Внутренним произведением двух векторов а и Ь называется произ- произведение их норм на косинус угла между ними. Внутреннее произве- произведение а и Ь обозначается символом ab. Итак: ab - || а ||. ||ft [cos (а, 6). D6)
32 ЭЛЕМЕНТЫ «-МЕРНОЙ ГЕОМЕТРИИ [ГЛ. Имеем: nb ==s buy n (b —{— С)гг==: иЬ-^—ис» Первое равенство очевидное. Остановимся на втором. В силу формулы D4) и определения внутреннего произведения имеем: а6= || а || . || Ъ || cos(a,6) = т. е. внутреннее произведение есть проекция одного вектора на дру~ гой, умноженная на норму того вектора, на который проектируем. ab -|-ш7= || а || (nptf&-f-npa r Выражения справа равны в силу теоремы о проекции полигона; этим самым дистрибутивный закон доказан. Ассоциативный закон, как и в случае трехмерного пространства, для внутреннего произведения в общем случае неверен. В самом деле, век- вектор (ab)c параллелен вектору с, тогда как вектор a (be) параллелен вектору и. Внутреннее произведение вектора а на самого себя равно квадрату его нормы: aa = П a II 2 Внутреннее произведение двух ортогональных векторов равно нулю (так как косинус угла между ними равен нулю). В частности j 0, если «фу; * 3 \ 1, если i =y. v 7 Единичные векторы е,- имеют нормы, равные единице, и все они попарно друг другу ортогональны. Внутреннее произведение векторов a(ava2? . ¦ *>ап) и b(Jbvb^.. -A) выражается через компоненты сомножителей так: ab = axbx -\- аф% -|- • • ¦ + ajbn. D9) В самом деле: 1,п В правой части равенства все члены при /фу пропадают в силу D8), а члены при i—j равны аД. Дадим сейчас новые формулы для угла между векторами. В силу D6) или в развернутом виде: cos (с, Ь) ¦¦
§ 6] ЕВКЛИДОВО /Z-МЕРНОЕ ПРОСТРАНСТВО 33 Задача 6. Дан вектор а и точка В (bi% Ы, ..., Ьп)% Через точку В требуется провести многообразие (п — I)-го измерения, ортогональное к вектору а. Обозначим через b вектор ОВ. В силу определения ортогональности, какова бы ни была точка Я искомого многообразия, имеем: Отсюда, полагая ОР~г, будем иметь: arr^ab или а (г — Ь) = 0. E0) Геометрическое место конца вектора, имеющего начало в начале координат^ и удовлетворяющего уравнению E0), есть искомое многообразие. Уравнение E0) есть уравнение этого многообразия в векторной форме. Чтобы получить урав- уравнение в обычной форме, достаточно представить выражения векторов через их компоненты и воспользоваться формулой D8). Дадим теперь критерии линейной представимости вектора а через векторы а,-(/=1,2, ..., п). Для этой цели решим предварительно следующую задачу. Задача 7. Определить совокупность векторов, ортогональных каждому из векторов a, (i = lf % ..., т\ т < п) системы т линейно независимых векторов. Обозначая через г произвольный вектор искомого семейства векторов, будем иметь: гщ = 0 (/ = 1,2, ..., т) или, обозначая через г, (/=1,2, ...,«) компоненты вектора г, последнее г авен- ство можно записать так: rn =~ 0 (/ = 1, 2, ..., т). E1) В силу линейной независимости векторов а^ один из определителей /и-го по- порядка матрицы (а^) отличен от нуля, пусть это будет определитель Д, соста- составленный из первых т столбцов. При этом условии мы можем решить систему E1) относительно rt, к2, ..., гш: r,= --f '-+1 -%¦ '*+*-• • — -<1'V» «-1. 2....,т), где Д,у есть определитель, который получается из определителя Д, если в нем г-ю колонну заменить (т+_/)-й колонной матрицы (a{j). Отсюда заключаем, мчо если начало вектора г закрепить, то положение tiv конца будет зависеть от in — т) параметров, иными словами, конец вектора г опишет линейное мно- многообразие (я — т) измерений. Таким образом существует п — т линейно неза- кнеимых векторов rv rQ1 ..., r/3l_w, ортогональных к векторам аи а& ..., ст; всякий вдошр г, ортогональный всем векторпм щ, есть линейная комбинация векторов rjif—1,% ..., л — /я). Построенную систему векторов: называть сопряженной с системой а = k^ + Ms -Ь ... + kmam. E3i Легко видеть, что если система векторов Г сопряжена с системой векторов а, то и, обратнОд система а Сопряжена с системой г. Пользуясь выявленным свойством сопряженных систем, мы можем теперь дать критерий представимости вектора а через векторы ак Для представимости вектора а через векторы п* необходимо и доста- достаточно > чтобы а был ортогонален всем векторам системы, сопряженной с системой а{.
34 ЭЛЕМЕНТЫ Я-МЕРНОЙ ГЕОМЕТРИИ [ГЛ. I § 7. Ортогональные преобразования Среди линейных преобразований особо важную роль в евклидовой геометрии играют так называемые ортогональные преобразо- преобразования. Мы скажем, что преобразование E4) или п ^ = 2^^ (' = 1. 2> • • •> я) E5) ортогонально, если векторы а, друг другу ортогональны и их нормы равны единице, т. е. если A при / = /, 0 „р„ ,+,. <» Покажем прежде всего, что всякое ортогональное преобразование есть не вырожденное. В самом деле, в противном случае векторы а, должны быть линейно зависимы: 2** = 0 B**2ФО). E7) Умножая E7) на а» в силу E6) получим: а это противоречит предположению линейной зависимости. Общее линейное преобразование зависит от п2 произвольных пара- параметров; выясним, от какого числа параметров зависит ортогональное, преобразование. Нормы всех векторов аг заданы, следовательно, мы можем задать только их направления. Направление аА можем взять произвольно; получаем (п—1) параметр. Вектор а2 должен принадле- принадлежать многообразию (п — 1) измерений, ортогональному к at; при выборе вектора а2 мы получаем еще (п — 2) произвольных параметра. Век- Вектор аь должен быть ортогонален векторам ах и а^у следовательно, дол- должен принадлежать многообразию (п — 2) измерений, получаем еще (я — 3) произвольных параметра. Продолжая это рассмотрение, окон- окончательно получим, что общее число произвольных параметров, опреде- определяющих ортогональное преобразование, равно (п—1)-{-(п—2)-]-«.. ...-}- 1 = ~->?-"I-i. To же самое число независимых параметров мы получим, если заметим, что п2 коэфициентов преобразования связаны уравнениями E6), число которых равно п-\- П ^ ; имеем: „2 „ я(я—1) _ п{п—\) п —п 2 - ^ . Умножим левую и правую части уравнения E4) на а{у тогда, поль- пользуясь E6), получим: гаг=уг или л = 2^ Гаким образом при ортогональном преобразовании матрица обратного преобразования получается из матрицы прямого заменой строк ко-
§ 7] ОРТОГОНАЛЬНЫЕ ПРЕОБРАЗОВАНИЯ 35 лоннами. Отсюда определитель преобразования равен определителю обратного преобразования. Так как произведение этих определителей в случае любого преобразования равно единице, то, следовательно, определитель ортогонального преобразования равен г±1. В заключение заметим еще одно чрезвычайно важное свойство ор- ортогональных преобразований. Пусть имеем два вектора г0 (х^°\ х^\..., хпЩ и гг (*/*>, х<^\ ..., xnW)f которые при ортогональном преобразовании E4) переходят в векторы: Ы (Л(о)> Лто. • • • • ^@)) и г/ (уД A) ( В силу E4) имеем: отсюда г, - /о = 2 «,(*,» - *,@)) = 2 «, (Л*> -Л(о)) E8) или 2 ef (*,« - д.-/0)) = 2 «, (у,« -л@))- Возводя правую и левую часть в квадрат, получим: или Таким образом длина отрезка есть инвариант ортогонального преоб- преобразования. Добавим к векторам г0 и /\ векторы г2 и г8, аналогично предыду- предыдущему будем иметь: E9> Перемножая почленно равенства E8) и E9), получим: = (гв' —гй0(г/ —го'), F0) т. е. произведение двух векторов есть инвариант ортогонального пре- преобразования. Отсюда мы заключаем, что углы также суть инварианты ортогонального преобразования. Доказанные свойства ортогональных преобразований дают право счи- считать эти преобразования я-мерного пространства полным аналогом пре- преобразования прямоугольных координат двух и трех измерений. Заметим в заключение, что ортогональные преобразования образуют группу — подгруппу группы невырожденных линейных преобразований. Задача 8. Доказать, что .шнейное преобразование, переводящее сфери- сферическое многообразие ^ х?~ 1 само в себя, есть ортогональное преобразование. На основе этого предложения можно определить ортогональное преобра- ювание как линейное преобразование, при котором единичная сфера 2*42==1 переходит сама в себя, и отсюда вывести все отмеченные нами выше свойства ортогональных преобразований. Мы предоставляем это сделать чита- читателю в виде упражнения.
36 ЭЛЕМЕНТЫ tt-МЕРНОЙ ГЕОМЕТРИИ [ГЛ. I Обобщение ортогональных преобразований. Рассмотрим теперь преобра- преобразование, оставляющее инвариантным более общее многообразие второго порядка: т. е. преобразующее форму F — ^tyf в форму Пусть среди коэфициентов lj имеется k положительных: lj = т/ (/ < к), а остальные отрицательные ^= — Р? (У>#)- Лри этих обозначениях: Таким образом, если положить г^ при j < Л, Uj при У > Л (/ = и аналогично = Vj при У < Дг, Vf при то формы /-' и Ft перейдут в единичные формы и наша задача этим самым формально приводится к ортогональному преобразованию. Совершая над пе- переменными Uj произвольное ортогональное преобразование, переводящее их б переменные Vj, а затем возвращаясь к переменным Xj и yjt мы получим искомое преобразование. Заметим, однако, что если ортогональное преобразование, переводящее и}- в Vj, будет обладать действительными коэфициентами, то искомое преобразо- преобразование Xj в У; (если ?<л) будет обладать мнимыми коэфициентами. По этой причине, чтобы получить преобразование с действительными коэфициентами, мы произведем над переменными Uj ортогональное преобразование с комплекс- комплексными коэфициентами и полученным более широким произволом воспользуемся так, чтобы преобразование Xj было действительным. Итак, пусть есть ортогональный определитель с комплексными элементами — коэфициентами преобразования. Исключение вспомогательных переменных и и v дает нам преобразование: * п-к 2 S i 0 < г к п-к iprxr = 21 VW + '* 2 Ji i
§ 7] ОРТОГОНАЛЬНЫЕ ПРЕОБРАЗОВАНИЯ 37 Если мы хотим, чтобы вещественные )'j переходили в вещественные же х^ и наоборот, то мы должны потребовать, чтобы числа arj- и drj были веще- вещественны, а числа brj и crj- — чисто мнимыми. Обозначив: (все Arj, Bt , Сф D • — числа вещественные), получим нужное нам преобра- преобразование: к п-к п-к Найдем теперь необходимые и достаточные условия, которым должны удо- удовлетворять коэфициенты А, В, С% D искомого преобразования. В силу ортогональности определителя Д имеем: л-ft —ft A> = ° при r+ Заменяя a, ^ r, d через Л, В, С, D, получим искомые условия: к п — к L >i j. у 1 ~ л I PS 3 J п-к
38 ЭЛЕМЕНТЫ П-МЕРНОЙ ГЕОМЕТРИИ [ГЛ. I D специальном принципе относительности применяется, например, преобра- преобразование, не меняющее вида формы: т. е. преобразующее трехмерный гиперболоид *2 + У2 + Z2 — ?& = COnst. сам в себя (так называемое лоренцово преобразование). Рассмотрим частный случаи этого преобразования: хг = ах + bt, tt = atx Наше преобразование должно переводить форму х- — г2/2 в форму х? Следовательно: et -  - *. 1 aax — hhi *=* 0. Полагая: мы можем выразить все коэфициенты любого искомого преобразования в зависимости от одного параметра s: ^^~—?==^^J bx = rt -—- § 8. Предельный переход в «-мерных пространствах В настоящем параграфе мы рассмотрим те основные понятия, кото- которые связаны с предельным переходом в /г-мерном пространстве Rn. Мы будем говорить для определенности об евклидовом пространстве, но эти понятия механически переносятся на другие «-мерные про- пространства, с которыми мы встретимся в будущем. Именно эти понятия лежат в основе теории непрерывных функций в /г-мерных простран- пространствах. Как мы увидим ниже, современная математика строит простран- пространства значительно более общей природы, в которых эти понятия и их основные свойства сохраняются. Тем самым нам удастся перенести на более общие пространства теорию непрерывных функций. Область* Множество точек /г-мерного пространства назовем областью, если для любой точки А Зтиго множества существует и-мерная сфера с центром в точке А, целиком принадлежащая рассматриваемому мно- множеству (черт. 2). В качестве примера области может служить любая и-мерная сфера, содержащая данную точку.
§ 8] ПРЕДЕЛЬНЫЙ ПЕРЕХОД В Я-МЕРНЫХ ПРОСТРАНСТВАХ 39 Окрестность. Понятие области дает возможность ввести еще одно понятие, исключительно важное для дальнейших обобщений понятия про- пространства, именно понятие окрестности. Окрестностью точки А я-мер- ного пространства называют любую область, содержащую точку А, например сферу с центром в Л. В дальнейшем без оговорок мы под окрестностью точки А будем понимать именно сферу с центром в А (черт. 2). Предельная точка. Точка А называется предельной для множества М точек л-мерного пространства /?л, если любая окрестность точки А содержит точку множества М, отличную от точки А. Пусть, например, множество М есть совокупность всех точек про- пространства Rn с рациональными координатами. Тогда любая точка про- пространства Rn есть предельная для М. Точки предельные для точек области, но не принадлежащие области, называются граничными точками области. Граничные точки области образуют границу области. Область вместе с границей называется замкнутой областью или телом. Например, границей сферы будет служить сферическое много- многообразие (п—1)-го измерения 2(*, —eJ8-»/*. V_^^ Черт. 2 Границами «-мерных параллелепипеда и тетраэдра будут являться со- совокупность их граней меньшего числа измерений. Замкнутым множеством называется множество, содержащее все свои предельные точки. В качестве примера заметим, что любое «-мерное линейное многообразие в пространстве Rn замкнуто. ТЕОРЕМА 1. Замкнутая область есть замкнутое множество. В самом деле, пусть Qx — некоторая область л-мерного пространства, a Q2 — ее граница; тогда Q=zQt-\-Q2 есть замкнутая область. Пусть теперь точка А есть предельная для Q. Каждая окрестность V точки А содержит хоть одну точку В из Q (В ф А). Возможны два случая: 1) точка В принадлежит области Qv 2) точка В принадлежит границе Q2- Докажем, что и во втором случае окрестность U содержит точку области Qv В самом деле, в этом случае существует окрестность Ui точки В (черт. 3), которая целиком вместе с В принадлежит ?/, причем эта окрестность не содержит точки А 1). Так как по предположению В есть точка границы ©2, т. е. точка предельная для точек области Ql9 то окрестность Ux точки В содержит по крайней мере одну точку С *) Пусть U есть сфера радиуса е с центром в точке А; г (А, В) —с, где ?<?. В качеств окрестности Vv можно пыбрать сферу радиуса меньшего, чем с — с, описанную вокруг точки В.
40 ЭЛЕМЕНТЫ «-МЕРНОЙ ГЕРМЕТРИИ [ГЛ. I области Qv Точка С попадет вместе с тем в объемлющую окрест- окрестность U точки Л. Итак, во всяком случае окрестность U точки А со- содержит отличную от Л точку области Qim Так как окрестность U была выбрана произвольно, то А является предельной точкой для области Qv Если А не принадлежит Qv то она принадлежит границе Q2, так что А принадлежит замкнутой области Q. Итак, замкнутая область Q содержит всякую свою предельную точку, т. е. является замкнутым множеством. Предел последовательности. Точка А называется пределом для последовательности точек Av Л2,..., Ар,..., если любая окрестность точки А содержит почти все точки нашей последовательности, т. е. все кроме, быть может, конечного числа. Мы пишем: lim Ap = А. р->со Говорят также: Ар сходится к А. Очевидно, если lim Л =i4, то р->со F lim г (Л, Л ) = 0. В самом деле, каково бы р->со г ни было положительное число г, почти все точки Ар попадут внутрь сферы радиуса г, описанной вокруг Л, поэтому для почти всех Л • * г(Л,Л,)О, откуда Черт. 3. lim r(A,Ap)=Q. р -*• -о Сходимость последовательности точек Ар к точке Л означает сходи- сходимость всех координат точек Ар к соответственным координатам точки Л. Последовательность Коши. Последовательность точек Аи Л^... Аш ... называется последовательностью Коши, если, каково бы ни было число е > 0, найдется такое число Р, что коль скоро т и /; больше Р. (Расстояние между членами последова- последовательности с достаточно большими индексами может быть сделано сколь угодно малым.) ТЕОРЕМА. Если последовательность точек п-мерного пространства Лр Л2,..., Ат9... есть последовательность Коши, то она сходится к некоторой точке А 1). В самом деле, пусть координаты точки Лм суть: ам а{т) а'т) Имеем: I ^Н)-4Р)\^г(Лш9 Лр) (i= i, 2,... , п), 1) Эта теорема есть прямое обобщение критерия Коши для числовых по- последовательностей.
§ 8] ПРЕДЕЛЬНЫЙ ПЕРЕХОД В «-МЕРНЫХ ПРОСТРАНСТВАХ 41 т, е. каждая из последовательностей чисел: удовлетворяет критерию сходимости Коши для числовых последователь- последовательностей. Поэтому она обладает пределом аг (/=1,2,..., /i): ai = limai;nK F1) W->co Обозначим через А точку с координатами аи а&.,», алЧ В силу F1) имеем: Итак, последовательность Ат сходится к точке А. Компактное в себе множество. Множество М называется ком- полетным в себе, если каждое его бесконечное подмножество ЛГ обла- обладает предельным элементом, принадлежащим М. Например, принцип Больцано-Вейерштрасса показывает, что отрезок прямой есть компактное в себе множество. Ограниченное множество. Ограниченным множеством называется множество, вес точки которого принадлежат некоторой сфере. ТЕОРЕМА. Замкнутое ограниченное бесконечное множество точек п-мерного пространства компактно в себе. В частности, замкнутая ограниченная область компшетна. Пусть М—замкнутое ограниченное бесконечное множество точек. ЛГ — произвольное бесконечное подмножество множества М. Докажем, что ЛГ обладает по крайней мере одним предельным элементом, при- принадлежащим М. В силу ограниченности множества М можно построить «-мерный куб Do !): такой, что все множество М (а значит, и Л!'), принадлежит Z)o. Разобьем куб Do на 2п кубов, имеющих длину ребер вДвое мень- меньшей длины, чем ребро куба Do. Координаты хь (/= 1,-2, . ¦. , п) точек этих кубов удовлетворяют одному из неравенств: Так как Do содержало бесконечное множество точек множества ЛГ, то один из этих кубов разделения содержит также бесконечное мно- множество точек ЛГ; пусть это будет куб Dv В свою очередь, разбив куб Dx аналогичным образом на 2Л кубов, мы найдем среди них куб />2, который содержит бесчисленное множество точек, принадлежащих ЛГ» Продолжая этот процесс, мы получим последовательность кубов: Do, Dl3 Dq, ..., DmJ..., причем куб Dm + x есть тот из 2п равных кубов, на которые разбит б куб Dm и который содержит бесчисленное множество точек множе- г) Мы имеем в виду здесь и в дальнейшем кубы вместе с границей.
42 ЭЛЕМЕНТЫ «-МЕРНОЙ ГЕОМЕТРИИ [ГЛ. I ства М'. В силу построения каждый следующий куб содержится во всех предыдущих; кроме того, длина ребра куба Dm, равная ~^ц, так же как и его диаметр dm9 стремится к нулю при т, неограниченно растущем. Обозначим через Ат центр куба Dm. Так как все кубы Ь^^ при р > О заключены в Dq, то их центры Aw+P прир^О заключены в Dmf вследствие чего расстояние между точками Ат и Ат+Р меньше диа- диаметра dm куба Dm: Так как dm стремится к нулю, то Ат есть последовательность Коши и сходится поэтому к предельной точке Д. Поскольку все точки АГТ^Р заключены в Dm, то А заключено в Dm или на его границе. По построению куб Dm заключает точки множества Мг. Расстояние от А до точек ЛГ, попавших в Dmy не превосходит dm. Но так как dw может быть сделано сколь угодно малым, то в любой окрестности точки А существуют точки М'\ точка А есть предельная точка длиМ', а следовательно, предельная точка для объемлющего множества М. Вследствие замкнутости Ж, А принадлежит М.
ГЛАВА II ФУНКЦИИ ТОЧКИ В tf-MEPHOM ПРОСТРАНСТВЕ § 9. Функции и диференциал Мы перейдем в этом параграфе к изучению функций многих пере- переменных, используй введенные выше геометрические понятия. Функция точки* Пусть задано множество {М\ точек л-мерного пространства и пусть каждой точке М этого множества отвечает число /С/И). Мы назовем f{M) функцией тошш п-мерного простран- пространства, а множество [М], в точках которого функция определена,— областью задания функции. В дальнейшем в качестве областей задания функций будут фигурировать само пространство или его открытые и замкнутые области. Мы назовем функцию / непрерывной в /тючке Мо n-мерного про- пространства, если для любого положительного числа е существует такая окрестность V точки М$} что коль скоро точка М принадлежит U и, конечно, области задания функции.» Заметим, что в определении непрерывности функции фигурирует единственное геометрическое понятие — понятие окрестности точки и-мерного пространства. Поэтому в дальнейшем, когда мы встретимся с пространствами значительно более общей природы, на которые удается распространить понятие окрестности точки, нам удастся определить в этих пространствах и понятие непрерывной функции. Условие Липшица* Мы скажем, что функция f{M) точки и-мерного пространства удовлетворяет условию Липшица, если для произвольной пары точек М и М области задания функция выполняется неравенство ! /ОЮ -f№ |< Кг (ж', ж), где К—положительная константа. Очевидно, все функции* удовлетво- удовлетворяющие этому условию, непрерывны. Диференциал. Пусть задана непрерывная функция f(M) точки М n-мерного евклидова пространства. Разность называется приращением функции при переходе от точки Мо к точке М.
44 ФУНКЦИИ ТОЧКИ В «-МЕРНОМ ПРОСТРАНСТВЕ [ГЛ. Н Обозначим координаты точки Л10 через л*0)(/5= 1,2,..,, л), а точки М — через хг(/= 1, 2,..., л). Допустим, что среди линейных функций i ь— 1 существует такая, что разность [f{M)-f(Mu)\ -%a.(xt- % есть величина высшего порядка малости сравнительно с r(AI0, M). В этом случае линейная функция (X) называется диференциалом фушсции f в точке Мо и обозначается: d(MQ; M~M). Имеем, следовательно: er^MOfM), B) где с стремится к нулю вместе с г(М0>М), т. е. диференциал функции есть главная линейная часть приращения этой функции. Понятие диференциала использует только два свойства и-мерного евклидова пространства: во-первых, возможность строить в нем линей- линейные функции (линейность) и, во-вторых, существование в нем понятия расстояния. Поэтому, как мы увидим ниже, понятие диференциала можно распространить на функции, определенные в пространствах чрезвычайно общей природы, сохраняющих, однако, эти основные свойства евклидова пространства. Согласно определению диференциала имеем равенство: df(M0; М~0М) = 2 а, (*. - xf). Вектор с компонентами аД/ = 1, 2,..., я) называется градиентом функции / в точке Мо и обозначается: grad /(Жо). Пользуясь символом внутреннего произведения, получим: d/Шо; ЛуИ) = Л*~Ж . grad /(ЛГ0). Производная в данном направлении. Проведем из тонки Л/о луч L. Рассмотрим отношение: где М — точка луча L. Это отношение можно рассматривать как сред- среднюю скорость изменения функции в данном направлении L. Предел отношения C) при М-+Мф если он существует называется произ- производной от функции f(M) в точке Л10 в направлении L; он обозначается символом fL(M0). Итак: и»
§ 9] ФУНКЦИИ И ДИФЕРБНЦИЛЛ 45 Производная по направлению, совпадающем}' с положительным на- направлением оси Ох17 равна частной производной--,— в точке Мо (точ- (точнее: правой частной производной ~9 если она в точке Мо не совпа- совпадает с левой). Если существует в точке Мо диференциал d/^M^ M^M)^ то про- производная /'(М0Усуществует для любого направления L. В самом деле, из равенств B) и C) следует, что в этом случае /(Л!)—/(Af0)=*AfoiW- grad/(Af0) + ir(Afo, Al), где з-*0 при r(MOi Ж)-*0. Но grad/(Af0) - M0M^\gr*<lf(M0)\r(MOyM)costea<lf, L), следовательно: ?1/) - lgrad/(vW0)| cos(grad/, L). Таким образом производная в данном направлении (при существова- существовании диференциала) равна проекции градиента на данное направление* Эта производная принимает наибольшее значение тогда, когда L на- направлено по градиенту, и равна нулю в том случае, если L перпенди- перпендикулярно градиенту. Отсюда заключаем, что направление градиента со- совпадает с направлением, в котором быстрее всего изменяется функция. Компоненты вектора grad/ совпадают с частными производными. В самом деле, в силу только что сделанного замечания t-я компо- компонента grad /f как проекция grad / на положительное направление оси Охг, совпадает с производной / в положительном направлении оси Oxif т. е. С"-р~. Отсюда получаем: т. е. диференциал, если он существует, совпадает с первым членом раз- разложения функции / в ряд Тейлора в окрестности точки MQ. Если функция / обладает в окрестности тонки Мо непрерывными частными производными по всем аргументамш то она обладает и диферещиалом. Ь самом деле, в силу теоремы Лагранжа: AM) -/(AW -? *]&. (xt - х где М'—точка, лежащая на отрезке М0М. Поэтому AM) - №0) _Д Ш& {х, - */•») --± Sj (Xi _ Ж|«). * -- 1 * * 1
46 ФУНКЦИИ ТОЧКИ В /7-МЕРНОМ ПРОСТРАНСТВЕ [ГЛ. II Здесь е df{M')_ df{MQ) При стремящейся к Жо, М' тоже стре- мится к Жо; числа е,- стремятся к нулю (так, функции -^- непрерывны в точке Мо по условию теоремьм. Поэтому правая часть равенства D) стремится к нулю быстрее, чем r(M0, M). Тем самым линейное выражение совпадающее с точностью до величин высшего порядка малости с при- приращением функции /, есть ее диференциал. Существование частных производных в точке Мо недостаточно еще ддя существования в ней диференциала, в чем нас убеждает следующий простой пример. Пусть 2 где р и <р — полярные координаты точки {х>у). Частные производные -^— и -г— существуют в каждой точке и в начале координат равны нулю. Но диференциала df в начале координат не существует. В самом деле, при наличии df> grad/ в начале координат равнялся бы в этом случае нулю, а питому равнялась бы нулю производная /^@) по лю- любому направлению L. Между тем, как легко убедиться, f^@) = -^sm2^9 где о — угол, образованный L с осью Ох. Мы убедились также на этом примере, что существование производных по любому направлению недостаточно для существования диференциала. Функция полигона* В дальнейшем нам понадобится геометрическая ин- интерпретация функции я переменных, которая отличается от принятой выше. Пусть дана функция п независимых переменных: Условимся относить каждой совокупности п чисел yv y2i ... , уп, или, что то же, точке л-мерного пространства, полигональную кривую, расположенную в координатной плоскости (л:, у) и определенную сле- следующим образом: концы полигона закреплены в точках А (а, у0) и В iP> Уп^-д (Р > а)» *~я веРшина полигона имеет координаты: Этим самым устанавливается взаимно-однозначное соответствие между всеми точками л-мерного пространства и всеми полигонами Рп с кон- концами в фиксированных точках А и В и с абсциссами вершин: a + t&x Функцию / можно таким образом рассматривать как функцию полигона Рп:
АНАЛИТИЧЕСКИЕ МНОГООБРАЗИЯ 47 Пусть теперь Рп есть такой полигон нашего семейства, что все его вершины, кроме *-й, совпадают с вершинами полигона Р„, а /-я вер- вершина имеет ординату у ЛЛ+Л Обозначим через s пло- площадь, заключенную между полигонами Рп и Рп7 счи- считая ее положительной, если 8у, > О, и отрица- отрицательной, если Ьуг < 0. Имеем: Найдем предел отно- отношении Черт. 4. когда lyi% а вместе с ним из, стремится к нулю. Предполагая, что-J— существует, очевидно, имеем: /№¦>-/<!>.) 1 А7"т Ax Таким образом рассматриваемый предел отношения пропорционален частной производной —¦, причем, если числа а и b подберем так, чтобы Лх=1, то пропорциональность лревращается в равенство. Такой подход к понятию частной производной позволит нам это понятие распространить на функции более общей природы. § 10. Аналитические многообразия. Криволинейные координаты. В настоящем параграфе мы коснемся понятия, играющего значи- значительную роль в вопросах анализа — именно понятия аналитического многообразия. Существуют два определения этого понятия. Параметрическое определение многообразия. Начнем с простей- простейшего случая. Линией или одномерным многообразием мы назовем гео- геометрическое место точек, координаты которых суть непрерывные дифе- ренцируемые функции одного параметра: *,=Л@ ('=1.2, ..., /х). E) Ограничимся случаем, когда функции /4(/) суть функции с непре- непрерывными производными /{(I). Мы должны еще потребовать, чтобы про- производные всех функций ft(f) не обращались одновременно тождественно в нуль. В противном случае Rce функции /,(*) были бы константами и линия выродилась бы в точку.
48 ФУНКЦИИ ТОЧКИ В Л-МЕРНОМ ПРОСТРАНСТВЕ [ГЛ. II Точки, отвечающие двум или более различным значениям *, называ- называются кратными. Критическими точками кривой мы называем, во-пер- я вых, кратные точки, во-вторых, точки, в которых V (-^Ч issO при всех выборах параметра L Например, плоская полукубическая парабола имеет критическую точку в начале координат. Аналогично определим ^-мерное многообразие: будем называть k-мерным многообразием геометрическое место точек л-мерного про- пространства (k <C я), координаты которых суть функции k параметров: *,=/, (tl9 /о, ..., tf) (*"= 1, 2, ..,, я), F) где функции /л удовлетворяют следующему дополнительному условию среди главных определителей матрицы (dtt\ щ) существует по крайней мере один, не равный тождественно нулю. Это условие исключает возможность вырождения данного многообразия в многообразие меньшего числа измерений. Преобразование переменных. Мы дали определение Л-мерного мно- многообразия через параметры, причем для определенности уместно фикси- фиксировать область изменения этих параметров. Это последнее обстоятель- обстоятельство является, конечно, несущественным. Допустим, в самом деле, что между точками некоторой ^-мерной сферы 2 1? — 1 пространства (_/,, t& .. .j /д) и точками некоторого тела V установлено взаимно-одно- взаимно-однозначное соответствие, и пусть '« = ?«(«!. «а» •••,«*) (8) суть уравнения, реализующие это соответствие. При этих условиях уравнениям (б) многообразия можно придать вид: 1де (ttlf и<ь .. ., «д) есть произвольная точка тела V и где положено: Так как каждой точке (и^ «2, ..., йл.) отвечает вполне определенная точка многообразия, то систему чисел (ии.%, . ¦•»#*) -молено назвать координатами точек многообразия. При таком определении система (8) реализует переход от одной системы координат к другой. Укажем сейчас на другое определение аналитического многообразия
§ 10] АНАЛИТИЧЕСКИЕ МНОГООБРАЗИЯ 49 многообразием k (k<^n) измерений в я-мерном пространстве назы- называется геометрическое место точек, координаты которых в я-мерном пространстве удовлетворяют я— k уравнениям: ?i(*i> Х2> ...,*„) = О (/—If2! ••-•л — *) (9) (функции Oj мы считаем дважды диференцируемыми). При этом я — k уравнений * (9) независимы. Это значит, что определители (п — А)-го порядка, составленные из элементов матрицы /*,\ //=1,2, ...,я~ k\ не могут одновременно обращаться в нуль во всех точках пространства. При таком определении многообразия k измерений можно рассматри- рассматривать как пересечение п — # многообразий (я— 1) измерений. Точки многообразия (9), для которых ранг матрицы и^М меньше п — kj называются критическими, остальные — обыкновенными. Мы не касаемся в общем виде трудного вопроса, при каких обстоя- обстоятельствах многообразие в параметрическом виде можно представить в виде (9). Это, между прочим, было бы возможно, если бы мы сумели из k уравнений F) исключить параметры tlf ?2, .,., th. Пусть точка Мо есть обыкновенная точка уравнении многообразия, заданного в параметрической форме F). Выберем из системы F) k таких уравнений, чтобы их функциональный определитель, составленный из правых частей этих уравнений, для значений параметров, отвечающих точке М09 отличался от нуля. Примем для определенности, что это суть первые k уравнений. Мы можем в силу основной теоремы о неявных функциях выразить в окрестности точки Мо параметры tv ?g, ••.,?* через координаты \\, х.гУ ¦,., хн. Подставив найденные значения пара- параметров в остальные п — k уравнений, выразим я—k координат Xj через координаты xly x2, ...9xk: Таким образом мы представили в окрестности точки Мо уравнение нашего многообразия в форме (9), где Точка Мо будет также обыкновенной точкой в смысле определения обыкновенной точки многообразий, заданных уравнением (9). В самом деле, ранг матрицы ,^v //=1,2, ..., л —*\ [dxj \t— 1,2, .. ., П ) равен п — k} ибо функциональный определитель \dxt равен единице.
50 ФУНКЦИИ ТОЧКИ В «-МЕРНОМ ПРОСТРАНСТВЕ [ГЛ. I Пусть, обратно, Л/о есть обыкновенная точка многообразия (9). В силу основной теоремы о неявных функциях мы в этом случае можем в окрестности этой точки п координат точек многообразия (9) выра- выразить через k из них, например через x4i x,j ..., х1}. В окрестности Мо уравнению многообразия (9) можно придать параметрическую форму, где в качестве параметров будут фигурировать координаты х*х» x%j • • •» х%к* Легко убедиться, что точка Л40 будет также обыкновенной в смысле определения уравнения (9). Таким образом в окрестности обыкновенной точки многообразия возможен переход от одной из двух основных форм задания его уравнений к Другой. Криволинейные координаты. Пусть нам задано в параметрической форме уравнение m-мерного многообразия в л-мерном пространстве <т<й* *,=?(?, ^ ..., U (*'=1,2, ...,п>т). A0) Примем согласно данному выше определению параметры /4 за коор- координаты на данном многообразии (криволинейные координаты). Точки многообразия, для которых все координаты хг будут функциями одного параметра т, образуют линию на данном многообразии. Обозначим через ds элемент дуги этой линии; тогда, обозначая через dxi приращения координат, которые получаются при продвижении по кривой на длину ds, получим: i к к где Ati = Ар — V -— • -?~. Положив dl'2 = 2 dtp и cos a, = -^, получим: ds* = dp 2 Аи cos ai cos <V Пока^сем, что в правильной точке многообразия 2 Aj cos a, cos «^ > О при любых значениях а„ а следовательно, 2 Ajcos a«c0S aj больше некоторой положительной константы, зависящей только от А#. В самом деле, допустим противное, т. е. что сумма при некоторых значениях с^ равна нулю, тогда в силу A1) при тех же значениях %j будем иметь: к причем 2cos2cty= 1 Ф 0; но в таком случае все определители &-го порядка вида ~ будут равны нулю, что противоречит условию пра- правильности точки многообразия. Таким образом в правильной точке многообразия, если точка ЛГСЬ*&» .. -, tj) пространства (tu ^, ..., t^ переместится на бесконечна малую величину, то соответствующая точка многообразия переместится на бесконечно малую того же порядка.
§ Ю] АНАЛИТИЧЕСКИЕ МНОГООБРАЗИЯ 51 Имея выражение диференциала дуги через дифереициалы координат в каждой точке многообразия, можно на данном многообразии решать основные метрические задачи геометрии, не прибегая вновь к общему уравнению многообразия. Пусть, например, на многообразии дана линия, соединяющая две данные точки A(tf*) иВ(?1у), заданная уравнением: При этом т0, ix суть значения параметра, соответствующие точкам А и В. Тогда длина s заданной линии вычислится по формуле: A2) Задача о разыскании геодезических — линий наименьшей длины среди линий, соединяющих на многообразии две данные точки, приводится в силу A2) к задаче разыскания линии, вдоль которой интеграл A2) принимает наименьшее значение. Эта задача является одной из основных за- задач вариационного исчисления. Многообразие, заданное уравне- уравнением (9), допускает параметрическое представление в окрестности любой его обыкновенной точки. Вместе с тем в та- такой окрестности можно ввести систему криволинейных координат. Такая система координат, заданная только в окрестно- окрестности некоторой точки многообразие на- называется местной системой координат. Мы можем ввести криволинейные координаты и в самом евклидовом пространстве. Пусть нам заданы пара- параметры t17 tfr ..., tn такие, что коор- координаты всякой точки евклидова пространства (или некоторой его обла- области) выражаются через эти параметры: Черт. 5. Параметры tv п). t можно рассматривать как криволинейные коор- координаты точек евклидова пространства. Многообразия (л—1) измерений f, = const, будем называть координатными многообразиями; очевидно, имеется п систем координатных многообразий. Приведем несколько при- примеров криволинейных координат в евклидовых пространствах. Примеры 1. Сферические координаты. Рассмотрим так называемые сферические координаты: радиус-вектор р точки А в трехмерном евклидовом пространстве есть ее расстояние до начала координат и (черт. 5); широтой <? точки А на- называют угол между вектором ОА и плоскостью хОу (у изменяется от— у до —-}; долготой & точки А назовем двугранный угол между плоскостью, проходящей через ось Oz и точку А (плоскостью меридиана точки А) и
52 ФУНКЦИИ ТОЧКИ В Я-МЕРНОМ ПРОСТРАНСТВЕ [ГЛ, П плоскостью xOz (ф меняется от — п до *), или, то же самое, 4> есть угол между проекцией ОВ вектора ОА на хОу и осью Ох. Имеем: OB = p cos <р, AR = р sin ч>. Следовательно: х = р cos <р cos ^, .у = р cos 9 sin<}>, z = i ds* = На поверхности сферы с центром в начале координат р = const.; широта <р и долгота 4* принимаются за координаты точки на сфере (географические коор- координаты); при этом d* з (*2 + s2 9 rf<L*). В л-мерном пространстве обобщением системы координат р, у, ф будет система координат р, <?i> ?2* •••> ^»—i* определяемая равенствами: хг « p cos <pt cos % ... cos 9n _3 sin <?n_ 2, ...+COS2 cp^_ t Л?^^ Ha (n — 1)-мерном сферическом многообразии р = const. <?lf %, ..., 9n_t образуют систему криволинейных координат. 2. Эллиптические координаты. Пусть *7lt ^ ^з — произвольные рааличнь?е действительные числа d{^>a2^>a^^>Q. Рассмотрим систему поверхностей Sk второго порядка: Пока k > clf 5*А. есть эллипсоид; при ах > /? > я*, «S/,- есть однополостный гипербо- гиперболоид; прн #2>?>аз — двуполостный гиперболоид; при kt равном одному из чисел пи й2, %, поверхности Sf. вырождаются в пару слившихся плоскостей; при k<i<xb мы имеем мнимый эллипсоид. 1\уыьА(х, у, z) — фиксированная точка. Уравнение A3) определит нам такое k, что поверхность Sfc будет проходить через точку А. Уравнение A3) есть уравнение третьего порядка относительно fc При изменении k от +оо до а^ многочлен P(k), как легко проследить, трижды меняет знак: прн ^ = 4-°°» ^№)>0, при /?=Л прн ^ = дх, Р(^)<0, при А> = я Следовательно, три корня kv % Л3 уравнения Р(Л) = О расположены так: Из этого следует, что через каждую точку А проходят три поверхности $и- &кх> ^2t Sk9 — один эллипсоид, один однополостный и один двуполостный гиперболоиды. Мы можем при этом выразить координаты х, у9 z точки А через числа kit k2, fcj. В самом деле, вычислил коэфициенты полинома P(k) и выражая их симметрическими функциями корней, имеем: (
§ 10] АНАЛИТИЧЕСКИЕ МНОГООБРАЗИЯ 53 Решая эту систему уравнений относительно х2, у2, z2, получим в конце концов: — aj (at — «3) 2 _ (&1 Д2) (^2 ^ ( ) Зная выражения для х, у, z через klt k2, Ьл, найдем выражения для dx, dy, dz через dkv dkp dbs. Отсюда уже нетрудно' выразить в новых координатах диференциал дуги: 4 L^— Полагая ^1=r: const, получим эллипсоид Sf.j k2, h будут криволинейными координатами на этом эллипсоиде; при ^ = const, klf k^ (черт. 6) дадут нам криволинейные координаты на однополостном гиперболоиде Sf:^ при &з = const, kt и k2 — на двуполостном гиперболоиде Sk^ k{, к% /?з н называются эллиптически/ли координатами. Аналогично можно определить такую же систему „эллиптических" координат (kv k^ ..., &„) в я-мер- ном пространстве. Переход от декартовых координат Хи хъ ,.., хп к эллиптическим kL, h^ .... kn дается форм}улой: \ П П (г =i,2. Эллиптические координаты были впервые вве- введены Якоби при решении задачи об отыскании гео- геодезических на эллипсоиде. Этот вопрос будет разо- Черт. 6. бран нами в главе X11I. 3. Барицентрические координаты. Можно определять положение точки в //-мерном пространстве с помощью я + к чисел (координат), связанных между собою к соотношениями. Простейшим сриадером такой системы, координат являются барицентрические координаты (&= 1). Представим себе, что бл+1 вершинах Ао, Аи ... , Ап единичного тетра- тетраэдра 7\ расположенных: АA — в начале координат, а остальные А4 на осях коор- координат, помещены массы (положительные или отрицательные): с0, сь ..., cnt удовлетворяющие условию: п Применяя обычную формулу, найдем центр тяжести этих масс. Учиты- Учитывая равенство A4), а также то, что все декартовы координаты точки Ау равны нулю, координаты же точек И, (/ = 1,2, ...., п) равны нулю, кроме /-й координаты, равной единице, центр тяжести А масс с0, cl9 .... сп будет иметь координаты: jri== ct (/= 1,2, ..., п).
64 ФУНКЦИИ ТОЧКИ В «-МЕРНОМ ПРОСТРАНСТВЕ [ГЛ. II Обратно, из этой формулы, зная точку А(хь хр ..., хп), мы единственным образом определим массы С& ciw c& .... сю помещенные в вершинах Г, центр тяжести которых попадает в А: Числа с% называются барицентрическими координатами точки Л. Линейным невырожденным преобразованием можно преобразовать еди- единичный тетраэдр Т в произвольный тетраэдр Т\ при этом центр тяжести масс cfp номещенных в вершинах Т, перейдет в центр тяжести тех же масс, помещенных в вершинах Т'. Поэтому мы можем дать несколько более общее определение барицентрических координат. Пусть 7" — произвольный л-мерный тетраэдр с вершинами Aq, А^ ..., Ап. Каждой точке А л-мерного пространства отвечают единственным образом (в 4-1) относительных чисел с^ си ..., сп таких» что центр тяжести масс cit по- помещенных в вершинах Л| нашего тетраэдра, попадет в точку А и что для этих чисел удовлетворяется равенство A4). Из определения барицентрических координат легко вытекают следующие нх свойства. 1. Л-мерная грань 0<!/?<! п, соединяющая (k-\-\) вершину А^9 Аг%, .... А» имеет в барицентрических координатах уравнение: 2- Точки тетраэдра V определяются в барицентрических координатах ке {/ = 0,1. .... я). § 11. Касательные многообразия Введем одно предварительное понятие. Расстоянием данной точки А от данного многообразия L мы называем минимум длины отрезков, соеди- соединяющих данную точку А с произвольной точкой многообразия. Очевидно, что расстояние от Л до ? равно нулю тогда и только тогда, когда точка А принадлежит многообразию L- Пусть теперь нам даны два Д-мерных многообразия, и пусть эти многообразия имеют общую точку MQ *). Мы скажем, что данные много- многообразия касаются друг друга в точке MQf если расстояние произвольной точки М одного многообразия от другого многообразия есть беско- бесконечно малая высшего порядка по сравнению с расстоянием г GИ0, М). Решим следующую задачу: дано k-мерное многообразие L и правильная точка Мо (х?0)) этого многообразия; требуется построить линейное многообразие k цзме- рений, касающееся L в точке ЛГ0. Допустим, что многообразие L задано уравнением в параметрической форме: *»=/i('i» h> •••> **) («=1,2, .„, п\ A5) и пусть /^°\ ^0), , /?0) суть криволинейные координаты точки /vf0. *) Мо предполагается правильной точкой для каждого из многообразий.
§ 11] КАСАТЕЛЬНЫЕ МНОГООБРАЗИЯ 55 При этих обозначениях уравнением искомого многообразия будет сле- следующая система: к где через (~) обозначено значение производной в точке Жо. В самом деле, система A6) дает линейное ^-мерное многообразие, ибо в силу правильности точки Мо один из определителей ?-го порядка, составленный из коэфициентов правых частей A6), отличен от нуля. Возьмем теперь точку Л/(/,.), бесконечно близкую к точке М& и обо- обозначим через h расстояние от М до многообразия (|6). Очевидно, имеем: ко в силу § 9 (определение диференциала) каждая квадратная скобка есть бесконечно малая высшего порядка по сравнению с бесконечно малой |/2(^ — ^@)J> которая в силу предыдущего параграфа имеет порядок бесконечно малой r(M0, AT). Следовательно, h есть также бес- бесконечно малая порядка более высокого, чем г (уИ0, AT). Если мы в системе A5) фиксируем k—1 параметр, а один оставим произвольным, то система A5) нам дает линию, которую мы будем называть координатной линией. Через каждую точку А й-мерного много- многообразия можно провести k координатных линий: Ти Т& ..., Тк. Прямые Г,@), Г2@), ..., Гй@), получаемые из A6) фиксированием соответствующих параметров, будут касательными к этим линиям. Заметим следующее. В правильной точке многообразия, если мы в направлении каждой прямой Г/0) отложим вектор, мы получим систему k линейно независимых векторов. Под углом между координатными линиями Г/ и Г^- мы будем по- понимать угол между соответственными касательными Г/°* и Г^. Условие ортогональности Г, и IV (т. е. ортогональности соответственных прямых Г/°* и Г^) запишется в форме: .=0 Это значит, что для точки Р коэфициент Atj(tz^J) в выражении элемента дуги ds^^^A^d^dtg (см. стр. 50) равен нулю. Если все координатные линии во всякой точке многообразия взаимно-ортого- взаимно-ортогональны, то все Л?7- = 0 при /фу. Из формул предыдзтаего параграфа непосредственно следует, напри- например, что сферические и эллиптические координаты образуют ортого- ортогональную систему криволинейных координат. Мы решили поставленную задачу в предположении, что данное много- многообразие задано уравнением в параметрической форме. Укажем вкратце на решение той же задачи, когда уравнение многообразия задано в форме: ф^ (^ ^ ^^ ^ = 0 (/ = ^ 2, ..., „ _ /г). A7)
56 ФУНКЦИИ ТОЧКИ В /2-МЕРНОМ ПРОСТРАНСТВЕ [ГЛ. II Пусть Жо есть обыкновенная точка многообразия. В этом случае все координаты точек многообразия в окрестности точки Жо выражаются через k координат, которые можно рассматривать как k параметров. За- Задача построения касательного линейного многообразия к многообразию A7) сведена к разобранному выше случ?ю. Рассмотрениями, аналогичными приведенным выше, мы обнаруживаем, что (п — &)-мерное линейное многообразие: j — Xi касается (п—1)-мерного многообразия Ф{ = 0 в точке Af0. § 12. Функция как многообразие. Стационарные точки Целью настоящего последнего вводного параграфа является устано- установление связи между понятием функции многих переменных и теми геометрическими понятиями, которые мы ввели раньше. Пусть нам дана функция f(xlf #?,..., хп) от п независимых пере- переменных. Эту функцию по аналогии с функциями двух независимых переменных можно интерпретировать геометрически двумя различными способами. 1-й способ* Введем пространство п-\-\ измерения (х1} х2,..., хпУz) и условимся изображать данную функцию / в этом пространстве как многообразие п измерений, определенное уравнением: 2-й способ. Введем пространство п измерений (хх, хш2? 7хп) и условимся изображать функцию / в этом пространстве как однопара- метрическое семейство {п—1)-мерных многообразий, определяемых уравнением: /(*i, *2,.-., хп) = к9 B0) где h — параметр. Мы используем в дальнейшем каждую из этих интерпретаций. Пер- Первая интерпретация дает нам изображение функций при помощи много- многообразий весьма простой природы: всякая прямая, параллельная оси Oz7 пересекает многообразие в единственной точке, каждая точка много- многообразия есть правильная точка *)• Однако при этой интерпретации нам приходится прибегать к пространству (п-f-l) измерений, более высо- высокому, чем при второй интерпретации, которая изображает функцию многообразиями общего вида. Заметим еще, что вторую интерпретацию можно рассматривать как частный случай первой. Многообразие B0) есть результат пересечения многообразия A9) с линейным л-мерным многообразием z~*. B1) Семейство многообразий B0) есть семейство, получаемое сечением многообразия A9) многообразиями B1). 1) Функция предполагается непрерывной и диференцируемой.
§ 12] ФУНКЦИЯ КАК МНОГООБРАЗИЕ 57 Допустим, что функция /(лг]э лг2,...? л:и), изображена при помощи многообразия A9), и пусть М (х®\ л**°\..., х?}) - произвольная точка этого многообразия. Проведем через точку Мо линейное л-мерное много- образно, касательное к многообразию A9): **•••. *«)• B2) Построенная линейная функция <р в бесконечно малой окрестности точки Мо аппроксимирует функцию / с точностью до бесконечно малых высших порядков: где г = J/ 2 (^—х\0)У2 и 8 стремится к нулю вместе с /-. Допустим, что линейная функция <р не есть константа, или, геоме- геометрически, касательное многообразие B2) не параллельно многообразию z = О, в таком случае grad f(xf\ xf\..., х^0)) ф 0, и, следовательно, можно через точку Мо провести прямую L, параллельную градиенту. Как было выяснено выше, эта прямая соответствует наискорейшему изменению функции. Если мы продвинемся по L из точки Мо на г да точки М1У то будем иметь: f{Mx) —f(M0) = ± | grad/(Af0) \r + re, B3) где е стремится к нулю вместе с г и где знак перед первым числом зависит от того, совпадает ли направление вектора М0М с направлением градиента или ему противоположно. Отсюда при г настолько малом, чтобы | г | была меньше ) grad f(M0) |, функция возрастает, если мы двигаемся по направлению градиента, и убывает при движении в обрат-» ном направлении. Норма градиента численно характеризует скорость изменения функции. В любой окрестности точки Мо имеются точки многообразия A9), принадлежащие области z > z(), и также точки, принадлежащие области z < 20. Кроме того, при сохранении гипотезы: | grad f(M0) \ ф 0, много- многообразия B2) и z = z0 пересекаются по линейному многообразию (п—1) измерения, которое будет касательным к (п — 1)-мерному многообразию В соответствии с этим многообразие B4) будет правильным в окрест- окрестности Мо (точка Мо не есть особая точка). Таким образом, если | grad f{M^) [ ф 0, то точка М^ (*{0), х?\.. ¦, *f(f) есть правильная точка многообразия B0). Если б точке Л10 касательное линейное многообразие параллельно многообразию 0 = 0, или, что то же, линейная функция ср есть константа и grad /= 0, то в этом случае касательное линейное много- многообразие примет вид: z — z0. Точка Мп вообще по определению, как мы увидим ниже> будет особой точкой многообразия B4).
53 функции точки в л-мерном пространстве [гл. II Точки пространства (хи #2,..м хп), где grad/=O, мы будем на- называть стационарными точками функции f(xl9 л:2,..,, лгл), а прини* маемые ею значения в стационарных точках мы будем называть крити- критическими значениями функции. Пример. Рассмотрим механическую систему с п степенями свободы. Пусть ^1» #2»-*" Яп СУТЬ л независимых параметров, определяющих положение сис- системы. Допустим теперь, что на систему действуют силы, допускающие потен- потенциал U(qx% <7з»..., qn). При этих условиях, если система получает бесконечно малое возможное перемещение, соответствующее изменению параметров на величины oft, о#2». --> &?я» то действующие силы совершают при этом опреде- определенную работу Pt равную сумме элементарных работ, соответствующих работе сил при изменении одного из параметров qt: dU ь Ц В силу принципа возможных перемещений для равновесия системы пе- обходимо и достаточно, чтобы при любом бесконечно малом возможном пере- перемещении сумма элементарных работ равнялась нулю: Следовательно, рассматривая систему параметров ql$ ?2»--» Яп как точку /z-мерного пространства, а потенциал сил U как функцию точки, мы получаем такую теорему: для того чтобы б точке {qif ^2»»-м ?я) было равновесие, не- необходимо и достаточно^ чтобы эта точка была стационарной точкой для потенциала сил. (В этом заключается принцип Дирихле.) Главной нашей задачей в дальнейшем будет являться изучение по- поведения функции и соответственно многообразий A9) и B0) в окрест- окрестностях критических точек, причем при изучении этого вопроса нам будет недостаточно знания линейных касательных многообразий: аппро- аппроксимация линейной функцией оказывается слишком грубой. В соответ- соответствии с этим мы введем сейчас многообразия, имеющие с данными многообразиями соприкосновения более высокого порядка. Допустим, что функция / обладает в окрестности точки также непрерывными частными производными второго порядка, Разложим функцию/ в ряд Тейлора с тремя первыми членами; получим: ЯМ)=/(«„) + ^ (-^H <*,- *?* где г и е имеют прежний смыед. Обозначим чере? <?(М) сумму пер- первых трех членов правой части B5). Формула B5) показывает, что \/(ЛТ) — 9(^I есть бесконечно малая порядка выше второго по срав- сравнению с г (Af0, Af). Многообразия: имеют в точке Мо соприкосновение второго порядка.
$12] ФУНКЦИЯ КАК МНОГООБРАЗИЕ 59 Допустим, что Мо есть стационарная точка. Исследуем, от чего в этом случае будет зависеть знак приращения /(М)—f(M0). Если точка Мо есть стационарная точка функции /, то функция примет вид: B6) Выпустим в пространстве (аг^ #2>..., хп) луч ?,, выходящий из точки Мо и характеризуемый направляющими косинусами cosotj, coso^,..., cosan, и определим приращение функции, которое она полу- получит, если продвинуться по лучу из Mq в некоторую бесконечно близкую точку М, Имеем: ГО) х—д:^J где г = г(М0, Л0 = |/2(*, — *JV; отсюда Эта формула показывает, что если число B8) отлично от нуля, то в достаточно малой окрестности точки Мо знак приращения функции, когда М движется по лучу L, зависит только от знака Л, причем если мы направление луча изменим на обратное, то знак приращения функции при этом меняться не будет. Таким образом задача изучения поведения функции в бесконечно малой окрестности стационарной точки сводится, с точностью до бес- бесконечно малых порядка выше второго, к изучению квадратической однородной формы с п переменными. Этому исследованию мы посвя- посвящаем главу III. Отметим еще здесь одно важное свойство семейства многообра- многообразий A9), вытекающее из соотношения B7). Допустим, что Afo(j^0)) есть стационарная точка функции f(M), и пусть z0 есть соответствующее критическое значение функции f{M): 20=/(М0). Выясним, в какой мере, считая h бесконечно малым, многообразие аппроксимирует многообразие: или, иными словами, насколько отклоняются друг от друга в окрест- окрестности точки Мо многообразия, получаемые от пересечения многообра- многообразием z — zo-\-h многообразий: =/(Л*), 1 <30>
60 функции точки в «-мерном пространстве [гл. II Остановимся на первой постановке. Воспользуемся построенным выше лучом L и определим порядок расстояния между точками пере- пересечения этого луча с многообразиями B9) и B9'). Если для данного направления Л = 0, то луч L не пересекает многообразия B9); поэтому будем предполагать, что для рассматриваемого направления А ф 0, и допустим, кроме того, для определенности, что А > 0. Обозначим через Tj и г2 соответственно расстояния от Л10 до ближайших точек пере- пересечения луча L с многообразиями B9) и B9'); гг и г2 будут в силу B6), B7), B8) соответственно корнями уравнений: h, C1) Л. C2) Так как е стремится к нулю вместе с г2, то гх и г2 будут бесконечно малыми одного и того же порядка. Из C1) и C2) следует: Г\ Г2 — Л 2 ' отсюда 2 Следовательно, если принять rj за бесконечно малую первого порядка, то |гх — га| будет бесконечно малой порядка выше первого или, по сравнению с hf бесконечно малой порядка выше половины. Пример. В случае, когда число независимых переменных п равно единице, мы получаем функцию одного неременного. Изображающее эту функцию многообразие будет одного измерения — кривая двумерного пространства. Касательным линейным много- многообразием будет служить касательная прямая. Приближение функции с точно- точностью до величин выше второго порядка будет даваться пяраболсй. В случае стационарной точки (ЛфО) каждое из мкогосбразий B9) и C0) будет со- состоять из пары точек. В случае п = 2 функция изображается в виде поверхности трехмерного пространства. Линейным каса- касательным многообразием будет являться касательная плоскость, касательными многообразиями второго порядка будут служить поверхности: ах (х — *о) + а2 (у — ус) + Здесь возможны три случая: 1) ei2 — ^ц^оз^^» рассматриваемое многообразие есть эллиптический па- параболоид, А не обращается в нуль ни при каком направлении. 2) «12-- ЯцД^ >0; мы имеем гиперболический параболоид, в этом случае существуют два направления, для которых А равно нулю, направление для которого Л>0 и направление для которого А <0. 3) ctl2 — aua92^szO; мы имеем параболический цилиндр; число А при изме- изменении направления L знака не меняет, причем существует одно направление» для которого А == 0.
ФУНКЦИЯ КАК МНОГООБРАЗИЕ 61 Допустим (черт. 7), что точка, в окрестности которой мы аппроксимируем функцию, есть стационарная точка, и посмотрим, что собою будут представлять многообразия B7) и B8). В случае эллиптического параболоида многообра- многообразие B7) при Ah<^0 пусто и при ЛЛ>0 есть эллипс с центром в точке МО. Следовательно, при ЛЛ<0 C0) также пусто и при ЛЛ>0 есть простая замкнутая линия, окружающая точку Мо. В случае гиперболического параболоида многообразие B9) не пусто как при ЛЛ>0, так и при ЛЛ<0. Если через 1^ и L3 обозначить направления, для которых А = 0, то многообразие B7) будет гиперболой с асимптотами Lt и L& двум разным знакам h будут отвечать две Черт. 7. сопряженные гиперболы; следовательно, многообразие C0) будет также не пусто при любом Лив окрестности точки Мо будет состоять из двух простых дуг, расположенных соответственно в двух вертикальных углах, образованных пря- прямыми Li и Lv В случае цилиндра многообразие BЭ) при Ah>0 есть пара параллельных прямых и при Л/г<0 пусто, что касается многообразия C0j, то в данном случае о нем никакого определенного суждения высказать нельзя — это многообразие может Оыгь замкнутой кривой, как в случае первом, и может быть не пустым лишь при опреаеленном знаке ht но может также состоять из двух дуг, не связанных одна с другой.
ГЛАВА Ш ЭКСТРЕМУМЫ ФУНКЦИЙ ТОЧКИ л-МЕРНОГО ПРОСТРАНСТВА § 13. Классификация экстремумов Перейдем к вопросу о разыскании тех значений независимых пе- переменных, при которых данная функция достигает наибольших и наи- наименьших значений. Начнем с более точной постановки задачи. Пусть нам дана функция точки «-мерного пространства /(М)> определенная в некоторой области U (закрытой или открытой — безразлично). Мы скажем» что в точке Мо функция достигает своего абсолютного минимума (максимума), если, какова бы ни была точка Ж, принадлежащая области 1/9 имеем: /(Мо) </(М). (/(Мо) >/(М)). A) Если равенство имеет место только при совпадении М с Жо, то мы скажем, что имеет место строгий минимум (максимум). Мы скажем, что f(M) в точке Л!о достигает относительного минимума (максимума), если существует окрестность D точки Мй такая, что не- неравенство A) имеет место только для точек этой окрестности. Иначе говоря: функция / (М) достигает абсолютного минимума (максимума) в точке Мо> если ограничиться рассмотрением f(M) только в этой окрестности. Из этих определений очевидно, что если в некоторой точке имеет место абсолютный минимум или максимум, то в этой точке имеет место также относительный минимум или соответственно отно- относительный максимум. Укажем еще на один термин, который обычно вводят для краткости речи. Мы скажем, что в данной точке MQ функция имеет экстремум (абсолютный или относительный), если в этой точке функция достигает минимума или максимума (абсолютного или относительного); точку Жо будем называть экстремальной. Общую проблему исследования экстремумов функций можно раз- разбить на три группы проблем: 1) найти по возможности широкие доста- достаточные условия существования абсолютного экстремума функции; 2) найти по возможности простые необходимые условия, пользуясь которыми можно было бы фактически определить все экстремальные точки; 3) по воз- возможности близкие к необходимым условиям дать достаточные условия того, чтобы в данной точке функция достигала минимума (максимума). Первая из поставленных задач решается в положительном смысле для чрезвычайно широкого класса функций- Ее решение основано на те- теоремах Вейерштрасса.
§ 14] ТЕОРЕМЫ ВЕЙЕРШТРАССА 63 § 14. Теоремы Вейерштрасса ТЕОРЕМА ВЕЙЕРШТРАССА 1. Всякая непрерывная функция, определенная в ограниченной замкнутой области п-мерного простран- пространства» ограниченна сверху и снизу. Допустим, в самом деле, что непрерывная функция точки /(Ж)> определенная в ограниченной закрытой области {/, не ограниченна, на- например, сверху. В этом случае существует последовательность точек: в которых значения функции f(Mn) стремятся к -f-°° ПРИ я-*оо. В силу компактности закрытой ограниченной области V в ней суще- существует по крайней мере одна предельная точка М последовательности Мп. Пусть f(M) = N; значения /(Л/п) при я, превышающем некоторое фиксированное значение л0, превзойдут /V-j-1. Выкинув первые п0 то- точек Mv М2, ..., Ж„о, мы оставим в последовательности Мп бесконеч- бесконечное число членов. Точка М будет, очевидно, предельной для оставшейся части последовательности Мп\ поэтому в любой окрестности точки М найдутся точки Мп» этой последовательности, для которых или f{Mn!)—f{M)>\, что противоречит непрерывности функции / в точке Мт Итак, первая теорема доказана. ТЕОРЕМА ВЕЙЕРШТРАССА 2. Всякая непрерывная функция* определенная в ограниченной замкнутой области, достигает в ней своего абсолютного максимума и минимума. Непрерывная функция / в ограниченной замкнутой области U в силу теоремы 1 ограниченна сверху. Обозначим через С верхнюю границу значений / на U. Возможны два случая: 1. Существует точка М области U> в которой /(/Л) = С; в этом случае теорема была бы доказанной. 2- Такой точки М не существует; тогда по определению верхней границы С в области U существует последовательность точек Mv M2,...> Л1п>... таких, что f(Mn) = С — гп> Hm sn = 0. Вследствие компакт- П->оо ности V последовательность Мп обладает на U хотя бы одной пре- предельной точкой Жо. В силу сделанной нами гипотезы: /(Жо) ф С; сле- следовательно, /(А/о) < С (неравенство /(Л/о) > С невозможно, иначе С не была бы верхней границей). Пусть C — k (й>0). B) Почти все члены!) последовательности f(Mn) отличаются отСменыие чем —: < 2 * *) Тс-есть все члены, за исключением, быть может, конечного числа их.
84 ЭКСТРЕМУМЫ ФУНКЦИЙ ТОЧКИ 72-МЕРНОГО ПРОСТРАНСТВА [ГЛ. U Подставляя вместо С его значение из равенства B), получим: Неравенство C) выпа'шено почти для всех точек MiOатак как Мо — пре- предельная точка, то в любой окрестности точки Мо найдутся точки М„. для которых также выполняется неравенство C). Это противоречит гипотезе о непрерывности / в точке /Йо. Итак, вторая теорема доказана. Наше доказательство опиралось только на определение непрерывной функции и на свойство ограниченных замкнутых областей евклидова про- пространства быть компактными. Оно сохраняет силу для функций, опре- определенных на любом компактном множестве в евклидовом пространстве. В главе VI мы дадим обобщение теоремы Вейерштрасса на случай функций чрезвычайно общего характера. Примечание. Устанавливаемое теоремой Вейерштрасса существование течки, в которой функция достигает минимума или максимума, связано с ком- компактностью системы точек, на которых функция опре- определена. Если непрерывная функция задана на неком- некомпактном множестве точек, то экстремум может не до- достигаться на точке этого множества. В соответствии с этим при пользовании теоремой Вейерштрасса необхо- необходимо предварительно убедиться в компактности множе- множества, на котором функция определена. Гипотеза о су- существовании абсолютного экстремума на некомпактном множестве может привести к неправильным выводам. Приведем пример, указанный Вейерштрассом. Ложное доказательство пятого постулата Ев- Черт. 8. клида из остальных аксиом геометрии. Постулат Ев- Евклида, как нетрудно убедиться, эквивалентен гипотезе, что сумма углов треугольника на плоскости равна тс. Лежандр доказал из прочик аксиом геометрии, что сумма углов треугольника не превосходит п. Пусть /Сесть верхняь граница сумм углов треугольника; К*Сп, и пусть существует треугольник ABC (черт. 8), на котором сумма углов достигает максимальной величины К- Произвольную внутреннюю точку D стороны АС соединим отрезком ?)? с вершиной В. BD разбивает наш треугольник на два тре- треугольника: ADB, DBC, сумма углов каждого из которых не превосходит /ft с дру- другой стороны» сумма углов обоих треугольников равна /С + гс, следовательно но так как К не превосходит п% то, следовательно, Итак, существует треугольник ABC, сумма углов которого равна те. Но в этом случае, как показал Лежандр, любой треугольник имеет такую же сумму углов; ыы получили „доказательство" постулата Евклида. Ошибочным в таком доказательстве было предположение о существовании треугольника, на котором сумма углов достигает своей верхней границы. В гео- геометрии Лобачевского разность между тс и суммой углов треугольника пропор- пропорциональна плошади последнего, и если сумма углов его стремится к тс, тре- треугольник стягивается в точку. ТЕОРЕМА 3. Если непрерывная функция f(M) определена во всем пространстве и если Шп f(M) = -f oo при г (О,Ж) -> ос, то существует точка Мо, где f(M) достигает своего абсолютного минимума.
§ 14] ТЕОРЕМЫ ВЕЙЕРШТРАССА 65 Возьмем число Р настолько большим, чтобы /(О)</(/Л) D) для всякой М9 для которой /"(О,М)^>Р. Рассмотрим теперь функ- функции f(M) внутри я-мерной сферы г (О, М) ^ А Эта сфера является ограниченной и замкнутой областью: по теореме Вейерштрасса суще- существует точка Жо, принадлежащая сфере или ее границе, такая, что fiW^/W), E) где Л! — произвольная точка сферы, т. е. функция /в точке Мо до- достигает абсолютного минимума в сфере. Докажем, что в точке Мо достигается абсолютный минимум функ- функции f{M) во всем пространстве. В самом деле, в силу E) в силу же D): или для любой точки М, расположенной вне сферы r(OtM)^P. Следо- Следовательно, E) имеет место для любой точки пространства. Этим теорема доказана. Приведем без доказательств еще одну теорему-следствие. ТЕОРЕМА 4. Если для функции f(Af), определенной и непрерыв- непрерывной в некоторой открытой области D, существует точка Мо обла- области D такая, что какова бы ни была точка N границы D, все значения, принимаемые функцией f в какой угодно малой окрестности точки Nt больше (меньше) f(MQ), то существует точка М, принад- лежаицхяО, в которой f достигает абсолютного минимума (максимума). Пример. Основная теорема алгебры. Пусть некоторый полином в комплексной плоскости z (я0 ф 0). Докажем, что этот полином, имеет корни, т. е. что существует точка zq, в которой Р (z0) = 0. Допустим противное; тогда функция In | P(z)\ определена и конечна в каждой точке плоскости. Так как то 1п 1 + -г-т а0 При zt стремящелтся в бесконечность, второй член стремится к нулю, так как выражение, стоящее в нем под знаком логарифма, стремится к единице; первый же член стремится к бесконечности вместе с | z | . Следовательно, в силу теоремы 3 функция In \ P(z)\ достигает абсолютного минимума в ка- какой-то конечной точке плоскости, что невозможно, ибо In \ P(z) \ есть гармо- гармоническая функция и, следовательно, не может достигать минимума ни в какой внутренней точке области ее существования, в нашем случае ни в какой ко- конечной точке плоскости. Мы пришли к противоречию, указывающему нам на неверность гипотезы отсутствия корней у полинома P(z).
66 ЭКСТРЕМУМЫ ФУНКЦИЙ ТОЧКИ Л-МЕРНОГО ПРОСТРАНСТВА [ГЛ. Ill] § 15. Необходимое условие экстремума Приведенная выше теорема Вейерштрасса и теоремы, полученные из нее как следствия, носят чрезвычайно общий характер, но совершенно не дают ответа на второй поставленный вопрос фактического опреде- определения тех точек, где достигается экстремум функции. Для того чтобы подойти к этой второй проблеме, мы прежде всего сузим класс рас- рассматриваемых функций, именно будем предполагать, что изучаемая нами функция п переменных обладает непрерывными частными производными первого порядка, этим самым мы получаем возможность использовать все результаты, добытые нами в § 11 и 12. При этих дополнительных гипотезах мы имеем следующую основную теорему: ТЕОРЕМА. Если непрерывная и диференцируемая функция, опре- определенная в некоторой области D, в точке Мо этой области дости- достигает экстремума, то точка Моесть стационарная точка для дан- данной функции. В самом деле, если функция / в точке Мо достигает минимума, или максимума, то разность должна в достаточно малой окрестности точки Мо иметь постоянный знак. Вместе с тем, в силу рассмотрений § 12, если точка Мо не есть стационарная точка, то в любой близости от точки М существуют точки, где эта разность положительна и где эта разность отрицательна1). Дадим доказанной теореме еще аналитическую формулировку: Если функция п переменных f{xv х2,..., xj в точке (xfo\x«g, ...,*W) достигает минимума или максимума и если точка (хЩ не есть гра- граничная точка области задания функции, то в этой точке имеем: |? = 0 (/=1,2,...,/,). F) Опираясь на эту аналитическую формулировку, дадим еще один вы- вывод теоремы. Если f(xu х2 хп) достигает в точке (л^>) минимума (максимума), то тем более функция одного переменного xt: f(x{G) хт x{0) х х{0) х{0)) достигает при лг< = дг^ минимума (максимума); отсюда, пользуясь ос- основным необходимым условием экстремума функции одного независи- независимого переменного, получим снова F). Доказанная теорема имеет огромное принципиальное и практическое значение. Во многих вопросах эта теорема, дополненная одним из ука- указанных следствий теоремы Вейерштрасса, дает возможность до конца решить задачу на разыскание экстремумов функции. Разберем ряд примеров на приложение развитой теории. 1) Отметим сейчас же, что при выводе мы существенно предполагаем, чго точка Mq есть внутренняя точка области. Если область D—закрытая область и если экстремум достигается на границе области, то теорема в общем случае перестает быть верной. К этому вопросу мы подробнее вернемся ниже.
§ 15] НЕОБХОДИМОЕ УСЛОВИЕ ЭКСТРЕМУМА 67 Примеры. 1. В пространстве п измерений даны две прямые: (/==1,2, ..., п), G) (/=1,2,...,л); (8) требуется определить расстояние между этими прямыми. 6 силу определения расстояния между двумя многообразиями наша задача приводится к разысканию минимума функции двух независимых перемен- переменных t и г: где г есть расстояние от точки t одной прямой до точки t другой прямой. Если данные прямые параллельны, то cos0^ = cos(^ (/=1,2, ..., я), но тогда, полагая t — / = Т, расстояние г выразится в зависимости только от Т9 и наша задача сведется к определению минимума функции одной переменной Г. Займемся общим случаем и будем считать, что данные прямые не парал- параллельны. В этом случае легко видеть, что когда точка (/, г) удаляется в беско- бесконечность, r-voo, следовательно, по теореме 3 минимум достигается при неко- некоторых конечных значениях / и t. Для определения t и ч воспользуемся основным необходимым условием Получим: ^ — f COS «1+6,— 0,) = G, 2 cos рй (t cos p| — t cos a, -f bi — at) = 0 или, обозначая через ? угол между прямыми: t — «с cos? = 2 cosa4 (bt — g,), \ Jcosy— t = 2C0SP<to — a*>- ] ( Определитель этой системы, равный — sin2 у, отличен от нуля, следовательно, система имеет единственное решение. Так как, с другой стороны, минимум существует, то это и будут те значения t и %, при которых г достигает своего абсолютного минимума. Для решения системы A0) введем добавочные обозначения. Пусть р есть вектор с началом в точке Mt(a^ и с концом в точке Mz(bfr, обозначим через р норму р и через р., и ^ соответственно углы, образованные р с пря- прямыми G) и (&). Система A0) примет вид: t — 1 COS Y = р COS fXj, Отсюда 4 = ^7 (cos ^ — cos у • cos p^), = !i?7 *COSY C0S H ~~ C°S ^' Подставляя найденные значения t и г в (9), получим искомое расстояние между прямыми: ^ г2 = ™- {1 — cos2y — cos2!^ — cos2^ + 2cosy• cos^• cosixj}. A1) Решение задачи остается в силе и для случая трехмерного пространства, ибо формула A1) от числа измерений не зависит. Это обстоятельство можно обнаружить геометрически, можно его обнаружить и прямо из формулы (9), если в этой формуле раскрыть скобки, просуммировать и воспользоваться вели- величинами р, Pi, [*2- Расстояние г примет вид: г* = /2 + *2 -|. & — 2fr cos y -f- 2/nc cos jjl2 — 2/n cos p-A, не зависящий от числа измерений; следовательно, также не зависит от числа измерений пространства и его минимум.
68 ЭКСТРЕМУМЫ ФУНКЦИЙ ТОЧКИ Л-МЕРНОГО ПРОСТРАНСТВА [ГЛ. Ш Легко показать, что прямая минимальной длины, соединяющая точки пря- прямых G) и (8), ортогональна каждой из прямых. В самом деле, направляющие косинусы минимальной прямой будут пропорциональны величииам (costcosfAt — cos fjig)— -^Г"-1 (cos *H"~"costcosi*J + 6| —в| Умножая эту величину на cos ai9 суммируя по i, получим: •^^jT (cos т cos (и — cos kJ — ^r (cos ^ — cos y cos fe) + /> cos ^ = 0. Следовательно, минимальная прямая ортогональна первой данной прямой. То же самое имеет место и для второй прямой. 2. В п-мерном пространстве дана точка M0(xf*) и линейное многооб- многообразие k измерений: х< = а{ + сй (/=1,2, ..., п), A2) где <*i = al\Pl ПГ • zpi суть взаимно ортогональные единичные векторы. Требуется определить расстояние от данной точки до данного многообразия. Расстояние от точки Мо до произвольной точки М многообразия A2) опре-* делится по формуле: Наша задача приводится к определению минимума правой суммы. Когда норма вектора t неограниченно растет, то и вся сумма неограниченно растет; следовательно, по теореме 3 минимум г достигается при некоторой конечной системе значений: ё?\ t^\ ..., $\ Эти значения для tv .-., tk в силу основ- основного необходимого условия будут корнями системы F), которая для данной задачи примет вид: п или = 2*«(*<-*$*) </ = !, 2, .... Л), A3) где bj = а^х + ... + anj€n> a векторы ej образуют координатный крест п-мер- ного пространства. Наша задача приводится к решению системы A3), причем в силу преды- предыдущего, если эта система имеет единственное решение, то найденные значе- значения t будут давать искомый абсолютный минимум для г. Рассмотрим опреде- определитель системы A3): Ьфъ ..., b2bH bhbi, bkb%, ..., bkbh Этот определитель, составленный из попарных внутренних произведений k век- векторов bit Ьъ ..., bfr часто встречается и носит название определителя Грамма.
§ 15] НЕОБХОДИМОЕ УСЛОВИЕ ЭКСТРЕМУМА 69 Докажем сначала, что если векторы bj линейно независимы, то ДфО. Для этой цели произведем ортогональное преобразование пространства так, чтобы в новых координатах п — k последних компонент всех векторов bt обратились в нули *): ь ь^ + ъ{ ++ *' A4) Б силу отмеченных выше свойств ортогональных преобразований при этом преобразовании значения внутренних произведений, а следовательно, и значе- значение Д не изменятся. Кроме того, в силу линейной независимости векторов Ь% будем иметь: Подставляя в выражение Д вместо Ьг значения из A4), по теореме Лапласа с б умножении определителей найдем: Покажем теперь, что векторы bj линейно независимы. Полагая мы можем уравнению A2) придать вид: отсюда видно, что векторы fcy должны быть линейно независимы, ибо в про- противном случае многообразие A2) имело бы меньше чем k измерений. Таким образом определитель системы A3) отличен от нуля, и система A3) имеет единственное решение. Чтобы упростить решение, допустим, что все векторы bj взаимно-ортого- взаимно-ортогональны и нормы их равны единице 2). В этом случае система A3) окажется автоматически разрешенной Я), и мы получим искомые значения параметров tm, соответствующие минимуму п |]() Обозначим через Mt точку многообразия A2), соответствующую найденным значениям параметров. Можно показать, что век юр МцМх ортогонален любому вектору, принадлежащему многообразию A2). Вектор МоМг мы назовем пер- пендикуляром, опущенным с тонки Мона многообразие A2), точка М1 назы- называется ортогональной проекцией точки Мо на многообразие A2). Пусть нам дано многообразие A2) и некоторый вектор АВ, не принадле- принадлежащий данному многообразию. Обозначим через А± и В\ проекции точек А и В на многообразие A2). Вектор Аф^ мы будем называть проекцией век- вектора АВ на многообразие A2). Решение примера 2 дает также сразу ответ на такую задачу: 3. Найти наилучшую аппроксимацию данного вектора г при помощи линейной комбинации k линейно независимых векторов^ *) Это будет тогда, когда первые k векторов: е{, ..., ек' нового координат- координатного креста будут принадлежать 6-мерному многообразию, образованному векторами bf. *) От общего случая к атому частному можно всегда перейти линейным преобразованием пространства параметров \tv ..., th). 3) Отсюда можно также получить доказательство, что Д=)=0.
70 ЭКСТРЕМУМЫ ФУНКЦИЙ ТОЧКИ Л-МЕРНОГО ПРОСТРАНСТВА [ГЛ. Ш Иными словами, требуется определить k параметров tlt гъ ..., 1к так, чтобы выражение 1 г — ha\ — ... — hah \ было минимальным. В такой постановке решение задачи, очевидно, сводится опять к решению системы A3). Используя понятие проекции, решение можно формулировать геометри- геометрически. Обозначим через L линейное й-мерное многообразие, проходящее через векторы аи ..., ак, и пусть гх есть проекция г на!,. В таком случае, принимая параметры tlt ..., th за координаты на многообразии L, компоненты вектора rj и будут искомыми значениями параметров: Т\ «= €Lytx + • -. + Qjfk- f A5) Если все векторы а{ взаимно-ортогональны и имеют нормы, равные еди- единице, то мы получим особенно простые выражения для t4. Умножим и пра- правую и левую части A5) на а*; в силу 8 условий ортогональности полупим: но | d I = 1, следовательно: В рассматриваемом случае решение можно выразить непосредственно через г. Положим / = ri-t-r2; в силу определения гх вектор гг есть вектор, ортогональный к многообразию L, следовательно: отсюда ГС,= Таким образом Черт. 9. ti = га* A6) Если определитель Грамма (см, предыдущий пример) I а/% I равен у то г линейно зависит от векторов щ. При этом коэфициенты tt из (.16) суть коэфициенты разложения вектора г по ортогональной системе векторов: r=**iir*d+:-+<*k(rad. A7) Если определитель Грамма отличен от нуля, то правая часть A7) нам дает наилучшую аппроксимацию вектора г. 4. Пусть плоскость, снабженная прямоугольной системой координат хОу, заполнена средой переменной плотности. Пусть в полосе АЛ * м где п — целое число, / принимает значения 0,1,..., п — 1, скорость света равна v€ и пусть вне полосы ОО<Л* среда не прозрачна и там свет распространяться не может. При этих условиях требуется определить траекторию луча света, проходящего через начало координат и через точку В. Эта физическая задача приводится к задаче на разыскание минимума функ- функции многих переменных, если воспользоваться следующим законом оптики: если рассмотреть всевозможные кривые соединяющие точки О и В, то свет будет распространяться вдоль той кривой, вдоль которой он попадает из О в В, в кратчайшее бремя (принцип Ферма). Отсюда очевидно, чго в каждой полосе М—<!.у<М" , где плотность среды постоянна, свет будет распро- /2 П страняться по прямой.
§ 15] НЕОБХОДИМОЕ УСЛОВИЕ ЭКСТРЕМУМА 71 Обозначая теперь через дг/+1 неизвестную абсциссу точки пересечения тра- траектории с прямой у = М —^— (черт. 9), будем иметь: где tt— время, в течение которого луч света пройдет из точки(xitM—\ точку (Xi+VM -J^— L Поэтому, чтобы попасть из точки О в точку В, световой в луч затратит время: Этим самым время Т выражено как функция п переменных хх, х& ...,*„. В силу принципа Ферма наша задача приводится к разысканию значений х\, х& ..., хп, при которых Т достигает своего минимума. Так как дго = О, то при неограниченном возрастании одного из переменных xt выражение для Т также неограниченно растет. Следовательно, по теореме Вейерштрасса экстре- экстремум существует и достигается внутри области. Для его фактического определения применим основные необходимые условия: дТ _ 1 *i-*i4-i 1 xi+i — xi z==Q Кроме тош, по условию xn = а. Таким образом мы получим систему (п — I) уравнений ел—1 неизвестным. Покажем, что эта система имеет единственное решение. Так как функция Т правильна при всех значениях переменных, то этим самым будет доказано, что решение системы дает нам искомый абсолютный экстремум. Для доказательства единственности будет удобнее уравнениям системы придать несколько иной вид. Обозначим через <р4 угол, который образует луч, проходящий в полосе —**"~ ' <у < — с осью Ох. Очевидно, имеем: л л Отсюда получаем: cos 92 = ~ cos ?l, cos cp3 = ^ cos <p2, .... cos сри = Jb- cos 9»-» известный из элементарной оптики закон преломления. Из этой системы уравнений непосредственно видно, что если мы зададим два значения для <pt: cpt' и 44"><р/, то получаемые при этом из уравнений значения для остальных углов, соответственно у/ и срД будут удовлетворять неравенству <р/'><р<'. Отсюда заключаем, что не может быть двух различных траекторий, соединяющих точки О и В и удовлетворяющих уравнению A8) 1). 5. Пусть в плоскости даны л точек: Мъ УИ2»--«» ^п> требуется найти точку Л так, чтобы сумма ее расстояний до данных точек была минимальной. Вводя прямоугольную систему координат и обозначая через (aif bft коор- координаты точки Mi9 мы сведем нашу задачу к разысканию координат х, у точки А, дающих минимум выражению 1) Мы исключаем случаи отражения от линии раздела и впе нашей полосы считаем среду непрозрачной. Если отказаться от этих гипотез, то получим неоднозначное решение задачи.
72 ЭКСТРЕМУМЫ ФУНКЦИЙ ТОЧКИ Л-МЕРНОГО ПРОСТРАНСТВА [ГЛ. III Рассуждения, приведенные в предыдущем примере, показывают опять, что искомый минимум достигается в некоторой точке плоскости и что для его фактического определения достаточно исследовать систему уравнений, полу^ чаемую из основного необходимого условия существования экстремума: или где у*— угол, образованный вектором AM с осью Ох. Мы предоставляем читателю попытаться доказать, что эта система имеет единственное решение, и тем самым довести принципиальную сторону задачи до конца. Б случае единственного реше- решения — найти хотя бы приближенно числен- численные значения искомых х и у, применяя известные графические или аналитические методы приближения. Здесь мы ограни- ограничимся лишь механической интерпретацией системы A9). Представим себе, что плоскость, в ко- которой расположены данные точки, есть пло- плоскость горизонтальной доски. Просверлим в доске в каждой из заданных точек Мг отверстие н через каждое отверстие про- просунем идеально гибкую нить. К концу каж- каждой нити, расположенному под доской, подвесим гирю произвольного веса р, но одного и того же для всех нитей. Свободные концы всех нитей свяжем. Если теперь, пренебрегая трением, написать условия равновесия построенной механической системы (условия равновесия узла), то мы получим систему A9) *). При такой механической интерпретации задачи первоначальная функция U будет, очевидно, с точностью до постоянного мно- жителя и аддитивной по- постоянной, потенциальной энергией системы. § 16. Условный экстремум Наряду с вопросами разыскания точек, где функция п переменных достигает экстремумов (максимальных и минимальных значений) среди всех значений, принимаемых ею в данной области или в окрестности данной точки, в анализе приходится встречаться с задачей разыскания точек, где функция принимает экстремальные значения среди значений, принимаемых ею на некотором многообразии k измерений k<^n, Такие задачи носят название задач на условный экстремум. Простей- Простейшим классом таких задач может служить задача определения экстре- экстремальных значений функции среди значений, принимаемых ею на границе некоторой я-мерной области (например сферы). Задачи, разобранные нами выше, в отличие от задач на условный экстремум, иногда назы- называют задачами на безусловный экстремум. Дадим более точную по- постановку задачи на условный экстремум. Пусть в /г-мерном пространстве дана функция f(M) точки, пусть, кроме того, в том же пространстве дано многообразие N: ?<(*!» *г> .-.,*„) = О (/=1,2, ...,*) B0) 1) Этой схемой можно воспользоваться, реализуя указанную конструкцию для механического решения системы A9).
§ 16] УСЛОВНЫЙ ЭКСТРЕМУМ 73 п — k измерений. Мы скажем, что функция f в точке Мо многообра- многообразия N достигает своего условного минимума (максимума), если, какова бы ни была точка М многообразия ЛГ, имеем: </(ло [/(лад Данное определение условного экстремума может быть развито вве- введением понятий: относительный экстремум, абсолютный экстремум, стро- строгий экстремум, нестрогий экстремум. Мы не будем давать определений этих понятий, ибо смысл их достаточно ясен из аналогичных опреде- определений теории безусловного максимума и минимума. Мы могли бы из k уравнений B0) выразить k координат, напри- например xiy х2, ..., хк> через остальные координаты: и заменить нашу задачу задачей отыскания безусловного экстремума от функции: Необходимые условия экстремума дали бы нам: dF df V df d^i л Так как в общем случае мы не умеем выражать в ивном виде из урав- уравнений B0) одни координаты через другие, то проведение этого метода на практике встречает значительные затруднения. По этой причине для решения задачи на разыскание условного экстремума был выработан специальный метод — метод неопределенных множителей Эйлера-Лагранжа^ Ввиду большого принципиального и практического значения этого метода как в задачах на максимум и минимум, так и в задачах меха- механики мы остановимся детально на этом методе. Сначала мы дадим два элементарных геометрических подхода к этому методу в простейших случаях, а затем уже дадим общий вывод. Займемся случаем, когда функция / есть функция двух переменных и когда дано одно условие Система уравнений z = f(x.V\\ Bj) определит в пространстве трех измерений кривую линию *у. Покажем,, что в услошю-стациопарных точках касательная к y параллельна плос- плоскости 2=0. Наша задача, таким образом, приводится к определению точек, где касательная к кривой f параллельна плоскости г = 0. В самом деле, если в точке (л;0, у0, z0) касательная к кривой f не принадлежит плоскости z = 2c, то кривая -у пересекает Эту плоскость, и на этой кривой найдутся точки, в которых z>z0, и точки, в кото- которых z < zQ; z0 не было бы экстремальным значением для / (л;, у) на кривой y> т. е. не было бы экстремальным значением /(х,у) при
74 ЭКСТРЕМУМЫ ФУНКЦИЙ ТОЧКИ П-МЕРНОГО ПРОСТРАНСТВА [ГЛ. Ш Допустим, что (лг0, у0, z0) есть искомая точка, допустим еще, что в плоскости хОу точка (хо,уо) есть правильная точка плоской кривой Уравнение касательной к кривой «у определится из уравнений: y— Уо)> Если касательная к у в точке (хо> у0, z0) параллельна плоскости z = 0, то для нее 2 = z0 или в силу B2) в экстремальной точке: Л (*-*о) +/, С—Л) = °- B3) Из B2) и B3) следует: А »2к.,» X B4) или Л—*?*=о, Л—Ч = о- Полученные нами условия B4) суть условия того, чтобы в точке (хо* Уо) Достигался условный экстремум. Таким образом задача разы- разыскания экстремальных точек сводится к совместному решению системы {24) и уравнения у (х, у) = 0 относительно хг у, X. Вместе; с тем эти условия также суть необходимые и достаточные условия для того, чтобы точка {ХфУ^ была стационарной точкой функции: /—X?. В этом сведении задачи на условный экстремум к задаче на без- безусловный экстремум и состоит метод Эйлера-Лагранжа. Преимущество его перед указанным выше заключается в том, что здесь нам не надо пользоваться неявными функциями. Сейчас мы дадим другой геометрический вывод метода Лагранжа- Эйлера, который не требует трехмерного пространства, при этом мы будем, как раньше, предполагать, что условно-экстремальные точки суть правильные точки кривой <р (ху у) и не дают безусловного экстремума функции f(x,y). Допустим, что точка (х0, у0) есть условно-экстремальная точка, и пусть / (лг0, у0) — С. Построим в плоскости хОу кривую / (л:, у) = С и кривую <?(хуу)~0. Эти кривые по условию проходят через точку (лг0, у0); докажем, что они в этой точке касаются. В самом деле, допустим противное, что кривые в рассматриваемой точке образуют конечный угол а. Тогда кривая v — О пересекает кривую /=С в точке (хо,уо), и, следовательно, в окрестности этой точки она пере- переходит из области, где f<f(xOiyo) — C, в область, где/> С; следова- следовательно, точка (xOfyo) не есть условно-экстремальная. Итак, в точке (xOiyo) кривые /=С и ср = О касаются, их каса- касательные:
§ 16] условный экстремум 75 совпадают; мы получим снова уравнения Лагранжа B4): Используя данные выше элементы аналитической геометрии п-мер- ного пространства, можно без труда распространить геометрический вывод метода Эйлера-Лагранжа на общий случай, когда имеется услов- условный экстремум функции п переменных при *(&<я) условиях. Условно-стационарная точка. Аналогично теории безусловного мак- максимума и минимума является чрезвычайно полезным ввести более широ- широкое понятие условно-стационарной точки функции. Мы скажем, что функция /(М) на многообразии N в точке Мо до- достигает условного критического значения, если, какова бы ни была точка М, принадлежащая N и бесконечно близкая к Мф разность [f(M)—/CMq)] есть бесконечно малая высшего порядка по сравнению с г{М9 Л40). Всякую точку, где функция достигает условного крити- критического Значения, мы будем называть условно-стационарной точкой. Перейдем теперь к исследованию общего случая условно-стационар- условно-стационарной точки. Пусть нам задано многообразие N (п — k) измерений: («—1,2,...,*). B5) Мы будем рассматривать наряду с N линейное многообразие LA : O, B6) касательное к TV в точке А0(х[^9х^, ..,,лДО). Мы будем все время предполагать, что точка Ло есть обыкновенная точка N, т. е.э что в этой точке матрица /djA //=1, 2, ...,*\ \dxj) Vjf=l, 2, ...9п) имеет ранг k. Рассмотрим функцию / точки я-мерного пространства. Мы пола- полагаем, что / имеет диференциал в точке Ао: f(A) — f(A0) = df(A0) + ег (Л, Ло), где е -> 0 при г (Л, Ло) -> 0. Многообразие/(Л) = /(Ац) имеет в точке Ло касательное линейное многообразие LA : По направлению всех лучей А0Т, лежащих в VA^ производная от /исче- /исчезает (если только Ао не есть безусловная стационарная точка для функции/)• Напомним читателю, что в некоторой окрестности точки Ао каждой точке В многообразия N отвечает точка Вх многообразия ?*л , и обратно, причем г(В9Вг) есть величина высшего порядка малости по сравне-
76 ЭКСТРЕМУМЫ ФУНКЦИЙ ТОЧКИ Л-МЕРНОГО ПРОСТРАНСТВА [ГЛ. Ш нию с г(ВуА0) и г(ВиА0). Если функция / удовлетворяет в окрест- окрестности Ао условиям Липшица *), то где М — константа, г(Вг Вх) есть величина высшего порядка малости по сравнению с г (Ло, В), Поэтому, пренебрегая величинами высшего по- порядка по сравнению с г (Л, В), мы можем заменять взаимно f{B) и /(#,)¦ ТЕОРЕМА I. Если Ао есть правильная тонка N и если Ао есть условно-стационарная точка функции f на N, то Ао есть также условно-стационарная точка / на LA , и обратно. В самом деле, если Ао есть условно-стационарная точка функции / на 7V, то для точек В многообразия TV имеем: равенство с точностью до величин порядка малости выше г (В, Ло). Но в силу сделанного выше замечания для точек В/ многообразия LA мы имеем также: т. е. Ао есть стационарная точка на LA . Вполне аналогично доказывается вторая часть теоремы. ТЕОРЕМА 2. Если точка А^ есть условно-стационарная точка f на N, то LA лежит в линейном многообразии B7), касательном к многообразию /=/(Л0). Прежде всего в силу предыдущей теоремы Ао есть условно-стацио- условно-стационарная точка функции /на LA. LA есть ^-мерное линейное много- многообразие, и если точка Ло есть на нем стационарная точка функции /, то производная f(A0) по любому направлению AQTt принадлежащему LA, равна нулю, а это значит, что луч А0Т принадлежит многообра- многообразию B7). Значит, и LA принадлежит многообразию B7). Эту теорему можно формулировать несколько иначе: в условно-ста- условно-стационарной точке Ао функции f на N многообразия /==/(Л0) и N со- соприкасаются. ТЕОРЕМА 3. Если Ао — обыкновенная точка N—естьусловно-ста- ционарная точка /, то существуют k констант Хх, Ц>..., \h таких, что в точке Ао > -щ (/+ 2>ч?«) = 0 (/=1, 2,... , п), B8) или, что то же самое: <Р,) = 0. B8') Иначе формулируя: существуют такие постоянные Xlf X2l..., \kt что Ао есть безусловно-стационарная точка функции: *) Условие Липшица во всяком случае удовлетворяется, если в окрест- окрестности Ао частные производные функции / ограниченны.
§ 16] УСЛОВНЫЙ ЭКСТРЕМУМ 77 Рассмотрим два случая: 1) Ао есть безусловно-стационарная точка /; в точке Ао df/=O. Достаточно принять все \ = 0, чтобы удовлетворить требованиям теоремы. 2) Ао не есть безусловно-стационарная точка/; тогда в силу теоремы 2 линейное многообразие LA, определяемое уравнениями B6), заклю- заключено в линейном многообразии l'a . В силу выведенных в конце § 1 условий включения ^-мерного линейного многообразия в (п—1)-мерное следует существование к констант: lv Xg,..., Xftf для которых П°> B8"> откуда следует уравнение B8) или B8'). ОБРАТНАЯ ТЕОРЕМА. Если удовлетворяется уравнение B8), то Ао есть условно-стационарная точка f на N Это почти очевидно. В самом деле, на N все ?у = 0; функции ф=/—2ty?y и / на N совпадают; условия B8) показывают, что Ао есть безусловно-стационарная точка для ф, тем более и условно-стацио- условно-стационарная точка для ф на N. Так как на N ^=/, то теорема доказана. ТЕОРЕМА 4. ЕслиА0 — обыкновенная точка многообразия N—есть точка условного экстремума для функции/ на N, то Ао есть условно* стационарная точка / на N. В самом деле, пусть Ао не является условно-стационарной точкой / на N. Тогда на LA существует направление А0Т9 по которому/'(Л 0) = = С>0, обратное направление AOTV по которому /' (Ло) = — С<0. Для точек Ву лежащих на Л0Г, имеем: f(B) —/(Ло) « Сг(В0У А$ . B9) (приближенное равенство с точностью до величины порядка выше Н 0)] Обозначая через ?, точку N, отвечающую нашей точке В, мы в силу сделанного выше замечания можем в приближенном равенстве B9) заменить f(JS) через f(Bx): Последнее равенство верно с точностью до величин порядка выше г(В9 Ло), следовательно, при достаточно малом /•(?, Ао) Аналогично, если Вг есть точка противоположного луча А0Т9 a J5/ — соответственная точка N, то Таким образом в любой окрестности Ао найдутся точки В17 Вг'9 для которых приращения функции / имеют противоположные знаки, т. е* Ао не есть точка экстремума / на N. Теорема доказана.
78 ЭКСТРЕМУМЫ ФУНКЦИЙ ТОЧКИ П-МЕРНОГО ПРОСТРАНСТВА [ГЛ. Ш В силу теоремы 3 в точке условного экстремума функции / на N удовлетворяются п уравнений B8). Таким образом для определения условного экстремума или, общее, условной стационарной точки функции f(x19 х&..., хп) на многообразии N: ), C0) мы имеем п -{- k уравнений: k уравнений C0) многообразия и п усло- условий B8). С их помощью мы находим значения п координат условно- стационарной точки и k множителей Эйлера-Лагранжа: Хи Х^,,..., Х&. В качестве первого примера на приложение метода Эйлера-Лагранжа раз- разберем следующую задачу. Задача 1. Определить критические аначе.ния функции F{xv л:^..., хп) при условии y(xv л*2,.. ., хп) = 1, где F и у суть однородные функции соот- соответственно измерений k и /. Для решения составим уравнения: 2...., хп) = \. C2) Умножим /-е уравнение системы C1) на jcj и все полученные уравнения по- почленно сложим, получим: L^-dx-^^L^-dxT' В силу известной теоремы Эйлера об однородных функциях: Отсюда, пользуясь уравнением C2), получим: kF(xb xi9..., хп) = Щ = }J или F(xv х^..., хп) = X —. В случае / = ? множитель X для данной экстремальной точки равен значению функции F в этой точке. Возвращаясь к общему случаю, встаоляя найденное выражение X в систему C1), C2), получим уравнения для определения стацио- стационарных точек. Решением этой задачи мы воспользуемся при изучении квадратичных форм. В качестве второго примера разберем условия равновесия системы п точек, подчиненных k неосвобождающим евнзнм. Задача 2. Дана система п точек Мг{хг, yit z{) (/ = 1, 2,..., п). подчинен- подчиненная k связям: 9jix* Уь *1-• •» *«. Уп> zn) = 0 (; = 1, 2,..., к). На систему действуют силы, зависящие только от положения точек сис- системы и обладающие потенциалом; требуется определить положение равно- равновесия системы. Обозначая через Pt силу, действующую на точку Мь и через Xif Yu Zf — ее компоненты, по условиям задачи имеем: где U есть потенциальная энергия системы и является функцией Зл координат точек системы. В силу указанного принципа возможных перемещений для
§ 16] УСЛОВНЫЙ ЭКСТРЕМУМ 79 равновесия необходимо и достаточно, чтобы точка A (xf*a у^\ я^,..о *пУ пространства Zn измерений была для функции {] условно-стационарной точкой, причем координаты точки А будут определять положение системы. Таким образом в силу развитой выше теории условного экстремума наша задача сразу приводится к решению системы уравнений: = 0, дЦ dU vT Черт. 11. Заметим, что решение системы дает не только положение равновесия, но полу- полученные при этом значения Х>- дают также реакции связей. Разберем в частности следующий пример. Пусть даны п однородных тяжелых стержней AqAv A^A^ ..., АПт.хАп оди- одинаковой длины, образующих некоторый полигон и сцепленных шарнирами. Предположим, что свободные концы первого и последнего стержня закреплены шарнирами в заданных точках Ао и Ап. Требуется определить положение равновесия данного шарнирного многоугольника. Обозначим через / общую длину звеньев. Введем систему прямоугольных координат хОу, направляя ось Ох горизонтально, ось Оу вертикально вверх (черт. II). Обозначим через ?* угол, образованный /-м звеном Ai_1Ai полигона с осью Ох, и через (*0, ^0), (xw уп) координаты точек Ао и Ап. При этих обозначениях ордината центра тяжести /-го звена будет: Следовательно, ордината центра тяжести системы определяется по формуле: У\уг \ I  sin j sin < • ¦ • + (УО +1 Sin Y! + ... -f у Sin <ря) j =: Таким образом, применяя принцип Дирихле (см. § 12), наша задача приво- приводится к разысканию минимума функции п переменных <р1# <f>2»---> <pn. В силу условий задачи эти переменные должны быть подчинены условиям, чтобы конец ломаной находился в заданной точке Ап. Эти условия будут: ] C3)
80 экстремумы функций точки п-мерного пространства [гл. Ш Применяя метод множителей Эйлера-Лагранжа, получим: д Отсюда или, полагая получим: 1 -te- -teДля определения неизвестных |^и (^ достаточно подставить найденные выражения для <р, в уравнения C3). Так как cos <?f = —- sin то система уравнений для определения ^ и (^ примет вид: п 1 хп — j /н-Оч--'.*"*-„ — .Уо C5) Задача 3. Найти максимум определителя Грамма !), обставленного из я векторов <*1. «2» ••» «п» условии, что нормы всех векторов фиксированы. Мы можем считать, что все векторы а{ расположены в /z-мерном евклидо- евклидовом пространстве: <*i = *a*i+...+tfif«e« («-1, 2,..., /г). В этом случае п* переменных при п условиях: Таким образом наша задача приводится к разысканию максимума функции 1*</1 C6) п = |Oil8 (/=1, 2.....Я). C7) J) См. § 12, задача 2. 2) Под символом |л, j мы, как раньше, понимаем определитель, общий элемент которого есть а^.
§ 16] УСЛОВНЫЙ ЭКСТРЕМУМ 81 Разложим определитель C6) по элементам /-Й строчки: где Aij есть минор, соответствующий элементу а^. Поставим себе задачу найти максимум выражения C8) при условиях C7), считая AfJ- фиксированными (это возможно, ибо Ау от aih не зависит). Условие C7) определит в пространстве (я«,..., ain) сферическое многообразие [п—1) измерения. Нам нужно, таким образом, искать максимум функции, заданной на этом замкнутом (п — 1)-мерном многообразии. Из этой постановки в силу теоремы 3,§ 14 сразу заключаем, что искомый мак- максимум достигается, и для его определения применим метод Эйлера-Лагранжа: ^ 0 = 1,2,..., и). Отсюда заключаеь<, что искомый максимум достигается, когда элементы а^ пропорциональны их минорам A{j. Покажем, что в этом случае все векторы а{ друг другу ортогональны. Имеем: ^ 2Г 2d a*j mJ ' з Если iz^m, то справа мы имеем определитель, у которого i-я и m-я строки совпадают, следовательно, <М*т = 0 при /фда. Отсюда |= По,2. Это и есть искомый максимум определителя Грамма. Отсюда, какова бы ни была таблица чисел а^ш имеем: 3 Полученное неравенство называется неравенством Гадамара. Дадим геометрическую интерпретацию доказанной теоремы. Для утой цели введем понятие объема /ьмерных тел, расположенных в /7-мерном евклидовом пространстве. Объемом «-мерного тела D назовем /2-кратный интеграл: Т..,! взятый по телу D. Из этого определения вытекает, что объем единичного //-мерного куба равен единице; объем параллелепипеда равен модулю определи- определителя липейного преобразования, перезодящего единичный л-мерный куб в рас- рассматриваемый параллелепипед, т. е. если ребра параллелепипеда суть векторы то объем V параллелепипеда будет равен: ап\ °«3 • • • ап\ Приняв это определение и заметив, что сумма квадратов элементов /-й строчки огфеделителя V еаь квадрат длины /-го ребра параллелепипеда, мы в силу неравенства Гадамара получаем такой результат:
82 ЭКСТРЕМУМЫ ФУНКЦИЙ ТОЧКИ «'МЕРНОГО ПРОСТРАНСТВА [ГЛ. ИГ Среди всех параллелепипедов, имеющих ребра данной длины, прямоуголь- прямоугольный параллелепипед имеет, наибольший объем. Задача 4. Изопери метрическая задача для полигонов. Среди всех замкнутых полигонов с п вершинами данного периметра найти momt который ограничивает наибольшую площадь. Обозначим вершины полигона через Aj{xj, yj) (у =* 1, 2,..., п\ Ап»1 *= А{У,. длину стороны AjAj+i через/у = f/r(xy^_1 — -^Д2 + UV+i —yj)\ периметр по- полигона через /, а его площадь через S. Задача сводится к нахождению максимума S при условии: 2', = '- C9) Прежде всего заметим, что полигон максимальной плошадн существует; мы можем, не меняя площадей и периметров полигонов, фиксировать одну из вершии; тогда совокупность полигонов данного периметра расположится в ограниченной части плоскости. Легко убедиться, что совокупность этих по- полигонов компактна, и мы можем применить теорему ВеЙерштрасса о существо- существовании абсолютного максимума. A priori возможны два случая: 1. У экстремального полигона все {, + 0. 2. У экстремального полигона некоторые стороны вырождаются в точки,, т. е. некоторые ij = 0. Рассмотрим первый случай. Введем следующие обозначения *): Zj = (xj+i — *,.) +10'i+1 — yj), j -- . I (/ = V^-1). D0> >• Очевидно, комплексный вектор Zj есть вектор равный и параллельный AjAJ+1. Поэтому _ Ъ^1^^ D2) где 4j — угол между у-й стороной AjAj+1 и осью Ох. Площадь S, ограничен- ограниченная полигоном, равна (с точностью до знака): о 1 Наша задача о нахождении экстремума D3) при условии C9) по правилу Эйлера-Лагранжа сводится к решению системы уравнений: U =1.2 я). D4> Заметив, что в сумме D3) лу входит только в j-ti и (у — 1)-й члены, что в сумме 2^ только члены lj, 13_% содержат Xj, мы получим из D4): Xjt | *~* Хш X* — Xj t yj+i -У,.+"'- '¦). ' - >---j^- =0; D5> аналогично: 7 X -j — 0. D5'> Weierstras^ Vorlesungen uber Variatlonsrechnung, § 6.
§ 16] УСЛОВНЫЙ ЭКСТРЕМУМ 83 Из D0), D1), D5), D5') получаем: или «О+¦?)¦—•»('-?)• Аналогично: ^+ D6'> Перемножая полученные равенства D6), D6х), мы в силу D1) получим: Отсюда сразу следует: или, полагая 7 = 2, 3,..., п: /,== — = const.: все стороны равны между собою. Подставив в формулу D2), получаем: Отсюда JL-/fi-V*y D7) * > / где fy — 9j_i есть угол между Aj^Aj и Л,^.^. Так как все /j -=• — ,то из D5) следует = const. или [сравнивая с формулой D7)J: ?j - 9y_i = const. Все углы полигона равны между собою, т. е. наш полигон правильный. Теперь рассмотрим второй случай. Пусть А? сторон экстремального полигона обращаются в нуль. Наш полигон обращается в полигон ел — k неравными нулю сторонами, а в силу предыдущего он был бы правильным полигоном en — k сторонами. При равном периметре, как легко убедиться, правильный полигон с большим числом сторон имеет площадь, превосходящую площадь правильного полигона с меньшим числом сторон, поэтому максимальная пло- площадь достигается при заданном периметре I на правильном п-уголънике. Задача 6. Неравенство Минковского. Докажем, что, каковы бы ни были числа хъ х%?ш.., хИ, yt, j/of..., y,t и каково бы ни было число р^-1, имеет место следующее неравенство: причем знак равенства достигается только в случае, когда все числа у* про- пропорциональны числам xt (случай, когда все числа одной из систем xt иди yi равны нулю, мы относим к случаю пропорциональности).
84 ЭКСТРЕМУМЫ ФУНКЦИЙ ТОЧКИ «-МЕРНОГО ПРОСТРАНСТВА [ГЛ. III Для случая р = 1 неравенство D8) вытекает из элементарных свойств абсо- абсолютных величин. Для /7 = 2 оно выражает известное неравенство между дли- длинами сторон треугольника в л-мерном евклидовом пространстве. Для доказа- доказательства неравенства в общем случае фиксируем xlf лг*,..., хп и найдем мини- минимум разности: при условии 9 = 2|л|я Покажем, что при любой системе значений х, и при любом К^>0 этот минимум достигается, когда yi пропорциональны х{. Отсюда будет, очевидно, следовать, что этот минимум равен нулю, а так как /С — любое число, то этим самым неравенство D8) будет полиостью доказано. Условный минимум F достигается в тех же точках, что и условный максимум при условии: Так как 2(~Л^~) ^^' то каждая ™чка замкнутого многообразия <р = К есть правильная точка этого многообразия, следовательно, точка, дающая абсолютный максимум Ф при условии 9 = /С существует и может быть получена методом множителей ЭЙлера-Лагранжа. Имеем: -?—*-?-~0. D9) дуг ду( х ' Для выполнения диференцирования заметим, что искомый максимум до- достигается, когда знаки х{ и у{ попарно одинаковы, ибо в противном случае, заменяя ^у, на — .)'*, мы, не меняй ?, увеличим Ф. Отсюда при разыскании макси- максимума мы можем считать все xt и уг неотрицательными. Равенство D9) примет вид: т. е. в искомой точке \у\\ пропорциональна \xi-*ryi\, но так как xtt yt неот- неотрицательны, то отсюда следует пропорциональность yt мхг-\-уг, а значит, про- пропорциональность yt и х{. Принцип взаимности* Как мы убедились выше, если точка Ао есгь условно-стационарная точка функции <?0(хи дг2,..., х„) на много- образин N: ?*(*!> X2f • • , *п) = 0 (*= 1, 2, . . . , ^ k < fl) и если Ао есть правильная точка JV, ю в этой точке имеем: ¦щ (?о + ДК?<) = О (J = 1, 2,...,«), E0) где )ч — некоторые константы. 1) Заметим, что при />>1 функция .у^ имеет непрерывную производную наконец, ---|^^= Um^Jiii^^o. Аналогично \хй+уг\* имеет при непрерывные производные по vf. Поэтому F и ^р обладают непрерывными про- производными по всем у{.
§ 16] УСЛОВНЫЙ ЭКСТРЕМУМ 85 Умножая обе части уравнения E0) на отличную от нуля константу Со и обозначая: Сг = С0\1У мы можем придать уравнению E0) форму: -Jr(.2С1?1) = 0 (;= 1, 2,.... и), E1) однородную относительно Со, Cv C2,..., Ск и симметрическую отно- относительно функций 9о> ?i>---> %• Если мы будем искать экстремум одной из функций ^ при усло- условии, что остальные функции <pj> j ={= «\ обращаются в нуль? то мы при- придем к тому же уравнению E1). В этом заключается принцип взаимности Эйлера. Особый случай. Мы предполагали, что в условно-стационарной точке Ао ранг матрицы (д\ /=1, 2,..., k —1, 2 n равен k (Ао—правильная точка N). Обратим внимание, что в общем случае уравнение E1) определяет вместе с уравнениями <р< = 0 не только условно-стационарные точки функции <р0 на N, но также (если С0=0) все особые точТси многообразия N, т. е. точки, в которых ранг мат- матрицы E2) меньше k. Рассмотрим три возможных случая: 1. Особая точка Ао многообразия N есть безусловно-стационарная точка функции %« Уравнение E1) удовлетврряется, если положить С% = С2 =5... = Ск = 0. Неоднородное уравнение E0) удовлетворяется, если положить Xj — Х2 = ... = Хл = 0. 2. Особая точка Аа есть условно-стационарная точка «ш но не есть безусловно-стационарная точка. Мы покажем на простых примерах, что уравнение E0) может не удовлетворяться. Таким образом в случае введения особых точек уравнение E0) перестает быть необходимым условием для стационарных точек. 3. Особая точка AQ не есть условно-стационарная точка <р0 на /V. Уравнение E0) не удовлетворяется, уравнение E1) удовлетворяется при Q = 0. Итак, уравнение E0) при введении особых точек много- многообразия N перестает быть достаточным условием стационарности точки. Поясним наши рассуждения примерами; полагаем л = 2, k •= 1. I. Пусть y^x<f и пусть многообразие N есть пара прямых: i^jtf-jtf^O. E3) Уравнения E1) примут внд: Уравнения (эЗ) и E4) имеют единственное совместное решение: ^ = дг2 = 0. E5) Точка E5) — начало координат — есть безусловно-стационарная ючка 'fo на плоскости и в то же время особая точка N. Как легко убедиться, начало коор- координат есть минимум у на N.
86 ЭКСТРЕМУМЫ ФУНКЦИЙ ТОЧКИ «-МЕРНОГО ПРОСТРАНСТВА [ГЛ. III Будем теперь рассматривать другую функцию 9о (*) = х "а том же много- многообразии N E3). Уравнение E0) в этом случае примет вид: Система уравнений E3) и E6) относительно л, хи хг несовместна. Однород- Однородная же форма уравнений E1) лает нам систему: ее решение, совместное с уравнением Eо), будет; Q 0 0 т. е. определит особую точку — начало коор- 1 динат О. Но начало координат не есть условно-стационарная точка ?о на № В са- самом деле, если М (xlt x? есть некоторая точка #, то Черт. 12. То W — V (О) 1 = I *2; = -±=- г (О, М). Приращение ^о (Л!) | 9о (О) есть величина первого порядка сравнительно с г(Of M) 2. Пусть задана функция на полу кубической параболе # (черт. 12): *!* —*./ = 0. Уравнение E0) дает нам: 1 + 2>лг2 = 0, >^ = 0. Сисгема E8) и E7) несопместнд. Однородные уравнения E1) дают нам совместно с E7): E7) E8) Мы попадаем в начало координат. Как легко убедиться, начало координат есть условно-стационарная точка.
ГЛАВА IV КВАДРАТИЧНЫЕ ФОРМЫ И ВТОРОЙ ДИФЕРЕНЦИАЛ §17. Билинейные и квадратичные формы Рассмотрим функцию J(x+ у) от двух векторов х(хх, х2,... , х^)9 Ум &>••-> У*>) в w-мерном пространстве, или, что то же самое, от 2л переменных: х„ дг2, ... , хп; ylt у» ... , уп, J(x, y) = J(xv х„ ... , хп; ух, у»..., уп). Билинейная форма. Функция J{x, у) называется билинейной, если она линейна относительно х и относительно у в отдельности, т. е. отно- относительно каждой из групп переменных: xv х2> ..., хп; yv у2, ..., уп. В силу условий линейности имеем: t у'-\- , У), A) , ly) =*kJ(x,lx)*=kl-J(x, у) B) и /—скаляры). Из A) и B) следует: Обозначая через ev е.2, ..., ^п единичные векторы в /г-мерном про- странстве^ чер^з л:4 и yi (*= 1, 2, .. ., я) — компоненты векторов дг, j;, в силу C) имеем: Un J(x,y) = %bljxiyJ, D) где bu=-J(ev ej). Числа bfj называются коэфициентами билинейной формы. Билинейная форма называется симметрической, если она удовлетво- удовлетворяет равенству: В этом случае, полагая х = е„ у — е^, получаем: Ьу = Ь^> т. е. матрица, составленная из коэфициентов b%i симметрической билинейной формы, симметрична.
88 квадратичные формы и второй диФБРВнциАл [гл. IV Квадратичная форма. Если оба аргумента х, у в билинейной сим- симметрической форме J(x} у) совпадают: х—у, то форма J(x, x) назы- называется квадратичной. Обозначая J(x, х) — J(Jt) — J(xi9 лг2, ..., xn)9 получаем в силу ра- равенств A) и B): а формула D) принимает вид: Квадратичная форма называется формой нормального или канонического вида. Многообразие, определяемое уравнением: называется многообразием второго порядка. Пусть точка А(х®\ .. .f xj®) принадлежит этому многообразию, тогда Найдем касательное линейное многообразие LA в точке Л к много- многообразию J(A) = c. Уравнение LA имеет вид: или, так С другой как стороны, п V ( 1,п l.n dJ(A) ах, т (ок dJ(A) 71 = V/> xA 3 = 1 Уравнение LA примет вид: =c. E) Примером квадратичной формы может служить второй диферен- циал функции f(M) точки в «-мерном пространстве, имеющий вид:
§ 17] БИЛИНЕЙНЫЕ И КВАДРАТИЧНЫЕ ФОРМЫ 89 Квадратичная форма называется неотрицательно^ если она никогда не принимает отрицательных значений. Например, 11 являются неотрицательными квадратичными формами. Неотрицательная форма J{x) называется положительно определенной, если она обращается в нуль только при х = 0, т, е- при xt=s^ = ... . # # =лгя = 0. Форма Art2-f х?~\- - - - +*п2 есть форма положительно- определенная, форма B л;,J уже не будет положительно определенной. Аналогично определяются неположительные и отрицательно определе- определенные формы. Условия максимума и минимума. Пусть точка Al(av д2, ...,ар} ^-мерного пространства есть стационарная точка функции f(M)> где / обладает непрерывными частными производными первых двух порядков по всем переменным. M'{ax-\-hXJ .. . >я„-ЬЛЯ) есть другая точка этого пространства; так как-^р—^ = 0 (/== 1, 2, ..., /г), то KAY)-ЯМ) = 1 V *Ш К . К. + е, G> где е есть величина порядка выше второго сравнительно с г (М\ АГ). Поскольку первый диференциал функции f[M) в точке М исчезает, главной частью приращения f{M')—f{M) становится квадратичная форма F), следовательно, она в основном определяет поведение функции / в окрестности точки М. ТЕОРЕМА. Для того чтобы стационарная точка М(а^) была точкой относительного минимума функций /, необходимо, чтобы второй диференциал F) был неотрицательной формой, и достаточно, чтобы второй диференциал был положительно определенной формой. В самом деле, пусть для системы значений hv Л2, .-., hn имеем: Обозначив через Mt точку (at-\-thv --., яЛ + 'АД имеем в силу G): где е/ есть величина порядка выше второго сравнительно с r{Mv Л/) = = I * | V S h?» т- I * | V S h?» т- е- величина порядка выше второго сравнительно с L При достаточно малом / знак приращения / (Mt)—/(Ж) совпадает со знаком главного члена — k42> т, е, f{Mt)<f(Ai) и М не является, сле- следовательно, точкой минимума. Аналогично доказывается достаточное условие. Рассмотрим поведение формы F) на сфере 2 V= *• ^ силУ те0Ремы Вейерштрасса на сфере имеется точка Мо (^/0)), в которой форма F) достигает своего минимума на этой сфере. Минимальное значение X формы F) в этой точке по
90 КВАДРАТИЧНЫЕ ФОРМЫ И ВТОРОЙ ДИФЕРЕНЦИАЛ [ГЛ. IV условию теоремы должно быть положительным. Поэтому мы имеем: при условии 2)А,*—I. ПРИ условии же 2а42== Поэтому, если г {Mv M) = t, то где з — величина порядка выше второю по сравнению с /. При доста- достаточно малом t^t0 знак f(Mt)—f(M0) совпадает со знаком положитель- положительного слагаемого X/2. Следовательно, во всякой точке сферы радиуса /0 вокруг точки Мо значение функции / больше значения / (Мо), т. е. М0 есть точка относительного минимума функции /. Доказанная теорема показывает, что в весьма широком классе слу- случаев вопрос о том, будет ли данная стационарная точка давать максимум или минимум, решается до конца изучением квадратичной формы. Прежде чем заняться общим случаем, остановимся на простейших случаях п = 2, л = 3, причем, кроме выявления достаточных условий для минимума и максимума, мы дадим геометрическую структуру ста- стационарных точек. § 18. Классификация стационарных точек для функций двух и трех переменных Пусть дана форма п переменных: Приравняв ее какой-нибудь постоянной величине с, получим много- многообразие (п — I) измерений: Л> = *> которое мы условимся называть многообразием второго порядка (см. § 10). Для случая: и = 2, 3 форму удается путем известных из аналитической геометрии преобразований (поворота осей) привести к ^каноническому" виду! где yt—новые переменные, выражающиеся через старые по формулам лоиорота осей. Рассмотрим случай п = 2. Форму J (хл, х^ можно привести к виду J —^lA^-f" c%y?* приравняв ее единице, получим: a) эллипс —в случае ^!>0, cft>0; b) гиперболу — в случае ^ > 0, с% < О, c) мнимый эллипс — в случае с% < О, сй < О; d) пару параллельных прямых—в случае q = 0, с2>° или с, > О, ° е) пару мнимых прямых— в случае сх < О, с± = О, или q = 0, с2 < О.
§ 18J КЛАССИФИК. СТАДИОН. ТОЧЕК ДЛЯ ФУНКЦИЙ ДВУХ И ТРЕХ ПЕРЕМЕННЫХ 91 Это обстоятельство лежит в основе классификации стационарных точек функций двух переменных. Пусть функция f(xv х%) имеет стационарную точку А, т. е. пусть частные производные ^-, J- в этой точке равны нулю. Для простоты примем эту точку за начало координат и, кроме того, примем, что в на- начале координат /= О. В окрестности начала координат имеем: / (хг, х+) = ~ (а где а е есть бесконечно малая порядка выше второго, если считать, что V^r^-f- х^ есть бесконечно малая первого порядка. С помощью пово- поворота осей можно привести стоящую в скобках форму к каноническому виду: тогда в новых переменных yv разится в виде: / Приравнивая / некоторому постоянному hx получим линии равных sum- нений функции / или, как их называют, линии уровня. Пренебрегая малыми высших порядков, в окрестности начала координат уравнения линий уровня будут. функция / в окрестностях начала вы- выРассмотрим все отмеченные выше пять случаев: а) сх > О, с% > 0. Линий уровня для h < О не существует, т. е. в окрестности начала не существует точек, в которых А<0. Значит, начало координат, в котором /=0, будет точкой минимума функции/. Линия уровня для /= 0 сводится к изолированной точ- точке— началу координат. При А>0линии уровня представляют собой (с точностью до малых высшего порядка) подобные между собой эллипсы (черт. 13). Если рассмотреть в трехмерном про- пространстве (aTj, дг2, х$) поверхность v — f(x х \ Чеот 13 то эта поверхность, в окрестности начала целиком расположенная над плоскостью х3 == 0, касается этой плоскости в одной точке, именно в начале координат.
КВАДРАТИЧНЫЕ ФОРМЫ И ВТОРОЙ ДИФЕРЕНЦИАЛ [гл. IV Ь) Случай, когда сх и с2 имеют разные знаки, например сг = т? > 0г с —-— я2<о, дает иную картину. При Л=гО линия уровня /=0 представляет собой (с точностью до малых высшего порядка) пару прямых: пересекающихся в начале координат. Стационарная точка — начало коор- координат— есть двойная точка (узел) линии уровня/=0. ПриА = /2>0 система линий уровня /== Р дает систему гипербол: асимптоты которых суть прямые тУ\ ± *% —0. При Л = /* < О мы получим систему сопряженных гипербол: Линия уровня /—0 разбивает окрестность начала координат на че- четыре части (черт. 14), причем в частях, помеченных на чертеже римскими цифрами I и III, />0; в частях II и IV /<0. Совокупность точек, в которых / имеет меньшее значение, чем в точке экстре- экстремума, назовем областью меньших значений; в нашем случае область меньших зна- значений распадается в окрест- окрестности стационарной точки на две части II и IV; область больших значений, т. е. сово ^ купность точек, в которых / принимает большие значения, чем в стационарной точке (в нашеы случае />0), тоже распадается в окрестности стационарной точки на две части I и III. Проведя вокруг начала Черт. 14. круг К достаточно малого ра- радиуса, мы видим, что, оста- оставаясь внутри этого круга, мы не можем соединить пару точек А и В> взятых из областей I и III больших значений, дугой остающейся целиком в области больших значений. Любая дута внутри Ку соединяющая Аи Вг обязательно заденет линию уровня /= 0. Точно так же, если мы возьмем в областях II и IV по точке С и D> то мы их не можем соединить» дугой СД остающейся внутри круга А' и не покидающей область мень- меньших значений. Область меньших значений, равно как и область больших, значений, попавшая внутрь круга К, представляют собой согласно тер- терминологии, принятой в топологии, несвязные области.
§18] КЛАССИФИК. СТАДИОН. ТОЧЕК ДЛЯ ФУНКЦИЙ ДВУХ И ТРЕХ ПЕРЕМЕННЫХ 93 Начало координат есть стационарная точка, существенно отличаю- отличающаяся от случая максимума или минимума; мы встречаемся с простейшим здесь типом минимакса. В трехмерном пространстве (gpjfg, *^) поверхность лга=/(хр лг2) касается плоскости лгЛ=О в гип^болияеекой точке» ( с) Случай с, < 0, с2 <.О дает случай максимума. Читатель легко по- построит линию уровня /=А; в этом случае, совершенно аналогичном случаю „а", линии уровня при h < 0 представляют собой эллипсы, при А > О — мнимые кривые. d и е) 6 случае, когда один из козфцциентов с, или оба обращаются в нуль, квадратичная форма характера стационарной точки не опре- определяет., В этом случае необходимо обратиться к третьему члену разло- разложения функции в ряд Тейлора. Не вдаваясь в детальное рассмотрение этого вопроса, который разрешается изучением кубических форм, а иногда приводит к формам гс-й (п > 3) степени, мы ограничимся здесь рядом примеров, поясняющих сказанное. Пусть здесь сх = 1, са = 0. В окрестности начала координат кривые /= h пред- представляют собой, как и в случае „а", замкнутые кривые, охватывающие на- начало координат; стационарная точка х=^ = 0 еегь точка минимума. Пусть /=*? — хК В окрестности начала кривые/= h ведут себя так же, как в случае „Ь"; .мы имеем минимакс. Пусть, наконец, В этом случае характер стационарной точки будет существенно отли- отличаться от разобранных нами выше. Линия /=0 будет иметь в начале координат точку возврата, эта линия разделит окрестность начала на две области, в одной из которых функция />0, в другой /< 0, эти области будут заполняться соответственно линиями /= h > 0 и /= h < 0. Если clr=sc2z=s0: сь с2 одновременно обращаются в нуль, то мы имеем еще большее разнообразие типов стационарных точек. Случай функции, заданной в трехмерном пространстве, дает большее разнообразие типов стационарных точек. Расположив начало коордииат в стационарной точке и считая значение функции в этой точке равной нулю, мы приведем функцию к виду: где а есть величина порядка выше второго сравнительно с У >ч+^+ з Надлежащим поворотом осей координат ми можем представить функ- функцию / в новой системе координат в виде: Будем считать ct расположенными в убывающем порядке:
94 КВАДРАТИЧНЫЕ ФОРМЫ И ВТОРОЙ ДИФЕРЕНШ1АЛ [ГЛ. IV Рассмотрим вокруг начала координат сферу К достаточно малого радиуса, внутри которой мы можем пренебречь членом е, порядка выше второго, считая искажения, вызванные им на форму поверхности уровня, несущественными. Возможны пять комбинаций. О сг ^ С2 > сз > 0- Имеем случай минимума; поверхности равных значений /= h (поверхность уровня) при h > 0 представляют собой серию подобных эллипсоидов, превращающихся при А = 0 в изолиро- изолированную точку, при h < О поверхностей уровня не существует. 2) сх = т2 > 0, с2 = Ф > 0, с8 = —р* < 0. Отвлекаясь от членов третьего порядка, будем иметь внутри сферы К достаточно малого шдиуса: / Поверхность уровня /= О представляет собой конус с особой точкой (вершиной) в стационарной точке — начале координат, ось конуса совпадает с осью д>3. При h = — /2 < 0 поверхности уровня: == /2 представляют собой двуполостные гиперболоиды (черт. 15). Эти гипер- гиперболоиды заполняют область меньших значений, распадающуюся на две части: часть I, расположенную над плоскостью уъ = 0, и часть П, рас- расположенную под плоскостью ^3 = 0. Эти части раз- разделены плоскостью yz = 0, на которой нет точек, принадлежащих области меньших значений (при уь = 0, /= т2ух2 -j- m2y22 всегда больше нуля, за исключе- исключением начала координат, где /== 0). Если взять в об- областях I и П по точке Л, В, то эти точки нельзя соединить линией, лежащей целиком внутри сферы К и проходящей только по области меньших значений. Область меньших значений не связна, как и в случае минимакса функции двух переменных. Если из сферы К выкинуть лежащую внутри нее часть конуса /—0 и области меньших значений, то оставшаяся часть сферы принадлежит области боль- больших значений, для нее всегда />0. Пусть h = /2, поверхность уровня Черт. 15. представляет собой однополостный гиперболоид. Об- Область больших значений заполнена частями этих ги- гиперболоидов. Любые две точки области больших значений, лежащие внутри /С, могут быть соединены кривой, лежащей в этой области и внутри /? Часть области больших значений, попав- попавшая внутрь К, образует, следовательно, связную область. Рассмо-
§ 19] ПРЕОБРАЗОВАНИЯ КВАДРАТИЧНЫХ ФОРМ 95 трим круг yf -\-ytf = г\ лежащий в плоскости ys = О. Любая поверх- поверхность, ограниченная этой линией, или, как говорят, любая натянутая на этот круг пленка, расположенная внутри Ку обязательно должна задеть ось уй; эта ось лежит вне области больших значений (на оси j/s, /= — Р2Уъ24^0), следовательно, нельзя натянуть на указанный круг пленку, содержащуюся целиком внутри области больших знаыений*). 3) сх > О, ^2 < О, св <. В этом случае области больших и меньших значений предыдущего случая меняются ролями. 4) с% < О, с2 < 0, с3 < О. Случай максимума. Области больших зна- значений не существует. Поверхности уровня f=h = — Z2 < О представ- представляют собой эллипсоиды (см. случай 1). 5) Один из коэфициентов cs обращается в нуль. В этом случае рас- рассмотрение квадратической формы не дает возможности судить о харак- характере стационарной точки: в зависимости от вида следующих членов разложения / в рял Тейлора здесь возможен максимум, минимум и минимаксы. В соответствии с этим структура областей меньших и больших значений / в окрестности стационарной точки может быть четырех отмеченных выше типов, а также может давать новые типы. § 19. Преобразования квадратичных форм Прежде чем перейти к функциям многих переменных, займемся подробно квадратичными формами многих переменных. Пусть 2 Л1**Л (*\ *= 1, 2, ..., п) есть квадратичная форма в я-мерном пространстве. Детерминант, со- составленный из ее коэфициентов назовем дискриминантом формы. Численную величину дискриминанта будем обозначать: |А|«=К1- Наряду с формой рассмотрим билинейную форму 2. Применим линейное преобразование ук=У\Ьк,у,' (*=1, 2, ..., п) (8) пространства (уи у^ ..., >/п). г) Наши рассмотрения можно резюмировать, пользуясь топологической тер- терминологией, следующим образом: лежащая внутри К область меньших значений содержит негомологичный нулю нульмерный цикл, область больших значений — негомологичиый нулю одномерный цикл.
96 КВАДРАТИЧНЫЕ ФОРМЫ И ВТОРОЙ ДИФЕРЕНЦИАЛ [ГЛФ IV Получим: 2 аи*1У« — 2 at* bhl х#{ = где *« = 2 *<**«• A0) h ?lo правилу умножения детерминантов имеем: После эгого применим аналогично линейное преобразование к пространству (хх, лг2, -.., хп): *, = 2***/ (<=1, 2, .... я); (8') Получим: 2 *игЪУ* = 2 ^«ж^/ = 2 сп bir xr'y/ =: 2 <Л% (I2) <. fc i, I 4> I, r rtl где ^=2v«'=2V«- 03) Следовательно: l^l = l*«l-U№|-|ftM|.|««l-l*№!. Если xt =yu xt' =y{, то билинейные формы перейдут в квадратичные формы •/ = 2 «««Л, J' = 2 ^*«» и формулы A2), A4) перейдут в 2 ««*Л — 2 *i*Xifx*> С12') I4»IH*«I-I*«I-I««I-I*«I- 0*0 Последняя формула дает нам закон преобразования дискриминанта квадратичной формы У в результате линейного преобразования переменных. Так как численное значение определителя | bih \ равно численному значению сопряженного определителя | bki |, формула A4) нам дает: т. е. при линейном преобразовании переменных численное значение, дискриминанта квадратичной формы умножается на квадрат чи- численного значения определителя преобразования. В частности численное значение дискриминанта не меняется при ортогональном преобразовании. Далее, если дискриминант квадратичной формы не равен нулю, то он остается не равным нулю при любом невырожденном преобразовании переменных.
§ 15] ПРЕОБРАЗОВАНИЯ КВАДРАТИЧНЫХ ФОРМ 97 В частности, если (| aik \\ ф 0, то в результате невырожденного преобразования форма 2 aihxixu не может перейти в форму меньшего %у К числа переменных t, /с где /гс < л, В самом деле, в преобразованной форме все коэфициенты aik при ?>т и k>m, очевидно, равны нулю, ее дискриминант содержит по крайней мере одну строку сплошных нулей и, следовательно, равен нулю. Закон инерции. Перейдем теперь к вопросу о преобразовании квад- квадратичной формы / к нормальному или каноническому виду, т. е. к виду: Задача сводится к нахождению такого линейного преобразования п *¦= 2^,Л (ё= 1, 2, .... я), чтобы в произведении определителей все элементы dik = 0 при / ф k. Так как определитель \ dih\ автомати- автоматически получается определителем симметрическим: dih = dhif то требо- требование d^ = 0 (/ ф k) накладывает на коэфициенты Ьш всего * V~ условий. Так как, с другой стороны, коэфициентов bik имеется я2, то мы имеем надежду решить задачу о приведении формы к нормальному виду даже при весьма специальном выборе определителя преобразо- преобразования, именно заранее потребовав, чтобы между элементами bik опреде- о п(п — 1) п(п+]\ лителя преобразования существовало пг ^ = —^—- соотно- соотношений. Такое количество соотношений меж^ Ь^ имеет место, если мы <>удем рассматривать преобразования ортогональные или треугольные; именно эти преобразования практически оказываются наиболее полез- полезными. Мы заранее ограничиваемся преобразованиями с вещественными коэфициентами bjkf поэтому коэфициенты т{ преобразованной формы тоже должны быть вещественны. Прежде чем приступить к доказательству существования преобразо- преобразований, приводящих форму к нормальному виду, мы допустим, что такое преобразование возможно, и, опираясь на это, мы, с олной стороны, установим некоторые свойства квадратичных форм, свойства, связанные с преобразованием форм, с другой стороны, выведем основное урав- уравнение, к решению которого приводится задача преобразования форм к нормальному виду.
КВАДРАТИЧНЫЕ ФОРМЫ И ВТОРОЙ ДИФЕРБНЦИАЛ (ГЛ. IV Начнем с так называемого закона инерции квадратичных форм. ТЕОРЕМА. Если два невырожденных преобразования п *i = 2 *«Л (''=1,2, - • -, >0, fcl 2«Л (*=Ь 2, ..., л) приводят форму J = 2 Д«Л** к нормальному виду. 1 А /«о «шсло положительных коэфициентов среди 1К равно числу поло- положительных среди ту Такое оке соотношение имеет место и для отрицательных\ а следовательно, и для равных нулю коэфициентов обеих форм. Иными словами, число положительных, отрицательных и равных нулю коэфициентов в каноническом виде квадратичной формы не за- зависит от преобразования, с помощью которого она была приведена к каноническому виду, лишь бы эти преобразования были невырожденным и Примечание. Очевидно, равные нулю коэфициенты могут по- появиться лишь в случае равенства нулю дискриминанта формы. Пусть положительными будут только первыер коэфициентов (/ I» t%> -••> lp и только первые // коэфициентов (р'<р): m2i , тР'. Рассмотрим систему р'-{-(п — р) уравнений: Число р'-\-п — р меньше п, так как р'<р. Числа yv z}- выражаются линейно через первоначальные переменные хи лг2, ..., х„> и мы полу- получаем относительно дг--ов систему однородных линейных уравнений, где число уравнений меньше числа неизвестных. Поэтому существует бес- бесчисленное множество систем значений хи хъ ...э дгя, не равных одно^ временно нулю, таких, что система уравнений A5) удовлетворяется. Пусть *f (*=1, 2, ..., п) — одна такая система значений. Отвечающие лей значения yv z% пусть будут: y?\z?> U=l,2, ...9n\ Если бы все у^ были равны нулю, то и все d±\ выражаемые через них линейно, тоже были бы равны нулю, что противоречит нашему предположению. Следовательно, некоторые из yf^ ф 0,- причем, так как для / > /?, д/$0 = 0, то не равные нулю значения yf} найдутся лишь среди обладающих индексом
§ 20] ГЛАВНЫЕ ОСИ КВАДРАТИЧНОЙ ФОРМЫ (ВЕКОВОЕ УРАВНЕНИЕ) 99 Итак, <~1 V/ ft/0)l2 ^ о Наоборот, среди z . найдутся не равные нулю лишь при j >р'. Сле- Следовательно: 2 ««*?*? -,Д.Л [г?Т * ° (ж' < °при ' >/0> получаем противоречие. Итак, Аналогично доказывается равенство числа отрицательных коэфициентов. § 20. Главные оси квадратичной формы (вековое уравнение) Пусть ортогональное преобразование преобразует форму п переменных к нормальному виду: j^w?^ об) i Сфера S, определяемая уравнением ? = 2^2=^» перейдет при этом в такую же сферу 2л2=1- Рассмотрим серию гиперповерхностей второго порядка J=h при меняющемся h. Легко доказать, что при Л = |а, гиперповерхность У = Л коснется сферы S в точке Av лежащей на оси yt. В самом деле, в новой системе координат точка Аг имеет коорди- координаты: ^=1, ^- = 0 при Уф/, следовательно, касательное линейное многообразие к сфере 5 в точке Аг имеет вид ^=1, но это же мно- п гообразие будет, очевидно, касательно к гиперповерхности 2^Д'/==:1*1 в точке Аг Отсюда на основании рассмотрений § 21 мы получаем, что точка Аг является стационарной точкой функции J на сфере Sy следо- следовательно, в точке Аг удовлетворяется уравнение: (/—*?) = 0, где X есть постоянный множитель Эйлера. Множитель X равен J(Ai)- так как так как то (см. задачу 1 § 16). Принимая за переменные координаты х19х2,.. .,хн 1) В силу сделанного выше замечания мы считаем числа ^ вещественными.
JOO КВАДРАТИЧНЫЕ ФОРМЫ И ВТОРОЙ ДИФЕРЕНЦИАЛ [ГЛ. IV иолучим для точки А{: или dxj Таким образом координаты хй точки At должны удовлетворять следующей системе уравнений: 21*i**jfc — Ks*> = 0 0 = lt2' ¦••• ")• О7) к *г V *^2 1 (\7f>\ JO, —— ^^ Xj *— 1 • ум. I f Система A7) есть система линейных однородных уравнений; для того чтобы координаты точки Aif не совпадающей с началом координат, удовлетворяли этому уравнению, необходимо обращение в нуль детер- детерминанта этого уравнения, следовательно, число {it должно быть корнем уравнения: » — *..- <hn _0 A8) Уравнение A8) называется вековым уравнением. Это название заим- заимствовано из астрономии (из теории вековых возмущений). Элементы aik и а^ в вековом уравнении A8) равны между собой: а^=^а^ так как определитель \aih\ симметрический. Корни уравнения A8) называются собственными значениями формы. Таким образом: если форма J приводится при помощи ортогональ- ортогонального преобразования к нормальному виду, то все коэфициенты приве- приведенной к нормальному виду формы суть корни векового уравнения. Заметим сейчас же несколько следствий, которые вытекают из дока- доказанного предложения. Если форма J приоодится к нормальному виду и если все действи- действительные числа \tt различны, то все корни векового уравнения действи- действительны и различны. Это вытекает из того, что вековое уравнение имеет степень п и что п чисел ^ суть его корни. Зная коэфициенты jAt приведенной формы, нетрудно определить также п взаимно ортогональных направлений пространства (xv x^ •«., х4%) — главных осей формы, которые при ортогональном преобразовании формы к нормальному виду переходят в координатный крест. Разберем два случая: 1. Бее значения ^ различны: В этом случае для каждого р, система A7) будет иметь нетриви- нетривиальное решение xf(j=\, 2, ..., и), но тогда уравнения при J=l,2, ..., п нам дадут все п главных осей изучаемой формы.
§ 20] ГЛАВНЫЕ ОСИ КВАДРАТИЧНОЙ ФОРМЫ (ВЕКОВОЕ УРАВНЕНИЕ) 101 2. Среди jjt, имеются равные, пусть У'| = У'<+1= ••• В этом случае приведенная форма будет содержать группу членов вида: u 2j y/l оставляя форму в нормальном виде, можно совершать над пе- переменными yit y€J,v --оуУ4*к любое ортогональное преобразование. Отсюда заключаем, что система A7) при рассматриваемом значении будет допускать k A-1 линейно независимых, друг другу ортогональных решений: Следующие A-f-1 прямых j = 1,2,.. ¦, л, определяемых уравнениями: \южно принять за к главных осей, соответствующих значениям у« = = 1* 1=. . . = ^ . Легко видеть, что в разбираемом случае главные осн определяются не единственным образом. Приведенные рассмотрения показывают, что если существует орто- ортогональное преобразование, приводящее форму к нормальному виду, то его фактическое определение, а также определение коэфициентов р4 приводится к решению векового уравнения. Перейдем теперь к доказательству возможности приведения любой квадратичной формы к нормальному виду. Применяя бесконечно малые деформации квадратичной формы, можно по коэфициентам ^ определить все корни векового уравнения даже в том случае, когда среди чисел имеются равные, а некоторые из них обращаются в нуль. Считая ^ расположенными в неубывающем порядке, допустим, что же ^ распадаются на т групп чисел> равных между собой: В таком случае Х = У<4\* + ... +*,- будет корнем векового уравнения, причем кратность этого корня будет равна ij. Теорема сохраняет силу также, если числа у4 одной us групп равны нулю. Для доказательства построим вспомогательную форму: где р/ = jx4 -f-18,; все числа е, различны, точно так же, как и числа у/. Следовательно, вековое уравнение для формы У(е,) будет иметь п раз- различных действительных корней у/, ti/, ..., ja/. При ео стремящихся одновременно к нулю, все коэфйциенты векового уравнения формы J(e7) будут стремиться к коэфициентам векового уравнения формы У, а корни
102 КВАДРАТИЧНЫЕ ФОРМЫ И ВТОРОЙ ДИФЕРЕНЦИАЛ [ГЛ IV Xrz^', р,2', ..., jx/ будут стремиться к jxt, jx2, ..., jxn, следовательно, корень X = j4f4-b + ...+ ».» полученный в результате слияния г^ корней */, имеет кратность iJm ТЕОРЕМА. Всякую квадратичную форму п переменных можно путем ортогонального преобразования привести к канонической форме. Проведем доказательство методом полной индукции. При п = 2 воз- возможность приведения формы к нормальному известна из аналитической геометрии. Допустим, что для любой квадратичной формы п пере- переменных существуют ортогональные преобразования, приводящие ее к нор- нормальному виду. Докажем, что то же имеет место для формы (п-\-1) переменных. Итак, пусть дана форма: 2 t, к (я-р 1) переменных xv x.Zi . .., хп> av +i. В силу теоремы Вейерштрасса на сфере + 1 существует точка А1(^\ --.,^!i1)> B которой функция / достигает условного минимума на этой сфере (точка Аг в силу теоремы 4 § 16 есть условно стационарная точка функции У на сфере ?"=1). Совершим над переменными xvx2, ..., хп+1 какое-нибудь из ортогональных преоб- преобразований, переводящих вектор ОАг в новую координатную ось уп + г Допустим, что в новых переменных ylty$f ..., уп , х форма J примет вид: i, к Докажем, что =0 при k= В самом деле, в условной стационарной точке At функции J, лежащей на сфере /: = 1, гиперповерхность J = J{AX) касается сферы ?"=1. В новой системе координаты точки Аг будут вуя,1 = 1; ^ = 0, если А<л-|-1. Касательное многообразие к сфере ?=1 в этой точке опре- определится уравнением j;n+1 = 1; касательное многообразие к гиперповерх- гиперповерхности У = /(^j) в точке А% определится уравнением (см. формулу E) § 18): П?«чУ<у?= ДА), где у(р —координаты точки Alt т. е. yn^t = 1, у*р =0 при у^я. Следовательно, уравнение нашего линейного касательного многообразия примет вид:
§ 20] ГЛАВНЫЕ ОСИ КВАДРАТИЧНОЙ ФОРМЫ (ВЕКОВОЕ УРАВНЕНИЕ) 103 Совпадение линейных касательных многообразий в точке Аг к сфере ?"=1 и к многообразию J = J(At) приводит к требованию: Таким образом в новых координатах форма J примет вид: этим самым нам удалось при помощи ортогонального преобразования форму J представить как сумму квадратического числа ап , х п,^+1 и формы п переменных. Но согласно основному допущению существует ортогональное преобразование над переменными у1У уъ .. -,уп, приво- приводящее к нормальному виду форму этих переменных. Совершая это преобразование (сохраняя неизменной координату yn,J9 получим: Этим самым возможность приведения к нормальному виду полностью доказана. Из этой теоремы, если воспользоваться приведенными выше рас- рассмотрениями относительно фактического определения нормального пре- преобразования, нормализующего форму, можно сразу получить ряд след- следствий — теорем основного значения. ТЕОРЕМА 1. Все корни векового уравнения действительны; эти корни образуют совокупность всех собственных значений квадратич- квадратичной формы. Иными словами, если j^, ja2» •••! V-n суть корни векового уравнения, то форму можно привести к виду: если корень кратный, то он считается столько раз, какова его кратность. ТЕОРЕМА 2. Если все корни векового уравнения различны и если есть одно из ортогональных преобразований, приводящих форму к нор- нормальному виду, то все остальные ортогональные преобразования, нор- нормирующие форму, получаются из рассматриваемого путем переста- перестановки индексов при у {перенумеровка осей) и путем замены произ- произвольной системы: у{ у,,. • ,,j/< через —yi, —у^. - ¦,—уи (зеркальные отражения). Первая теорема вытекает из того, что всякую форму можно при- привести к нормальному виду, и из того, что все коэфициенты ji4 суть
104 КВАДРАТИЧНЫЕ ФОРМЫ И ВТОРОЙ ДИФЕРЕНЦИАЛ [ГЛ. IV корни векового уравнения, причем если среди pt имеется т равных, то соответствующий корень векового уравнения имеет кратность т. Для доказательства второй теоремы достаточно заметить, что каждому простому корню векового уравнения соответствует единственная главная ось квадратичной формы J и что ортогональное преобразование, приводя- приводящее форму к нормальному виду, должно переводить крест, образованный главными осями формы, в координатный крест новой системы координат. Таким образом ортогональное преобразование, приводящее форму к нормальному виду, допускает и при различных корнях X = jx4 некото- некоторую многозначность, которую можно считать несущественной. При совпадении двух или более корней ^ мы получаем возможность преобра- преобразовать J к нормальному виду A6) бесчисленным множеством способов. В самом деле, пусть В формулу A6) войдет группа членов ^ 2 У?* Обозначим через р-мерную сферу 2иУ—1'>Уг=® ПРИ г<* или Сохраним направление всех осей, кроме осей yi9 yi+i$ ..., yi+p9 неиз- неизменными. Группу же переменных^, yt,v --.>^.p подвергнем произ- произвольному ортогональному преобразованию. Получим новое ортогональное + преобразование, не меняющее вида суммы 2.У/> т* е- переводящее сферу Sp в самое себя» Следовательно, не меняется и вид формы: Точка А1У расположенная на пересечении сферы Sp с осью уо может перейти при этом в любую другую точку сферы Sp. Из свойств точки А% мы заключаем, что любая точка Sp есть стационарная точка / на 5, т. е. в любой из этих точек удовлетворяется условие d(J-\-KB) = 0 или, в старой системе координат, уравнение A7). Последнее обстоятельство следует еще из такого соображения: одно- однородные линейные уравнения A7) имеют, при ^ — ^,/7-4-1 независи- независимых решений (так как соответствующие векторы ортогональны). Любая линейная комбинация этих решений есть также решение системы уравне- уравнений A7). Решения этой системы образуют линейное /?-j-1-мерное мно- многообразие, вырезающее из сферы 5 /?-мерную сферу 5^. Одновременное приведение к каноническому виду двух квадра- квадратичных форм. Пусть нам даны две формы: 2 причем форма Jv есть форма положительно определенная. Требуется линейным преобразованием переменных х% одновременно привести формы
§21] ЭКСТРЕМАЛЬНАЯ ТЕОРИЯ СОБСТВЕННЫХ ЗНАЧЕНИЙ ФИШЕРА-КУРАНТА 105 Jv J2 к каноническому виду, причем так, чтобы форма Jx перешла в единичную форму. Для решения задачи ортогональным преобразованием *< = 2<*«*Л («=1,2 ,я) приведем форму Jt к нормальному виду где все X, > 0 в силу положительности формы Jv Линейное преобразо- вание yit=^'yrXizl преобразует //(.у,) B единичную форму: '= >¦«!*. При этом J2(x4) перейдет в результате обоих преобразований в неко- некоторую форму переменных zt: Ортогональным преобразованием переменных *, = 2P«A (?=1,2, ...,/z) к можно привести эту форму к каноническому виду: при этом форма Jj'iZi) перейдет в единичную форму =2 «Л На основании предыдущего числа ^ представляют собой стацио- стационарные значения формы /3 при условии J% = 1. Условие d(J2 — jjL/j) = 0 примет в прежних координатах вид: Числа ^ определятся Как корни уравнения: §21. Экстремальная теория собственных значений Фишера-Куранта Фишеру и Куранту принадлежит интересное определение собственных значений, опирающееся на весьма простые экстремальные свойства соб- собственных значений. Мы поясним его сначала на примере положительной формы / трех переменных х19 лг2, *з- Уравнение 7=1 есть уравнение обыкновенного-
КВАДРАТИЧНЫЕ ФОРМЫ И ВТОРОЙ ДИФЕРЕНЦИАЛ [ГЛ. IV эллипсоида. Наибольшая ось эллипсоида дает максимум расстояний от начала координат до поверхности эллипсоида, т. е. максимум единичной -формы при условии У=1, наименьшая ось — минимум расстояний от центра эллипсоида, т. е. минимум Е при / = 1. Средняя ось определится не- несколько сложнее. Рассмотрим все плоские сечения эллипсоида, прохо- проходящие через его центр. Они высекают из поверхности эллипсоида эллипсы с центром в начале координат. Рассмотрим совокупность больших осей этих эллипсов. Каждая из этих осей дает максимум Е при условии J = 1 и дополнительном условии 2*Л = 0. B0) Уравнение B0) есть уравнение плоскости, высекающей этот эллипс. Средняя ось есть наименьшая из этих больших осей. По принципу взаимности мы можем рассматривать экстремум функции / при условии ?"=1. Направление меньшей оси есть направление максимума / на сфере 6=1. Направление большей оси есть напра- направление минимума Уна ?"=1. Направление средней оси определится как -направление наибольшего из минимумов J на сфере Е = 1 при допол- дополнительных условиях B0), причем в условиях B0) нужно давать числам Ь\* Ь& &з произвольные значения, за исключением: ?, = ?2 = ?8 — о. (При таком определении можно отказаться от требования положительной определенности J.) Разъясним этот метод геометрически. Пусть J — произвольная поло- положительная форма трех переменных xv х2, аг8. При достаточно большом с поверхность J = с лежит вне сферы S, заданной уравнением Е = 1 (черт. 16). Уменьшая с, мы добьемся того, что при некотором с=*сх поверхность J = Cj коснется сферы 5 (черт. 17); сг есть значение ма- максимума J на 5,ибо, при с>сь J=c не имеет точек на сфере. Точки касания Аг и А$ (симметрично расположенные относительно центра) суть точки максимума У на 5. Будем называть областью меньших значений совокупность точек сферы 5, в которых / < 1, точки 5 в которых / > 1 составят область больших значений. При дальнейшем убывании с (черт. 18) появятся две области меньших значений, высекаемые поверхностью J = с из сферы 5, вокруг точек А1 и Л/. Эти области симметричны относительно центра, так как J в двух симметричных точках принимает равные значения. При дальнейшем убывании с для некоторого значения с = с2 обе части области меньших значений сольются. Область же больших значений в этот момент распадается на две части (черт. 19). Сфера 5 вторично коснется поверхности 7 = ^. До этого момента большой круг, располо- расположенный ортогонально к диаметру АХАХГ9 лежал целиком в области больших значений и делил область меньших значений на две части. Теперь же этот круг уже не лежит целиком в области больших зна- значений. Максимум J на этом круге равен, очевидно, с2 и достигается в точках Л2 и симметричной ей точке А/, в которых У=с2 касается
§ 21] ЭКСТРЕМАЛЬНАЯ ТЕОРИЯ СОБСТВЕННЫХ ЗНАЧЕНИЙ ФИШЕРА-КУРАНТА 107 сферы 5. (Очевидно, точка Л2 есть точка мииимакса J на S.) При с = с2 область меньших значений не содержит ни одного полного боль- большого круга. Очевидно, максимум / на любом большом круге не лежит в области меньших значений для с = с2, т. е. максимум J на любом большом круге не меньше с2. Число с2 есть минимальное значение максимума J на любом большом круге сферы 5. Если мы будем рассматривать макси- максимум / при f=l и Ь1х1~\-Ь.лх2-1гЬ9х3*=:(), варьируя bvb2fb8, и искать наименьшего значения этого максимума, то получим, очевидно, для наи- наименьшего из этих максимумов значение cv Черт. 16. Черт. 17. Черт. 18. 0 Черт. 19. Черт. 20. Черт. 21. Черт. 22. При дальнейшем убывании с мы будем иметь картину, даваемую черт. 20. Область больших значений состоит из двух частей, не имеющих общих точек. Наконец, при некотором c — cs область больших значений исчезнет, сфера 5 в третий и последний (черт. 21) раз коснется поверхности J —??. сь есть значение минимума / на 5. При дальнейшем убывании с сфера 5 заключает внутри себя эллип- эллипсоид J—c (черт. 22). Развитый выше метод для прямого определения собственных значений квадратичной формы трех переменных распространяется на формы п переменных. Определим условный максимум формы п переменных: ~ B1) B2) (/=1,2, ...,т). B3) з Этот условный максимум будет, очевидно, при заданной форме J зави- зависеть от пт произвольных констант Ь^ Обозначим его через при т-\-\ <^п условиях:
108 КВАДРАТИЧНЫЕ ФОРМЫ И ВТОРОЙ ДИФЕРЕНЦИАЛ [ГЛ. IV ТЕОРЕМА. Нижняя граница значений л(т)(*^) равна т-му по вели- величине *) собственному значению \п формы J. Эта теорема дает искомое прямое определение собственных значений формы J. Прежде чем перейти к доказательству теоремы, дадим гео- геометрическую интерпретацию этого определения. Мы рассматриваем максимум формы J на всевозможных (п — т-\-\)~ мерных сферических многообразиях радиуса единица с центром в на- начале координат. Нижняя граница этих максимумов и есть У^т\Ь^ В самом деле, если т уравнений группы B3) независимы, они определяют вместе с B2) сферическое многообразие {п — т—1) измерений. Если они сводимы к меньшему числу условий, они определяют сферическое многообразие k измерений, п— l^ft> п — т— 1. Следовательно,усло- Следовательно,условия B2) и B3) определяют всевозможные сферические многообразия ?>>п— т— 1 измерений радиуса единица с центром в начале координат. Число *• j мы определяем, следовательно, как нижнюю границу максимумов J по всем таким сферическим многообразиям. Но при &>л — т — 1 максимум на таком сферическом многообразии больше (или во всяком случае не меньше), чем на заключенных в нем сфери- сферических многообразиях (п — т— 1) измерений. Так как мы ищем нижнюю границу этих максимумов, то нам достаточно ограничиться сфериче- сферическими многообразиями (п — т— 1) измерений радиуса единица с центром в начале [т, е. можно, не меняя нижней границы, требовать, чтобы уравнения группы B3) были независимы]. Перейдем к доказательству теоремы. Пусть Sflr_m_l есть некоторая сфера (л — т—1) измерений, определенная уравнениями B2) и B3) при некоторой системе коэфициентов Ь^. Приведем форму J к нормальному виду: 2 ^А путем ортогонального преобразования координат. Числа \ расположены у нас в убывающем порядке. Пересечем сферу Sn_n_t с линейным многообразием: Л»+*в°*-Ws^0. ••••-У* = °- B4) Система уравнений B4) вместе с уравнениями B3) образует относительно переменных х-оъ систему п—1 однородных линейных уравнений и, зна- значит, имеет по крайней мере одно линейное одномерное многообразие нетривиальных решений, пересекающее сферу в точках Л, А\ Обозна- Обозначим новые координаты одной из этих точек (например точки А) через уТ* уТ> ••->^°)- Очевидно, при i>-m + 2, j^^O, следовательно: т-\-1 В точке А форма / равна: так как г) Собственные значения предполагаются расположенными в убывающем порядке.
§22) АНАЛИТИЧЕСКИЙ КРИТЕРИЙ ПОЛОЖИТЕЛЬНОСТИ ФОРМЫ 109 Следовательно, на любой сфере Sn_m_1 есть точка А, в кото- которой J^2>\n+V Отсюда максимум/ на Sn_m_l не меньше Хт+1- Ниж- Нижняя граница этих максимумов не меньше, очевидно, ^w^.1- Но, взяв сферу S^M_1? определяемую уравнениями: мы убедимся, что на ней максимум / как раз равен ^mtt и достигается в точке с координатами:. В самом деле, заметив, что ^<С^ш+1 ПРИ j>m-{*lt на этой сфера имеем: п тем самым теорема доказана (нижняя граница Xw , t достигается для § 22. Аналитический критерий положительности формы Фактическое определение собственных значений квадратичной формы приводит, как мы видели, к довольно сложным вычислениям (решение векового уравнения, разыскание условного экстремума квадра- квадратичной формы), вместе с тем для многих приложений является доста- достаточным только знать, существуют ли отрицательные собственные зна- значения или нет. По этой причине, естественно, возникает задача дать по возможности простой критерий для положительности (отрицатель- (отрицательности) всех собственных значений формы. Этот критерий в силу пре- предыдущего будет также критерием положительности (отрицательности) соответствующей квадратичной формы. Поставленная задача полностью решается следующей теоремой Сильвестра. ТЕОРЕМА СИЛЬВЕСТРА. Для того чтобы форма п Jn = 2j aikXiXk была положительно определенной, необходимо и достаточно, чтобы бее главные угловые миноры ее дискриминанта: ап а12 #21 ^22 были положишльны. .•. а 1» I - • • а~
110 КВАДРАТИЧНЫЕ ФОРМЫ И ВТОРОЙ ДИФЕРЕНЦИАЛ [ГЛ. IV В самом деле, пусть форма в результате приведения ее к канони- каноническому виду путем ортогонального преобразования имеет вид: Так как значение дискриминанта Д,г формы JH не меняется при орто- ортогональном преобразовании, то Д = Xt 0 ... О °.х.':*:°. об .*.! х. Следовательно, если все \ > 0, то необходимо также Ан > 0. Итак, положительно определенная форма имеет положительный дискриминант. Предположим теперь, что Хт+1 =*ш+2 = • • • =0 форма Jft перейдет в форму J^ от т переменных (я*<л). Мы будем называть Jm усеченной формой. Дискриминант усечен- усеченный формы равен Д^. Усеченная форма положительно определенной формы есть также форма, положительно определенная, а следователь- следовательно, по только что доказанному Дто > 0; этим необходимость условий теоремы доказана. Достаточность условий вытекает из следующей леммы: ЛЕММА. Число положительных (аналогично-неотрицательных, отри- отрицательных, неположительных) собственных значений усеченной формы ^m-hi не меньше числа положительных (неотрицательных, отрицатель- отрицательных, неположительных) собственных значений усеченней формы Jm. В самом деле, приведем формы Jvi,t, Jm к каноническому виду: 2j Jm+i = где yitzu— некоторые линейные формы от хи х%, . . ., х.г. Пусть среди чисел Х^ первые / положительны, остальные т — / не- неположительны; среди чисел же X*w+1) положительны только первые р < /, остальные т -\- 1 — р ^ //г—J—2 — / неположительны. Рассмотрим систему линейных уравнений относительно т -j-1 неиз- неизвестных: xv xv ..., xmJLl: у, = 0 A=1,2, ...,/;),
§ 22] АНАЛИТИЧЕСКИЙ КРИТЕРИЙ ПОЛОЖИТЕЛЬНОСТИ ФОРМЫ 111 Общее число уравнений следовательно, для наших уравнений найдется нетривиальная система решений: ХО) @) ^0) л» _0 Обозначим соответственные значения переменных j^, zi через ^0 Очевидно, ^«0, если *f =0 Для данной системы значений Jk^ совпадает с Jk: ^Cxf)-/^^). B5) Но так как все коэфициенты lf\ /</, положительны, а коэфициенты ufc+i)^ l>pf неположительны, но это противоречит равенству B5). Итак, лемма доказана. Докажем теперь достаточность условий теоремы Сильвестра методом совершенной индукции. При п=\ форма Jt имеет вид апхг*, и усло- условие Д2 = ап > 0 достаточно для положительности формы. Пусть до- достаточность этих условий доказана для формы т переменных. Рассмотрим форму Jm+1 от т-\-\ переменных, удовлетворяющую условиям теоремы (дискриминант положителен). Усеченная форма Jw тоже удовлетворяет условиям теоремы, и мы считаем для т перемен- переменных теорему доказанной; следовательно, Jm есть форма положительна определенная и все ее т собственных значений положительны. На осно- основаниях нашей леммы форма / . г имеет по крайней мере т положитель- положительных собственных значений, но так как произведение всех ее собственных значений равно дискриминанту &т,v который мы считаем положитель- положительным, то и (m-j-l)-e собственное значение должно быть положительным. Пример* Пусть даны п функций: /.(*), /,(*)..... /.D заданных на отрезке а^х^Ь* Рассмотрим выражение
112 КВАДРАТИЧНЫЕ ФОРМЫ И ВТОРОЙ ДИФЕРЕНЦИАЛ [ГЛ. IV Возможны два случая: 1) Выражение B6) не обращается тождественно в нуль на отрезке [а, д] ни при какой системе постоянных ci BС*2Ф^)# ^ 9т0М случае ъ ъ 0. B7) При любых значениях cvJ есть квадратическая форма от с%. Следова- Следовательно, дискриминант этой формы: (Л, Л), (Л, Л) (/2.Л). С4»Л). •••» 5 та* if*./,)** f fj,dx. а 2) Существует система значений q,^, .. ,,сЛ, 2с«*>0> такая, что для нее 2 *,/•<*)> о. В этом случае форма B7) перестает быть положительно определенной формой с„ оставаясь формой неотрицательной. Имеем: I(/о/у) 1 = 0 (/,7=1, 2, ...,п). Определитель [(^,J^)l—дискриминант формы J% называется функцио- функциональным определителем Грамма (см. § 15, задачу 2). Из сказанного следует: определитель Грамма не может бить числом отрицатель- отрицательным. Обращение в нуль определителя Грамма есть необходимое и достаточное условие линейной зависимости функции. Рассмотрение последовательности диагональных миноров дискрими- нантной формы дает также возможность узнать число отрицательных собственных значений. Обобщение теоремы Сильвестра* Пусть дана квадратичная форма л переменных. Рассмотрим последовательность чисел 1 =Л0, Д^Л.^, ...,ДЛ, где числа At сохраняют тот же смысл, что и выше. Пусть все Д, ф 0. В этом случае имеет место ТЕОРЕМА. Число отрицательных собственных значений формы равно числу перемен знаков в последовательности Д0. Д1>Д2> '••> Д« (числом перемен знака в последовательности называют число пар ее последовательных членов, имеющих противоположные знаки. Если все Aj > 0, последовательность не имеет перемен знаков, и тогда из нашей
§ 22] АНАЛИТИЧЕСКИЙ КРИТЕРИЙ ПОЛОЖИТЕЛЬНОСТИ ФОРМЫ 113 теоремы следует достаточное условие теоремы Сильвестра положитель- положительной определенности формы). Доказательство. Рассмотрим усеченную форму Jm нашей формы Jnf где т < я. Так как ее дискриминант Дл ф О» то все ^ характеристические числа Xf> 0=1, 2,...f и) отличны от нуля. Пусть среди них будет г положительных и (т — г) от- отрицательных. Перейдем к форме У1||+г В силу доказанной выше леммы число положительных собственных значений усеченной формы не уменьшается при переходе от Jm к /т+1. Точно так же не уменьшается и число отрицательных. При переходе от Jm к Jnh,l общее число характеристических чисел увеличивается на единицу* Так как среди собственных значений формы /fn+1 нет равных нудю, то лишнее собственное значение может быть только положитель- положительным или отрицательным. Так как, с другой стороны, дискриминант формы равен произведению характеристических чисел, то лишнее харак- характеристическое число формы Jm будет положительным, если Д. lf Д^ имеют один и тот же знак (добавление положительною множителя не меняет знака произведения), и отрицательным, если Дт, Д,^ образуют перемену знака. Для случая т = 1 форма Jx = auxt2 имеет свое единственное ха- характеристическое число ап. Если оно отрицательно, то пара Z^=l, Дх =г ап образует перемену знака. Таким образом, двигаясь по последовательности До, Д^ Д^, •.., Д„, мы будем увеличивать на единицу число отрицательных характеристи- характеристических чисел форм Jm (m = l9 2, , п) по мере появления перемен знаков в последовательности чисел До, Д1э Д2 Дп* Теорема доказана. Рассмотрим теперь случай, когда Дотф ^» ^т+ъ Ф ^> а заключенный между ними член &т.t нашей последовательности равен нулю. При переходе от Jm к Jm»1 число положительных и отрицательных собствен- собственных значений усеченной формы не уменьшается. Так как форма Д^ имеет собственное значение, равное нулю, то; значит, число г положи- положительных и т — г отрицательных собственных значений формы Jm не из- изменилось при переходе к форме im+t. Форма Jm^1 имеет r-f-1 неотри- неотрицательных характеристических чисел (г положительных и один, равный нулю). Число их не уменьшится при переходе к форме /w, 2- Так как форма /9Л,2 не имеет собственных значений, равных нулю, то она имеет, следовательно, по крайней мере г-{-1 положительных характеристи- характеристических чисел, т. е. при переходе от Jm к Jm^ число положительных собственных значений увеличилось по крайней мере на единицу. Точно так же и число отрицательных собственных значений чисел увеличилось по крайней мере на единицу. Общее же число собственных значений при переходе от Jm к Jntf2 увеличилось на 2, значит, ровно на еди- единицу увеличилось как число положительных, так и число отрицательных собственных значений, а следовательно, Дот и Д^, 2 имеют разные знаки.
114 квадратичные формы и второй диФВРВнциАл [гл. IV Итак, обращение в нуль промежуточного члена влечет за собой перемену знаков у не равных нулю членов и увеличение на единицу числа отрицатель- отрицательных собственных значений. Теорема остается верна и для нашего случая. Мы оставляем в стороне более сложные случаи, когда два или более члена последовательности Д, обращаются под-ряд в нуль. Доказанную теорему можно геометрически иллюстрировать Следую- Следующим образом. На координатной плоскости (*,. у) возьмем п -j-1 точек, абсциссы которых суть целые числа 0,1,2, .. #J л# а ординаты—соответ- ординаты—соответственно члены последовательности: Дв, Дх> Д^, •.., Д^. Соединим их отрез- отрезками прямых. Число отрицательных собственных значений формы Jn равно числу пересечений полученной ломаной с осью абсцисс. § 23. Квадратичная форма на линейном многообразии Как мы увидим ниже, вопрос о достаточных условиях для условного экстремума приводится к изучению квадратичной формы на линейных многообразиях. Итак, пусть дана форма: Л» 2 4, к Изучим поведение Jn на линейном многообразии Rm m измере- измерений (т < я), заданном уравнениями: п %с^ = 0 (/=1,2, ...,я — т). B8) Для этой цели введем ортогональным преобразованием новые коорди- координаты: х/, яг2', ...,*/, такие, чтобы т осей х/ при i^m лежали на многообразии Rm9 а остальные были им ортогональны. Система уравне- уравнений B8) перейдет в систему: Форма Jn в новых координатах примет вид: J» = i aikxixk- На многообразии Rm форма Jn перейдет в усеченную форму Jm' от т переменных х/ (j ^ m)» Обозначим через собственные значения формы 'n(**)=A/(*i')> и через собственные значения формы J^ (числа X^n)f X^w) расположены в порядке убывания). Докажем для них следующую теорему. ТЕОРЕМА. 1-е собственное значение У^ формы Jn=j'n не меньше 1-го собственного значения усеченной формы Jm'; i-\-(n — т)-е соб- собственное значение *??»--тформы J*n не больше i-го значения Ь(р
§ 23] КВАДРАТИЧНАЯ ФОРМА НА ЛИНЕЙНОМ МНОГООБРАЗИИ 115 Рассмотрим наряду с формой // форму и преобразуем форму Jn' ортогональным преобразованием к канони- каноническому виду: Так как при таком преобразовании единичная форма не меняет своего вида, то Числа Х<л)— Х*п) (/а 1, 2, ..., п) суть собственные значения формы Ап, аналогично числа XJW> — Х^ 0 = 1» 2, • -•,/?*) суть собственные значе- значения усеченной формы Ат: х/ = 0 при j > т. Предполагая числа X*w* и Х^ расположенными в убывающем порядке: мы видим, что в последовательности Х^}—x?w) (/=1, 2, ..., те) пер- первые i членов неотрицательны. В силу леммы предыдущего параграфа первые / членов последовательности X^w) — X*w)(y=l, 2, ...,л) неотри- неотрицательны, и поэтому в частности аналогично, так как форма Аш имеет т. — *"+1 неположительных соб- собственных значений Х^ — Х$т) (/ >Qf форма i4w должна иметь т — неположительных собственных значений: у + ^ n—i следовательно: Дадим сейчас другое доказательство теоремы, опираясь на экстре- экстремальную теорию собственных значений. В силу этой теории Х^2* есть нижняя граница максимумов J при фиксированном условии 2 ¦*/ = 1 и при (I—1) переменных линейных условиях: Х^ш* есть нижняя граница максимумов Jn при фиксированных усло- условиях 2#i2=l и B8) И1 кроме того, при (i—1) переменных условиях: 0 (^=1,2, ...,/—1).
116 КВАДРАТИЧНЫЕ ФОРМЫ И ВТОРОЙ ДИФЕРЕНЦИАЛ Обозначая максимум Jn при условии 2-*ч2 [гл. IV ni-\-n—т — 1 условиях: — т— 1) через Х(^), мы получим в силу теории Фишера-Куранта: Если мы фиксируем Ь^ при г>*—1, считая то тем самым мы фиксируем некоторые переменные в функции b(?ri); такая фиксация может только увеличить нижний предел соответственных зна- значений Х(?гу). Отсюда, вспомнив экстремальное определение Xjm), получим: С другой стороны, добавление дополнительных условий B8) может только уменьшить условный максимум /я, а значит, и нижнюю границу этих условных максимумов; отсюда, вспоминая экстремальные опреде- определения Х^\ \^!п\ получаем: § 24. Преобразование к нормальному виду с помощью треугольных преобразований Треугольным линейным преобразованием (см, § 4) называется пре- преобразование: п т. е. линейное преобразование, при котором каждое из переменных х3- зависит только от переменных y^y^v -••>Д^* Следовательно» при тре- треугольном преобразовании «-мерного пространства всякое заключенное в нем А-мерное пространство Xj = О (/ > k) преобразуется в ^-мерное же у. = О (J > k\ Определитель треугольного преобразования равен *jjotu. Пусть форма: ^?|Д«Л** преобразуется с помощью треугольного преобразования B9) к каноническому виду: 2 I Имеем: ап а12 . •. аг а21 ап1 пп2 так как усеченные формы при xi = 0 (j > k) переходят в усеченные же формы при ^=0 (J > ?), то ап а12 . •. а1Р ар2 ... а,
§ 24] ПРЕОБРАЗОВАНИЕ К НОРМ. ВИДУ С ПОМОЩЬЮ ТРЕУГОЛЬН. ПРЕОБРАЗОВ. 117 Отсюда Если все att= 1, то преобразование B9) имеет вид; и форма 2в«*Л перейдет в форму: Формула C0') вместе с законом инерции показывает, что число от- отрицательных характеристических чисел равно числу перемен знаков в ряду: Для того чтобы можно было применять формулу C0) и (ЗСК), нужно, чтобы все числа Д^ Д2, ..., Д были отличны от нуля. Якоби показал, что если Дл ф 0, то можно соответственной перестановкой строк и столб- столбцов добиться того, чтобы в дискриминанте ДЛ все угловые миноры Д^ были не равными нулю; мы без оговорок будем считать это выполненным. Обратим внимание, что преобразование B9) определяется J" параметрами а# (j > /), т. е. их ровно столько, скольким условиям они должны удовлетворять для того, чтобы преобразованная с помощью пре- преобразования B9) форма была канонической. Формула Якоби треугольного преобразования. Построим сейчас последовательности квадратических форм Вх% /?2>—» &п следующим обра- образом: Вх 5= А дли определения остальных Bt дадим рекуррентную формулу: в=в-х Здесь zm-= 2~й^' <1|=8|Ь!575?Я ^ еСТЬ КО9фициент при 2й^ |75? х2т в Вт; мы докажем ниже, что если все Дм ф 0, то и все km ф 0). ЛЕММА 1. Вт (а следовательно u z^ есть форма только хШУ хп. H, п Для т = 1 лемма очевидна; пусть она верна для т*=г. Br (zr) есть форма от хг% лгг+1, •.., хп. В силу C2) #г+1 есть форма тех же пере- переменных. Но дВ' Л дВ„ о д& j^-1—A-z * 3r дхг dxf kr r дхг не зависит от -*у* следовательно, она есть форма от ..., хп. Лемма доказана. хп.
118 КВАДРАТИЧНЫЕ ФОРМЫ И ВТОРОЙ ДИФЕРЕНЦИАЛ [ГЛ. IV ЛЕММА 2. Переход от х-ов к z-ам есть треугольное преобразо- преобразование, приводящее А к каноническому виду. В самом деле, в силу определения Вт [см. C1)] имеем: S?? C1') i~l или Из леммы I следует: л- >S ¦и -1 m Л— > ZJ Cf) Обозначим теперь: А = — ~— « О А*. (/==1, 2, ..., я). ЛЕММА 3. Каждое г. {/=1, 2, .,., л) выражается линейно через А А А- 9» i = V, xfc при этом ам а» 1. Лемма верна при /=1: по определению она верна для /</я. Из (ЗГ) следует: C2) 11 = ^аГ- ПУсть 2 д2у где Су=—-—-—i-. Так как все ^(/«<j») выражаются линейно через Лх, Ла# * *., ^w, то лемма верна и для /=/ю-{-1; тем самым она доказана. Так как коэфициенты при х19 х2, ..., хт_г в гт равны нулю, то: Решая полученную систему уравнений относительно ami, найдем: ait m-~ia2t m-l * * *а€-1% т-Лп4+1, mr-l' * ' C3)
§ 24] ПРЕОБРАЗОВАНИЕ К НОРМ. ВИДУ С ПОМОЩЬЮ ТРЕУГОЛЬН. ПРЕОБРАЗОВ. 119 где /„— коэфициент жение для ат в гтУ Отсюда, где так как А% пропорциональности. получим: «и я, ж Z Аг получим: п «а» •- -1^,^-1 •• Подставляя • А- • «««2 > • «w ,„_! т т найденное выра- 1 QO 1 C3") Очевидно; что при к < т йсе Aj^ = 0. Сравнив коэфициенты при Ат в формуле C3) и разложении определяющимся C3'), получим откуда Введем новые переменные: ух, у& ..., ул% где п C4) Преобразование C4) и есть преобразование Якоби. Поскольку ут про- пропорциональны [ср. C4) и C3А/)] «»—1 то преобразование Якоби приводит форму А к каноническому виду» Из C1*) следует: п п C5) где С другой стороны, коэфициент при хт в преобразовании C4) равен 1, так как Дш = A,,*". Мы имеем право применить формулу (ЗС), отсюда
120 КВАДРАТИЧНЫЕ ФОРМЫ И ВТОРОЙ ДЙФЕРЕНЦИАЛ [ГЛ. Г\Г Сравнивая оба полученные выражения для ji^, получаем е- при выполнении условия все Д{ ф 0, все kA ф О- Окончательно, форме А можно придать такой вид: C5') Из формулы C5') следует снова достаточность условий теоремы Силь- Сильвестра для положительности формы А4. § 25. Достаточные условия экстремума» Минимаксы Займемся теперь приложением добытых выше результатов к теории экстремумов функций. Безусловный экстремум. Пусть нам дана функция непрерывная вместе со всеми частными производными до второго по- порядка включительно, и пусть точка А (х*р) есть стационарная точка для этой функции. Обозначим через fXmJC значение ^ ^ в точке А. При этих условиях имеем следующие теоремы: ТЕОРЕМА 1. Для того чтобы в стационарной точке А функция достигала своего относительного минимума, достаточно^ чтобы все диагональные миноры определителя \fxx\ л7 Г были тложшпельны. ТЕОРЕМА 2. Для того чтобы в точке А функция } достигла минимума, необходимо, чтобы все определители: были неотрицательны. Для доказательства достаточно вспомнить, что для минимума / до- достаточно, чтобы форма была положительно определенной, и необходимо, чтобы эта форма была неотрицательной. Применяя к фюрме C6) теорему Сильвестра, полу- получим теоремы 1 и 2. Дополнения. 1. Если одно или несколько собственных значений формы d?f равны нулю, а остальные положительны (отрицательны), т. е. если выполнено только необходимое условие экстремума, то вопрос,
§ 25] ДОСТАТОЧНЫЕ УСЛОВИЯ ЭКСТРЕМУМА. МИНИМАКСЫ 121 будет ли данная точка А давать минимум (максимум) или нет, рассмо- рассмотрением квадратичной формы d2/ решен быть не может. Так же как: при я = 2, для разрешения поставленного вопроса необходимо обра- обратиться к изучению следующих членов разложения в ряд Тейлора, что в свою очередь приводит к изучению форм высших степеней. Этого вопроса кы здесь затрагивать не будем. 2. В начале этой главы мы дали для случая я == 2,3 полную геомет- геометрическую характеристику различных типов стационарных точек. Эта характеристика основана на структуре областей, определенных нера- неравенством: где А — изучаемая стационарная точка, Р — произвольная точка об- области. Аналитически тип стационарной точки определяется числом от- отрицательных собственных значений квадратической формы. Эта теория может быть распространена на случай функции п пере- переменных. Относя геометрическую часть этой теории на второй том, мы ограничимся здесь аналитическими определениями. Мы считаем, что стационарная точка А есть стационарная точка k-vo порядка, если форма имеет k отрицательных и п — k положительных собственных значений. Применяя данную выше обобщенную теорему Сильвестра, мы полу- чаем следующий результат. Для того чтобы стационарная точка А била порядка k, необхо- необходимо и достаточно, чтобы в последовательности было k перемен знаков, где> как и раньше, Условный экстремум* Для того чтобы возможно было наглядна представить геометрическую природу достаточных условий условного экстремума, мы разберем сначала случай функции трех переменных. Разберем отдельно случаи: I. Ищется минимум при одном условии* И. Ищется минимум при двух условиях. Случай L Пусть точка А (х*®$ х?\ х*®) есть условно-стационарная точка функции: _ . ,л/чч W e =/(* *а*Ж C7) при условии 9(x1,x2,xs) = 0. C&) Мы во всем дальнейшем будем предполагать} что ср обладает непрерыв- непрерывными частными производными до второго порядка включительно; кроме
122 КВАДРАТИЧНЫЕ ФОРМЫ И ВТОРОЙ ДИФЕРЕНЦИАЛ [ГЛ. IV того, мы допустим, что точка А есть правильная точка поверхности q> = О, и будем предполагать, что в точке А При этих условиях существует число \ такое, что точка А является •безусловно-стационарной точкой для функции так что в точке А дхг дх2 дхв Отсюда, пренебрегая бесконечно малыми порядка выше второго, в бес- бесконечно малой окрестности точки А функцию ф можно представить в виде квадратичной формы: где $ххш есть значение -g^rgj в точке Л, ft;=jc4— х$ A=1, 2,3). Пусть {Aj !> jJk2 >- [is — собственные значения формы Рассмотрим отдельно четыре основных случая: *) 14 > В этом случае / является положительно определенной, и мно- множество {В} точек, где ф(Л)<ф(А)» имеет точку Л в качестве изоли- изолированной точки; функция ф достигает в точке А безусловного минимума. Так как на поверхности ^ = 0 имеем <!>=/, то, следовательно, тОчка А <5удет точкой относительного условного минимума функции / на поверх- поверхности ^ = 0. 2) ^>0, ц2>0, \Ь<Ь В этом случае, как мы видели в § 18, область D, где ф(В)<$(А), несвязна и ее граница в точке А касается конической поверхности второго порядка. Всякий луч *)> выходящий из Л и принадлежащий конусу J < 0 в достаточной близости от Л, будет лежать в D; анало- аналогично всякий луч, выходящий из Л и лежащий вне J-^О, будет при- принадлежать области, где ф(В)>^(Л). Для решения вопроса, будет ли точка А давать условный минимум, проведем через точку А плоскость Р, касательную к поверхности <р в точке А: Если в пересечении плоскостью Р конической поверхности Т мы по- получим изолированную точку Л, то очевидно, что в достаточно малой *) Мы рассматриваем все точки луча, отличные от А
§ 25] ДОСТАТОЧНЫЕ УСЛОВИЯ ЭКСТРЕМУМА. МИНИМАКСЫ 123 окрестности А на поверхности <р = 0 будем иметь: знак равенства достигается только при совпадении В с Л. В таком случае для тех же точек В будем иметь: т. е. в точке А функция / достигает условного минимума. Если в пере- пересечении Р и Т мы получим две различных прямолинейных образующих конуса, то, очевидно, в любой окрестности точки А будут существовать точки В поверхности © = 0^ где и будут существовать точки В поверхности <? = 0, где Но так как на поверхности ф = 0 функции / и Ф совпадают, то в раз- разбираемом случае получается, что в любой окрестности А на <р^0 существуют точки, где /(?)>/( Л), и точки, где /(В)</(Л). Следо- Следовательно, в точке А нет ни минимума, ни максимума. 3) ^>0, ц2<0, Цз<0. Этот случай можно исследовать аналогично предыдущему. Здесь область, где <5>(в)>Ф(Л), будет иметь ту же структуру, что и область <}»(#)<<!>(Л) разобранного случая. Если пересечение плоскости Р с ко- конусом Т дает изолированную точку, то мы имеем максимум; если пере- пересечение ТсР дает пару различных образующих, то нет ни минимума, ни максимума. 4) ^ < 0, 1*2 < °. На < 0. Аналогично случаю 1 имеем максимум. Заметим в заключение, что если одно из неравенств, определяющих разобранные нами различные случаи, заменить равенством, то вопрос, будет ли точка А давать минимум или максимум, рассмотрением квадратичной формы разрешить нельзя; в этом случае нужно обра- обращаться к формам высшего порядка. Резюмируя проведенное аналитическое исследование, получим: для того чтобы стационарная точка А давала относительный услов- условный минимум (максимум), достаточно, чтобы форма J бы/м на много- многообразии C8) положительно определенной (отрицательно определенной), и необходимо, чтобы J на C8) была неотрицательной (неположи- (неположительной). Случай II. Пусть теперь точка А(х^°К х^°\ лг8<°>) есть условно- стационарная точка функции при двух условиях:
124 КВАДРАТИЧНЫЕ ФОРМЫ И ВТОРОЙ ДИФЕРЕНЦИАЛ [ГЛ. IV Функции /,?!,<& удовлетворяют прежним условиям непрерывности; кроме того, как раньше» мы будем считать точку Л правильной точкой линии х- ?i = 0* У2 — О и будем предполагать, что в точке Л матрица имеет ранг, равный двум. Пусть опять \г и Xg суть множители Эйлера- Лагранжа, так что для функции точка А является безусловно-стационарной точкой. Обозначая через В точку, бесконечно близкую к А, и сохраняя бесконечно малые только низших порядков, получим: <КВ)-<К<4) =42 V/A- где tyx hthj имеют прежний смысл. Обозначая через jj.,, jj^, jjl3 собственные значения формы, разберем опять различные случаи: 1) V-x > О, [х2 > 0, у3 > 0. Как и раньше, в точке А имеем условный минимум. 2) ih>°, i*2 >°> до- достроим коническую поверхность второго порядка Т: /=0. Граница области />, где ^ (В) < <Ь (Л)> будет касаться конуса Т в точке Л, и область />, как раньше, в окрестности А с точностью до малых высших порядков будет совпадать с внутренней частью конуса / < 0. Построим касательную Р к линии Г в точке Л: Если Р будет лежать вне конуса J<[0 (исключая точку Л), то линия Г в достаточно малой окрестности точки Л будет лежать вне области D; точка Л является точкой условного минимума. Если Р бу- будет лежать внутри конуса J < 0 (исключая точку Л), то в достаточно малой окрестности точки Л линия Г будет также лежать внутри обла- области D (кроме точки Л), точка А является точкой условного максимума. 3) 14 > 0, ji2 < 0, ^8 < 0. Здесь роль конуса J < 0 будет играть конус J > 0; в зависимости от того, будет ли касательная Р лежать внутри конуса / > 0 или вне конуса J < 0, мы будем иметь минимум или максимум. 4) ^ < 0, ix2 < 0, jx8 < 0. Точка Л есть точка максимума.
§ 26] ДОСТАТОЧНЫЕ УСЛОВИЯ ЭКСТРЕМУМА. МИНИМАКСЫ 125 Резюмируя наше исследование, получаем: для того чтобы стацио- стационарная точка А была тпонкой минимума ^максимума), достаточно, чтобы форма J на прямой Р была положительно определенной (отри- (отрицательно определенной), и необходимо, чтобы J на Р была неотрица- неотрицательной (неположительной)* Общий случай» Оставляя пока в стороне геометрический анализ условно-стационарных точек функции п переменных, дадим для этого случая достаточные условия экстремума и отметим одну общую теорему, вытекающую из доказанной выше теоремы Фишера-Куранта. Итак, пусть точка А(х^°\ x?°\...f хп(-0У\ есть условно-стационар- условно-стационарная точка функции при k (ft]< n) условиях: т (V V \' \ П (t ? 1 О Ь\ t*\Qi\ TV \ 1> 2' " # • • ft' "~~~ V ~~~ > ' • • • t »v/" yisVj Будем предполагать, что / и <р удовлетворяют обычным условиям не- непрерывности, и, предполагая, что точка А — правильная точка п — &-мер- ного многообразия C9), будем считать, что ранг матрицы = 1, 2,..., к" в точке Л равен k. Обозначая через Хи Х^..., ХЛ множители Лагранжа, положим: № ) так что в точке А ТЕОРЕМА. Для того чтобы точка А была точкой условного ми- минимума (максимума) функции f на многообразии о, == 0 A = 1,2,..., k\ достаточно, чтобы форма была положительно определенной (отрица^льно определенной) на п — k-мерном многообразии Р: i=i J и необходимо, чтобы J на Р была неотрицательной (неположительной). Докажем сначала справедливость достаточного условия. Если форма J положительно определенная на Я, то в силу прежних рассмотрений на сфере S (п — k—1) измерений, получаемой пересечением сферы W с многообразием Я, имеем: где с — положительная константа, не зависящая от г (за с можно при- принять наименьшее собственное значение УнаР). Но так как приращение
126 КВАДРАТИЧНЫЕ ФОРМЫ И ВТОРОЙ ДИФЕРЕНЦИАЛ [ГЛ. IV функции ф: Ф(В) — ty(A), отличается от У на бесконечно малые порядка выше второго, то при всех достаточно малых е на сфере 5 имеем: «,*, D2) где сх— новая константа (например сг=-хА. Рассмотрим теперь (п — к—1)-мерное многообразие Slf получаемое пересечением многообразия C9) сферой D1). Так как Р касается много- многообразия C9) и имеет с ним одно и то же число измерений, то, следо- следовательно, расстояние от любой точки Sx до многообразия S— бесконечно малая второго порядка по сравнению с е. Кроме того, на сфере D1) все частные производные ~^~ суть бесконечно малые того же порядка, что и е; следовательно, какова бы ни была точка Bi много- многообразия Slt существует точка В многообразия S такая, что К(В,)—ИВ} К «2, D3) где с — константа, остающаяся ограниченной на сфере 5. Сопоставляя D2) и D3), заключаем, что в каждой точке В1% при- принадлежащей многообразию C9) и находящейся в достаточно малой окрестности точки Л, имеем: Но так как на многообразии C9) ф=/, то /{В)—/(Л)>0; точка А есть точка условного минимума. Докажем теперь справедливость необходимого условия. Итак, допу- допустим, что форма J не есть неотрицательная на многообразии Р. В таком случае можно из точки А выпустить прямолинейный луч ?, принадле- принадлежащий Р и такой, что в каждой точке В луча будем иметь: где s — расстояние от А до В и с' — отрицательная константа. Отсюда, как раньше для достаточно малого е: Ъ(В) — ф(Л)<Л«, D4) где с" — новая отрицательная константа. С другой стороны, так как луч L касается многообразия D0), то аналогично предыдущему на многообразии D0) найдется точка Ви для которой \ИВХ) — Ф(В)|<Л* D5) Сопоставляя D4) и D5), заключаем, что в любой окрестности точки А имеется точка Вх многообразия C9), в которой и так как на многообразии C9) / = <К то /(?,)</О*); точка А не есть точка минимума. 1) Знак равенства имеет место только тогда, когда В совпадает с
§ 25] ДОСТАТОЧНЫЕ УСЛОВИЯ ЭКСТРЕМУМА. МИНИМАКСЫ 127 Вполне аналогично доказывается справедливость условий для макси- максимума. Используя теорему Сильвестра, доказанной теореме можно при- придать аналитическую формулировку. Произведем над переменными hi ортогональное преобразование п Л1=2а'Л V—h 2,..., п), так, чтобы п — k координатных осей расположились на многообразии Р. Уравнения Р в новых координатах получатся приравниванием нулю к новых переменных. Пусть уравнения Р будут: При переходе к координатам у форма J примет вид: где коэфициенты aif выразятся через 5—^— и через аи. Условие, чтобы форма J была определенно положительной (неотрицательной) на линей- линейном многообразии Я, приводится к тому, чтобы усеченная форма п-к была определенно положительной (неотрицательной). Отсюда, используя теорему Сильвестра, получаем аналитическое условие для относительного минимума: для того чтобы стационарная точка А давала условный минимум, достаточно, чтобы все. диагональные миноры определителя \а^\ были положительны, и необходимо, чтобы эта миноры были не- неотрицательны. Заканчивая рассмотрение условий для условного минимума, отметим еще один интересный результат. Пусть Х„ L,...,ХЛ суть собственные значения формы У, расположен- расположенные в порядке возрастания: При этих обозначениях имеет место следующая теорема: ТЕОРЕМА. Для того чтобы условно-стационарная точка А да- давала условный минимум функций f(xy *?,..¦, х^) при k условиях <р, = 0 (i = l,2»..., ?), необходимо^ чтобы при i^>k числа \ были неотрицательны. В самом деле, обозначая через X/ ^ X/ <; .. • ^ X%_fc собственные значения усеченной формы У, в случае минимума все числа Хп_л должны быть неотрицательны. Отсюда, применив теорему Куранта, получаем: Теорема доказана.
128 КВАДРАТИЧНЫЕ ФОРМЫ И ВТОРОЙ ДИФБРЕНЦИАЛ [ГЛ. IV Геометрическая характеристика точек минимакса. Биркгоф (Birk- hof) выделил случай, когда второй диференциал в стационарной точке имеет одно отрицательное собственное значение. Такие стацио- стационарные точки названы им точками минимакса. Точки минимакса обла- обладают следующим свойством, найденным уже нами для случая двух и трех переменных (§ 18): область меньших значений в окрестности точки минимакса несвязна. Пусть точка Л есть точка минимакса функции /. Мы будем считать начало координат помещенным в точке Л и оси координат (yv yv..., уп) направленными по главным осям второго диференциала причем Xt = — т < О; \ > О при / > 1. Пусть точка В(уи yit. • .,уп) лежит в достаточной близости точки Л, Пренебрегая членами порядка выше р (Л, В)\ пишем: /(В) -/(А) = - Приращение /(?)—f(A) распадается на отрицательный член — и положительную форму Линейное многообразие лежит вне области меньших значений функции / по сравнению с /(А). Для всякой точки С (О, >>S,..., >n) этого многообразия, достаточно близкой к Л, причем равенство наступит лишь при С —А. Наоборот, все точки оси ух (в окрестности А), кроме точки А, лежат в области меньших значений. В самом деле, если D(yu 0,..., 0), ^фО, лежит доста- достаточно близко к Л, то Многообразие ^ = 0 делит область меньших значений на две части: на точки этой области, в которых ух > 0, и точки, в которых ух < 0. Так как само многообразие J^ —0 лежит вне области меньших зна- значений то, значит, эта область в окрестности точки Л, т. е. точки мииимакса, несвязна. Многообразия (^поверхности уровня") /(Л. Л.—Л) суть обобщенные „двухполостные гиперболоиды".
§ 26] ПРИБЛИЖЕННОЕ НАХОЖДЕНИЕ ТОЧЕК МИНИМУМА 129 § 26» Приближенное нахождение точек минимума Пусть задана в пространстве R^u х^,..., *«) функция /, непре- непрерывная вместе со всеми частными производными первых двух порядков. Назовем выпуклую *) ограниченную область U в пространстве Rn выпуклой областью минимума, если: а) для всякой точки А области U и ее границы форма есть форма положительно определенная. Ь) Существует по крайней мере одна точка А области U, для которой f()<9 где с — нижняя граница значений / иа границе U. Например, пусть ft П , 4=1 где аш bt—константы, форма /==2Л****1Г* положительно определен- определенная, т. е. ^aihxixb > ^2х** где ^^^ есть наименьшее собственное значение формы /. На сфере радиуса г вокруг начала форма J не меньше, чем Хг2, а линейная форма 2^^ по абсолютной величине есть вели- величина не выше первого порядка относительно г, следовательно, при г-*ооформа У, а вместе с ней и / стремятся к положительной беско- бесконечности. На границе такой сферы достаточно большого радиуса, функция / как угодно велика и превзойдет во всякой точке та- такой сферы значение /, например в начале координат. Кроме того, \) .. * hthj =22 ао^Аи есть Ф°Рма положительно определенная. Итак, сфера достаточно большого радиуса есть выпуклая область ми- минимума для функции / Свойства области минимума. 1. Внутри выпуклой области мини- минимума U не существует более одного стационарного значения функции /. В самом деле, пусть А(а^ и В{р^ — две стационарные точки функ- функции, лежащие в области U. Имеем: где точка С есть какая-то внутренняя точка отрезка АВ. В силу вы- выпуклости области U точка С принадлежит U; по свойству „а" областей минимума получим поэтому: Аналогично докажем также обратное неравенство: /(В)— ДЛ)>0. Итак, гипотеза о существовании на U двух стационарных точек приво- приводит к противоречию. О выпуклых областях см. дополнение I.
130 КВАДРАТИЧНЫЕ ФОРМЫ И ВТОРОЙ ДИФЕРЕНЦИАЛ [ГЛ. IV 2, В области U существует одна стационарная точка функции /. В силу теоремы Вейерштрасса существует точка Л, в которой функ- функция / достигает минимума своих значений на области U с ее границей. По определению области минимума А есть внутренняя точка области U и, следовательно, есть стационарная точка. Итак, система уравнений: ^ = 0 (г=1, 2,..., «), имеет в области U единственное решение. 3, Существует такая положительная константа X, что во всякой точке В области U В самом деле, обозначим через Х(Я) наименьшее собственное значение формы 2j д \J К*1? Из экстремального определения собственного зна- значения следует, что "к (В) есть непрерывная функция точки В; в силу свойства „а" для всех точек В области U и ее границы X (Б) > О-Сле- О-Следовательно, нижняя граница X (Б) на области U с границей, которую мы обозначим через X, положительна: X (В) >- X > 0. Тем самым дока- доказывается неравенство D6). Из D6) следует (полагая hj = 0 при j ф /): 4, Пусть А(а{) — точка абсолютного минимума. Для любой точки В области V имеет место неравенство: где Это неравенство показывает квадратическую погрешность, которую мы делаем, заменяя решение системы уравнений -~- = 0 решением приближенной системы уравнений ~ = hiy и может служить для оценки точности этого приближения. В самом деле, если Ь% суть координаты точки В, то 1=1 где С—некоторая точка отрезка Л В. Так как С принадлежит области U> то форма в правой части нашего равенства положительна и больше Но А (а19 а2, ..., ап) есть точка абсолютного минимума: /(Л)-ДВ)<0,
§ 26] ПРИБЛИЖЕННОЕ НАХОЖДЕНИЕ ТОЧЕК МИНИМУМА 131 и член 2 *«(#,- — яД очевидно, отрицателен и превосходит по абсо- абсолютной величине Х[г(Л, В)]2; в силу неравенства Шварца Итак, б. Если для последовательности точек из области ?/ все частные производные * ™ стремятся к пулю при т->оо, то последовательность А,9 сходится к точке минимума А. Это следует из свойства 4; непосредственно это вытекает из того обстоятельства, что для всякой точки сгущения последовательности —- = О, т. е. точка сгущения совпадает с А. х* Метод Либмана решения системы уравнений -^- = 0. Пусть Л0(л?0)) есть произвольная точка области U, в которой /(Ло) меньше нижней границы значений / на границе U. Построим точку Л, у ко- которой все координаты, кроме xv совпадают с координатами точки Л, а координата xt = J^ выбрана так, что f(xv х®\ ..., я?*) при пере- переменной координате хх и фиксированных остальных координатах дости- достигает при jc1=jc^1) своего минимума на U\ число аг^ определяется из уравнения v l ' ^ ' ** ¦ = 0. В силу свойств 1 и 2 области U мы убеждаемся, что это уравнение имеет в области U единственное решение. Определим последовательно точки А% (/=1, 2, ..., Н) следующим образом: если (*^, ..., х^\ xf\ v ..., jc^}) суть координаты точки Ajj то координаты ^-+1 совпадают с координатами Aif кроме i-{-l, которая определяется из условия: д f(JX) <S) х{\) JP) или: при фиксированных всех остальных координатах, совпадающих с координатами А.} (/-{-1)-я координата ^ , 1 = ^111 точки Ai вы- выбирается так, чтобы функция /достигала в точке (*^\ д:^, ..., х^1}, jc^1^,^0^, .-.,л^) своего минимума. Аналогично определяются после- последовательно точки: А А А >И2» '••» Л2п» *••' ^fc где 1 <] г <«, а ^ пробегает натуральный ряд. Именно: если мы уже определили точку ^^(jc^, ..., х^\ то точку Аы,± мы определим, положив все ее координаты х^ = х^ при />1, координату же
132 КВАДРАТИЧНЫЕ ФОРМЫ И ВТОРОЙ ДИФЕРЕНЦИАЛ [ГЛ. IV х =;с^+1) определим из требования, чтобы для этого значения xv при фиксированных остальных координатах / достигал минимума на U или Точно так же, определив точку Аы+Г(г<*)> мы можем определить точку Akn+r + v считая, что при /фг-J-l координаты точек Акп + Г и Л*л + г+1 совпадают, хг = х<* + г) при /<г, х\ — ^} при />r-f-l- Для / = г—}— 1 координата ^г+1=-^!^1) выбирается так, чтобы при фиксированных остальных координатах в точке 4Ли+г+1 достигался ми- минимум / на U, т. е. Из условия D7) следует: где С — точка отрезка i4fcli,rli4/ju+r, следовательно, С принадлежит области {/; так как-^|-^;> а > 0 (см. 46'), то наша разность положи- + тельна. Следовательно, последовательность/(Лдг), где N;rr=kn-\-r про- пробегает натуральный ряд, есть последовательность убывающая и ограни- ограниченная снизу: / (AN) >- А, где А — точка минимума / на U. Выражение Л?3 (jt^Vf^ xf^Y как разность между двумя членами сходящейся последовательности стремится к нулю, а так как g--tt- > X > 0, то, сле- следовательно, разность между координатами хг ;шух соседних точек после- последовательности сколь угодно мала. Пусть N—kn. Рассмотрим группу точек: A^,l9 AN,27 . ..,ЛДГ . df(Am Л В каждой из этих точек удовлетворяется одно из равенств: —^—х— = 0. ох9 При достаточно большом Л^ все эти точки сколь угодно близки друг к другу. И если в точке AN+Jf} ~ =0, то вследствие непрерыв- непрерывз-'- А дх< у ности з-'- в точке ААг имеем: где А, могут быть сделаны сколь угодно малыми при достаточно боль- большом N. В силу свойства 5 выпуклой области минимума V отсюда следует; точки AN сходятся к точке минимума А. Таким образом получаем метод последовательного приближения к точке минимума А} исходя из произвольной точки AQ1 удовлетворя- удовлетворяющей лишь следующим двум свойствам: Ао области U, f{A0) меньше значений/ на границе U.
§ 26] ПРИБЛИЖЕННОЕ НАХОЖДЕНИЕ ТОЧЕК МИНИМУМА 133 Пример. /= y2^*'^ + 2^x'> где 2 *«***>" есть Ф°Рма положи- тельняя. Мы ищем точку минимума А, т. е. решение системы уравнений п O (/=1,2, ...,/i). D3) В качестве точки А$ можно взять произвольную точку (-vj0*); в самом деле, мы можем в качестве области U взять сферу достаточно большого радиуса, так чти Aq попадет внутрь этой сферы и значение / ь любой точке границы сферы превзойдет /(Д>). Построим последовательность точек Если точка Л,т+г(*^+1), ..., х^+1\ лг^_1, ..., х***) построена, то точку ^few-fr+i мы ПОЛУЧИМ> считая все ее координаты равными соответственным координатам точки A1cfl_yri кроме (г +1)-й координаты, которая найдется из уравнения: + 2 Последовательным решением подобных линейных уравнений с одним неиз- неизвестным мы получим решение системы уравнений D8) со многими хшлазест- ными. При налтпти многих неизвестных описанный метод является удобным методом решения системы линейных ур&внендд* (В такой общей форме, он обоснован И. Г. Соколовым.) Требования положительности формы •олУдг«х> можно обойти. Пусть мы имеем произвольную систему уравнений с п неизвестными хь хь ..., хя: 2"<Л + bi = ° С в !• ^ - -. п). D9) к Рассмотрим функцию Если \alh. 1Ф0, то форма 2/2****Y Л к } существенно положительна. Функция F достигает минимума, равного нулю, если удовлетворяются уравнения D9). В точке же минимума удовлетворяются п линейных уравнений: п )• E0) Система E0) эквивалентна системе D9). Система E0) уже поддается прибли- приближенному решению описанным методом.
ДОПОЛНЕНИЕ I ЦЕЛОЧИСЛЕННЫЕ СЕТИ При решении некоторых экстремальных задач в следующей части мы встретимся с так называемыми целочисленными сетями. Назовем целочисленной сетью 91 я-мерного пространства (х19 х^у .. v х^ сово- совокупность точек A(ktl &2> ,.., k^) с целочисленными координатами х{ = кг (г =1,2, •.., я). Сами точки А называются узлами сети % а соответственные векторы О А — целочисленными в?КПЩ#лми. Оче- Очевидно, линейная комбинация ^ci0Ai целочисленных векторов ОАк с це- целыми коэфициентами с§ есть тоже целочисленный вектор Пусть нам дано линейное преобразование п jjv (*—*' 2> • • •' ")• с1) Обозначим через 39 совокупность точек с целочисленными координатами в системе (yv у2у ...у у»). ТЕОРЕМА 1. Для tnozo чтобы при преобразовании A) 33 совпадала с % необходимо и достаточно, чтобы все коэфициенты а4* были целыми числами и чтобы |a;fi-{ = db:i. Условие достаточно. В самом деле, пусть числа а^ целые и |afy|=:rtzl; в этом случае существует обратное преобразование Я=2<ЧЛ 0 = 1. 2, ..., п). B) При этом числа а^ целые, так как они равны минорам детерминанта |*%|, деленным на значение самого детерминанта, т. е, на 1. Очевидно, всякий элемент сети 95 есть элемент сети 31, так как при целых уг в силу целочисленности atj следует из A) целочисленность xv Из фор- формулы же B) в силу целочисленности &ц следует, что всякий элемент *й есть элемент 25, т. е. целочисленным значениям хг отвечают целочис- целочисленные значения уг Условие необходимо. Докажем прежде всего необходимость условия |«о-|ф0. В самом деле, пусть \а^\ = 0. Преобразование A) переводит наше гьмерпое пространство в некоторое ft-мерное многооб- многообразие Lk (k < п). Сеть 83 принадлежит Lk. Но сеть 91 содержит в каче- качестве узлов концы п единичных векторов, поэтому сеть 91 не может при этих обстоятельствах совпадать с сетью 5В, ибо иначе ^-мерное много- многообразие Lh содержало бы п единичных векторов.
ЦЕЛОЧИСЛЕННЫЕ СЕТИ 135 Итак, | ai3\ ф 0. В силу этого существует преобразование B), обратное преобразованию A). Так как сеть 91 должна совпадать с 95, то точка с целочисленными координатами в системе (xlt лг2, ¦ -., хп) должна иметь целочисленные же координаты в системе (уи у^ . ¦ •> .У«)- Рассмотрим точку Aj с координатами у: У/21'} при '+/• Ее координаты в системе ^-ов следующие: Так как х% суть числа целые, то а^ — числа целые. Аналогично дока- доказывается целочисленность коэфициентов обратного преобразования. Детерминанты \atj\ и |а^| суть также числа целые, кроме того, их произведейие равно единице, так как преобразование A) и B) суть обратные преобразования: Произведение же двух чисел равно единице только в том случае, если каждое из них равно :±=1. Таким образом теорема доказана. ТЕОРЕМА 2. Пусть U есть единичный параллелепипед сети ф: 0<У«<1 ('=1. 2, ...,«). Пусть вершины его совпадают с точками сети 91 и пусть на гранях и внутри U других точек сети % не содержится. При этих условиях, если преобразование (I) невырожденное, то оно переводит сеть 91 в самое себя (т. е. числа а^ целые и Ja^|= 1). В самом деле, в силу формулы A) единичные векторы ОУг {1= 1, 2, ..., п) системы координат (уг, у2, ..., уп) имеют в системе лг-ов коор- координаты аи> ап, ..., anV Так как концы единичных векторов ОУ{лежат в вершинах параллелепипеда Uy принадлежащих сети 9t, то их коорди- координаты a4j суть числа целые. Пусть теперь точка А сети 91, имеющая целочисленные координаты дг4г=А<1 имеет в системе (у^ нецелочисленные координаты: yi = li-\-dl, где /, — число целое, 0 ^ dt < 1 и не все d% = 0. Имеем: > ,. где точка С имеет в системе у координаты dv d2t ,,., dn. Точка С принад- принадлежит параллелепипеду U и не совпадает ни с одной его вершиной. В силу определения параллелепипеда U точка С не принадлежит сети 91, Но так как векторы ОА и ОУг суть векторы целочисленные в системе коор- координат (х{)9 то ОС=ОА — 2'*0У^ есть тоже целочисленный вектор в системе (х,) и точка С принадлежит сети 91. Полученное противо- противоречие доказывает нашу теорему.
136 ДОПОЛНЕНИЕ I Плоская сеть. Рассмотрим теперь в частности случай плоской цело- целочисленной сети % при системе координат (xv л^). Пусть ОА и ОВ будут единичные векторы этой системы (черт. 23). Наряду с системой (*i> **) введем новую систему координат (уи у%), причем концы С и D единичных векторов этой системы принадлежат сети %: ОС = kn0A -f- ku0B, OD = k^x О А -\- kp OB, где k%i — числа целые. Единичный параллелограм OCED: О 4^ух <С 1» О ^Уъ < ^ разбивается на два тре- треугольника OCD и ECD с вершинами, принадлежащими сети 91- Пусть тре- треугольник OCD не содержит никаких узлов сети 91, кроме своих вершин. Тогда и треугольник ECD не содер- содержит никаких точек сети, кроме сво- своих вершин. В самом деле, если точ- точка Му не совпадающая с Е, С, D, принадлежит треугольнику ECD, то точка N— конец вектора ОЕ—ОМ — принадлежит треугольнику OCD и не совпадает с его вершинами. Если бы мы имели Черт. 23. где iv /2 — числа целые, то причем числа в скобках были бы числа целые; если бы точка М при- принадлежала сети 91, то точка N тоже принадлежала бы сети 91, что про- противоречит нашему предположению. Итак, если OCD не содержит узлов сети 91, кроме, своих вершин» то и параллелограм OCED не содержит узлов сети, кроме своих вершин. Поскольку единичные векторы системы координат (д^, у^) не лежат на одной прямой, переход от системы (xv x2) к (у%9 у2) есть преобра- преобразование невырожденное. В силу теоремы 2 получаем: если треугольник OCD, построенный из единичных векторов новой системы координат (ух, у.^), не содержит узлов сети % Кроме своих вершин^ принадлежащих этой сети, то в преобразовании коэфициенты: а1 До2 — числа целые и
ВЫПУКЛЫЕ ТЕЛА 137 ДОПОЛНЕНИЕ II ВЫПУКЛЫЕ ТЕЛА Область (тело) л-мерного пространства называется выпуклой, если отрезок, соединяющий две произвольные точки области (тела), целиком принадлежит области (телу). В качестве примеров выпуклых тел можно взять сферу, параллеле- параллелепипед и тетраэдр. Допустим, что мы имеем две выпуклых области, имеющих хотя бы одну общую точку- Докажем, что пересечение этих областей есть опять выпуклая область. В самом деле, если две точки А и В при- принадлежат пересечению, то А и В принадлежат каждой из областей, следовательно, отрезок, их соединяющий, будет также принадлежать каждой из областей, т. е. будет принадлежать их пересечению. Из изложенного легко вытекает такая общая теорема: пересечение любого конечного числа выпуклых областей есть или пустое множе- множество или выпуклая область. Доказанную теорему можно распространить также и на выпуклые тела. ТЕОРЕМА 1. Пересечение двух п-мерных выпуклых тел есть или выпуклый кусок линейного многообразия k (k < я) измерений *) или выпуклое тело (черт. 24). Повторяя рассуждения, приведенные в § 8 при рассмотрении пересечения двух об- областей, мы заключаем, что если концы отрез- отрезка принадлежат пересечению, то этот отрезок целиком принадлежит пересечению. Далее здесь возможны два случая. L Существует точка А пересечения, из которой можно провести не более k (k < п) линейно независимых векторов ги г2, --*>гк, принадлежащих пересечению. Черт. 24. 2. Из каждой точки произведения можно выпустить п линейно независимых векторов, принадлежащих пересечению. Разберем первый случай. Построим линейное многообразие L k измерений, содержащее векторы rlf г2, ..., гк\ покажем, что все точки пересечения принадлежат построенному многообразию L. В самом деле, допустим, что существует точка М пересечения, не принадлежащая многообразию L; тогда вектор AM будет принадлежать пересечению и вместе с тем не будет линейно выражаться через векторы г„ сле- следовательно, из точки А можно провести k -\-1 линейно независимых векторов г19 г2, ..., гк и AM, принадлежащих пересечению. Но это противоречит первоначальному допущению. Итак, в этом случае каждая точка пересечения принадлежит линейному многообразию k измерений. Во втором случае по п линейно независимым векторам, выходящим из каждой точки А пересечения, мы можем построить «-мерный тетра- х) Сюда причисляется случай, когда пересечение пусто или содержит точку.
138 ДОПОЛНЕНИЕ II здр с вершиной в точке А и целиком принадлежащий пересечению. Отсюда легко видеть, что в разбираемом случае пересечение есть я-мерное тело. Аналогично докажем, что пересечение 6-мерного линейного мно- многообразия с выпуклым телом есть выпуклая часть /-мерного много- многообразия (выпуклое /-мерное тело), где /<[ А. В частности, пересечение выпуклого тела с прямой есть отрезок прямой или точка. В качестве примеров, иллюстрирующих теорему о пересечении вы- луклых тел, рассмотрим пересечение двух n-мерных сфер и пересечение двух параллелепипедов. Если сумма радиусов двух сфер больше, чем расстояние между их центрами, то пересечение есть выпуклое тело; если сумма радиусов равна расстоянию между центрами, то пересечение есть точка; в других слу- случаях пересечение пусто. Если пересечение двух параллелепипедов содержит k — 1-мерное сферическое многообразие и не существует ^-мерного сферического многообразия, обладающего тем же свойством, то пересечение есть (k— 1)- мерное выпуклое тело, принадлежащее линейному многообразию (k—1) измерений и ограниченное кусками (А — 2)-мерных линейных многообразий. Заметим еще следующее: ТЕОРЕМА 2. Если точки В и С лежат внутри выпу1слого тела М, то весь отрезок ВС лежит внутри /IL В самом деле, так как В и С лежат внутри М (черт. 25), то их можно окружить сферами некоторо- некоторого положительного радиуса е, цели- целиком лежащими внутри М. Пусть отре- отрезок ВС содержит точку Д лежащую на границе М. В любой близости точ- точки D находятся точки, лежащие вне М. Пусть Е лежит вне Миг (D, ?)<е. Перенесем параллельно отрезок ВСтак, чтобы сдвиг каждой его точки равнялся вектору DE. Точки В и С перейдут в точки Bt и С1э попрежнему лежащие г{С, CJ = r{D% ?)< е. Значит, и весь Черт 25 внутри М, так как г (В, В^ отрезок JB^Cj должен принадлежать М. Но этот отрезок содержит точку Е7 которая лежит вне М. Получаем противоречие. ТЕОРЕМА 3. Если концы отрезка ВС принадлежат границе вы- выпуклого тела М и если третья точка D отрезка принадлежит границе All, то весь отрезок ВС лежит на границе J&* В самом деле, пусть D лежит на границе М (черт. 26), а четвертая точка_?Г отрезка ВС лежит внутри М. J^ принадлежит или отрезку BD или DC. Пусть Е лежит на отрезке DC; существует сфера радиуса г > 0 вокруг точки ?, целиком лежащая в Л!. С другой стороны, в лю- любой близости граничной точки D существует точка Dlt лежащая вне М.
ВЫПУКЛЫЕ ТЕЛА 139 Пусть Dt лежит вне М и r(D, D^ < ~~7дЧ?ч- • Проведем прямую че- через В и ?>х и отметим точку ?*г пересечения этой прямой с пря- прямой EEV параллельной DDV Вследствие подобия треуголь- g ников BDD1 и ВЕЕХ имеем: /В /О € С> Поэтому точка Et лежит вну- внутри тела Л! (она принадлежит сфере радиуса е с центром в точке ?). Мы получили проти- противоречие: отрезок ВЕг соединяет г Черт. 26. две точки В и Ех выпукло- выпуклого тела М и содержит точку Dly этому телу не принадлежащую. Предыдущие рассуждения сохраняют силу, если точка лежит внутри Л!, а точка Е—на его границе. Но так как в этом случае весь отре- отрезок ВС не может лежать на границе Л!, то, значит, отрезок ВС не мо- может содержать точек границы М (кроме точки С), Получаем: ТЕОРЕМА 4, Отрезок, соединяющий внутреннюю точку выпукло? го тела с граничной, не может содержать никаких других гранич- граничных точек. Следствие. Пусть ВС — отрезок, соединяющий две точки В а С границы тела Д1. Продолжение этого отрезка не может содержать вну- внутренних точек М. Пусть, обратно, продолжение отрезка #С содержит внутреннюю точку Е тела Л!; мы имеем: или отрезок BE содержит точку С или СЕ содержит точку В. В обоих слу- случаях мы вступаем в противоречие с теоремой 4. Опорные плоскости. Пусть М — ограниченное выпуклое тело в я-мер- ном пространстве, L — некоторая прямая. Рассмотрим семейство {Р\ всех (п— 1)-мерных линейных много- многообразий, ортогональных к L; много- многообразия Р заполняют все «-мерное пространство. Среди многообразий Р найдутся многообразия, пересекаю- пересекающие М9 и многообразия, не пересека- пересекающие М. Пусть, например (черт. 27), Рх не пересекает М. Будем пере- перемещать его параллельно, в направле- направлении к М9 пока оно впервые в по- Черт. 27. ложении PQ не пересечет границу Л!, Будем продолжать параллельное передвижение нашего линейного много- многообразия. Теперь оно (в положении, например, />3) будет пересекать Л1. У 7
140 ДОПОЛНЕНИЕ II Обозначим далее через Р4 положение этого мнотобразия, когда оно в последний раз имеет общие точки с Ж. При дальнейшем параллельном движении нашего многообразия оно уже (в положении, например, Рь) не пересекает М. Многообразия Рг и Р4 называются опорными плоскостями для Мх ортогональными/,. Опорные плоскости кМ определяются как линей- линейные (п— 1)-мерные многообразия, удовлетворяющие следующим условиям: 1. Опорная плоскость имеет общие точки с границей тела М. 2. Тело М расположено по одну сторону опорной плоскости. Для всякого направления L можно построить две (и только две) опорных плоскости к выпуклому телу Ж, ортогональные к L Гомеоморфизм выпуклых тел в /f-мерном пространстве. Пусть нам даны два множества А и В. Установим между их точками взаимно- взаимнооднозначное соответствие, при котором каждой точке А множества А отвечает единственная точка В множества /?, называемая образом точки А Черт 2«. Черт. 29. на В> и обрятно. Пусть, кроме того, если точкя Acs А является пре- предельной для точек Ап множества, ее образ В является предельным для точек Вп — образов точек АЛ на В. Вкратце скажем: между точ- точками А и В устаноапено взаимно-однозначное и взаимно-непрерывное соответствие. В этом случае множества А и В называются гомеоморфными* Например, окружность гомеоморфна аплипсу, любому овалу, вообще любой замкнутой линии без кратных точек. ТЕОРЕМА 5. Все выпуклые ограниченные тела в п-мерном про- пространстве гомеояюрфны. Пусть нам даны два выпуклых тела М и N в я-мерном пространстве (черт. 28). Пусть А есть внутренняя точка М. Перенесем тело N па- параллельно так, чтобы А стала внутренней точкой также тела N. Про- Проведем из точки А луч L. Этот луч пересечет границы тел М и N, при- причем каждую из них в одной точке (в силу теоремы 4), Пусть L пере- пересекает границы М и N в точках соответственно В и Bv Если рассма- рассматривать точку Bt как образ В, то, проводя лучи L во всевозможных направлениях, мы получим взаимно-однозначное соответствие между точками границ обоих тел. Докажем, что это соответствие непрерывно. Проведем вокруг точки А сферу $ радиуса е, целиком находящуюся внутри М и N. Пусть В есть точка границы М; она находится вне
ВЫПУКЛЫЕ ТЕЛА 141 сферы 5. Точка С—другая точка границы, столь близкая к В, что весь отрезок #С (включая точку С) находится вне сферы S. Продолжение отрезка ВС тоже не пересекает этой сферы (в силу следствия к тео- теореме 4). Расстояние г{ от точки А до прямой ВС превышает радиус сферы. Обозначая через а угол в треугольнике ABC в вершине В (черт. 29), имеем: где / — диаметр тела М. Обозначая через АВ и АС, имеем (теорема синусов): угол между отрезками Когда угол р стремится к нулю, отрезок ВС стремится к нулю. Пусть теперь точка Вх границы N есть образ точки В границы М. Если точка С границы М стремится к точке В, то угол р= / CAB стремится к нулю; в силу только что сделанного замечания при этом стре- стремится к нулю и г(С1э В{\9 где Су — образ С на гра- границе N. Итак, непрерывность отображения доказана. Мы доказали пока го- гомеоморфизм границ тел М и N. Установим теперь следующее соответствие Черт. 30. точек М и N. Пусть (черт. 30) D— точка М. Проведем через А и D луч Ll9 пересекающий границу Ж в точке В и фаницу N в точке Bv Отнесем точке D точку Dx тела N на том же луче Lx такую, что г (Л, Р) г (Д В) п. г(Л А) '(А ад * 1 ' Точка А соответствует при нашем отображении сама себе. Очевидно, это отображение взаимно-однозначное. Докажем его непрерывность. Пусть Е — точка тела Ж, неограниченно приближается к D (D от- отлично от Л), Тогда луч /,, соединяющий А и Е9 стремится к лучу Ll9 соединяющему А с D. Точки пересечения С и Сг луча L с грани- границами М и N стремятся к точкам пересечения В и Вх предельного луча Lx с этими границами, поэтому г (Л, С) —> г(Ау В)9 г(А9 Сг)—->г(А, Вх). В силу равенства A), когда луч L стремится к лучу Lx и г (А, ?")-> -+r(A, D), то г(Л, Ех) стремится к r{A>t3fy. Очевидно, при этом точка Ех стремится, как к своему предельному положению, к точке Dv Итак, теорема доказана.
142 дополнение ш ДОПОЛНЕНИЕ III ТЕОРЕМА БРАУЕРА Более общим отображением, чем гомеоморфное, является отображе- отображение непрерывное. Отображение множества М на Мх называется непре- непрерывным, если каждой точке Л! отвечает ее образ — точка М1У и если пределу последовательности точек Л! отвечает на Мг предел последо- последовательности их образов (не предполагается взаимная однозначность отображения). Пусть дано непрерывное отображение множества точек М на мно- множество Mv Если точка А множества М при этом отображении перешла сама в себя, то точка А называется неподвижной точкой нашего ото- отображения. Мы докажем здесь фундаментальную теорему Брауера (Brower) отно- относительно непрерывного отображения выпуклого тела в собственную часть. Эта теорема играет существенную роль в доказательстве целого ряда теорем анализа. В частности мы будем пользоваться ею в § 61. ТЕОРЕМА БРАУЕРА. При всяком непрерывном отображении F вы- выпуклого тела U в пространстве п измерений на множество U19 совпа- совпадающее с U или являющееся его частью, существует хотя бы одна неподвижная точка. Так как все выпуклые тела гомеоморфны n-мерному симплексу (см. Дополнение II, теорему 5), то достаточно доказать эту теорему для л-мерного симплекса 1). Мы дадим замечательное доказательство этой теоремы, принадлежащее Кнастеру, Куратовскому и Мазуркевичу 2). Обозначая вершины n-мерного симплекса То через р0, ри ..., pnt любую его ^-мерную @<;&О) грань будем обозначать через (р,о, Pt i •••> Pi )> r#e P§ (w = 0, 1, 2, . . ., k) образуют совокупность вершин этой грани. Пусть симплекс То симплициально 8) разбит на не- некоторые симплексы 71*. Каждой вершине р симплексов подразделения отнесем целое число е(р) следующим образом. Рассмотрим грань наименьшего числа измерений основного симплекса То содержащую р. Пусть этой гранью оказалась ft-мерная грань (A » Pi, • • • i Pik) (Q ^ ^^ п)' Число е(р) определяем равным одному из индексов /0, г\, ..., /А. Например, если р совпадет с вершиной pt симплекса То, то <?(/?) = i; если р лежит на прямой ptp^ не совпадая с ее концами, мы можем приравнять е(р) одномуиз чисел i или j и т. д. Наконец, если р лежит внутри То [не принадлежит ни одной ^-мерной грани F<я)], то е(р) может равняться любому из {п-\-1) чисел О, 1, 2, ...,«. Назопем е{р) нормальной функцией вершин. *) Теорема Брауера верна, конечно, не только для я-мгрных выпуклых тел но и для всех тел, гомеоморфных //-мерному симплексу. 2) Fund. Mat, т. 14, стр. 132—137. 8) Пусть л-мерный симплекс Г разбит на симплексы TQt Ть Т& . . ,. Т* Это разбиение называется симплициальным, если два симплекса разбиения или не имеют общих точек, или имеют в качестве пересечения обшую целую Л-мер- ную грань ifi<^)
ТЕОРЕМА БРАУЕРА 14$ Черт. 31. Назовем репрезентативным симплексом тот из симплексов Т* нашега разбиения, (я-f- I) вершинам которого отнесены п-{- 1 различных чисел О, 1, 2, . . . , п. (На черт. 31 мы приводим разбиение двумерного симплекса с подобным отнесением вершинам симплексов разбиения чисел 0, 1, 2; заштрихованный треугольник есть репрезентативный симплекс.) ЛЕММА 1. Каково бы ни было симплициальное разбие- разбиение симплекса То и какова бы ни была нормальная функция вершин е(р), заданная на вер- шинах симплексов разбиения, всегда существуют репрезен- репрезентативные симплексы и при- притом в нечетном числе. Доказательство ведется ме- методом совершенной индукции. Теорема тривиальна для случая п = О, когда симплекс сводится к одной точке. Считая теорему верной для симплексов (п—1) измерения, докажем ее для сим- плексов п измерений. Пусть дано симплициальное разбиение л-мерного симплекса То и на вершинах р симплексов раз- разбиения определена нормальная функция е(р), где е{р) равно одному из чисел 0, 1, 2, ..., п—1. Назовем (п—1)-мерной репрезентативной гранью (л—1)-мерные грани симплексов разбиения, на п вершинах кото- которых нормальная функция принимает п значений: 0, 1, 2f...xn—1. Число (п—1)-мерных репрезентативных граней симплекса разбиения Тг обозначим через аG\). Возможны три случая. 1) Функция е(р) на вершинах симплекса 7\ принимает все (л-|-1) значений 0, 1, 2, ..., л; 7\ — репрезентативный симплекс, он содер- содержит единственную репрезентативную (п — 1)-мерную грань, противопо- противоположную вершине р, для которой е(р) = п, отсюда а G\)= 1, 2>G\) = rv A) где рп—число репрезентативных n-мерных симплексов; сумма в левой части берется по всем репрезентативным симплексам. 2) Функция е(р) на вершинах нерепрезентативного симплекса Т2 принимает п значений 0, 1, 2, ..., п—1. Одно из этих значений она должна принимать два раза, следовательно, 7*2 имеет две репрезентатив- репрезентативные (п—1)-мерные грани: выпускает одно из зна- зна3) Функция е(р) на вершинах симплекса чений 0, 1, 2, ..., п— 1, а(Г8) = 0. Отсюда
144 ДОПОЛНЕНИЕ III Первая сумма берется по всем я-мерным симплексам разбиения, вторая по репрезентативным «-мерным симплексам. Произведем несколько другой подсчет репрезентативных (я—^-мер- (я—^-мерных граней. Возможны два случая. 1) Репрезентативная грань попадает внутрь основного симплекса Т^ она есть общая граница двух симплексов разбиения, и в сумме ^а(Т) мы ее считали два раза. 2) Репрезентативная грань попадает на границу То. Из определения такой грани и функции е (р) следует, что она может находиться только на (п— 1)-мерной грани р^ pv /;2, ..., рп_х основного симплекса. Обозначим через рп_, число (п—1)-мерных репрезентативных траней, попавших на (р^, ри ..., рп_г). Имеем: 2aG)epe-1(mod 2). C) Из A), B), C) следует: Но для (п—1)-мерных симплексов лемму мы считаем доказанной: рп1 — нечетно, следовательно, рм нечетно. Во всяком случае pw Ц= 0 (ибо нуль число четное). ЛЕММА 2. Пусть симплекс То покрыт (п-\-\) замкнутыми множествами Ао> А у ..._, Ан таким образом, что его k-мерная грань р^ р^ .... pik @<?<л) покрыта множествами А*, Ай, ..., А^. При этих условиях существует точка, принадлежащая всем (п -f-1) множествам Л, (/ = 0, 1, 2, .,.,«) (черт. 32). Разобьем То симплициально и на вер- вершинах р симплексов разбиения определим следующую функцию е(р): рассмотрим Черт. 32. грань (AV А^ ^ э pj @ < k < п) наи. меньшего числа измерений, заключаю- шу ю р. Точка р попадет в одно из множеств А, А.,..., А4, покрывающих эту грань. Примем е (р) равным индексу того из этих множеств, которое заключает р (или любому из таких индексов, если р попала в несколько из множеств A., Ati ..., А4)) е(р) есть нормальная функция вершин. Для нее в силу леммы 1 должен существовать репрезентативный сим- симплекс Тг среди симплексов нашего разбиения. На вершинах Тх функ- функция е{р) принимает все (п-\-1) значений 0, 1, 2, ..., л, или: вершины Тх принадлежат (и-f-l) различным множествам Л,. Будем производить симплициальные разбиения 7^ на все более и более мелкие симплексы; пусть диаметры симплексов п-разбиения не превосходят ew, lim en = Q. Рассмотрим последовательность репрезента- тивных симплексов 7\, Г2, ..., 7^,...; 1-го, 2-го, ..., m-го,... подразде- подразделения. Вследствие компактности То совокупность вершин симплексов Тт имеет точку сгущения /0- Ьыбрав произвольное е, ограничимся в после-
ТЕОРЕМА СРАУВРА 145 довательности Тт теми членами, для которых s^<-^« В сферу ра- радиуса 4у с центром н t0 попадает по крайней мере одна вершина одного из симплексов ТтУ а следовательно, в сферу радиуса е вокруг t0 — все (п-\~1) вершин такого симплекса. Так как вершины Тт принадлежат всем множествам Ао, Av А2, ..., Ан, то в любой е-окрестности точки *0 найдутся точки всех множеств Аг (/=0, 1, 2, ..., а); /0 есть предель- предельная точка для всех Аг и вследствие замкнутости этих множеств принад- принадлежит им самим. Лемма доказана. Перейдем к доказательству теоремы. Введем на То барицентрические координаты с0, с19 с,, ..., сп, 2^=1 1). Для точек То все сг > 0. Пусть точка а (с{) (i — 0, 1, ..., п) перейдет при преобразовании F в точку b = F(a) с координатами^^/ (/ = 0, 1, 2, ..., п), 2е/=1- Так как 1>С тъу то » все с/>0. Рассмотрим точку а, лежащую ria грани p. pi7 ..., р> @<^<//). Координаты Cj точки а при / =р/0, lv ..., ih равны нулю, с{ -\-ct -[- ... -{-Ct =1. Пусть /; — F(a) имеет координаты с0', г/, ..., сп'. Так как то невозможно одновременное выполнение неравенств: ct < с/> сг < с{', ..., с{ < с% [\ по крайней мере для одной из этих координат будем иметь: Отсюда следует: если обозначить через А{ множество точек, у кото- которых координата ct не возросла при преобразовании F, то всякая точка а грани U\yPiky •••• Pi,) покроется одним из множеств А^ А^ ..., Aif. Множества Л, удовлетворяют условиям предыдущей леммы. Мы мо- можем поэтому утверждать, что существует на 7 хотя бы одна точка ао(со(О)> сг{0)> •••» ^0))> которая попадет во все джожества А4 (/ = 0, 1, ..., //). Ни одна из координат точки а0 при преобразовании F не возрастет. Отсюда, если с0A), с^1*, . .., сп{1> суть координаты точки ? F то г/°>>/:^> @ </</*), следовательно: Поэтому неравенства отпадают, и мы получаем с^=с^ (/==0, 1, 2, ..., л). Точка а0 совпадет с точкой д^ в которую она перейдет при преобразовании Z7, т. е. а0 есть неподвижная точка. Теорема Брауера доказана. Обобщения теоремы Брауера на случай линейных пространств более общей природы даны последовательно П. С. Александровым и В. В. Немыц- ким, Шаудером (Schauder), A. H. Тихоновым. г) См. конец § И
УКАЗАТЕЛЬ Абсолютный минимум (максимум) 62 Александров /7. С. 145 Аналитические многообразия 77 Аналитический критерии положитель- положительности формы 109 Аппроксимация (наилучшая) векто- вектора 69 Ассоциативность сложения векто- векторов 14 — умножения вектора на скаляр 14 Базис совокупности векторов 21 Барицентрические координаты 53, 54 Билинейная форма 87 симметрическая 87 Билинейной формы коэфициенты $7 Биркгоф 128 Брауера теорема 142 Вековое уравнение 99, 100 Вектора геометрическая проекции на многообразие 31 — компоненты 12 — конец 12 — начало 12 — норма 26 — проекция 30 — проекция на многообразие 69 — умножение на скаляр 13 Векторов ассоциативность сложе- сложения 14 — внутреннее произведение 31 — дистрибут. законы операции 14 — коммутативность сложения 14 — линейная зависимость 15 — разность 13 — сложение 13 — совокупность как многообразие 1С — сумма 13, Векторы 11, 12 — единичные 14 — целочисленные 134 Вершины куба 23 Вейерштрасса теоремы 63—65 Выпуклая область 137 минимума 129 Выпуклые тела 137 Гадамара неравенство 81 Географические координаты 52 Геодезические линии 51 Главные оси квадратической формы 99,100 Гомеоморфизм выпуклых тел 140 Градиент функции 44 Грамма определитель 68—69, 80, 112 Грани куба 23 Граница области 39 Граничные точки 39 Грань репрезентативная 143 Группа преобразований 19 Диаметр множества 26 Дирихле принцип 58 Дискриминант квадратичной формы 95 Дистрибутивности законы в опера- операциях над векторами 14 Диференциал 43—44 Длина отрезка 25 Длина проекции 31 Долгота сферическая 51 Дуги элемент 50 Евклидово л-мерное пространство 25 Единичные векторы 14 Единичный куб 23 Замкнутая область 39 Замкнутое множество 39 Замыкающая полигона 31 Зеркальные отражения 103 Изолированная точка 91 Изопериметрическая задача для по- полигона 82 Инварианты линейных преобразова- преобразований 18 Инерции закон (квадрат, формы) 97 Канонический вид квадрат, формы 88 Касательные многообразия 54 Квадратичная форма 88 на линейном многообразии 114 неотрицательная 89 положительно определенная 89 главные оси 99, 100 закон инерции 97 нормальный вид 88 преобразование 95 Классификация экстремумов 62 Коммутативности закон сложения векторов 14 Компактное в себе множество 41 Компоненты вектора 12 Координат местная система 51 Координатная линия 55
УКАЗАТЕЛЬ 147 Координаты барицентрические 53, 64 — криволинейные 47,50 — сферические 51 — эллиптические 52, 53 Координаты многообразия 51 Коши последовательность 40 Коэфициенхы билинейной формы 87 Кратные точки 48 Крест координатный 14 Критические значения функции 58 — точки 48, 49 — (условно) значения 75 Куранта-Фишера экстремальная тео- теория собственных значений 105 Куба вершины 23 — грани 23 — ребра 23 Куб единичный 23 Лагранжа формула 22 — Эйлера метод неопределенных множителей 73 Либмана метод 131 Линейная зависимость векторов 15 Линейное или векторное простран- пространство 20 Линейные преобразования 17—20 Линии геодезические 51 — равных значений 91 Линия координатная 55 Липшица условие 43 Лоренцово преобразование 38 Максимума и минимума условия 89— 90 Мини макса точки 128 Минн максы 93 Минимум (максимум) абсолютный 62 относительный 62 строгий 62 Минимума выпуклая область 129 Минковского неравенство 63 Многообразие линейное 6 — fc-мерное 48 линейное 6 — сферическое 26 Многообразий параллельность 10 — пересечение 9 Многообразия аналитические 47 — (взаимная принадлежность) 9 — касательные 54 — координатные 51 — параметрическое определение 47 Множества диаметр 26 Множество замкнутое 39 — компактное в себе 41 — ограниченное 41 Немыцкий П. В, 145 Норма вектора 26 Нормальная функция вершин 143 Нормальный вид квадратичной формы Ньютона формула 22 Области граница 39 — минимума свойства 129—130 Область 38 — больших значений 92, 106 — выпуклая 137 — задания функции 43 — замкнутая 39 — меньших значений 92, 106 — несвязная 93 — связная 95 Образ точки 140 Объем я-мериого тела 81 Ограниченное множество 41 Окрестность точки 39 Определитель Грамма 68—69, 80, 112 — преобразования 18 Ортогональная проекция точки 30 Ортогональн. преобразования 34, 97 Ортогональных преобразований об- обобщение 36 Относит, минимум (максимум) 62 Отображения непрерывные 142 Отражения зеркальные 103 Отрезка длина 25 Отрезок направленный 12 — прямой 11 Параллелепипед 24 — я-мерного пространства 23 Параллельное перенесение 12 Параллельности векторов условие 27 Параллельность дшогообразий 10 Параметрическое определение много- многообразия 47 Перенесение параллельное 12 Пересечение многообразий 9 Перпендикулярности векторов усло- условие 27 Плоскость опорная 139, 140 Полигона замыкающая 31 Полиномов пространство 21 Последовательность Коши 40 Предел последовательности точек 40 Предельная точка 39 Предельный переход в «-мерных про- странствах 38 Преобразование Лоренца 38 — вырожденное 18 — обратное 18, 19 — переменных 48 — тождественное 18 Преобразований группа 19 — интерпретация 18 — произведение 18—19 Преобразования квадратичных форм 95 — линейные 17—20
148 УКАЗАТЕЛЬ Преобразования определитель 18 — ортогональные 34, 97 — треугольные 20, 97, 116 Приближенное нахождение точек ми- минимума 129 Принцип взаимности Эйлера 84— 85 -*• Дирихле 58 Приращение функция 43 Проекции длина 31 Проекций векторов сумма 31 Проекция вектора 30 геометрическая 31 ¦ -на многообразие 69 — точки 30 на многообразие 31 Произведение векторов внутреннее 31 — преобразовании 18—-19 Производная в данном направлении 44-46 Пространство полиномов 21 — решений линейного однородного уравнения 22 — цветов 22 Радиус-вектор 51 Разность векторов 13 Расстояние между точками 25 Расстояние точки до многообразия 54 Ребра куба 23 Репрезентативная грань 14В Репрезентативный симплекс 143 Сети целочисленные 134 Сеть плоская 135 Сильвестра теорема 109 — теоремы обобщение 112 Симметрическая билинейная фор мл S7 Симплекс /7-мерный 23 — репрезентативный 143 Скаляр 13 Сложение векторов 13 Собственные значения формы 100 Соколов И. 1\ 133 Соприкосновение второго порядка Г>9 Сопряженная система векторов 33 Стационарная (условно) точка 7Г> — точка Л-порядка 121 Сташоннарные точки 56, 58 Стационарных точек классификация 90 Сумма векторов 13 Сфера 26 Сферические координаты 51 Сферическое многообразие 26 Тетраэдр 23 Тейлора формула 22 Тихонов А. И, 145 Точек мини макса геометрическая ха- характеристика 128 Точка двойная 92 Точка изолированная 01 — неподвижная 142 — предельная 29 — условно стационарная 75 — экстремальная 62 Точки граничные 39 — кратные 48 — критические 48, 49 — мини макса 128 - образ 140 — стационарные 56, 58 Треугольные преобразов. 20, 97, Ш> Угол между векторами 27 координатными линиями 55 Умножение вектора на вещественное. число 13 Уравнение вековое 99, 100 Уровня линии 91 Усеченная форма 110 Условие Липшица 43 Условный экстремум 72 Ферма принцип в оптике 70 Фишера-Куранта экстремальная тео- теория собственных значений 105 Форма билинейная 87 — квадратичная 8Я — усеченная 110 Функции диференциал 44 — область задания 43 — приращение 43 Функция вершин нормальная 142 — непрерывная в точке 43 Функция полигона 46 — точки 43 Целочисленные вектиры 13*1 — сети 134 Шаудер 145 Шварца неравенство 26 Широта сферическая 51 Эйлера-Лагранжа метод неопределен- неопределенных множителей 73 — принцип взаимности 81—fc5 Экстремальная теория собственных значений Фишера-Куранта 105 — точка 62 Экстремум 62 — безусловный 72, 120 — условный 72, 121 Экстремума достаточные условия Г20 — необходимые условия 66 Экстремумов классификация 62 Элемент дуги 50 Эллиптические координаты 52, 53 Якобн формула треугольного преоб- преобразовании 117— 119