Текст
                    ВАРИАЦИОННОЕ
ИСЧИСЛЕНИЕ-


Израиле Моисеевич Гелъфаяд и Сергеи Васильевич Фомин Вариационное исчисление Редактор С. М. Половинкин „ , т Л«,«„Л " Корректор И. В. Цветкова Техн. редактор Н. А. Ту Маркина ^ - ^ * ^ /VII1 1951 г. Бумага 60x90/16. литературы'
ОГЛАВЛЕНИЕ Стр. Предисловие 5 Глава I. Функционалы. Простейшая задача вариационного ис- . числения 7 § 1. Введение 7 § 2. Функциональные пространства 10 § 3. Дифференциал функционала. Необходимое условие экстре- экстремума 14 § 4. Простейшая задача вариационного исчисления. Уравнение Эйлера 20 § 5. Случай нескольких переменных. Задача со свободными кон- концами 28 § 6. Вариационная производная. Инвариантность уравнения Эйлера 33 Глава II. Некоторые обобщения простейшей задачи. Условный экстремум 39 § 7. Задача с закрепленными концами в случае п неизвестных функций 39 § 8. Вариационные задачи в параметрической форме 43 § 9. Функционалы, зависящие от производных высших порядков 46 § 10. Изопериметрическая задача. Условный экстремум 48 Глава III. Основная формула для вариации функционала. Задачи с подвижными концами 56 § 11. Основная формула для вариации функционала 56 § 12. Задача с подвижными концами 61 § 13. Случай не гладких экстремалей. Условия Вейерштрасса — Эрдмана 63 Глава IV. Канонический вид уравнений Эйлера. Вариационные принципы. Законы сохранения. Уравнение Гамиль- Гамильтона— Якоби 66 § 14. Канонический вид уравнений Эйлера. Первые интегралы ... 66 § 15. Преобразование Лежандра. Канонические преобразования . . 71 у ь § 16. Связь между инвариантностью интеграла I F dx и первыми а интегралам** уравнений Эйлера (теорема Нетер) 79 § 17. Принцип наименьшего действия . . , . 84 § 18. Законы сохранения , \ . . . 85 § 19. Уравнение Гамильтона — Якоби. Теорема Якоби 89
4 ОГЛАВЛЕНИЕ Глава V. Вторая вариация. Достаточные условия слабого экстре- экстремума . 95 § 20. Квадратичные функционалы. Вторая вариация функционала 95 § 21. Формула для второй вариации. Условие Лежандра 98 § 22. Исследование квадратичного функционала 103 § 23. Сопряженные точки. Необходимое условие Якоби ПО §24. Достаточные условия слабого экстремума 115 § 25. Условия Якоби для функционалов, зависящих от нескольких функций 117 § 26. Связь условий Якоби с теорией квадратичных форм в конеч- конечномерном пространстве 124 Глава VI. Теория поля. Достаточные условия сильного экстре- экстремума 129 § 27. Согласованные граничные условия: Общее определение поля 129 § 28. Поле' функционала 135 § 29. Инвариантный интеграл Гильберта 144 § 30. Функция Вейерштрасса. Достаточные условия сильного экстре- экстремума 146 Глава VII. Вариационные задачи с частными производными ... 151 § 31. Основная формула для вариации функционала в случае фиксированной области 151 § 32. Вариационный вывод уравнений колебаний струны, мем- мембраны и пластинки 154 § 33. Основная формула для вариации в случае переменной области. Теорема Нетер 167 § 34. Принцип стационарного действия для полей. Законы сохра- сохранения 182 § 35. Примеры: уравнение Клейна — Гордона и уравнение Максвелла 188 Глава VIII. Прямые методы вариационного исчисления. Вариа- Вариационные методы в задаче Штурма — Лиувилля ... 193 § 36. Понятие о прямых методах вариационного исчисления ., . . . 193 § 37. Метод Ритца и метод ломаных 196 § 38. Собственные функции и собственные значения краевой задачи Штурма — Лиувилля 199 Дополнение I. Распространение возбуждения и канонические уравнения 210 Дополнение II. Вариационные методы в задачах об оптималь- оптимальном регулировании 220
ПРЕДИСЛОВИЕ В основу данного курса положены лекции, читавшиеся И. М. Гель- фандом на механико-математическом факультете МГУ. Однако со- содержание книги значительно выходит за рамки материала, фактически излагавшегося на лекциях. Авторы ставили своей целью изложить основы вариационного исчисления в доступной и в то же время достаточно современной форме. Значительное внимание в книге уде- уделено физическим применениям вариационных методов — каноническим уравнениям, вариационным принципам механики, законам сохра- сохранения и т. д. — Читатель, желающий ознакомиться лишь с самыми основными понятиями и методами вариационного исчисления, может ограничиться изучением одной первой главы. Совокупность первых трех глав образует несколько более обширный, но все еще достаточно элементарный курс основ вариационного исчисления (в рамках одних лишь необ- необходимых условий экстремума). Наконец, гл. I — VI составляют более или менее обычный по объему университетский курс вариационного исчисления (с некоторыми применениями к механике систем с конеч- конечным числом степеней свободы),- включающий теорию поля (в не- несколько отличном от обычного изложении) и достаточные условия слабого и сильного экстремумов. Седьмая глава книги посвящена применению вариационных методов к изучению систем с бесконечным числом степеней свободы. В восьмой главе кратко изложены прямые методы вариационного исчисления. Авторы благодарны М. А. Евграфову и А. Г. Костюченко, ко- которые прочли книгу в рукописи и сделали ряд полезных замечаний. Я. М. Гельфанд Октябрь, 1960 ?. В. Фомин
ГЛАВА I ФУНКЦИОНАЛЫ. ПРОСТЕЙШАЯ ЗАДАЧА ВАРИАЦИОННОГО ИСЧИСЛЕНИЯ § 1. Введение Во многих задачах, возникающих в анализе, механике, геометрий и т. д., важную роль играют переменные величины, называемые функционалами. Мы говорим, что нам задан функционал, если каждой функции (или кривой) из некоторого класса поставлено в соответ- соответствие определенное число. Таким образом, можно* сказать, что функ- функционалы — это функции, в которых роль независимого переменного играют кривые или функции. Приведем примеры функционалов. 1. Рассмотрим на плоскости всевозможные спрямляемые *)' кри- кривые. Каждой такой кривой соответствует определенное число—^е длина. Таким образом, длина кривой представляет собой функционал, определенный на множестве спрямляемых кривых. 2. Поставив в соответствие каждой плоской спрямляемой кривой (которую мы будем рассматривать как однородную материальную линию) ординату ее центра тяжести, мы опять-таки получим некото- некоторый функционал. 3. Рассмотрим на плоскости всевозможные пути, соединяющие две данные точки А и В\ Пусть некоторое тело может двигаться по любому из этих путей, имея в каждой точке (х, у) определенную скорость v(x, у). Мы получим функционал, поставив в соответствие каждому пути то время, за которое рассматриваемое тело проходит этот путь. 4. Пусть у(х) — произвольная, Непрерывно дифференцируемая функция, определенная на отрезке [а, Ь]. Определим на множестве *) Длина кривой определяется в анализе как предел длин ломаных, вершины которых лежат на этой кривой, при стремлении к нулю длин звеньев этих ломаных. Если этот предел существует и конечен, то данная кривая называется спрямляемой.
8 ФУНКЦИОНАЛЫ. ПРОСТЕЙШАЯ ЗАДАЧА [ГЛ. I всех таких функций функционал J[y\ равенством 5. Рассмотрим более общий пример. Пусть F(x, у, z) — некото- некоторая непрерывная функция трех переменных. Выражение (x, y(x)t y'{x))dxt A) где у(х) пробегает совокупность всевозможных непрерывно диффе- дифференцируемых функций, определенных на отрезке [а, Ь], представляет собой функционал. Выбирая ту или иную функцию F, мы будем получать различные функционалы, например если F(x, у, z) = VT+J\ то J[y]—длина кривой у — у(х) (пример 1), а при F(x, у, z) = z2 получаем предыдущий пример. Функционалы вида A) мы и будем в основном рассматривать ниже. Отдельные задачи, связанные с понятием функционала, рассматри- рассматривались более трехсот лет назад. Первые важные результаты здесь были получены еще Л. Эйлером. Тем не менее до сих аор еще не существует достаточно общих методов «исчисления функцио- функционалов», аналогичных классическому анализу («исчислению функций»). Наиболее разработанными являются методы нахождения наибольших и наименьших значений функционалов. Этот наиболее разработанный раздел «исчисления функционалов» называется вариационным исчисле- исчислением. Правильнее, однако, было бы назвать его «вариационным исчислением в узком смысле», поскольку значение понятия вариации функционала, играющего основную роль в вариационном исчислении, далеко не исчерпывается применениями к задачам на нахождение экстремумов функционалов. Укажем некоторые типичные примеры вариационных задач, т. е. задач на нахождение наибольших и наименьших значений функционалов. 1. Среди всех плоских кривых, соединяющих две заданные точки А и В, найти ту, которая имеет наименьшую длину; иначе говоря, найти кривую у = у(х), для которой функционал достигает минимума. Искомой линией будет отрезок прямой, соеди* няющий точки А и В.
§ 1] ВВЕДЕНИЕ 9 2. Пусть А и В— две фиксированные „точки. Время, в течение которого материальная точка скатывается под действием силы тяжести вдоль некоторого пути, соединяющего точки А и В, зависит от выбора этого пути, т. е. представляет собой функционал. Кривая, вдоль которой точка скатывается быстрее всего, носит название брахисто- брахистохроны. Задача о брахистохроне была поставлена И. Бернулли в 1696 г. и сыграла важную роль в развитии вариационного исчисле- исчисления. Ее решение было дано И. Бернулли, Я. Бернулли, Ньютоном и Лопиталем. Брахистохрона представляет собой циклоиду, лежащую в вертикальной плоскости, проходящей через А и В. 3. Л. Эйлером было дано решение следующей вариационной задачи (изопериметрическая задача): среди всех замкнутых кривых, имеющих данную длину S, найти ту, которая ограничивает наиболь- наибольшую площадь. Такой кривой является окружность. Во всех указанных выше задачах речь шла о функционалах, пред- ставимых в виде ь Такие функционалы обладают так называемым свойством «локаль- «локальности», которое состоит в следующем. Если мы разобьем кривую у = у(х) на части и вычислим значение функционала для каждой из этих частей, то сумма этих значений будет равна значению функционала для всей кривой у = у(х). Именно такие функционалы обычно рассматриваются в вариационном исчислении. Примером нелокального функционала может служить выражение представляющее собой абсциссу центра тяжести материальной кривой у = у(х) (a<x<&). В развитии вариационного исчисления важную роль сыграли многие механические и физические задачи, например упомянутая выше задача о брахистохроне. В свою очередь методы вариационного исчисления широко используются в различных вопросах физики. Следует подчеркнуть, что применения вариационного исчисления в физике не исчерпываются решением отдельных, хотя бы и весьма важных задач. Так называемые «вариационные принципы», о которых речь будет идти в гл. IV и VII, представляют собой, по существу, выражения весьма общих физических закономерностей, имеющих
10 ФУНКЦИОНАЛЫ. ПРОСТЕЙШАЯ ЗАДАЧА [ГЛ. I место в самых различных областях физики, начиная от классической механики и кончая теорией элементарных частиц. Для понимания существа задач и методов вариационного исчисле- исчисления очень важно уяснить их связь с задачами классического анализа, т. е. с исследованием функций п переменных. Рассмотрим функцио- функционал вида ь (x,y. y')dx, Здесь каждой кривой у = у(х) ставится в соответствие некоторое число. Разобьем отрезок [а, Ь\ точками а = Xq, ATj, X24 ...» хп+\ =и на п-\-\ равных частей и рассмотрим вместо кривой у = у(х) ломаную с вершинами (дг0, А\ (xv у(*!>). ..... (xn+v В), а сам функционал J[y] приближенно заменим суммой '(У, Уп) = %г(*1> У/. У<7<4)*' h = xi-xi_v B) Каждая ломаная однрзначно определяется ординатами yv y2, ..., уп своих вершин, а сумма B) представляет собой функцию переменных У1» Уг» •••» Уп- Таким образом, вариационную задачу можно прибли- приближенно рассматривать как задачу о нахождении экстремума функции J(yv •••• Уя) от п переменных. Этот прием в вариационном исчи- исчислении- был широко использован Эйлером. Заменяя гладкие кривые ломаными, он еводил задачу о нахождении экстремума функционала к нахождению экстремума функции п переменных, а затем с помощью предельного перехода при п~>оо получал точные решения. Таким образом, функционалы можно рассматривать как «функции qt бесконечного числа независимых переменных», а именно значений функции у (л:) в отдельных точках, а вариационное исчисление — как Соответствующий аналог дифференциального исчисления. § 2. Функциональные пространства При изучении функций п переменных удобно пользоваться гео- геометрическим языком, рассматривая набор п чисел (у,, ..., уп) как точку «-мерного пространства. Точно так же геометрический язык полезен и при изучении функционалов. Каждую функцию у(х), при- принадлежащую какому-либо классу, мы будем рассматривать как точку
§ 2] ФУНКЦИОНАЛЬНЫЕ ПРОСТРАНСТВА П некоторого пространства. Пространства, элементами которых являются функции, мы будем называть функцибнальными пространствами. В *г6 время как для изучения функций от данного числа п неза- независимых переменных достаточно рассматривать одно пространство, а именно «-мерное евклидово пространство, не существует какого- либо «универсального» функционального пространства; сами эти про- пространства приходится выбирать в зависимости от характера рассматри- рассматриваемой вариационной задачи. Например, если речь идет о функционале ь вида Г F(x, ty, y')dx, то естественно рассматривать его на сово- а купности всех функций, имеющих непрерывную первую производную, ь а в случае функционала вида Г F(л;, у, у', y")dx следует за соот- а ветствующее функциональное пространство взять класс дважды непрерывно дифференцируемых функций. Поэтому для того чтобы задать функциональное пространство, надо прежде всего задать класс рассматриваемых функций. Для функционалов, так же как и для обычных функций, рассма- рассматриваемых в классическом анализе, важную роль играет понятие непрерывности. Для того чтобы сформулирЬвать это понятие для функционалов, необходимо ввести в функциональном пространстве, тем или иным путем, понятие близости элементов. Это удобнее всего сделать, введя для функций понятие нормы — аналог расстояния , между точками в евклидовом пространстве. Хотя в дальнейшем мы будем всегда рассматривать именно функ- функциональные пространства, нам удобнее будет сейчас ввести понятие нормы несколько более общим и абстрактным образом, а именно сформулировав определение линейного нормированного пространства. Линейным пространством называется совокупность R элементов х, у, г, . . . произвольной природы, для которых определены опера- операции сложения и умножения их на числа, причем выполнены следую- следующие аксиомы: 2. + y) + + (y + ) 3. Существует такой элемент 0 (нулевой элемент), что х*-\-0 = для любого х из R. 4. Для каждого x?R существует такой элемент —xt что 5. 1 •* = 6. 7. p p 8. а(х-f--у) = схл:-j-ay.
12 ФУНКЦИОНАЛЫ. ПРОСТЕЙШАЯ ЗАДАЧА [ГЛ. I Линейное пространство R называется нормированным, если каж- каждому элементу х ? R поставлено в соответствие неотрицательное число || л: || — норма этого элемента так, что 1. || х || = 0 только при х = 0. В линейном нормированном пространстве можно говорить о рас-4 стоянии между элементами, понимая под расстоянием между л: и у величину ||л: — у||. Элементами линейного нормированного простран- пространства могут быть объекты произвольной природы: системы чисел, векторы (т. е. направленные отрезки), матрицу, функции и т. д. Для нас важны следующие пространства. 1. Пространство С, состоящее из всех непрерывных функ- функций, определенных на некотором отрезке {а, Ь]. Сложение элементов и умножение их на числа вводятся как обычные сложение функций и умножение их на числа, а норма определяется как максимум модуля, т. е. ||у||= max |y(*)|. а <х<Ь Таким образом, в пространстве С рис j мы считаем функцию у(х) отстоя- отстоящей от функции уо(х) не больше чем на е, если ее график целиком лежит внутри полосы, шириной 2е (по вертикали), окружающей график функции уо(х) (рис. 1). 2. Пространство Dv состоящее из всех функций, определен- определенных на некотором отрезке [а, Ь] и непрерывных на этом отрезке вместе со своей первой производной. Операции сложения и умножения на числа вводятся так же, как и в С, а норма определяется формулой ! = тах|у(д:)| ~|- тах|у'(л;)|. Таким образом, близость функций в пространстве Dx означает, что близки как сами функции, так и их первые производные. Действи- Действительно, если то при а ^ \y(x) — z(x)\<e и | у'(*) — *'(*)!< е. 3. Пространство Dn, состоящее из всех функций на от- отрезке [а, Ь], имеющих непрерывные производные до п-го порядка включительно, где п — некоторое целое фиксированное число. Сумма элементов и произведение элемента на число определяются так же.
§ 2] ФУНКЦИОНАЛЬНЫЕ ПРОСТРАНСТВА 13 как и в предыдущих случаях, а норма определяется формулой где под производной нулевого порядка понимается сама функция. Близость функций в этом пространстве означает, следовательно, бли- близость значений как самих функций, так и их производных до я-го порядка включительно. Легко проверить, что в каждом из указанных выше трех пространств все аксиомы линейного нормированного про- пространства действительно выполнены. Аналогично можно ввести пространства функций нескольких пе- переменных, например пространства непрерывных функций п перемен- переменных, пространство непрерывных функций п переменных, имеющих непрерывные первые производные, и т. д. После того как в линейном (в частности, функциональном) про- пространстве R введена норма, для функционалов естественно вводится понятие непрерывности, а именно: Определение: Функционал ср(у) называется непрерывным в точке yo?R, если для любого s>0 существует такое 8 > 0, что |<Р()О —?(УоI<8 как тольк° IIУ — УоII <8- На первый взгляд может показаться, что при изучении функцио- функционалов и, в частности, при решении вариационных задач можно обой- обойтись пространством С — самым обширным из всех перечисленных. На самом деле это не так. Действительно, как уже указывалось выше, один из основных типов функционалов, рассматриваемых в ва- вариационном исчислении, — это функционалы вида ь F(x* У> y')dx. /¦ Легко видеть, что такой функционал будет непрерывен, если бли- близость функций понимать как близость в пространстве Dv но он не будет, вообще говоря, непрерывен, если пользоваться нормой, вве- введенной в пространстве С*). В то же время на пространстве Dx этот функционал (в частности, длина кривой) непрерывен. Для того чтобы иметь возможность пользоваться обычными аналитическими ме- методами, например предельным переходом, разумно выбирать каждый раз функциональное пространство так, чтобы интересующий нас функционал был непрерывен. *) Типичным примером является длина кривой. Для каждой кривой можно указать другую, сколь угодно близкую к ней (в смысле нормы про- пространства С) кривую, длина которой отличается от длины первой кривой, скажем, в 10 раз.
14 ФУНКЦИОНАЛЫ. ПРОСТЕЙШАЯ ЗАДАЧА, [ГЛ. I В заключение этого параграфа сделаем следующее замечание. Выше речь шла о линейных пространствах и функционалах на них. Однако во многих вариационных задачах приходится рассматривать функционалы на совокупности функций, не образующих линейного ,пространства, например на совокупности плоских кривых, проходя- проходящих через две фиксированные точки (см. § 4). Несмотря на это,' понятие линейного нормированного пространства и связанные с ним понятия расстояния между функциями, непрерывности функционала и т. д. играют важную роль в вариационном исчислении. С анало- аналогичным положением приходится встречаться и в анализе: рассматри- рассматривая функции п переменных, удобно пользоваться понятием я-мерного евклидова пространства, однако" область определения той или, иной функции может и не быть линейным многообразием. § 3. Дифференциал функционала. Необходимое условие экстремума 1. В этом параграфе мы введем понятие дифференциала функ- функционала, аналогичное понятию дифференциала функции п переменных и применим его к отысканию экстремумов функционалов. Мы нач- начнем с некоторых вспомогательных фактов и определений. Определение. Пусть R — линейное нормированное про- пространство и пусть каждому элементу h из R поставлено в соответ- соответствие число <р(/г), т. е. задан функционал. Этот функционал ср(/г) называется линейным, если он 1) непрерывен, 2) для любых hv h2, принадлежащих /?, удовлетворяет условию Укажем некоторые примеры линейных функционалов в про* странстве С. 1. Положим =/ h(x)dx. Это выражение будет, очевидно, линейным функционалом. 2. Более общим примером линейного функционала в С является =J a(x)h(x)dx, где а(х) — фиксированная функция.
§ 3] ДИФФЕРЕНЦИАЛ. НЕОБХОДИМОЕ УСЛОВИЕ ЭКСТРЕМУМА 15 3. Поставим в соответствие каждой функции h (х) ее значение в фиксированной точке xQt т. е. зададим функционал ср (/г) равенством где х0 — фиксированная точка. Это тоже будет линейный функционал* (Проверьте это!) х2 Как уже было сказано выше, выражение Г a(x)h(x)dx есть линейный функционал. Предположим, что этот функционал равен х* нулю, т. е. Г a(x)A(x)dx — 0 для всех функций И(х), принадле- xt жащих некоторому классу. Что можно сказать о функции а(х)? Ответ на этот.важный для дальнейшего вопрос дает,следующая Лемма 1. Если а(х) — непрерывная функциям ь J a(x)h(x)dx = 0 а для любой непрерывной функции h(x), имеющей непрерывную производную и удовлетворяющей условию h(a) = h (b) = 0, то 0 Доказательство. Пусть в некоторой точке с а (с) Ф 0, на- например а (с) > 0, тогда найдется интервал %г < с < ?2. содержащийся' в (хг> х2), в котором а(х), > 0. Положим h(x) = (Z1 — хJ{12 — л:J на интервале (^, ?2) и Л(л:)==О вне этого интервала. h(x), очевидно, удовлетворяет условиям леммы. В то же время J a(x)h(x)dx= f а(х)(Цг — хJ(^ — x?dx>0, Xt & так как под интегралом стоит положительная непрерывная функция, Полученное противоречие доказывает лемму. Рассмотрим теперь линейный функционал Хг J b(x)h'(x)dx, Xi определенный в пространстве Dv Покажем, что если ь fb{x)h'(x)dx=0
16 ФУНКЦИОНАЛЫ. ПРОСТЕЙШАЯ ЗАДАЧА [ГЛ. I для каждой функции h(x) из Dx такой, что h(a) = h(b) = O, то b (x) = const. Действительно, положим hr (x) = g (x)t тогда а Выберем постоянную с так, что а и покажем, что ъ a для любой непрерывной f(x). Всякую непрерывную функцию можно представить в виде / (х) = X (х) + а, где ь Г X (х) dx = О, а = const. а Получаем ь ь ъ Г (Ь(х) — c)f(x)dx= Г (р(х) — c)X(x)dx-\-a [ (b(x) — c)dx. j j j a a a Первое слагаемое справа равно нулю, так как Х(х) есть произ- X водная от функции jX(x)dfzt удовлетворяющей всем условиям, на- а ложенным на h (x), а второе равно нулю в силу выбора с. Таким образом, ь f (b(x)-c)f(x)dx = 0 а для любой непрерывной функции f(x). Положив получаем ь J а откуда Ъ (х) — с ==z 0, т. е. Ъ (х) есть постоянная.
§ 3] ДИФФЕРЕНЦИАЛ. НЕОБХОДИМОЕ УСЛОВИЕ ЭКСТРЕМУМА 17 Рассмотрим в Dx линейный функционал более общего вида: f [a(x)h(x) + b(x)h'(x)]dx. (Читателю предоставляется проверить, что этот функционал линей- линейный.) Такие функционалы нам понадобятся в дальнейшем. Докажем следующую лемму: Лемма 2. Если x = O A) для каждой функции h(x) из Dx такой, что h (a) = h (b) = О, то Ь(х) дифференцируема и а(х)— Ь'(х) = 0. Действительно, положив B) получаем с помощью интегрирования по частям, что ь ь j a(x)h(x)dx = — f A(x)h'(x)dxt a a т. е. равенство A) можно переписать в виде f l—A(x)-\-b(x)]h'(x)dx = O, но отсюда следует (см. выше), что Ь (х) — Л (х) = const, откуда в силу B) Ь'(х) = а(х). Лемма доказана. Подчеркнем, что здесь дифференцируемость функ" ции Ь (х) заранее не предполагалась. 2. Перейдем теперь к определению понятия дифференциала функ- функционала. Рассмотрим некоторый функционал J[y] и его приращение ]— J[y], отвечающее приращению h «независимой переменной» у. Если у фиксировано, то А/ представляет собой функционал (вообще говоря, нелинейный) от /г.
18 . ФУНКЦИОНАЛЫ. ПРОСТЕЙШАЯ ЗАДАЧА у \ГЛ. V Мы назовем дифференциалом, или вариацией, bj функционала J главную линейную часть приращения Д/ функционала J, т. е, линей- линейный функционал ср(/г), отличающийся от Д/ на бесконечно малую величину порядка выше первого по отношению к ||А||. Таким обра- образом, где а->0, когда ||А||->0. Легко видеть, что дифференциал функционала (если он вообще существует) определяется однозначно. Сделаем предварительно сле- следующее замечание: если ср (А) — линейный функционал и 2JLJ _> о SII "¦ II при. ||А||->0, то ср(/г) = О. Действительно, пусть ср(hQ) = X =? 0. По- Положим Ая = -^. Имеем j|Aj|-> 0, но* Допустим теперь, что дифференциал функционала определяется не единственным образом, т. е. пусть 11*11 где cpj(A) и ср2(Л) — линейные функционалы, a alf a2—>0 при ||А||->0. Тогда C) Следовательно, cpj(A) — <р2(А) есть бесконечно малая порядка выше первого относительно А. Но так как <pi(A) — Фг(^) — линейный функ- функционал, то он в силу сделанного выше замечания рав?н нулю. Воспользуемся понятием дифференциала (вариации) функционала для того, чтобы установить необходимые условия экстремума функ- функционала. Напомним сначала соответствующие понятия из анализа. Пусть F(xv .... хп) — дифференцируемая функция п переменных. Говорят, что F(xv .... хп) имеет в точке х\, .... х°п экстремум, если bF = F(xx x,) — F(x°i х°п) имеет один и тот же знак для всех точек (хг, .... хп), принадле- принадлежащих некоторой окрестности точки (#?, .... х°п), именно F имеет в данной точке минимум, если AF^O в данной окрестности, и ма- максимум в случае Д/7 ^ 0.
§ 3] ДИФФЕРЕНЦИАЛ. НЕОБХОДИМЫЕ УСЛОВИЯ ЭКСТРЕМУМА 19 Аналогично мы скажем, что функционал /(у) достигает экстре- экстремума при у = у0, если J [у] — 7[уо1 сохраняет знак в некоторой окрестности кривой уо(х). Мы будем рассматривать функционалы, определенные на некото- некотором множестве дифференцируемых.функций. Сами эти функции мы мржем считать элементами пространства С или пространства Dv В соответствии с этими двумя возможностями мы будем говорить, что функционал J [у] достигает при y = yQ слабого экстремума, если существует такое е > 0, что J[y]—i[y0] сохраняет постоянный знак для всех тех у из Dv для которых функционал J [у] определен и IIУ — yolli<e CДесь II Hi означает норму в пространстве Dx)t и будем называть значение )[у$\ сильным экстремумом, если оно является экстремальным по отношению ко всем тем у(х), которые при- принадлежат области определения функционала J[y] и удовлетворяют усло- условию \\у — уо\\ < е (т. е. близки к у0 в смысле нормы пространства С). Ясно, что всякий сильный экстремум будет в то же время и слд- бым экстремумом. Действительно, если ||у — y<jlli < е» то "подавно \\у — уо|| < е, поэтому если J[yQ] есть экстремум по отношению ко всем у таким, что Цу-—Уо11< ?. то J[y] тем более будет экстремумом по отно- отношению к тем у, для которых ||у — yolli<e. Обратное, вообще говоря, неверно, т. е. слабый экстремум может сильным экстрему- экстремумом и не быть. Нахождение слабого экстремума является, как пра- правило, задачей более простри, чем нахождение сильного экстремума. Причина этого состоит в том* что, как было отмечено в конце пре- предыдущего параграфа, функционалы, рассматриваемые обычно в ва- вариационном исчислении, непрерывны в пространстве Dv Поэтому в теориет слабого экстремума можно пользоваться непрерывностью функционалов. В то же время эти функционалы, вообще говоря,, не непрерывны по отношению к норме пространства С. к Теорема. Для того чтобы функционал J [у] при y = yQ достигал экстремума, необходимо, чтобы его дифференциал ^если он существует) обращался в нуль при у = у0, т. е. при у = у0. Доказательство. Рассмотрим для определенности случай минимума. Если J[y] при y = yQ достигает минимума, то это зна- значит, что для всех /г, для которых Цй]^ достаточно мала. Но, по определе- определению вариации, ^
20 ФУНКЦИОНАЛЫ. ПРОСТЕЙШАЯ ЗАДАЧА [ГЛ. Г и ос->0 при ||А||->0. Если bJ[h] Ф 0, то при достаточно малых h знак выражения 87 [А] + а || А || D) определяется знаком первого (главного) члена. Но bJ—линейный функционал, поэтому 87[—А] = —87[А], и, следовательно, при 87 Ф 0 выражение D) может быть как поло- положительным, так и отрицательным при сколь угодно малых /г, т. е. экстремум в этом случае невозможен. Замечание. В анализе, помимо условия df = 0, рассматри- рассматривается и другое необходимое условие экстремума, состоящее в том, что второй дифференциал функции должен быть неотрицателен. Рас- Рассмотрение аналогичного вопроса для функционалов мы отложим до гл. V. § 4. Простейшая задача вариационного исчисления. Уравнение Эйлера 1. Изучение конкретных задач вариационного исчисления мы начнем с так называемой простейшей задачи, которая формулируется следующим образом. Пусть F(x, у, z)— функция, имеющая непре- непрерывные частные производные по всем переменным до второго по- порядка включительно. Среди всех функций у (л:), имеющих непрерыв- непрерывную производную и удовлетворяющих условиям у(а) = Д у(Ь) = В, A) найти ту функцию, которая доставляет слабый экстремум функцио- функционалу ь Ч*. У, У')йх. B) а Иначе говоря, простейшая задача вариационного исчисления состоит в отыскании слабого экстремума функционала вида B) на множестве всех гладких кривых, соединяющих две заданные точки. Упомянутые во введении примеры 1 и 2t вариационных задач (о нахождении кратчайшей линии и о брахистохроне) принадлежат как раз к этому типу. Чтобы применить к решению сформулированной простейшей за- задачи необходимое условие экстремума, найденное в предыдущем параграфе, нужно уметь вычислять вариацию для функционалов вида B). Выведем соответствующую формулу.
§ 4] ПРОСТЕЙШАЯ ЗАДАЧА. УРАВНЕНИЕ ЭЙЛЕРА 21 Дадим функции у(х) некоторое приращение h (х). Для того чтобы функция по-прежнему удовлетворяла граничным условиям, нужно, чтобы h{a) = h (b) = 0. Вычислим приращение функционала B). Оно равно ь ь ДУ = f F(x, y-{-h, у1 -\-h')dx— f F (x, yt yr)dx = a a b = /[^(*. У. y')h+F'r{x, у, y')h']dx+ .... a где многоточие обозначает члены порядка выше первого относи- относительно h и hf. Выражение ъ f [F'y (х, у, у') h + /у (х, у, Я h>] dx а представляет собой главную линейную часть приращения ДУ функ- функционала У, т. е. дифференциал. Согласно теореме § 3 необходимым условием экстремума является равенство ь 8У = J (Fyh + Frh') dx = 0. C) а Но в силу леммы 2 § 3 из равенства C) вытекает, что*) dx * Выражение D) называется уравнением Эйлера. Таким-образом, установлена следующая Теорема 1. Для того чтобы функционал ь Л3>] = ]>(*. У, y')dx, а определенный на множестве функций у = у(х), имеющих *) Подчеркнем, что существование производной-^—Fy, здесь заранее не предполагается, а вытекает из той же самой леммы 2 § 3.
22 ФУНКЦИОНАЛЫ. АРбСТЕЙШАЯ ЗАДАЧА [гЛ. 1 непрерывную первую производную и удовлетворяющих условиям у(а) = А, уф) — В% достигал на данной функции у(х) экстре- экстремума*), необходимо, чтобы эта функция удовлетворяла урав- уравнению Эйлера Интегральные кривые уравнения Эйлера называются экстре- экстремалями. Уравнение Эйлера представляет собой дифференциальное урав- уравнение второго порядка. Его решение должно зависеть, вообще го- говоря, от двух произвольных постоянных, которые определяются из двух краевых условий у (а) = Л и у(Ь) = В. Отметим, что при решении уравнения Эйлера мы, в отличие от обычной для дифференциальных уравнений постановки вопроса, где ищется решение, определенное в окрестности некоторой точки и удовлетворяющее заданным начальным условиям (задачи Коши), ищем решение, определенное во всей фиксированной области и удов- удовлетворяющее заданным граничным условиям. Поэтому вопрос о раз- разрешимости той или иной вариационной задачи не сводится непосред- непосредственно к обычным теоремам существования для дифференциальных уравнений. Приведем следующую теорему С. Н. Бернштейна **) о существовании и единственности решения в целом для уравнения вида /W (*,?,/). (*) Если функции F, Fy, /у непрерывны в t каждой конечной точке (х, у) для любого конечного у' и если существует такая постоянная h > 0 и такие, ограниченные в каждой конечной -части плоскости функции что Ру <*. У> У) >*> \Р <*. У> У) I то через любые две точки (а, ах) и (b, b{) плоскости (jc, у), абсциссы кото- которых различны {а Ф Ь), проходит одна и только одна интегральная кривая уравнения (*). Мы не будем приводить здесь доказательства этой теоремы. Уравнение D) дает необходимое, но, вообще говоря, недостаточное условие экстремума. Вопрос о достаточных условиях экстремума будет рассмотрен в гл.- V. В ряде случаев, однако, уже одно уравнение *) Это условие необходимо для слабого экстремума. Так как всякий сильный экстремум является в ток же время и слабым, то любое условие, необходимое для слабого экстремума, необходимо и для сильного. **) Работа С. Н. Бернштейна относится к 1912 г. Ее русский перевод «Об уравнениях вариационного исчисления» напечатан в V1I1 выпуске «Ус- «Успехов математических наук» A941 г.).
§ 4] ПРОСТЕЙШАЯ ЗАДАЧА. УРАВНЕНИЕ ЭЙЛЕРА 23 Эйлера дает исчерпывающее решение задачи. Действительно, часто само существование экстремума бывает ясно из физического или геометрического смысла задачи (например, задачи о брахистохроне, о кратчайшем -расстоянии между двумя точками и т. п.). Если при этом существует лишь единственная экстремаль, удовлетворяющая граничным условиям задачи, то именно она и будет непременно той кривой, которая реализует искомый экстремум. ь Уравнение Эйлера для функционала Г F(x, у, y')dx представляет а собой уравнение второго порядка. Может оказаться, однако, что та кривая, на которой этот функционал достигает экстремума, "не является дважды дифференцируемой. Рассмотрим, например, функ- функционал 1 JW = fy4l-y'Jdx, у (—0 = 0, уA)=1. -1 Его минимальное значение, равное нулю, достигается на функции 0 при jc<0, x при х>0; не имеющей второй производной. Хотя функция g (x) и не имеет вто- второй производной, она удовлетворяет соответствующему уравнению Эйлера. Действительно, при F(x, у, у') = у2A—у'J и y = g имеем и, следовательно, -~т Fg* = 0; и хотя уравнение Эйлера имеет по- порядок два, a g"(x) не существует, подстановка g(x) в уравнение Эйлера обращает его в тождество. Выясним теперь условия, при, которых можно гарантировать су- существование второй производной у функции у = у (х),' представляю- представляющей собой решение уравнения Эйлера. Теорема 2. Пусть у = у(х)—решение уравнения Эйлера Fy — ~4х^У'=0. Если функция F(x,ytyr) имеет непрерывные частные производные до второго порядка включительно, то во всех точках (х, у), в которых функция у = у(х) имеет непрерывную вторую производную. Доказательство. Рассмотрим разность AF >.= Fr (х + Д*. У + Ау. У 4- by'
24 ФУНКЦИОНАЛЫ. ПРОСТЕЙШАЯ ЗАДАЧА [ГЛ. I где знак—-указывает, что производные берутся в некоторой проме- промежуточной точке. Разделив эту разность на Аде, рассмотрим предел полученного г. , Ay ~ Ду' ~ выражения /у\* + х^ ^у'у\"~т~ *у'у' ПРИ &х->0 (этот предел су- существует, так как Fy> имеет производную по х, в силу уравнения Эйлера она равна Fy). Так как вторые производные функции F(xt у, z) по условию непрерывны, то Fy>x при Адс->0 стремится к Fy>Xt т. е. к значению d2F производной д ,д в точке х. Д v "^ Второе слагаемое, т. е. -^-Fy'y, при Аде—>0 также имеет пре- предел. Это вытекает из существования у' и непрерывности второй производной Fy'y. Но тогда существует предел и третьего слагаемого (так как предел всей суммы существует), т. е. существует }хШ0Тх ^у'у'9 Если Аде -> 0, то Fy'y' стремится к пределу Fyy* Ф 0, и значит, суще- существует Из уравнения dx y,—Fy = 0 у у можно найти выражение для у", из которого видно, что у" непре- непрерывна всюду, где /уУ' =? 0. Теорема доказана. Из этой теоремы вытекает, что экстремаль у = у (дс) может иметь излом только в тех точках, где Frr = 0. 2. Уравнение Эйлера, выведенное нами в этом параграфе, играет фундаментальную роль во всем вариационном исчислении. Оно пред- представляет собой, вообще говоря, дифференциальное уравнение второго порядка. Укажем некоторые частные случаи, в которых это урав- уравнение может быть сведено к уравнению первого порядка или даже полностью проинтегрировано в квадратурах. 1. Подынтегральная функция не зависит от у. Лредположим, что рассматриваемый функционал имеет вид
§ 4] ПРОСТЕЙШАЯ ЗАДАЧА. УРАВНЕНИЕ ЭЙЛЕРА 25 т. е. F не содержит у явно. В этом случае уравнение Эйлера при- принимает вид и имеет, очевидно, первый интеграл Fy.=C. Это — уравнение первого порядка, не содержащее у. Решив его от- относительно у', получаем соотношение вида / = /(*. С), откуда у находится квадратурой. 2. Подынтегральная функция не зависит от х, т. е. В этом случае Умножив это выражение на у', получим выражение, которое можно записать в виде откуда получаем, что в рассматриваемом случае уравнение Эйлера имеет первый интеграл F — y'Fy, = С. 3. Если F не зависит от у', то уравнение Эйлера прини- принимает вид т. е. представляет собой не дифференциальное/а конечное уравнение, определяющее одну или несколько кривых. 4. В различных задачах часто встречаются функционалы вида представляющие собой интеграл от некоторой функции v(x, у), взятый по длине дуги. В этом случае уравнение Эйлера может быть
26 ФУНКЦИОНАЛЫ. ПРОСТЕЙШАЯ ЗАДАЧА [ГЛ. I преобразовано следующим образом: dF d т. е. 2 Примеры. 1. J[y] = fVl+fdx. y(l) = 0, yB)=l. 1 Подынтегральная функция не содержит д;, поэтому уравнение Эйлера имеет вид ty> =C, т. е. — откуда ) > т.е. /- и следовательно, Таким образом, решение представляет собой окружность с цен- центром на оси у. Из условий уA) = 0, ^уB) = 1 получаем, что С = —^=, Сх = 2. Итак, окончательное решение (у —2)* + *2=f 2. Среди линий, соединяющих две данные точки (aTj, yj) и (х2, у2). найти ту, которая при вращении образует поверхность наименьшей площади*. Как известно, площадь поверхности вращения равна ¦*• Fl-f y'2dx. Так как здесь подынтегральная функция не зависит явно от х, то можно сразу написать первый интеграл уравнения Эйлера, это будет: F C
§ 4] ПРОСТЕЙШАЯ ЗАДАЧА. УРАВНЕНИЕ ЭЙЛЕРА 27 или откуда С2 Ф Разделяя переменные, получаем Ш== [ах, т. е. откуда Таким образом, искомой кривой является цепная линия, проходящая через заданные точки. Поверхность, образованная вращением цепной линии, называется катеноидом. Значения произвольных постоян- постоянных Си Сх определяются из условий Можно показать, что в зависимости от положения точек (хг, уг) и (jc2, у2) здесь возможны следующие случаи: 1) Через точки (xv уг) и (х2У у2) можно провести единственную кривую вида тогда эта кривая и является решением задачи. 2) Через точки (xv y{) и (д:2, у<^ проходят две экстремали. В этом случае одна из них действительно реализует минимум поверхности вращения, а другая нет. 3) Не существует ни одной кривой вида проходящей через заданны'е точки (xlt yx) и (х2, у2). Это означает, что в классе гладких поверхностей вращения, проходящих через данные точки, нет поверхности, реализующей минимум площади. Этот случай можно представить себе следующим образом. Если две заданные точки расположены так, что расстояние между ними доста-
28 ФУНКЦИОНАЛЫ. 'ПРОСТЕЙШАЯ ЗАДАЧА [ГЛ. I точно велико по сравнению с расстояниями их от оси х, то пло- площадь поверхности, состоящей из двух кругов радиусов ух и у2 и соединяющего их центры отрезка оси х (рис. 2), будет меньше, чем площадь любой гладкой поверхности вращения, проходящей через заданные точки. Таким образом, в этом случае решением задачи о минимуме площади является ломаная Ахгх2В, а в классе поверх- поверхностей, образованных вра- I/ I aj Рис. 2. щением гладких кривых, проходящих через заданные точки поверхности, имею- имеющей наименьшую площадь, не существует. 3. Рассмотрим функцио- функционал ь E) Здесь уравнение Эйлера сводится к конечному уравнению; его реше- решение— прямая у = х (вдоль нее интеграл E) равен нулю). § б. Случай нескольких переменных. Задача со свободными концами 1. Выше мы рассматривали функционалы, зависящие от функций одного переменного, т. е. от линий. Во многих вопросах встречаются функционалы, зависящие от функций нескольких независимых пере- переменных, т. е. от поверхностей. Подробнее такие многомерные вариа- вариационные задачи мы рассмотрим в гл. VII, а сейчас покажем лишь, как на случай функционалов, зависящих от поверхностей, переносятся постановка и решение рассмотренной выше простейшей задачи вариа- вариационного исчисления. Ограничимся для простоты записи случаем двух независимых пере- переменных. В случае п переменных все рассуждения остаются без изме- изменений. Рассмотрим функционал вида = / / F (Xi У> Zt Zjc' A) где zx и zy — частные производные от z = z(x, у), и предположим, что ищется функция z(x/y)t непрерывная вместе, со своими произ- производными до второго порядка в области О, принимающая на границе этой области заданные значения и дающая экстремум функционалу A). Доказательство теоремы 1 § 3 не связано с видом рассматривае- рассматриваемого функционала, поэтому, как и в случае одного независимого переменного, необходимым условием экстремума функционала A)
§ 5] СЛУЧАЙ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ. СВОБОДНЫЕ КОНЦЫ 29 является обращение в нуль его вариации, т. е. главной линейной части его приращения. Для установления необходимых условий экстремума функцио- функционала A) нам понадобится следующая лемма, аналогичная лемме 1 § 3. Лемма Г. Если интеграл f f f(s, t t)dsdtt B) где f(s, t) — фиксированная функция, непрерывная в области G, обращается в нуль для всякой функции y\(st t), непрерывной вместе со своими частными производными первого порядка и обращающейся в нуль на границе L области G, то f(s, t) — 0 во всей области G. Действительно, предположим, что в некоторой точке (?, т]) функ- функция f(s, t) отлична от нуля, например положительна, тогда она положительна и в некотором содержащемся в G круге радиуса р с центром (?, т]). Тогда если положить 0 вне круга (s — ?J + (t — т]J = р2, [(<?_?J_|_^_7]J_p2j2 внутри этого круга, то интеграл B) сведется к интегралу по, рассматриваемому кругу и будет положителен. Лемма доказана. Для того чтобы применить необходимое условие экстремума bJ—O к изучению функционала A), вычислим вариацию этого функционала. Если h(x, у) — произвольная дважды непрерывно дифференци- дифференцируемая функция, обращающаяся в нуль на границе области О, то вместе с z(x, у) области определения функционала A) принадлежит и z(x, y)-+-h(x, у). Приращение функционала A) равно ] — J[z] = ~ F (*' У* Z> Zx> гУ^ dX аУ= где выписанный интеграл представляет собой главную линейную часть этого приращения, т. е. вариацию. Применяя формулу Грина
30 ФУНКЦИОНАЛЫ. ПРОСТЕЙШАЯ ЗАДАЧА (ГЛ. I получаем Так Ткак h(x, у) обращается в нуль на L, то справа первый инте- интеграл исчезает, и мы получаем для вариации функционала J[z] сле- следующее выражение: *—hF;—h Ff)h {х'у) dx dy- C) Итак, для того чтобы поверхность z = z(xb у) доставляла экстремум, необходимо, чтобы двойной интеграл C) обращался в нуль для любой h(x, у), удовлетворяющей указанным выше условиям; в сиЛу леммы Г отсюда вытекает соответствующее уравнение Эйлера р Lp L.F —О г* дх *х дуг*у~ щ Оно представляет собой уравнение второго порядка в частных про- производных, причем ищется решение его, принимающее на контуре L заданные значения. Пример, Найти поверхность наименьшей площади, натянутую на данный контур. Это сводится к отысканию минимума функционала J= Уравнение Эйлера для данного случая приводится к виду D) где p = zx, q = zr r = zxx, s = zxy> t = zyr Оно имеет простой геометрический смысл. Для выяснения этого смысла воспользуемся формулой средней кривизны поверхности 1
§ 5] СЛУЧАЙ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ. СВОБОДНЫЕ КОНЦЫ , 31 где Е, F, О и D, Dx, D2 — коэффициенты первой и второй квадра- квадратичных форм поверхности. Если поверхность задана явным уравне- уравнением z = z(x, у), то = pqt O= и, следовательно, Здесь числитель совпадает с левой частью уравнения Эйлера D). Таким образом, уравнение D) означает, что средняя кривизна иско- искомой поверхности равна нулю. Поверхности, имеющие нулевую сред- среднюю кривизну, называются минимальными. 2. Задача со свободными концами. Простейшая задача вариационного исчисления, которую ^ы рассматривали до^сих пор,* является далеко не единственно возможной. Другие типы вариацион- вариационных задач, с другими граничными условиями, будут рассмотрены в гл. II и III. Однако с* одной из таких задач — так называемой задачей со свободными концами, целесообразно познакомиться уже сейчас. Она формулируется следующим образом. Среди всех кривых, концы которых лежат на двух заданных вертикалях х = а, х = Ь, найти ту, которая дает экстремум функционалу . У. ?)dx. E) Вычислим вариацию функционала E). Понимая под вариацией, как й выше, главную линейную часть приращения /[у + Д]—J[y\ функ- функционала, получаем ь h] — J[y]= f[F(x9 y + A. y' + h') — F(x, у, y')\dx. а Разлагая подынтегральное выражение по степеням h и h\ имеем ь — Л У] = flFyA + Fy'A'lrf^H-члены выше первого а порядка малости. Таким образом,
32 ФУНКЦИОНАЛЫ. ПРОСТЕЙШАЯ ЗАДАЧА [ГЛ. 1 Так как здесь, в отличие от задачи с закрепленными концами, h(x) уже не обязательно обращается в нуль в точках а и Ь, то, инте- интегрируя по частям, получаем ь bJ = а —шру'У <*> ** U где byl^=h(b)t byo = h(a). Таким образом, для задачи со свобод* ными концами мы получили следующее выражение вариации: ъ< Рассмотрим сначала такие функции h(x)y для которых h(a) = = /г(й) = О. Тогда, как и в простейшей задаче, из условия $7=0 получаем, что Итак, для того чтобы кривая У — у(х) могла быть решением задачи со свободными концами, она должна быть экстремалью, т. е. реше- решением уравнения Эйлера G). Пусть теперь у = у(д;) — экстремаль. Тогда в выражении F) для 87 интегральный член исчезает и усло- условие Ы=0 принимает вид т. е., в силу произвольности h(x)t *VU=o. ^-и = о. (8) Таким образом, для решения поставленной задачи нужно найти общий интеграл уравнения Эйлера G) и затем определить значения произ- произвольных постоянных из условий (8). Наряду с закрепленными и свободными концами можно рас- рассматривать смешанный случай, т. е. считать, что один конец закреп- закреплен, а другой свободен. Пусть, например, ищется экстремум функционала E) на классе кривых, соединяющих данную точку А (с абсциссой а) и произвольную точку прямой х = Ь. В этом случае из двух условий (8) остается * только одно условие а равенство у(а) = А служит вторым краевым условием.
§ 6] ВАРИАЦИОННАЯ ПРОИЗВОДНАЯ. ИНВАРИАНТНОСТЬ УРАВНЕНИЯ ЭЙЛЕРА 33 Пример. По какой плоской кривой тяжелая точка должна ска- скатываться вниз из положения А (а, у0) для того, чтобы в кратчайшее время достигнуть вертикальной прямой х = Ь? Решение. Для упрощения записи будем считать, что исходная точка совпадает с началом координат. Так как скорость движения по кривой равна ds -\/"\ ; J2 dx то at V\+y'2dx Vl+y'2dx at = —¦ = откуда время движения Т равно '-/ v*+¦' dx. ¦У2 V2gy Общим решением соответствующего уравнения Эйлера будет семей- семейство циклоид х = г(Ь — sin 0)-|-с, у = гA—cos 0). Из условия прохождения искомой кривой через начало координат получаем, что с = 0. Для определения г воспользуемся вторым условием , F у 0 YSiyVi+y т. е. при х — Ь должно быть у' = 0: в правом конце искомой кри- кривой касательная горизонтальна. Отсюда г = — . Итак, соответствующая кривая задается уравнениями х = ~(д — sin 0), у=1(\— cos0). § 6. Вариационная производная. Инвариантность уравнения Эйлера 1. Для функций п переменных наряду с понятием дифференциала вводится понятие частной производной. Выше мы ввели понятие диф- дифференциала для функционалов. Выражение, играющее для функцио- функционалов ту же роль, что и частные производные для функций п пере- переменных, носит название вариационной производной. Мы введем сперва понятие вариационной производной для функционалов вида ъ = ]>(*, у, y')dx, A) отвечающих простейшей задаче. Для этой цели мы перейдем от вариационной задачи к конечномерной, а затем совершим предельный переход. 3 Зак. 2486. Гельфанд и Фомин
34 ФУНКЦИОНАЛЫ. ПРОСТЕЙШАЯ ЗАДАЧА [ГЛ. I Разобьем отрезок [a, b] на п-\-\ равных частей'точками хо — а, хх хп, xn+l=b, Хц_г — xt = kx и заменим гладкую функцию у (х) ломаной с вершинами (*о. Уо). (*i- Уг) (*я+1 Функционал ь J[y] = fF(x, у, y')dx а при этом можно приближенно заменить суммой представляющей собой функцию п переменных yv y2, ..., уп. Обозначим это выражение J[ylt y2, •••, Уп\- Вычислим частные производные — л*'" и ПОСМОТРИМ» чт0 происходит с этими производными при неограниченном увеличении числа точек деления. Заметив, что в выражении каждое переменное yk входит ровно в два слагаемых (отвечающих 1 = к и 1 = к—1), получаем Правая часть написанного здесь выражения при Ах->0, т. е. при неограниченном увеличении числа точек деления, стремится, очевидно, к нулю, представляя собой величину порядка Ад:. Для того чтобы получить при Ал;->0 предел, вообще говоря, отличный от нуля, разделим равенство B) на Ал:. Получаем -,. ,М. ^-^)]. C)
§ 61 ВАРИАЦИОННАЯ ПРОИЗВОДНАЯ. ИНВАРИАНТНОСТЬ УРАВНЕНИЯ ЭЙЛЕРА 35 Заметим, что выражение dyk Ал;, стоящее в знаменателе слева, имеет непосредственный геометрический смысл. Это — разность между площадями, ограниченными сплошной и пунктирной ломаными (рис. 3). При Ад:->0 выражение C) стремится к пределу, равному F(x У У^ Р(Х У У0 Этот предел и называется вариационной производной функционала A). Вариационная производная обозначается символом bJ Таким образом, формула, которая получается из C) в результате предельного перехода при Ах—>0, имеет вид Мы видим, что полученное нами выражение вариационной производ- производной представляет собой левую часть уравнения Эйлера. Следова- Следовательно, уравнение Эйлера означает не что иное, как равенство нулю Рис. 3. в каждой точке вариационной производной соответствующего функ- функционала, точно так же, как в анализе необходимым условием экстре- экстремума функции п переменных является равенство нулю всех ее част- частных производных. Сформулируем теперь определение вариационной производной в общем случае. Пусть имеется некоторый функционал J[y]. Дадим функции у приращение, отличное от нуля лишь в окрестности некоторой точки х, и вычислим соответствующее приращение функ- функционала Разделив это приращение на площадь As, ограниченную кривой h и осью х, рассмотрим отношение E) US
36 ФУНКЦИОНАЛЫ. ПРОСТЕЙ1ГАЯ ЗАДАЧА [ГЛ. I Пусть теперь площадь As, ограниченная кривой h (х), стремится к нулю, причем так, что и \h(x)\ и длина того интервала, в кото- котором h (x) отлична от нуля, стремятся к нулю. Если при этом отно- отношение E) стремится к некоторому пределу, то этот предел называется вариационной производной функционала J [у] в точке х0. Вариа- bJ ционную производную в точке х0 мы обозначим — Задача. Вычислить вариационную производную в точке х0 квадра- квадратичного функционала ь ь fK(s,t)y(s)y(t)dsdt Для вариационных производных остаются в силе те основные правила, которые хорошо известны для обычных производных, на- например правила дифференцирования суммы, произведения, сложной функции и т. д. Во многих случаях оказывается полезным понятие вариации в точке, представляющее собой аналог выражения l ¦ -?- dxt Вариацией функционала J[y] в точке х для кривой у=у(х) назы- называется произведение функциональной производной от У в точке х на площадь As области, заключенной между кривыми у(х) и ) + () Замечание. Из определения вариационной производной ясно, что если h (x) отлична от нуля в некоторой окрестности точки х0 и ограничивает площадь As, то где s—>0, когда стремятся к нулю и \h(x)\ и длина интервала, в котором h (x) отлична от нуля. 2. Инвариантность уравнения Эйлера. Пусть на плоскости вместо переменных (х, у) введены криволинейные коор- координаты (и} v) по формулам х = х(и, v), у = у(и} v), Уи Ф 0. F) Кривой, задаваемой на плоскости ху уравнением у = у (х), отвечает на плоскости uv кривая, определяемая некоторым уравнением V — V {и).
§ б] ВАРИАЦИОННАЯ ПРОИЗВОДНАЯ. ИНВАРИАНТНОСТЬ УРАВНЕНИЯ ЭЙЛЕРА 37 При замене переменных F) функционал Jly] = fF(x, У, y')dx переходит в функционал (« «) у(« <0 " ? Ьх / Покажем, что если некоторая функция у = у(х) удовлетворяет урав- уравнению Эйлера, то функция v = v(u) удовлетворяет соответствующему уравнению Эйлера dF{ d dFx _0 ? dv da dv1 ~ ' K } где ((«. v). y(u, v)t Для этого воспользуемся введенным выше понятием вариационной производной. Площадь, ограниченную кривыми у = у (х) и у = у (х) -\- -\-h(x) на плоскости (х, у), обозначим As, а площадь, ограничен- ограниченную соответствующими кривыми v — v(u) и v = v(u)-\-y\(u)t обо- обозначим До. Отношение этих площадей стремится к функциональному детерминанту Уи У не равному, по условию, нулю. Если то и Итак, если функция у — у(х) удовлетворяет уравнению Эйлера, то функция v(u) удовлетворяет уравнению G). Иначе говоря, свой- свойство кривой быть (или не быть) экстремалью не зависит от выбора системы координат. Свойство инвариантности уравнения Эйле'ра может быть исполь-, зовано следующим образом. При решении уравденця Эйлера часто
38 ФУНКЦИОНАЛЫ. ПРОСТЕЙШАЯ ЗАДАЧА [ГЛ. I приходится пользоваться той или иной заменой переменных. В силу свойства инвариантности эту замену можно делать не в уравнении, а прямо в интеграле, представляющем рассматриваемый функционал, а затем уже для нового интеграла писать уравнение Эйлера. Пусть, например, ищутся экстремали функционала (8) где г = г (ср). Соответствующее уравнение Эйлера имеет вид 0 Замена х = г cos ср, у = г sin cp переводит (8) в интеграл вида а которому отвечает уравнение Эйлера /' = 0 с общим решением Следовательно, общее решение уравнения (9) есть г sin cp = ar cos c
ГЛАВА II НЕКОТОРЫЕ ОБОБЩЕНИЯ ПРОСТЕЙШЕЙ ЗАДАЧИ. УСЛОВНЫЙ ЭКСТРЕМУМ В этой и следующей главах мы рассмотрим некоторые обобщения простейшей задачи вариационного исчисления, рассматривавшейся нами в гл. I. В § 7 изложена простейшая задача для функционалов с несколь- несколькими неизвестными функциями. В § 8—10 рассматриваются различ- различные обобщения простейшей задачи вариационного исчисления. При- желании читатель может приступить к чтению гл. III сразу же после изучения § 7. § 7. Задача с закрепленными концами в случае п неизвестных функций ь Рассмотрим функционал J= / F(x, у., y'Jdx, A) а зависящий от п функций yt (/=1, 2 /г), где функции yt удо- удовлетворяют граничным условиям B (/=1, 2 п\ B) и установим необходимые условия экстремума для такого функцио- функционала. Иными словами, ищется экстремум функционала, определенного на некоторой совокупности кривых, соединяющих две фиксированных точки в п -f-1 -мерном пространстве. Примером подобных задач является отыскание геодезических, т. е. кратчайших, линий между двумя точками некоторого многообразия. Та же самая задача возни- возникает и в геометрической оптике при нахождении пути, по которому распространяется свет в неоднородной среде; согласно принципу Ферма свет идет от точки Л в точку В по такому пути, чтобы время прохождения было наименьшим.
40 ОБОБЩЕНИЯ ПРОСТЕЙШЕЙ ЗАДАЧИ. УСЛОВНЫЙ ЭКСТРЕМУМ [ГЛ. II Найдем необходимые условия экстремума функционала A). Для этой цели вычислим его вариацию. Заменив функции yt(x) близкими к ним функциями yi{x)-\-hi{x)i где ht(a) = ht(b) = 0, получим ь ъ f у., yf.)dx = a b n где многоточие означает члены порядка выше первого, а выписанные члены представляют собой главную линейную часть ДУ, т. е. вариа- вариацию рассматриваемого функционала. Таким образом, ь п Все вариации ht{x) независимы между собой, и мы можем, на- например, одну из них выбрать произвольно (с соблюдением граничных условий), а все остальные взять равными нулю. Поэтому из равенства / 8У=0, представляющего собой необходимое условие экстремума, вытекает, iTO ь для всех /=1,2, ..., п. Воспользовавшись леммой 2 § 3, полу- получаем систему дифференциальных уравнений Эйлера Итак, для того чтобы кривая Л = У/(*) ('=». 2 ")• доставляла экстремум функционалу необходимо, чтобы функции yt (x)t ..., уп (х) удовлетворяли урав~ нениям Эйлера D). Система D) состоит из п уравнений второго
§ 7] ЗАДАЧА С ЗАКРЕПЛЕННЫМИ КОНЦАМИ В СЛУЧАЕ П ФУНКЦИЙ 41 порядка, следовательно, ее общее решение содержит 2п произвольных постоянных, которые определяются из граничных условий B). Примеры. 1. Распространение света в неоднород- неоднородной среде. Пусть пространство заполнено оптически неоднородной средой, так что в каждой точке пространства скорость распростра- распространения света есть некоторая функция v(x, у, z) от координат этой точки. Согласно уже упоминавшемуся принципу Ферма свет идет из одной точки в другую по той кривой, для которой время прохо- прохождения света будет наименьшим. Если линия, соединяющая две точки А и В, задана уравнениями у = у О), г = г (х). то время, за которое свет проходит вдоль нее, равно ь _ v (х, у, z) а Написав для этого функционала систему уравнений Эйлера dv У\ + у'*+г* , d ду v* ~r dx V2 получаем дифференциальные уравнения линий распространения света. 2. Геодезические линии. Рассмотрим некоторую поверх- поверхность, заданную векторным уравнением г —г {ut v). E) Линия минимальной длины, соединяющая две точки и лежащая на данной поверхности, называется геодезической линией. Найдем урав- уравнения геодезических линий. Их можно, очевидно, получить как уравг нения Эйлера, соответствующие некоторой вариационной задаче, а именно задаче о нахождении кратчайшего расстояния (считая по поверхности) между двумя точками, лежащими на данной поверхности. Линия, лежащая на поверхности r = r(ut v), может быть задана уравнениями и = и (t), v = v (t). Длина ее отрезка между точками, отвечающими значениям tx и t2 параметра t, равна и ./ [и, v] = J VEu/2 + 2Fufvr + Gv'2 dt. F) ft
42 ОБОБЩЕНИЯ ПРОСТЕЙШЕЙ ЗАДАЧИ. УСЛОВНЫЙ ЭКСТРЕМУМ [ГЛ. II где Е, F и О — коэффициенты первой квадратичной формы поверх- поверхности E), т. е. ^ (с)г_ _дг_\ р 1дг__ дг\ с /_дг_ дг \ \ ди ' да ) ' \ да ' dv ) * \ dv * dv )' Напишем для функционала F) уравнения Эйлера. Получаем „а V + Guv'2 d VЕа'2 + 2Fu'v' + Gt;'2 ^ V'Eu'2 + г^а'г;' + Gt;/2 Evu'2 + 2Fvii'v' + G^/2 d 2 (Fa' + Gv') _ Q "К^+г/^'г/' + Ог/2 ^ VEu'2 + 2Fu'v' + Gt;/2 Рассмотрим в качестве простейшего примера круглый цилиндр г— (a cos <p, a sin <p, ,г) G) и найдем геодезические линии на этом цилиндре. Здесь роль пара- параметров и и v играют переменные ср и z. Первая квадратичная форма цилиндра G) имеет следующие коэффициенты: E = a?t F = 0, 0=1. Следовательно, уравнения геодезических для этой поверхности будут * *У. =П d z' _0 dt у* * ' Л /22 т. е. Деля одно из этих уравнений на другое, получим dz n ~~Э— == v>« аср Решение этого уравнения представляет собой двупараметрическое семейство винтовых линий, лежащих на рассматриваемом цилиндре. Понятие геодезической может быть определено не только для поверхностей, но и для многообразий большего числа измерений. Нахождение геодезических линий ^-мерного многообразия приводится, очевидно, к решению вариационной задачи для функционала, завися- зависящего от п функций. Замечание. Выше мы для каждого функционала
§ 8] ВАРИАЦИОННЫЕ ЗАДАЧИ В ПАРАМЕТРИЧЕСКОЙ ФОРМЕ 43 получили отвечающую ему вполне определенную систему уравнений Эйлера. Поставим обратную задачу: пусть заданы левые части урав- уравнений Эйлера р d_p Требуется по ним восстановить функцию F(x, у, y'\ определяющую функционал A). Такая задача решается неоднозначно. Действительно, если мы прибавим к выражению, стоящему под знаком интеграла в функционале A), полный дифференциал какой-либо функции, т. е. прибавим к F выражение вида — у', где Ф = Ф(д:, у, уД (8) то соответствующие уравнения Эйлера при этом не изменятся, так как выражение dx \ dyt ) dyL (рассматриваемое как функция от х, у., у'Л тождественно равно нулю. В этом легко убедиться, подставив сюда вместо ф выражение (8). Сам функционал A) от добавления к нему какого-либо полного диф- дифференциала изменится, очевидно, на некоторую постоянную вели- величину*). § 8. Вариационные задачи в параметрической форме До сих пор мы считали, что кривые, на которых определен тот или иной функционал, заданы своими явными уравнениями, например, в плоском случае уравнениями вида у = у(х). A) Часто, однако, удобнее считать, что эти кривые заданы в пара- параметрической форме. Фактически мы уже встречались с этим положе- положением в последнем примере предыдущего параграфа, рассматривая *) Из сказанного выше видно, что две различные функции F{ и F2 могут определять один и то* же функционал, т. е. может оказаться, что ъ J ?х (*. У/, y'i) dx = J F2 (x, yif y't) dx a для всех допустимых кривых, хотя Fx (x, y^ zj) ф F2 (x, у/, zj). Если гово- говорить о восстановлении функционала (а не функции F) по левым частям уравнений Эйлера, то этот функционал находится однозначно с точностью до произвольного постоянного слагаемого (аналогично тому, как функция п переменных восстанавливается по ее полному дифференциалу с точностью до произвольного постоянного слагаемого).
44 ОБОБЩЕНИЯ ПРОСТЕЙШЕЙ ЗАДАЧИ. УСЛОВНЫЙ ЭКСТРЕМУМ [ГЛ. II геодезические линии на поверхности. В этом параграфе мы, ограни- ограничиваясь простейшей задаче-й вариационного исчисления, перенесем полу- полученные ранее результаты на случай параметрического задания кривых. Предположим, что в функционале B) мы хотим аргументом считать кривую, заданную не в виде а в параметрической форме x = x(f). y = y(f). C) Тогда функционал B) запишется в виде f J= fF(x(t)t y@. X®-)x(t)dt = [ф(х, у, i, y)dt D) У V x(t)l у (точка означает дифференцирование по t), т. е. в виде функционала, зависящего от двух неизвестных функций x{t) и у СО- Функция Ф, стоящая здесь под знаком интеграла, положительно однородна первой степени относительно x(t) и у @*) и не содер- содержит t явно. Обратно, пусть дан функционал (x, у, х, y)dt, где подынтегральная функция Ф не зависит от t явно и является положительно однородной первой степени относительно л: и у. Пока- Покажем, что значение такого функционала зависит лишь от кривой (в плос- плоскости (л:, у)), определяемой параметрическими уравнениями x = x(t), y = y(t), а не от самих функций x(t) и у {t)t т. е. если перейти от t к какому-либо новому параметру т, положив то будет иметь место равенство *) То есть она удовлетворяет условию Ф (х, у, kx, ky) = кФ (х, у, х, у) при всяком k > 0.
§ 8] ВАРИАЦИОННЫЕ ЗАДАЧИ В ПАРАМЕТРИЧЕСКОЙ ФОРМЕ 45 Действительно, воспользовавшись однородностью функции Ф по х и у, получаем = /ф(*. у, х. у)^й1= /ф(*. у, х, y)dt, tl что и требовалось. Итак, мы получили следующий результат. Для того чтобы значения функционала и Ф(?, х, у, х, y)dt Г зависели только от кривой, определяемой в плоскости (х, у) параметрическими уравнениями x = x(t), y = y(t), но не от выбора ее параметрического представления, необходимо и доста- достаточно, чтобы подынтегральная функция Ф не зависела от t явно, а по отношению к х и у была бы положительно однородной функцией первой степени однородности. Если мы функционал B) приведем с помощью того или иного параметрического представления кривой у = у(х) к виду , y,X-\xdt= [ф(х, у, х9 y)dt, xi J то для функционала B) мы можем написать два уравнения Эйлера: Эти два уравнения должны быть эквивалентны одному уравнению F — d F,—О отвечающему функционалу B), и следовательно, не могут быть не- независимы. Действительно, легко проверить, что они связаны тожде- тождественным соотношением К этому вопросу мы еще вернемся в гл. VII. Задача. Написать условия независимости от выбора параметра для функционала J F(t, yt(t), у\({))(И, т. е. для функционала, заданного на кривых я-мерного пространства.
46 ОБОБЩЕНИЯ ПРОСТЕЙШЕЙ ЗАДАЧИ. УСЛОВНЫЙ ЭКСТРЕМУМ (ГЛ. II § 9. Функционалы, зависящие от производных высших порядков До сих пор мы рассматривали функционалы вида ь yr y\)dx, зависящие от уь и их первых производных. В ряде задач, например в теории упругости, встречаются функционалы, для которых под- подынтегральное выражение содержит производные от искомой функции не только первого, но и более высоких порядков. Изложенные выше методы нахождения экстремумов функционалов (в рамках необходи- необходимых условий) могут быть перенесены без существенных изменений на этот более общий случай. Для простоты записи мы ограничимся слу- случаем одной неизвестной функции. Итак, рассмотрим функционал вида . У' y(n))dx A) и поставим для него следующую задачу. Среди всех кривых у = у(х), принадлежащих пространству Dn на отрезке [а, Ь] (см. § 2) и удовлетворяющих условиям у (а) = Ао, у' (а) = Л, уО-Ч (а) = Ап_х, Л у ф) = Во, у' ф) = ВХ y'»-i> (*) = Bn_v \ {2) найти ту, вдоль которой интеграл A) принимает экстремальное зна- значение. При решении этой задачи будем исходить из общей теоремы, установленной в § 3 гл. I: для того чтобы функционал J[y] дости- достигал экстремума, необходимо, чтобы его вариация обращалась в нуль. Вычислим вариацию функционала A), понимая под вариацией функционала A) главную часть его приращения, линейную относи* тельно h (х) (т. е. вариации у (х)) и ее производных W (х) Л*"* (х). Для того чтобы провариированная функция y(x)-\-h(x) тоже удовле* творяла граничным условиям B), нужно, очевидно, предположить, что \ )
§ 9] ФУНКЦИОНАЛЫ, ЗАВИСЯЩИЕ ОТ ПРОИЗВОДНЫХ ВЫСШИХ ПОРЯДКОВ 47 Имеем — F(x, у, у' где многоточие означает совокупность членов, имеющих порядок выше первого относительно /г, Ь! h^n\ Следовательно, выражение ъ и есть вариация функционала A). Таким образом, для экстремума необходимо ь U=f (Fyh + Fy,h' + ... + Fy{n)h(n)) dx = 0. D) a Отсюда с помощью интегрирования по частям, используя гранич- граничные условия C) для h (x), получаем ь E) для любой функции h(x), имеющей п непрерывных производных и удовлетворяющей условиям C). В силу леммы 1 § 3 отсюда следует, что Уравнение F) называется уравнением Эйлера — Пуассона. Оно пред- представляет собой дифференциальное уравнение порядка 2/г и, следова- следовательно, его общее решение содержит 2/г произвольных постоянных. Значения этих постоянных могут быть определены из краевых усло- условий B). Замечание. Приведенный выше вывод уравнения Эйлера — Пуассона не вполне строг, так как переход от D) к E) с помощью интегрирования по частям предполагает существование производных d f dn f m FF G)
48 ОБОБЩЕНИЯ ПРОСТЕЙШЕЙ ЗАДАЧИ. УСЛОВНЫЙ ЭКСТРЕМУМ [ГЛ. II Можно, однако, несколько усложнив рассуждения, доказать, что из D) вытекает уравнение F) и без этих дополнительных предположений (при этом само существование производных G) также доказывается, ср. с леммой 2 § 3). § 10. Изопериметрическая задача. Условный экстремум 1. В простейшей задаче вариационного исчисления, которую мы рассматривали в гл. I, класс допустимых линий, помимо тех или иных требований гладкости, определялся условиями, задаваемыми на концах этих линий. Однако ряд приложений вариационного исчисления при- приводит к задачам,, в которых на допустимые кривые, кроме граничных условий, накладываются условия совсем иного типа. Рассмотрим в каче- качестве примера так называемую изопериметрическую задачу. Эта задача формулируется следующим образом. Среди всех кривых, удовлетворяющих условиям у (а) = Л, у (b) = Bt на которых функционал ъ f(x,y,y')dx A) принимает заданное значение /, найти Ту, для которой другой функ- функционал достигает экстремума *). При решении этой задачи мы предположим, что функции О и F, определяющие функционалы A) и B), имеют непрерывные производ- производные первого и второго порядков при а <С х ^Ь и при произволь- произвольных значениях у и у''. Кроме того, мы предположим, что искомая кривая не является экстремалью функционала A). Решение поставлен- поставленной задачи дает следующая Теорема**) 1. Если кривая у = у{х) дает экстремум интегралу ь , у, y')dx, *) Первоначально под изопериметрической задачей понималась следую- следующая частная задача: среди всех замкнутых кривых, имеющих заданную длину, найти ту, которая охватывает наибольшую площадь. Отсюда и само назва- название «изопериметрическая задача» (т. е. задача с фиксированным периметром). **) Читатель легко обнаружит аналогию между^ формулируемой ниже теоремой и известным из анализа методом множителей Лагранжа для услов- условных экстремумов функций нескольких переменных.
§ 10] ИЗОПЕРИМЕТРИЧЕСКАЯ ЗАДАЧА. УСЛОВНЫЙ ЭКСТРЕМУМ 49 удовлетворяет условиям и не является экстремалью функционала A), то существует такая постоянная К что эта кривая у (х) является эктремалъю функционала ь f (F-\-\O)dx. Доказательство. Пусть кривая у = у(х) дает экстремум функционалу J[у] при условии, что K[y\=L Возьмем в интервале [а, Ь] две произвольные точки хг и х2 и придадим у (х) приращение h (х) = Ъху -\-ЪХзу, отличное от нуля лишь в окрестностях этих точек. Соответствующее приращение АУ функционала J можно представить в виде *) где ai = j 8*,У их, а2 = j ЬХ2у dx и sls s2->0 при Oj, a2->0. , Потребуем теперь, чтобы провариированная кривая удовлетворяла условию Д/С можно представить в виде, аналогичном C). Таким образом, получаем где Sj, в'2->0 при av а2->0. Выберем теперь точку х2 так, что *) См. замечание на стр. 36.
50 ОБОБЩЕНИЯ ПРОСТЕЙШЕЙ ЗАДАЧИ. УСЛОВНЫЙ ЭКСТРЕМУМ [ГЛ. II Такая точка существует, так как по условию у = у (х) не является экстремалью функционала К. При таком выборе точки х2 условию D) можно придать вид в,. E) где е'->0 при о2->0. Положив и подставив в формулу C) для ДУ вместо о2 выражение E), получим А7= (LFy~dZFyr\XaXi +Х[°у — Ц Gy'\x=xj Ol +Ml" Первое слагаемое справа представляет собой главную линейную отно- относительно h (х) часть ДУ, т. е. вариацию функционала У. Так как равенство вариации нулю есть необходимое условие экстремума и так как аг отлично от нуля, то что и требовалось доказать. Полученный результат используется при решении той или иной изопериметрической задачи следующим образом. Составив дифферен- дифференциальное уравнение G), находим его общее решение, которое будет содержать параметр X и еще две произвольные постоянные. Эти три величины определяются из граничных условий у(а) = А, у(Ь) = В и условия К [у] = 1. Все сказанное выше непосредственно обобщается на случай функ- функционалов, зависящих от нескольких функций и нескольких связей вида A). Именно пусть, ищется экстремум функционала х yn) = fF(x, ylt у\)с1х (8) а при условиях yl(b) = Bl (t=l, 2 /г), (9) yt, y')dx = lj U= L 2 k). A0)
§ 10] ИЗОПЕРЙМЕТРИЧЕСКАЯ ЗАДАЧА. УСЛОВНЫЙ ЭКСТРЕМУМ 51 В этом случае необходимым условием экстремума будет / k д \ } = l ('=1. 2 n). A1) 2п произвольных постоянных, входящих в решение этой системы, и значения k параметров \ \к определяются из граничных усло- условий (9) и условий A0). Доказательство для этого общего случая по существу не отличается от изложенного выше, и мы не будем его приводить. 2. В изопериметрической задаче дополнительные условия, которым должны удовлетворять функции уг уп, имеют вид A0), т. е. задаются с помощью функционалов. Сейчас мы рассмотрим задачу несколько иного типа, а именно: Найти экстремум функционала ь fF(x.yi.yrt)dx. а причем допустимые функции удовлетворяют граничным условиям yi(a) = Ai, yi(b) = Bi (/=1, 2 я), и k условиям связи вида У, У„) = 0 (/=1. 2 А:)- A2) Иначе говоря, функционал (8) рассматривается здесь не на всех кри- кривых, удовлетворяющих граничным условиям (9), а только на тех из них, которые лежат на некотором п — ^-мерном многообразии. Эта вариационная задача называется задачей Лагранжа, или зада- задачей на условный экстремум. Ограничимся для простоты записи случаем п = 2, k=l, т. е. будем искать экстремум функционала ъ F(x, у, г. у', zf)dx A3) а ъ f на пространственных кривых у = у (х), z = z (x)t принадлежащих фиксированной поверхности g(x9 у, г) = 0. A4) Решение этой задачи дается следующей теоремой.
52 ОБОБЩЕНИЯ ПРОСТЕЙШЕЙ ЗАДАЧИ. УСЛОВНЫЙ ЭКСТРЕМУМ [ГЛ. II Теорема 2. Если кривая У = У(Х)> г = г(х) A5) дает условный экстремум функционалу A3) б классе кривых, лежащих на поверхности g(x, у, z) = 0, причем ни в одной ее точке gy и gz не обращаются в нуль одновременно, то существует такая функция ^(х), что кри- кривая A5) является экстремалью функционала ъ f(F + \(x)g)dx. A6) а т. е. удовлетворяет дифференциальным уравнениям ру + Х8у-ТхГ>' = Ъ, Ft + \ga-±F, = 0. A7) Доказательство. Пусть У = У (х). z = z(x) — кривая, реализующая экстремум функционала A3) при указанных условиях, а у = у(х), z = z(x) — близкая к ней допустимая кри- кривая *). Пусть, далее, функции Ьу (х) = у — у и bz (х) = z — z отличны от нуля лишь- в малой окрестности (х9, хх) некоторой точки хМ, лежащей между а и Ь. Положим о1 = Г by dx, с2= С bz dx. Так как у = у(х), z = z(x) — допустимая кривая, то ъ хх x> У> ^) — g(x> У. z)\dx— J ( где Sj — величина выше первого порядка малости по сравнению с аг и а2. *) Существование таких кривых вытекает из теоремы о неявных функ- функциях. Действительно, если, например, в данной точке gz Ф 0, то в окрест- окрестности этой точки z есть функция от л: и у, поэтому, задав в этой окрест- окрестности у как функцию х, мы можем определить из уравнения g (х, у, /) = О и z как функцию х.
§ 10] ИЗОПЕРИМЕТРИЧЕСКАЯ ЗАДАЧА. УСЛОВНЫЙ ЭКСТРЕМУМ 53 Предположим, что из коэффициентов при аг и о2 хотя бы один, например gz, отличен от нуля. Тогда Воспользовавшись равенством A8), мы можем представить приращение функционала A3).в виде — 4-рУ — — y dx y gz XssX (e2, e3, e4 — величины порядка выше первого относительно ог). Для того чтобы имел место экстремум, необходимо, чтобы главная линей- линейная часть этого приращения равнялась нулю. Таким образом получаем или <LF Вдоль рассматриваемой кривой у — у(х), z = z(x) общее значение отношений A9) есть некоторая функция от х. Обозначив ее Х(х), мы и приходим к уравнениям A7). Теорема доказана. Замечание 1. Отметим без доказательства, что установленная выше теорема остается в силе и в том случае, когда за допустимые линии принимаются гладкие пространственные кривые, удовлетворяю- удовлетворяющие дифференциальному уравнению*) g(xt у, /, г, г') = 0. B0) Точнее говоря, если кривая fo дает экстремум функционалу J при условии B0) и если вдоль f0 производные g , и gz, не обращаются в нуль одновременно, то существует такая функция Х(х), что fo является интегральной кривой системы *) В механике условия вида B0), т. е. содержащие производные, назы- называются неголономными связями, а условия вида A4) — голономными связями.
54 ОБОБЩЕНИЯ ПРОСТЕЙШЕЙ ЗАДАЧИ. УСЛОВНЫЙ ЭКСТРЕМУМ [ГЛ. II где Замечание 2. Задачу Лагранжа можно рассматривать в неко- некотором смысле как предельный случай изопериметрической задачи. Действительно, если мы предположим, что условие A4) выполняется не всюду, а лишь в некоторой фиксированной точке ?(*o. У. *) = 0, то мы получим условие, левую часть которого можно рассматривать как функционал от у, z, т. е. условие того типа, который участвует в изопериметрической задаче. Таким образом, условие A4) можно рассматривать как совокупность бесконечного множества условий типа функционала. В изопериметрической задаче, как мы видели, число множителей Лагранжа \ \k равно числу условий связи. В задаче Лагранжа, в соответствии с только что сказанным, появляется функ- функция Х(х), т. е. свой множитель X в каждой точке х. Примеры 1. Найти кривую в верхней полуплоскости, прохо- проходящую через точки э(—а, 0) и (а, 0), имеющую заданную длину 21 (/ > а) и охватывающую вместе с отрезком [— а, а] максимальную площадь. Решение. Мы ищем функцию у — у (х), для которой а интеграл J(y) = Г ydx принимает максимальное значение. Мы имеем, таким образом, изопериметрическую задачу. В соответствии с изло- изложенным выше составляем функционал а J(y) 4-XL (у) = J (у + X /7+7*) <** и пишем для него уравнение Эйлера /2 отсюда находим
§ 101 ИЗОПЕРИМЕТРИЧЕСКАЯ ЗАДАЧА. УСЛОВНЫЙ ЭКСТРЕМУМ 55 Интегрируя, получаем уравнение (х — СхJ + (у — С2J = X2 семейства окружностей. Значения Cv С2 и X определяются из условий у(—а) = = у (а) = 0 и условия L (у) = 21. 2. Из всех кривых, лежащих на поверхности x2-\-y2-\-z2 = а2 и проходящих через две заданные точки (х0, у0, z0) и (xv yv zx)t найти ту, которая имеет наименьшую длину. Решение. Длина кривой записывается интегралом J Составляем вспомогательный функционал J и пишем соответствующие уравнения Эйлера = 0. Решая эти уравнения, мы получим семейство линий, зависящее от четырех постоянных, значения которых определяются из граничных условий у(*о) = Уо» г(хо) = го и у(д:1) = У1. г(хг) = гг. Замечание 3. Задачу на нахождение условного экстремума функции нескольких переменных можно, как известно, свести к задаче на безусловный экстремум, выразив переменные, на которые наложены связи, через соответствующее число независимых переменных. Ана- Аналогичным образом обстоит дело и в вариационных задачах. Например, задачу о нахождении геодезических на некоторой поверхности можно рассматривать как задачу на условный экстремум (пример 2), но можно, представив координаты х, у, z как функции двух пара- параметров, свести эту задачу к отысканию безусловного экстремума (см. конец § 7).
ГЛАВА III ОСНОВНАЯ ФОРМУЛА ДЛЯ ВАРИАЦИИ ФУНКЦИОНАЛА. ЗАДАЧИ С ПОДВИЖНЫМИ КОНЦАМИ §11. Основная формула для вариации функционала Выведем прежде всего оёщую формулу для вариации функционала fF(x.yt.yfl)dx. Хо Начнем с того случая, когда рассматриваемый функционал зависит лишь от одной функции, т. е. имеет вид fF(x, у, yf)dx\ A) при этом, однако, в отличие от простейшей задачи, мы будем счи- считать, что концы тех кривых, на которых определен этот функционал, могут сдвигаться произвольным образом. Все рассматриваемые кривые мы будем предполагать гладкими, а расстоянием между двумя кри- кривыми у(х) и у(х) мы назовем величину —Я + maxl/—/l+pC/^ A>) + P(ft. ft), B) где pQt р0 и pv /?! — левые, соответственно правые концы кривых у и у. Так как функции у и у определены, вообще говоря, на разных интервалах, то для того чтобы формула B) всегда имела смысл, эти кривые нужно продолжить на интервал, содержащий те интервалы, на которых определены у и у, проведя, например, для этого каса- касательные в конечных точках кривых (рис. 4). Определим вариацию функционала A) как выражение, линейное относительно приращения h функции у и относительно приращений координат концов и отличающееся от полного приращения функцио- функционала J[y] на величину выше первого порядка малости по сравне- сравнению с расстоянием между функциями у и у -\-h.
§ 11] ОСНОВНАЯ ФОРМУЛА ДЛЯ ВАРИАЦИИ ФУНКЦИОНАЛА Обозначим координаты концов кривой у (х) через (xQi у0) и (хг, уг), а координаты концов провариированной кривой У + А через (хо-\-Ъхо, ^о + Ы) и (*1 + 8*1« У1+8У1> соответственно. Рис. 4. Найдем явное выражение для вариации. Для этого сперва найдем приращение функционала J[y]. Имеем*) Хх + О*! = f F(x, y + h, y' + h')dx— fF(x, у, y')dx = q -f- qXq О —J4*. У. У' хо+Ьхо ,y'-\-h')dx—f F(x, ')dx. Воспользовавшись формулой Тейлора и отбрасывая члены выше пер- первого порядка малости, получим отсюда, что х1 —У[у]~ flFy(x. у, , у, y')h'\dx + *) Нас не должно смущать, что в подынтегральные выражения здесь входят функции, определенные на разных интервалах. Мы ведь условились продолжать их, например, с помощью линейной экстраполяции!
58. ОСНОВНАЯ ФОРМУЛА ДЛЯ ВАРИАЦИИ. ПОДВИЖНЫЕ КОНЦЫ [ГЛ. III где ~ означает равенство с точностью до величин порядка выше первого относительно р(у, у + /г). Но, как это ясно из рисунка 4, h (лт0) ~ Ьу0 — / Ьх0; h (хх) ~ Ьух — у' Ьхг C) (где ~ опять-таки означает равенство с точностью до бесконечно малых порядка выше первого). Поэтому окончательно ] \x=Xi by, + + (F - Fry') \x=Xs Ьхг - Fr |^ 8y0 - (F - Fy,y>) |^ bx0. D) Мы получили общую формулу вариации для функционала, зависящего от одной функции. Она содержит в качестве частных случаев фор- формулу вариации для задачи со свободными концами (в этом случае 8jco = 8x1 = O) и формулу вариации для простейшей задачи (в этом случае Sxo = 8x! = O и 8^ = 8^ = 0). Найдем теперь вариацию функционала $yl9y\)dxt E) зависящего от п функций ух уп, причем опять-таки для этих функций никаких условий на концах ставить не будем. Поскольку всякую систему п функций можно интерпретировать как кривую в п + 1 -мерном пространстве, функционал E) можно рассматривать как определенный на некотором множестве кривых в пространстве размерности п-\- 1. Вариацию функционала E) мы определим как главную линейную (относительно всех приращений ht{x) функций yt{x)) часть прираще- приращения функционала. Найдем сперва это приращение: х^Ьхг Хх = J F(x, у. + Л;, у;+ *;)rfx— fF(x. yl xo+bxo Главную линейную (относительно ht) часть этого приращения можно, воспользовавшись формулой Тейлора, представить в виде -р\х=х Ьхо- G)
§ 11] ОСНОВНАЯ ФОРМУЛА ДЛЯ ВАРИАЦИИ ФУНКЦИОНАЛА 59 Интегрируя здесь слагаемые, содержащие h'v по частям, получим, что приращение функционала E) с точностью до бесконечно малых порядка выше первого равно /=1 — F Обозначим byi0 приращение координаты уь на одном из концов кри- кривой, а Ьуп— приращение координаты yt на другом конце. Аналогично случаю функционала, зависящего от одной функции, получаем Поэтому мы можем окончательно написать х-хх или, короче, ' Ь* (8) где символ I ' показывает, что нужно взять разность между значе- ниями соответствующей величины в конечной точке дуги и в начальной. Это выражение линейно относительно величин ht, byit Ьх и отли- отличается^ на бесконечно малую порядка выше первого от приращения функционала, т. е. представляет собой его вариацию. Выражение (8) и представляет собой ту основную формулу вариации функционала E), которую мы хотели получить.
60 ОСНОВНАЯ ФОРМУЛА ДЛЯ ВАРИАЦИИ. ПОДВИЖНЫЕ КОНЦЫ Введем следующие обозначения: [ГЛ. III В этих новых обозначениях основная формула (8) для вариации функционала запишется следующим образом: l. A0) Заметим, что если детерминант, составленный из производных F , , отличен от нуля, то величины у', можно выразить из равенств через рь и yt, и мы можем в рассматриваемом функционале перейти (локально) от переменных х,уГ',.,9 уп, у'х у'п и функции F к переменным х, ух Уп* Рл Рп и ФУНКДИИ Н. Переменные xtyx уп, рх рп и Н называются каноническими перемен- переменными. Они играют важную роль в самых разных вопросах вариа- вариационного исчисления, и мы будем еще неоднократно с ними встре- встречаться. Пусть кривая, соединяющая точки (х0, у\ у?) и (л;, у[ y^)t является экстремалью. Тогда в выражении для вариации интеграль- интегральный член обращается в нуль, и мы получаем *i у/ или, в других обозначениях, Равенство (И) A2) 87=0 является необходимым условием экстремума для функционала E) при любых граничных условиях. В следующих двух параграфах мы применим полученну^ выше общую формулу вариации к исследованию некоторых типов вариа- вариационных задач.
§ 12] ЗАДАЧА С ПОДЙ*ЖНЫМИ КОНЦАМИ 61 § 12. Задача с подвижными концами В простейшей задаче, которой мы в основном до сих пор зани- занимались в качестве граничных условий, определяющих класс допу- допустимых кривых, берутся условия закрепления концов. Сейчас мы рассмотрим задачу иного типа. Чтобы не усложнять дело, ограни- ограничимся случаем одной неизвестной функции. Пусть дан функционал f A) определенный на гладких кривых, концы которых /?0 и р1 лежат на двух фиксированных линиях у = ср (л:) и у = ф (х). Требуется найти экстремум такого функционала. Примером подобной задачи может служить нахождение расстоя- расстояния между двумя линиями. Воспользуемся тем выражением вариации, которое было получено нами в предыдущем параграфе. При п = 1 оно имеет вид - Ру L-*4 - С7 - Fyy') U,04- B) Если некоторая кривая дает экстремум рассматриваемому функцио- функционалу среди всех допустимых кривых, то она тем более будет давать экстремум и по отношению ко всем кривым, имеющим те же кон- концевые точки. Следовательно, эта кривая должна быть экстремалью, т. е. удовлетворять уравнению Эйлера. Поэтому в выражении B) первый член обращается в нуль, и мы получаем - Fr U,> - С7 - Руу') U^*o- C) Так как (рис. 5) Ъух = ф'8*! +ар Ьу0 = у'Ъх0 + а0, где <Xj и а0 — бесконечно малые величины порядка выше первого, то окончательно условие экстремума bJ=O можно переписать так: 87 = (Fy,y +F — y'Fy.) \х=хЬхх - {Fy.?'-+-F-y'Fr)\ХтХЬх0 = 0. Так как Ьхг и Ъх0 — независимые приращения, то отсюда получаем
62 ОСНОВНАЯ ФОРМУЛА ДЛЯ ВАРИАЦИИ. ПОДВИЖНЫЕ КОНЦЫ [ГЛ. III т, е. трансверсальна Эти граничные условия называются условиями трансверсальности. Про кривую у = у(х), удовле- творяющую этим условиям, гово- говорят, что она кривым ср(х) и ф Итак, для решения вариацион- вариационной задачи с подвижными кон- концами нужно сперва написать и ре- решить соответствующее уравнение Эйлера, а затем найти значения входящих в его общее решение двух произвольных постоянных из условий трансверсальности, встречаются функционалы вида j?;+?z; Рис. 5. В вариационных задачах часто л1 ff(x, y)V\+y'2dx. D) Для них условия трансверсальности выглядят особенно просто. Действительно, в этом случае и следовательно, условие трансверсальности принимает вид откуда аналогично на втором конце т. е. для функционалов вида D) трансверсальность сводится к ор- ортогональности. Можно рассматривать задачу с подвижными концами и для функ- функционалов, зависящих от нескольких функций, например, в случае двух функций эту задачу можно сформулировать так: Среди всевозможных кривых, концы которых лежат на двух фиксированных поверхностях х = у{у, z) и x = ty(yt z)t найти ту,
§ 13] НЕ ГЛАДКИЕ ЭКСТРЕМАЛИ. УСЛОВИЯ ВЕЙЕРШТРАССА—ЭРДМАНА 63 которая дает экстремум функционалу Г F (х, у, z, у\ z')dx. Воспользовавшись общей формулой для вариации (8) (при п = 2) и проводя те же самые рассуждения, что и в случае одной неиз- неизвестной функции, получаем, что функции у(х) и z(x), определяю- определяющие искомую кривую, опять-таки должны удовлетворять уравнениям Эйлера а в концевых точках должны выполняться условия х-хй = o, ¦Xq = 0, X-X. \x=xt которые также называются условиями трансверсальности. § 13. Случай не гладких экстремалей. Условия Вейерштрасса — Эрдмана В § 4 мы показали (теорема 2), что экстремаль у = у(х) функ- функционала ь F(xt у, y')dx а является дважды непрерывно дифференцируемой функцией, если производная не обращается в нуль. Существуют, однако, вариационные задачи, в которых экстремум достигается на кривой, являющейся лишь ку- кусочно-гладкой. Примером таких задач может служить рассмотренная нами в § 4 задача о нахождении кривой, проходящей через две заданные точки (х0, у0), (хх, уг) и образующей при своем вращении вокруг оси х поверхность возможно меньшей площади.
,64 ОСНОВНАЯ ФОРМУЛА ДЛЯ ВАРИАЦИИ. ПОДВИЖНЫЕ КОНЦЫ [ГЛ. III Действительно, как уже указывалось в § 4, если две заданные точки (х0, у0) и (xv Ут) расположены так, что у0 и уг достаточно малы по сравнению с хх — х0, то кривая, представляющая собой решение этой задачи, состоит из отрезка (лг0, хх) на оси х и двух вертикальных отрезков. Итак, рассмотрим задачу о нахождении экстремума функцио- функционала A), считая, что допустимые кривые удовлетворяют граничным условиям у{а) = А, уф) = В и могут иметь излом в некоторой точке с (а << с < Ь). (В силу упо- упоминавшейся выше теоремы 2 § 4 излом возможен лишь там, где Fy.y. = 0.) На каждом из отрезков [а, с] и [с, Ь] та кривая, на которой функционал %(x, yt y')dx достигает экстремума, удовлетворяет уравнению Эйлера Представим рассматриваемый функционал в виде суммы двух функ- функционалов ъ (x,y, y')dx = а с Ъ и вычислим вариацию для каждого из этих двух функционалов в отдельности. На каждом из отрезков [а, с] и [ct b\ граничные условия состоят в том, что один конец допустимой кривой закреп- закреплен, а другой свободен. Поэтому, принимая во внимание уравнение Эйлера, получаем с помощью формулы C) § 12, что Ц = Fy U-o bi+F- УРг) \хте-о b*i. Ц = -Fr \X=C+Q by, -(F- y'Fr) | x=c+Qbxv Если имеет место экстремум, то т. е.
§ 13] НЕ ГЛАДКИЕ ЭКСТРЕМАЛИ. УСЛОВИЯ ВЕЙЕРШТРАССА — ЭРДМАНА 65 откуда в силу произвольности Ьу1 и Ьхх получаем . На каждом из двух отрезков [а, с] и [с, ?] экстремаль должна удовлетворять уравнению Эйлера, т. е. дифференциальному уравнению второго порядка. При решении этих двух уравнений получаются четыре произвольные постоянные, которые находятся из граничных условий и условий (*) в точке излома, называемых условиями Вейерштрасса — Эрдмана. Эти условия выглядят особенно просто, если воспользоваться введенными в § 11 каноническими переменными р = Fy* и Н= — F-\-y'Fy'. Действительно, условия Вейерштрасса — Эрдмана просто означают, что канонические переменные должны быть в точке излома непрерывны. Условия Вейерштрасса — Эрдмана (*), которым должна удовлетво- удовлетворять экстремаль в точке излома, допускает следующую геометриче- / скую интерпретацию. Фиксируем х и у и будем на одной из координатных осей от- откладывать значения у', а на другой — значения F(x, у, у'). Мы по- получим некоторую кривую, изображающую F(xt yt уг) как функцию от у'. Тогда первое из условий (*) означает, что касательные к этой кривой в точках у' (с — 0) и у (с-\-0) параллельны между собой, а второе из этих условий, которое можно переписать в виде р \ р \ F г\)г Iе означает, что эти две касательные не только параллельны, но даже совпадают. Одновременно здесь получается и наглядная интерпретация усло- условия Fy'y' Ф 0, исключающего возможность излома экстремали. Дей- Действительно, если, например, функция F такова, что Fy'y' > 0, то экстремаль не может иметь излома, так как при этом условии кри- кривая, изображающая зависимость F от у\ выпукла и касательные к ней, проведенные в двух разных точках, не могут совпадать (ср. с теоремой 2 § 4). Задача. Найти кривую, проходящую через точки (—1,0) и A, 1) и дающую минимум функционалу -1
ГЛАВА IV КАНОНИЧЕСКИЙ ВИД УРАВНЕНИЙ ЭЙЛЕРА. ВАРИАЦИОННЫЕ ПРИНЦИПЫ. ЗАКОНЫ СОХРАНЕНИЯ. УРАВНЕНИЕ ГАМИЛЬТОНА - ЯКОБИ Как было отмечено еще во введении, многие физические зако- закономерности выражаются в экстремальных свойствах некоторых функ- функционалов. В этой главе мы рассмотрим применение методов вариаци- вариационного исчисления к вопросам классической механики системы ко- конечного числа материальных точек. Мы увидим, например, что тра- траектории некоторой механической системы в фазовом пространстве, описывающие эволюцию этой системы с течением времени, можно находить как экстремали некоторого функционала. С помощью ва- вариационного исчисления можно также указывать те величины, свя- связанные с данной физической системой, которые при эволюции рас- рассматриваемой системы не меняются с течением времени. Этот круг вопросов и составляет основное содержание настоящей главы. В первых параграфах этой главы вводится важное для дальнейшего понятие канонических переменных и излагается приведение уравне- уравнений Эйлера к каноническому виду. С содержанием этой главы тесно связано Дополнение I, в котором содержится другой независимый вывод канонических уравнений и уравнения Гамильтона — Якоби, а также их геометрическая интерпретация. § 14. Канонический вид уравнений Эйлера. Первые интегралы 1. Уравнения Эйлера yi dx yt к ' b отвечающие функционалу Г^(*. у*. y'i)dx, зависящему от п функ-
§ 14] КАНОНИЧЕСКИЙ ВИД УРАВНЕНИЙ ЭЙЛЕРА. ПЕРВЫЕ ИНТЕГРАЛЫ 67 ций, образуют систему п уравнений второго порядка. Такую систему можно, и притом различными способами, свести к системе 2п урав- уравнений первого порядка; например, можно принять у'х у'п за п новых неизвестных функций и рассматривать систему*) Ч ~F * = О yi dx yt B) где ух уп, y'v ..., yfn — неизвестные функции, а х — незави- независимое переменное. Мы получим, однако, для уравнений Эйлера го- гораздо более удобную и симметричную форму, введя вместо х> ylt ..., уп другую систему переменных — так называемые канони- канонические переменные. В § 11 при выводе основной формулы вариации функционала мы ввели следующие величины: р^ру:: n=-F+^iPl. C) С их помощью мы получили компактное выражение для вариации функционала, а также (§ 13) наглядную интерпретацию условий Вейерштрасса — Эрдмана. Однако особенно ясной становится их роль именно в связи с канонической формой уравнений Эйлера. Выразив из равенств Л = ^у; D) величины yt уп через х, ух уп и рх рп, мы можем величины х. Ух Уп> Pi Рп принять за новые переменные вместо прежних переменных х> Ух Ул. Уь •••. Уп- Именно эту замену переменных мы и сделаем в уравнениях Эйлера B). Одновременно функцию F(x, y.t y'^t входящую в уравнения Эйлера, *) Таким образом, здесь (и далее в этой главе) под у\ будут пониматься новые переменные. Было бы правильнее, чтобы не смущать читателя, вместо у\ писать zt. Мы будем, однако, пользоваться общепринятыми обо- обозначениями, а в тех случаях, когда речь будет идти именно о производной некоторой функции у^, мы будем подчеркивать это, пользуясь обозначе- d нием dyt r ~?L, а не yt.
68 КАНОНИЧЕСКИЙ ВИД УРАВНЕНИЙ ЭЙЛЕРА [ГЛ. IV мы выразим через новую функцию #(х, yt, pt), связанную с F ра- равенством (здесь у'ь означает соответствующие функции от х, у., р\ Опреде- Определенная этим равенством функция Н(х, yit pt) называется функ- функцией Гамильтона, отвечающей данному функционалу Переменные х, yt, pp H, связанные со старыми переменными xt y.t y'r F соотношениями C) и D), называются каноническими переменными (отвечающими данному функционалу \ F (х,уг y'^dxy Переход от старых переменных к новым возможен, если функцио- функциональный детерминант —,1\ " "—тг,т. е. детерминант матрицы, со- °{Уь Уп) ставленной из производных отличен от нуля. Мы будем предполагать это условие выполненным *). Выясним теперь, как преобразуются уравнения Эйлера B) при переходе к каноническим переменным. Чтобы сделать в уравнениях Эйлера указанную замену, нужно частные производные Fy. (т. е. частные производные от F по yit взятые при постоянных у[ • уг\ выразить через частные производные Ну. (которые берутся при по- постоянных значениях pi Рп)**)- Непосредственное вычисление этих производных было бы несколько громоздко. Мы избежим длинных выкладок, воспользовавшись вы- выражением дифференциала функции Н. При этом в силу независи- независимости (инвариантности) первого дифференциала от выбора независи- независимых переменных, нам нет необходимости помнить о том, перешли мы уже к новым переменным или нет. *) Следует иметь в виду, что это условие обеспечивает лишь локаль- локальную разрешимость уравнений pt = Fy[ относительно y'-v ..., уп, но не га- гарантирует возможности представить у[,...,уп в зиде функций от х.у^р^ определенных во всей рассматриваемой области. Таким образом, все наши рассуждения носят локальный характер. **) Обычно употребляемые в анализе обозначения частных производных обладают известным несовершенством: в них не содержатся указания на то, какие именно переменные фиксируются.
§ 14] КАНОНИЧЕСКИЙ ВИД УРАВНЕНИЙ ЭЙЛЕРА. ПЕРВЫЕ ИНТЕГРАЛЫ 69 Из определения Н получаем dH = -dF + 2 Pi dy\ + 2 У\ dpit т. е. V dF ^ V dF л * У — dyt — ZtT-r^i Й^ Йду' tdpr E) Для того чтобы получить отсюда выражения для частных про- производных функции Н, следовало бы выразить dyr{ через х, у{ и р.. Однако (в этом по существу и состоит важная особенность канони- канонических переменных) в силу равенств члены, содержащие dyrt в E), взаимно уничтожаются, и мы полу- получаем %f§ f G) Для получения частных производных функции Н остается выписать коэффициенты при соответствующих дифференциалах справа. Таким образом, dH__dF ^.__jtfL JOL— ' дх~ дх* dyt ~ dyt ' dpt ~yi- Итак, величины ^— и у'. выражаю.тся через частные производные функции Н по формулам y W Пользуясь этими выражениями, можно уравнения Эйлера B) пе- переписать в виде dfi__dH dyi_dH Q dx ~ dyt' dx ~ dpi' w Эти 2п уравнений первого порядка образуют систему, эквивалент- эквивалентную B) и называемую канонической системой уравнений Эйлера ь рассматриваемого функционала Г F(x, yi, y[)dx.
70 КАНОНИЧЕСКИЙ ВИД УРАВНЕНИЙ ЭЙЛЕРА [ГЛ. IV 2. Первые интегралы уравнений Эйлера. Напомним, что первым интегралом некоторой системы дифференциальных уравне- уравнений называется функция, сохраняющая постоянные значения вдоль каж- каждой интегральной кривой этой системы. Выясним, какие первые ин- интегралы может иметь каноническая система (9) (а следовательно, и эквивалентная ей первоначальная система B)). Рассмотрим сначала тот случай, когда функция F, определяющая функционал, не зависит от х явно, т. е. F(yY уп, уп уп). Тогда функция И = — F' + 2 У//7* тоже не содержит х явно и, следовательно, dx jU dyt dx ' AA dpi dx ' Воспользовавшись каноническими уравнениями Эйлера (9), получаем dH_ydH дН у дН дН =Q dx JmA ду[ dpi AA dpi dyi ' 1=1 i=l откуда Я = const вдоль каждой экстремали *). Таким образом, если F не зависит от х явно, то функция Н(у(, р^ является первым интегралом урав- уравнений Эйлера **). Рассмотрим теперь некоторую произвольную функцию вида Ф(У1. •••• Ул. Р\ Рп) и выясним, при каких условиях она будет первым интегралом си- системы (9). При этом мы уже не будем предполагать, что F не за- зависит от х явно, а рассмотрим общий случай. Вдоль каждой интегральной кривой системы ?9) имеем dФ у / dФ dy-t , dФ dpi \ Vi / dФ dH dФ dH \ dx AU \dyi dx ' dpi ~dx) 2u \&у\ ~dpl Ifpi ~dyl) ' Выражение [ф И] — УA>±йК_д*йЦ\ *) Если Н зависит от х, то имеет место формула dx ~ дх ' которая получается таким же рассуждением. **) См. в § 4 интегрирование уравнения Эйлера для функционала, не зависящего от х.
§ 15] ПРЕОБРАЗОВАНИЕ ЛЕЖАНДРА. КАНОНИЧЕСКИЕ ПРЕОБРАЗОВАНИЯ 71 называется скобкой Пуассона функций Ф и И. Мы получаем сле- следующую формулу: ^ = [Ф.Я]. dx l J Таким образом, для того чтобы Ф^ уп, рх рп) была первым интегралом системы уравнений Эйлера (9), необхо- необходимо и достаточно, чтобы скобка Пуассона [Ф, Н] была тождественно равна нулю *). Если же не только И, но и Ф может явно зависеть от х, то спра- справедлива, как легко проверить, следующая формула: dx дх ' L J § 15. Преобразование Лежандра. Канонические преобразования Рассмотрим еще один метод приведения уравнений Эйлера к ка- каноническому виду, отличный от изложенного в предыдущем пара- параграфе. Идея этого нового вывода состоит в том, что рассматри- рассматриваемая вариационная задача заменяется другой, ей эквивалентной и такой, что уравнения Эйлера для этой новой задачи совпадают с каноническими уравнениями Эйлера для первоначальной задачи. 1. Сначала рассмотрим некоторые соображения, относящиеся к за- задаче о нахождении экстремума функции конечного числа перемен- переменных. Начнем со случая одного переменного. Пусть ищется экстремум (скажем, минимум) функции t = / (?), причем /(с) выпукла, т. е. Гй>о. CD Введем новую независимую переменную р (называемую танген- тангенциальной координатой), положив Р = /'(<)**). B) *) Так как в силу теоремы существования через каждую точку (х, у,, ...,ул, Pi,...,pn) проходит интегральная кривая системы (9), из то- того, что [Ф,^/] = 0, вдоль каждой интегральной кривой действительно следует, что [Ф, //]ееО. **) Таким образом, за независимую пере- переменную принимается угловой коэффициент каса- касательной, проходящей через данную точку кри- Рис. 6. вой. Если кривая выпукла, то точка на ней опре- определяется по угловому коэффициенту касательной однозначно (см. рис. 6). То же самое верно, конечно, и для вогнутой кривой (т. е. такой, у которой всюду /" (?) < 0).
72 КАНОНИЧЕСКИЙ ВИД УРАВНЕНИЙ ЭЙЛЕРА [ГЛ. IV Так как, по условию, -^ = /"(?)=? О, то из B) можно выразить ? через р. Введем теперь новую функцию C) (здесь ? есть функция от р, определяемая равенством B)). Преобра- Преобразование, определяемое формулами B) и C), называется преобразо- преобразованием Лежандра. Таким образом, преобразование Лежандра — это переход от переменной и функции "I S./G) к переменной и функции •р. Н(р). Легко проверить, что из выпуклости /(Ё) вытекает выпуклость Н(р). Действительно, откуда dH dp'' и, следовательно, dp2 dp поскольку /" (E) > 0. Пример. Пусть /(?) = — Тогда т. е. и следовательно, т. е. где й связано с а соотношением Функция #(/?), определенная равенством C), иногда называется двойственной по Юнгу к функции /(?). Легко проверить, что пре-
§ 15] ПРЕОБРАЗОВАНИЕ ЛЕЖАНДРА. КАНОНИЧЕСКИЕ ПРЕОБРАЗОВАНИЯ 73 образование Лежандра, примененное к р и Н(р), приводит снова к (¦ и /(^*). Действительно, согласно D) -т- = ? и, кроме того, = f ?)- pHf {p)-\- pH> (p) = f ?). E) Посмотрим теперь, как связан переход от функции /(Е) к Н(р) с задачей о нахождении экстремума функции /(?). Рассмотрим вы- выражение (б) которое при \ = Н'(р) совпадает с /(?).' как функцию двух незави- независимых переменных. Покажем, что min[—Я (/>) + &/>] = /F). G) Р Действительно, из условия ^L(_//(p)+s/>) =-я'0>)+&=о получаем ? = //'(/>). откуда в силу E) и вытекает G). Таким образом, задача об оты- отыскании минимума функции /(?) равносильна задаче о нахожде- нахождении минимума выражения —Н(р)-\-Ър как функции двух пере- переменных. Говоря более точно, мы получаем из G), что (?) = min[— Аналогичные рассуждения можно провести и для функций не- нескольких независимых переменных. Пусть — функция п переменных, для которой детерминант, составленный из производных, d*F не обращается в нуль. Положим Pt = Fii (8) и iPi- (9) *) Преобразование, двукратное повторение которого есть тождественное преобразование, называется обычно инволютивным. Таким образом, пре- преобразование Лежандра инволютивно. **) Эта формула дает возможность определить переход от Н(р) к т. е. преобразование Лежандра для любых выпуклых функций.
74 КАНОНИЧЕСКИЙ ВИД УРАВНЕНИЙ ЭЙЛЕРА [ГЛ. IV Выразив ^ через pt из (8) и подставив эти выражения в (9), полу- получим функцию H=H(Pli ..., рп). Как и в случае одного независимого переменного, непосредственная проверка показывает, что min Г - H(plt ..., рп) + 2 pfo] = F F/f ..., ln\ и потому отыскание минимума функции F (?v ..., %п) равносильно отысканию минимума выражения — Н(рх% ..., /O-f-SftE/, в котором pi и lk рассматриваются как независимые переменные. Замечание. Мы показали, что min [- следовательно, при произвольных значениях /?а р^ -н(Р1, .... />e) + SpA>/'(?, U, т. е. где /?!,..., /?л и Я(р!, ..., рп) определяются формулами (8) и (9). Полученное нами неравенство называется неравенством Юнга. Для функций одного переменного его геометрический смысл непосред- непосредственно виден из рис. 6. 2. Применим эти рассуждения к функционалам. Пусть дан функ- функционал ь J[y] = fF(x,y,y')dx. A0) а Положим p = Fr(x, у, /) A1) Н(х. у, p) = — FJrpy' (ПО (считая, что в правой части этого равенства у' представляет собой функцию от а:, у и р, определенную равенством A1)). Введем новый функционал ь J[y,p)=f(-H(x,y,p)-\-py')dx, A2)
§ 15] ПРЕОБРАЗОВАНИЕ ЛЕЖАНДРА. КАНОНИЧЕСКИЕ ПРЕОБРАЗОВАНИЯ 75 в котором у и р рассматриваются как две независимые функции, а у' есть производная от у. Этот функционал совпадает, очевидно, с исходным функционалом A0), если за р взять выражение A1). Напишем для функционала A2) уравнения Эйлера. Получим дН dp _ дН (*У _п Это не что иное, как канонические уравнения для функционала ь J F(x, у, yr)dx. Мы докажем эквивалентность эти* уравнений а с уравнением dF d dF (и, следовательно, получим новый, независимый от первоначального, вывод канонических уравнений), если докажем, что функционалы A0) и A2) принимают экстремальные значения на одних и тех же кривых. Для этого заметим прежде всего, что определяемый форму- формулами A1) и (ПО переход от функции F переменных х, у, у' к функ- функции Я переменных х, у, р инволютивен, т. е., проделав преобра зование Лежандра для Я, мы основа вернемся к функции F (х, у, у') Действительно, так как#) .rj dF , dF , . , , dti = — -3— dx 3— dy -4- у dp, dx dy ^ ' •* r то dp —y' поэтому >-%!r = F-py'+py' = F. A5) Докажем теперь эквивалентность вариационных задач A0) и A2). Это будет доказано, если мы докажем, что минимум J [у, р] по р при фиксированном уесть J[y]. Действительно, тогдя минимум J[y, p) при изменении как /?, так и у будет совпадать с минимумом J[y]. Докажем, что mini [у, p] = J[p]. Так как J[y, p] не содержит р', то для нахождения минимума J[y, p] достаточно найти минимум подынтегрального выражения в каждой точке, т. е. положить Отсюда дН уГ=~ьу- *) См. формулу G) предыдущего параграфа.
76 КАНОНИЧЕСКИЙ ВИД УРАВНЕНИЙ ЭЙЛЕРА [ГЛ. IV Но тогда, согласно A5), и значит mmJ [у, p] = J[y]. р Итак, эквивалентность вариационных задач A0) и A2), а следова- следовательно, и отвечающих им уравнений Эйлера A4) и A3) доказана. Мы рассмотрели функционалы, зависящие от одной функции. Те же рассуждения остаются в силе и в случае п функций. Пр и м е р? Рассмотрим функционал A6) ' где Р и Q — функции от х. Для него p = 2Py't Н—Ру' —Qy2, откуда Соответствующие канонические уравнения имеют вид dP _9Г)м *У*— Р~ Уравнение Эйлера в обычной форме для функционала A6) имеет вид 3. Рассмотрим теперь следующий вопрос: при каких преобразо- преобразованиях переменных канонические уравнения Эйлера сохраняют свою каноническую форму? В конце первой главы мы показали, что уравнение Эйлера У dx y инвариантно по отношению к преобразованию координат, т. е. пе- переходу от переменных х, у к любым другим переменным ? —?(jc), т] = т] (у). При этом у' в функционале заменяется на —j^-. Этим свой- свойством инвариантности обладают и канонические уравнения Эйлера. Однако в силу той симметрии, которая имеется в канонических урав- уравнениях между переменными pi и yit здесь замену переменных можно понимать в более широком смысле, а именно как переход от пере- переменных yt, pt к новым переменным
§/15] ПРЕОБРАЗОВАНИЕ ЛЕЖАНДРА. КАНОНИЧЕСКИЕ ПРЕОБРАЗОВАНИЯ 77 (т. е. рь преобразуются по собственным формулам, не зависящим от того, как преобразуются переменные yt). Однако не при любой за- замене A7) канонические уравнения сохранят свой вид. Посмотрим, какие условия нужно наложить на функции A7) для того, чтобы в новых переменных уравнения Эйлера снова имели канонический вид, т. е. чтобы эти новые переменные удовлетворяли уравнениям dYi_dH dPi _ дН dx — dPt* ~dx~ — ~~Wi> где H=H(x, Yt, Pt) — некоторая новая функция. Те преобразова- преобразования вида A7), которые сохраняют канонический вид уравнений Эйлера, называются каноническими преобразованиями. Для нахо- нахождения канонических преобразований воспользуемся тем, что кано- канонические уравнения dyl_dH_ dpL__dH_ dx dpi ' dx ~ dyt представляют собой уравнения Эйлера для функционала ь . Pi) = / (S piy'i - н)dx' B0) а в котором рь и yt рассматриваются как 2п независимых функций. Мы хотим, чтобы новые переменные Уь и Pt удовлетворяли уравне- уравнениям A8) с некоторой функцией Я. Напишем тот функционал, для которого уравнения A8) служат уравнениями Эйлера. Это будет J\Yt. Pt\= $^PiY\ — H)dx. B1) Здесь Y{ и Pt — функции от х, р{ и yh определяемые равенст- равенствами A7), а У\ — производная от УУ, таким образом, функционалы B0) и B1) представляют собой две различные вариационные задачи для одних и тех же переменных yit pt. Мы требуем, чтобы новая система A8) получалась бы из старой системы A9) некоторой заменой переменных, т. е. была бы ей экви- эквивалентна. Это равносильно требованию эквивалентности между ва- вариационными задачами B1) и B0). В гл. II (см. замечание в конце § 7) было показано, что две вариационные задачи эквивалентны (т. е. имеют одни и те же экстремали), если подынтегральные выражения в соот- соответствующих функционалах отличаются друг от друга на некоторый
78 КАНОНИЧЕСКИЙ ВИД УРАВНЕНИЙ ЭЙЛЕРА [ГЛ. IV полный дифференциал, т. е. если п п 2 Pidyt — Hdx=^PidYt — ЙAх-\-AФ(х, yh pt\ B2) i=1 i=\ где Ф — некоторая функция. Таким образом, если преобразование A7) переменных х, yh pt в пе- переменные х, У 1% Рь таково, что существует функция Ф, удовлетворяю- удовлетворяющая условию B2), то преобразование A7) каноническое. Определяе- Определяемая *) условием B2) функция Ф называется производящей функцией данного канонического преобразования. Покажем, что название «производящая функция» здесь действи- действительно оправдано; а именно покажем, что по заданной производящей функции Ф можно найти соответствующее каноническое преобразо- преобразование. Для этого перепишем равенство B2) в виде </Ф = 2 pt dyt — 2 Pt dYt + (#—#)dx, откуда получаем**) дФ D дФ м и \дФ Но это и есть соответствующее каноническое преобразование. Дей- Действительно, 2^+1 равенств B3) устанавливают связь между пере- переменными (yt, Pi) и (Yh Pt), а также дают выражение для новой функции Гамильтона Н. Очевидно, что условие B2) при этом вы- выполнено, т. е. преобразование B3) действительно каноническое. Мы считали, что производящая функция задана как функция ста- старых координат yh новых координат Уt и переменной х, т. е. ф = ф(у., уi% x). Может оказаться удобным выразить производящую функцию не через yt и Уt, а, например, через yt и Pt. Для этого перепишем соотношение B2) в виде d (Ф + 2 PtYi) = 2 Pi dyt + yEiyt dPt + (Я- Н) dx. Выражение Ф + 2^^/ (представленное как функция переменных х, yt и Pt) и будет новой производящей функцией. Обозначив ее W(x, yh Pt), мы можем записать соответствующее ей каноническое преобразование в виде *) Как известно, функция определяется по ее полному дифференциалу однозначно с точностью до постоянного слагаемого; следовательно, если при заданном преобразовании A7) функция Ф, удовлетворяющая условию B2), существует, то она единственна с точностью до постоянного слагаемого. **) Ф есть функция от xiy yi, p-t. Мы можем, однако, пользуясь равенст- равенствами A7), преобразовать ее к переменным х, у^ У^
§ 16] ТЕОРЕМА НЕТЕР 79 Если производящая функция канонического преобразования не зависит от времени, то Й=?Н, т. е. в этом случае для получения новой функции Гамильтона достаточно в Н подставить вместо yt и рь их выражения через Vi и Рь. Задача. Проверить, что замена Yi = ph Pt = yt является канониче- каноническим преобразованием. Написать соответствующую производящую функцию. ь § 16. Связь между инвариантностью интеграла Г F dx а и первыми интегралами уравнений Эйлера (теорема Нетер) В § 14 мы установили, что система уравнений Эйлера, отвечаю- отвечающая функционалу ь F{?t.yfydx (О а (F не зависит от х явно), имеет первый интеграл Тот факт, что F не зависит от х явно, равносилен, очевидно, сле- следующему: если ввести новое переменное jc*. положив х* = х + а, B) то функция Ft a следовательно, и интеграл A) при этом не изме- изменятся. Таким образом, Н является первым интегралом системы урав- h нений Эйлера в том и только том случае *), если функционал I F dx а не меняется при преобразовании B). Мы покажем сейчас, что связь между первыми интегралами си- системы уравнений Эйлера и инвариантностью соответствующего функ- функционала относительно некоторых определенных преобразований пере- переменных х и ух уп существует и в общем случае. Уточним прежде всего само понятие инвариантности функционала относительно той или иной совокупности преобразований. *) Что Н будет первым интегралом только в том случае, видно из j т г A F-t /) f-f формулы —т— = -з—» полученной в § 14, так как -^— = 0# лишь если
80 КАНОНИЧЕСКИЙ ВИД УРАВНЕНИЙ ЭЙЛЕРА [ГЛ. IV Пусть дан функционал ь а Рассмотрим некоторое преобразование *• = %(*. У1. .... У„). 1 У1 = Ъ(Х- Уг Уп) 1 точек п-\- 1-мерного пространства. Это преобразование переводит некоторую кривую т» заданную уравнениями в другую кривую т*« уравнения которой можно получить, под- подставив в равенства C), связывающие х, у. с л:*, у* вместо y[t ... уп функции 7]j(л;), ..., ^я(^), задающие уравнения кривой f» и исклю- исключив х из полученных таким образом п -f-1 равенств. В результате этой операции мы получим п уравнений вида ; которые и будут уравнениями кривой у*. Функционал J [у] мы назо- назовем инвариантным относительно данного преобразования, если т. е. Приведем простейшие примеры. 1. Функционал a инвариантен относительно преобразования Действительно, если кривая f задана уравнением у = 7j (х) {а < х < Ь),
§ 16] XE0PEMA HETEP 81 то преобразованная кривая y* задается уравнением у* = 7] (X* — С) = 7]* (**) (а < Jt* — С < Ь). Имеем Ь+с Ь+с а+с а + с 2. Интеграл может служить примером функционала, не инвариантного относи- относительно преобразования D). Посмотрим, как он меняется при приме- применении к нему этого преобразования. Проведя те же выкладки, что и в предыдущем примере, получим Ъ+с Ь+с = f ,(*ур}„- f а+с Пусть теперь имеется совокупность обратимых преобразований переменных х, ух, ..., уя, зависящая от некоторого параметра а: ^''--'^а)' (,= 1.2 п). E) причем функции сро и ?/ дифференцируемы, а значению сс = О отве- отвечает тождественное преобразование, т. е. <Ро(*. У1. •••• Ул» О) = аг, Л ?/(*. Ур •••• Уя. 0)зЛ. Имеет место следующая Теорема (Нетер). Каждому преобразованию вида E), оста- оставляющему интеграл A) инвариантным, отвечает некоторый пер- первый интеграл системы уравнений Эйлера. Явный вид этого первого интеграла будет указан ниже,
82 КАНОНИЧЕСКИЙ ВИД УРАВНЕНИЙ ЭЙЛЕРА [ГЛ. IV Доказательство этой теоремы частного случая преобразований вида х* = х, у! = ?/(*. у,. .... мы проведем сейчас для E') (Доказательство теоремы Нетер в общем случае, в том числе и для функционалов, содержащих несколько независимых переменных, будет дано в гл. VII. Заметим, что для нескольких независимых перемен- переменных сама формулировка этой теоремы несколько изменяется.) Считая величину а бесконечно малой, имеем У* — Уь = Положим т. е. ¦*> Уь «) да Считая, что кривая, определяемая уравнениями есть экстремаль, напишем выражение для вариации функционала A), отвечающее переходу от yt к У/Ч-а^. Воспользуемся полученной в § 11 формулой A1) для вариации. Учтя, что в нашем случае х не вариируется, т. е. Ъх0 = Ьхг = 0, a byt = atylt получаем *): Так как по условию функционал A) инвариантен относительно преобразования E), то вариация bJ этого функционала, отвечающая 8y/==a<]>?, равна нулю. Приравнивая §У нулю, получаем т. е. *) Здесь мы под Ъу; понимаем главную линейную относительно а часть приращения yit а не само это приращение (как было выше). Легко видеть, что это не оказывает влияния на результат, hq зато сразу избавляет нас дт возни с малыми высших порядков.
§ 16] tEOPEMA HETEP 83 Так как это справедливо для любых двух точек х0 и xv то это означает, что вдоль каждой экстремали n 2^;*/ = const, F) т. е. n *. Уь a) = const. cc = 0 Итак, мы построили по заданному преобразованию C), оставляю- оставляющему инвариантным функционал A), выражение, сохраняющее постоян- постоянное значение вдоль каждой экстремали, т. е. построили некоторый первый интеграл системы уравнений Эйлера. Теорема доказана. Посмотрим, что дает нам теорема Нетер в уже знакомом нам случае, когда подынтегральная функция F не зависит от х явно. Независимость F от х означает, что интеграл A) инвариантен относительно преобразования х* = х-\-а, Действительно, оно переводит интеграл . Уi* yfi)dx f Ъ a, у., y't)dx. Эти два интеграла равны между собой для произвольного интервала (а, Ь) в том и только том случае, если F не зависит от х явно. Вычислив вариацию функционала A), отвечающую преобразованию G), получим Приравнивая это выражение нулю и рассматривая его лишь на кривых, удовлетворяющих уравнениям Эйлера, получаем вдоль интегральной кривой. Таким образом, мы снова получаем уже установленный в § 13 результат: для функционалов, не зависящих от времени явно, функция Н представляет собой первый инте- интеграл соответствующей системы уравнений Эйлера,
84 КАНОНИЧЕСКИЙ ВИД УРАВНЕНИЙ ЭЙЛЕРА [ГЛ. IV § 17. Принцип наименьшего действия Рассмотрим некоторые применения полученных в предыдущих параграфах общих результатов к задачам механики. Пусть нам дана некоторая система материальных точек с массами т1% т2, .... тп и координатами xi% yh zt (/= 1, 2, ..., а). Будем предполагать при этом, что никаких связей на рассматриваемую систему не наложено. Кинетическая энергия такой системы равна Предположим также, что система обладает потенциальной энер- энергией, т. е. что существует такая функция *) U=U(t. xi9 yitZl). B) что компоненты силы, действующей на /-ю точку, равны Положим L=T—U. C) Это выражение мы будем называть функцией Лагранжа рассматри- рассматриваемой механической системы. L представляет собой, очевидно, функ- функцию от координат и скоростей частиц, составляющих рассматриваемую систему, и времени. Пусть в момент времени tQ система находится в некотором фикси- фиксированном положении. Эволюция рассматриваемой системы с течением времени описывается некоторой кривой в 3/г-мерном пространстве, определяемой уравнениями *i = xt (О, У/ = У/ @, */ = г% @ (/=1,2 я). Среди всех кривых, проходящих через начальную точку, та, которая описывает фактическое движение рассматриваемой системы под влия- влиянием ^действующих на нее сил, удовлетворяет следующему условию, называемому принципом наименьшего действия: Движение системы за промежуток времени (tQt tj описывается теми функциями xt(t)t у ДО» ^ДО» /= 1. 2, ..., п% которые дают минимум интегралу к 'Ldt. t0 Сам интеграл D) называется действием. • *) Здесь t означает время, а точка — дифференцирование по t.
§ 18] ЗАКОНЫ СОХРАНЕНИЯ 85 Покажем, что этот принцип эквивалентен обычным уравнениям движения системы п точек. Если функционал D) достигает минимума, то должны удовле- удовлетворяться уравнения Эйлера dL d dL dt dxi dL d dL _Q dyt dt dL d dL _Q (/=1. 2 n). E) dz-t dt dzt Принимая во внимание, что потенциальная энергия U зависит только от xh ylt zt (и не зависит от xit yl% zt), a T представляет собой сумму квадратов скоростей с коэффициентами -~- , мы можем переписать уравнения E) в виде dU d • ' -^Ti--dtmixi = ^ dU _ dU dU dU * M Так как производные g—, g—, g— представляют собой компоненты силы, действующей на /-ю частицу, окончательно получаем mlxi = Xi% myt = Yit mzt = Zh а это и есть обычные уравнения движения для системы из п сво- свободных материальных точек. Принцип наименьшего действия справедлив и в том случае, когда на рассматриваемую систему наложены некоторые связи. В этом слу- случае допустимые кривые, на которых рассматривается функционал D), должны удовлетворять наложенным связям, т. е. применение прин- принципа наименьшего действия к системе со связями, приводит к вариа- вариационной задаче на условный экстремум. § 18. Законы сохранения Рассмотрим снова механическую систему из п материальных точек с кинетической энергией
86 КАНОНИЧЕСКИЙ ВИД УРАВНЕНИЙ ЭЙЛЕРА [ГЛ. IV потенциальной энергией U=U(t. xh yit zt) B) и функцией Лагранжа L=T—U. C) Как было показано в предыдущем параграфе, уравнения движения этой системы могут быть получены из принципа наименьшего дей- действия, т. е. из условия минимума интеграла f(T—U)dt. D) to Посмотрим, что представляют собой для этого интеграла канони- канонические переменные (см. § 14). Для нашего случая имеем ; dL , dL • , dL р=тх pmy pmZ т. е. р1х, pl. plz представляют собой компоненты импульса /-й ча- чах, p. стицы, и 2(ipx т. е. Н есть полная энергия системы. Замечание. Утверждение, что Н есть полная энергия, будет справедливо и в том случае, если мы вместо декартовых координат введем обобщенные координаты q{ (докажите это). Выражения —:— dqi в этом случае называются обобщенными импульсами системы (они, конечно, отличаются от обычных импульсов). Пользуясь видом подынтегральной функции в функционале D), мы можем найти те или иные функции, сохраняющие постоянные значения вдоль каждой из траекторий системы, т. е. получим так называемые законы сохранения. 1. Закон сохранения энергии. Пусть рассматриваемая система консервативна, т. е. ее функция Лагранжа L не зависит явно от времени (это означает, что U не зависит от времени). В этом случае, как было показано выше, Н= const вдоль каждой экстре- экстремали, т. е. полная энергия консервативной системы остается при движении постоянной. 2. Закон сохранения импульса. Пусть L не меняется при параллельном переносе, т. е. при замене xv yt, zt на
§ 18] ЗАКОНЫ СОХРАНЕНИЯ 87 xi~\~a> У/ ¦+¦*. &1-\-с соответственно. Согласно теореме Нетер (§ 16) из инвариантности интеграла J F(x* У г y'i) относительно преобразования х* = х, У* = ?,.(*, уЛ. а) следует, что соответствующая система уравнений Эйлера имеет пер- первый интеграл где Поэтому из инвариантности интеграла D) относительно преобразования следует, что п п l — \ I s= 1 Аналогично из инвариантности D) относительно сдвига вдоль оси у следует, что п 2 Ру = const, а из инвариантности D) относительно сдвига вдоль оси г следует, что п 2 Plz = COnst. Вектор Р с компонентами называется полным импульсом системы. Итак, мы показали, что если интеграл jLdt
88 КАНОНИЧЕСКИЙ ВИД УРАВНЕНИЙ ЭЙЛЕРА [ГЛ. IV инвариантен относительно параллельного переноса, то полный импульс' системы не меняется с течением времени. Это и есть закон сохра- сохранения импульса. Замечание. Инвариантность Г L dt относительно сдвига в каком- либо одном направлении (например, в направлении оси х) влечет за собой, как видно из сказанного выше, сохранение соответствующей компоненты полного импульса системы. 3. Закон сохранения момента количества движе- движения. Предположим, что ;¦ Ldt инвариантен относительно вращения вокруг оси zy т. е. относительно следующего преобразования координат: x. = xt cos a -+- yt sin a, y* = — xt sin a -|- У/ cos a, Воспользуемся снова теоремой Нетер. В данном случае дх\ ua a=0 Таким образом, из теоремы Нетер вытекает, что т. е. 2(^ — ^) = const. E) В этой сумме каждое слагаемое представляет собой z-ю компоненту векторного произведения \pl% rj, где^г^ = (xlt yt, zj) — радиус-вектор, a pl = (р^, р^ р1^ — импульс /-й частицы. Вектор [р1, г1] называется моментом количества движения /-й частицы относительно начала координат. Равенство E) означает, что сумма 2-х компонент моментов количества движения отдельных частиц, т. е. 2-я компонента момента количества движения всей системы, есть постоянная величина. Аналогичные утверждения верны и для х- и у-компонент при условии, что Г Ldt инвариантен относительно вращений вокруг соответствующих осей.
§ 19] УРАВНЕНИЕ ГАМИЛЬТОНА — ЯКОБИ. ТЕОРЕМА ЯКОБИ 89 Итак, если \ Ldt инвариантен относительно вращений, то момент количества движения системы с течением времени не меняется. Примеры. 1. Рассмотрим движение материальной точки, при- притягивающейся по некоторому закону неподвижным центром. В этом случае имеют место закон сохранения энергии (так как L не зависит явно от времени) и закон сохранения момента количества движения. Импульс при таком движении не сохраняется. 2. Материальная точка притягивается однородной материальной прямой (которую примем за ось z). В этом случае сохраняются следующие величины: а) энергия (так как L не зависит от времени), б) компонента импульса в направлении оси z% в) момент количества движения относительно оси z. § 19. Уравнение Гамильтона — Якоби. Теорема Якоби Рассмотрим функционал ь J=fF(x,y.,y'i)dx, A) а определенный на кривых, лежащих в некоторой области G, и пред- предположим, что через любые две точки Л, В из G проходит одна и только одна экстремаль функционала A). Величину 1 S= fF(x, у., y\)dx. B) а где интеграл берется вдоль экстремали, соединяющей точки А = (jc0, y°v ..., у°) и В = (Xj, yj, . .., у?), назовем геодезическим расстоянием между этими точками. 5 представляет собой, очевидно, однозначную функцию координат точек Л и В. Рассмотрим простейшие примеры. 1. Пусть функционал J означает длину кривой, тогда 5 — рас- расстояние (в обычном смысле) между А и В. 2. Рассмотрим процесс распространения света в неоднородной среде. Скорость света в каждой точке предполагается зависящей от координат точки и от направления v = v(x, у, г% х, у, z). Время, в течение которого свет идет вдоль некоторой кривой от точки А до точки В, равно '= ;,-^-^- C)
90 КАНОНИЧЕСКИЙ ВИД УРАВНЕНИЙ ЭЙЛЕРА [ГЛ. IV Согласно принципу Ферма свет распространяется во всякой среде' вдоль той кривой, для которой время его прохождения является наименьшим, т. е. вдоль экстремали функционала C). Итак, в случае функционала C) 5 есть время распространения света из точки А в точку В. 3. Рассмотрим механическую систему с некоторой функцией Лагранжа L. Интеграл взятый вдоль экстремали, проходящей через заданные точки А и В, представляет собой согласно сказанному в § 17 действие, отвечаю- отвечающее переходу рассматриваемой системы из одного состояния в другое. Будем считать начальную точку А фиксированной, а точку В переменной. Тогда 5 будет представлять собой в области G одно- однозначную функцию S = S(x, уг уп) координат точки В. Выведем дифференциальное уравнение, которому удовлетворяет функция S(x, ylt ..., уп). Вычислим с этой целью ее частные про- производные dS dS /. 1 о ч ¦SF и <Ъ7 (| = 1' 2 п)' Для этого найдем полный дифференциал функции 5, т. е. главную* линейную часть приращения &S = S(x-{-dx, yi~\-dylt ..., yn-{-dyn) — S(x, ylt ..., yn). Но Д5 есть, по определению, разность где 7 — экстремаль, идущая из Л в точку (х, yv ..., уп), a f— экстремаль, идущая в точку (x-\-dx, yi~\~dyl yn~\~dyn), и следовательно, dS = hJ, где за начальную кривую берется экстремаль f, а начальная точка А остается неподвижной *). Воспользовавшись выведенной в § 11 формулой для вариации A2), получаем dS(x. уг yn) = bJ=^pibyi (все величины берутся в точке В). *) То обстоятельство, что провариированная кривая i тоже является экстремалью, здесь не существенно.
§ 19] УРАВНЕНИЕ ГАМИЛЬТОНА —ЯКОБИ. ТЕОРЕМА ЯКОБИ 91 Следовательно, ? = -". Dа) где под Pi = Pt(x* У11 • ••» Уп) понимается выражение F ' в кото- котором у'. — значение производной -— в точке В для идущей из А в В экстремали, и Н=Н(х, yj, ..., ул, ^(л:, у! уп) рп(х, уг уп)) тоже является функцией от ху ух> ..., уп. Из равенств Dа) и D6) получаем, что 5 как функция от коор- координат точки В удовлетворяет уравнению дх E) Это уравнение в частных производных (вообще говоря, нелинейное) называется уравнением Гамильтона — Якоби. Существует тесная связь между уравнением Гамильтона — Якоби и каноническими уравнениями Эйлера. Именно эти канонические уравнения представляют собой так называемую характеристическую систему для уравнения E) *). Мы рассмотрим этот вопрос с несколько иной точки зрения, а именно выясним связь между решениями уравнения Гамильтона — Якоби и первыми интегралами системы уравнений Эйлера. Теорема 1. Пусть 5 = 5(лг, yv ..., уп, av .... ak) — не- некоторое решение уравнения Гамильтона — Якоби, зависящее от параметров ах, ..., ak. Тогда каждая из производных Ц ('=». 2 *) является первым интегралом системы уравнений Эйлера dy_t _ дН_ dPi _ дН dx dpi * dx dyi ' т. е. -Р- = const вдоль каждой экстремали. *) По этому поводу см., например, Т р и к о м и, Лекции по уравнениям в частных производных.
92 КАНОНИЧЕСКИЙ ВИД УРАВНЕНИЙ ЭЙЛЕРА [ГЛ. IV Доказательство. Нам нужно показать, что вдоль каждой экстремали dx \ dat) ~ и# Вычислим эту производную. Имеем d (dS\_ d2S . у d*S <*У1 f~ dx \ dat) дх дач ~*~ Lk dyj dat' dx ' K } Далее, подставив 5(x% ylf ..., yn, alt ..., afe) в уравнение Гамильтона — Якоби и продифференцировав полученное равенство по ait находим d2S _ у _ дх д<*1 **L dpi Подставляя это выражение в F), получаем п п d / dS\ у dH d2S . VI d2S "У] +dx \ dai ) jmJ dpj dyj da-i ' *U dyj dai dx ~ 2u dyj doLt \dx ~dpj) ' dyj dH Так как —z -5—==0 вдоль экстремалей, то действительно dx на каждой экстремали. Теорема доказана. Если нам известен полный интеграл уравнения Гамильтона — Якоби, т. е. его решение S = S(x, yv ..., уп, аг ап), зависящее от п параметров, то мы можем согласно сказанному выше написать п первых интегралов ¦д|=Р, (/=1,2 я), G) канонической системы уравнений Эйлера, которых, вообще говоря, достаточно для получения общего решения канонической системы D). Действительно, пусть эти первые интегралы независимы, т. е. детер- детерминант матрицы, составленной из производных, d2S dat dyk
§ 19] УРАВНЕНИЕ ГАМИЛЬТОНА ЯКОБИ. ТЕОРЕМА ЯКОБИ 93 отличен от нуля. Тогда из соотношений G) мы можем определить функции положив затем A = fy;sC*' У1 Уя. ai «„)• мы получим общее решение канонической системы ?yi__dH_ dpi _ дЯ dx "~ д/^ ' дл: ду/ Итак, мы получили следующий результат. Теорема 2 (Якоби). Пусть S = S(x, уг уп, aY ап) — полный интеграл уравнения Гамильтона — Якоби dS . г., dS dS\ л -з \-H(xt Vi, .... У„, з—, .... -л—1=0 ^ пусть детерминант матрицы отличен от нуля. Пусть, наконец, pi р» — /г произвольных постоянных. Тогда функции yi = yi(xi <xlf ..., ая, р1§ ..., р определяемые соотношениями dS(x, yb ..., у^, alt ...t ая) R 1 О вместе с функциями > аг Ру). ал образуют общее решение канонической системы dyL_dH_ dPi _ дН dx dpi ' dx dyi ' Приведем еще одно доказательство теоремы Якоби, основанное на использовании канонических преобразований. Пусть S = S(t, у, уп. аг ая)
94 КАНОНИЧЕСКИЙ ВИД УРАВНЕНИЙ ЭЙЛЕРА [ГЛ. IV — полный интеграл уравнения Гамильтона — Якоби. Сделаем в уравне- уравнениях dyl_dH_ dpi _ дН dx dpi * dx dyi каноническое преобразование, приняв функцию S(tt yit at) за произ- производящую функцию, a oclf ..., ап — за новые импульсы. Пусть Plt ..., рл — новые координаты. Тогда в силу формул B4) § 15 имеем „ dS Q dS ?% гт - dS ^l dyi Vi dat ' ' dx # Но поскольку функция S удовлетворяет уравнению Гамильтона — Якоби, имеем дх Поэтому для новых переменных канонические уравнения имеют вид ^L — 0 d$i —о dx ~Vt dx ~Vt откуда af. = const, j^ = const вдоль каждой экстремали. Мы снова получили те же самые п первых интегралов системы уравнений Эйлера. Если из них определить yv ..., уп как функции от t и-от 2п параметров alf .... ал, рх рл и, как и выше, положить то мы получим 2п функций yd*. ai a«» Pi» •••> P«). pt{x, av .... an; p1§ ..., рл), которые образуют общее решение канонической системы dyL_dH_ dpj _ дН dx dpi ' dx dyi *
ГЛАВА V ВТОРАЯ ВАРИАЦИЯ. ДОСТАТОЧНЫЕ УСЛОВИЯ СЛАБОГО ЭКСТРЕМУМА До сих пор, рассматривая задачу о нахождении экстремума функ- функционала, мы занимались лишь необходимым условием экстремума, состоящим в том, что вариация функционала на экстремальной кривой обращается в нуль. В этой главе будут изложены достаточные условия слабого экстремума функционалов. Для нахождения достаточных условий экстремума нам нужно будет ввести понятие второй вариации функционала и изучить ее свойства. Одновременно мы установим и некоторые новые необхо- необходимые условия экстремума. Как будет видно из дальнейшего изложения, существуют удобные для применения достаточные условия экстремума, весьма близкие к необходимым. Достаточные условия экстремума функционалов, излагаемые ниже, отличаются от приводимых в этой же главе необ- необходимых примерно так же, как достаточные условия у' — О, у" > О экстремума для функций отличаются от соответствующих необходи- необходимых условий у! = 0, у" ^> 0. § 20. Квадратичные функционалы. Вторая вариация функционала Введем некоторые необходимые для дальнейшего изложения общие понятия. Функционал Лх. у], зависящий от двух элементов х и у (принадлежащих некоторому линейному пространству) называется билинейным, если при фикси- фиксированном х он представляет собой линейный функционал от у, а при фиксированном у — линейный функционал от х. Таким образом, функционал J[xt у] билинеен, если 2, у].
96 ВТОРАЯ ВАРИАЦИЯ. ДОСТАТОЧНЫЕ УСЛОВИЯ СЛАБОГО ЭКСТРЕМУМА [ГЛ. V Полагая в билинейном функционале у = х, получаем выражение, назы- называемое квадратичным функционалом. Билинейный функционал в конечномерном пространстве называется билинейной формой. Каждая билинейная форма А(х, у) может быть п записана в виде 2 а1^1Ъ> где ^i» ^2 ?л и Ъ» Ъ 'Чп — j, k=i координаты векторов х и у в некотором базисе. Полагая здесь п у = х, получим квадратичную форму А(х, х)= 2 aufifik- i,k=l Квадратичный функционал J[x, x] называется положительно опре- определенным, если J[x, х] > 0 для любого ненулевого элемента х. Примеры. 1. Выражение ь fx(t)y(t)dt а представляет собой билинейный функционал, а ь x2(t)dt а — квадратичный функционал в пространстве С[а> Ь\ • • Более общим примером билинейного функционала является ь Лх, y] = f A(t)x(t)y(t)dt, а где A(t) — фиксированная функция. Если Л@>0 при всех t, , то соответствующий квадратичный функционал J A(t)x2{t)dt будет положительно определенным. 2. Выражение ь f [а (о х' (о + в (о х @ *' @ + с @ л-'2 a)] at а представляет собой- пример квадратичного функционала, определен- определенного для всех функций из пространства Dv 3. Интеграл ъ ъ f f K(st t)x(s)y(t)dsdtt
§ 20] КВАДРАТИЧНЫЕ ФУНКЦИОНАЛЫ. ВТОРАЯ ВАРИАЦИЯ ФУНКЦИОНАЛА 97 где К(s, t) — фиксированная функция двух переменных, является билинейным функционалом в C[ufb]. Заменив здесь y{t) на x(t), получим квадратичный функционал. Введем теперь понятие второй вариации (второго дифференциала) функционала. Пусть J[y]— функционал, определенный в каком-либо линейном нормированном пространстве /?. В гл. I мы назвали функционал У [у] дифференцируемым, если его приращение можно представить в виде где lx{h) — линейный функционал и а->0 при ||А||->0. Величину lx{h) — главную линейную часть приращения функционала J[у] — мы назвали дифференциалом (вариацией) этого функционала и обозна- обозначили bj[h]. Мы скажем, что функционал J[y] имеет вторую вариацию, если его приращение можно записать в виде ДУ = /1(А) + /2(А) + р||А||2, A) где 1Х(Н) — линейный функционал (вариация), /2(/г)— квадратичный функционал, а р->0 при ||А||->0. Квадратичный функционал I2(h) мы будем называть второй вариацией (вторым дифференциалом) функционала J[y] и обозначать 82У[А]. В дальнейшем мы будем пред- предполагать у рассматриваемых функционалов существование второй вариации, не оговаривая это особо. Вторая вариация функционала (если она существует) определяется однозначно. Это доказывается в точности так же, как и однозначность первой вариации (§ 3). Легко доказывается следующая Теорема 1. Для того чтобы функционал J[y] при у = у0 имел минимум {максимум), необходимо, чтобы при у = у0 выпол- выполнялось условие V0 (< B) для всех допустимых h. Действительно, в точке экстремума 8У[/г] = 0, поэтому если 82/[Н]ф0, то при достаточно малом ||А|| знак выражения будет совпадать со знаком 82У[/г]. Пусть 82У[А0] < 0 при некотором Ао. Тогда при любом е Ф 0 имеем
98 ВТОРАЯ ВАРИАЦИЯ. ДОСТАТОЧНЫЕ УСЛОВИЯ СЛАБОГО ЭКСТРЕМУМА [ГЛ. V и следовательно, ДУ = J [у0 -\- eh0] — J [у0] < 0 при достаточно малом е, т. е. при у = у0 минимума нет. Аналогичные рассуждения проводятся и в случае максимума. Неотрицательность второй вариации необходима, но, конечно, не доста- достаточна для того, чтобы функционал J [у] достигал на данной кривой мини- минимума. Для получения достаточного условия минимума введем следующее понятие. Мы скажем, что квадратичный функционал /2 (/г), заданный в неко- некотором нормированном пространстве, сильно положителен, если существует такое постоянное k > О, что I2(h)>k\\h\\* для всех h. Теорема 2. Для того чтобы функционал J [у], определенный в нормированном пространстве Е, имел в точке у = у0, в которой bj = 0, минимум, достаточно, чтобы при у = у0 его вторая вариация была сильно положительна, т. е. чтобы выполнялось условие b2J[h]>k\\h\\\ C) где k = const > 0 *). Действительно, выберем ? настолько малым, чтобы при || h || < г вели- величина р в равенстве A) удовлетворяла условию IP | < -^. Тогда ^ >0 при т. е. имеет место минимум. § 21. Формула для второй вариации. Условие Лежандра Найдем явное выражение второй вариации в случае простейшей задачи, т. е. для функционала ь W = JF{x.y,ridx, A) а определенного на кривых у(х) с закрепленными концами у(а) = А, уф) = В. B) Дадим функции у(х) приращение h (x), удовлетворяющее условиям h{a) = h (b) = 0. *) В конечномерном пространстве сильная положительность квадратич- квадратичной формы равносильна просто ее положительной определенности. Поэтому функция конечного числа переменных имеет минимум (в точке, где первый дифференциал равен нулю), если в этой точке ее второй дифференциал положителен. В общем случае сильная положительность есть условие более сильное, чем положительная определенность.
§ 21] ФОРМУЛА ДЛЯ ВТОРОЙ ВАРИАЦИИ. УСЛОВИЕ ЛЕЖАНДРА 99 Воспользовавшись формулой Тейлора, мы можем представить при- приращение функционала J[y] в следующем виде: ь j [у + hj _ j [у] = j {Fyh + /уh') dx + A2 + 2/VAA' 2) rf где и аналогично определяются Fyy> и /^у'у'. Заменив Fyyt Fyy* и Fy'y' производными Fyyt Fyy>t Fy>yrt взятыми в точке (лг, у{х), yf (x))t запишем АУ в виде + ¦§• / (^уу А2 + 2Fyrhh' + fy'y A/2) d^ -f s. C) Величина е может быть представлена как + esh'*)dx; C') из непрерывности производных Fyy9 Fyy>, Fy'y> следует, что ei» е2» 8з"^^ ПРИ IIА|| "^ 0, откуда видно, что е есть бесконечно малая высшего порядка по сравнению с fl/гЦ2. Первое из стоящих в C) справа выражений есть &У[/г], а второе — квадратичное относи- относительно h — представляет собой Ъ2)щ, т. е. вторую вариацию. Таким образом, для функционала A) имеем ъ ЪЧ [А] = 1 У" (Fyy /г2 + 2/V АА' + Fyy /г/2) dx. D) Приведем это выражение второй вариации к более удобному виду. Интегрируя по частям и учитывая, что h(a) = h(b) = 0, получаем ь ъ f 2Fyyhh' dx = — f (?. Fyy ) h?dx
100 ВТОРАЯ ВАРИАЦИЯ. ДОСТАТОЧНЫЕ УСЛОВИЯ СЛАБОГО ЭКСТРЕМУМА [ГЛ. V Следовательно, формулу D) можно переписать в виде ь ЬУ [h] = f (Q/г2 + Ph'2) dx, E) a ' где Р = у/у/. E0 Этим выражением для второй вариации мы и будем в дальнейшем пользоваться. Отметим еще следующий факт, вытекающий из формул C) и C0- Если у(х) — экстремаль и y{x)-\-h(x) — некоторая допусти- допустимая кривая, то ь ь J1У + h] — J [у] = J (Q/г2 + Ph'2) dx + J (?/г2 + т)/г'2) dx, F) а а где |?|->0 и |т)|->0 при ||й||->0. Действительно, так как у(х)—экстремаль, то в правой части равенства C) линейные члены обращаются в нуль, а величина е, давае- ъ мая формулой C0, может быть приведена к виду Г (?/z2 -|~ y\h'2) dx а интегрированием члена e2hhf по частям с учетом граничных условий h(a) = h (b) = 0. Формулой F) мы воспользуемся в § 23 при выводе достаточных условий слабого экстремума. В предыдущем параграфе было показано, что неравенство есть необходимое условие минимума функционала J[y]. Полученная нами формула E) позволяет установить некоторые усло- условия неотрицательности второй вариации. Нахождение этих условий основано на следующих соображениях. Квадратичный функционал E) рассматривается для функций h (x), удовлетворяющих условию h(a) = Q. При этом условии, если мала производная функция k(x) на отрезке [а, Ь], то мала на этом отрезке и сама функция h (x). Обратное, однако, неверно: мы можем построить такую функцию h (x), что она сама мала, а ее производная hr {х) велика. Отсюда следует, что в квадратичном функционале E) слагаемое Ph'2 играет основную роль в том смысле, что оно может быть намного больше, чем второе слагаемое Q/г2, но не может быть намного меньше его (при Р Ф 0). Поэтому от коэффициента Р(х) в первую очередь зависит, будет ли функционал E) принимать значения только одного знака или разных. Сформулируем теперь точно соответствующее утверждение. Для того чтобы квадратичный функционал
§ 21] ФОРМУЛА ДЛЯ ВТОРОЙ ВАРИАЦИИ. УСЛОВИЕ ЛЕЖАНДРА 101 определенный на функциях h(x) таких, что h(a) = h (b) = 0 был неотрицательным, необходимо, чтобы выполнялось условие (8) Действительно, пусть (8) не выполнено, т. е. в некоторой точке х0 пусть Р(л:0)<0. Покажем, что в этом случае функционал G) при- примет при соответствующем выборе h (x) отрицательное значение. Для этого подберем h (x) так, чтобы в выражении E) основной вклад давался бы слагаемым РЬ/ , а член Qh2 был бы мал. Положим У о (\ — при х0 — о ^ х ^ х0, при хо<л;<л;о-{-с, О при всех остальных х. На интервале (х0 — о, хо-\-а) имеем При таком выборе h(x) в выражении ь ъ ЪУ [h]= j Qh2dx-\- J Ph'2 dx A0) a a остается интегрирование по отрезку [х0 — о, х0-\-о]. Если поло- положить, что с—>0, то в силу (9) первое слагаемое в правой части равенства A0) будет стремиться к нулю, а второе—к Р(х0). Но так как, по предположению, Р(л:0)<0, то мы получаем, что ь f(Ph'2 + Qh2)dx<0 а при указанном выше h(x) (и достаточно малом о). Тем самым наше утверждение доказано. Отсюда и из установленного в предыдущем параграфе необхо- необходимого условия минимума (b2J[h]^0) сразу вытекает следующая Теорема 1 (Лежандр). Для того чтобы функционал . У. y')d*
102 ВТОРАЯ ВАРИАЦИЯ. ДОСТАТОЧНЫЕ УСЛОВИЯ СЛАБОГО ЭКСТРЕМУМА [ГЛ. V достигал на кривой у = у(х) минимума,, необходимо, чтобы вдоль этой кривой выполнялось условие Fyy>0 (условие Лежандра). Лежандр пытался доказать, что выполнение строгого неравен- неравенства Fy>y> > 0 в каждой точке экстремали у(х) является достаточ- достаточным условием того, что эта экстремаль дает функционалу A) мини- минимум (слабый). Для этого он проводил следующее рассуждение. Так как h(a) — h(b) = Q, то для любой дифференцируемой функ- функции w{x) имеем ъ ь j (h2wr -f- 2hh'w) dx = f -— (h2w) dx = 0. a a Поэтому выражение для второй вариации можно переписать так: ь ЬУ [h] = j [Ph'2 + 2hh'w + (Q + w') h2] dx. a Достаточность условия Fy'y1 > 0 для минимума можно было бы доказать, если бы удалось подобрать функцию w так, чтобы выра- выражение, стоящее здесь в квадратных скобках, представляло собой полный квадрат. Это, однако, не всегда возможно (как впервые указал Лагранж). Действительно, для этого функция w должна удовлетворять уравнению Это уравнение всегда, конечно, разрешимо локально, но на доста- достаточно большом отрезке может и не иметь решения *). В том, что выполнение неравенства Fyy(x, у(х), /(*))> 0 (И) во всех точках экстремали у = ух не может быть достаточным условием того, что эта экстремаль реализует минимум функцио- функционала A), можно убедиться следующим образом. Это условие так же, как и условие Fy — 4-Fy' = °> у dx y характеризующее экстремаль, носит локальный характер, т. е. оно относится не ко всей кривой в целом, а к ее отдельным точкам. *) Например, если Р == — 1, 0 = 1, то получаем уравнение w' + 1 + -\-w2 = 0, откуда w (х) = tg (с — х). Если Ь — а > те, то на всем отрезке [а, Ь] решения не существует.
§ 22] ИССЛЕДОВАНИЕ КВАДРАТИЧНОГО ФУНКЦИОНАЛА 103 Поэтому, если условие A1) выполняется для двух каких-либо дуг ЛВ и ВС, то оно выполняется и для составленной из них кри- кривой АС. В то же время из того, что две части ЛВ и ВС некото- некоторой кривой доставляют экстремум рассматриваемому функционалу вида A), не следует, что вся кривая АС будет доставлять экстре- экстремум. Например, дуга большого круга на сфере есть кратчайшая из линий, соединяющих концы дуги, если эта дуга составляет меньше половины окружности и не будет кратчайшей (даже среди кривых, достаточно близких к ней), если она превышает полови- половину окружности. Вместе с тем всякая дуга большого круга на сфере является экстремалью функционала, представляющего собой длину кривой на сфере, и в каждой точке такой дуги выполнено, как легко проверить, для этого функционала условие F , , > 0. Следовательно, это условие (как и любой набор одних только локальных условий) не может быть достаточным для экстремума. Несмотря на то, что условие Fy>y> > 0 не обеспечивает мини- минимум, сама идея приведения подынтегрального выражения в фор- формуле для второй вариации к полному квадрату (с целью получе- получения достаточных условий экстремума) оказалась очень полезной, а дифференциальное уравнение Р (Q -J- wr) = w2, возникающее при попытке осуществить эту идею, приводит к новым необходимым условиям экстремума (уже не локальным!). Мы вернемся к этим вопросам в §§ 22 и 23. § 22. Исследование квадратичного функционала ь В § 20 уже была показана важная роль второй вариации в за- задаче о нахождении экстремума функционала. В частности, там было установлено, что если кривая у = у(х) реализует минимум некоторого функционала, то вторая вариация этого функционала неотрицательна. Для функционала ь j[y] = fF (*. у, у') dx (у (а) = А, уф) = В) A) вторая вариация представляет собой квадратичный функционал. Поэтому для дальнейшего изучения вариационной задачи A) нам нужно предварительно исследовать свойства квадратичных функ- функционалов, подобно тому, как исследование экстремумов функций нескольких переменных (в том числе нахождение достаточных
104 ВТОРАЯ ВАРИАЦИЯ. ДОСТАТОЧНЫЕ УСЛОВИЯ СЛАБОГО ЭКСТРЕМУМА [гЛ. V условий) опирается на изучение свойств квадратичных форм (второго дифференциала). Итак, будем рассматривать квадратичный функционал *) ь f(Ph'2 + Qh2)dx B) а На множестве функций, удовлетворяющих условиям h(a) = h (b) = 0. В § 21 мы показали, что для неотрицательности такого квадратич- квадратичного функционала необходимо (но не достаточно) условие В этом параграфе мы найдем условия (необходимые и достаточные), при которых квадратичный функционал B) будет положительно определен (т. е. строго положителен для всех допустимых A (x), кроме А (х) = 0). Напишем для нашего квадратичного функционала уравнение Эй- Эйлера **). Получим ^ O. (З) Это — линейное дифференциальное уравнение второго порядка. Урав- Уравнению C) и граничным условиям А (а) = А (Ь) — 0 удовлетворяет, очевидно, функция А(л;)==0. Однако оно может, вообще говоря, иметь и другие решения, удовлетворяющие тем же граничным условиям. Введем следующее важное Определение. Точка х называется сопряженной с точкой х = а, если уравнение C) имеет решение, не равное нулю тож* дественно, обращающееся в нуль при х = а и при х = х. Замечание. Если А (х)— некоторое ненулевое решение урав- уравнения C), удовлетворяющее условиям А (а) = А (Ь) = 0, то и ch (x)> где с = const Ф 0, будет таким же решением. *) Сейчас мы можем не помнить о том, что этот квадратичный функ- функционал представляет собой вторую вариацию, и рассматривать его совер- совершенно независимо. **) Не следует думать, что это делается с целью нахождения минимума функционала B). Ввиду однородности этого функционала его минимум ра- равен или 0 (в случае положительной определенности), или —оо (в против- противном случае). В последнем случае этот минимум, очевидно, из уравнения Эйлера найти нельзя. Важную роль уравнения Эйлера C) в исследовании квадратичного функционала показывает формулируемая ниже теорема 1.
§ 22] ИССЛЕДОВАНИЕ КВАДРАТИЧНОГО ФУНКЦИОНАЛА 105 Мы можем поэтому для определенности наложить на h (х) некоторое условие нормировки, например hr(a)=\ (если 1г(х)ф§ и /г(а) = О, то обязательно h1 (а) Ф 0). Это мы и будем делать в дальнейшем. Теорема 1. Если Р(х)>0 при а<л;<? и отрезок [а, Ь\ не содержит точек, сопряженных с а, то квад- квадратичный функционал ь f(Ph2-\-Qh'2)dx положительно определен для всех h(x) таких, что h(a) = h (b) = 0. Доказательство. Мы докажем положительность функционала dx (P (x) > 0), B0 если сможем привести его к виду ь гдеср(...)—некоторое выражение, не равное нулю тождественно при h(x)^0. Для этой цели добавим к выражению, стоящему под знаком интеграла B'), величину вида d (wh2), где w (x) — некоторая дифференцируемая функция. Так как ь f d(wti>)dx = 0 (в силу h(a) = h(b) = O), а то от этого значение рассматриваемого квадратичного функционала не изменится. Постараемся теперь подобрать функцию w(x) так, чтобы выражение Ph'2 + Qh2 + -^ (wh2) = (Q -Ь w') h2 + 2whhr + Я/г'2 D) стало полным квадратом. Это требование будет выполнено, если за w(x) взять какое-либо решение уравнения ') = w2, E)
106 ВТОРАЯ ВАРИАЦИЯ. ДОСТАТОЧНЫЕ УСЛОВИЯ СЛАБОГО ЭКСТРЕМУМА [ГЛ. V Действительно, при этих условиях выражение D) можно переписать в виде Итак, если уравнение E) имеет решение, определенное на всем отрезке [а, Ь], то квадратичный функционал B') может быть при- приведен к виду ь ( %fx. F) и- следовательно, он неотрицателен. Если функция h (х) обращает этот функционал в нуль, то она очевидно является его экстремалью, т. е. решением уравнения C). Вместе с тем она должна удовлетворять условию hr (х) -\- ~ h (х) = 0, откуда, положив х = а и вспомнив, что h (а) = 0, получаем h1 (a) = 0. Но, в силу теоремы единственности для дифференциальных уравне- уравнений решение C), удовлетворяющее условиям h (а) — W (а) = 0, есть тождественный нуль. Это означает, что функционал F) — по- положительно определенный. Остается показать, что при отсутствии на отрезке [а, Ъ\ сопря- сопряженных с а точек уравнение E) имеет решение, определенное на всем этом отрезке. Это уравнение представляет собой так называе- называемое уравнение Риккати. Заменой переменных его можно свести к линейному уравнению второго порядка. Действительно, положив ^> = -~Р, G) где и — новая неизвестная функция, мы получим уравнение т. е. уравнение Эйлера для функционала B'). Если на отрезке нет точек, сопряженных с а, то это уравнение имеет решение и(х), не обращающееся в нуль на отрезке [а, Ь] *), а тогда существует и определенное на всем отрезке [а, Ь] решение уравнения E), опре- определяемое формулой G). *) Если отрезок [а, Ь] не содержит точек, сопряженных с а, то, в силу непрерывности зависимости решения уравнения от начальных условий, най- найдется столь малое е > 0, что отрезок [а, Ь] не содержит точек, сопряженных с а — е. Тогда решение, удовлетворяющее начальным условиям h(a — е) = 0, h' (а — е) = 1, не обращается в нуль на отрезке [а, Ь].
§ 22] ИССЛЕДОВАНИЕ КВАДРАТИЧНОГО ФУНКЦИОНАЛА 107 Итак, если отрезок [а, Ь] не содержит точек, сопряженных с а, то функционал B0 положительно определен. Теорема доказана. Приведение квадратичного функционала к виду (б) представляет собой континуальный аналог приведения квадратичной формы к сумме квадратов. Отсутствие на отрезке [а, Ь] сопряженных точек — это аналог известных условий Сильвестра по- положительной определенности квадратичной формы. (Подробнее об этом будет сказано в § 26.) Теорема 1 представляет собой, собственно говоря, реализацию той идеи Лежандра, о которой мы упоминали на стр. 102. Покажем, что отсутствие на отрезке [а, Ь] сопряженных точек не только достаточно, но и необходимо для положительной опре- определенности функционала а Теорема 2. Если квадратичный функционал ъ f(Ph'2+Qfi2)dxt где Р(х)У>0 (а < х <^), положительно определен для всех h(x) таких, что то отрезок [а, Ь] не содержит точек, сопряженных с а. Идея доказательства состоит в следующем. Мы строим семейство положительно определенных квадратичных функционалов, зависящее от некоторого параметра tt которое при t = 1 дает наш функцио- функционал B), а при ? = 0 — простейший квадратичный функционал J /г'2 dx. для которого вообще не существует сопряженных точек. Затем мы доказываем, что при непрерывном изменении параметра t от 0 до 1 сопряженные точки на отрезке [а, Ь\ не могут возникнуть. Для доказательства нам понадобится следующая
108 ВТОРАЯ ВАРИАЦИЯ. ДОСТАТОЧНЫЕ УСЛОВИЯ СЛАБОГО ЭКСТРЕМУМА [ГЛ. V Лемма. Если функция h = h(x) удовлетворяет уравнению* — 5J С^*') + Q* = 0 и граничным условиям А (а) = A (ft) = 0, (8) то для нее ь ) Доказательство леммы непосредственно вытекает из ра- равенства ь ь которое получается интегрированием по частям с учетом (8). Перейдем теперь к доказательству теоремы. Если функционал ь \ \Ph'2-\-Qh2)dx положительно определен, то и функционал а Ъ f [{Ph>2 H- QA^) t + h'2 A - tj\ dx, (9) a очевидно, положительно определен при всех t, 0<^<;i. Рас- Рассмотрим, далее, отвечающее функционалу (9) уравнение Эйлера ~ic{ltP + (\-t)]h'}+tQh = Q, A0) и пусть h(x,t) — решение этого уравнения такое, что h(a, t) — Q, h'x(a, t)=i. Это решение представляет собой непрерывную функ- функцию параметра t. При t=\ оно переходит в решение h(x) урав- уравнения C), удовлетворяющее условиям /г(а) = 0, /г'(а)=1, а при ? = 0 — в удовлетворяющее тем же начальным условиям решение уравнения А" = 0, т. е. в функцию h-=x — а. Заметим, что если h(x0, to) = O в некоторой точке (д:0, t0), то в этой точке h'x(xQ% *ЛФ 0. Действительно, h (xt t) при каждом фиксированном t удовлетворяет уравнению A0), и если бы равенства h(xQ, to\ = Q и h'x(xQ, ^0) = 0 выполнялись одновременно, то, в силу теоремы единственности для дифференциальных уравнений, было бы h(xtt0) = 0 при всех х, а<лг<^; это же невозможно, так как по условию h'x{a% t)=\ при всех t, 0<^<^1. Допустим те- теперь, что на отрезке [а, Ь] есть точка, сопряженная с а, т. е. что функция h(x, 1) обращается в нуль в некоторой точке л:^1), лежащей внутри отрезка [а, Ь].
§ 22] ИССЛЕДОВАНИЕ КВАДРАТИЧНОГО ФУНКЦИОНАЛА 109 Рассмотрим совокупность всех точек (л;, t), удовлетворяющих условию h (х, t) = Q. Это некоторая кривая в плоскости (a:, t). Действительно, в каждой точке, в которой h (х, t) = 0, производ- производная hx(x, t) отлична от нуля и по теореме о неявных функциях, равенство h (x, t) = Q, опреде- определяет в окрестности каждой та- такой точки непрерывную функ- функцию x = x(t). На этой кривой лежит, по предположению, точ- точка xW. Но такая кривая, начав- начавшись в точке (х§\ \у. а) не может окончиться внутри пря*моугольника а ^ х <! Ъ% 0<;/^1, так как это противо- противоречило бы непрерывной зависи- зависимости решения h (x, t) от пара- параметра t\ б) не может пересечь отре- отрезок х — Ь, так как тогда мы в силу леммы получили бы противоречие с положительной опреде- определенностью функционала (9) при всех t\ в) не может пересечь сторону t—\t так как тогда при неко- некотором t мы получили бы, что h(x, t) = Q и hfx(xt t) — Q одновре- одновременно; г) не может пересечь сторону ? = 0, так как при ? = 0 уравнение сводится к Рис. 7. а соответствующим решением является функция h = x — а, которая нигде, кроме точки х = а, в нуль не обращается; д) не может пересечь сторону х = а, так как тогда при неко- . dh (x, t) л тором t было бы —^—- =0 в противоречие с предположе- дх нием. Но отсюда следует, что такой кривой вообще не существует. Наконец, точка х$ не может совпадать и с х = Ь, иначе мы полу- ъ чили бы, в силу доказанной леммы, что \ {ph'2-\- Qh2)dx = 0 для а некоторой ненулевой функции, удовлетворяющей условию /г(а) = = h ф) = 0. Но это противоречит положительной определенности нашего функционала. Теорема доказана. Теми же самыми рассуждениями, которые мы провели при доказа* тельстве теоремы 2, устанавливается следующий результат.
ПО ВТОРАЯ ВАРИАЦИЯ. ДОСТАТОЧНЫЕ УСЛОВИЯ СЛАБОГО ЭКСТРЕМУМА [ГЛ. V Теорема 2'. Если квадратичный функционал ь f{Ph'2-{-Qh2)dx (h (a) = h ф) = 0) а неотрицателен, то решение уравнения удовлетворяющее начальным условиям h (а) — 0, hf (а) = 1, не обращается в нуль ни в какой внутренней точке отрезка [а, Ь]. ь Действительно, если функционал Г\Phf2 -\-Qh2)dx неотрицате- а лен, то квадратичный функционал (9) положительно определен при всех tt кроме, может быть, t=\. Доказательство теоремы 2 при этом остается в силе, за исключением последнего абзаца (ссылка на лемму). Поэтому при условиях теоремы 2' равенство h(b) = Q не исключается. Объединив теоремы 1 и 2, мы можем сформулировать следующий окончательный результат. Для того чтобы квадратичный функционал ь f {Ph'2 + Qh2)dx (P(x) > 0 при а^х^Ь) а был положительно определен для всех h(x) таких, что h(a) = h ф) = 0, необходимо и достаточно, чтобы отрезок [а, Ь] не содержал точек, сопряженных с а. § 23. Сопряженные точки. Необходимое условие Якоби 1. Применим результаты, полученные в предыдущем параграфе для квадратичного функционала, к простейшей задаче вариационного исчисления, т. е. к исследованию функционала ь fF(x,y,y')dx A) а с граничными условиями А, уф) = В. B)
§ 23] СОПРЯЖЕННЫЕ ТОЧКИ. НЕОБХОДИМОЕ УСЛОВИЕ ЯКОБИ 111 Рассмотрим некоторую экстремаль у = у (х) этого функционала и вычислим его вторую вариацию в окрестности этой экстремали. Как было показано в § 21, вторая вариация функционала A) записывается в виде ъ а где Определение 1. Yравнение Эйлера = 0 E) квадратичного функционала C) называется уравнением Якоба исходного функционала A). Определение 2. Точка х называется сопряженной с точ- точкой х = а по отношению к функционалу A), если она сопряженна с х = а по отношению к квадратичному функционалу C), пред- представляющему собой вторую вариацию функционала A). Воспользовавшись теоремой 2' предыдущего параграфа, получаем непосредственно следующий важный результат. Теорема (необходимое условие Якоби). Для того чтобы экстремаль у = у(х) давала минимум функционалу ъ F(x,y.y')dx. f необходимо, чтобы интервал (а, Ь) не содержал точек, сопря- сопряженных с а. Доказательство. В § 20 было доказано, что неотрицатель- неотрицательность второй вариации есть необходимое условие минимума. Далее, в силу теоремы 2' § 22, если квадратичный функционал неотрицателен, то интервал (а, Ъ) не содержит точек, сопряженных с а. Из сопоставления этих двух фактов вытекает утверждение теоремы. 2. Мы определили уравнение Якоби для функционала A) как уравнение Эйлера для квадратичного функционала
112 ВТОРАЯ ВАРИАЦИЯ. ДОСТАТОЧНЫЕ УСЛОВИЯ СЛАБОГО ЭКСТРЕМУМА [ГЛ. V представляющего собой вторую вариацию. Это же уравнение можно получить и с помощью следующего рассуждения. Пусть у = у(х) — экстремаль. Выясним, какие условия нужно наложить на h (х), чтобы провариированная функция у (х) -\- h (х) тоже была экстремалью. Подставим y(x)-\-h(x) в уравнение Эйлера Воспользовавшись формулой Тейлора и учтя, что у(х)— решение уравнения Эйлера, имеем где о (h) — величина выше первого порядка малости относительно h. Отбросив о(h) и приведя слева подобные члены, получим Но это и есть уравнение Якоби, которое мы выше, пользуясь обозна- обозначениями Q Г P писали в виде Итак, уравнение Якоби — это дифференциальное уравнение, которому удовлетворяет с точностью до величин выше первого порядка малости разность между двумя бесконечно близкими экстремалями. Уравнение, которому удовлетворяет с точностью до малых выше первого порядка разность двух бесконечно близких решений неко- некоторого исходного дифференциального уравнения, называется уравне- уравнением в вариациях (для этого исходного уравнения *)). *) В общем случае уравнение в вариациях определяется следующим образом. Пусть дано некоторое дифференциальное уравнение F(x,y. /,..., У(л)> = 0 (*) и пусть у (х) и у (х) + Ьу — два его бесконечно близких решения. Подставив у (х) + Ьу в (*) вместо у (х) и воспользовавшись формулой Тейлора, получим (учтя, что у (х) удовлетворяет уравнению (*)) • = 0-
§ 23] СОПРЯЖЕННЫЕ ТОЧКИ. НЕОБХОДИМОЕ УСЛОВИЕ ЯКОБИ ИЗ Таким образом, уравнение Якоби — это уравнение в вариациях для уравнения Эйлера. Мы определили сопряженную точку (к данной точке а) как точку, в которой обращается в нуль решение уравнения Якоби, удовлетво- удовлетворяющее начальным условиям /г(а) = 0, /г'(а)=1. Теперь мы можем дать другое определение сопряженной точки. Мы выяснили, что раз- разность z (х) = у (х)— у(х) между двумя бесконечно близкими экстре- экстремалями, выходящими из одной и той же точки, удовлетворяет условию где o(z) — величина выше первого порядка малости относительно z. Отсюда видно, что у (х) — у(х) совпадает с точностью до величин выше первого порядка малости с некоторым ненулевым решением уравнения Якоби. Поэтому второе определение сопряженной точки можно сформулировать так: Точка х называется сопряженной к точке х = а, если в ней разность между данной экстремалью у (х) и произвольной близкой экстремалью у(х), выходящей из той же начальной точки, есть величина выше первого порядка малости по сравнению с || у С*)-у(*) II- Можно дать еще и третье определение сопряженной точки, а именно: Точка х называется сопряженной к точке х = а, если она есть предел точек пересечения данной экстремали у (х) близкими экстремалями у(х), выходящими из той же начальной точки, при у(х) — у(х)-+0. Покажем, что это определение действительно равносильно первым двум. Ясно, что если точка х сопряжена к а в смысле последнего определения (экстремали пересекаются), то она будет сопряженной и в первоначальном смысле. Остается проверить, что верно и обрат- обратное. Пусть у(х) — рассматриваемая экстремаль, удовлетворяющая где е обозначает остаточный член, представляющий собой величину выше первого порядка относительно Ьу и ее производных. Ограничиваясь членами первого порядка, получаем линейное дифференциальное уравнение Fy *У + Fy (W + • • • + Fy(n) (Wn) = О, называемое уравнением в вариациях. Это уравнение определяет при начальных условиях, достаточно близких к нулевым, функцию, представляющую собой главную часть разности двух бесконечно близких решений исходного уравнения (*), отвечающих бесконечно близким между собой начальным условиям.
114 ВТОРАЯ ВАРИАЦИЯ. ДОСТАТОЧНЫЕ УСЛОВИЯ СЛАБОГО ЭКСТРЕМУМА [ГЛ. V начальному условию у(а) = А и пусть уа(х)—экстремаль, выходящая из той же точки а и удовлет- удовлетворяющая условию У« (я) — У (а) = ос. Тогда уа(х) можно представить в виде F) где h(x) — решение соответствующего уравнения Якоби, удовле- удовлетворяющее условиям h (а) = 0, h' (а) = 1, a e — величина выше первого порядка малости относительно а. Пусть h(x) = 0 и пусть C==|/ ~. Ясно, что Н(х)ФО (поскольку h(x)jEO). Воспользовавшись формулой Тейлора легко проверить, что при достаточно малом а выражение У а (х)—У (*) = <*Л (х) + о (а) в точках х — р и х-\-$ принимает значения разных знаков. Так как р—^О при а->0, то это и означает, что х есть предел точек пере- пересечения экстремалей уа(х) и у(х) при а->0. Пример. Рассмотрим геодезические линии на сфере. Это — дуги больших кругов. Каждая такая дуга есть экстремаль функционала, представляющего собой длину линии на сфере. Для каждой точки М на сфере сопряженной с ней будет диаметрально противоположная точка сферы. Если данная экстремаль вместе с точкой М содержит и диаметрально противоположную ей точку М, то через точку М про- проходит любая другая экстремаль, проходящая через М (а не только бесконечно близкая к первоначальной). Это связано с тем, что сфера имеет постоянную кривизну. Положение изменится, если рассмотреть, например, близкий к сфере эллипсоид. В заключение этого параграфа приведем сводку всех установлен- установленных выше необходимых условий экстремума. Если вдоль кривой функционал ь /¦ y')dx достигает экстремума, то: 1. Кривая у — у(х) является экстремалью, т. е. удовлетворяет уравнению Эйлера (§ 4) d
§ 24] ДОСТАТОЧНЫЕ УСЛОВИЯ СЛАБОГО ЭКСТРЕМУМА 115 2. Вдоль этой кривой Fyy(x. y(x)t /(*))> О в случае минимума и /%'у'^О в случае максимума (§ 21). 3. Интервал (а, Ь) не содержит точек, сопряженных с а (§ 23). § 24. Достаточные условия слабого экстремума В этом параграфе мы сформулируем систему условий, достаточ- достаточных для того, чтобы допустимая кривая у = у (х) реализовала слабый экстремум функционала (x, у, y')dx (y(a) = A, y(b) = B). A) Эта совокупность условий состоит в следующем: 1. у = у(х) является экстремалью, т. е. удовлетворяет уравнению Эйлера ф 2. Вдоль этой кривой i-FyV(A:, у(х), (усиленное условие Лежандра). 3. Отрезок [а, Ь] не содержит точек, сопряженных с точкой х = а (усиленное условие Якоби)*). Теорема. Если допустимая кривая у = у (х) функционал! удовлетворяет условиям 1—3, то эта кривая реализует слабый минимум данного функционала. Доказательство. Если отрезок [а, Ь] не содержит точек, сопряженных с а, и если на нем P(x)>0, то, в силу непрерывности решения уравнения Якоби и функции Р(х), можно указать такой больший отрезок [а, Ь-\-е\, который также не содержит точек, со- сопряженных с а, и на котором Р(л;)>0. *) Отметим, что эти достаточные условия весьма близки к рассматри- рассматривавшимся ранее необходимым условиям (см. выше). Необходимые условия мы рассматривали по отдельности (поскольку каждое из них само по себе необходимо). Достаточные же условия следует рассматривать в совокупности, так как лишь выполнение всех их одновременно обеспечивает наличие экстремума.
116 ВТОРАЯ ВАРИАЦИЯ. ДОСТАТОЧНЫЕ УСЛОВИЯ СЛАБОГО ЭКСТРЕМУМА [ГЛ. V Рассмотрим квадратичный функционал ь ъ J (р/г' 2 _(_ Qh^ dx — a*f h'2 dx B) a и соответствующее ему уравнение Так как функция Р (х) на отрезке [а, Ь-{-е] положительна и, следо- следовательно, имеет на этом отрезке "положительную нижнюю грань и так как решение уравнения C), определяемое начальными условиями h(a) = 0, h' (а)=\, непрерывно зависит от параметра а, то при всех достаточно малых значениях а будем им(еть: 1) Р(х) — а2>0, a<x<?. 2) Решение уравнения C), определяемое начальными условиями /г(а) = 0, h'(a)=\, не обращается в нуль на полусегменте (a, b]. Как было показано в § 22 (см. теорему 1), из этих двух условий следует, что квадратичный функционал B) положительно определен при всех достаточно малых а. Иначе говоря, существует такое по- постоянное число с > 0, что ъ ь f(Ph'2+ Qh2) dx>c J h'2 dx. D) a a Из этого неравенства уже легко следует, что на рассматриваемой экстремали минимум действительно достигается. В самом деле, если у = у(х) — данная экстремаль и y(x)-\-h(x) — достаточно близкая к ней кривая, то по формуле F) § 21 ъ f dx, E) где | Е | и | т] | стремятся к нулю, равномерно на отрезке а ^ х при ||А||~>0. Далее, в силу неравенства Коши — Буняковского \2 h?(x) = I f hr dx I < (x — a) j h'2 dx < (x — a) J Л/2 </*, F) Т. С
§ 25] УСЛОВИЯ ЯКОБИ ДЛЯ ФУНКЦИОНАЛОВ ОТ НЕСКОЛЬКИХ ФУНКЦИЙ 117 Поэтому, если |$(лг)| ^е и | ч\(х)\ <Се, то ь ь fh' dx. (8) Так как е > 0 можно взять сколь угодно малым, если \\h\\ достаточно мала, то в силу D) и (8) получим ь ь при всех достаточно малых ||/z||. Таким образом, экстремаль у = у(х) действительно реализует слабый минимум (в некоторой достаточно малой окрестности этой кривой) функционала A). Теорема доказана. Итак, мы установили достаточные условия слабого экстремума в случае простейшей задачи вариационного исчисления. § 25. Условия Якоби для функционалов, зависящих от нескольких функций Понятие сопряженной точки и связанные с ним условия Якоби могут быть обобщены на тот случай, когда рассматривается функ- функционал, зависящий от нескольких функций. В этом параграфе мы изложим применительно к функционалам, зависящим от нескольких функций, те определения и факты, кото- которые в предыдущих параграфах этой главы были изложены для функ- функционалов от одной функции. Здесь мы будем широко пользоваться векторными обозначениями, в частности, рассматриваемый функционал будем записывать в виде ъ f(x, у, y')dx, A) понимая под у вектор (уг, у2 уп). В тех случаях, когда переход от одной функции к нескольким не связан с какими-либо затруднениями, мы не останавливаемся на подробностях. Вторая вариация функционала. Условие Лежандр а. Если приращение ЛУ(/г) функционала A), отвечающее переходу от у к у-\-/г, можно записать в виде где [3->0 при || А ||-> О, 1Х — линейный функционал, а /2 — квадра- квадратичный, то квадратичный функционал /2W называется второй вариацией исходного функционала A) и обозначается ЬУ
118 ВТОРАЯ ВАРИАЦИЯ. ДОСТАТОЧНЫЕ УСЛОВИЯ СЛАБОГО ЭКСТРЕМУМА [ГЛ. V {lx(ti) представляет собой при этом, очевидно, первую вариацию функционала A)). Применив формулу Тейлора, легко получаем, что при (т. е. в случае закрепленных концов) вторая вариация функционала A) имеет вид Полагая h = (hv h2 hn) и рассматривая матрицы Fyy, Fyy>, Fy'y>, составленные из производ- производных F%t , F s F r / как линейные операторы, мы можем пере- yiyk УУи yi4 F Р писать выражение C) в следующей компактной форме: rh't h')\dx. Интегрируя по частям *), приведем выражение второй вариации функционала A) к виду ь f[(Ph\ АО+ «2*. h))dxt где Р = " ^у'у'• Q =  Как и в случае одной неизвестной функции, легко проверить, что в квадратичном функционале ь f[(Ph',h') + (Qh,h)]dx D) а «основной вклад» дает член (Ph\ АО» точнее говоря, верна следую- следующая теорема: для того чтобы квадратичный функционал D) при- принимал неотрицательные значения для всех h{x) таких, что h(a) = h ф) = О, *) Легко проверить, что обычная формула интегрирования по частям справедлива для скалярных произведений.
§ 25] УСЛОВИЯ ЯКОБИ ДЛЯ ФУНКЦИОНАЛОВ ОТ НЕСКОЛЬКИХ ФУНКЦИЙ 119 необходимо, чтобы квадратичная форма \ hr) не принимала отрицательных значений. •¦. Условие Якоб и. Напишем теперь для квадратичного функ- функционала D) систему уравнений Эйлера = 1' 2 E) или, в сокращенных обозначениях, QA--?-(Я*0 = 0. Здесь Qik и Pik — элементы матриц Р и Q соответственно. Систему E) уравнений Эйлера для квадратичного функционала, представляющего собой вторую вариацию функционала A), назовем системой Якоб и этого исходного функционала. Определение 1. Пусть = {А„. А и *,„}, F) — решения системы E), удовлетворяющие соответственно начальным условиям А@(а)={0. 0 0}, Gа) й«>'(а)={0. 0 1 0} G6) (т. е. /г(/)(а) образуют строки нулевой, a hw (a) — единичной матриц). Точка х называется сопряженной с точкой х = а, если в ней обращается в нуль детерминант Ац(*) hn(x) ••• hm(x) h2l (x) h22 (x) ... h2n (x) (8) Справедлива следующая Теорема 1. Если отрезок [а, Ь] не содержит точек, сопря- сопряженных с а, и матрица Р положительно определенна, то квад- квадратичный функционал D) положительно определен. Доказательство этой теоремы проводится по тому же плану, что и доказательство теоремы 1 § 22. Пусть W — произвольная
120 ВТОРАЯ ВАРИАЦИЯ. ДОСТАТОЧНЫЕ УСЛОВИЯ СЛАБОГО ЭКСТРЕМУМА [ГЛ. V дифференцируемая матрица, удовлетворяющая условию самосопряжен- ности W* = W. Тогда ь ь ь JЪЛ-(уРН, h)dx = f(W'h, а а , а для всякого h, удовлетворяющего граничным условиям Gа). Поэтому мы можем к выражению, стоящему под знаком интеграла D), при- прибавить (W'h, h)-{-2(Wht h'\ не изменив значения этого интеграла. При этом получим ъ '. hf)-\-(Qht h)-\-2(Vrh9 h')-\-(W'h, h)]dx. (9) a Постараемся теперь подобрать матрицу W так, чтобы выражение, стоящее в (9) под знаком интеграла, стало полным квадратом. Для этого достаточно потребовать, чтобы матрица W удовлетворяла сле- следующему уравнению: ' l 09 A0) которое мы назовем «матричным уравнением Риккати». Действитель- Действительно, при этом подынтегральное выражение в (9) приводится к виду (PA', h')-\-2(Wh9 h') + {WP-lWht h), т. е. (рV 4-P~4Wh, P4*h' + P~4*Wh) (так как Р — положительно определенная симметричная матрица, то Р1/2 существует, является симметричной и положительно опреде- определенной и имеет обратную матрицу Я/г). Повторив рассуждения, про- проведенные в случае скалярной функции h (x) (стр. 106), можно пока- показать, что не может быть равно нулю при всех х, а ^ х ^ Ь, если только h ф 0. Поэтому функционал (9), а значит и D), принимающий те же значения, что и (9), положительно определенный. Наконец, если отрезок [а, Ъ\ не содержит точек, сопряженных с а, то в матричном уравнении Риккати A0) можно сделать замену, положив W = — PU'U-1. A1) Получим 0, A2)
§ 25] УСЛОВИЯ ЯКОБИ ДЛЯ ФУНКЦИОНАЛОВ ОТ НЕСКОЛЬКИХ ФУНКЦИЙ 121 Это — матричная форма системы Якоби. Решение уравнения A2), удовлетворяющее начальным условиям ?/@) = 0, U'@) = E, и есть система F) решений уравнений E) с начальными усло- условиями G). Если нет сопряженных точек, т. е. детерминант (8) не обращается в нуль на отрезке [а, Ь\, то по формуле A1) находится матрица W, с помощью которой выражение, стоящее под знаком интеграла в функционале D), приводится к сумме квадратов. Это означает положительную определенность функционала D). Теорема доказана. Теорема 2. Если квадратичный функционал J[(Ph', h') + (Qh, h)]dx, а где Р — положительно определенная симметричная матрица, положительно определен для всех h (х) таких, что h(a) = h ф) = О, то отрезок [а, Ь] не содержит точек, сопряженных с а. Доказательство этой теоремы опирается, как и в случае одной неизвестной функции, на следующую лемму: Лемма. Если (h1(x) hn(x)) — решение системы E), обращающееся в нуль в точках а и Ь, то ь [(PA'. ft') + (Q*. *)]</* = 0. J Ее справедливость вытекает из равенства ь ъ = f[(Ph'. A0 + (QA, h)\dx, получающегося интегрированием по частям с учетом граничных усло- условий для h. Далее доказательство теоремы 2 проводится следующим образом. Рассмотрим положительно определенный квадратичный функционал ь / {/[(PA'. AO + (QA. A)]+(l — t){h', АО) dx. A3) а
122 ВТОРАЯ ВАРИАЦИЯ. ДОСТАТОЧНЫЕ УСЛОВИЯ СЛАБОГО ЭКСТРЕМУМА [ГЛ. V Ему отвечает система уравнений Эйлера 0 (ft=l. 2 п\ A4) которая при t = 1 переходит в систему E), а при t = О — в си- систему Предположим, что на отрезке [а, ft] существует точка х0, сопряжен- сопряженная с а, т. е. такая, в которой обращается в нуль детерминант (8). Это равносильно тому, что найдется линейная комбинация реше- решений F), не равная нулю тождественно и обращающаяся в нуль при х = х0. Далее, предположив, что система A4) имеет ненулевое решение, обращающееся в нуль в некоторой точке (х, t), где а <С х <С.Ь, и повторяя рассуждения, проведенные при доказательстве теоремы 2 § 22, получаем, что наличие такой точки противоречит положительной определенности функционала A3). В частности, при t = 1 получаем, что нетривиальное решение системы E) не может обращаться в нуль при а < х < ft. Наконец из леммы вытекает, что при условии положительной определенности функционала D) точка ft тоже не может быть нулем какого-либо нетривиального решения системы E). Тем самым доказательство заканчивается. Те же самые рассуждения показывают, что если от функцио- функционала D) потребовать лишь неотрицательность (а не положительную определенность), то при этом ни одна из внутренних точек отрезка [а, ft] не может быть сопряженной с а. Соединив теоремы 1 и 2, получаем следующий результат. Квадра- Квадратичный функционал ъ [(PA', A')-f-(QAf h)\ dx {{Phf, A') > 0) положительно определен в том и только том случае, если отре- отрезок [а, Ь] не содержит точек, сопряженных с а. Все сказанное выше относилось к квадратичному функционалу. Вернемся теперь к произвольному функционалу вида ъ fF(x,y,y')dx A5) а и рассмотрим некоторую его экстремаль. Точку х, сопряженную с а по отношению к квадратичному функционалу, представляющему собой вторую вариацию данного
§ 25] УСЛОВИЯ ЯКОБИ ДЛЯ ФУНКЦИОНАЛОВ ОТ НЕСКОЛЬКИХ ФУНКЦИЙ 123 функционала, мы будем называть сопряженной с а и по отношению к функционалу A5), а систему уравнений Эйлера для второй вариа- вариации назовем системой Якоби данного функционала. Так как неотри- неотрицательность второй вариации есть необходимое условие минимума для любого функционала, то с помощью только что сформулирован- сформулированного следствия непосредственно получается Теорема 3 (необходимое условие Якоби для функционалов, зависящих от нескольких функций). Для того чтобы экстремаль у. = у.(х) (/= 1, 2 п), доставляла минимум функционала fF(x,y,y')dx, необходимо, чтобы интервал (а, Ь) не содержал точек, сопря- сопряженных с а. Мы определили точку, сопряженную с а, как ту точку, в кото- которой обращается в нуль детерминант, составленный из п независимых решений системы Якоби, выходящих из данной начальной точки. Этому основному определению равносильны следующие два, в фор- формулировке которых участвуют лишь экстремали рассматриваемого функционала A2) (а не решения системы Якоби). Определение 2. Пусть из начальной точки выходит ji экстремалей (/=1. 2 п) под близкими между собой, но линейно независимыми направлениями. Точка х называется сопряженной с а, если в этой точке детерминант представляет собой бесконечно малую величину более высокого по- порядка, чем при а < х < х. Определение 3. Точка х называется сопряженной к а, если существует последовательность экстремалей, выходящих из той же начальной точки и бесконечно близких к данной экстремали, такая, что каждая из этих экстремалей пересекает данную экстремаль и эти точки пересечения имеют точку х своим пределом. Эквивалентность этих определений устанавливается с помощью рассуждений, аналогичных проведенным в случае одной функции (§24)
124 ВТОРАЯ ВАРИАЦИЯ. ДОСТАТОЧНЫЕ УСЛОВИЯ СЛАБОГО ЭКСТРЕМУМА [ГЛ. V Достаточные условия. Сформулируем в заключение сово- совокупность условий, достаточных для того, чтобы кривая У(х)={ух(х), у2(х) уп(х)} доставляла функционалу ь fF(x. у, y')dx а слабый минимум. 1. Данная • кривая является экстремалью, т. е. удовлетворяет системе уравнений Эйлера F —JLf>=0 (/=1,2 4 2. Матрица, составленная из производных положительно определенна при а^. 3. Отрезок [а, Ь] не содержит точек, сопряженных с я. Доказательство достаточности этих условий опирается на тео- теорему 2 настоящего параграфа и проводится аналогично доказатель- доказательству достаточности соответствующих условий для случая одной функции. § 26. Связь условий Якоби с теорией квадратичных форм в конечномерном пространстве *) В § 22 было доказано, что квадратичный функционал ь f {Ph'2 + Q/г2) dx (P (x) > 0) A) а положительно определен для всех h (х) таких, что h (a) = h {b) = 0, в том и только том случае, когда отрезок [а, Ь\ не содержит точек, сопряженных с а. Функционал A) представляет собой бесконечно- бесконечномерный аналог квадратичной формы. Естественно поэтому попытаться получить условия положительной определенности этого функционала из условий положительной определенности квадратичной формы с по- помощью предельного перехода. *) Этот параграф не связан непосредственно с дальнейшим изложением и, при желании, может быть пропущен. Как и § 25 он написан несколько более конспективно, чем остальной текст книги.
§ 26] СВЯЗЬ УСЛОВИЙ ЯКОБИ С ТЕОРИЕЙ КВАДРАТИЧНЫХ ФОРМ 125 Разобьем отрезок' [а, Ь) на п равных частей точками а = х0, xlt ..., хп = Ъ и рассмотрим квадратичную форму л-1 B) где Pit Qit ht — значения функций Р(х), Q(x) и h (x) в точке xt. Эта квадратичная форма представляет собой конечномерное прибли- приближение функционала A). Сгруппировав в форме B) подобные члены и положив ho = h (a) = 0 и Pn — Qn — 0, перепишем ее в виде hn с матрицей Таким образом, квадратичный функционал A) приближенно запи- записывается в виде квадратичной формы от hv ах Ьх ... О О Ьх аг 0 0 6 О Ьп-\ где (/=1. (/=1. я), я). D) E) F) Симметричная матрица, в которой равны нулю все элементы, кроме стоящих на главной диагонали и на двух соседних с ней диагоналях, называется матрицей Якоби. Квадратичную форму с такой матри- матрицей будем называть формой Якоби. Выведем рекуррентное соотно- соотношение, связывающее главные миноры любой матрицы Якоби. Пусть 1 Ьх 0 ... О О Ъо О о о о G) — один из таких миноров. Разложив его по элементам последней строки, получим Dk+i=akDk — b\^Dk^. (8) Сформулируем с помощью этого рекуррентного соотношения усло- условие положительной определенности для квадратичной формы Якоби. Соотношение (8) позволяет определить все миноры матрицы Якоби
126 ВТОРАЯ ВАРИАЦИЯ. ДОСТАТОЧНЫЕ УСЛОВИЯ СЛАБОГО ЭКСТРЕМУМА [ГЛ. V по двум ее первым минорам DY и D2. Если мы еще положим Do = 1 и D_1 = 0, то соотношение (8) будет справедливо при всех & = 0, 1, .... л — 1, и значения Dv D2 Dn будут определяться этим соотношением однозначно. Воспользуемся следующим критерием положительной определен- определенности квадратичной формы (критерий Сильвестра): квадратичная форма п .2 а,„Цк kl положительно определенна в том и только том случае, если все миноры iu ип ... иы hi a22 • • • а2п ал а и а п\ а>п ап положительны. Применительно к квадратичной форме Якоби этот критерий можно сформулировать так: квадратичная форма Якоби положительно определенна в том и только том случае, если все величины, опре- определяемые рекуррентным соотношением ?)Л+1= auDk b\-\Dk-\ (k = О, 1, ..., п — 1), и условиями Do= I, D_j = 0, положительны. Чтобы получить отсюда критерий положительной определенности квадратичного функционала, посмотрим, во что превращается рекур- рекуррентное соотношение (8) при п->оо. В нашем случае, когда коэффициенты ak и bk определяются равенствами E) и F), рекуррентное соотношение, связывающее миноры матрицы Якоби, принимает вид f^Dfe Ах Непосредственный предельный переход при п-+оо (т. е. при Ал:~»0) здесь, очевидно, невозможен, так как коэффициенты при Dk и Dk_A при этом обратятся в бесконечность. Чтобы избежать этого, сделаем «замену переменных», положив *) k =1, ..., n); A0) *) Непосредственное вычисление показывает, что минор &-го порядка Dk матрицы Якоби с элементами, определяемыми формулами E) и F), имеет вид Таким образом, вводимые нами величины Z^ имеют вид
§ 26] СВЯЗЬ УСЛОВИЙ ЯКОБИ С ТЕОРИЕЙ КВАДРАТИЧНЫХ ФОРМ 127 Тогда рекуррентное соотношение (9) примет вид Р0Р, ...PkZk+l = — in л- , Ax ) (Ajc)*+1 (A*)» (A*)* т. е. ZkQk ^+Pk_lZk+PkZk-PkZk+l-Pk_lZk_, = 0. Деля это равенство на Ах2, получаем Перейдя здесь к пределу при Ал;->0, мы получим дифференциаль- дифференциальное уравнение ^ = Q, A2) т. е. уравнение Якоби. Условие положительности величин Dki удовлетворяющих соотно- соотношению (9), равносильно условию положительности величин Zk, удо- удовлетворяющих разностному уравнению A1), поскольку множитель (Ax)k+l всегда положителен (в силу условия Р(х)У>0). Поэтому условие положительности квадратичной формы C) можно сформулировать так: эта форма положительно определенна в том и только том случае, если величины Zk (k — —1, 0, 1, ..., ri), удовлетворяющие разностному уравнению A1), условию Z_j = O(b которое переходит условие D_l = 0) и условию Z0 = Aa: (вытекающему из условия D0=l), все положи- положительны *). Рассмотрим ломаную Wn с вершинами (a, Zo), (хг, Zx) (b, Za); условия Zk > 0 (k—\, 2, ..., п), Z0 — 0 означают, что эта ломаная не пересекает отрезок [а, Ь] оси абсцисс. При Ал:—>0 разностное уравнение A1) переходит в дифференциальное уравнение Якоби, а ломаная Wn — в решение Z = Z(x) этого дифференциального урав- уравнения, не равное нулю тождественно, удовлетворяющее начальным *) Заметим, что уравнения A1) вместе с уравнениями Z_!=0, Zo = Длс представляют собой систему п -f- 2 независимых линейных уравнений cn-f 2 неизвестными. Решение такой системы определено однозначно.
128 ВТОРАЯ ВАРИАЦИЯ. ДОСТАТОЧНЫЕ УСЛОВИЯ СЛАБОГО ЭКСТРЕМУМА [ГЛ. V условиям Z(a) = 0, Z'(a)=\ и не пересекающее отрезка [a, b\ (т. е. не обращающееся на этом отрезке в нуль). Таким образом, при предельном переходе от квадратичной формы Якоби C) к квад- квадратичному функционалу A) условие положительной определенности квадратичной формы переходит в следующее условие для функционала. Для того чтобы квадратичный функционал был положительно определен, необходимо и достаточно, чтобы решение соответствующего уравнения Якоби удовлетворяющее начальным условиям у(а) = 0, уг(а)=\, не обращалось в нуль при а <; х ^ Ъ, т. е. чтобы отрезок [а, Ь\ не содержал точек, сопряженных с а, А это и есть то условие положительной определенности квадра- квадратичного функционала, которое было доказано в § 22 (теорема 1). Законность описанного выше предельного перехода можно строго обосновать. Мы, однако, не будем на этом останавливаться.
ГЛАВА VI ТЕОРИЯ ПОЛЯ. ДОСТАТОЧНЫЕ УСЛОВИЯ СИЛЬНОГО ЭКСТРЕМУМА В предыдущей главе, рассматривая достаточные условия слабого экстремума, мы ввели важное понятие сопряженной точки. Это поня- понятие вводится наиболее простым и естественным путем с помощью рассмотрения пучка экстремалей. (Тогда сопряженная точка опреде- определяется как точка пересечения данной экстремали бесконечно близкой к ней экстремалью, выходящей из той же самой начальной точки.) Целесообразность рассмотрения не отдельных экстремалей, а неко- некоторых их семейств становится особенно отчетливой при переходе к достаточным условиям сильного экстремума. Рассмотрение таких семейств экстремалей тесно связано с важным понятием поля, с кото- которого мы и начнем эту главу. По-видимому, понятие поля может быть полезно в разных вопросах, поэтому мы сперва сформулируем его в общей форме, непосредственно не связанной с вариационными задачами. § 27. Согласованные граничные условия. Общее определение поля Рассмотрим систему дифференциальных уравнений второго порядка разрешенную относительно старших производных. Для того чтобы выделить некоторое определенное решение этой системы, нужно задать 2п условий, например, граничные условия вида У; = Ф,(У1 У») ('=!. 2 ») B) при двух значениях х, скажем хг и х2. (Именно такие граничные условия встречаются обычно в вариационных задачах.) Если требо- требовать выполнения граничных условий B) только в одной точке, то они выделят решение системы A), зависящее от п параметров.
130 ТЕОРИЯ ПОЛЯ. ДОСТАТОЧНЫЕ УСЛОВИЯ СИЛЬНОГО ЭКСТРЕМУМА [ГЛ. VI Введем следующие определения: Определение 1. Граничные условия Уп) ('=1. 2 *)• (а) заданные при х = х}, и граничные условия У; = «М2)(У1 Уп) ('=1. 2 л). (Р) заданные при х = л:2, называются согласованными между собой, если каждое решение системы A), удовлетворяющее граничным условиям (а), поставленным при x = xlt удовлетворяет и гра- граничным условиям (р), поставленным при х = х2, и обратно *). Определение 2. Пусть при каждом значении х из неко- некоторого сегмента [а, Ь\ заданы граничные условия y'i = *?i{x> Уг Уя). С=1.2 я) C) причем граничные условия, отвечающие двум любым значениям х% согласованы между собой. Совокупность таких согласованных между собой граничных условий называется полем (отвечающим данной системе A)). Граничные условия C), заданные при каждом х, это система дифференциальных уравнений первого порядка. Требование согласо- согласованности их при разных х означает, что решения системы C) должны удовлетворять и системе A), т. е. что система A) есть следствие системы C). В силу теоремы существования и единственности для дифферент циальных уравнений, через каждую точку (xt yv .... уп) той области, в которой заданы функции tyt(xt yv ..., yn)t проходит одна и только одна интегральная кривая системы уравнений C) (мы будем называть их траекториями поля). Согласно сказанному выше, каждая из этих кривых будет в то же время и решением исходной системы A). Таким образом, заданием поля C) системы A) в некоторой области О определяется /г-параметрическое семейство решений системы A) такое, *) Таким образом, можно сказать, что граничные условия в точке x2f согласованные с граничными условиями, заданными в точке xlt заменяют влияние отрезка [л:,, х2] и граничных условий, имеющихся в точке хх. Во всякой краевой задаче граничные условия — это учет влияния внешней среды. Но в каждой конкретной задаче мы можем вопрос о том, что отно- относить к внешней среде, а что — к рассматриваемой системе, решить по собственному усмотрению. Например, если речь идет о колебаниях струны (с некоторыми граничными условиями на концах), то можно рассматривать не всю струну, а некоторую ее часть, отнеся остальную ее часть к внешней среде. При этом можно влияние отбрасываемой части струны заменить соответствующими граничными условиями, задаваемыми на концах рассма- рассматриваемой части.
§ 27] СОГЛАСОВАННЫЕ ГРАНИЧНЫЕ УСЛОВИЯ. ОПРЕДЕЛЕНИЕ ПОЛЯ 131 что через каждую точку этой области проходит одна и только одна кривая из этого семейства *). Посмотрим, каковы должны быть функции ф/(х, уг, ..., уп) (/=1, 2, ..., п) для того, чтобы система C) была полем для си- системы A). Продифференцировав C) по х, получаем yi> дх ~т~ La дуь dx ' k = i R т. е. ду. ™- Итак, система A) есть следствие системы C), если Ф1. ..-.фя) а=1. п). k=\ Таким образом, доказана следующая Теорема. Система первого порядка У! = М*' yv •••• Уп) ("<*<!>> ' = 1. 2, .... п). представляет собой поле для системы y"i=fi{x> Уг Уп* У[ Ун- Унесли функции $i(xt уг уп) удовлетворяют следующей си- системе уравнений с частными производными: Систему D) будем называть системой Гамильтона — Якоби**) для исходной системы A). Таким образом, каждое решение системы Гамильтона — Якоби D) задает некоторое поле для исходной си- системы A). *) Обычно поле определяется не как система C) согласованных между собой в каждых двух точках граничных условий, а как совокупность инте- интегральных кривых системы A), удовлетворяющих в каждой точке усло- условиям C), т. е., иными словами, как общее решение системы C). Нам пред- представляется, что наше определение имеет известные преимущества, в част- частности, при применении понятия поля к вариационным задачам с частными производными. **) Связь между системой D) и данным в гл. IV определением уравнения Гамильтона — Якоби будет выяснена в следующем параграфе.
132 ТЕОРИЯ ПОЛЯ. ДОСТАТОЧНЫЕ УСЛОВИЯ СИЛЬНОГО ЭКСТРЕМУМА [ГЛ. VI Рассмотрим в качестве примера одно линейное уравнение E) Для него система Гамильтона — Якоби сводится к одному уравнению т. е. Совокупность решений такого уравнения зависит от произвольной функции и каждое из них определяет, согласно сказанному выше, некоторое поле уравнения E). Рассмотрим среди решений уразнения F) простейшие, а именно те, которые линейны относительно у. Положим ф(лг, у) = а(х)у. Получим а'(х)у + а?{х)у=р\ т. е. Мы получили для а(х) уравнение Риккати. Решив его и положив у' = а (х) у, получаем поле уравнения E), линейное по у. Аналогичным образом можно найти простейшее поле для системы линейных уравнений Y" = P(x)Y, G) где У = (уг уя), a P(x)=\\pik(x)\\—матрица. Напишем соот- соответствующую G) систему уравнений Гамильтона — Якоби Будем опять искать здесь решение, линейное по К, т. е. имеющее вид п Ф/ (х. У г Уп) = 2 аш (х) yk (9) или, в векторных обозначениях, W = AY.
§ 27] СОГЛАСОВАННЫЕ ГРАНИЧНЫЕ УСЛОВИЯ. ОПРЕДЕЛЕНИЕ ПОЛЯ 133 Подставив это выражение в уравнение (8), получим п п п п 2 *« (*) у*+2а*й <*) 2a*> <*> ^=2 т. е. (^ Л (х)) К + Л» (*) К = Я (х) К. Таким образом, функции (9) определяют поле системы G), линейное по у, если матрица Л(х) удовлетворяет уравнению которое естественно назвать матричным уравнением Риккати. Отметим, хотя это нам и не понадобится в дальнейшем, что понятие поля тесно связано с решением краевых задач для си- системы уравнений второго порядка методом так называемой прогонки. Поясним этот метод на простейшем примере одного уравнения с граничными условиями A1а) A16) Построим сначала уравнение первого порядка , A2) все решения которого удовлетворяют: 1) граничному условию (На) и 2) уравнению A0). Для выполнения первого требования нужно положить, очевидно, а(а) = с0 и P(a) = d0. A3) Чтобы удовлетворить второму требованию, продифференцируем уравнение A2); получим у" (х) = а (х) у' (х) + а' (х) у (х) + $' (х). Подставив сюда вместо у'(х) правую часть равенства A2), находим у" (х) = [с* (х) + а' (х)] у (х) + Р' (х) + а (х) Р (х), откуда ясно, что уравнение A0) представляет собой следствие урав- уравнения A2), если а* (*) 4" *'(*) = />(*). 1 )• I Р'(*) Ч-* (*)Р (*) = /(*)• Пусть теперь а(дг), ^(л:) — решение системы A4), удовлетворяющее
134 ТЕОРИЯ ПОЛЯ. ДОСТАТОЧНЫЕ УСЛОВИЯ СИЛЬНОГО ЭКСТРЕМУМА [ГЛ. VI начальным условиям A3). Найдя функции а(х) и $(х), мы получаем, таким образом, в каждой точке х0 отрезка [а, Ь\ граничное условие у' (*0) = а (дг0) у (х0) + C (*0). Этот процесс переноса граничных условий, заданных первона- первоначально при х = а, в каждую из точек отрезка [а, Ь\ называют пря- прямой про?онкой. Положив, в частности, х = Ь, получим равенство которое вместе с граничным условием A16) образует систему, опре- определяющую у(Ь) и у'(Ь). Если эти значения определяются однозначно, то наша первоначальная краевая задача имеет единственное решение, которое теперь можно найти как решение уравнения A2), принимаю- принимающее при х = Ь полученное нами значение у(Ь). Этот второй этап решения краевой задачи называется обратной прогонкой. Мы рассмотрели случай одного уравнения. Аналогичный метод можно применить и к системе уравнений второго порядка. Решение краевой задачи A0), A1) методом прогонки имеет серьез- серьезные преимущества по сравнению с более традиционным методом, состоящим в том, что сперва отыскивается общее решение уравне- уравнения A0), а потом в нем значения произвольных постоянных подби- подбираются так, чтобы удовлетворялись граничные условия (Па) и A16). Эти преимущества видны особенно отчетливо в тех случаях, когда приходится при решении задачи прибегать к тем или иным прибли- приближенным численным методам. (См. И. С. Берез и н и Н. П. Жидков, Методы приближенных вычислений, ч. И, стр. 386—389.) Совершенно очевидна связь метода прогонки с введенным выше понятием поля системы уравнений второго порядка. Действительно, прямая прогонка и представляет собой не что иное, как построение для уравнения A0) поля, линейного относительно у, а уравне- уравнения A4) — это та система обыкновенных дифференциальных уравне- уравнений, к которой сводится система Гамильтона — Якоби D) в том слу- случае, когда для одного уравнения второго порядка ищется поле, линейное относительно у. (Выше мы рассматривали в качестве при- примера однородное линейное уравнение и в соответствии с этим искали поле в однородной форме yf (х) = а(х)у(х). При этом мы получили для функции а(х) уравнение Риккати, совпадающее с первым из уравнений A4).) Мы могли бы строить поле, исходя не из левого конца проме- промежутка [a, b], а из правого; таким образом, в краевой задаче мы фак- фактически имеем дело с двумя полями дпя уравнения A0), одно из которых получается переносом вдоль [а, Ь] граничных условий (Па), а другое — переносом от b к а граничных условий A16). Решение краевой задачи, состоящей из уравнения A0) и граничных условий
§ 28] ПОЛЕ ФУНКЦИОНАЛА 135 (На) и (Пб), — это кривая, являющаяся общей траекторией этих двух полей. Таким образом, метод прогонки состоит из построения одного поля (прямая прогонка) и затем выбора из его траекторий такой, которая является одновременно траекторией и второго поля. § 28. Поле функционала Применим сказанное в предыдущем параграфе к вариационным задачам. Уравнения Эйлера F —4-Р '=0, отвечающие функционалу образуют систему п уравнений второго порядка. Для того чтобы выделить некоторое определенное решение этой системы, нужно за- задать 2п дополнительных условий, которые обычно задаются в виде граничных условий, т. е. соотношений, связывающих значений yi и у'. в концах интервала [a, b\ (no n условий в каждом из концов). Во многих случаях эти граничные условия, естественно, определяются самим'рассматриваемым функционалом. Рассмотрим, например, задачу со свободными концами для функционала ъ J>(x, у, A) отличающегося от рассматривавшихся ранее членами gW и ставляющими собой функции координат концов дуги, на рассматривается функционал. Вычислив вариацию функционала A), получим пред- предкоторой Приравняв ее нулю и считая, что кривая у.=^уь(х) есть экстремаль, получим
136 ТЕОРИЯ ПОЛЯ. ДОСТАТОЧНЫЕ УСЛОВИЯ СИЛЬНОГО ЭКСТРЕМУМА [ГЛ. VI Так как ht(a) и ht{b) произвольны, то отсюда получаем *) Будем рассматривать граничные условия, отвечающие одному из кон- концов, например х = а. При этом вместо gW (х, уь) будем писать просто g (x, yt). Положим, как обычно, **>;(*• у.- y'd=Pi(*. у,, у'д и запишем граничные условия B) в виде Pl(X- УР tf)-*>,(*«. У/) La^0' C) Эти соотношения определяют у'ь (а) как функции от уг (а) уп (а), т. е. задают на гиперплоскости х = а поле направлений (граничные условия), которое будем записывать в виде у» = ^00. Определение 1. Пусть* дан функционал**) ь ]>(*. У. y')dx. *) Если g^ ' = g^ ' ЕЕ О, то получим т. е. граничные условия для задачи со свободными концами, уже встречав- встречавшиеся в § 5. Заметим, что условия закрепления концов можно рассматривать как предельный случай граничных условий B), B'), получающихся с помощью добавочных членов. Действительно, взяв, например, функционал б получим на левом конце граничное условие Ру(х, У, У)-2к(у-А д , Fy (x. У, /) 3* | Если теперь положить &->оо, то в пределе получим граничное условие у (а) = А. То же самое верно и в случае нескольких функций у1г ..., уп. **) Ниже мы будем, для упрощения записи, символами у, у' и т. д обозначать векторы (уь ...уп), (у[, ..., у'п) и т. д.
§ 28] ПОЛЕ ФУНКЦИОНАЛА 137 Граничные условия заданные в точке х = а, называются самосопряженными, если существует такая функция g(x, у), что Ру'(х. У> ФОО ) = ?*,(*. У)- D) Теорема 1. Граничные условия у\ = ф. (у) |JC=fl являются само- самосопряженными в том и только том случае, если они удовлетво- удовлетворяют соотношениям ар«(*.у.ф(у)) = ар»(*.у.ф(у)) a,k = i.2 «). E) •У« ^.z* x = a Систему этих равенств мы будем называть условием самосопря- самосопряженности. Доказательство. Если граничные условия самосопряженные, т. е. определяются равенствами C), то Pl(x> У* Ф(У)) = й'у/(^. У)\х=а> откуда получаем dpi (-у» У> Ф (У)) _ ^2^ (-у> У) _ dPk (х> У' Ф (У)) Обратно, если граничные условия у\ = Ь таковы, что функции pt(x, у, ф(у)) удовлетворяют условиям само- самосопряженности D), то pt представляют собой (при х = а) частные производные по yt некоторой функции g(y). Ясно, что, рассмотрев функционал ь г "(*. у. и приравняв его вариацию нулю, мы придем к исходным граничным условиям .У^ = Ф/OObsa» которые, таким образом, будут самосопря- самосопряженными. Теорема доказана. Замечание. При я=1, т. е. в случае вариационных задач с одной неизвестной функцией, условия самосопряженности E) отпа- отпадают. Непосредственно ясно, что в случае п=\ любое граничное условие является самосопряженным.
138 ТЕОРИЯ ПОЛЯ. ДОСТАТОЧНЫЕ УСЛОВИЯ СИЛЬНОГО ЭКСТРЕМУМА [ГЛ. VI В предыдущем параграфе мы ввели понятие поля для системы уравнений второго порядка. Сейчас мы сформулируем определение поля для функционала. Рассмотрим функционал ь fF(x,y,y')dx F) а и отвечающую ему систему уравнений Эйлера F>-hp,r°- G) Мы скажем, что граничные условия . У), (а) заданные при x = xlt и граничные условия у;=Ф12)(*. у). т заданные при х = х2, согласованы между собой (по отношению к функционалу (б)), если они согласованы между собой по отноше- отношению к системе G), т. е. если каждая экстремаль, удовлетворяющая при х = х1 граничным условиям (а), удовлетворяет при х = х2 усло- условиям (р) и обратно. Определение 2. Совокупность граничных условий y[ = ^i(x, у), (8) заданных при всех х, а <; х <; ?, называется полем функционала F(x, у, y')dx, а если а) при каждом значении х эти условия самосопряженны; б) при любых xv x2?[a, b) эти условия согласованы между собой (по отношению к рассматриваемому функционалу). Иначе говоря, полем функционала F) называется поле системы отвечающих ему уравнений Эйлера G), удовлетворяющее в каждой точке х условиям самосопряженности. Равенства (8) представляют собой систему дифференциальных урав- уравнений первого порядка. Ее общее решение (т. е. совокупность траекто- траекторий поля) есть я-параметрическое семейство экстремалей такое, чтр
§ 28] ПОЛЕ ФУНКЦИОНАЛА 139 через каждую точку (х, ух уп) той области, в которой задано поле, проходит одна и только одна экстремаль из этого семейства *). Укажем теперь эффективный критерий того, что данная совокуп- совокупность граничных условий /, = <!>,(*. У) (*=1. 2, .... п. a<*<ft). образует поле функционала. Теорема 2. Для того чтобы граничные условия заданные при каждом xt a^.x^.bt образовывали поле функцио- функционала ъ Г F (х, у, yf) dx, а необходимо и достаточно, чтобы выполнялись равенства dPi (х, У> Ф (*, у)) = dpk {х, у, ф (х, у)) 5) дуй дуь (условия самосопряженности) и dPi (*> У. Ф (х, у)) _ _ дН(х% у, ф(л:, у)) ,д. дх dyi ^ ' (условия согласованности), где а Н — функция Гамильтона, т. е. п У* У') = — F(*> У. У)+2 Ръ(х, у, у')у' Доказательство. Мы уже показали выше (теорема 1), что равенства E) необходимы и достаточны для того, чтобы в каждой точке х граничные условия (8) были самосопряженными. Поэтому остается лишь показать, что, при выполнении равенств E) в каждой точке, равенства (9) необходимы и достаточны, чтобы граничные условия y\ = ^i(xt у) были при а ^ х <^ Ъ согласованы. Для доказательства этого утвер- утверждения подставим в условие (8) вместо функции Н(х, у, ф(*. у)) *) Обычно в вариационном исчислении полем функционала называется само я-параметрическое семейство экстремалей (удовлетворяющее некоторым определенным условиям). Как уже было указано (см. сноску на стр. 131), несколько иной подход к этому понятию нам представляется более удобным.
140 ТЕОРИЯ ПОЛЯ. ДОСТАТОЧНЫЕ УСЛОВИЯ СИЛЬНОГО ЭКСТРЕМУМА [ГЛ. V! ее выражение A0) (заменив в нем у', на ф^ (дг, у)), а вместо Pi(x, у, ф(лг, у)) подставим F / (х, у, ф(лг, у)). Выполнив после этого в равенстве (9) дифференцирования, получим (аргументы для сокращения записи опускаем) Так как должны выполняться условия самосопряженности dF , OF , то это равенство можно переписать следующим образом: У/ У* ~ 4d *Ь~ yhy Так как д V/ у/ V* ^ yiyy то равенству A1) можно придать вид Вдоль траекторий поля имеем: 4 dx и, следовательно, dx2 дх поэтому вдоль траекторий поля равенство A2) принимает вид п п F —F > yt ytx • ^ ж ytyk dx т. е. а это и означает, что траектории поля направлений (8) суть экстре- экстремали, т. е. что это поле есть поле рассматриваемого функционала.
§ 28] ПОЛЕ ФУНКЦИОНАЛА 141 Тем самым достаточность сформулированного условия доказана. Так как выкладки, приводящие от (9) к A3), могут быть проведены в обратном порядке, то это условие и необходимо. Теорема доказана. Заметим, что равенства (9), представляющие собой систему урав- уравнений в частных производных — это, собственно говоря, то, что в § 27 мы назвали системой Гамильтона — Якоби. В связи с доказанной теоремой сделаем несколько замечаний. Если граничные условия /, = <!>,(*, у) (/=1. 2 п, а<*<?), (8) являются согласованными (т. е. решения системы (8) суть экстремали ь функционала Г F(x, у, yr)dx)> то проверять их самосопряженность а достаточно в какой-либо одной точке. Это вытекает из следующей теоремы. Теорема 3. Выражение * dpjjx, у, у') dpk(x, у, /) Wk Wi (И) сохраняет постоянное значение вдоль каждой экстремали. Доказательство получается непосредственным вычислением производной -г- от выражения A4) вдоль произвольной экстремали. Согласно сказанному выше, граничные условия у1 = ФД*. у) самосопряженны в каждой точке, если они определяются равенствами Fy[(x> У> У') — еУ1(х> У)- Поставим следующий вопрос: какие дополнительные условия нужно наложить на функцию g(x, у) для того, чтобы граничные условия, определяемые этими равенствами, были не только самосопряженными в каждой точке, но и согласованными, т. е. чтобы они представляли собой поле функционала. Ответ дает следующая Теорема 4. Граничные условия у'. = ф.(х, у), определяемые при а <; х <; b равенствами F^i*. У> y') = gyi(x> У). согласованы, если функция g (x, у) удовлетворяет уравнению Гамильтона — ?+«(*•* >-¦& ?)-* <15>
142* ТЕОРИЯ ПОЛЯ. ДОСТАТОЧНЫЕ УСЛОВИЯ СИЛЬНОГО ЭКСТРЕМУМА [ГЛ. VI Доказательство. Принимая во внимание, что Л О*. У> Ф(*. y)) = gyi(x, У). A6) можно уравнение Гамильтона — Якоби A5) переписать в виде g = -tf(x, у, у„. А Рп), A7) где pi = pi(x, у, ф(лг, у)). Продифференцировав это равенство по у,., получим уь ...» Ул. М*> У), ¦ -., ФЛ*. У)) дхдУ1— dyi т. е. (х, уь .,., уп, ^у(х, у), ..., tyn(x, у)) а это и есть не что иное, как условия согласованности. Сейчас уже легко усметреть связь между введенной нами в § 27 системой Гамильтона — Якоби, которая для случая вариационной задачи переходит в условия согласованности (9), и уравнением Гамильтона — Якоби A5), рассмотренным еще в § 19. Для произвольной системы уравнений второго порядка поле представляет собой, как мы видели в § 27, систему п уравнений вида У/' = Ф/(*. У). где функции tyi(x, у) удовлетворяют системе Гамильтона — Якоби. Для случая вариационной задачи эта система Гамильтона — Якоби превращается в условия согласованности (9). На поле функционала мы наложили еще условие самосопряженности граничных условий в каждой точке. Это приводит к тому, что поле функционала опре- определяется уже не п функциями фДх, у), & одной функцией g(x, у), по которой функции фДх, у) определяются посредством равенств Pi(x> У* $(х> У)) = ёу,(х» У)- Функция g(x, у) играет, таким обра- образом, по отношению к полю функционала роль своего рода потен- потенциала. При этом, поскольку для функционала поле- определяется уже не п функциями, а одной, то и условия согласованности для такого поля задаются не п уравнениями, а одним уравнением, т. е. система Гамильтона — Якоби заменяется уравнением Гамильтона — Якоби A5)* Рассмотрим в {п-\~ 1)-мерном пространстве некоторую область О, и пусть с = (с0, с1 сп) — точка, лежащая вне этой области. Рассмотрим, далее, семейство экстремалей функционала J>(*. У,
§ 28] ПОЛЕ ФУНКЦИОНАЛА 143 выходящих из точки с, и такое, что через каждую точку области G проходит одна и только одна экстремаль из этого семейства. Тем самым в каждой точке (х, yv ..., уп) области G задано направление Определенное таким образом на G поле направлений мы назовем центральным полем. Теорема 5. Всякое центральное поле представляет собой поле функционала ь fF(x, у, y')dx {т. е. удовлетворяет условиям согласованности и самосопряжен- самосопряженности). Доказательство. Нужно показать, что поле направлений B0), полученное указанным выше способом, при каждом значении х удовле- удовлетворяет условиям самосопряженности. Пусть (*, у) Л B1) где интеграл берется вдоль экстремали, соединяющей точку (с0, cv ..., сп) с точкой (х, уг уп). Определим в области G поле направлений, положив Fy't (*. У, у') = gyi(x.y) (/= 1. 2 п). B2) Покажем, что это поле направлений совпадает с исходным полем. Тем самым теорема будет доказана, так как исходное поле удовле- удовлетворяет условию согласованности (поскольку его траектории — экстре- экстремали), а поле, определяемое равенствами B2), самосопряженно в каждой точке в силу теоремы 1. В § 19 мы уже рассматривали функцию B1) (там мы ее обозна- обозначали S(x, уг уп)) и показали, что gyi(x. y)=F^(x, у, г), B3) где z — вектор, касательный к экстремали, проходящей через точку (х> уг уп) (см. стр. 91, формула D6)). Отсюда видно, что поле направлений, определяемое равенствами B2), действительно совпа- совпадает с исходным полем. Мы скажем, что данная экстремаль i окружена полем, если существует такая область G, содержащая экстремаль у» что во всех точках этой области определено поле рассматриваемого функционала, причем такое, что данная экстремаль f является одной из траекто- траекторий этого поля,
144 ТЕОРИЯ ПОЛЯ. ДОСТАТОЧНЫЕ УСЛОВИЯ СИЛЬНОГО ЭКСТРЕМУМА [ГЛ. VI Из теоремы 5 вытекает важное Следствие. Если некоторая экстремаль if» заданная урав- уравнениями Уь = Ус (*) О < х < Ь), не содержит точек, сопряженных с а, то эту экстремаль можно окружить полем. Действительно, в этом случае можно выбрать настолько малое е > 0, что 1) экстремаль -у можно продолжить на весь отрезок [а — е, Ь\\ 2) отрезок [а — е, Ь\ не содержит точек, сопряженных с а — е. Рассмотрим совокупность экстремалей, выходящих из точки с координатами а — е, yt(a — е) (/=1,2 п). Из отсутствия на отрезке [а — е, Ь\ точек, сопряженных с а — е, следует, что никакие две экстремали из этого семейства, достаточно близкие к исходной экстремали f. не пересекаются при а^х^.Ь. Эти достаточно близкие к f экстремали определяют в некоторой, содержащей ^, области G центральное поле, окружающее -[• § 29. Инвариантный интеграл Гильберта Пусть G — некоторая односвязная область в (п-\- 1)-мерном про- пространстве переменных х, уг уп и пусть в G определено поле У/ = Ф/(*. У) 0) функционала ь fF(x,y,y')dx. B) а Как было показано в предыдущем параграфе, поле направлений A) представляет собой поле функционала B) в том и только том случае, если функции фДх, у) удовлетворяют условиям самосопряженности dpt С*. У> Ф С*. У)) _ dPk (х, У, Ф (¦*, У)) ^ - wt C) и согласованности дН (х, у, ф (х, у)) _ _ dpi (xt у, ф (х, у)) (ЛЛ dyi ~ дх ' w Условия C) и D) в совокупности означают, что величина п — Н(х. у, ф(х, y))dx-\- ^S pt(xt у, ф(х, y))dyt представляет собой полный дифференциал некоторой функции
§ 29] ИНВАРИАНТНЫЙ ИНТЕГРАЛ ГИЛЬБЕРТА 145 g(x, ух уп). Как известно из анализа, эта функция (определен- (определенная с точностью до постоянного слагаемого) может быть записана с помощью криволинейного интеграла п) = j' — Hdx + ^Pidy,, E) Уг> •• взятого вдоль кривой С, идущей из некоторой фиксированной точки Мо = (х°, у^, ..., у0} в точку М — (х, у2, ..., уп). Так как под знаком интеграла в E) стоит полный дифференциал, то выбор кри- кривой С не играет роли: значение интеграла зависит только от точек Мо и Ж, а не от выбора кривой С. Этот интеграл E) называется инвариантным интегралом Гильберта. С помощью уравнений поля y't = <]л (х, у) и функции F, определяющей функционал A), интеграл Гильберта можно записать следующим образом: у))— J Итак, окончательно: инвариантным интегралом Гильберта (отве- (отвечающим данному полю) называется выражение F), где ф^ (х, у) — функции, определяющие поле функционала. Если кривая С, по которой берется интеграл, является одной из траекторий поля, то вдоль нее и интеграл F) сводится к интегралу (x,yt y')dx. взятому вдоль этой траектории. Подчеркнем следующее, важное для дальнейшего обстоятельство. Если if — некоторая экстремаль, являющаяся одной из траекторий поля, то интеграл Гильберта позволяет значение функционала B) для этой экстремали записать в виде интеграла, который можно брать по любой кривой, соединяющей концы экстремали f.
146 ТЕОРИЯ ПОЛЯ. ДОСТАТОЧНЫЕ УСЛОВИЯ СИЛЬНОГО ЭКСТРЕМУМА [ГЛ. VI § 30. Функция Вейерштрасса. Достаточные условия сильного экстремума Определение. Пусть дан функционал ь fF(x,y,y')dx. A) а Функцией Вейерштрасса Е(х, у, z, w) этого функционала назы- называется следующая функция 3/г —|— 1 переменных: п Е(х, у, z, w) = F(x, у, w)—F(x, у, z) — ^(wl — zi)F'(x, у, г). i=\ yi B) Таким образом, функция Вейерштрасса представляет собой разность между значением функции F (рассматриваемой как функция послед- последних п аргументов) в точке w и первыми двумя членами ее разложе- разложения Тейлора с центром в точке z. Отсюда видно, что функция Вейер- Вейерштрасса может быть записана в виде E(xt y, z,w) = -j2j (wi — zi)(wk — zk)Fyry (x> У> ' ъ — 1 Ik C) т. е. как остаточный член формулы Тейлора. При п = I функция Вейерштрасса допускает следующую наглядно- геометрическую интерпретацию: рассмотрим F(x, у, z) как функцию от z. Тогда F(x, у, w) — F(x, у, z) — (w — z)Fy>(x, у, z) представляет собой расстояние (по вертикали) от кривой, изображаю- изображающей функцию F(x, у, z) до касательной к этой кривой, проведенной через фиксированную точку этой кривой. Целью данного параграфа является установление достаточных условий сильного экстремума для функционала , у, y')dx. Напомним (см. §§ 24 и 25), что для достижения слабого экстремума достаточна следующая совокупность условий: 1) кривая yl = yi(x) является экстремалью, 2) вдоль нее матрица \\F ' > II положительно определенна, [| yi ь\\ 3) отрезок [а, Ь] не содержит точек, сопряженных с а.
§ 30] ДОСТАТОЧНЫЕ УСЛОВИЯ СИЛЬНОГО ЭКСТРЕМУМА 147 Каждый сильный экстремум является одновременно и слабым экстремумом, но, вообще, говоря, не наоборот, поэтому достаточные условия для сильного экстремума естественно искать следующим образом: «взять за основу» приведенные выше условия и затем до- дополнить их так, чтобы получить совокупность условий, обеспечиваю- обеспечивающих наличие не только слабого, но и сильного экстремума. Для нахождения этих дополнительных условий напомним прежде всего, что отсутствие сопряженных точек на рассматриваемой экстремали у. = у.(х) позволяет окружить эту экстремаль полем функционала A) (следствие из теоремы 5 § 28). Далее, по этому полю У| = Ф(*. У) можно согласно § 29 построить инвариантный интеграл Гильберта L 'У. «К*. Сравним теперь значение рассматриваемого функционала на данной экстремали yi = yi(x), обозначим ее f» c ег° значением на произ- произвольной кривой f, заданной уравнениями у. — у.(х) и удовлетворяю- удовлетворяющей граничным условиям. Воспользовавшись тем (см. конец § 29), что величину Г F(x9 у, yf)dx Г можно представить в виде интеграла Гильберта, взятого по кривой f'. , у, y>)dx = t у. Ф) —2*Л'.(^ У> Щ п /V>' У. запишем разность J F(xt у, yf)dx — J F(x, у, y')dx D) т т
148 ТЕОРИЯ ПОЛЯ. ДОСТАТОЧНЫЕ УСЛОВИЯ СИЛЬНОГО ЭКСТРЕМУМА [ГЛ. VI следующим образом: (*, у, y')dx— J F(x, у, y')dx = JF(xt у, y')dx — i — I F (х, у, ф)— V ^F r (jc, ^, a L (x. У' i — У. <I>)U*. E) Экстремаль ^ реализует сильный минимум, если разность D) неотри- неотрицательна для любой допустимой кривой 7» достаточно близкой (в смысле метрики С) к *р Это условие будет, очевидно, выполнено, если выражение, стоящее в правой части равенства E) под знаком интеграла, неотрицательно. Но это выражение представляет собой не что иное, как функцию Вейерштрасса Е(х, у, z, w), в которой вместо wt представлены компоненты поля ^t(x, у), вместо Уь — функции уь(х)у определяющие произвольную допустимую кри- ~ dyi вую 7» а zi заменены на --г1-- Поэтому экстремаль ^ будет давать функционалу A) сильный минимум, если мы к условиям 1—3 присоединим следующее требо- требование: Е(х, у, z, <К*, у))>0 F) для любых конечных z, в каждой точке (х, уг, ..., уп) некоторой области D, в которой задано поле У^ = <М*. У)- Так как функция Вейерштрасса Е непрерывна по х и у, то усло- условие F) будет выполнено во всех точках, достаточно близких к экстре- экстремали f» если в каждой точке этой экстремали выполнено строгое неравенство при всех конечных z. Заметим одновременно, что ослабленное условие вдоль экстремали 7 необходимо для того, чтобы эта экстремаль
§ 30] ДОСТАТОЧНЫЕ УСЛОВИЯ СИЛЬНОГО ЭКСТРЕМУМА 149 давала функционалу A) сильный минимум. Действительно, если в какой-либо точке экстремума ^ выполнено противоположное нера- неравенство ( то Еух, у, 2, -jr~) отрицательно и в некоторой окрестности этой точки. А тогда уже приведенная выкладка E) приводит нас к тому, что кривую т можно в этой окрестности изменить так, чтобы полу- полученная из 1 в результате этого изменения кривая у удовлетворяла условию f F(x, у, y')dx—fF(x, у, y')dx<0. 7 т Это означает, что на кривой у минимум не достигается. Итак, к установленным ранее необходимым условиям экстремума (как сильного; так и слабого), перечисленным в § 24, мы сейчас можем добавить еще следующее необходимое условие сильного экстремума (условие Вейерштрасса). Если экстремаль ? доставляет функционалу ь F(x, у, y')dx сильный экстремум, то вдоль нее (т. е. при у = у(х), у'= у' (х)) при любых z функция Вейерштрасса z> неотрицательна. Вернемся теперь к достаточным условиям сильного экстремума и сформулируем окончательный результат. Теорема. Кривая yt = yt (x) доставляет функционалу ь f F (*> У, /) dx (yt (a) = Ai9 Vl ф) = Bt) а сильный минимум, если 1) эта кривая является экстремалью, 2) матрица \\F ' г (х, у(х), 1 *Р положительно определенна при а ^ х ^ Ь, 3) отрезок [а, Ь\ не содержит точек, сопряженных с а,
150 ТЕОРИЯ ПОЛЯ. ДОСТАТОЧНЫЕ УСЛОВИЯ СИЛЬНОГО ЭКСТРЕМУМА [ГЛ. VI 4) вдоль экстремали yi = yi(x) выполнено неравенство при любых конечных z ф -~ . Действительно, из условий 2) и 3) следует, что экстремаль yt = у. (х) можно окружить полем и, следовательно, построить инте- интеграл Гильберта. Как уже было сказано выше, условие 4) гарантирует неотрицательность выражения, стоящего в равенстве E) справа под знаком интеграла в некоторой области, окружающей рассматриваемую экстремаль, а это и обеспечивает сильный минимум функционала. Так как, согласно сказанному выше, функция Вейерштрасса может быть записана в виде то условие 4) вытекает из следующего, более грубого условия: 4') матрица r для любых конечных z положительно определенна в некоторой области, содержащей экстремаль yi=zyi(x). Ясно, что это последнее условие влечет за собой не только условие 4), но и 2). В случае п = 1 условие 4') означает, что при всех z и при (х, у), принадлежащих некоторой области, кото- которая содержит рассматриваемую экстремаль, т. е. выпуклость F(xt у, z) как функции от z.
ГЛАВА VII ВАРИАЦИОННЫЕ ЗАДАЧИ С ЧАСТНЫМИ ПРОИЗВОДНЫМИ В этой главе мы изложим ряд вопросов, относящихся к функцио- функционалам, зависящим от функций двух или большего числа переменных. К рассмотрению таких функционалов приводят, в частности, задачи механики, относящиеся к системам с бесконечным числом степеней свободы (струна, мембрана и т. п.). Мы рассмотрим здесь, применительно к таким задачам, принцип наименьшего действия и общие методы получения законов сохранения (теорему Нетер), кото- которые в гл. IV излагались для систем, состоящих из конечного числа материальных точек. § 31. Основная формула для вариации функционала в случае фиксированной области Рассмотрим функционал J[u) = f ... JF{xx хП9 и9 иХх% ..., иХп)ахх ...dxn. A) зависящий от функции и переменных xv ..., хп и ее частных произ- производных первого порядка, и вычислим его вариацию, считая, что область интегрирования G не вариируется, а функция и(хг хп) переходит в «•(*i xn) = u(xv .... хп) + еу(хг хл) + ..., B) где многоточие означает члены выше первого порядка малости по е. При этом под вариацией функционала A) мы понимаем главную линейную относительно е часть разности J[u*]-J[u]. Вычислим эту разность. Для сокращения записи будем писать 11{х), ty(x) вместо и(х1г . .., хп), ty(xx хп), dx вместо dxx .. . их i
152 ВАРИАЦИОННЫЕ ЗАДАЧИ С ЧАСТНЫМИ ПРОИЗВОДНЫМИ [ГЛ. VII и т. п. Получим = f[F(x, « G — F(x, и(х)9 uXl(x) uXfi где опять многоточие справа означает совокупность членов выше первого порядка относительно е. Выражение и есть вариация функционала A). Поставим следующую задачу, важную для дальнейшего: предста- представить вариацию функционала A) как интеграл от выражения вида Я (*)<K*)+div (...); иначе говоря, мы хотим преобразовать выражение C) так, чтобы производные ф^ содержались лишь в такой комбинации членов, k которую можно представить в виде дивергенции. Для этой цели в формулу C) вместо Р подставим x Получим 87 = О L ^=1 J Эта формула для вариации является основной. Ее значение основано на том, что последнее слагаемое, представляющее собой интеграл от дивергенции, может быть сведено к интегралу по границе Г области О. В результате этого под знаком интеграла, взятого по G, будет стоять выражение, зависящее только от функции ф(х), но не от ее
§ 31] ОСНОВНАЯ ФОРМУЛА ДЛЯ ВАРИАЦИИ В СЛУЧАЕ ФИКСИРОВАН. ОБЛАСТИ 153 производных, а члены с производными войдут лишь в граничные условия *). Если функция ф(#), определяющая вариацию функции и (х), обращается в нуль на границе области G, то интеграл G k-l обращается, в силу *формулы Грина (*), в нуль, т. е. формула для вариации сводится к Из общего необходимого условия экстремума функционала 87 = 0 вытекает, как это уже было изложено в гл. I, уравнение Эйлера п д г-1 ~ Ри-Ъ дхк представляющее собой основное необходимое условие экстремума для функционала A). Мы вывели формулу D) для вариации, считая область интегри- интегрирования G фиксированной. Обобщение этой формулы на тот случай, когда в функционале A) область интегрирования тоже вариируется, будет сделано в § 33. *) Для этого достаточно воспользоваться «-мерной формулой Грина, которая в данном случае может быть записана так: k l = f (х) dx2 ... dxn -...+(- VfFUx? (x) dx{ ... Этим приемом формула для вариации D) приводится к виду, вполне ана- аналогичному формуле для вариации функционала, зависящего от линий, кото- которая тоже записывается как интеграл от (ty —~j— Fy,\h (x) плюс граничные члены (см. § 11).
154 ВАРИАЦИОННЫЕ ЗАДАЧИ С ЧАСТНЫМИ ПРОИЗВОДНЫМИ [ГЛ. VII § 32. Вариационный вывод уравнений колебаний струны, мембраны и пластинки В этом параграфе мы рассмотрим применение полученной в § 31 основной формулы для вариации к выводу уравнений движения не- некоторых механических систем с бесконечным числом степеней сво- свободы. С дальнейшим изложением содержание этого параграфа не связано. В § 17 было показано, что уравнения движения для механической системы, состоящей из п материальных точек,смогут быть получены из так называемого принципа наименьшего действия, который состоит в следующем: если U — потенциальная энергия системы материальных точек, а Т—ее кинетическая энергия, то траектория этой системы в фазовом пространстве доставляет минимум функционалу ъ f(T—U)dt, A) а который называется действием. В этом параграфе мы рассмотрим применение принципа наимень- наименьшего действия к выводу уравнений колебаний (и соответствующих краевых условий) для некоторых простейших систем с бесконечным числом степеней свободы, а именно для струны, мембраны и пластинки. 1. Струна. Рассмотрим движение струны, т. е. гибкой мате- материальной нити с линейной плотностью р = const. Предположим, что концы струны х = 0 и х = 1 закреплены упруго, т. е. что при отклонении их от положения равновесия возникает сила, пропор- пропорциональная этому отклонению *), Обозначим и(ху t) отклонение струны от положения равновесия в точке х в момент времени t. Кинетическая энергия струны равна, очевидно, i B) Найдем теперь выражение для потенциальной энергии струны, нахо- находящейся в момент t в положении, описываемом некоторой определенной функцией и(х, t) (при фиксированном t). Эта потенциальная энергия равна той работе, которую нужно затратить для того, чтобы перевести струну из положения *) Такое закрепление можно осуществить, на- Рис. 8. пример, следующим образом: концы струны закреп- закреплены с помощью двух колечек на параллельных стержнях, а сами эти колечки удерживаются в начальном положении двумя пружинками (рис. 8).
§ 32] ВЫВОД УРАВНЕНИЙ КОЛЕБАНИЙ СТРУНЫ, МЕМБРАНЫ И ПЛАСТИНКИ 155 равновесия в рассматриваемое положение. Подчеркнем, что струна считается абсолютно гибкой, т. е. вся работа идет на ее растяжение (а не на изгиб). Пусть натяжение струны равно То = const. Рас- Рассмотрим некоторый элемент струны в двух положениях: начальном и конечном (рис. 9). Мы рассматриваем малые колебания струны, ди поэтому можно считать, что —з— fr есть малая величина при всех значе- значениях t. Работа, которая при этом совершается, равна произведению силы (натяжения струны) То на путь, который проделывает один из концов рассматриваемого элемента, и на косинус угла между силой натя- Рис- 9- жения и направлением перемещения. Это произведение равно, очевидно, произведению То на удлинение рассматриваемого элемента струны, т. е. равно То Vdu> + dx* -Todx = ± где многоточие означает члены более высокого (по сравнению с вы- выписанными) порядка малости. Мы нашли работу, отвечающую элементу струны. Для всей струны эта работа равна :, t)dx. Сюда нужно еще прибавить работу, затрачиваемую на смещение упруго закрепленных концов. Она равна *) где <?! и о2 — постоянные. Поэтому потенциальная энергия струны, находящейся в момент времени t в положении, описываемом функ- функцией и(х, t)y равна i \u\Ut\ D) *) При упругом закреплении конца х — 0 сила, действующая на него в момент t, пропорциональна его отклонению от положения равновесия, т. е. равна ajM @, t). Следовательно, работа, совершаемая при его перемещении из нулевого положения в положение и @, t), равна ~- и2 @, t). Аналогично для второго конца.
156 ВАРИАЦИОННЫЕ ЗАДАЧИ С ЧАСТНЫМИ ПРОИЗВОДНЫМИ [ГЛ. VII а действие за некоторый промежуток времени [t0, tx\ имеет вид Jw=iff И(*> о—ТЛ(х. t)\dxdt+ to 0 tx ft +т /  @'f) *+т /  (l> ° *• E) to t0 Согласно принципу наименьшего действия, функция и(х, t), описы- описывающая реальное движение струны, должна быть экстремалью функ- функционала E). Выпишем для этого функционала основное необходимое условие экстремума 57=0. Воспользовавшись полученной в предыдущем параграфе формулой D) для вариации и тем, что вариация суммы равна сумме вариаций, получим 87=8{ //[~РИ«(Х' *) + 7'<Ar,(*. t)\*t(x,t)dxdt-\- itQ 0 tx tQ 0 J (эта вариация отвечает переходу от функции и(х, t) к функции Относительно функции ф(х, ^) мы предположим, что т. е. будем считать, что в начальный и конечный моменты функ- функция u(xt f) не вариируется. Тогда последнее слагаемое в F) можно преобразовать так: Я_^_ (_ 70и„(х, ОФС*. t))dxdt-\- t0 0 tx I -\- -7u(Put(x> 0Ф(*» t))dxdt = t0 0 = f[TQux@, 0ф@. t) — Toux(l, 0ф(/.
§ 32] ВЫВОД УРАВНЕНИЙ КОЛЕБАНИЙ СТРУНЫ, МЕМБРАНЫ И ПЛАСТИНКИ 157 и затем переписать выражение вариации F) следующим образом: ( 87=е U + /[о2я(/, t) — Toux(l, + f f[TQuxx(x. t)-putt(x, tW(x. t)dxdt\. G) t0 0 j Согласно принципу наименьшего действия, это выражение должно быть равно нулю для той функции, которая отвечает реальному движению струны. Пусть сначала ф(х, t) обращается в нуль на концах, т. е. при х = 0 и при х = 1. Тогда выражение G) для Ы сводится к одному двойному интегралу. Приравнивая его нулю, получаем (см. лемму 1' §5) ин (х, 0 = аЧхх (х, 0. где а? = Ь- > 0. (8) Это и есть уравнение колебаний струны. Оно представляет собой уравнение Эйлера для функционала :j(jc, t)—TQux(x, t)]dxdt. tQ о Пусть функция и (х, t) удовлетворяет уравнению колебаний струны (8). Для такой функции выражение G) для вариации bJ сводится к i«@. t)+Toux(O, 0]ф@, t)dt to + f [о2и (I, t) - Toux (/, 0] ф (/, t) dt. Это выражение должно быть • равно нулю. В силу произвольности ф@, t) и if{l, t) это требование приводит к двум равенствам о,в@. 0+7"ов,@. 0 = 0. OjB(/, t)—Toux(l. 0 = 0.
158 ВАРИАЦИОННЫЕ ЗАДАЧИ С ЧАСТНЫМИ ПРОИЗВОДНЫМИ [ГЛ. VII Таким образом, функция и(х, t), описывающая колебания струны, должна удовлетворять уравнению (8) и граничным условиям аи @, 0 + их @,0 = 0 («= -г). <9ь> \ о / связывающим отклонение каждого из концов струны от положения равновесия с направлением касательной к струне на этом же конце. Если концы струны свободны *), то Oj = о2 = 0, и граничные условия (9) принимают вид их@, 0 = 0, ux(lt 0 = 0, т. е. на свободном конце касательная к струне сохраняет все время то направление, которое она имеет в положении равновесия. Жесткое закрепление концов струны, т. е. граничные условия и@, 0 = 0, иA, 0 = 0, A0) можно рассматривать как предельный случай упругого закрепления их. Действительно, если считать, что жесткость удерживающих концы струны пружин неограниченно возрастает, то это означает, что аг —> оо и о2—>оо, т. е. а—>оо и р—> — оо. Деля (9j) на а и (92) на р и переходя к пределу, получаем условия A0). 2. Замечание о принципе наименьшего действия. Принцип наименьшего действия широко используется не только в механике, но и в других областях физики: электродинамике, тео- теории поля и т. д. Вместе с тем следует иметь в виду, что этот принцип, в известном смысле, не вполне верен. Рассмотрим простейшую механическую систему — материальную точку, колеблющуюся вокруг положения равновесия под действием упругой силы (осциллятор). Потенциальная энергия такой материаль- материальной точки равна U = kx2, а кинетическая ~ тх2 л — 2 f поэтому для нее действие имеет вид и t. A1) *) Мы называем концы струны свободными, если в схеме, указанной в сноске на стр. 154, пружинки отсутствуют. Колечки, с помощью которых струны закреплены на прямых х =• 0 и х = I, в этом случае сво- свободно передвигаются вверх и вниз.
§ 32] ВЫВОД УРАВНЕНИЙ КОЛЕБАНИЙ СТРУНЫ, МЕМБРАНЫ И ПЛАСТИНКИ 159 Уравнение движения осциллятора mx + 2kx = 0. A2) Каждое его решение записывается в виде х = Л sin a> (^ -f-а), где а) = |/ — ; A3) значения постоянных Л и а определяются из граничных условий. Уравнение A2) представляет собой уравнение Эйлера для функ- функционала A1). Однако утверждать, что его решение A3) обязательно реализует минимум функционала A1), мы, вообще ^говоря, не можем. Действительно, рассмотрим, например, решение х = — sin Ы; A4) оно проходит через точку х — 0, t = 0 и удовлетворяет условию х@)=1. С точкой @, 0) сопряжена точка t — — (в этой точке экстремаль A4) пересекается с каждой из экстремалей, удовлетво- удовлетворяющих условию x@) = 0). Так как для рассматриваемого функ- функционала A1) то при tQ < — экстремаль х = ±йпЫ @<*</0) удовлетворяет достаточным условиям минимума (не только слабого, но и сильного). Однако если рассматривать интервал времени, боль- больший чем —, то утверждать, что соответствующая экстремаль обяза- •тельно будет давать минимум функционалу A1), нельзя. Рассмотрим теперь систему п осцилляторов; ее кинетическая энер- энергия записывается в виде квадратичной формы от скоростей п Т= 2 а1Ьх,хк, A5) а потенциальная энергия — в виде квадратичной формы от координат п и= 2 *,*****. A6) Так как квадратичная форма A5), представляющая кинетическую энергию, положительно определенна, то формы A5) и A6) можно
160 ВАРИАЦИОННЫЕ ЗАДАЧИ С ЧАСТНЫМИ ПРОИЗВОДНЫМИ [ГЛ. VII линейной заменой переменных одновременно привести к сумме квад- квадратов *), т. е. к виду В этих новых переменных действие записывается так: Напишем соответствующие уравнения Эйлера Ъ + \Я1 = 0 (/=1. 2, .... п). A7) Это — уравнение движения системы п осцилляторов. Будем считать все \ положительными (это означает, что рассматриваются колебания системы вокруг положения устойчивого равновесия). Тогда решения системы A7) имеют вид ) (t=lt 2 д). где At и dt — постоянные, определяемые из начальных* условий, a coj = j/\. Рассуждения, аналогичные проведенным выше для одно- одного осциллятора, показывают, что отрезок траектории (задается урав- уравнениями вида A7)), временная длина которого не превосходит —, где со = max a^, не содержит сопряженных точек и удовлетворяет i всем остальным достаточным условиям минимума. Однако, если рас- рассматривается интервал времени, больший чем — , то гарантировать, что отрезок экстремали, отвечающий этому интервалу, действительно реализует минимум действия, нельзя. Рассмотрим теперь колебания струны. Мы не будем приводить здесь такой анализ, как для одного или нескольких осцилляторов-, а ограничимся следующим элементарным рассуждением. Решение уравнения колебаний струны д2и __ 2д2и dt2 ~~п дх2 может быть записано в виде **) а (л:, ?) = 2 ап(-х *) Подробнее об этом см., например, Г. Е. Шило в, Введение в тео- теорию линейных пространств. **) См., например, И. Г. Петровский, Лекции об уравнениях с част- частными производными, М., 1950, § 20.
§ 32] ВЫВОД УРАВНЕНИЙ КОЛЕБАНИЙ СТРУНЫ, МЕМБРАНЫ И ПЛАСТИНКИ 161 где ап(х) и ал определяются из начальных и краевых условий, а Поэтому струну можно рассматривать, в известном смысле, как систему бесконечного числа осцилляторов, имеющих собственные частоты а)л = -^. Но числа —- не ограничены сверху, поэтому ана- аналогия с осцилляторами заставляет думать, что для струны нет вре- временного интервала, настолько малого, чтобы на нем решение и (х, /) уравнения струны непременно реализовывало бы минимум функцио- функционала, представляющего собой действие для колеблющейся струны дли- длины /. Аналогичные рассуждения можно провести и для других си- систем с бесконечным^ числом степеней свободы. Исходя из изложенных соображений, лучше говорить не о прин- принципе наименьшего, а о принципе стационарного действия, понимая под этим обращение в нуль вариации действия вдоль истинной траектории движения. 3. Мембрана. Рассмотрим задачу о колебаниях мембраны. Обозначим и(х, у, t) отклонение точки (х, у) мембраны от равно- равновесия в момент времени t. Кинетическая энергия мембраны в момент t ±ffu*( x, yt t)dxdyt где р — плотность мембраны, а интеграл берется по всей занимаемой мембраной области. Найдем потенциальную энергию мембраны в со- состоянии, описываемом функцией и(х, у, t), где t фиксировано. Она равна работе, которую нужно затратить для того, чтобы перевести мембрану из положения равновесия и^О в рассматриваемое поло- положение. Эта работа слагается из работы смещения края мембраны (который мы будем считать закрепленным упруго) и работы, затра- затрачиваемой на деформацию мембраны. Первое слагаемое равно ~ J'o(s)u*(s,t)ds. L где L — граница мембраны, и (s, t) — ее отклонение от положения равновесия, a g(s) — коэффициент упругости в точке s. Второе слагаемое может быть записано в виде Действительно, подобно тому, как работа, затрачиваемая на дефор- деформацию элемента струны, равна произведению натяжения на изменение длины, работа, затрачиваемая на деформацию элемента мембраны,
162 вариационные задачи с частными производными [гл vii равна произведению натяжения мембраны на изменение площади этого элемента. При деформации мембраны элемент площади dxdy переходит в V1 -\-*%-\-и* dxdy. Ограничиваясь в выражении У\ +4+и]dx dy — dx dy главными членами получаем, приращение элемента площади { Работа, совершаемая при деформации элемента мембраны, равна а работа, затрачиваемая на деформацию всей мембраны, есть J G Таким образом, для мембраны действие имеет вид =± f fo{s)u*(st + Y fff[Pt(*. У> *)—Т0(иЦх9 у, Ъ + иЦхъ у, t))\dxdydt. Воспользовавшись формулой D) предыдущего параграфа, найдем вариацию этого функционала, считая, что функция и (х, у, t) переходит в ч «• (х9 у, t) = и (*, у, 0 + еф (х, у, 0 + ... Получаем =е j fp(s)u(s, 0фE, t)dsdt + ff fl -J- Т0(ихх(х, у, t)-\-uyy(x, у, t))]ty(x, у, f)dxdydt-\- и х> У у 0 )"~лТ (TqUx (х, у, 0 ф (л:, у, t)) — /о "о" — л~-(^оиу(*» У» ОФС-^» У* t))\dxdydt. A8)
§ 32] ВЫВОД УРАВНЕНИЙ КОЛЕБАНИЙ СТРУНЫ, МЕМБРАНЫ И ПЛАСТИНКИ 163 Как и в случае струны, будем считать, что функция ф, определяю- определяющая вариацию, равна нулю в начальный и конечный моменты <К*. У, Ы = Цх. у, узО. A9) Воспользовавшись формулой Остроградского и приняв во внимание условие A9), мы можем переписать последнее слагаемое в выражении для вариации A8) следующим образом (здесь и далее мы для сокра- сокращения записи опускаем аргументы) в виде поверхностного интеграла: . ' *г г J J ря,ф dx dy — TQuxty dt dy — Г0«уф dt dx. B0) Так как интеграл tx f fpufydxdy B1) t0 L равен нулю (как интеграл по цилиндрической поверхности, обра- образующие которой параллельны оси t)t a L It (где -д— означает дифференцирование по направлению нормали к L], то окончательно выражение A8) для вариации можно переписать в следующем виде: tx Предположим сначала, что на границе мембраны ф = 0, т. е. что в граничных точках функция и не вариируется. Тогда в полученном выражении для bJ остается лишь тройной интеграл, и условие 87=0 приводит к уравнению /Ж B3)
164 ВАРИАЦИОННЫЕ ЗАДАЧИ С ЧАСТНЫМИ ПРОИЗВОДНЫМИ [ГЛ. VII Это и есть уравнение колебаний мембраны. Если функция и удовле- удовлетворяет этому уравнению, то выражение B2) для bJ сводится к J f(o(s)a(s. t)— TQdu{^f)\^{st t)dsdt. to L , это выражение к нулю ности интервала (tQy tx) и ф($, t)t что L , Приравнивая это выражение к нулю, получаем, в силу произволь- произволь) Это — граничное условие для уравнения мембраны, отвечающее упру- упругому закреплению ее границы. В частности, если эта граница сво- свободна, то o(s)==0, и мы получаем — = 0 дп ¦— граничное условие для свободной мембраны; жесткому закрепле- закреплению границы отвечает a(s) = oo, т. е. условие а E, t) = 0. 4. Пластинка. Применим в заключение принцип стационар- стационарного действия к выводу уравнения и краевых условий для колебаний пластинки. Пусть и(х, у, t) — отклонение пластинки от положения равновесия в -точке (л:, у) в момедт времени t. Потенциальная энер- энергия пластинки определяется ее изгибом, следовательно, она должна выражаться ^р^з вторые производные *) функции и (х, у, t) по про- пространственным .переменным х и у. Далее, выражение для потенциаль- потенциальной энергии должно быть квадратично относительно производных (для получения линейного уравнения колебаний) и не должно зависеть qt выбора системы, координат. Этим условиям удовлетворяют лишь детерминант матрицы B4) и квадрат ее следа. Поэтому потенциальная энергия Ux деформации пластинки должна записываться в виде интеграла от Обычно полагают *) Считается, что пластинка «не работает на растяжение», поэтому первые производные в выражение для потенциальной энергии пластинки не входят.
§ 32] ВЫВОД УРАВНЕНИЙ КОЛЕБАНИЙ СТРУНЫ, МЕМБРАНЫ И ПЛАСТИНКИ 165 где к — коэффициент, зависящий от выбора единиц (в дальнейшем мы будем его считать равным 1). К энергии Ux нужно прибавить еще энергию внешних сил /(•*, у) и p(s) (если такие есть), дей- действующих на поверхность пластинки и на границу L, а также и энергию заданных на границе изгибающих моментов m(s). Суммарное Выражение для этих энергий имеет вид p(s)uds-\-fm(s)^ds. О L L Кинетическая энергия пластцнки записывается, очевидно, в виде ;; ^ |-/* f u)dxdy, о ¦ . где р—плотность. Таким образом, для действия получаем следующее выражение: , y)ti\dxdy-\- \ p(s)uds-\- / m{s)-?-ds\dt. B6) L L ) Заметим, что выражение B6) представляет собой функционал более общего вида, чем те, которые мы рассматривали выше (струна, мембрана), так как подынтегральное выражение зависит от произ- производных неизвестной функции порядка выше первого. Вариацию функционала B6), отвечающую переходу от функции и к функции и -f- еф + .... можно представить в следующем виде (промежуточ- (промежуточные выкладки мы опускаем): -/{Я [Л Дй + / (*» У) — utt?] tydxdy — — / (Р(и) — р (s))<]> ds — / (Ж (и) — т (s)) -Л- ds \ dt, L l / где дАи . о дАи , дАа Ж
166: вариационные задачи с частными производными [гл. vii (здесь хп, уп и хх, ух — направляющие косинусы внешней нормали п и касательной т). Считая, что на границе пластинки функция и и ее нормальная производная не вариируются, получаем, в силу произволь- произвольности как интервала (t0, tx), так и выбора ф внутри области О, урав- уравнение у), B7) представляющее собой уравнение вынужденных колебаний пластинки. При отсутствии внешних сил (т. е. при /ssO) получаем уравнение свободных колебаний пластинки р^ = ДДй. B8) Наконец, полагая в уравнении B7) utt — 0t получим уравнение для нахождения положения равновесия упругой пластинки, нагруженной внешними силами: у) = 0. B9) Это последнее уравнение может быть получено непосредственно из условия обращения в минимум потенциальной энергии пластинки. Если и(х, у, t) удовлетворяет уравнению B7), то выражение для вариации действия принимает вид В силу произвольности интервала [^0> tx\t функций ф и -~, полу- получаем, что : P(u) — p(s) = 0 и Л! (я) — /яОО = 0. C0) Это — т$к называемые естественные граничные условия. Если гра- граница пластинки закреплена, т. е. если на границе « = ° и Ж = °- то естественные граничные условия заменяются условиями C1). Если же рассматривается опертая пластинка, т. е. сама граница пла- пластинки Неподвижна, но направление нормали к ней в точках границы может меняться, то получаем следующие граничные условия: « = 0, 1хДИ + A-^)(и,Х + 2«,у^Уп+иуу^) = (>- С32) Следует обратить внимание на то, что выражение которое, очевидно, представляет собой дивергенцию вектора (и^пуу, ^ иха^у), не участвует в уравнении B7), а входит лишь
§ 33] ОСНОВНАЯ ФОРМУЛА ДЛЯ ВАРИАЦИИ В СЛУЧАЕ ПЕРЕМЕННОЙ ОБЛАСТИ 167 в граничные условия. В силу этого в уравнение B7) не входит и коэффициент |х. Как выше было указано, применительно к пластинке, при отыска- отыскании положения равновесия той или иной системы, условие стацио- стационарности действия переходит в условие стационарности потенциаль- потенциальной энергии (поскольку для тела, находящегося в положении равно- равновесия, кинетическая энергия равна нулю). При этом устойчивое положение равновесия (а только такие и могут быть реализованы физически) отвечает минимуму потенциальной энергии. В теории упругости для нахождения состояния равновесия упругого тела часто используется вместо принципа минимума потенциальной энергии прин- принцип минимума работы деформации, называемой также принципом Кастилиано. Изложение.этого принципа и доказательство эквивалент- эквивалентности его принципу минимума потенциальной энергии читатель может найти, например, в книге Р. Куранта и Д. Гильберт.а, Методы математической физики, т. I, гл. IV, § 11. § 33. Основная формула для вариации в случае переменной области. Теорема Нетер 1. Постановка задачи. В § 31 мы вывели формулу для вариации функционала J а, иХх% ..., uXn)dxx ... йхп% A) считая, что в нем вариируется лишь функция и (а значит, и ее производные), а независимые переменные (следовательно, и область интегрирования G) никак не меняются. Сейчас мы рассмотрим задачу о нахождении вариации функционала A) в самом общем случае, т. е. когда вариируется не только функция а (и ее производные), но и независимые переменные х\* Х2* • • •• хпл ; Уточним постановку задачи. Пусть задано преобразование х\ = Ф1{х1 хП9 и, иХх xnt и, иХх « Если а = а(хг, ..., хп), то и* можно рассматривать как функцию от x*v ..., jc*. Действительно, из соотношений B) можно в этом случае выразить хг хп через х\ х*п; подставив эти выра- выражения в B0, представим и* в виде «*=«*к о- •) 1, 2, .. .. n), B) B')
168 ВАРИАЦИОННЫЕ ЗАДАЧИ С ЧАСТНЫМИ ПРОИЗВОДНЫМИ [ГЛ. V|l Соотношения B) (при условии, что и = и(хх хп)) переводят область G изменения переменных хх хп в некоторую область G* изменения переменных х л:*. Мы предположим, что преобра- преобразование B), B') при е = 0 сводится к тождественному преобразо- преобразованию Введем для упрощения записи сокращенные обозначения: будем v писать х вместо хх хпп х* вместо х* х*п. Формулы B), B') дают возможность каждой функции и(х) и области G сопоставить функцию и*(х*) и область G*. Тем самым интегралу ставится в соответствии интеграл \ U* х U*)dx*. Наша задача состоит в том, чтобы вычислить вариацию функцио- функционала A), отвечающую переходу от х и и(х) к х* и и*(х*), т. е. главную линейную (относительно е) часть разности J[u*(x*)] — J[u(x)]. Проиллюстрируем постановку задачи на простом примере, относя- относящемся к функционалам, зависящим от функций одного переменного. Пусть — некоторая кривая -[, лежащая в плос- плоскости (х, я), и пусть рассматриваемое преобразование представляет собой пово- поворот плоскости (а:, и) на угол е. При этом каждая точка (а:, и) переходит в не-, которую другую точку (**, а*). В част- частности, каждая точка кривой т переходит в точку кривой f*. получающейся из дан- данной кривой с помощью поворота. 2. Формулы для вариаций переменных х и и. Рассмотрим предварительно более подробно переход от х к х* и от и к и*. Положим х* = дг/ + еср/(А:) + члены высшего порядка C) и Рис. 10. \ и* (х*) = и\х) + еф (л;) + члены высшего порядка. C0
§ 33] ОСНОВНАЯ ФОРМУЛА ДЛЯ ВАРИАЦИИ В СЛУЧАЕ ПЕРЕМЕННОЙ ОБЛАСТИ 169 Здесь, очевидно, дх _ i _ди* ^е е = 0* ^? g=0 Введем обозначения 8а:/ = ecpj, D) Ьи = еф. D') Нам понадобится еще разность мы представим ее в виде и*(х) — й(А:) = еф(А:L-члены высшего порядка по е и положим Ьи = еф. E) Прежде, чем двигаться дальше, рассмотрим смысл введенных нами величин 8^, Ьи и Ьи на указанном выше примере поворота на угол s вокруг .начала координат. В этом случае каждая точка (а:, и) переходит в точку с координатами х* = х cos s — и sin e, и* = х sin e 4~ и cos e. В частности, точка (а:, и(х)), лежащая на кривой т» переходит в точку, лежащую на f* и имеющую координаты х* = х cos е — и (х) sin e, / и* (а:*) = х sin e 4- и (х) cos e, поэтому х* = х — ей (х) -|- члены высшего порядка, и* (х*) = и (х)-\-ех-\-члены высшего порядка, т. е., в соответствии с C) и (Зг), ср = — и (а:), ф = xt и, значит (см. D) и DГ)), 8а: = — ей (а:), Ьи = ex. То, что вектор, соединяющий точки (л:, и(х)) и (а:*, и*(х*)\ имеет именно компоненты —tu(x) и sa:, видно и непосредственно из чертежа. Далее, в нашем случае, U* (х) — и* (х* + ew (a:) ) d= и* (х*) 4~ zu*' (x*) и(х)-\-о (г);
170 : вариационные задачи с частными производными [гл. vii но так как и* (х*) = и' (х) + величина порядка е, то «• (х) = и* (**) + т' (х) и (х) + о (е), р. е. в данном случае или ф (а:) = х + а' (х) и (х). Вернемся теперь к общему случаю. Найдем связь между Ьи и Ьи. Имеем и* (х*) — и (х) = и* (х*) — и* (х) -f и* (х) — и(х) = г да* ди Так как -д— и -g— отличаются друг от друга на величину порядка е, то окончательно ^) - в W~ Jl^W^+Bii =11+2^-8^ (здесь и ниже символ ~ означает равенство с точностью величин выше первого порядка малости относительно s). Но главная линей- линейная относительно е часть разности и*(х*) — и(х) есть Ьи, поэтому э8и + 2и 8*, F) ИЛИ Для того чтобы вычислить разность J[u*(x*)]—J\u(x)], нам нужно еще сосчитать да(х) Г Точнее говоря, нам нужно вычислить главную линейную относи- относительно е часть этого выражения. Мы рбозначим ее символом Ъъх..
§ 33] ОСНОВНАЯ ФОРМУЛА ДЛЯ ВАРИАЦИИ В СЛУЧАЕ ПЕРЕМЕННОЙ ОБЛАСТИ 171 дх} Запишем прежде всего -^-. Это нам понадобится не только для нахождения Ьих.у но еще и для выражения элемента объема области О* через переменные хг хп. Из формулы C) получаем, что дх* _* , дЬ где 6 ' 8 =( ik \ О при / + к. Далее, отсюда мы получаем, что д ^1у д l ^ -^--^-; (8) dx*дх* и значит Вернемся к вычислению Ьа . Имеем __ д[и*(х*)-и(х*)] . (?[и(х*)-и(л:)] ¦ (ди(х*) ди (х*) дх% Т дхк Т\ дх\ дхк Рассмотрим каждое из стоящих справа трех слагаемых в отдёль* «ости. Разность и*(х*) — и(х*) представляет собой величину порядка е, поэтому в первом слагаемом можно дифференцирование по x*k заме- заменить дифференцированием по xk (в силу (9) результат от этого изменится на величину порядка е2). Таким образом, вспоминая, что и*(х) — и(х)~г$(х), получаем д [и* (х*) - а (**)] ^ шд [и* (х*) - и (**)] , . е dx*k dxk dxk
172 ВАРИАЦИОННЫЕ ЗАДАЧИ С ЧАСТНЫМИ ПРОИЗВОДНЫМИ [ГЛ. VII д$(х*) но —V—- отлич dxk окончательно *): н0 -ЛА—L отличается на величину порядка е от ^ . Поэтому д[и*(х*)-и(х*)] Далее д[и(х*)- dxk И наконец Собирая вместе полученные нами формулы A0), A1) и A2), находим йхк Главную линейную относительно 8 часть разности ** ' и\х) дх% dxk мы обозначили Ьихk> Пользуясь этим обозначением и обозначениями D) и E), мы можем соотношение A3) переписать в таком виде: Итак, соберем вместе полученные нами формулы. Имеем ** — х. ~ е<р/ (х) — lxi% и*(х*) — й(л:)~еф = 8и, и*(х) — й(А:)~еф = 8«, S ??«л:.. Т.е. 8й = Ьи — 2 ¦) Следует помнить, что и считается функцией от х> т. е. при вычисле- вычислении -^— значение и не фиксируется. (К сожалению, несовершенство обще- общепринятых обозначений для частных производных опять-таки не позволяет нам отразить это в самих формулах!)
§ 33} ОСНОВНАЯ ФОРМУЛА ДЛЯ ВАРИАЦИИ В СЛУЧАЕ ПЕРЕМЕННОЙ ОБЛАСТИ 173 где bl-x—J — главная линейная часть выражения ди* (**) ди (х) дх% Для частного примера, приведенного на стр. 169, все эти соотноше- соотношения легко усмотреть нелосредственно из рис. 10. 3. Основная формула для вариации функционала. Теперь мы уже можем вычислить интересующую нас разность Для этого сведем прежде всего в выражении для J[u*(x)] интегри- интегрирование пЪ О* к интегрированию по области G. Так как , дхк — °<*~|~гЛ^"> D(x\ 4) то якобиан -рг~, г- равен (с точностью до величин выше пер*- и (хи ..., хп) вого порядка относительно е *)) 1 Поэтому — F(a:, и, и^ \ix^ \dx. Воспользовавшись формулой Тейлора и выписывая лишь члены пер- первого порядка относительно е, получаем О *) Действительно, дх2 дх2 ? ilXL e-XXl l-i c u^n dxn dxn '•' (^лгл
174 ВАРИАЦИОННЫЕ ЗАДАЧИ С ЧАСТНЫМИ ПРОИЗВОДНЫМИ [ГЛ. VII Выписанные члены представляют собой главную линейную относи- относительно е часть AJ, т. е. вариацию bj функционала J[u]. Заменив п здесь Ьи на bu-\-^ux.bxt и Ьих на (см. F) и A4)), получим Л/1 Л/1 ?=1 Как и в рассмотренном в § 31 случае фиксированной области О, поставим задачу: записать вариацию как интеграл от выражения вида *) А(х) Ьи + div (.,.). Для этого в выражении A5) сумму запишем как **) заменим на п *) Иными словами (поскольку интеграл от дивергенции сводится к ин- интегралу, взятому по границе области), мы приводим выражение для вариа- вариации к такому виду, чтобы производные от вариаций Ьи входили лишь в гра- граничные члены. **) См. сноску на стр. 172с
§ 33] ОСНОВНАЯ ФОРМУЛА ДЛЯ ВАРИАЦИИ В СЛУЧАЕ ПЕРЕМЕННОЙ ОБЛАСТИ 175 (аналог интегрирования по частям). Окончательно получаем n 1 ^ д I = 1 J Это и есть основная формула для вариации. Перепишем ее еще раз, подставив вместо Ьи и bxk их выражения E) и D). Получим / о Итак, если дан функционал JW = f F(x, и, uXl, ..., ttxn)dx о и дано преобразование д* = ФД*, «, uXl uXji% s), / = 1. 2, .... л, н* = ^(лг, w, uXl иХп, е), mo вариация bj функционала Jt т. е. главная линейная относи- относительно е часть разности J[u*(x*)]—J[u(x)] представляется формулой A7), где Заметим, что в том частном случае, когда независимые переменные xt не вариируются, а вариируется только функция и (и ее производ- производные), в форме A6) последнее слагаемое исчезает, и мы получаем несколько более простое выражение совпадающее с формулой D) § 3i. Обычно формулой вариации функционала приходится пользо- пользоваться тогдз, когда ц (х) представляет собой экстремальную поверхность,
176 ВАРИАЦИОННЫЕ ЗАДАЧИ С ЧАСТНЫМИ ПРОИЗВОДНЫМИ [ГЛ. VII этого функционала, т. е. удовлетворяет соответствующему урав- уравнению Эйлера i-F -О В этом случае выражение для вариации сводится к О в общем случае и к ( не вариируются. 4. Обобщения на случай нескольких функций или нескольких параметров. Формулы, аналогичные фор- формулам A6) — A9), можно, конечно, получить и в том случае, когда рассматриваемый функционал зависит не от одной функции и, а от нескольких, т. е. если и является не скалярной величиной, а.век- а.векторной. Если и = (их ит), то, например, формула A6) для ва- вариации принимает вид Другое, также часто полезное для приложений обобщение полу- полученных нами выше формул для вариации состоит в следующем. Бу- Будем' считать, что совокупность преобразований, переводящих х и а в л:* и и*, зависит не от одного параметра е, а от нескольких. Иначе говоря, будем считать, что величина е также представляет собой вектор е = (е1, ,.., ер). Если соответствующие преобразования писать в виде ОСх=1
§ 33] ОСНОВНАЯ ФОРМУЛА ДЛЯ ВАРИАЦИИ В СЛУЧАЕ ПЕРЕМЕННОЙ ОБЛАСТИ 1 И и под 8лг^, Ьи^ bat понимать следующие выражения: 4* = 2<yp(fta)(*.«). OCss 1 Ч = 2 •$*> (*. и), а=1 то формул^ A6т) сохранится без всяких изменений и в рассматри- рассматриваемом общем случае. б. Теорема Нетер. Из полученной нами формулы вариации функционала вытекает одна из важных теорем вариационного исчи- исчисления— теорема Нетер об инвариантных вариационных задачах, ко- которая для случая одного независимого переменного была доказана нами в § 16. Сформулируем прежде всего определение инвариант- инвариантности функцирнала, Пусть дан функционал (x. и, иХу *xn)dx. B0) о Будем рассматривать преобразования -независимых переменных хг хп и функции и = и(х), имеющие вид*) *;=ф* (*•«•«*. «*„)• <21а> «• = *(*, и, aXl uXn). B16) Интеграл B0) мы назовем инвариантом данной совокупности преоб- преобразований, если в. иХх ux)dx= [F(x\ и\ и* .. ., u*\dx* о* для каждого из преобразований, принадлежащих этоЗ совокупности. Здесь интеграл слева берется по любой области изменения перемен- переменных хх хп, а справа — по соответствующей области изменения переменных х* х^. *) Подчеркнем еще раз, что при таком преобразовании функция и пе- переменных хи ..., хп переходит в функцию ик переменных х*, ..., х*п, так как из равенств B1а) мы можем определить хь ..., хп (а следовательно, и tiynXy ..., их \ как функции от x*v ..., х*п и затем подставить эти выра- выражения в B16).
178 ВАРИАЦИОННЫЕ ЗАДАЧИ С ЧАСТНЫМИ ПРОИЗВОДНЫМИ [ГЛ. VII Иными словами, если о — поверхность, заданная уравнением и = и(х), а о* — поверхность, заданная уравнением и* = и*(х*), в ко- которую о переводится преобразованием B1), то инвариантность функ- функционала B0) означает, что J[o']=J[o]. Для случая п=\9 т. е. применительно к функционалам от линий, понятие инвариантности уже вводилось в § 16. Там же были рас- рассмотрены и простейшие примеры. Приведем еще один пример. Функционал / ичвариантен относительно преобразований х* = х cos a 4- У sin а, у* =— х sin а -f- у cos а, B3) Действительно, пусть о — поверхность, заданная уравнением и== = /(х> У)» Найдем уравнение поверхности о*, получающейся из а преобразованием B3). Из первых двух равенств B3) получаем, что х = х* cos а — у* sin а, у = л:* sin а + у* cos а, следовательно, а* задается уравнением u* = f (x* cos а — у sin а, х* sin а -}- у* cos а). Запишем это уравнение так: u* = f*(x*9 у*). Тогда имеем / О Вернувшись в этом интеграле к прежним переменным х и у, по- получим о Упражнение. Пусть дх о~ Вычислит!. /Jo], если о* получается из а преобразованием B3),
§ 33] ОСНОВНАЯ ФОРМУЛА ДЛЯ ВАРИАЦИИ В СЛУЧАЕ ПЕРЕМЕННОЙ ОБЛАСТИ 179 Теорема Нетер. Пусть задана совокупность преобразо- ваний Тогда из инвариантности функционала '(*. «. ** *хя)йх B5) о относительно преобразований B4) следует, что и, uXl, ..., их\ и ф = ty(xt и, иХх% .... их \ опре- определяются формулами B4), и и — произвольная экстремальная по- поверхность функционала B5). Если преобразования B4) зависят не от одного параметра, а от р параметров е = (е1 sp), то из инвариантности функционала B5) относительно такой совокупности преобразований следует существо- существование р линейно независимых соотношений l^0' «== 1, 2, ..., где a w — любая экстремальная поверхность. Наконец, если функцио- функционал B5) зависит от векторной функции u = (uv... , ит), то соотно- соотношения B6р) заменяются соотношениями Доказательство теоремы Нетер сразу же вытекает из общей формулы A7) для вариации. Действительно, если функционал B5) инвариантен относительно преобразований B4), то вариация этого
180 вариационные здалчи с ^стныш производными. [гл. vii функционала (отвечающая переходу от х, и к х*, и*) равна нулю. Если и = и(х) — экстремальная'поверхность, то для нее F и формула A7) принимает вид о Так как область G здесь произвольна, то отсюда следует что и требовалось доказать. Для случая преобразований, зависящих от нескольких парамет- параметров, доказательство не содержит ничего нового, поэтому мы его опускаем. Замечание 1. Если и = и(х) — произвольная функция (не экстремаль), то для нее из инвариантности функционала B5) отно- относительно преобразований B4) вытекает соотношение <27> Замечание 2. Если п— 1, то соотношение B6) принимает вид т. е. _ • = const B8), вдоль каждой экстремали и = и (х). Иначе говоря, соотношение B8) представляет собой первый интеграл системы уравнений Эйлера,, отвечающих функционалу ь (*, и, u')dx. Если этот функционал инвариантен относительно совокупности пре* | образований зависящих от' р параметров, то отвечающая ему система| уравнений Эйлера имеет р линейно независимых первых интегралой|
§ 33] ОСНОВНАЯ>ОРМУЛА ДЛЯ ВАРИАЦИИ В СЛУЧАЕ ПЕРЕМЕННОЙ ОБЛАСТИ 181 вида B8). Мы пришли к тому частному случаю теоремы Нетер, который был изложен в § 16. Пусть некоторый функционал \F(x, и, uXl ux\dx инва- G риантен относительно группы преобразований, зависящих не от нескольких параметров, а от некоторого числа произвольных функ- функций. Тогда имеет место вторая теорема Нетер, согласно которой между левыми частями уравнений Эйлера, отвечающих вариационной задаче; инвариантной относительно группы преобразований, завися- зависящих от р произвольных функций, существует р тождественных соот- соотношений, т. е. р этих уравнений являются следствиями остальных. Простеййий пример такой инвариантности дают параметрические задачи, рассмотренные нами в § 8. Действительно, преобразования, оставляющие инвариантной соответствующую вариационную за- задачу,— это всевозможные замены параметра. В случае параметри- , ческой- задачи на плоскости рассматривается функционал . х. у. х\ y')dt, B9) инвариантный относительно преобразований Группа этих преобразований зависит от одной произвольной функ- функции ?(т), поэтому между левыми частями отвечающих этой задаче уравнений Эйлера должно существовать одно тождественное соотношение. Действи- Действительно, в этом случае имеет место равенство которое было доказано непосредственной проверкой еще в § 8. Еще один интересный пример преобразований, зависящих от произвольной функции (так называемое градиентное преобразование в электродинамике), мы рассмотрим в следующем параграфе. Мы не будем останавливаться на доказательстве теоремы Нетер для групп преобразований, зависящих от произвольных функций, и не будем выписывать в общем виде тех соотношений между уравне- уравнениями Эйлера, существование которых утверждает вторая теорема Нетер.
182 ВАРИАЦИОННЫЕ ЗАДАЧИ С ЧАСТНЫМИ ПРОИЗВОДНЫМИ (ГЛ. VII § 34. Принцип стационарного действия для полей. Законы сохранения 1. Выше уже указывалось, что принцип стационарного действия может быть применен к системам с бесконечным числом степеней свободы. В § 35 это было показано на примерах струны, мембраны и пластинки. В этом и следующем параграфах мы рассмотрим при- применения принципа стационарного действия и теоремы Нетер к тео- теории поля. Состояние всякого поля характеризуется некоторой функцией и = и(х, у, г, t) координат и времени, называемой функцией поля. Эта функция может быть величиной различной природы — скаляром, вектором, тензором и т. д. В зависимости от этого различают ска- скалярные, векторные, тензорные и т. д. поля. Если функция и имеет несколько компонент, то их обозначим uv ..., ит. При выводе уравнений поля обычно, так же как мы делали это выше для струны или мембраны, вводится соответствующая функция Лагранжа, из которой и получаются уравнения поля. В случае системы с конечным числом степеней свободы функция Лагранжа пишется обычно в виде суммы, взятой по всем материаль- материальным точкам, входящим в рассматриваемую систему. Для поля такая сумма заменяется, естественно, интегралом по пространственным пере- переменным л:, у, z от некоторой функции, называемой плотностью функции Лагранжа или, короче, лагранжианом*) Л @ = / I (t, х, у, z) dx dy dz. A) Интеграл от лагранжиана по всем четырем переменным, т. е. А = j L (t, х, у, z) dx dy dz dtt B) представляет собой действие. Здесь интеграл берется по некоторой области четырехмерного пространства — времени. Ниже, для придания большей симметрии формулам, мы будем вместо обозначений х, у, z и t пользоваться обозначениями xv x2, ^з и xQt а интегрирование по этим переменным будем обозначать символом Г ... dx. Обычно bo всех физических теориях считают лагранжиан функ- функцией от функций поля щ(хх, х2, х3, х0) и их первых производных: *) С этим положением дел мы уже фактически встречались в § 35, хотя термин «лагранжиан» там не вводился.
§ 34] ПРИНЦИП СТАЦИОНАРНОГО ДЕЙСТВИЯ. ЗАКОНЫ СОХРАНЕНИЯ 183 Принцип стационарного действия приводит к уравнениям Эйлера 3 dL VI д 6L Л /у|ч 6L VI дщ Li дщ Li dxk определяющим функции ui% т. е. представляющим собой уравне- уравнения поля. 2. Законы сохранения для полей. Теорема Нетер, из- изложенная в предыдущем параграфе, дает общий способ вывода за- законов сохранения, т. е. построения таких величин, представляющих собой комбинации функций поля, которые не меняют со временем. Такие величины называются инвариантами поля. Пусть интеграл инвариантен относительно совокупности преобразований х] = Ф1(х, и, uXi иХп, е) = *,-+-2 s<Me) + • зависящих от р параметров s — (elt s2> ..., ер). Тогда согласно тео- теореме Нетер имеют место р соотношений вида div^a = 0, F) где Из каждого такого соотношения может быть получен некоторый инвариант поля. Действительно, проинтегрируем равенство F) по некоторому четырехмерному объему, ограниченному двумя плоско- плоскостями хо = а и хо = Ь (т. е. отвечающим двум фиксированным мо- моментам времени) и цилиндрической поверхностью х\-\~х\-\-х\= R2. Поскольку выражение F) есть дивергенция, этот интеграл, взятый по четырехмерной области, можно преобразовать в интеграл, взятый по границе этой области. Получим О = J div Aa dx = f (Aa9 n) de9 (8) где do — элемент площади поверхности, ограничивающей рассматри- рассматриваемую четырехмерную область, а п — нормаль к этой поверхности.
184 ВАРИАЦИОННЫЕ ЗАДАЧИ С ЧАСТНЫМИ ПРОИЗВОДНЫМИ [ГЛ. VI? Считая в соответствии с обычными физическими представлениями, что на бесконечности поле достаточно быстро убывает, мы можем, положив /?->оо, отбросить в правой части (8) интеграл по боко- боковой цилиндрической поверхности. При этом останется лишь инте- интеграл по двум трехмерным плоскостям хо = а и xQ — b. На этих пло- плоскостях (Ла, п) сводится к временной компоненте А°а вектора Ла, а интегрирование по do — к интегрированию по пространственным координатам. Таким образом, из (8) получаем J А°Л*1. Х2> *з- b)dxxdx2dxz — f aI(Xv X2tXz% a)rf^Лс2Лса == 0. т. е. величина a\ dxx dx2 dx3 = / [2 -y^j^Цх. «) + /.<#> (x, «I dxxdx2dxz (9) не зависит от времени. Итак, мы показали, что из инвариантности действия B) относительно совокупности преобразований E) действи- действительно' вытекает наличие соответствующего числа инвариантов поля, представимых формулами (9). х Рассмотрим конкретные законы сохранения, отвечающие тем пре- преобразованиям переменных, которые фактически встречаются в физике. Обычно во всех физических теориях предполагается, что функцио- функционал, представляющий собой действие, инвариантен относительно параллельных переносов (по всем четырем осям) и относительно преобразований, образующих полную группу Лоренца*). Выясним, к каким законам сохранения приводит эта инвариант- инвариантность. Тензор энергии-импульса. Пусть лагранжиан L(x, и, иХх иХо) инвариантен относительно параллельных переносов, т. е. относи- относительно преобразований *) Полной группой Лоренца называется совокупность преобразований четырехмерного пространства, оставляющих инвариантной квадратичную форму х\ \ Х2 "г" хг хо и не меняющих направления времени. Детерминант матрицы такого преобра- преобразования равен ± 1. Совокупность тех преобразований, для кот?фых этот детерминант равен -fl, образует подгруппу, называемую собственной груп- группой Лоренца. '
§ 34] ПРИНЦИП СТАЦИОНАРНОГО ДЕЙСТВИЯ. ЗАКОНЫ СОХРАНЕНИЯ 185 В этом случае имеем Ъх, — е,, т. е. <р(а) = 8. ={ к ' ' fl " [0 при 1фа. buk = O, т. е. <|?> = 0, Следовательно, соотношения F), вытекающие из теоремы Нетер, в этом случае имеют вид а сортве^ствующие инварианты (9) поля записываются следующим образом: • . Величина называется тензором энергии-импульса, а не зависящий от времени интеграл f?dxxdx2dxz A1) носит название вектора энергии-импульса. Его нулевая компо- компонента Яо есть энергия поля, а остальные три компоненты суть ком- компоненты импульса. Замечание. Если рассматриваемое поле скалярно, т. е. если и имеет лишь одну компоненту, то тензор энергии-импульса удовлет- удовлетворяет, очевидно, условию симметрии Если же и имеет несколько компонент, то полученное нами выраже- выражение A0) уже не будет, вообще говоря, симметричным тензором*). Однако, его можно заменить симметричным тензором, отличающимся *) Условие симметрии тензора энергии-импульса существенно с физи- физической точки зрения. Здесь, однако, мы не имеем возможности подробно обсуждать этот вопрос.
186 ВАРИАЦИОННЫЕ ЗАДАЧИ С ЧАСТНЫМИ ПРОИЗВОДНЫМИ [ГЛ. VII от полученного нами выражения A0) лишь на величину, дающую при интегрировании по xv x2, хг нуль. Так как в физические рассмот- рассмотрения входит всегда не сам тензор энергии-импульса, а его инте- интеграл по xv x2, хг, то такая замена всегда возможна. Тензор момента количества движения. Как уже было сказано выше, функционал " L(x, и, иХх uXo)dx /¦ для каждого поля, имеющего определенный физический смысл, дол- должен быть инвариантен относительно преобразований Лоренца. Каж- Каждое из этих преобразований можно записать следующим образом: *;=*,+.2 «'Чш/у A2) где ™и = — *п — параметры, определяющие данное преобразование*), а gll _ g22 _ g33 _ 1 ^ 000-= \t Таким образом, **i = 2«"*/V A3) Двенадцать величин <0уAф/) связаны соотношениями <о^ = — о>^; следовательно, среди них имеется лишь шесть независимых. За эти независимые параметры можно взять те со^, для которых / < у. В соответствии с этим равенство A3) преобразуем так: где сумма берется по всем парам у, /, для которых у </ и, как обычно, 0 при / Ф у, 1 при /=у. Формулы A2) определяют преобразование независимых переменных xv х2, хг, х0. Нужно еще указать, каким образом преобразуются функции поля и(х). Если рассматриваемое поле скалярное, го пре- преобразования Лоренца никак не действуют на и (х), т. е. имеет место равенство и*(х*) = и(х). A4) *) Каждая из величин а>/у представляет собой угол поворота в плоско- плоскости (Xit Xj).
§ 34] ПРИНЦИП СТАЦИОНАРНОГО ДЕЙСТВИЯ. ЗАКОНЫ СОХРАНЕНИЯ 187 Следовательно, для скалярного поля Перейдем от ол;,. и Ьи к функциям ср(а) и ф(а) в соответствии с фор- формулами D), E) предыдущего параграфа. Получим щ Преобразования A2) зависят от шести параметров. Следовательно, из инвариантности функционала B) относительно этих преобразова- преобразований вытекает шесть равенств вида F), где вместо индекса а нужно брать все шесть комбинаций индексов j и / такие, что j < /, а вместо ср/ и фа— их выражения A5) и A5'). Мы получаем окон- окончательно* \ й "* *"]+ l [1-д »*м \ - о. Введем обозначение dXi) Определим, далее, величины м{1 при j > /, положив М{1 = — М1/. Выражения М{1 образуют тензор третьего ранга, антисимметричный по У и /. Он называется тензором момента количества движения. Воспользовавшись полученным выше выражением A0) для тензора энергии-импульса, мы можем записать тензор момента количества движения следующим образом: Закон сохранения момента количества движения состоит в том, что в соответствии со сказанным выше (стр. 184) интеграл Г Mo dx1 dx2 не зависит от времени, т. е. представляет собой инвариант поля. Если рассматривается не скалярное, а какое-нибудь другое поле, например векторное, то преобразование Лоренца действует не только на координаты
188 - ВАРИАЦИОННЫЕ ЗАДАЧИ С ЧАСТНЫМИ ПРОИЗВОДНЫМИ [ГЛ. VII (х\, xit х%, х0), но и на компоненты функции поля. В случае векторного поля и = (ии и2, и3, и0): 2 }тф1 Следовательно, для векторного поля Проведя выкладки, аналогичные проделанным выше для скалярного поля, получим для тензора момента количества движения векторного поля сле- следующее выражение: М? = 8»х,Т\ - g»*tT* - S -ГШТ S»ur (x), дЫ) где Т\ и Tlj — компоненты тензора энергии-импульса. § 35, Примеры: уравнение Клейна — Гордона и уравнения Максвелла В этом параграфе мы рассмотрим кратко в качестве иллюстраций два вида полей: поле скалярных нейтральных частиц и электро- электромагнитное поле. 1. Рассмотрим так называемое уравнениеКлейна — Гордона (?-1Л2)«(*) = 0. A) где ?—оператор Даламбера n_JL. JL о. J! ?L U~dx\^dx\ ^ дх\ дх\ # Это уравнение, с помощью которого в теоретической физике описывается поле нейтральных (т. е. не заряженных) скалярных час- частиц со спином нуль (например, тс0-мезонов), может быть получено из принципа стационарного действия как уравнение, отвечающее лагранжиану Для этого лагранжиана общее выражение тензора энергии-импульса принимает вид , . грЫ kkii ди ди /SJ
§ 35] УРАВНЕНИЕ КЛЕЙНА — ГОРДОНА И УРАВНЕНИЯ МАКСВЕЛЛА 189 откуда плотность энергии рассматриваемого поля равна 3 а плотность вектора импульса равна Тензор момента количества движения для лагранжиана B) принимает вид 2. Уравнения Максвелла. В качестве второго конкретного примера возьмем уравнения Максвелла, описывающие электромагнит- электромагнитное поле. Состояние электромагнитного поля задается вектором электрического поля Е и вектором электромагнитного поля Н. Эти величины связаны между собой (при отсутствии зарядов) известными уравнениями Максвелла . г, дН . „ dF Л votE = — з—» rot //== ^—, дх0 дх0 I C) j Эти уравнения можно свести к одному уравнению, если выразить Е и Н через компоненты четырехмерного вектора (Аг, А2, Аг, Ао) электромагнитного потенциала, положив НА E = gradAQ — -р-, Н = хо\А ^ D) OXq {здесь А = (Av А2, Аг)). По заданным Е и Н потенциал (Ах, Л2, Л3, Ло) определяется этими соотношениями неоднозначно. Величины Е и Н не меняются, если потенциал (Ах, А2, Л3, Ао) заменить потенциалом (Аи Хъ А'г, Aq) по формуле Ц& (*=1. 2, 3.0). E) где f(x) — некоторая функция. Преобразование E) называется гра- градиентным преобразованием второго рода. Для того чтобы избежать такой неоднозначности, на четырехмерный вектор {Ak} можно на- наложить некоторые дополнительные условия. Обычно в качестве такого дополнительного условия берется так называемое условие Лоренца
190 ВАРИАЦИОННЫЕ ЗАДАЧИ С ЧАСТНЫМИ ПРОИЗВОДНЫМИ [ГЛ. VII Компоненты щие тензорного векторов поля Е и /° Г* \Е3 И удобно Е\ — 0 н2 — рассматривать как составляю- F F \ тт М \ По Jin \ о нА- G) я,, о/ Через электромагнитный потенциал \Ak) эти составляющие выра- выражаются следующим образом: и dAi dAk (ЯЛ С прмощью тензора Hkt уравнения Максвелла записываются в виде з = 0.1.2.3). (9) , dHim п - ; 0. 1. 2. 1. 2. 3. 2. 3, 0. 3. 0. 1. Переходя здесь к потенциалу {Ak}t получаем, что уравнения A0) являются следствием равенств (8), а уравнение (9) с учетом условия Лоренца F) приводится к виду 00 где u в** д4 д4 dxV Покажем, как это уравнение для [Ak] получается с помощью принципа стационарного действия. Для электромагнитного поля лагранжиан имеет следующий вид *): ± A2) *) Это выражение для лагранжиана электромагнитного поля может быть получено из следующих общих соображений. Оно представляет собой единственную с точностью до постоянного множителя комбинацию Е и И, инвариантную относительно преобразований Лоренца и градиентного пре- преобразования, не содержащую членов выше второй степени (последнее усло- условие обеспечивает получение в качестве соответствующих уравнений Эйлера линейных уравнений).
§ 35) УРАВНЕНИЕ КЛЕЙНА — ГОРДОНА И УРАВНЕНИЯ МАКСВЕЛЛА 191 Заменив здесь Е и Н их выражениями D) через вектор электро- электромагнитного потенциала {Ak}, получим {(§J} A3) Уравнения Эйлера отвечающие этому лагранжиану, могут быть приведены к виду A1). Проверим это, например, для компоненты AQ (для остальных выкладки аналогичны). Из A3) получаем, что dL - — о dL — 1 (дА° дАЛ д(дАо\ \ дх0 ) dL _ J_ / дА0 _ дА2\ д( дАо\ ~ 4*\ дх2 дх0) \дх2) f dL 1_ / дА0 дАл \ dL 4^ \ дх3 д. \дх Следовательно, <? dL dL dxf А(дАъ\ дА 0 - 47U [ ^2 Из условия Лоренца F) получаем, что дАх . ^Л2 . дАч дА ОХ\ ох2 дх§ uXq Поэтому 3 дхп 4л I a v-2 ~»~ xJ* т. е. для А = 0 уравнение A4) принимает вид дх дх дх si y Аналогично при ^=1, 2, 3 получаем
192 ВАРИАЦИОННЫЕ ЗАДАЧИ С ЧАСТНЫМИ ПРОИЗВОДНЫМИ [гл. VII Но это и есть не что иное, как записанное в компонентах уравне- уравнение (И). Приводя уравнение (ИХ к виду A5), мы воспользовались усло- условиями Лоренца. Вместо этого мы могли бы заранее ввести в лагран- лагранжиан дополнительный член, а именно положить v^-^J}. A6) Уравнения Эйлера для такого лагранжиана приводятся к виду A5) при произвольном \Ak). Налагая условия Лоренца, мы сводим A6) к A3). Лагранжиан A3), отвечающий уравнениям Максвелла, инвариантен относительно градиентных преобразований, образующих группу, завися- зависящую от одной произвольной функции, а также относительно параллель-, ных переносов и преобразований Лоренца. В силу теоремы Нетер инва- инвариантность лагранжиана относительно указанных преобразований, приводит к соответствующим законам сохранения. Именно инвариант- инвариантность относительно параллельных переносов приводит к сохранении* энергии и трех компонент импульса, а инвариантность относительно лоренцевых преобразований дает сохранение момента количества движения *). Инвариантность лагранжиана A3) относительно группы градиент- градиентных преобразований, зависящих от произвольной функции, означает в соответствии со второй теоремой Нетер наличие линейной зависи- зависимости между соответствующими уравнениями Эйлера, т. е., иначе говоря, неоднозначность их решения. Действительно, уравнениями Максвелла электромагнитный потенциал , [Ak] не определяется одно- однозначно. Для получения однозначного решения к уравнениям Максвелла следует присоединить еще одно уравнение, в качестве которого обычно берется уже упоминавшееся выше условие Лоренца div.4—^*- = 0. *) Отметим, что уравнения Максвелла инвариантны не только относи- относительно параллельных переносов и преобразований Лоренца, но и относи- относительно некоторой более обширной группы преобразований, зависящих от 15 параметров. Инвариантность относительно этой группы приводит к тому» что, кроме упоминавшихся выше 10 законов сохранения, имеют место еще 5, не имеющие, впрочем, непосредственного физического смысла. Подробно вопрос о законах сохранения для уравнений Максвелла рассмотрен, напри- например, в работе Бессель-Хаген, Matheraatische Annalen, 84, 1921, 258.
ГЛАВА VIII ПРЯМЫЕ МЕТОДЫ ВАРИАЦИОННОГО ИСЧИСЛЕНИЯ. ВАРИАЦИОННЫЕ МЕТОДЫ В ЗАДАЧЕ ШТУРМА — ЛИУ'ВИЛЛЯ § 3S. Понятие о прямых методах вариационного исчисления Основным методом, доказательства существования и фактического нахождения решения той или иной вариационной задачи, которым мы пользовались в предыдущих главах, было сведение этого вопроса к вопросу о существовании решения некоторого дифференциального уравнения (или системы дифференциальных уравнений). Этот метод, однако, не всегда приводит к желаемому результату. Его применение осложняется еще тем, что для решения задач вариационного исчисления требуется нахождение решения соответствующих дифференциальных уравнений не в малой окрестности некоторой точки (как это обычно делается в теории дифференциальных уравнений), а в некоторой фиксированной области, на границе которой искомое решение должно удовлетворять определенным граничным условиям. Возникающие на этом пути трудности заставили искать в вариационном исчислении другие, так называемые прямые методы (т. е. не сводящие вариацион- вариационную задачу к дифференциальным уравнениям). Развитие прямых методов вариационного исчисления оказалось полезным не только непосредственно для вариационных задач, но и для других областей математики, в частности, они нашли широкое применение в теории дифференциальных уравнений. Основная идея использования вариационных методов в дифференциальных уравнениях состоит в следующем. Если данное дифференциальное уравнение можно рассматривать как уравнение Эйлера для некоторого функционала и если установлено тем или иным путем, что этот функционал имеет экстремум в классе достаточно гладких функций, то тем самым устанавливается, что исходное уравнение имеет решение, удовлетворяющее краевым усло- условиям, отвечающим рассматриваемой вариационной задаче. Как будет показано ниже, прямые методы вариационного исчисления дают воз- возможность не только доказывать существование соответствующего реше- решения, но и фактически находить его с любой степенью точности.
194 ПРЯМЫЕ МЕТОДЫ ВАРИАЦИОННОГО ИСЧИСЛЕНИЯ [ГЛ. VIII Существует много различных приемов, объединяемых общим назва- названием «прямые методы». Один из наиболее употребительных среди них — так называемый метод Ритца — мы рассмотрим ниже. Однако большинство всех этих методов основано на одной и той же общей идее, которая состоит в следующем. Рассмотрим, для определенности, задачу о нахождении минимума некоторого функционала J[y], определенного на каком-то классе Ш допустимых кривых. Для того чтобы задача имела смысл, следует предположить, что в классе Ш существуют кривые, для которых J[y] < +со, и что inf J[y] = p >—оо. A) В этом случае, по определению точной нижней грани, существует такая последовательность кривых ylt у2, ..., уп, ... —мы назовем ее минимизирующей последовательностью, — что Mm J\yn] = ^ B) л-»оо Если для последовательности [уп] существует предельная кривая у(°) и если окажется законным предельный переход J[y^]=\imJ[ynl C) то тогда т. е. предельная кривая у(°) и будет решением рассматриваемой задачи. Таким образом, решение вариационной задачи прямым методом сла- слагается из 1) построения минимизирующей последовательности {уп}> 2) доказательства существования у этой последовательности пре- предельной кривой у(°), 3) доказательства законности предельного перехода C). Сами члены минимизирующей последовательности можно рассмат- рассматривать как приближенные решения соответствующей вариационной задачи. Подчеркнем следующее. 1. Построение минимизирующей последовательности, очевидно, возможно всегда, если только inf У [у] >—оо. Каждый из употреб- употребляемых в вариационном исчислении прямых методов характеризуется, собственно говоря, именно способом построения минимизирующих последовательностей. Подробнее об этом будет сказано в следующем параграфе. 2. Хотя минимизирующую последовательность можно построить во всякой вариационной задаче, предельная кривая такой последова-
§ 36] ПОНЯТИЕ О ПРЯМЫХ МЕТОДАХ ВАРИАЦИОННОГО ИСЧИСЛЕНИЯ 195 тельности может не существовать. Рассмотрим, например, функционал 1 -1 он принимает положительные значения и для него В качестве минимизирующей последовательности здесь можно взять последовательность функций f («=1,2, ...)• D) -УпК ' arctgrz Действительно, = f arctgnnX(\ + nV) = 2/iarctg* ~*° "РИ 1 -1 Но последовательность D), очевидно, в классе непрерывных функций, удовлетворяющих граничным условиям у(—1) = —1, уA)=1, ника- никакого предела не имеет. 3. Вопрос о законности предельного перехода C) в предположении существования предела минимизирующей последовательности (если уп—>у понимается как сходимость самих только функций без про- производных) для функционалов тоже не тривиален, поскольку рассма- рассматриваемые в вариационном исчислении функционалы, вообще говоря, не непрерывны в метрике С, и следовательно, значение функционала J для функции у(°) — lim yn% вообще говоря, отлично от lim J[yn]. Л->оо Л->оо В ряде случаев обосновать предельный переход C) можно с помощью следующих соображений. * Для справедливости равенства C) непрерывность функционала J[y] не обязательна, а достаточно, чтобы он был полунепрерывен снизу*). *) Напомним определение полунепрерывности снизу (для обычных функ- функций действительного переменного). Неравенство n с помощью которого определяется непрерывность в точке х, равносильно двум неравенствам f(x + h)—f(x)> — zt (a) f(x + h)-f(x)<z. (b) Если для любого е > 0 существует такое Ь, что при всех | h \ < о выполнено первое неравенство, то функция называется полунепрерывной снизу в точке х. Заменив неравенство (а) неравенством (Ь), мы получим определение полу- полунепрерывности сверху (которое было бы существенно при рассмотрении вопроса о максимуме функционала).
196 ПРЯМЫЕ МЕТОДЫ ВАРИАЦИОННОГО ИСЧИСЛЕНИЯ [ГЛ. VIII Действительно, тогда, с одной стороны, lim J[yn)=\ntJ[y]t E) а с другой, в силу полунепрерывности снизу, при всех достаточно больших я, откуда при п—>оо получаем т. е., в силу произвольности е > О, /[/] < lim J[yn]. F) п ->оо Таким образом^ из E) и F) получаем, что действительно ./[/] = Hm J[ya\. П->ОО если только функционал J полунепрерывен снизу. Аналогичным обра- образом при нахождении с помощью прямых методов максимума функ- функционала достаточно, для законности соответствующего предельного перехода, чтобы рассматриваемый функционал был полунепрерывен сверху. § 37. Метод Ритца и метод ломаных Как было сказано выше, основой так называемых прямых мето- методов вариационного исчисления является построение минимизирующих последовательностей функций. Одним из наиболее распространенных" прямых методов является метод.Ритца, который состоит в следующем. Пусты ищется минимум функционала J[y), (О заданного на каком-то многообразии, лежащем в некотором линей- линейном нормированном пространстве Е. Рассмотрим некоторую последовательность функций из Е такую, что как сами функции, так и их линейные комбинации; являются допустимыми для функционала A). Поставим задачу: при заданном п выбрать коэффициенты ck, k=\, 2, ..., п так, чтобы значение п\ D)
§ 37] МЕТОД РИТЦА И МЕТОД ЛОМАНЫХ 197 было возможно меньше. Это — задача о нахождении минимума функ- функции от п переменных (которыми являются cv с2, .. -, сп), т. е. несрав- несравненно более простая, чем нахождение минимума функционала A). Таким образом, при каждом п мы получим соответствующий мини- минимум |хя. Ясно, что при увеличении п этот минимум не может воз- возрастать, т. е. Pi > V-2 > поскольку среди линейных комбинаций первых п -f- 1 функций со- содержатся все линейные комбинации первых п функций. Рассмотрим теперь вопрос о том, при каких условиях можно утвер- . ждать, что получающаяся таким образом последовательность функ- функций уг, у2> •••» Ул» ••• — минимизирующая, т. е. что П->со есть минимум функционала A). Теорема. Если функционал A) непрерывен*), а система функций B) — полная (тц, е. линейные комбинации C) этих функ- функций образуют множество, всюду плотное в пространстве, на кото- котором задан A)), то ИГЛ |ЛЯ = [А, п ->оо где [а — минимум функционала A). Доказательство. Пусть у* — кривая, на которой реализу- реализуется минимум функционала A), и пусть задано некоторое е > 0. Так как функционал A) предполагается непрерывным, то найдется такое 8 > 0, что как только \\у.— У*||<8. Среди линейных комбинаций вида C) най- найдется такая, обозначим ее уп, что НЯ.-.У1К8. Тогда согласно E) Если теперь уп — та линейная комбинация, на которой функция D) при данном п достигает минимума, то *) В смысле метрики того пространства Е, на котором он рассматри- рассматривается. 14 Зак. 2486. Гельфанд и Фомин
198 ПРЯМЫЕ МЕТОДЫ ВАРИАЦИОННОГО ИСЧИСЛЕНИЯ [ГЛ. VII! откуда в силу произвольности 8 получаем, что lim J[yn] = p.. /I->oo Теорема доказана. Эта теорема применима, например, в том случае, когда функцио- функционал вида ь 7(х, У, yf)dx рассматривается на некотором множестве, лежащем в Dv поскольку в этом пространстве функционал указанного вида непрерывен. Замечание 1. Во многих задачах математической физики при- приходится рассматривать такие функционалы (*, у, y')dx. в которых подынтегральное выражение F (xt yt уг) квадратично отно- относительно у и у'. В этом случае уравнения, которые получаются для определения коэффициентов ck, будут линейными, и следовательно, нахождение этих коэффициентов не представляет существенных труд- трудностей. Замечание 2. Быстрота сходимости метода Ритца для дан- данной вариационной задачи зависит, очевидно, как от самой рассматри- рассматриваемой задачи, так и от выбора функций Следует подчеркнуть, что во многих случаях достаточно взять линей- линейную комбинацию совсем небольшого числа функций срл C—4, иногда даже меньше) для того, чтобы получить вполне удовлетворительное приближение к точному решению. Пользуясь геометрическим языком, основную идею метода Ритца можно пояснить следующим образом. Нам нужно найти минимум функционала J[y], рассматриваемого на некотором многообразии Ф, имеющем бесконечное число измерений. Мы заменяем это многообра- многообразие совокупностью линейных комбинаций п первых функций из неко- некоторой фиксированной последовательности {срл}, т. е. многообразием не более чем п измерений (полагая п=\, 2,...), и ищем минимум нашего функционала на этом конечномерном многообразии, т. е., иначе говоря, ищем в этом конечномерном многообразии тот вектор, который является возможно лучшим приближением решения исходной вариационной задачи. Беря последовательно линейные комбинации одной, двух и т. д. функций, мы получаем последовательность вложенных друг в друга многообразий Фп возрастающей размерности. Если линейные
§ 38] СОБСТВЕННЫЕ ФУНКЦИИ И ЗНАЧЕНИЯ ЗАДАЧИ ШТУРМА ЛИУВИЛЛЯ 199 комбинации функций )срл} всюду плотны в многообразии Ф, то это означает, что векторами из Фп (при различных п) можно сколь угодно точно аппроксимировать любой элемент из Ф, в частности тот, кото- который дает решение рассматриваемой вариационной задачи (если такой существует). Аппроксимация бесконечномерного многообразия конечномерными лежит в основе многих прямых методов вариационного исчисления. Укажем из них еще один, встречающийся, по существу, уже у Эйлера. Еще в гл. I мы упоминали в связи с выводом уравнения Эйлера о том, что каждую задачу о нахождении экстремума функционала ь (*, у. y')dx F) можно (приближенно) заменить задачей о нахождении экстремума для функции конечного числа переменных, если искомую функцию заменить ломаной, вершины которой имеют фиксированные абсциссы xi> Х2> •••» хп> а ее производную у' (х) — разностным отношением При этом функционал F) заменяется функцией конечного числа переменных ('=1. 2, ..- п). Найдя при каждом п ту ломаную, которая дает минимум соответ- соответствующей функции п переменных, мы построим последовательность ломаных, которые можно рассматривать как приближенные решения исходной вариационной задачи. Говоря о методе Ритца и о методе ломаных, мы ограничились здесь указанием способов фактического построения приближенных решений, оставив в стороне вопросы сходимости и вопросы суще- существования точного решения. Подробное изложение прямых методов и их применений читатель найдет, например, в книгах: Л. В. Канторович и В. И. Крылов, «Приближенные методы высшего анализа» и С. Г. Михлин, «Пря- «Прямые методы математической физики». § 38. Собственные функции и собственные значения краевой задачи Штурма — Лиувилля Рассмотрим применение прямых методов вариационного исчисления к дифференциальным уравнениям на примере следующей задачи. Данр дифференциальное уравнение Штурма — Лиувилля >.y, A)
200 ПРЯМЫЕ МЕТОДЫ ВАРИАЦИОННОГО ИСЧИСЛЕНИЯ [ГЛ. VII) где Р(л:)>0 имеет непрерывную производную и даны граничные условия У(а) = у(Ь) = 0. B) Требуется найти решения уравнения A), удовлетворяющие гранич- граничным условиям B), определив при этом те значения параметра X, при ко- которых эта задача имеет решения, отличные от тождественного нуля. Совокупность уравнения A) и граничных условий B) мы будем называть краевой задачей Штурма — Лиувилля. Те значения параметра, при которых уравнение A) имеет ненулевые решения, удовлетворяю- удовлетворяющие условиям B), называются собственными значениями, а сами эти решения — собственными функциями данной краевой задачи. В этом параграфе мы с помощью прямых методов вариационного исчисления установим следующую теорему. Для краевой задачи A), B) существует бесконечная последо- последовательность собственных значений \>\ Хл ,. . ., причем каж- каждому из \п отвечает единственная, с точностью до постоянного множителя, собственная функция. Одновременно с доказательством сформулированного утверждения мы получим и способ приближенного нахождения этих собственных значений и отвечающих им собственных функций. Заметим прежде всего, что уравнение A) есть уравнение Эйлера, отвечающее следующей задаче на условный экстремум: найти минимум функционала ь f dx C) а при условиях Ь f D) 0. B) Поэтому, если некоторая функция у(х) будет решением этой вариа- вариационной задачи, то она будет решением и уравнения A) (отличным, очевидно, от тождественного нуля в силу условия D)). Для применения к этой вариационной задаче прямых методов покажем прежде всего, что интеграл C) ограничен снизу. Так как Р(л:)>0, то a a 110 ь ь J у2 dx = М,
§ 38] СОБСТВЕННЫЕ ФУНКЦИИ И ЗНАЧЕНИЯ ЗАДАЧИ ШТУРМА — ЛИУВИЛЛЯ 201 где М= min Q(x). Таким образом, интеграл B) действительно ограничен снизу. Воспользуемся теперь изложенным в предыдущем параграфе мето- методом Ритца. Для упрощения записи будем вместо интервала (а, Ь) рассматривать интервал @, тс). Возьмем на этом интервале какую- либо полную ортогональную систему функций {срл (х)}> удовлетво- удовлетворяющих граничным условиям B), например {sinnx}. Рассмотрим всевозможные линейные комбинации первых т функ- функций этой системы т Ут (X) = 2 <*п Sin ПХ E) /2=1 и будем искать минимум функционала C) только на этих функциях. Сам функционал C) при этом запишется в виде квадратичной формы F) 0 а условие D) — в виде , sin nx I dx= 1. G) Граничные условия выполняются автоматически в силу самого выбора функций срл (х) = sin nx. Выполнив в левой части равенства G) интегрирование почленно, получим Это равенство означает, что квадратичная форма F), к которой сво- сводится функционал C) на множестве функций вида E), рассматри- рассматривается на поверхности сферы в /тг-мерном пространстве. По теореме Вейерштрасса форма F) достигает на сфере (8) минимума в некото- некоторой точке. Пусть это будет точка (av a2, .... ат) и пусть т Ут=^ап Sin ПХ' п= 1 Полагая т=\, 2, ..., получим последовательность минимумов
202 ПРЯМЫЕ МЕТОДЫ ВАРИАЦИОННОГО ИСЧИСЛЕНИЯ [ГЛ. VITI соответствующих квадратичных форм. Легко видеть, что всегда Действительно, 'т = Л*1 am] = J [а, ат, 0|, а добавление еще одного аргумента может только уменьшить мини- минимум функции. Отсюда и из установленной выше ограниченности функ- функционала J снизу следует, что существует предел lim Х(Л} = ХA). A1) т Мы доказали сходимость числовой последовательности {X^j, соста- составленной из минимумов функционала О на совокупностях функций вида т 2 ап sin nx л = 1 при т=\ч 2, ... Теперь естественно было бы попытаться доказать сходимость последовательности тех функций т Ут(х)= 2 ans\nnx, п = \ на которых соответствующие минимальные значения принимаются. Сначала мы сделаем несколько меньше, а именно покажем, что последовательность {ут(х)} содержит некоторую равномерно сходящуюся подпоследовательность. Покажем для этого, что совокупность функций {ут(х)\ равно- равномерно ограничена и равностепенно непрерывна *). Действительно, из сходимости последовательности *) Семейство функций W, заданных на [я, Ь], называется равномерно ограниченным, если существует такая постоянная С, что | ф (х) |< С для. всех ф ^ Ч? и всех а^.х ^.Ь. Оно называется равностепенно непрерывным, если для каждого ? > 0 найдется такое 5 > 0 (одно и то же для всех ф), что | ф (х{) — ф (х2) I < е, как только \х{ — х2\ <Ь для всех ф ? W.
§ 38] СОБСТВЕННЫЕ ФУНКЦИИ И ЗНАЧЕНИЯ ЗАДАЧИ ШТУРМА — ЛИУВИЛЛЯ 203 следует ее ограниченность. Таким образом, при всех т, где М — некоторое постоянное число. Поэтому f Py'* fQf и так как Р(х) > 0, тс dx Мх A2) Из этого неравенства легко получаем, что функции ут равностепенно непрерывны и равномерно ограничены. Действительно, из условия вытекает, что Воспользовавшись неравенством Коши — Буняковского, отсюда по- получаем Г = /y'mwdx Lo -I Lo -I о т. е. {ут(х)) равномерно ограничены. Далее, так как X, 2 х, X, f y'm(x)dx < fdx f y* го {ут(х)} равностепенно непрерывны. Согласно теореме Арцела*) из последовательности ух, у2 у,т, ... можно выбрать равно- равномерно сходящуюся подпоследовательность Положим Л -» ос A4) *) Теорема Арцела состоит в том, что из каждой равномерно ограни- ограниченной и равностепенно непрерывной последовательности можно выбрать равномерно сходящуюся подпоследовательность.
204 ПРЯМЫЕ МЕТОДЫ ВАРИАЦИОННОГО ИСЧИСЛЕНИЯ [ГЛ. VIII и покажем, что эта предельная функция удовлетворяет уравнению Штурма — Лиувилля A). Трудность здесь состоит в том, что в интеграле мы не можем непосредственно перейти к пределу при k —> сю, так как нам ничего не известно о сходимости производных у' (х). Поэтому из того, что при каждом k функция ymk(x) реализует минимум инте- интеграла A5) в соответствующем конечномерном пространстве, еще не вытекает сразу, что предельная функция у (х) дает минимум функ- функционала A). Для того чтобы обойти указанное затруднение, докажем предварительно следующую лемму. Лемма. Если для любой функции С (л:), имеющей непрерывные первую и вторую производные и удовлетворяющей граничным условиям B), выполнено равенство f где то у дважды дифференцируема и L [у] — 0. Доказательство. Проинтегрируем выражение .')'+Qi4yd*=0 о по частям. Получаем тс " Qfy dx = 0 = / — PVydx + fV'l fP'ydAdx+ftr \ f if Qiydzjdtldx — 0 0 \0 J q Lq \0 / J ¦к тх / x \ - — С (it) J P'y dx — С (ic) J J Qxy dt dx.
§ 38] СОБСТВЕННЫЕ ФУНКЦИИ И ЗНАЧЕНИЯ ЗАДАЧИ ШТУРМА — ЛИУВИЛЛЯ 205 Пусть С(х) выбрана так, что* С (тс) = 0. Тогда два последних члена в полученном выражении обращаются в нуль, и мы получаем равенство J> \-Py + fP'ydx + f [fQ.ydz для любой дважды непрерывно дифференцируемой С(х), удовлетво- удовлетворяющей условиям С @) = С (тс) —0 и ?'(тс) = 0. Отсюда с помощью интегрирования по частям легко получается, что выражение, стоящее здесь в квадратных скобках, представляет собой многочлен первой степени — Py + fP'ydx-\-flfQlydz)dt = c0+clx. A6) о о *о / Так как в этом равенстве как правая часть, так и второе и третье слагаемые в левой части имеют производные, то имеет производную и выражение —Ру. Поэтому равенство A6) можно продифференци- продифференцировать почленно. Получаем X — (Ру)' -\-Р*у + J Q,y dx = cv Так как функция Р(х) не обращается в нуль и дифференцируема, то существует у'. Поэтому, дифференцируя Ру как произведение и приводя подобные члены, окончательно получаем cl. A7) Так как здесь правая часть и второе слагаемое в левой части равен- равенства дифференцируемы, то существует (Ру')'. Дифференцируя A7) почленно, получаем Лемма доказана. Вернемся теперь к нашей основной задаче и покажем, что функ- функция у(х), представляющая собой предел построенной нами подпо- подпоследовательности {Утк(х)}> удовлетворяет уравнению A) при X, равном X = lim Xm . т -»оо
206 ПРЯМЫЕ МЕТОДЫ ВАРИАЦИОННОГО ИСЧИСЛЕНИЯ [ГЛ. VIII Точка (av a2, ..., ат), в которой квадратичная форма Jm достигает минимума, определяется, согласно теории условного экстремума, из уравнений 0 \л=1 / / Л/ т \ Р (*) [У ап sin' nx sin' о v \«=i / ^ansmnx\ sit\kx\dx = 0t (k = 1, 2, .. ., m). A8) Умножив каждое из этих равенств на произвольное постоянное А(™) и просуммировав по k от 1 до aw, получим m\dx=O, A9) и о где т Ст (х) = 2 А^ sin &x. B0) Пусть С—произвольная дважды дифференцируемая функция, удо- удовлетворяющая граничным условиям B). Тогда коэффициенты Л(Лт) можно при каждом т—\, 2, ... выбрать так, что Отсюда следует, что Z, [Cm]-> Z. [С] при т->оо. Пусть теперь в равенстве A9), которое можно переписать в виде J-mdx, B1) т пробегает последовательность значений mk, отвечающую сходя- сходящейся к функции у(х) подпоследовательности {у (х)[. Мы можем при этом в равенстве B1) перейти к пределу. Получим J ? [С] У rf* = XA> f y^dx B2)
§ 38] СОБСТВЕННЫЕ ФУНКЦИИ И ЗНАЧЕНИЯ ЗАДАЧИ ШТУРМА — ЛИУВИЛЛЯ 207 для любой дважды непрерывно дифференцируемой функции С (л:). В силу доказанной выше леммы отсюда получаем, что у(х) имеет две непрерывные производные и Действительно, достаточно в указанной лемме положить Итак, мы показали, что у (л;) удовлетворяет уравнению A). Выше мы определили у(х) как предел некоторой подпоследова- подпоследовательности (.У/иЛ*)} последовательности {ут(х)\. Покажем, что после- последовательность {ут(х)} сама сходится к у(х). Для этого восполь- воспользуемся тем, что если X задано, то решение уравнения удовлетворяющее граничным условиям и условию нормировки тс J y2(x)dx= 1, о определено с точностью до знака. Рассмотрим такое решение, и пусть в точке xQ это решение отлично от нуля у(хо)=/=О. Выберем знак у у(х) так, что у(хо)>О. Знак ут(х) будем выбирать так, что Ут(х0)'^>0 при каждом т. Если {ут(х)} не сходится к у(х), то из {ут(х)} можно выбрать вторую подпоследовательность, схо- сходящуюся к некоторому другому решению у(х)Ф у(х). В силу ука- указанной выше единственности (с точностью до знака) решения, удо- удовлетворяющего условиям B) и D), у (х) = —у(х), но тогда у(х0) < О, что невозможно, так как ут(х0)^0. Таким образом, ут(х)->у(х) (равномерно), если только выбирать соответствующий знак у ут(х). Мы доказали существование функции у(х), которую обозначим теперь y(l) (x), отвечающей одному собственному значению уравнения Штурма — Лиувилля. Следующая собственная функция у2(х) и отве- отвечающее ей собственное значение ХB> могут быть найдены так. Будем искать минимум интеграла C) при условиях B) и D) и дополнитель- дополнительном условии ортогональности Положим
208 ПРЯМЫЕ МЕТОДЫ ВАРИАЦИОННОГО ИСЧИСЛЕНИЯ [ГЛ. VIII Подставив это выражение в интеграл C) вместо у(х), мы снова получим некоторую квадратичную форму. Будем рассматривать эту квадратичную форму на совокупности функций вида т 2 bk sin kx, )dx = °- I удовлетворяющих условию ортогональности их к построенным выше функциям ут(х), т. е. равенству т к I m sin kx I 2 пп sin nx)dx = °- B3> Равенство B3) представляет собой уравнение {т—1)-мерной пло- плоскости в яг-мерном пространстве, проходящей через начало коорди- координат. Ее пересечение со сферой, определяемой условием D) есть сфера размерности т—1. На этой сфере наш функционал A) сводится опять-таки к квадратичной форме. Применяя теорему Вейерштрасса, видим, что эта квадратичная форма достигает на этой (т— 1)-мерной сфере минимума, который мы обозначим )Sm\ Ясно, что и так как функционал C) ограничен снизу, то существует предел ХB)= lim Xg». т -» ос При этом, очевидно, Построив последовательность функций g=Sft*sinftjf A11=1. 2, ...). каждая из которых реализует соответствующий минимум Х^ и удо- удовлетворяет условию ортогональности т к j m \ 2j bk Г sin kx ( ^j an sin nx I dx = 0, ft=l 0 \n=\ I « мы можем показать, что эта последовательность равномерно сходится к некоторой предельной функции уB) (х), удовлетворяющей уравнению граничным условиям
§ 381 собственные функции и значения задачи штурма — лиувилля 209 условию нормировки тс ff(x)dx=\ о и условию ортогональности к yW (x): It / У{1) (*) У (*) dx = 0. B4) о Таким образом, у<2) (х) представляет собой собственную функцию уравнения A), отвечающую собственному значению )S2). Так как ортогональные между собой, функции не могут быть линейно зави- зависимы, а каждому собственному значению X отвечает лишь одна (с точностью до постоянного множителя) собственная функция, то имеет место строгое неравенство Повторяя аналогичные рассуждения, можно получить собственные значения Х3, Х4, ... и отвечающие им собственные функции у@) (х)% У4)(лг) и т. д.
ДОПОЛНЕНИЕ I РАСПРОСТРАНЕНИЕ ВОЗБУЖДЕНИЯ И КАНОНИЧЕСКИЕ УРАВНЕНИЯ*) Рассмотрим распространение возбуждения в некоторой среде, которую мы будем считать неоднородной и анизотропной; таким образом, скорость распространения возбуждения зависит, вообще говоря, от точки и от направления. Относительно рассматриваемого процесса мы будем предполагать следующее: а) каждая точка может находиться лишь в одном из двух со- состояний: возбуждения или покоя. Таким образом, понятие интенсив- интенсивности возбуждения мы не вводим; б) каждая точка, до которой возбуждение дошло в момент вре- времени t, сама становится, начиная с этого момента, источником дальнейшего распространения возбуждения. Наша цель — показать, что рассмотрение такого процесса позволит получить из геометрических соображений такие основные понятия вариационного исчисления, как канонические уравнения, функцию Гамильтона, уравнение Гамильтона-Якоби и т. д. Проводимые ниже рассуждения не опираются на тот вывод этих понятий, который содержится в основном тексте книги (§§ 14, 19), и, по существу, могут его заменить. 1. Постановка задачи. Пусть среда, в которой распро- распространяется возбуждение, представляет собой я-мерное многообразие X, в котором введена некоторая система координат. Таким образом, каждая точка х из X определяется системой п чисел х1, х2, ..., хп. Выбрав в X некоторую фиксированную точку, рассмотрим совокуп- совокупность всевозможных гладких кривых x = x(s), A) проходящих через эту точку. Совокупность векторов, касательных к этим кривым в данной точке, т. е. векторов *) Вопросы, излагаемые в настоящем дополнении, авторы обсуждали с М. Л. Цетлиным.
РАСПРОСТРАНЕНИЕ ВОЗБУЖДЕНИЯ И КАНОНИЧЕСКИЕ УРАВНЕНИЯ 211 представляет собой я-мерное линейное пространство, называемое касательным пространством. Мы обозначим его Т (х). Отметим, что при переходе в X к новым координатам по формулам Л — Л \Л) \О) векторы х' касательного пространства Т (х) преобразуются по закону ***- v ***<**> D) ds ~ dxJ ds Пусть х (s) и х (s -\-ds) — две близкие точки, лежащие на неко- некоторой кривой х = х (s). Согласно сказанному выше, скорость распространения возбужде- возбуждения в X зависит от точки и от направления, т. е. от х и х''. Обозначим через /(х, xf) величину, обратную этой скорости; тогда время dt, за которое возбуждение пройдет из точки х (s) в точку х (s -j-ds), можно представить в виде s. E) а время, за которое возбуждение распространится вдоль некоторой конечной дуги, соединяющей точки хх = х (sx) и х2 = х (s2), равно Если точка хх возбуждена, то время, через которое возбужденной окажется некоторая точка х2, равно min ff(x.%f)ds. G) Si где минимум берется по всем кривым х = х (s), соединяющим точки хх и х2. Действительно, если возбуждение, распространяясь из точки хх по всевозможным направлениям, уже дошло по какому- либо пути до точки х2, то все другие соединяющие эти точки пути, по которым возбуждение распространяется за большее время, уже не играют роли. Таким образом, процесс распространения возбужде- возбуждения в некоторой среде всегда подчиняется известному принципу Ферма: возбуждение распространяется из одной точки в другую всегда вдоль того соединяющего эти точки пути, который оно про- проходит за наименьшее время. Эти пути мы будем называть траекто- траекториями возбуждения.
212 ДОПОЛНЕНИЕ I Вернемся к введенной нами функции f(x, х'). Так как время распространения возбуждения вдоль любой кривой положительно, то / О, х') > 0, если xf Ф 0. (8) Далее, время распространения возбуждения вдоль некоторой кривой, т. е. величина F), должно зависеть только от этой кривой (а не от выбора ее параметризации). Как известно (см. гл. II § 8), это имеет место в том случае, если функция f (х, х') положительно однородна первой степени относительно х', т. е. если x/) при /г>0. (9) Поскольку при изменении направления на, противоположное скорость распространения возбуждения не меняется, то /(*.—*') = /(*.*'). (Ю) Функция f(x, х') удовлетворяет условию выпуклости fix, jc' + j?)</(*. *')+/(*. х'). A1) Действительно, пусть рассматриваемая среда однородна, т. е. / зави- зависит только,от хг (но не от точки х). Пусть хг и хг — два вектора из Т{х)\ возбуждение за время / (х') распространяется вдоль хг и за время f (xf)— вдоль х'. Тогда оно распространится вдоль х'-\-хг за время, не превышающее f(x')-{-f(x')t т. е. Если же / зависит от х, но эта зависимость достаточно гладкая (скажем, существуют производные -~\* то те же рассуждения пока- V дх1) зывают, что условие выпуклости будет выполняться для достаточно малых хг и x't а отсюда, в силу однородности функции / по х\ оно будет выполнено и для всех х'', хг. Мы будем предполагать функцию / удовлетворяющей несколько более сильному, чем A1), условию строгой выпуклости, а именно знак = в A1) имеет место только в том случае, когда х' = \х\ где X > 0. Пусть имеется возбуждение, которое в момент t = 0 занимает некоторую область и затем распространяется дальше. Границу зоны возбуждения мы будем называть фронтом волны. Уравнение фронта волны в момент t можно записать в виде S(x, t) = 0. Задачу нашу можно теперь сформулировать следующим образом: найти уравнение, которому удовлетворяет функция S(x, t), описы- описывающая фронт волны, и уравнения траекторий возбуждения. 2. Сформулируем поставленную задачу в терминах теории нормированных пространств.
РАСПРОСТРАНЕНИЯ ВОЗБУЖДЕНИЯ И КАНОНИЧЕСКИЕ УРАВНЕНИЯ 213 В я-мерном линейном пространстве Т(х) введем норму, положив ||*'||=/(*. X'). Из условий (8) — A1) следует, что f(x, xf) действительно обладает всеми свойствами нормы (определение нормы см. в § 2). Совокуп- Совокупность векторов из Т(х), удовлетворяющих условию f(x, *')<«. т. е. ||*'!|<а, будем называть сферой радиуса а в Т(х) (с центром в точке х). Таким образом, сфера радиуса а — это та область пространства Т(х), на которую распространится за время а возбуждение, в начальный момент сосредоточенное в точке х. Мы можем теперь рассматриваемую задачу сформулировать так: дано я-мерное многообразие X, в каждой точке х которого опре- определено касательное пространство Т(х). В Т(х) задана норма f(x, x'), удовлетворяющая, кроме обычных аксиом нормы, условию строгой выпуклости. Найти уравнения, описывающие процесс возбуждения, который из каждой точки х за время dt распространяется по сфере 3. Рассмотрим, наряду с нормированным пространством Т(х), пространство Т(х) линейных функционалов на нем (определение линейного функционала см. в § 3). Т(х) представляет собой я-мерное пространство, элементами которого являются векторы р = (рг, .. ., рп), называемые контраградиентными векторам из Т(х). Пространство линейных функционалов на некотором линейном нормированном пространстве называется пространством, сопряженным к данному *). В сопряженном пространстве норма вектора р определяется сле- следующим образом: где sup берется по всем хг Ф 0 из Т(х), а (р, xf) означает п 2 Pixi'> т- е- значение линейного функционала р?Т(х) в точке х~' ? Т(х). Обозначим норму элемента р^Т(х) через Н(х, р). Таким образом, по определению *) О понятии сопряженного пространства см., например, И. М. Гель- фанд, «Лекции по линейной алгебре», § 22.
214 ДОПОЛНЕНИЕ Т Можно показать, что переход от функции f(x, xf) к функции Я(х, /?), определяемый формулой A2), представляет собой не что иное, как преобразование Лежандра (рассмотренное нами в гл. IV, § 15), но только в параметрической форме. 4. Уравнение Гамильтона — Якоб и. Пусть S(x,t) = = 0— уравнение фронта волны в момент /. Найдем дифференциаль- дифференциальное уравнение, которому удовлетворяет функция S (x, t). Для этого посмотрим, как происходит распространение возбуждения за неко- некоторый малый промежуток времени dt. Каждая точка поверхности S(x, t) = 0 сама служит источником возбуждения, которое за время dt распространится по сфере Фронт волны в момент t-\~dt представляет собой огибающую этих сфер; действительно, эта огибающая отделяет точки, в которые возбуждение за время, не превышающее dt, может дойти от какой- либо точки фронта 5 (х, t) = 0, от точек, до которых возбуждение за время dt дойти не успеет. Но такая «поверхность раздела» и есть фронт волны. Следовательно, эта огибающая определяется уравне- уравнением S(x, t-\-dt) = §. Сказанное означает, что гиперплоскость, каса- касательная к поверхности S{x, t-\-df), является касательной и к неко- некоторой сфере f(x, с центром в точке л:, принадлежащей поверхности S(x, t) = 0. Уравнение каждой гиперплоскости в пространстве Т(х) может быть записано в виде п 2 р: dxl = const, / = i где р = (рг рп)? 74*). В частности, уравнение гиперплоскости, касательной к поверх- поверхности S(x, t-\-dt) = O, имеет вид Если гиперплоскость A3) является в то же время касательной к сфере радиуса dt с центром в точке х, то постоянная С равна радиусу / dS dS \ сферы, умноженному на норму вектора 1:гт»«#*» ТГ*/' т* е* на Н(х,—Л. Таким образом, уравнение гиперплоскости, касательной Л. к фронту волны и к сфере радиуса dt, проходящей через точку
РАСПРОСТРАНЕНИЕ ВОЗБУЖДЕНИЯ И КАНОНИЧЕСКИЕ УРАВНЕНИЯ 215 касания, имеет вид dS >±dx> = H(x.-™Adt. A4) >xl \ дхЧ Но из уравнения фронта волны S(xt t) = 0 имеем: Из двух последних равенств окончательно получаем: Мы получили уравнение, описывающее изменение фронта волны со временем. Это уравнение A6) представляет собой не что иное, как уравнение Гамильтона — Якоби, рассмотренное нами в § 19. 5. Траектории возбуждения. Выше было сказано, что возбуждение распространяется из одной точки в другую вдоль той линии, которая реализует минимум функционала s2 ff(x, x')ds среди всех линий, соединяющих две данные точки. Поэтому диф- дифференциальные уравнения траекторий возбуждения можно получить, например, как уравнения Эйлера для функционала F). Мы, однако, выведем эти уравнения, опираясь лишь на следующие геометриче- геометрические соображения. Так как функция f(x, x')t отвечающая рассматриваемому про- процессу, предполагается дифференцируемой и строго выпуклой, то через каждую точку сферической поверхности f(x, x') = const проходит единственная касательная гиперплоскость, и эта гипер- гиперплоскость имеет со сферой только одну общую точку. Отсюда сле- следует, что для двух поверхностей S(x, 0 = 0, (а) x, t-\-dt) = O, F) представляющих собой фронт волны в близкие моменты t и t-\-dt, можно говорить о том, в какую именно точку x-\-dx поверх- поверхности (б) приходит за время dt возбуждение из данной точки х поверхности (а). Действительно, это та точка x~\-dxt через кото-
216 ДОПОЛНЕНИЕ I рую проходит гиперплоскость, касательная одновременно к поверх- поверхности (б) и к сфере радиуса dt, с центром в точке х. До остальных точек поверхности (б) возбуждение за время dt не успеет дойти из точки л;*). Таким образом, в каждой точке поверхности S(x, t), представляющей собой фронт волны в данный момент, определено некоторое направление распространения возбуждения. Итак, направление распространения возбуждения это то напра- направление, по которому возбуждение, идущее из данной точки поверх- поверхности S(x, t) = 0, достигает поверхности S(x-{-dxt t-\-dt) — O быстрее, чем по какому-либо другому направлению. Пусть f — траектория, по которой возбуждение проходит из точки х0 поверхности 5 (х, to) = O до точки хь лежащей на поверх- поверхности S(x, tl) = 0. Тогда в каждой точке направление кривой есть направление распространения возбуждения в том смысле, как это было только что определено. Действительно, вдоль той кривой, направление которой в каждой точке есть направление распростра- распространения возбуждения от данной поверхности 5 (х, t) = 0 к близкой, возбуждение проходит быстрее, чем вдоль какой-либо другой кривой. Таким образом, фиксировав однопараметрическое семейство по- поверхностей S(x, ^) = 0 и точку х0, мы получим некоторую траекто- траекторию возбуждения. Выбирая точку х0 произвольно, мы получим, что однопараметрическое семейство поверхностей S(x, t) = 0 определяет семейство траекторий возбуждения, зависящее от п—1 параметров; при этом через каждую точку х пространства X проходит одна и только одна траектория из этого семейства. Рассмотрим теперь полный интеграл уравнения Гамильтона — Якоби, т. е. его решение S(x, t% аг ап), зависящее от п параметров. Этот полный интеграл определяет {п -\- 1)-параметрическое **) семейство поверхностей S(x9 t%*x oLn) = 0. Это семейство поверхностей определяет B/г—1)-параметрическое семейство траекторий возбуждения. Так как траектории возбужде- возбуждения — это экстремали функционала F), то полученный результат представляет собой геометрическую интерпретацию теоремы Якоби *) Физически это означает следующее. Если поверхность (а) изменить лишь в малой окрестности точки х> то поверхность (б) при этом изменится также лишь в некоторой малой области. **) Так как S(x, t + t0, <хь ..., ап) = 0 при всяком t0 тоже представляет собой интегральную поверхность, то данное семейство действительно зависит от п + 1 параметров.
РАСПРОСТРАНЕНИЕ ВОЗБУЖДЕНИЯ И КАНОНИЧЕСКИЕ УРАВНЕНИЯ 217 о построении общего решения системы уравнений Эйлера по полному интегралу уравнения Гамильтона — Якоби *). 6. Уравнения траекторий возбуждения. Выведем теперь дифференциальные уравнен ]я траекторий распространения возбуждения. Примем за параметр вдоль каждой из таких траекто- траекторий время t. Тогда из равенства dt = f(x, dx) и однородности функции / по dx получаем: т. е. норма вектора ~-гг тождественно равна единице. Из соотноше- соотношения A4) следует, что в каждой точке х вектор —гт- (касательный к траектории, вдоль которой распространяется возбуждение) связан с ковариантным вектором р (определяющим гиперплоскость, каса- касательную к фронту волны) соотношением i=\ Для любого другого вектора р, по определению нормы вектора в сопряженном пространстве, имеем; Таким образом, выражение рассматриваемое как функция от р, достигает максимума в том случае, когда р определяет гиперплоскость, касательную к фронту волны. Поэтому вдоль траектории распространения возбуждения выполнены условия *) Мы рассматриваем параметрическую задачу; в этом случае между уравнениями Эйлера имеется зависимость (см. гл. II, § 8 и гл. VII, § 33), поэтому общее решение получающихся здесь 2л уравнений содержит только 2/г — 1 произвольных постоянных.
218 ДОПОЛНЕНИЕ I т. е. dxl _дН{хур) ~dt—~ dPi ' A/' Мы получили систему п обыкновенных уравнений 1-го порядка. Так как в них входит 2п неизвестных функций х1, ..., хп и рх, ..., рп, то для полного описания траекторий нужно пвлучить еще п уравнений. Для получения недостающих уравнений восполь- воспользуемся тем, что поверхности, представляющие собой фронт волны в различные моменты времени, не произвольны, а удовлетворяют уравнению Гамильтона — Якоби dS . rr( dS\ л \-H\x, —г 1 = О, dt ^ \ дх1) а значения рь ¦ .., рп в каждой точке траектории — это компо- компоненты —г вектора, определяющего гиперплоскость, касательную дх1 к фронту волны. Поэтому вдоль каждой траектории имеем: D = D- it} = 5 (Х^ if} ХП (t) t} следовательно, dpi _ d dS__ д dS , у d2S dxJ dt ~ dt dxl ~ 'dt дх1 ^ дх* дх1 dt Введем теперь следующие обозначения. Если функция Н(х, р) рассматривается при /?,==—г как функция от х1, ..., хп и t, то дх1 соответствующую частную производную ее по х1 будем обозначать символом дН х t = const Если же Н(х, р) рассматривается как функция 2п переменных Р\> ••-, рп, х1 хп\ то соответствующую частную производную обозначим дН 1/и' р = const
РАСПРОСТРАНЕНИЕ ВОЗБУЖДЕНИЯ И КАНОНИЧЕСКИЕ УРАВНЕНИЯ 219 Воспользовавшись уравнением Гамильтона — Якоби, мы можем равен- равенство A8) переписать в виде п dpi _ dt дН d2S t = const дх' дх1 dt A9) Найдем связь между значениями производных дИ дх1 const дН дх1 вдоль каждой траектории. Имеем: ОН дх1 /=const дН дх1 /7 = COnSt /7= COnst дН dpf дх1 ' х = const Так как вдоль каждой траектории р/=—г и = , то из A9) J dxJ dt dpj получаем: dt дН_ "дх1 const Мы получили таким образом п уравнений, которые вместе с уравне- уравнениями A7) образуют систему dxl _дН(х, р) dt ~ dpi B0) dpt dt дН(х,р) дх1 интегральными кривыми которой являются линии распространения возбуждения, т. е. экстремали функционала F). Система B0) пред- представляет собой систему канонических уравнений для вариационной задачи F). По отношению к уравнению Гамильтона — Якоби A6) система B0) является системой уравнений характеристик.
ДОПОЛНЕНИЕ II ВАРИАЦИОННЫЕ МЕТОДЫ В ЗАДАЧАХ 4 ОБ ОПТИМАЛЬНОМ РЕГУЛИРОВАНИИ 1. Здесь мы кратко изложим некоторые результаты, относящиеся к так называемой теории оптимальных процессов. Эти результаты принадлежат Л. С. Понтрягину и его ученикам; они содержатся в монографии Л. С. Понтрягина, В. Г. Болтянского, Р. В. Гамкре- лидзе и Е. Ф. Мищенко «Математическая теория оптимальных про- процессов» *). Рассмотрим связь этой теории с классическими вари- вариационными задачами. Нахождение для некоторой системы режима работы, наивыгод- наивыгоднейшего с той или иной точки зрения, приводит к математической задаче, которую можно сформулировать так. Пусть закон изменения состояния некоторого объекта с течением времени дается системой дифференциальных уравнений или в векторной форме -?L = f(x, и), B) где х1, .... хп — функции времени /, a fl(x, и) — функции, опре- определенные и непрерывные для всех х?Х и всех и = (и1г и2, . . ., uk), принадлежащих некоторой фиксированной области Й /г-мерного пространства**). Задав функцию u = u(t) (со значениями из 2), мы получим вместо системы A) систему - •?|? = f (х\ .. .. х": и, @ и, (О )Г C) *) См. также Л. С. П о н т р я г и н, Оптимальные процессы регулиро- регулирования, Успехи матем. наук, 14, № 1 (85), 1959, стр. 3—20; В. Г. Б о л т я н- ский, Р. В. Гамкрелидзеи Л. С. Понтрягин, Теория оптималь- оптимальных процессов. I, Изв. АН СССР, сер. матем., 24, 1960, стр. 3—42. **) В указанных в предыдущей сноске работах рассматривается более общий случай произвольного топологического пространства У.
ВАРИАЦ. МЕТОДЫ В ЗАДАЧАХ ОБ ОПТИМАЛЬНОМ РЕГУЛИРОВАНИИ 221 которая при заданном начальном значении x(to) = xo имеет неко- некоторое определенное решение. Функции «i@. -... МО мы будем называть функциями управления. Задав эти функции на отрезке [^0, tx\ и начальное значение xo = x(to), мы получим неко- некоторую траекторию, т. е. решение системы A). Мы будем называть «управлением» совокупность функций ut (ty отрезка [t0, tx\ и начальной точки х0. В соответствии с этим упра- управление будет обозначаться символом U = (a(t)% tOt tl% x0). Пусть далее f°(xl хпу их uk) — некоторая функция, определенная вместе со своими частными производными f)fo Ъи=х-2 п) при всех х?Х и всех а ^2. Каждому управлению U поставим в соответствие число ti AU] = f f°(x, u)dt. D> to Таким образом, J[U] есть функционал, определенный на множе- множестве управлений. Управление U = (u(t)y t0, tv x0) назовем оптималь- оптимальным, если, каково бы ни было управление переводящее данную точку х0 в точку хх (г. е. такое, что соот- ветствующая^ траектория х* (t) удовлетворяет условию x*(t\) = хЛ, имеет место неравенство . E). Траекторию, отвечающую оптимальному управлению, назовем оптимальной траекторией. Задача состоит в том, чтойы найти необходимые условия опти- оптимальности управления (и соответствующей траектории). Подчеркнем следующее. Говоря об оптимальности того или иного управления, мы предполагаем, что заранее фиксирован некоторый класс управлений; мы будем называть эти управления допустимыми. Здесь мы будем предполагать, что класс допустимых управлений состоит из всех кусочно-непрерывных ограниченных функций с раз- разрывами первого рода, в каждый момент времени принимающих зна- значения из области 2.
222 ДОПОЛНЕНИЕ II Важным частным случаем задач об оптимальном регулировании является тот случай, когда функционал D) имеет вид dt% т. е. представляет собой время, за которое совершается переход из точки х0 в точку xv Таким обраэом, здесь оптимальность означает переход из х0 в хх за возможно более короткое время. 2. Задача об оптимальном управлении тесно связана с традицион- традиционными задачами вариационного исчисления. Действительно, интеграл //»(*. u)dt можно рассматривать как функционал, зависящий от n-\-k функций х1, .... хп\ аь . ... uk% т. е. как функционал, определенный на некотором классе кривых в {n-\-k-\- 1)-мерном пространстве. Функ- Функции а;1, . .., хп, их uk связаны уравнениями A). Таким образом, мы имеем здесь задачу на условный экстремум с неголономными связями (см. по этому поводу гл. III, § 10). Граничные условия, состоящие в том, что искомая оптимальная траектория x(t) начи- начинается в точке х0 и кончается в точке хь означают, что в указан- указанном (n-{-k-{- 1)-мерном пространстве допустимыми являются те кри- кривые, концы которых лежат на двух {к -|- 1)-мерных плоскостях, определяемых заданными значениями (х* х^\ и (х\ х**\ координат х1 хп. Мы видим, что задача об оптимальном регулировании предста- представляет собой видоизменение задачи на условный экстремум. Особен- Особенность, характерная для задач об оптимальном регулировании, состоит в том, что заранее фиксируется определенный класс допустимых управлений, причем непрерывность функций управления, вообще говоря, не требуется, но предполагается, что они принимают значе- значения, лежащие в некоторой фиксированной области. Покажем, что простейшая вариационная задача в я-мерном про- пространстве, в которой подынтегральное выражение не зависит явно от t *), является частным случаем задачи об оптимальном регулиро- регулировании. Пусть д^н функционал / п dxl dxn *) Это условие не является ограничением, так как к такому виду можно привести любой функционал, например, перейдя к параметрической форме задачи.
ВАРИАЦ. МЕТОДЫ В ЗАДАЧАХ ОБ ОПТИМАЛЬНОМ РЕГУЛИРОВАНИИ 223 требуется среди кривых, проходящих через точки найти ту, на которой этот функционал достигает минимума. Для того чтобы представить эту задачу как задачу об оптималь- оптимальном регулировании, достаточно функционал F) переписать в виде и ff°(xl х\ их un)dt. G) to а в качестве системы A) взять уравнения 3. Перейдем теперь к изложению условий, необходимых для того, чтобы данное управление (и отвечающая этому управлению траектория) было оптимальным. Для этой цели присоединим к системе уравнений -^-= /.(*, и), /=1, 2 п, at J l v еще одно уравнение где /0 (л:, и) — функция, определяющая тот функционал D), который мы должны минимизировать. Одновременно начальные условия *'(*о) = *о- *=!. 2 »• (9> мы дополним условием *°('о) = О. A0) Ясно, что если U — некоторое допустимое управление и x — x(t) — решение системы ах1 A1) отвечающее этому управлению и начальным условиям (9), A0), то Итак, задача об оптимальном регулировании может быть сформу- сформулирована так: найти такое допустимое управление U, при котором
224 ДОПОЛНЕНИЕ II решение x(t) системы A1), удовлетворяющее начальным условиям (9), A0), давало бы возможно меньшее значение хо(^). 4. Принцип максимума. Для того чтобы сформулировать основное необходимое условие оптимальности, так называемый принцип максимума, будем, наряду с переменными х°, х1 хп, рассматривать новые переменные ф0, tyx, ..., ф^, которые будем счи- считать подчиненными следующей системе дифференциальных урав- уравнений *): {ее называют системой, сопряженной системе A1). Сформулируем основную теорему. Теорема (принцип максимума). Пусть U = (u(t), t0, tl% xQ) — такое допустимое управление, что отвечающая ему интеграль- интегральная кривая x(t) системы A1), проходящая при t = t0 через точку @, jcJ, .... л;*), удовлетворяет условиям Положим jlax. и). Если управление U — (u(t), tOt tv x0) оптимально, то сущест- существует такая непрерывная вектор-функция ф(/), что: 1) величины x(t), ф(/) и u(t) удовлетворяют системе ура- уравнений п\ oo=0 2) для всех t, to^t ^Ctlt величина , x (t)t u)= 2j к «-0 достигает максимума при и~и (t)\ *) Эта система имеет следующий смысл Рассмотрим в пространстве X переменных хо,...,хп некоторую гиперплоскость Zo. проходящую через начальную точку @, x\t ..., х"). Пусть эта гиперплоскость определяется вектором (^, ..., <\>°п). Тогда уравнения A2) описывают перенос этой гипер- гиперплоскости вдоль траекторий, являющихся решениями уравнений A1).
ВАРИАЦ. МЕТОДЫ В ЗАДАЧАХ ОБ ОПТИМАЛЬНОМ РЕГУЛИРОВАНИИ 225 3) в момент t[ выполнены соотношения Фо d) = О, 2 фа (*д Г (х (/Д и (tx)) = 0. 0 2 а=0 этом, если ф(?), •*(*). #@ удовлетворяют условиям 1) г/ 2), /гго функции фо(*) # 2 фа(О •/* (•*(*). u(t)) переменного t на а=0 сял/ол* деля от t не зависят и тогда в условии 3) точку tx можно заменить любой другой, 5. Мы не будем приводить здесь доказательство принципа мак- максимума (читатель найдет его в цитированных выше работах), а огра- ограничимся лишь следующими замечаниями. 1°. Часто принцип максимума может быть использован как рецепт для построения оптимальной траектории, состоящий в следующем. Выберем для каждых фиксированных ф и х то значение и, при котором выражение 2 а=0 достигает максимума. Если этим требованием и определяется как однозначная функция от ф и х: и == а (ф, х), то, подставив ее вместо и в уравнения A1) и A2), мы получим замкнутую систему 2(п-\-\) уравнений с 2{п-\-\) неизвестными функциями. Это и есть те уравнения, которым должна удовлетво- удовлетворять оптимальная траектория. 2°. С помощью функции Щф> х. й)=2ф.Г(*. и) а = 0 систему уравнений A1), A2) можно записать в виде dt — дь ' (И > dt dxi ' A2 > Эти уравнения по форме напоминают канонические уравнения Гамиль- Гамильтона. На самом деле они имеют иной смысл: уравнения Гамильтона образуют замкнутую систему, в которой число уравнений равно числу неизвестных, а уравнения A1), A2) содержат кроме х и ^ неизвестные величины и и превращаются в замкнутую систему лишь при определенном выборе этих последних.
226 ДОПОЛНЕНИЕ II Для того чтобы в задаче об оптимальном регулировании полу- получить уравнения гамильтоновского типа, их нужно писать не с по- помощью функции П(ф, х, и), а с помощью функции*) ф, х% и), и 3°. В простейшей задаче вариационного исчисления система A1), A2) или эквивалентная ей система (ПО. A20 вместе с условием максимальности функции П(ф, xt и) представляет собой обычную систему уравнений Эйлера. Действительно, для простейшей задачи, записанной в виде и f х\ их un)dx. dxl функция П(ф, х, и) имеет вид , X. U) = f0 ( ч dxl J (*. «;. -jf — «/. Система (ПО. A20 при этом перепишется так: /==1. 2 л, dt ~"и' л — djc а условие максимальности П(ф, х$ и) дает: аи,- ди, Отсюда получаем: ди, /=1,2 л, но это и есть не что иное, как система уравнений Эйлера, в которой *) Переход от П к И представляет собой аналог преобразования Ле- жандра (о преобразовании Лежандра см. гл. IV, § 15).
ВАРИАЦ. МЕТОДЫ В ЗАДАЧАХ ОБ ОПТИМАЛЬНОМ РЕГУЛИРОВАНИИ 227 для приведения ее к системе уравнений 1-го порядка производная -?т- = tit принята за новую искомую функцию *). 4°. Мы уже встречались (см. Дополнение I) с тем, что всякий процесс распространения можно описывать двояко: или с помощью траекторий, по которым происходит распространение («лучи» в оптике), или с помощью движения фронта волны. Первый подход приводит к каноническим уравнениям Гамильтона или, как здесь, к уравне- уравнениям Эйлера, т. е. к системе обыкновенных дифференциальных урав- уравнений, а второй — к уравнению Гамильтона — Якоби, представляю- представляющему собой уравнение с частными производными. Изложенный выше принцип максимума связан с рассмотрением траекторий, т. е. в этом смысле аналогичен методу канонических уравнений. Подход к задачам оптимального регулирования, аналогичный рассмотрению «фронта волны», развивался в работах Беллмана (см., например, Р. Беллман «Динамическое программирование»). 6. Укажем в заключение связь между принципом максимума и вейерштрассовским необходимым условием экстремума (см. гл. VI, стр. 149). Рассмотрим сначала задачу о нахождении минимума функ- функционала J= J fo{x\ ..., x*t ax Un)dtt A3) to где Для этого случая, как мы уже знаем, выражение П(<|». х, н) = 2<КА*, и) а = 0 имеет вид П(<1>, х, a) = С другой стороны, с помощью ураЙЙений A4) функционал A3) можно записать в виде °(*] хп, х1' xn')dt. Функция Вейерштрасса для такого функционала имеет вид (см. гл. VI) ?(*. х'..г) = Р(х. г)-Р(х, х') - Jj B. -z\)fxl. (*, *')• A6) *) См. по этому поводу гл. IV, стр. 67.
228 ДОПОЛНЕНИЕ II Из формул A5) и A6) получаем: (ф. х, г) — П(ф, х, х') 1=1 /г S ° = Фо • ^ (¦*• *'• *>• A7) Если функция П достигает максимума при значениях и = л/, являю- являющихся внутренними точками области 2, то в этих точках дп 0 Так как, кроме того, ф0 — отрицательная константа, то в этом случае условие максимальности функции Н вдоль оптимальной траектории равносильно в силу равенства A7) условию т. е. известному условию Вейерштрасса. Если воспользоваться выражением функции Вейерштрасса для задач на условный экстремум (см., например, Блисс «Лекции по вариационному исчислению», стр. 264), то легко проверить, что соот- соотношение фоС = П(ф. х, *)-П(ф, х, *О-(*,-*г)-д^П(ф. х. х') остается в силе и в случае условного экстремума, т. е., иначе говоря, для любой задачи об оптимальном управлении. Из сказанного ясно, что в те!?случаях, когда множество допустимых значений управляющих функций открыто (т. е. все его точки — внутреа- ние), принцип максимума равносилен известному необходимому условию Вейерштрасса. Однако в тех случаях, когда оптимальное управле- управление попадает на границу области 2, условие Вейерштрасса, вообще говоря, не выполняется, в то время как принцип максимума верен и в этом случае. Заметим, что принцип максимума содержит, в част- частности, иной, независимый от изложенного нами в гл. VI, вывод условия Вейерштрасса.