/
Текст
ЛЕНИНГРАДСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
СМИРНОВ, В. И., КРЫЛОВ, В. И., КАНТОРОВИЧ, л. в.
ВАРИАЦИОННОЕ
ИСЧИСЛЕНИЕ
ЛЕНИНГРАД
1933
ПРЕДИСЛОВИЕ
Настоящая книга выпускается в качестве пособия для студен-
тов математического и физического факультетов Ленинградского
Университета. В ее основе лежат лекции, которые читались мною
несколько лет тому назад студентам-физикам. Объем этих лекций
был значительно меньше объема выпускаемой книги, которая, как
мы уже упоминали, предназначается не только для физиков, но и
для математиков. В связи с этим пришлось добавить большой
новый материал. Вся эта книга составлена Л. В. Канторовичем и
В. И. Крыловым. Главы I, IV и V написаны Л. В. Канторовичем,
а главы II, III и VI — В. И. Крыловым.
Вл. Смирнов.
Июнь 1933.
ГЛАВА I.
§ 1. Общие замечания.
Предмет вариационного исчисления—это различного рода вопросы
maxima и minima, в которых нужно определить вид одной или
нескольких неизвестных функций. Началом разработки вариацион-
ного исчисления можно считать 1696 г., когда Иоганн Бернулли
поставил задачу о линии наискорейшего ската (брахистохроне).
В решении этой задачи приняли участие лучшие математики того
времени: Лейбниц, Ньютон, Яков Бернулли, Лопиталь. После этого
в XVIII веке Эйлером и Лагранжем были даны общие методы
решения задач вариационного исчисления. Их работу в XIX веке
продолжили Лежандр, Коши, Якоби, Гаусс, Пуассон, Остроград-
ский, Клебш и др.
Однако, решения задач и методы вариационного исчисления до
недавнего времени были все же неудовлетворительны и неполны,
и лишь в конце XIX века работами Вейерштрасса и Гильберта
было дано полное решение основных задач вариационного исчис-
ления.
§2. Две задачи.
Рассмотрим два примера вариационных задач:
I. ЗАДАЧА О НАИМЕНЬШЕЙ ПОВЕРХНОСТИ ВРАЩЕНИЯ.
Среди линий, соединяющих две точки плоскости, найти ту»
дуга которой при вращении около оси ОХ образует поверхность
с наименьшей площадью.
Пусть данные точки будут: А (х0 > Уо) И В (xi, У1) и пусть
у — f (х)— уравнение линии, их соединяющей; тогда величина пло-
щади поверхности вращения выразится, как известно, интегралом
X 1 _______
S — 2 К J* у 1 4" У 2 dx.
i*
3
Таким образом, поставленная выше задача сводится к отыска-
нию такой линии y — f (х), проходящей через точки А и В, для
которой величина S или, что то же самое, интеграл
достигает наименьшего значения.
II. ЗАДАЧА О БРАХИСТОХРОНЕ.
Найти среди линий, соединяющих две данные точки А и В,
ту, двигаясь яс которой свободно пущенная материальная точка
пройдет путь АВ в кратчайшее время.
Примем первую точку А за начало координат и направим ось у
вертикально вниз. Пусть y~f (х)— уравнение кривой, соединяю-
щей точку А со второй точкой В (xj,^). Найдем время Т, нужное
для прохождения тяжелой материальной точкой пути АВ при дви-
жении по этой кривой. Пусть движущаяся точка, в момент вре-
мени t, занимает положение М (х, у) и имеет скорость v; тогда
по уравнению живой силы
ГП&2
= mgy,
где
771 V2
1“
приращение живой силы от t = 0 до t, так как в начальный момент
скорость равна нулю, a mgy есть работа силы тяжести. Из этого
уравнения определяем скорость
откуда
а все время
1._ __V I
v ~ ’
Т, нужное для прохождения пути АВ будет
В данном случае опять задача привелась к нахождению функции,
дающей минимум некоторому интегралу, именно
§ 3.
Понятие о
ункцнонале»
Основным понятием дифференциального исчисления является
понятие функции — переменной, численные значения которой опре-
4
деляютоя численными значениями одного или нескольких незави-
симых переменных. Это понятие функции, позволяющее разрешить
ряд вопросов, является во многих случаях недостаточным. Оно не
охватывает всех видов зависимостей, существующих в действи-
тельности. Рассмотрим хотя бы следующие два примера:
1) Величина напряжения в данном месте электромагнитного
поля, вызванного прохождением тока по проводнику, зависит от
формы кривой, по которой расположен проводник.
2) Сопротивление, оказываемое жидкостью движущемуся телу,
зависит от формы поверхности этого тела.
В обоих указанных примерах рассматриваемая величина (на-
пряжение поля, сопротивление) зависит от выбора кривой или
поверхности. Такая зависимость не может быть очевидно приве-
дена к обычной функциональной зависимости, а представляет
нечто существенно новое. Мы видим, таким образом, что изучение
подобного рода зависимостей заставляет расширить понятие
функции.
Важнейшим обобщением понятия о функции является понятие
о функционале. Существенное отличие функционала состоит в том,
что значения аргументов его не числа, как у обычной функции,
а функции одного или нескольких переменных. Таким образом,
функционал дает такого рода зависимость, что каждой функции
(или паре функций) определенного класса ставится в соответствие
число—значение функционала. Мы дали сейчас аналитическое опре-
деление функционала; геометрически же разница между функцио-
налом и функцией та, что обычная функция одного или несколь-
ких переменных есть функция точки на прямой, плоскости или
в пространстве, функционал же есть функция более сложных
геометрических образований: линий, поверхностей и т. п. Так, на-
пример, если функционал зависит от двух функций f (х) и (х),
то мы можем считать его функцией от пространственной кривой
y = f (х); z = (х).
Простейшим примером функционала является определенный
интеграл функции, взятый в данных пределах:
ь
v [/ (*)] = f f (х) dx.
а
Другим весьма важным общим примером функционала является
интеграл
х1
J* F (*> У9 У ) dx...............(1)
который каждой дифференцируемой функции y — f (х) ставит
в соответствие некоторое число. При частном выборе функции F,
мы можем получить из (1) интегралы /, к исследованию которых
привелось решение задач о наименьшей поверхности вращения и
о брахистохроне (§ 2). Таким образом эти интегралы I также
представляют собой функционалы.
5
Общее исследование функционалов представляет задачу функ-
ционального анализа. Вариационное исчисление занимается только
задачей нахождения maxima и minima функционалов, ограничиваясь
ври этом простейшими из них.
Прежде чем перейти к изложению основных задач вариацион-
ного исчисления, мы докажем два простых вспомогательных пред-
ложения, которыми придется нам воспользоваться.
§4. Две леммы.
ЛЕММА I.
Если интеграл
Л {
f F (х) 7] (х) dx,
XQ
где F (х) данная непрерывная в промежутке (х0» *1) функция^
обращается в нуль для всякой функции (х), непрерывной
вместе со своей производной в (х0, Xi) и исчезающей на концах
его: (х0)=т| (х1)=0, то
F (х) —О
для всякого х, в промежутке (хо, xi).
Предположим противное, что в некоторой точке $ внутри про-
межутка (х0, xi) функция F (х) отлична от нуля, например, F (;) > 0.
Тогда, благодаря непрерывности F (х), она будет положительна и
в некотором промежутке (^, Ёз), содержащем точку £ и лежащем
внутри (х0, Х1) [х0 < $1 < $ < ^2 < *2] •
Определим теперь функцию т) (х) следующим образом:
Построенная таким образом функция т) (х) (график ее дан на
рис. 1) удовлетворяет наложенным на нее в лемме ограничениям.
Очевидно, она обращается в нуль
в точках х0 и xj. Покажем, что
TQ (х) непрерывна вместе со своей
производной. Это не вызывает
сомнений для всех точек кроме $1
и так как во всяком проме-
жутке не содержащем и функ-
ция г[ (х) совпадает с одной из
функций 0 или (х — q)2 (х—^)2.
Докажем, что то же самое имеет
место и в точке [для ?2 рассужде-
ние аналогично]. Но, действи-
тельно, значение функции т) (х) в точке q равно нулю и тому же равен
предел tq (х) справа и слева. Далее, так как слева от точки функция
6
т] (х) тождественно равна нулю, то производная ее слева в точке
также равна нулю; нулю же равен, очевидно, и предел if (х)
при х—если точка х остается левее Справа от точки Ei
функция rf (х) совпадает с функцией (х — ^)2 (х — £2)2» а потому
производная ее справа от точки Ei найдется дифференцированием
этой функции, т.-е.
V (x) = [(*-U2 (х-Ш' = 2 (х-ео (х-$г) [(x-w + U-У].
Отсюда видно, в частности, что производная справа в самой
точке равна нулю, и тому же равен, очевидно, предел т/ (х) при
х—[х>Ц, так как написанное для т/ (х) выражение есть не-
прерывная функция х. Итак, значение производной функции (х)
справа и слева в точке q равно нулю, и тому же равен предел
rf (х) при х—► отсюда следует, что к/ (х) в точке x = $i суще-
ствует и непрерывна, а потому функция iq (х) удовлетворяет всем
поставленным в лемме условиям. Но интеграл
V ? С
*0 Ч Ч
^а
= / {х — ?i)2 (х — У2 F (х) dx > О,
ч
так как под’ьинтегральная функция положительна, что противоречит
условию леммы. Итак, во всех точках х промежутка (х0, xi)
F (х) = О,
что требовалось доказать.
ЛЕММА Ш.
Пусть F (х, у) определенная и непрерывная функция двух
переменных в области D, ограниченной контуром L. И пусть
для всякой функции iq (х, у), непрерывной вместе со своими
частными производными в D и обращающейся в нуль На L:
f f Г (х, у) v (х, у) dx dy — Q.
(D)
Тогда во всех точках области D
F (х, у) = 0.
Доказательство. Предположим, что в некоторой точке (xi, yi)
внутри D функция F (х, у) отлична от нуля, например, F yi) > 0.
Тогда она будет положительна и в некотором круге
(х — Xi)2 4- (у — #i)2 = 32
радиуса 8 лежащем внутри 2).
*) Чтение этой леммы читатель может отложить до § 10.
7
Определим у (х, у) следующим образом
. (О если (х— Xi)3-4-{у — t/i)2Se8’
'll*,У) и (X —*1) + (# ~.У1)2 < 82
Нетрудно проверить, что определенная таким образом функция
iq (х, у) удовлетворяет условиям леммы, между тем
f J F {х, у) rt (х, у) dx dy > О,
(О)
что противоречит условию леммы. Итак, непременно во всех точках
внутри D
F (*, у) = О,
что и требовалось доказать.
Заметим, что лемма I остается верной, если мы наложим
и более сильные ограничения на функцию (х). Например, если
мы потребуем, чтобы интеграл произведения F-?i обращался бы
в нуль лишь для функций (х) непрерывных вместе с п произ-
водными и обращающихся вместе с (п — 1) производными в нуль
на концах промежутка (х0, xj, тс и в .этом случае заключение
леммы будет справедливо. Для доказательства этого нужно только
в доказательстве леммы I заменить показатель 2, в формуле
задающей (х) на (n-j-l).
Отметим также, что лемма II переносится на функции трех
и более переменных.
§ 5. Постановка основной задачи.
Основной задачей вариационного исчисления называется задача
нахождения extrema интеграла
г (*, у, у') dx
• (1)
Здесь F данная функция
аргументов х, у, у
у есть функ-
ция от х; х0 и Xi постоянные. Величина интеграла (1) зависит от
выбора функции или, что то же самое, кривой
y=f (*) • •
• (2)
Для того, чтобы интеграл I имел смысл, а также для дальней-
ших рассуждений мы должны наложить некоторые ограничения на
функции F и /. Относительно функции F будем, предполагать, что
она однозначна и непрерывна вместе со своими частными произ-
водными до третьего порядка включительно при всех значениях х, у,
из некоторой области 7? плоскости, точнее говоря, таких, что точка
(х, у) лежит в R, и при всех конечных значениях у'. Прежде чем
указать ограничения, налагаемые на / (х), введем одно определе-
ние, которое сократит нам изложение в дальнейшем. Будем гово-
8
рить, что функция или кривая у = J (х) принадлежит классу О если
она однозначна и непрерывна в промежутке (х0, х^) и имеет не-
прерывную производную в этом промежутке [т.-е,, касательная
к кривой у ~ f (х) меняется непрерывно и нигде не параллельна
оси ОУ] и вообще y~f (х) принадлежит к классу С^г\ если она
однозначна и непрерывна вместе со своими производными до
п-ого порядка.
Теперь мы можем сформулировать точно основную задачу:
это есть задача об отыскании такой кривой y~f (х), лежащей
в области R, принадлежащей классу и проходящей через две
данные точки плоскости А (х0 > #о) и В (хь у^), для которой инте-
грал I имеет наименьшее значение.
Таким образом, кривые y—f (х), для которых мы рассматри-
ваем значение интеграла I [мы будем эти кривые называть для
краткости допустимыми^ должны удовлетворять следующим трем
условиям:
1) Кривая принадлежит классу С^\ т.-е./(х) непрерывна вместе
со своей производной в (х0, Xj).
2) Целиком лежит в данной области 7? плоскости. Выбор этой
области определяется условиями задачи.
3) Проходит через точки
А (х0, Уо) н В (xi, yt),
т.-е.
/ (*о)=Уо> f {xi)—yi.
Мы можем теперь основную задачу сформулировать кратко так:
среди допустимых кривых найти ту, для которой интеграл (1)
имеет наименьшее значение.
Мы здесь и в дальнейшем говорим только о минимуме инте-
грала, так как задача о максимуме сводится к задаче о мини-
муме, если только заменить функцию F на —F.
Поставленная выше основная задача аналогична задаче об
абсолютном extrema в дифференциальном исчислении, но суще-
ственная разница между этими задачами заключается в том, что
основная задача вариационного исчисления в отличие от задачи
дифференциального исчисления не всегда имеет решение 1).
Так же, как и в дифференциальном исчислении, для решения
задачи об абсолютном минимуме нужно предварительно решить
задачу об относительном минимуме, т.-е., о нахождении таких
допустимых кривых, которые дают интегралу I значение мини-
мальное по сравнению с соседними кривыми. Если задача об отно-
сительном минимуме будет решена, и мы найдем конечное число
кривых, дающих интегралу / относительный минимум, и если из
J) Действительно, пусть F (х, у, уг) 0, тогда интеграл / принимает только
положительные значения для всех допустимых кривых, и эти значения имеют
точную нижнюю границу т Р> 0; но мы не можем поручиться, вообще говоря,
что найдется такая кривая, для которой эта граница достигается. Наоборот,
можно показать примером, что эта граница не всегда достигается (см* доб. стр. 32).
9
физических соображений ясно, что задача об абсолютном мини-
муме должна иметь единственное решение, удовлетворяющее усло-
виям, наложенным на допустимую кривую, и лежащее внутри Л, то
это решение мы получим, выбрав из найденных кривых ту, для
которой I наименьшее. В дальнейшем мы будем заниматься только
задачей об относительном минимуме, который мы будем называть
для краткости просто минимумом.
Для того, чтобы данное выше определение относительного
минимума стало вполне точным, нужно определить, что надо пони-
мать под соседними кривыми. Будем говорить, что допустимая
кривая у близка к другой допустимой кривой у—f (х) и лежит
в области R*, если она удовлетворяет в промежутке (х0, xi) не-
равенству*.
Этн условия, очевидно, равносильны тому, что y—f (х)4~ 03 (х),
причем (%) принадлежит классу С и удовлетворяет условиям:
(*о) = ш (xi) = 0; '
I <0 (х) I < е для Хо < х < Х1 '
. . (4)
Дадим теперь точное определение того, что кривая дает мини-
мум J) интегралу (1):
Кривая у “ f (х) дает минимум интегралу 1 (1), если можно
найти такое положительное число в, что значение интеграла (1)
взятого по данной кривой'
f F [х, f (х), /' (х)] dx
. . (5)
меньше, чем значение интеграла!по всякой допустимой кривой у
области Re, т.-е. меньше чем значение интегралах
<о' (*)] dx,
. . (6)
где (х) функция класса удовлетворяющая условиям (4)
и не тождественно равная нулю в (х0, xi).
§ 6. Первая вариация. Уравнение Эйлера»
Теперь мы займемся разысканием необходимых условий для
того, чтобы кривая y~f (х), лежащая внутри области R 2) давала
минимум интегралу (1). По определению, для этого необходимо
Как мы условились выше, минимум здесь обозначает относительный
минимум.
2) Случай, когда эта кривая имеет общую часть с границей /?, является, как
и в дифференциальном исчислении случай концов промежутка, особым, и те
необходимые условия, которые мы найдем дальше, к нему неприменимы.
10
и достаточно, чтобы при достаточно малом е, для всякой функции
to (х), удовлетворяющей условию (4), интеграл (5) был бы меньше
интеграла (6). Так как это условие должно выполняться для всякой
<о (х), то оно будет выполнено и при частном выборе <*> (х). Этим
мы и воспользуемся для получения необходимых условий. Пусть
т4 (х) произвольная функция класса обращающаяся в ноль на
концах промежутка *
"G (*о) = "G (*i) — 0...............(7>
Тогда при любом достаточно малом л функция
будет удовлетворять условиям (4), а потому, если подставить в инте-
грал (6) вместо <*> (х) величину a iq (х), то полученное выражение
J F [х, f (х) -f- а т( (х), /' (х) + a -q' (х)] dx = I (а), . . (8}
представляющее некоторую функцию от а, не должно превосхо-
дить величины интеграла (5), при достаточно малом а. Но, как это
ясно из (8), интеграл (5) представляет ничто иное, как I (0)
и поэтому, при достаточно малых а
I (0) < / (а),
т.-е. функция I (а) достигает минимума при а = 0. Таким образом,
задача приведена, в известной части, к задаче дифференциального
исчисления.
Разложим функцию I (а) в ряд Маклорена:
получающиеся здесь выражения а Г (0), а2 7" (0), . . . называ-
ются первой, второй, . . . вариацией интеграла 1 и обозначаются
соответственно 8 7, 82 7, .
Из теорем дифференциального исчисления вытекает, что для
того, чтобы функция y = f (х) давала минимум интегралу (1),
необходимо, чтобы Г (0) = 0, т.-е.
8 7=0,.......................(9)
причем это условие должно выполняться для всякой функции (х)
[которая участвует в выражении 8 7], принадлежащей классу С(1) и
удовлетворяющей условию (7).
Напишем выражение 8 7= а Г (0) в раскрытом виде. Из (8),
дифференцируя под знаком интеграла по а и полагая затем а = 0,
найдем Г (0) и
г/^аГ(О) = ау*1[^^ (х)4-^<(х)]<7х, . . . (10)
11
причем в выражениях
dF
ду
величины у и у’ должны быть заменены на4/ (х) и ff (х).
Сделаем теперь дополнительное предположение !), что функция
f (х) имеет непрерывную вторую производную f" (х); тогда вторую
часть выражения (10) можно преобразовать, применив формулу)
интегрирования по частям, а именно:
Первый член второй части этого равенства в силу (7), обра-
щается в нуль и, подставляя остальное в выражение для 8 I (10),
найдем
*0
Для того, чтобы 8 I— 0, необходимо равенство нулю интеграла
стоящего в правой части (11), для всякой функции (х) класса
удовлетворяющей условию (7). Мы можем применить теперь лемму I
(§ 4), так как все условия ее соблюдены, если за F принять
д F d /д F\'
у d х \дуУ
и заключаем, что в промежутке (х0, xj) тождественно
dF d
(12)
Итак, мы нашли первое условие, которому должна непременно
удовлетворять функция y=f (х):
Для тою, чтобы функция y — f (х) давала экстремум опре-
деленному интегралу I, необходимо, чтобы эта функция удовле-
творяла дифференциальному уравнению (12).
Это уравнение было найдено
о d (dF\
имя. Раскрывая член з— f I, мы
впервые Эйлером
можем уравнение
и носит его
Эйлера (12)
переписать в развернутом виде
<^F~ z, । &F~ , । JPF___________dF
dydyf ! dxdyf dy
• • (13)
Вообще говоря, F (x, у, у), действительно, содержит y!, и урав-
нение Эйлера представляет тогда дифференциальное уравнение
второго порядка.
Ч Этого дополнительного условия можно и не ставить (см. доб. 2, стр. 33).
12
Его общий интеграл /1 (л*. С\ , 02) содержит две произвольных
постоянных С} и С2. Если мы потребуем, чтобы интегральная кри-
вая прошла через две заданные точки А и В, то мы должны вы-
брать константы Q и С2> чтобы
Так как число уравнений равно числу неизвестных, то задача эта,
вообще, имеет решение. *
Интегральные кривые уравнения Эйлера называют экстремалями.
Мы показали выше, таким образом, что всякая кривая дающая
экстремальное значение интегралу I есть интегральная кривая
уравнения Эйлера, т.-е. экстремаль.
Мы рассмотрим здесь те
* . к
§ 7. Некоторые случаи интегрируемости уравнения Эйлера.
Мы рассмотрим здесь те случаи, когда функция F, стоящая
под знаком интеграла (1), не зависит от каких-либо из переменных
г,
1) F есть функция только от у .
В этом случае уравнение Эйлера (13) приводится к
?яУ'=о
или просто
Его общий интеграл
и интегральные кривые
2) F зависит только
у" = 0.
есть
у — ах Ь)
суть прямые линии,
от у и у’:
Уравнение Эйлера в этом случае будет
d2F t d*F , d F
д y’2^ ' дуду' д у
и мы легко найдем его первый интеграл. Действительно, рассмотрим
d ,dF\ д F , . д F ,, »dF d2F „ d2F __
/
d*F , _<FF\
ду'ду У д у) '
Если функция у удовлетворяет уравнению Эйлера, то правая
часть обращается в нуль и
У ду'
(14)
13.
дает нам первый интеграл уравнения Эйлера. После того как пер-
вый интеграл найден, интегрирование может быть здесь доведено
до конца с помощью квадратуры.
3) F зависит только от х и у'*.
F — F{x, у').
Так как в этом
случае
= 0, то уравнение Эйлера (12) будет:
у
и его первый интеграл находим сразу:
- (15)
Решая это уравнение относительно у1
общее решение уравнения Эйлера.
4) F зависит только от х и у:
F — F (х, у).
и интегрируя, найдем
Уравнение Эйлера (12) в этом случае обращается в
dF(x, у) = 0
ду
и не будет дифференциальным, Решая это уравнение, найдем одну
или конечное число экстремалей вида:
#=? (*)•
Таким образом, в этом случае вариационная задача, вообще говоря,
не имеет решения, так как нельзя найти для любых точек А и
В экстремаль, проходящую через эти точки, и основная задача,
разрешима здесь лишь при исключительных А и В.
§ 8. Некоторые обобщения основной задачи.
Здесь мы рассмотрим две задачи о минимуме интеграла типа (1)
В основной задаче функция F зависела только от неизвестной
функции у и ее производной yf; здесь мы рассмотрим два более
общих случая:
1) Функция F зависит от нескольких неизвестных функций у,
z, • . . и их первых производных у, z\ .
2) Функция F зависит от неизвестной функции у и ее произ-
водных до п-ого порядка у', у” < . . , у^п\ Необходимые условия
для этих задач находятся совершенно тем же методом, что и для
основной задачи.
I. СЛУЧАЙ НЕСКОЛЬКИХ НЕИЗВЕСТНЫХ ФУНКЦИЙ.
Мы ограничимся случаем, когда имеются две неизвестных
функции у и z, так как случай большего числа неизвестных
14
функций ничем от него не отличается. В указанном случае задача
ставится так: Найти кривую
Уf (х); z=fi (х),
проходящую через две данные точки
которая дает минимальное значение
Л (х0, у(), z0) и В (xi, , zO,
интегралу
(16)
Функция F предполагается здесь непрерывной вместе с част-
ными производными до 3-го порядка, а функции / и /i принад-
лежащими классу С&. Поступаем так же, как в основной задаче.
За близкую кривую возьмем
У—f (*)+а *1 Ws «=/1 W4-® -G1 (х),
где (х) и тц (х) произвольные функции класса обращаю-
щиеся в нуль на концах интервала (х0, Xi). Подобно тому, как
в основной задаче (10), составим первое выражение для 3 /:
Проинтегрировав два последние члена в скобках по частям, найдем:
Так как 8 [=0 для всяких (х) и тц (х), то, беря сначала
Tji (х) = 0, а (х) произвольным, убеждаемся, пользуясь леммой I
(§ 4), в том, что множитель при т4 (х) должен быть равен нулю,
беря же наоборот, (х) —0, а тц (х) произвольной, убеждаемся,
что и множитель при -Qi (х) должен быть равен нулю; таким обра-
зом, тождественно в (х0 , Xi):
Эта система уравнений, относительно неизвестных функций у и z
играет ту же роль в этой задаче, что уравнение Эйлера в основной.
II. СЛУЧАЙ, КОГДА ВХОДЯТ ПРОИЗВОДНЫЕ ВЫСШИХ ПОРЯДКОВ.
Задача.
Найти функцию y—f (х) класса Cfrtf принимающую вместе
со своими производными до (п— 1) порядка заданные значения при
х=х0 и х = хь т.-е.
У=Уо> У —у'о, • • • У(л-1) = Уоу при х = х0
и У=УГ> у'=УГ> • • г/(л-1) = при х — хъ
15
тахдЮ} что интеграл
1
• • (1S)
имеет минимальное значение.
Функция F предполагается здесь имеющей непрерывные частные
производные до (п-г2) порядка, а искомое решение функция у
принадлежащей классу C<2rt). За близкую кривую примем
y=f (х)Ч-а (х),
где iq (х) произвольная функция класса обращающаяся в нуль
вместе со своими производными до (п — 1) порядка в точках
х0 ИХ].
dx.
Преобразуем все слагаемые правой части кроме первого, проин*
тегрировав каждое k раз по частям, найдем
Первое слагаемое правой части равно нулю, в силу условия,
наложенного на ц (х) в точках х0 и н подставляя полученное
выражение в 8 Z, найдем
*0
Так как 8 1—0 для всякой функции tq (х) класса С^п\ обра-
щающейся в нуль вместе с производными до (п — 1) порядка в точ-
ках х0 и хь то (см. замечание в конце § 4) множитель при (х)
должен быть равен нулю тождественно в (х0, л^), т.-е.
(19>
Таким образом, функция y=f (х) должна удовлетворять урав-
нению (19) (2п-ого) порядка, соответствующему уравнению
Эйлера в основной задаче. Общий интеграл этого уравнения
16
содержит 2п произвольных постоянных; распоряжаясь ими, мы
можем, вообще говоря, удовлетворить поставленным выше 2 п
начальным условиям.
§9- Примеры.
S
I. ЗАДАЧА О НАИМЕНЬШЕЙ ПОВЕРХНОСТИ ВРАЩЕНИЯ.
Эта задача (см. § 2) была приведена к разысканию минимума
интеграла
*0
В этом случае функция F не зависит от х, а потому мы можем
написать сразу первый интеграл уравнения Эйлера по (15)
Отсюда
и интегрируя найдем
Таким образом, искомые экстремальные кривые представляют
семейство цепных линий, имеющих ось симметрии параллельную оси
OY. Поверхность вращения такой цепной линии называется кате-
ноидом. Постоянные Ci и Сг определяются из условия, что
кривая проходит через заданные точки А и В, но эта задача
разрешима не при всех положениях точек А и В х).
II. ЗАДАЧА ГЕОМЕТРИЧЕСКОЙ ОПТИКИ.
Если на плоскости скорость распространения света есть функция
точки v (х, #), что мы имеем в случае неоднородной изоторопной
среды, то время, нужное для прохождения светом пути от точки А
До точки В по кривой у =f (х), выражается интегралом
') Подробнее об этом см. добавление 4.
Вариационное «счисление. — 2
17
Задача геометрической оптики есть задача нахождений линий
наискорейшего распространения света, т.-е. линий, дающих наимень-
шее значение интегралу L Для нахождения этих линий составляем
дифференциальное уравнение Эйлера (12)
Рассмотрим частный пример, когда v (х> у) - у. Написанное
уравнение примет в этом случае вид
Так как F здесь не зависела от х, мы можем написать его
первый интеграл [см- (15)] в виде:
откуда упрощая и интегрируя, найдем
Здесь линии наискорейшего распространения света суть окруж-
ности с центром на оси абсцисс. Пользуясь написанным выше
первым интегралом, нетрудно показать, что решение задачи будут
давать и прямые, параллельные оси OY, Ясно также, что через каждую
пару точек верхней полуплоскости можно провести одну и только
одну из этих линий.
Последний рассмотренный пример имеет интересную геометри-
ческую интерпретацию. Рассмотрим пространство, состоящее из
точек верхней полуплоскости, в которой определена новая метрика
так, что новый элемент длины
dx* 4“
У
Какова будет геометрия этого пространства? Точками его будут
обычные точки верхней полуплоскости. При этом точки оси абсцисс
будут здесь бесконечно удаленными, так как расстояние от любой
точки верхней полуплоскости до любой точки оси OY выражается
интегралом
18
а этот интеграл будет расходящимся при любом пути интегриро-
вания, так как он, очевидно, превосходит по абсолютной величине
о
который как известно расходящийся. Прямыми этого пространства
естественно считать линии, дающие кратчайшие пути, т.-е. наи-
меньшее значение
представляют собой полуокруж-
и полупрямые параллельные оси
полуокружностями с бесконечно
которые, как мы нашли выше,
кости с центром на оси абсцисс
OY (их также можно считать
удаленным центром).
Углом между пересекающимися прямыми (этого пространства)
нужно считать угол между касательными к этим полуокружностям.
При таком определении точек, прямых и углов, как можно
проверить, соблюдены все аксиомы геометрии кроме аксиомы
параллельности; например:
Через каждые две точки можно провести одну—и только
одну — прямую.
Точка разделяет прямую на две части.
Между тем аксиома параллельности, очевидно, не верна, так как
через каждую точку можно провести бесчисленное множество полу-
окружностей с центром на оси, не пересекающихся с данной полуокруж-
ностью. Это показывает, что аксиома параллельности не есть след-
ствие остальных аксиом геометрии, так как в нашем примере их
выполнение не влечет за собой выполнения аксиомы параллельности.
Плоскость, которую мы здесь рассматривали, есть т. н. плос-
кость Лобачевского.
III. ЗАДАЧА О БРАХИСТОХРОНЕ.
Задача эта была приведена (см. § 2) к разысканию минимума
интеграла
dx.
О Г у
Так как функция F не зависит от X, мы можем сразу написать
первый интеграл уравнения Эйлера (15):
'2
или
2*
19
Полагая теперь
у — ~ (1 — cos и), откуда у — sin и * и!
после подстановки
и упрощения найдем
Откуда интегрируя
Так как кривая
жить С2 — 0.
Мы видим, что
должна проходить через начало, то нужно поло-
искомая кривая — брахистохрона есть циклоида
1
Постоянная С] должна быть найдена из условия, что кривая
проходит через точку В (хь #1).
IV. ГЕОДЕЗИЧЕСКИЕ ЛИНИИ НА СФЕРЕ.
Дака сфера радиуса 1. Выбирая сферические координаты дол-
готу и широту 0, можем уравнение линии на сфере написать
н виде = / (Н). Тогда элемент длины
d s2 — d О2 4“ sin2 в d
а вся длина линии между точками А и В выражается
в________________________________________
j* 1 4“ sin2 0 ? 2 d в.
А
интегралом:
Для того, чтобы линия <р = f (0) была
геодезической, функция
f должна быть подобрана так, чтобы написанный интеграл достигал
минимума, т.-е. должна удовлетворять но всяком случае уравнению
Эйлера (12):
d sin3 0 ср' n
Одно решение ®' = 0, т.-е. <р = const здесь очевидно. Так как
это решение дает семейство больших кругов, то по симметрии
шара заключаем, что все большие круги суть геодезические линии.
§ 10. Экстремум двойного интеграла.
Пусть F (х, у, z, р, q) функция пяти переменных X, у, z, р, q
непрерывная вместе со своими производными до третьего порядка
20
в некоторой пространственной области значений переменных %,
г и при всех конечных р и </. Пусть Г замкнутая пространствен-
ная кривая, проекция которой на плоскость ХО Y есть простой зам-
кнутый контур С, ограничивающий область D.
Пусть z—f (%, у) уравнение поверхности S, расположенной
в R и проходящей через кривую Г; если кроме того функция
/ (-*> У) непрерывна вместе со своими частными производными
и то будем называть ее допустимой. Заменим в выражении F
переменные г, р, д соответственно
тат будет представлять непрерывную
поэтому двойной интеграл,
У, z, р, д) dx dy .
, резуль-
функцию х, у в области D, и
. . (20)
имеет определенное конечное значение для каждой допустимой
поверхности S. Можно поставить и здесь задачу отыскания поверх-
ности, для которой интеграл I (20) имеет значение наименьшее по
сравнению с интегралами, взятыми по близким допустимым поверх-
ностям. Для получения необходимого условия, которому должна
удовлетворять такая поверхность z—f (х, у), возьмем за близкую
допустимую поверхность
а V (х, у),
где (х, у) произвольная функция, непрерывная в D вместе со
д -q д Y]
своими частными производными и обращающаяся в нуль
на контуре С. Тогда функция
Ф)
4- а dx dy
д х д у оу)
должна достигать минимума при сс = 0. В таком случае первая вариация
8 Г (0)
должна равняться нулю; дифференцируя же I (а) под знаком инте-
грала и положив а = 0, найдем
Преобразуем последние два слагаемые правой части, восполь-
зовавшись общей формулой Грина [при этом мы делаем дополни-
тельное предположение о том, что функция / имеет непрерывные
частные производные второго порядка]
21
следующим образом:
Но полученный контурный интеграл равен нулю, так как по
условию tq (х, у) обращается в нуль на С, и потому, заменяя
в выражении для 3 I два последних члена их новым выражением,
найдем:
dx dy.
При этом 3 I равно нулю для всякой функции (х, у), непрерыв-
ной вместе с частными производными в D и равной нулю на С, и для
выражения
д у q)
соблюдены все условия леммы II (§ 4), а потому, воспользовавшись
этой леммой, заключаем, что тождественно в области (D)
dF д_ \ д (<№_
dz дх dd / ду \ дц
. . (21
ч
Таким образом, функция z=f (х, у) должна быть решением,
уравнения в частных производных (21), соответствующего урав-
нению Эйлера в основной задаче. Граничным условием здесь
является то, что поверхность 2— f (х, у) должна пройти через
кривую А
Заметим, наконец, что рассуждения этого параграфа полностью
переносятся и на тройной интеграл, только в уравнении (21) при-
бавится еще один член.
Пример 1. Рассмотрим задачу отыскания поверхности с наи-
меньшей площадью, проходящей через данную кривую Г, в про-
странстве. Задача эта есть задача нахождения минимума интеграла
Уравнение (21) для этого случая принимает вид:
Раскрывая это выражение найдем
г (1 + д2) + (1 4" р2) — 2 pqs — О,
_ дИ
где г дх2’ $ дхду *9 ду* ’
Полученное уравнение и представляет уравнение в частных
производных, определяющее минимальные поверхности. Это урав-
нение дает то геометрическое свойство этих поверхностей, что
сумма главных радиусов кривизны в каждой точке поверхности
равна нулю.
Действительно, как известно *)> эта сумма равна:
и, очевидно, обращается в нуль, если функция f удовлетворяет най-
денному выше уравнению для минимальных поверхностей.
Пример 2. Рассмотрим задачу о минимуме тройного интеграла
где v о&ъеы. пространства, ограниченный поверхностью Е, и и функ-
ция трех переменных х, у, z9 значения которой заданы на поверх-
ности Е.
Согласно сделанному выше замечанию, результат, найденный
для двойного интеграла, верен и для тройного, и функция, дающая
минимум тройному интегралу, должна удовлетворять уравнению
(21), в котором добавлен один член. Пользуясь этим, находим для
и уравнение:
или произведя дифференцирование и сокращение,
д?и . д^и , д^и
dxQ ' tf’*3 * dx2
Таким образом, функция и должна удовлетворять уравнению
Лапласа. Вспоминая дополнительное начальное условие, видим, что
поставленная задача о минимуме тройного интеграла приводится
к нахождению гармонической функции п, принимающей данные
значения на поверхности Е, т.-е. к решению так называемой задачи
Дирихле в трехмерном пространстве.
См., например, Г у р с а. Курс анализа, т. I, стр. 547.
23
Полученный результат о том, что функция, даюшая минимум
тройному интегралу (*), должна удовлетворять уравнению Лапласа,
находит следующее интересное приложение в теории электри-
ческого поля.
Как известно *), полная энергия электрического поля выра-
жается интегралом
где Е есть численная величина вектора Ё
напряженности поля:
Ё] = grad ? = Щ -g- + |j_| -g- + E-g
обозначает здесь потенциал поля.
Отсюда
Принцип Томсона дает нам возможность утверждать, что функ-
ция должна давать энергии поля W наименьшее значение!
Но из вида W*.
в7=т// / [ш+оу+0)1 *
следует, что функция ? дает минимум интегралу (*) и как пока-
зано выше, должна в таком случае удовлетворять уравнению
Лапласа:
Мы получили, таким образом, что основное уравнение теории
поля
Дф — О
вполне согласуется с принципом Томсона и может быть выведено
из него.
§ 11. Ураввевие Эйлера для параметрической формы задания
кривых (теория Вейерштрасса).
Предшествующий анализ основной задачи допускал к рассмо-
трению только такие кривые, у которых касательная нигде не па-
раллельна оси ОУ, и которые всякая прямая параллельная этой
оси пересекает только в одной точке, так как лишь они могут
быть представлены в виде y=f(x), где / (х) однозначная функ-
ция с конечной производной. Между тем отброшенные нами кри-
вые могли оказаться решающими данную геометрическую или фи-
зическую задачу, так как условие возможности явного задания
*) См., например, И. Тамм. Основы теории электричества, стр. 93 (обозна-
чения заимствованы оттуда же).
24
кривой в виде y=f (х) было вызвано не существом вопроса, а
лишь требованиями примененного метода.
Вейерштрасс подошел к вопросу более обще, чем устранил этот
существенный недостаток прежнего метода. В этом параграфе мы
изложим начала его теории.
Рассмотрим кривую, заданную параметрически:
x = x{ty, y—y{t).
Мы будем говорить, что эта кривая Г принадлежит классу С(1\
если она допускает параметрическое представление
x*='?(ty, y = b(t),..................(22)
причем « и ф функции непрерывные вместе со своими производ-
ными при t изменяющемся в промежутке (to, Л) и (t) и ф' (t) не
обращаются в нуль одновременно (т.-е. кривая не имеет особых
точек). Всякая кривая, принадлежащая классу имеет беско-
нечное множество таких представлений, так как, если (22) одно из
них, то произведя подстановку / = где ^(т) произвольная
функция, возрастающая от значения tQ до 6, когда т изменяется
от т0 до Т! и имеющая непрерывную производную к' (“), не обра-
щающуюся в нуль, мы получим новое представление
X = » [- 0)]; у = [тг (т)].....................(23)
удовлетворяющее тем же условиям.
Пусть теперь F (х, у, х', у') функция четырех переменных х, у,
х , у', непрерывная вместе со своими частными производными до
третьего порядка, для всех х, yt для которых точка (х, у) лежит
в области 7? плоскости, и при всех конечных значениях х’ и у\
для которых х'2-|-у’2 ф 0. Если Г—кривая класса С задана пара-
метрическими уравнениями (22), причем выполняются поставлен-
ные выше условия для <р и то определенный интеграл
получит определенное значение
л
1= f F [? (0, m ?' (0] dt.............(24)
A)
Это значение будет зависеть, вообще, не только от вида кривой
но и от формы параметрического представления (22)*
Представляют интерес только такие задачи, в которых вели-
чина интеграла I зависит только от вида кривой Г\ но не зави-
сит от способа ее задания, являющегося чисто внешним факто-
ром; поэтому важно выяснить, какое условие надо наложить на
Функцию Z7, чтобы это имело место. Для этого необходимо, чтобы
при замене представления (22) кривой Г на представление (23)
величина интеграла (24) сохранила прежнее значение,
25
т.-е.
о
Заменяя в Л переменную т на к(т)=п найдем:
. • (25
Так как интегралы Л и I должны совпадать для любой кри-
вой Г, то они должны совпадать в частности для любого участка
Г, т.-е. эти интегралы должны равняться для любых пределов tf,
t", из промежутка (tQi t^y а это возможно только в том случае,
когда подъинтегральные функции их совпадают.
Итак,
Г [? (и), (п); ?' (и) г/ (?), (и) к' (?)] =
— (т) F (? (ц)» (u)f ?' (и)> (“)]•
Но так как к (?) может быть сделано равным любому положи-
тельному числу Ку то при Всех К должно быть, для всех допусти-
мых значений х, х' у':
F(x, y;Kx’Ky) — KF(x,y; х'у')
. .(26)
Вспоминая определение однородной функции, видим, что условие,
наложенное на F, привелось к тому, чтобы она была однородной
функцией степени 1 от аргументов х' и у' !)*
Можно показать и обратное, что условие (26) является до-
статочным для того, чтобы интеграл / зависел только от кривой
Гу йо не зависел от способа ее представления. Действительно,
пусть кроме представления (22) кривая Г имеет еще какое-либо
представление; тогда, как легко убедиться, можно подобрать функ-
цию к(?) так, чтобы это представление приняло вид (23).
Интеграл, соответствующий этому второму представлению,
после замены переменной может быть приведен к виду (25), и
тогда, воспользовавшись однородностью Л* (26) для К~^’(д)у мы
установим непосредственно равенство интегралов (24) и (25).
Будем предполагать в дальнейшем, что F однородная функция
переменных xf, у'.
Под кривой близкой к Г будем понимать кривую, расположен-
ную в области тех точек плоскости, которые отстоят от кри-
вой Г не более чем на г. Подобно прежнему будем говорить, что
кривая Г дает минимум интегралу (25), если найдется такое s, что
интеграл по кривой Г имеет минимальное значение по сравнению
2) Последнее заключение не вполне точно, так как для того, чтобы функция F
была однородной, нужно, чтобы условие (26) выполнялось не только для К поло-
жительных, что мы установили, но для всех К. Однако в наиболее важных слу-
чаях (когда Л аналитическая функция) выполнение условия (26) для К положи-
тельных само собой обеспечивает его выполнение для всех возможных значений К.
с интегралами по всем кривым класса проходящим через
то ЧКИ л [® (to), Ф Оо)] и В[? (б), Ф (Л)] и лежащим в области R.,
Длч нахождения необходимых условий для кривой Г за близкую
кривую возьмем•
X = <р (/) 4- ai (t); У = ф (t) + ат; (f),
где 5(0 и т] (/) произвольные функции класса С(1\ обращающиеся
в нуль на концах промежутка (Zo, ti).
Тогда интеграл
ч
/(«) = f ^h(t)-\-n^(f), ф(/)4~аМ0; ?'(0+а^(0> Ф'(0 + ат<' (t)]dt
^0
должен достигать минимума при а=0; поэтому первая вариация
о/=а/'(0) должна быть равна нулю. Подобно тому как мы сде-
лали в основной задаче (§ 6) можем посредством интегрирования
по частям представить 81 в виде
В виду произвольности 5 (0 и т] (0 по лемме I (§ 2):
______d f dF\ _JF d ( dF\ _
dx dt \ dx1 / ’ dy dt \ uyf J
(27)
Мы получили два уравнения относительно функций ср и но
эти уравнения не независимы. Так как F однородная функция от
х и у\ то по теореме Эйлера:
Дифференцируя это равенство по каждой из переменных х, у,
х, у’ получим
. .(28)
Из последних двух равенств найдем:
Определенная таким образом функция
ГГ / '
П (л, у; х, у)
• (29)
непрерывна и имеет непрерывные производные при х'2 4~ У2 0*
Очевидно также, что
Fi (х, у; х, у)
есть однородная функция переменных х’ и у' степени — 3.
27
Возвращаясь к уравнениям (27) и произведя дифференцироьа
ние, придадим им вид:
Заменяя в этих уравнениях Fx и F'y по формулам (28) и F”х*
Ff'y 4y Ffr ху по формулам (29), можем преобразовать эти уравнения
к форме:
уГ=0;х'Г=0. . . . ...........(30)
где
Так как х' и у' одновременно в нуль не обращаются, то оба
уравнения (30) привЪдятся к одному
Т=Л(х, у, xf,y>) ^-yx^^F\y -Fyx =Q. . .(31)
Полученного одного уравнения (31) недостаточно для опреде-
ления двух неизвестных функций x(f) и y(t)* Действительно,
если бы мы имели одну пару функций x(t), y(t)> удовлетворяющих
уравнению (31), то и любая пара функций х[я(т)], у [к (х)], задаю-
щих ту же кривую Г, будет удовлетворять этому же уравнению,
В этом легко убедиться, подставив, действительно, в уравнение (31)
вместо х и у функции х (т)] и у [к (г)] и воспользовавшись тем,
что F (х, у; х’, yf) есть однородная функция степени — 3 от пере-
менных х'у у'. Можно, таким образом, сказать, что уравнение (31)
есть уравнение не относительно пары функций х (f) и у (/), а отно-
сительно кривой Г,
Для того, чтобы задача отыскания функций х (t) и у (t) полу-
чила определенное решение, необходимо выбрать определенный
параметр, т.-е. ввести еще одно уравнение, связывающее функции
x(t) и у (t). Так, например, если за параметр t выбираем х, то это
уравнение будет
если длину дуги s, то
[*' (OWWM.
и вообще это будет некоторое дифференциальное уравнение, свя-
зывающее переменные х и у. Это дифференциальное уравнение мы
можем добавить при этом, не исходя из выбора параметра, а про-
извольно, так как после добавления его к уравнению (31) мы по-
лучим систему двух уравнений с двумя неизвестными функциями
х (t) и у (t). Эта система дает вообще определенные х (/) и у (t)y
(с точностью до постоянных интегрирования), т.-е. определенное
представление кривой Г; таким образом, добавление уравнения
к уравнению (31) само собой определяет выбор параметра. Заме-
тим, что вместо добавления произвольного уравнения к уравне-
нию (31) его можно добавить к равносильной уравнению (31) си-
стеме (30) или (27). Отметим, наконец, что если в уравнении (31)
28
за параметр t принять х, то оно превратится в уравнение Эйлера,
при этом мы можем потерять те решения задачи, где кривая Г
содержит участки вида х —const или имеет касательную параллель-
ную оси ОУ. Между тем уравнение в форме (31), когда не отдано
предпочтение ни одной из переменных х и у содержит все реше-
ния задачи.
§ 12. Геодезические линии п-мерного пространства.
Под n-мериым пространством мы будем понимать здесь много-
образие точек, положение которых определяется заданным п чисел
Xi, х2, .... хп — координат точки. Примером таких пространств
может служить обычное эвклидово пространство двух или трех из-
мерений, в котором выбрана определенная система координат, по-
верхность с определенной на ней системой криволинейных коорди-
нат, неэвклидово пространство. Под кривой в n-мерном простран-
стве будем понимать многообразие точек n-мерного пространства
(хь х2,. •.., хп), зависящее от некоторого непрерывного параметра
t, т.-е. множество точек, определенное уравнениями
Xi = Xj (t)} х2 — х2 (/),...., Хп = хп (0.(32)
Можно показать, что теория Вейерштрасса, развитая в преды-
дущем параграфе для плоских кривых, переносится и на кривые,
расположенные в n-мерном пространстве. Именно, можно доказать,
что ’если кривая (32) дает минимальное значение интегралу
А
• f F[x, (t), х2хп (О> xi (0> ^2 (Oj • • • > (01 > • (Зз)
*0
то функции Xi (/), х2 (t)> хп (/) должны удовлетворять следующей
системе уравнений [аналогичной системе (27)]:
~dii ЗгСтх?)"0 0 = 1>2> п)..............(34)
Как и в случае двух неизвестных функций предполагаем, что F
однородная функция первой степени от аргументов х/, . ..., х'п.
При этом система п уравнений (34) содержит только (п-7)
независимых и для того, чтобы сделать задачу о нахождении
функций Xi (£), х2 (0, • • • > хп (0 определенной нужно добавить про-
извольно одно уравнение, определяющее выбор параметра.
Предположим теперь, что в рассматриваемом пространстве опреш
Делена метрика, т.-е. дан элемент длины. Квадрат элемента длины
ds2 представляет в таком пространстве аггрегат:
п
ds2 = а/, k dxi dxk, ......... (35)
i, k = 1
где а*/, суть некоторые функции координат х/. Квадратическая
форма (35) предполагается всюду существенно положительной.
29
Например, з случае декартовой системы, з трехмерном простри. .
стве форма (35) принимает зид:
ds2 — 4~ dx22 dx^9
a/j;=0 при и а#=1.
Для нахождения геодезической линии, соединяющей две данные
закрепленные точки А и В, нужно найти линию, проходящую через
эти точки:
. . .(36)
и имеющую наименьшую длину, т.-е. дающую минимальное зна-
чение интегралу
1
(37)
(производные от х> взяты по т). Заметим, что мы можем считать
в (35) a^ — aki, так как в противном случае мы могли бы этого
добиться,
Положим
заменив
и то и другое на их полусумму
it ft-- 1
.(38)
тогда о представляет сложную функцию от зависящую от него
посредством переменных Хь .хп\ х/, .... х& , При таком обо-
значении
. . . (39)
Для отыскания кривой (36),
мы должны написать систему
в этом случае принимает вид:
I ду d 1
2/?
дающей минимум интегралу (37),
уравнений Эйлера (34), которая
(Л —1,2,
• • • э
или в раскрытом виде
2V?
= 0 (h = 1,2,
., п) . . . . (40)
л
Система п уравнений (40) должна содержать лишь (и—1)
уравнений независимых в согласии с общим результатом, указан-
ным в конце предыдущего параграфа, и мы можем к уравнениям
(40) произвольно добавить еще одно. За это последнее возьмем
уравнение
•(41)
30
g силу (39) его добавление равносильно тому, что за параметр т
выбираем длину дуги s.
Благодаря присоединенному уравнению (41), система (40) упро-
щается и принимает вид:
п п
Наконец, подставляя сюда выражение (38) для и сокращая
на 2, найдем:
Остановимся на второй сумме; в ней коэффициенты при х t x'k
и Xk xi неодинаковы, поэтому заменим каждый из этих коэффи-
циентов на их полусумму:
1 / дат
~2\d*k
дачь
dxi
Теперь, соединив первую сумму со второй и переменив знаки
на обратные, приведем окончательную систему (40) к виду:
dxh
xi’xn' = 0 (42) (h = 1,2,
n).
• • • >
В уравнениях (42) нужно считать производные от х вздаыми
по s. Заметим также, что выражение, стоящее в скобках во второй
сумме, носит в дифференциальной геометрии название символа
Кристофеля первого рода и обозначается
дам
dxi
дат
дхн
В качестве примера рассмотрим задачу нахождения геодези-
ческих линий на произвольном цилиндре. Пусть уравнение напра-
вляющей цилиндра будет
когда за параметр принята длина дуги направляющей а, так что
dd2, = dx2 + dy2
и
?'2(^) + и/2(з) = 1-
координаты точки на цилиндре возьмем з и высоту точки г.
ds2 = d з2 dz2,
31
так что в этом случае
GjI ----6Z22 — 1
и
fifjs а21 ~~ О-
Уравнения (42) примут здесь вид:
для h = 1, У' = 0; для h ~ 2, z — О,
где производные взяты по дуге s, отсюда
Если А 0, то можем написать уравнение этих линий в внде
Z — Cl 3 *-j~ С*2 j
где Ci и Сз произвольные постоянные. Эти линни, полное урав-
нение которых
х = ?0); = z = Cia-j-C2
обладают тем замечательным свойством, что касательная к ним
образует постоянный угол <р с осью OZ.
Действительно, tg <р = —— = С\ = const. В случае кругового
цилиндра радиуса 1 направляющая есть круг. х = cos z/ = sin«p,
длина дуги о равна углу © и согласно с полученным результатом
найдем, что геодезические линии кругового цилиндра суть винто-
вые линии:
x=cos<p у — sin с? z = Cj<p-j“C2.
Предлагаем, читателю найти, пользуясь уравнениями (42), гео-
дезические линии на шаре.
Дополнения и задачи.
1. Пример несуществования решения в основной
задаче.
В § 5 мы указали, что не всякая задача вариационного исчис-
ления имеет решение (см. примечание на стр. 9). В виде при-
мера такой задачи рассмотрим задачу об отыскании кривой, прохо-
дящей через точки А (—1,—1), 5(1,1), которая дает минимум ин-
тегралу
х2 у 2 dx = 0.
Очевидно, что для всякой кривой y—f(x)> принадлежащей
классу и проходящей через точки А и 5, интеграл 1 имеет
существенно положительное значение />0; таким образом, нуль
является нижией границей для значений /. Покажем, что нуль
32
является точкой нижней границей для этих значений, т.-е., что
существуют кривые класса проходящие через точки А и В,
для которых значение I как угодно мало. Для доказательства этого
найдем величину / для кривой Гх:
которая проходит через точки А и В и принадлежит классу
Значение I для А:
CW.
представляет величину сколь угодно малую при достаточно малом л.
Итак, нуль, действительно, есть точная нижняя граница значений
интеграла /, но эта граница не достигается ни для какой кривой
класса
2. Возражение Дюбуа Рей м о на.
При выводе уравнения Эйлера мы сделали дополнительное
предположение о том, что функция, дающая минимум интегралу Z,
обладает непрерывной второй производной (см. § 6 стр.). Это
ограничение не вызывалось существом вопроса, а было сделано
лишь потому, что оно казалось необходимым при принятом методе
исследования, именно, для интегрирования по частям. Дюбуа Рей-
мом показал, что уравнение Эйлера может быть получено без этого
предположения, так как существование у" у функции, дающей
экстремум, может быть выведено из сделанных уже предположений.
Доказательство этого нуждается в следующей лемме.
ЛЕММА ДЮБУА РЕЙМОНА.
Пусть F(х) определенная непрерывная функция в (*о, xi).
Тогда, если
*1
хо
для всякой функции (х), для которой J ц (х) dx = 0, то функ-
х°
ция F (х) приводится к постоянной.
Вариационное исчисление. — 3
33
Обозначим через С среднее значение F (х) в (х0, хД так что
В силу условия леммы, для всякой функции (х), для которой
-*1
имеем
1
i
1
что возможно, так как F (х) непрерывна, только, если
ч.
В дальнейшем рассуждение Дюбуа Реймона основано
образовании выражения первой вариации (10) отличном
которое было применено в § 6. Обозначим через Ф (х) результат
подстановки f (х) и (х) вместо у и у в и через Ф*(х) не-
определенный интеграл от Ф (х); Ф (х) и Ф* (х) представляют не-
прерывные функции х. Преобразуем теперь выражение 5/ (10):
H3L
ОТ
пре-
того,
dF
dy
dF
dyl
проинтегрировав по частям первый член:
Г dF
J dy
* \ ?
1
Так как tj (хо) = (*i) = 0, то, отбрасывая первый член в пра-
ной части последнего равенства, найдем новое выражение для S /:
Г dF
w L dy'
0
Последний интеграл должен обращаться в нуль для всякой не*
прерывной функции if (х), интеграл которой
а потому по лемме Дюбуа РеЙмона, множитель при if (к) должен
быть постоянным, т.-е.,
[Х,/(Д Г(х)]-ФЦХ) = С,
где функция
Л (х, у, у) =
dF(x, у, у')
дУ
имеет непрерывные частные производные по всем аргументам.
Последнее полученное уравнение может быть разрешено относи-
тельно f (х), так что
где 6 (х, у) функция, имеющая непрерывные частные производные*
Так как правая часть равенства имеет непрерывную производную
по х, то должна существовать и быть непрерывной f” (х). После
того как это доказано, возвращаясь к рассуждению § 6, можно
установить уравнение Эйлера для функции / (х).
В §§ 6 и 10 было показано, что задача нахождения минимума
простого и двойного интеграла приводится к решению дифферен-
циального уравнения второго порядка: обыкновенного для случая
простого интеграла и в частных производных для двойного. Пред-
ставляет интерес и является полезной и постановка обратной за-
дачи о нахождении по данному дифференциальному уравнению ва-
риационной задачи, которая к нему приводит, т.-е. такой, для ко-
торой данное уравнение является уравнением Эйлера.
Решение обратной задачи представляется полезным потому, что
некоторые методы приближенного решения могут быть применены
к вариационной задаче, а не непосредственно к уравнению (см.
гл. VI). В некоторых случаях нахождение одного из решений обрат-
ной задачи может быть получено непосредственно. Так, например,
для произвольного линейного уравнения
переписав
его после умножения на
е
в виде
г at (х) dx
b (x)
e °
Уг
at (х) dx
d
d9
d
b
3*
35
находим непосредственно функцию г в виде:
Уравнение Лапласа А и = 0 было связано с вариационной задачей
fff [("5t)2+ dx dy dz =тт'п‘
(см. пример в § 10) и т. д.
Вопрос о существовании решения обратной задачи для случая
обыкновенного уравнения был решен до конца Дарбу. Именно, им
было показано, что всякое уравнение второго порядка есть урав-
нение Эйлера для бесчисленного множества вариационных задач,
и все функции F (х, у, у') этих задач могут быть найдены с по-
мощью квадратур, если известно общее решение данного диффе-
ренциального уравнения (об этом см,, например, у Гурса т. Ш,
4-е франц, изд., стр. 655).
4. Исследование задачи о наименьшей поверхности
вращени я.
При решении этой задачи мы получили
экстремалей в виде:
§ 9) семейство
провести через
Здесь мы исследуем вопрос о том, можно ли
данные две точки А и В экстремальную кривую. Мы покажем, что
в зависимости от положения этих точек поставленная задача имеет
два, одно или ни одного решения. В этом легче всего убедиться на
основании геометрических соображений. Все кривые семейства экстре-
малей получаются из одной y=Chx посредством преобразований:
переноса по оси ОХ и подобия, как это ясно из их выражения.
Возьмем какие-либо две точки А и В, пусть через них прохо-
дит какая-либо экстремаль Г, тогда на основной экстремали
^(y—Chx) им будут соответствовать две подобно расположенные
точки а и 6, так что хорда ab будет параллельна АВ. При этом,
если обозначить через С точку пересечения прямой АВ с осью
ОХ, через к отношение к = - и через с точку соответствую-
1 ас __ /Ю __ J
щую С, т.-е. пересечение ab с CZA, то отношение — к.
Таким образом, если через точки А и В можно провести экстре-
маль, то на кривой у существует хорда аЬ параллельная АВ и
ас т
имеющая тоже отношение -уу- = Аг; не трудно видеть также, что
существование такой хорды ab является и достаточным для воз-
можности проведения экстремали через точки А и В. Итак, дело
приводится к нахождению хорды ab.
36
Проведем к кривой 7 касательную rt параллельную прямой АВ,
Точка касания г разделит кривую 7 на две части \ и (см,
рис» 2). Нам нужно отыскать такие точки т на 7' и п на 7", чтобы
отношение = к, Обо-
ns
значим через пт такую точ-
ку, для которой
геометрическое место то-
чек nf составит некоторую
кривую 7*, обращенную
выпуклостью в сторону
противоположную выпук-
лости Эта кривая у*
может иметь с 7 две, одну
или ни одной общей точ-
ки. Если она имеет с 72
точки пересечения bi и Ь2,
то хорды bi и а2 па-
раллельные ab и будут
удовлетворять всем по-
ставленным условиям.
В случае, когда две
такие точки пересечения
; сливаются в одну, мы
имеем только одну хорду ^ис- 2
ab и одну соответствую-
щую ей экстремаль, проходящую через А и В, Наконец, если та-
ких точек пересечения нет, то через точки А и В не проходит ни
одна экстремаль. Это иссле-
Рис. 3
дование значительно упро-
щается, если точки А и В рас-
положены на одной горизон-
тали. Можно предположить их
в таком случае расположенны-
ми симметрично относитель-
но оси OY (см. рис. 3). Для
нахождения хорды ab соеди-
няем точки А и В с нача-
лом, тогда точки пересечения
линий ОА и ОВ с кривой и
должны дать нам хорды a^bi
и а2Ь2. Таким образом, для
существования этих хорд
нужно, чтобы точки А и В
лежали внутри угла, образо-
ванного касательными из на-
чала; в этом случае существуют две хорды и две экстремали, про-
ходящие через А и В.
Если точки А и В лежат на сторонах этого угла, то обе экстре-
37
Мали сливаются в одну, наконец, если точки А и В лежат вне
угла, образованного касательными из начала, то не существует
экстремали, проходящей через эти точки. Заметим, что условие о
том, чтобы точки А и В лежали внутри угла может быть заменено
аналитическим условием
tg ?о = 1.5088,
где Xi и yi координаты точки A, a tg <р0 угловой коэффициент
касательной к цепной линии y—Chx, проведенной из начала.
5) Показать, что для задачи нахождения минимума
х0
семейством экстремалей является семейство парабол, имеющих
ось параллельную отрицательному направлению оси О У, фокус
которых расположен на оси ОХ. Провести для этой задачи иссле-
дование, подобное исследованию проведенному в 4-ом примере.
6) Показать, что линиями наискорейшего прохождения луча
света в однородной неизотропной среде (т.-е., когда скорость света
v есть функция от у) являются прямые линии.
ГЛАВА II.
Связанные задачи вариационного исчисления»
До настоящего времени мы рассматривали только такие задачи
вариационного исчисления, когда искомые функции должны были
удовлетворять лишь некоторым условиям на границах, кроме
само собой разумеющихся условий непрерывности, и в остальном
оставались произвольными. Решение задачи в этом случае, как
мы видели, можно искать в виде интеграла соответствующего
уравнения (нли системы уравнений) Эйлера с заданными гранич-
ными условиями. Многие вопросы приводят, однако, к таким за-
дачам об экстремуме определенного интеграла, когда искомые
функции, кроме названных граничных условий и условий непрерыв-
ности, должны удовлетворять еще дополнительным требованиям,
относящимся к поведению их во всем промежутке интегрирования.
Уравнения, выражающие эти требования, мы будем, заимствуя
термин из аналитической механики, называть уравнениями связи,
или, просто, связями рассматриваемой задачи. Природа их может
быть самой разнообразной. Мы будем заниматься здесь лишь
простейшими и наиболее распространенными связями подобного
рода и ограничим свою задачу только указанием на те изменения,
которые, вследствие связей, претерпевают уравнения Эйлера.
§ 13. Голономиые связи.
Функция F (х, j/, z, у, z) определена по переменным х, у, z,
в некоторой области /?, по переменным у!> zдля всех конечных
значений и имеем непрерывные производные по своим аргументам
до третьего порядка.
Совокупность допустимых кривых задачи определена требо-
ваниями:
Кривая С, определяемая функциями y=f (х), z= (х):
1) лежит в области
2) принадлежит классу
3) проходит через точки А (х0, <у0, z0) и В (xj, у\, z^) об-
ласти R',
4) удовлетворяет уравнению
G (х, у, z)~Q............(1)
где G(x, у, z) определена в и принадлежит там классу C(2L
Среди всех допустимых кривых нужно найти ту, которая
дает экстремум интегралу
хп
У, z, у, z) dx
. .(2)
Геометрически говоря, среди кривых, лежащих на поверхности (1)
и проходящих через точки (х0, z/0> го) и С*л> Уи *1) 9 нужно найти
такую, которая давала бы экстремальное значение интегралу (2).
При разыскании необходимых условий для функций у и z есте-
ственно пытаться решить уравнения (1) относительно одной из
искомых функций, например, z, и свести поставленную задачу
к несвязанной (свободной) задаче с одной функцией.
Для выполнения этой цели мы сделаем следующие допущения:
1) искомая кривая С—существует;
2) принадлежит классу С^; это условие не необходимо при
ближайших рассуждениях и потребуется несколько позже при
выводе уравнений Эйлера.
3) если в вместо у и z подставить их выражения для кри-
вой С, ТО При Xq^X^Xi,
Требование 3 достаточно для возможности^ решения уравне-
ния (1) относительно z. Обозначим через I проекцию кривой С
на плоскость (х, у); по известным теоремам о неявных функциях,
мы можем утверждать, что кривую I можно заключить внутрь не-
которой достаточно узкой области г так, что уравнение (1) в этой
области может быть решено относительно z:
z = ® (л, у),
где з (х, у) принадлежит классу С^.
11 Следует заметить, что допустимыми кривыми здесь будут лишь те, которые
могут быть представлены аналитически однозначными функциями y~f (х) и
z имеющими необходимое число производных.
Координаты *си -о и *1» У1» zi должны, очевидно, удовлетворять уравне-
нию (1).
39
Подставим в F найденное значение для z; после подстановки
интеграл (2) примет вид:
*0
Всякая допустимая кривая поставленной нами задачи, лежа-
щая в достаточно узком соседстве с кривой С, перейдет после
проектирования на плоскость (х, у) в кривую класса лежащую
в соседстве с кривой L Наоборот, всякой кривой класса С^\ ле-
жащей в некотором узком соседстве с /, соответствует допусти-
мая кривая нашей задачи, соседняя с С.
Если С дает экстремум интегралу (2) относительно класса до-
пустимых кривых, то I должна давать экстремум относительно
всех соседних кривых класса Но тогда для I должно быть
справедливо уравнение Эйлера. Для его составления находим:
Поэтому, после простых
приводится к:
преобразований, уравнение Эйлера
. .(3)
С другой стороны, дифференцирование связи (1) по у дает:
dG , dG dy ~
ду dz ду
□
Исключая отсюда и из (3) приходим к равенству:
d р ___р f р f___р г
dx y 1 У dx ?
• dG ~ dG ...............................
dy dz
(4)
Обозначим общую величину обоих отношений
тогда:
через
. .(5)
Таковы необходимые условия экстремума.
Уравнения (5) могут быть приведены к иной форме, если
вспомогательную функцию
ввести
40
и j и G не зависит от у', имеют
место равенства:
dF
dF dF ,
и — -—!
Поэтому (5) принимают
вид:
dF
dz'
О
эквивалентный уравнениям Эйлера для функции F\ Исключив из
(6) и (1) функцию л (х) и одну из искомых функций, например z,
получим дифференциальное уравнение второго порядка с одной не-
известной функцией у. Общий интеграл этого уравнения будет
содержать 2 произвольных постоянных, которые определятся из
граничных условий задачи:
Изложенные рассуждения, при надлежащих изменениях, могут
быть легко перенесены на задачу более общего вида, например,
когда дело идет об экстремуме интеграла
1
при связях
и граничных условиях
,, \.— „о
Очевидно, по самому существу задачи, должны быть
дены условия
соблю-
• • Уп
Мы будем предполагать далее, что, по крайней мере, один из
функциональных определителей порядка тп, составленный из
dGs
частных производных , например,
& I
I
будет отличен от нуля, если вместо yi подставить функции, даю-
щие экстремум интегралу (7).
41
Чтобы не усложнять текста, мы ограничимся только формули-
ровкой правила множителей Лагранжа, следуя которому можно
решать задачи такого типа:
Существуют т непрерывных функций Xi (х), л2 (*) • • • (х),
которые вместе с функциями yi (х), дающими экстремум инте-
гралу (7), удовлетворяют системе дифференциальных уравнений.
где
I — 1,2 « • *, п,
.........................(9)
• . (10)
(9) вместе со связями (81), дают систему т 4“ п уравнений для
определения т-\~ п функций yi и (х).
Скажем еще несколько слов относительно выбора произволь-
ных постоянных интегрирования. Уравнения (9) могут быть запи-
саны, благодаря (10), в форме:
d dF
dx dy[
Рассмотрим первые т из этих уравнений. В силу предположе-
ния неравенства нулю Якобиана
D (У1 * • -Ут)
они могут быть решены относительно функций (х). Найдя из
уравнений связи (8i) z/i, у^ - - • ут, как функции от х, i . • .уп и
подставив найденные для них и для функций (%) значения
в оставшиеся п — т уравнений системы (91), получим систему
п —т дифференциальных уравнений 2-го порядка относительво
Ут Уп •
Общее решение этой системы будет содержать 2 (п — т) про-
извольных постоянных, которые определятся из граничных условий
yt (х^=ур, yi (%1) = г/- . . п.
Рассмотрим задачу о геодезических линиях на заданной по-
верхности С (х, у, z) — 0
dx.
42
Уравнения (5) имеют вид:
.........(И)
Чтобы выяснить геометрическое свойство геодезических линий,
аналитически выраженное полученными нами уравнениями, про-
дифференцируем уравнение связи полным образом по х:
dG ! dG ,
dx дуУ
умножим результат
значения из (11):
л / \ . dG . dG
на л (х) и подставим вместо л — и л -т- их
После несложных преобразований придем к равенству
d
dx У" 1 -р у'2 + z'2
• -(12)
Возьмем за параметр,
искомой кривой, длину s
определенной точки. При
определяющий положение точки на
ее дуги, отсчитываемую от некоторой
таком выборе параметра имеют место
равенства:
где а, 3, 7 суть углы, образуемые касательной к нашей кривой
с осями координат и
dx \ 2
ds)
Заменим всюду дифференцирование по X дифференцированием
по s:
f_ dy ds __dy 1 r__dz ds___dz 1
У ds dx ds cos a ’ ds dx ds cos a ’
Написанные выше уравнения примут вид:
У cos а = а G . -- cos В
as х as
, -г cos 7 = <
as
где u, “ л cos
Но, согласно формул Френе, левые части этих уравнений про-
порциональны направляющим косинусам главной нормали кривой,
правые же части пропорциональны направляющим косинусам нор-
мали к поверхности, и полученные нами уравнения Эйлера говорят
о том, что главная нормаль геодезической линии будет одновре-
менно и нормалью к поверхности.
43
§ 14. Неголономные связи»
Значительно более сложным, чем предыдущий, является случай,
когда уравнения связи содержат производные, т.-е. будут диффе-
ренциальными уравнениями, которым должны удовлетворять иско-
мые функции:
67s (л-, У2 * • • У п. ? yi, У2 • ' • Уп ) — 0 • • (13)
5 = 1 . . . т< п
Такие связи, следуя терминологии установленной Гертцем
в аналитической механике, называют неголономными.
Многие задачи вариационного исчисления, рассмотренные нами
до настоящего времени, представляют собой частный случай за-
дачи настоящего параграфа.
Для вопроса, рассмотренного в § 13, это утверждение предста-
вляется совершенно очевидным. Мы укажем здесь еще на то об-
стоятельство, что, например, задача об экстремуме интеграла
/ Г* / /л/ (п)\ 1
I г у, у , у . . . у ) dx
*0
равносильна задаче об экстремуме интеграла
г
F (-^, У: г ^2 ? • • • ^/7—1? 71—1) dx
С
при условиях:
г rx " гх п
Z]— tA—0, z2—у — 0 . . . zn__\—у =0.
Вновь отказываясь от проведения доказательства справедливости
при некоторых предположениях правила Лагранжа неопределенных
множителей, ограничимся лишь его формулировкой.
Для нахождения функций^ дающих экстремум интегралу
J F(x> Z/i. У2, • • Уп, Уг, У2', • • • Уп) dx
*0
при условиях (13) составляют функцию
т
F* = F + 2^ W с*.....................(14)
5 == 1
Искомые функции yt вместе с (х) должны удовлетворять
уравнениям Эйлера для функции F*:
= ......................
dx дщ
Z -= 1, . . , п
44
Система (15) обладает одним существенным отличием от (9),
установленной для голономных связей. Так как левые части ра-
венств (13) в рассматриваемом случае содержат производные и/,
др*
ТО В ^-7 войдут функции л5 (х), и уравнения (15) будут содержать
поэтому производные от (х)'по X.
Уравнения (13) и (15) дают систему дифференциальных
уравнений с тР-п неизвестными функциями.
Каждое из уравнений (15) будет второго порядка, относительно
искомых функций yi (х) и первого, относительно л$ (х). Чтобы
выяснить число произвольных постоянных, получающихся в ре-
зультате интегрирования, и возможность удовлетворить предельным
условиям, введем систему функций zt (х), определенных равен-
ствами
. (15-а)
После такой замены (13) дают систему т конечных связей
для функций yi и Zi и (15) вместе с (15-а) обращаются в систему
2п уравнений первого порядка, с 2п^т функциями yLi zi и
>5 (х).
Решив (13) относительно каких-либо т функций у> и zt и под-
ставив их значения в преобразованную введением zi систему (15)
и (15-а) получим 2п дифференциальных уравнений первого порядка
для 2п из функций yt> zi, Общее решение этой системы будет
содержать 2п произвольных постоянных. Они должны быть опре-
делены из 2п граничных условий
yi (^о) = *Л<0) IP (xi)~yP (z—1,2 . . .} n).
Как пример, поясняющий применение приведенного правила, мы
рассмотрим задачу о брахистохроне в сопротивляющейся среде.
Среди кривых, соединяющих две точки Pq и найти ту, вдоль
которой должна двигаться материальная точка под действием
силы тяжести, чтобы пройти путь в кратчайший срок, если она
исходит из Pq с заданной абсолютной скоростью г/0 и приходит
в Л с заданной абсолютной скоростью . Сопротивление среды
есть определенная функция скорости R (v).
Примем массу точки равной единице-
Направим ось z вертикально вниз, а оси у и х расположим
каким-либо образом в горизонтальной плоскости.
Принцип живой силы дает:
d — gd z — R (у) • ]/ с/х2 4* dy2 4~ dz2.
Пусть положение и скорость точки определяются некоторым
параметром т. После деления предшествующего уравнения на dx
имеем:
. .(16)
45
Время, необходимое для прохождения пути ds~ у dx- — dy2
dz2
есть
Поэтому полное время движения точки от Ро до Pi будет:
•(17)
И наша задача может быть аналитически формулирована сле-
дующим образом: среди систем функций X, у, z, v, удовлетворяю-
щих граничным условиям
X (.о) Х() у (^У ~Уо % ('’оУ— —^0
х (“1)^X1 y(~i) = yi 2 (“1) = 21 v (zi) ~Vd
дифференциальному уравнению (16) и принадлежащих классу
найти ту, которая дает минимум интегралу (17).
А V V
t~gz , где /7= .R(v),
так как F* не содержит х, у, г, то имеют место первые интегралы
уравнений Эйлера:
- (18.)
Кроме того, должно быть выполнено дифференциальное уравне-
ние Эйлера относительно функции v:
дН
dv
•(19)
Из (18|) и (18j) следует:
ау' — &х' — 0
т.-е. вся траектория движения лежит в одной плоскости, парал-
лельной оси z. Примем ее за плоскость х, z. Тогда у — 0.
Возведем (181) и (183) в квадрат и сложим:
. .(20)
Это уравнение определяет X как функцию от v.
Разделив почленно (18j), (183) на (19) получаем:
, avd X , (с 4- X с) vd к
dx = Jz= -
H dv dv
Подставив сюда значение функции X, определенное из (20) и
проинтегрировав полученные выражения, найдем Хиг, как функ-
ции от V:
X = а9 с) г — е (v, а, с).
Постоянные интегрирования о, с, d, е, определяются из гра-
ничных условий.
При постановке этой задачи было бы естественным не зада-
вать значения скорости, с которой должна прибыть материальная
точка в Pi, считая лишь, что она брошена из точки Р^ с опреде-
ленной начальной скоростью. Значение же скорости v в точке Pi
так же, как и значения х, у, z, v во всех промежуточных точках
должно было бы быть найденным из условия минимума рассматри-
ваемого интеграла. С такого рода задачами мы ознакомимся ниже
в главе III.
§ 15» Изопериметрическая задача.
Последний тип задач связанного экстремума, на котором мы
остановимся в настоящем параграфе, возник из частной задачи
о нахождении замкнутой кривой заданной длины 21, ограничиваю-
щей наибольшую площадь, и получил, благодаря ей, свое указан-
ное в заголовке название.
Пусть функции
F (х> Уу у') и G Iх’ У> У')
удовлетворяют всем требованиям, перечисленным в главе I при
выводе уравнений Эйлера для простейшей задачи вариационного
исчисления.
Класс допустимых кривых задачи определим следующими тре-
бованиями:
Кривая С: 1) лежит в области R,
2) проходит через точки Л(хо, ул) и В (xi,yi) этой
области,
3) принадлежит классу
4) удовлетворяет условию:
" 1
Л G) = y* G (х, у, у') dx — K
. .(21)
Вопрос о том, существуют или нет кривые, удовлетворяющие
перечисленным здесь требованиям, должен быть подвергнут
в каждом частном случае исследованию. Во всех следующих ниже
рассуждениях существование их мы предполагаем.
Среди класса допустимых кривых нужно найти ту, которая
дает экстремум интегралу
1 (у) — J F (х> У> у') 4х
*0
...............(22)
47
Как и всюду во всех предшествующих рассуждениях, для
получения необходимых условий, мы предположим решение нашей
задачи существующим.
Для возможности интегрирования по частям, что нам потре-
буется немного ииже, мы допускаем, что функция
дающая решение, принадлежит классу С^2)1)*
Рассмотрим семейство кривых
/(x) + ai71i(^)-j-a2vi2(x),.............(23)
где Tji (х) и т(2 (х) принадлежат классу С(1) и обращаются в нуль
на концах интервала
’ll (*о) — 'll (*i) = (хо) = ^12 (xj — 0.
*
Если и т|2 (л) выбраны, то при всех достаточно малых
системах значений сц и а2 кривая (23) лежит в соседстве Re с кри-
вой y~f(x) и удовлетворяет первым трем требованиям, наложен-
ным на класс допустимых кривых. Чтобы удовлетворить четвер-
тому и последнему требованию, мы ограничиваем произвол выбора
параметров и а2 и требуем, чтобы было соблюдено условие:
Л(31>а2)=у G(x>f+ 04 7(1 4~ а2 Ti2,f' -1- (Zi 7]/ 4- а2 т;,') dx = К, . . (24)
выражающее связь, которой должны быть подчинены и л2 .
чтобы (23) была бы допустимой кривой задачи. При а1 = а2 = 0(24)
наверное, удовлетворено, ибо тогда (23) вырождается в кривую
для которой, по предположению, равенство (21) верно.
Но имеются ли налицо другие пары значений «1 и <х2, близкие
к паре 0,0, удовлетворяющие тому же уравнению, т.-е. содержит ли
действительно, семейство (23) в себе допустимые кривые, близкие
к кривой — еще открытый вопрос.
Мы, однако, убедимся в этом, если покажем, что уравнение (24)
может быть вообще решено в некотором малом интервале около
нуля относительно одной переменной. Наши рассуждения потре-
буют еще дополнительных, правда весьма естественных предполо-
жений о функциях f и содержание которых мы выясним в свое
время.
Вследствие сделанных относительно функции G (х, у, у) пред-
положений, / ($4, а2) имеет при всяких достаточно малых и а2
непрерывные частные производные по «1 и а2 • Если бы нам удалось
установить, что одна из этих производных, например, по а2
в точке 0,0 будет отлична от нуля, то, по теореме о существо-
вании неявных функций, известной из курса дифференциального
Как ж раньше, этого требования можно избежать; здесь может быть приме-
нена лемма Д ю б у а-Р е й м о н а (см. добавление к главе I) и прн некоторых
ограничениях доказано существование непрерывной второй производной у функ-
ции у. Мы предлагаем читателю исследовать этот вопрос.
48
исчисления, мы, наверное, смогли бы из (24) определить а2 как
функцию от «1 для достаточно малых laj, обращающуюся в нуль
при = 0.
d/i (<h> Зз) _ dG ~ _L dG г (
«3 — U x.
или интегрируя по частям второе слагаемое, стоящее под знаком
интеграла, и принимая во внимание, что т]2 (х) обращается в нуль
на концах промежутка интегрирования, имеем:
дД (а1,аа)
д ctg
Если окажется, что y—f (х) удовлетворяет уравнению Эйлера,
dG_d_ — п
ду dx ду'
составленному для функции G ( х, у, у'), т.-е. является экстре-
малью для интеграла (21), то при любом выборе т)2 интеграл,
стоящий в правой части последнего равенства, будет нулем, и мы
не можем быть ни для каких уверенными в возможности ре-
шения (24) относительно а4.
Чтобы не затруднять изложения, мы оставляем пока в стороне
этот частный случай и будем предполагать
dG_ d_ dG
ду dx ду'
Но тогда можно бесконечным числом способов выбрать т)з так,
чтобы интеграл
был бы отличен от нуля. Итак, если у =f (х) не экстремаль ин-
теграла (21), уравнение (24) для "некоторого выбора наверное,
может быть решено относительно в малом промежутке.
Всюду ниже, мы будем считать в семействе (23) параметры «1
и а2 связанными уравнением (24).
Подставим (23) в интеграл (22)
/(aj, а3)= j F(x,/4-ai13i+<Xa712>/’4-aiYli'4-a2T12') dx . .(25)
Xq
При a1 = a2 = 0 интеграл / (ab a2) имеет экстремальное зна-
чение. Мы получили обыкновенную задачу на экстремум функции
(25) при связи (24). По известной теореме дифференциального ис-
числения. всегда найдутся два числа Aq н Ч > не равные одновре-
Вариационное исчисление. — 4
49
менно нулю и такие, что частные производные от функции
/(аь 4“ обратятся в нуль при а1 = а2=0.
Проделав преобразования, совершенно аналогичные применен-
ным при выводе уравнений Эйлера, мы убедимся в том, что на-
писанные выше условия эквивалентны следующим:
Непосредственно применить основную лемму вариационного
исчисления к написанным интегралам мы не можем, ибо вместе
с изменением функций и *q2 будет изменяться и зависимость
между «1 и а2, даваемая равенством (24); поэтому могут изме-
няться и числа Хо и входящие в (26). Но, как видно из вто-
рого из этих равенств, отношение чисел Хо, не зависит от *q1.
Поэтому из первого равенства, на основании основной леммы,
в виду произвола тц (х) следует
е
(Ч ?+ ki G) - ± ± (Xo F4- G) = 0............(270
Мы остановимся лишь на случае, когда Хо не равно нулю *)•
В виду однородности полученного нами уравнения (271) отно-
сительно Хо и можно, при нашем предположении считать
J) Иначе, если Хо—0, число должно быть отличным от нуля и из (27J
следовало бы
d dG dG„
dx ду1 dy "" °‘
т.-е. рассматриваемая кривая, как уже говорилось
выше, будет экстремалью для
интеграла
интеграла, стоящее в правой
его экстремальным значением.
Другими словами, значение К для этого
части уравнения связи будет, вообще говоря,
В большинстве практически важных случаев существует одна или конечное число
Л1
экстремалей, для которых интеграл С dx будет принимать это значение К,
Задача в этом случае будет решена «аданием одних только связей.
50
Хо=1, ибо для этого достаточно разделить обе части уравнения
на
Окончательно имеем:
d д (Fд (F+^G)
dx ду1 ду
• (273)
уравнение Эйлера нашей вариационной задачи.
Правило множителей Лагранжа, полученное для изопериметри-
ческой задачи, отличается от того же правила для предшествовав-
ших задач тем, что в рассматриваемом случае X есть некоторая
постоянная, тогда как в обоих предыдущих случаях X было неко-
торой функцией от х.
Интегрируя (273), найдем семейство экстремалей нашей задачи,
зависящее от трех параметров: л и двух постоянных интегриро-
вания
*/ = /(*, а, 6).................(28)
Чтобы среди найденных кривых найти ту, которая удовлетво-
ряет поставленным требованиям, мы должны будем постоянные X,
а, Ь выбрать согласно граничным условиям и уравнению связи
lh=f (*о, К b) yi— f (*!, к, а, Ь)
Заметим еще, что в уравнение (271) функции F и G входят
симметрично. Оно не изменится, если переменить местами F G г).
Из этого замечания следует интересное свойство изопериме-
трических задач, известное под названием закона взаимности и со-
стоящее в том, что экстремали вариационной задачи для инте-
грала
% I
у'} dx при условии Л =
G (х, у, у’) dx
с бу-
дут вместе с тем и экстремалями вариационной задачи для
интеграла
х 1
*0
*1
dx при условии Ii = F (х, г/, у')
*0
dx — с.
Примеры этому мы увидим ниже:
В более общем случае изопериметрическая задача имеет вид:
найти функции yi—y^ (х) (z = l, 2... п), дающие экстремум
интегралу
Ди 1
/ = J F (х, yi, уг ..
... dx
Уп, у\, у'2
Как и прежде, мы оставляем здесь в стороне исключительный случай = 0.
4*
51
при связях:
X 1
Л = I Gs (х, 1/1, Уг ... Уп, у'1, у'г, ... у' n) dx — Cs (s = 1, 2, ... т)
и удовлетворяющие на границах условиям'.
У‘ (Х1) = у,°, yt (,Xi) = yil.
В виду очевидной возможности обобщения изложенных только
что рассуждений на задачу такого вида, мы не будем подробно
останавливаться на выводе правила ее решения и ограничимся
лишь формулировкой его:
Дифференциальные уравнения для определения искомых функ-
ций у: получатся, если для функции
ТДе
ния Эйлера:
неопределенные множители, составить уравне-
d dF* dF* о
т f — С/ I — ij £ ••• 72•
dx dy'i dyt
Полученные после интегрирования этих уравнений выражения
для «//будут содержать 2л т произвольных постоянных: 2л по-
стоянных интегрирования и т постоянных л в силу однородности
уравнений относительно X. Эти постоянные должны быть опреде-
лены из 2п граничных условий и т уравнений связи.
Рассмотрим теперь несколько частных задач.
1) Простейший пример доставляет обыкновенная изопериметри-
ческая задача, о которой упоминалось в начале параграфа и кото-
рая в
наи-
своей первоначальной геометрической форме читалась:
Среди замкнутых кри-
вых длины 21 Найти ту,
которая ограничивает
большую площадь.
Прежде всего, очевидно,
что рассматриваемая кривая
должна быть выпуклой. В
противном случае существо-
вала бы прямая, имеющая
с замкнутой областью S,
ограничиваемой нашей кри-
вой, по крайней мере 2 не
имеющих общих точек за-
мкнутых отрезка. Пусть АВ
ис. 4) и BD отрезок между
два соседних таких отрезка (р:
Обозначим BCD и BFD части кривой, на которые она делится
и DE
ними,
точками В и D. Отразив зеркально одну из этих частей, например,
BCD, около прямой, мы получим новую Кривую BFD BCD,
имеющую ту же длину, но ограничивающую большую площадь.
52
Так же просто доказывается утверждение, что всякая прямая’
делящая пополам кривую, будет делить пополам и ограничиваемую
ею площадь. Допустим в самом деле противное. Пусть прямая АВ
не обладает этим свойством. Отразив тогда зеркально около АВ
ту часть 5, которая является большей, мы получили бы кривую
с той же длиной, но с большей внутренней площадью.
Выберем за ось ОХ любую из прямых, делящих кривую попо-
лам, назовем х0 и Xj точки пересечения оси и кривой. Благодаря
сделанным нами замечаниям, задача может быть сформулирована
в несколько иной форме: среди кривых, соединяющих точки (х0, О)
и (xi, О) и имеющих длину /, найти ту, которая вместе с отрезком
(х0 , Xi) ограничивает наибольшую площадь.
В силу конвексности, искомая кривая аналитически может быть
представлена однозначной функцией от х между х0 и Xi.
Окончательно имеем следующую задачу:
•X1
Найти экстремум интеграла I — J* у dx при условии
Числа Xj, Хг и I мы будем считать подчиненными условию
необходимость которого очевидна.
В нашем случае
I л
Эта функция не содержит х и потому первый интеграл уравне-
ния Эйлера имеет вид:
, dF'
f2 ____
— а
откуда
/ __
У =
или dx =
интегрируя, получим
х—Ь = у X2— (у — а)2, (х—Ь)2-^(у—а)2=Х*
т.-е. экстремалями будут окружности радиуса X,
Пусть угол, под которым виден отрезок хо Xj из центра
X) — Хо = 2 X sin и I = X си.
Для определения od имеем уравнение
«о
sin
53
решение которого, благодаря поставленному условию, всегда воз-
можно,
Пользуясь принципом взаимности, мы можем высказать обрат-
ное предположение: среди кривых, ограничивающих площадь задан-
ной величины, окружность имеет экстремальную (очевидно, наимень-
шую) длину.
2) Определить положение равновесия тяжелой однородной нити
данной длины I с закрепленными концами, находящейся под дей-
ствием силы тяжести, направленной параллельно отрицательной
оси у. Положение равновесия Определяется требованием, чтобы
центр тяжести нити лежал возможно низко. Мы считаем очевид-
ным, что всякая прямая, параллельная оси у> встречает нить не
больше чем в одной точке. Задача сводится, поэтому, к нахожде-
нию экстремума интеграла
при связи
и граничных условиях у (х0) = г/0) у (xi)~y^
Первый интеграл уравнения Эйлера дает,
Уравнение легко интегрируется, если положить
и дает:
Экстремалями задачи будут цепные линии.
Граничные условия дают:
Уо + — — a ch + by, yi + = — a ch b } •
Вычитая одно из' другого и преобразуя разность гиперболиче-
ских косинусов к произведению, будем иметь:
t/i — Уъ = 2 a sh р sh о ,
54
После подстановки найденного значения у в уравнение связи
оно интегрируется и приводится к виду
a sh 4- Ь ) — sh 4- b = I,
\ a * J \ a * J J
или
2 a ch p sh о = Z..................(29)
Откуда
th .................(30)
Число Z, очевидно, должно удовлетворять неравенству:
/ > V(xi — х0)24-(yi — Уо)2 > I У1 — Уо I-
Поэтому предшествующее уравнение, для каждого из обоих
случаев, будет иметь один и только один корень.
Из (29) и (30) получаем:
|/I2 — (yi — у о)2 — 2 a sh о и
sh ° _ — (ffi — Уо)2
и Хц — Xi
sh
2
есть монотонно возрастаю-
щая от 1 до 4"00 функция) когда 0 х < со, принимающая один
и только один раз всякое значение большее 1. Поэтому предше-
ствующее уравнение имеет
один и только один корень больший
нуля.*
После того как найдены о и р, нахождение а, Ь, л не предста-
вляет затруднений.
3) Рассмотрим упругий однородный стержень прямолинейный
в недеформированном состоянии. Как известно из теории упругости,
его потенциальная энергия в деформированном состоянии считается
пропорциональной интегралу, взятому вдоль стержня, от квадрата
кривизны.
Пусть стержень, имеющий длину /, заделан в точках (х0, yQ)
и (xi, г/1). Положение равновесия его определяется из условия ми-
нимума потенциальной энергии. Чтобы составить ее выражение,
примем за независимую переменную длину стержня, отсчитываемую
от точки (х0, уо) и обозначим через 0 (s) угол, образованный каса-
тельной с осью х-ов. Кривизна К— W — .
Интеграл, экстремум которого мы рассматриваем, имеет вид:
Известно, что — cos
будут:
У* cos 0 ds = xi — xQ
и
= sin 0; уравнения связи поэтому
i
J sin 0 ds — у i — у$.
и
Кроме того, заделанность стержня в точках (х0 > (*i >
равносильна заданию величины 0 на концах:
0(О)=а 0 (1) = Ь
F* — 0'2 Xi COS 0 4" sin 0.
Функция F* вновь не содержит независимой переменной, и пер-
вый интеграл уравнения Эйлера для нее будет:
е'’ + Xj cos 0 4~ ^2 sin 0 — 0' • — С
0'2 = С-р COS 0 4" ^2 sin 0.
Чтобы представить правую часть этого равенства в форме
А (1 — К2 sin2 ср), достаточно, что легко проверить простыми вычис-
лениями, положить:
6 — 80
? =------2----, 0о = arc tg
откуда
Sq •
г
Эта кривая есть не что иное, как упругая линия Якова Бернулли.
Мы не будем давать исследования возможности надлежащего
выбора постоянных. Отметим только что здесь их 4 : АГ, А, 0П и
*$0, т.-е. ровно столько, скольким условиям нужно удовлетворить.
Если необходимо найти декартовы координаты точек стержня,
достаточно в соотношения
•«I
~ — cos 0 = cos (2 ? + 0О), 4|- = sin 0 sin (2 ? 4“ ®е)
поставить вместо ds его значение:
dx=d?
у h 1 у 1 — № sin3 ср
откуда сейчас же определяются х и у.
56
ополнения и задачи.
1. Преобразование уравнений Эйлера к канони-
ческому виду.
Во многих случаях при исследовании вариационных задач бы-
вает удобнее предварительно преобразовать их уравнения Эйлера
к каноническому виду.
Первоначально мы проведем рассуждения для уравнения вида
^F'y' (*. у, y')-F'y (-V, у, у') = о....(31)
Будем рассматривать его как систему двух дифференциальных
уравнений первого порядка с двумя неизвестными функциями у и у'.
. (32)
Введем вместо у' новую функцию р = F(yr; предполагая , Ф О
мы можем обратить это равенство, решив его относительно yf
у' = у' (х, у, р)
. .(33)
Введем функцию Н (х, у, р), определенную равенством
Н (х, у, p)—py’ — F (х, у, у')
где вместо у1 должно быть подставлено его выражение (33)
Подстановка в (32) вместо F’y< новой неизвестной функции р
и вместо Fy и у их значений из последних двух соотношений
приводит к каноническим уравнениям вариационной задачи
dp &Н dy дН /«.V
dx ~ ду dx “ дР ...............
Подобные же преобразования могут быть проделаны и для
случая, когда имеем систему уравнений Эйлера со многими неиз-
вестными функциями:
d
. .(35)
/
где г = г уъ ... t/п, t/i, -. . уп
Как и прежде, заменим зту систему уравнений второго порядка
системой 2п уравнений первого порядка с 2п неизвестными функ-
циями yi И y'i.
ZP = О
dx
. .(36)
/
57
Введем функции pi~FfyJi н предположим Якобиан
D (F' ... Л', )
------отличным от нуля.
Тогда у/ могут быть найдены как функции от х, yi и
Рассмотрим функцию
Л
Легко видеть, что
1
Подстановка в (36) вместо Fg, Ffy. и у(' их значений из по-
следних равенств вновь приводит к каионическей системе
dPi дН dHi дН t <
=-----д^~ » = 1.-п.(37)
Ради краткости мы оставляем в стороне случай производных
высшего порядка, помня, что исследование его может быть сведено
к задаче с первыми производными и неголономными связями.
Пусть функция F в рассматриваемой вариационной задаче имеет
вид F—F (х, у, ... yi ... ynf) и yi подчинены неголономным
Связям
(х, у х • • • уп» Ух • • • У& ) — 0 S — 1, • • • 77Т • • (38)
Как известно, для получения уравнений Эйлера в этом случае
мы должны будем составить
т
Неизвестные yi и л<? определятся тогда из уравнений (38) и
системы
F*y,. - z = l, ..n.........(39)
Как и в обоих предыдущих случаях мы преобразуем (39) в си-
стему 2и уравнений с 2п~-т неизвестными функциями у'
и
d с *' n- *z
~dF~ y'i ? У-: — 0
• (40)
dy.
Положим
(41)
n
58
Присоединим сюда еще т уравнений (38) и предположим, что
Якобиан, составленный из функций F и G по переменным у/
отличен от нуля. Тогда уравнения (41) и (38) могут быть решены
относительно yi и Xs.
Введем
п
i = /
Но
и так как у/ и получены как решения (38) и (41), то после
подстановки в Gs вместо yi найденных значений, все функции
Gs обратятся тождественно в нуль, и мы будем иметь
дН _ дН _ f
<?</, Hi dpi У1
Подставляя в (40), имеем каноническую систему:
dPt ______дН_ _ЛУ1_ - ’ —
dx ду( dx Oyi 1 ’
• .(41)
2. Изопериметрическая задача для кратного инте-
гр а ла.
Полученное нами правило Лагранжа для изопериметрической
задачи в простых интеграхах может быть перенесено на задачи
того же типа с интегралами любых кратностей. В виду очевидной
возможности обобщения всех рассуждений, мы формулируем здесь
правило лишь для двукратного интеграла.
Пусть функции F уу z, р, q) и С (х, у, р, 7) определены
и принадлежат классу в некоторой области R пространства х,
р, z при всех конечных р и 9.
Г—замкнутая пространственная кривая, лежащая в R, проек-
ция которой на плоскость хоу есть простой кусочно гладкий кон-
тур С; ограничивающий область D.
59
Класс допустимых поверхностей определяем требованиями:
1) поверхность z—f (х, у) лежит в R,
2) принадлежит в области D классу С^9
3) проходит через контур Г,
4) удовлетворяет требованию
/ / G (х, у, z, р, q) dx dy — К,
dz dz
где e и ^“задано.
Среди класса допустимых поверхностей нужно найти ту, ко-
торая дает экстремум интегралу
f J F ^x> У’ z' р’ dx
Буквальное повторение уже известных рассуждений для про-
стого интеграла приводит к следующей теореме.
Если искомая поверхность принадлежит классу С<2\ то можно
указать такие два числа Хо и Хь между которыми, по крайней мере,
одно отлично от нуля, что искомая поверхность будет решением
уравнения Эйлера, составленного для функции
F* = X0 F+Xi G:
dF* _ d / dF* \ _ d / dF* \ _ Q
dz dx \ dp J dy \ dg J
Мы предлагаем читателю проверить справедливость этой теоремы*
В плоскости ху расположены материальные массы известной
плотности р (х, у). Среди всех кривых, соединяющих две данные
точки и М2 и имеющих заданную длину Z, определить ту, ко-
торая вместе с прямолинейным отрезком М^ и М2 ограничивает
площадь с наибольшей массой.
Найти уравнение Эйлера.
Решение:
л — постоянно и г—радиус кривизны экстремали.
4. Среди кривых, соединяющих две заданные точки М (х0, yf)
и М (xi, yi) найти ту, которая вместе с ординатами крайних точек
Л/1 и М2 и отрезком х0 Xi оси абсцисс ограничивает заданную
площадь и при вращении около оси х дает тело вращения наимень-
шей поверхности.
Решение: экстремали получаются путем преобразования вида
из укороченной циклоиды
sin
У = Х4- cosf*
60
5. Найти кривые, дающие минимум интегралу / у”2 dx при
Закрепленных концах и связи / у2 dx — К.
Исследовать выбор произвольных постоянных.
6. Из заданного количества однородной материи, притягиваю-
щейся по закону Ньютона, образовать тело вращения, поверхность
которого встречает ось вращения только в двух точках pi и рч
и которое действует на материальную точку либо в pi, либо в р%
с наибольшей силой.
Решение: уравнение меридиана
7. Дана тяжелая материальная струна, концы которой закре-
плены на горизонтальной прямой. Найти положение равновесия
струны под действием силы тяжести (фигуру провисания) при усло-
вии малости деформации,
8. Исследовать фигуру равновесия плоско деформированного
упругого стержня, заделанного на концах, в случае малых дефор-
маций.
9. Решить ту же задачу для случая, когда на стержень дей-
ствует сила тяжести, и концы стержня расположены на горизонталь-
ной прямой.
ГЛАВА III.
Общая форма первой вариации. Предельные условия.
Приложения к механике.
§ 16. Общая форма первой варяацки.
При рассмотрении первой вариации интеграла, мы до сих пор
предполагали неизменной как границу области интегрирования,
так и значения, которые принимали на границе допустимые функ-
ции. Для простых интегралов это требование равносильно тому
обстоятельству, что допустимые кривые должны проходить через
две наперед заданные точки пространства и задача состояла в вы-
боре среди этих кривых той, которая давала бы изучаемому инте-
гралу экстремальное значение. Во многих вопросах возникают гра-
ничные условия совершенно иной природы. Так, например, в неко-
торых задачах дело идет о разыскании функции в некоторой по-
стоянной области и не подчиненной никаким граничным условиям.
Мы будем говорить тогда о естественных граничных условиях.
Многочисленные геометрические вопросы приводят к таким за-
дачам, где допустимые кривые должны начинаться и кончаться на
наперед заданных кривых или поверхностях, или где границы допу-
61
стимых поверхностей могут скользить вдоль заданной наперед
поверхности. Наконец, могут возникнуть задачи с граничными
условиями различного смешанного вида. Нам встретится, напри-
мер, случай когда искомая функция должна принимать наперед за-
данные значения лишь на одной части границы; значения же ее
на другой части границы — неизвестны и должны быть найдены
из условия минимальности
Все эти задачи обычно
ного и легкого обобщения
до настоящего времени.
Остановимся сначала на общем выражении первой вариации
для основной простейшей задачи вариационного исчисления.
Пусть F (х, у> у') определена в некоторой области R плоскости
х, у и для всех конечных значений у' и имеет непрерывные част-
ные производные второго порядка.
Возьмем какую-либо кривую С класса лежащую внутри
изучаемого функционала.
могут быть решаемы путем естествен-
тех приемов, которыми мы пользовались
где f (х) непрерывна вместе с своей производной первого порядка
в интервале (х0, Xi). Ей соответствует некоторое значение инте-
грала:
F (х> У> у) dx = J F (х, у, y')dx.........(1)
Xq С
Рассмотрим теперь семейство кривых, лежащих в области /?,
зависящее от одного или нескольких параметров и содержащее
в себе при некоторой частной системе значений параметров кри-
вую y—f (х). Чтобы остановиться на чем-нибудь определенном,
мы будем иметь в виду семейство кривых с одним параметром,
хотя формулы, которые мы получили, будут относиться без изме-
нения и к случаю многих параметров.
Мы не сделаем никакого ограничения общности, если предпо-
ложим, что кривая 4~f(x) соответствует значению нуль пара-
метра.
При переходе от одной кривой нашего семейства к другой
будут изменяться не только ординаты точек кривой, но и интер-
вал изменения абсциссы х; концы этого интервала будут функ-
циями параметра.
Пусть:
y=f(x, а); х0 (а) х sg Xi (а); |а ..............(2)
уравнение этого семейства. При этом /(х> а), х0 (а)> Xi, (а) удо-
влетворяют начальным условиям
/ (х, o)~f (х); х0 (о)~ х0; xi (p) = xt
Относительно f (х, а) мы будем предполагать, что она имеет
непрерывные производные по х и а и непрерывную смешанную
производную второго порядка и х0 (2), Xi (л) имеющими производ-
ные по а.
62
Перейдем в интеграле (1) от кривой, определяемой равенством
a = 0f семейства (2) к некоторой другой кривой того же семей-
ства. Такой переход равносилен не только замене у на / (х, а)
под знаком интеграла, но и изменению концов промежутка инте-
грирования соответственно на хо (а) и Xi (а).
Полученный после этого интеграл будет функцией I (а) пара-
метра а.
/(з) — J а), fx (х, л)] dx.............(3)
*о(а)
Как и прежде, первую вариацию 8 I интеграла I мы определим
сейчас равенством:
8 /=
• • (4)
Обозначим через 8 х0 и 8 xi
соответственно первые вариации
dxo (д)
d а
da
и
da
О
a = 0
абсцисс концов кривой (концов промежутка интегрирования) и
через 8 у и § у' первые вариации функции y—f (%, а) и ее первой
производной по х:
a = 0
da = —
dx
а = О
ах
а —О
d a
Так как выражение (3) зависит от а не только через функцию
F, стоящую под знаком интеграла, но и через пределы интегри-
рования, то прн дифференцировании по а мы получим три члена,
соответствующие дифференцированию по пределам интегрирова-
ния и дифференцированию F, и в принятых обозначениях первая
вариация интеграла принимает вид:
s/=/r(xi, У1, у/) 8 *1 — F(xQ, у0, z/o')8xo +
*1
*0
• • (6)
В неинтегральный член полученного выражения, так же как и
аналогичные члены во всех дальнейших преобразованиях, мы усло-
вимся обозначать подстановкой от индекса 0 до индекса 1:
Ы=\Г(х,у,у)Ьх
О -хв
s у) dx.
63
Преобразуем второе слагаемое
Х0 *0
= Fy< {хх,ух,у\)(^у\— F'y, (х0, у0, у 0) (8 у)0 —
где (8 y)i и (8 у)$ есть не что иное, как граничные значения вариа-
ции функции у:
(3</)/ = Г д-^-} 1 < = 0,1 .... (7)
L (7 а J
а — О
Найдем теперь первую вариацию ординат концов кривой. Мы
проведем все вычисления лишь для ординаты правого конца
кривой. Очевидно:
V1 =/[*1 (а)> “]•
При изменении параметра а здесь будут меняться оба аргу-
мента функции /, а не только второй, как это мы имели в преды-
дущем случае и первая вариация Si/i ординаты yi будет иметь
поэтому вид:
/ Г Г Л 1 J dxx J
a a J L 1 4 Jj L 0*1 « я
a — 0 a — 0
(9i)
y'i есть угловой коэффициент касательной к кривой, вдоль кото-
рой вычислен интервал, в ее правом конце.
Аналогично для вариации ординаты левого конца кривой
имеем:
3 У- - У о 8 *о + (3 у)а..............(92)
Подстановка в (8) вместо и (Зу)0 их значений, найденных
из равенств (91) и (92), дает:
где символ
о
. .(10)
означает, что выражение, стоящее внутри
скобок,
должно быть вычислено для правого и левого концов кривой и из
первого результата вычтен второй. S* и *у, стоящие в этих скоб-
ках, как только что говорилось, суть первые вариации декартовых
координат, концов кривой.
64
Правая часть равенства (10) линейна относительно % у; и
3у. Благодаря этому обстоятельству, мы можем утверждать, что
она сохраняет свой смысл и для случая многопараметренного се-
мейства кривых, если под первой вариацией условиться понимать
первый полный дифференциал по параметрам, вычисленный для той
системы значений этих параметров, которая соответствует взятой
кривой, например:
если рассматриваемая кривая получается
при ^ = 0, 4 = 1, . . • * , п.
Совершенно аналогичные вычисления
интеграла с п неизвестными функциями
из уравнения семейства
первой вариации дЛя
Уъ уЛ
уп) dx
приводят к формуле:
где
1=1
п
1=1
как
символ
означает,
и выше, подстановку в выражение,
. . (11)
стоящее внутри скобок, значений всех величин для правого и ле-
вого концов кривой; о > 8xj, 8у№\ 8у^ суть вариации декарто-
вых координат концов кривой.
В обеих формулах (10) и (11) выражение первой вариации
содержит интегральные слагаемые. Для того, чтобы эти интегралы
исчезли, достаточно, чтобы взятая кривая семейства была экстре-
малью и первая вариация интеграла для экстремальной кривой
будет зависеть только от координат концов ее, первых вариаций
о X/, SуР} et концов и углового коэффициента ус касательной
к ней в конечных точках.
§ 17. Естественные предельные условия.
Между задач вариационного исчисления с естественными гра-
ничными условиями простейшая есть следующая:
Среди функций, определенных в интервале а'о х Xi и при-
надлежащих классу С^\ найти ту, которая дает экстремум
интегралу.
X 1
1 = f F(x, у, у') dx...............(12)
В&ржа^новвое исчисление. — 5
65
На искомую функцию не налагается никаких условий как на
границах, так и на значения ее внутри промежутка интегрирования.
Геометрически говоря, допустимыми кривыми здесь считаются
все кривые класса C(V}, лежащие в полосе концы кото-
рых могут свободно перемещаться вдоль прямых л*=л*0 и x=Aj.
Пусть
У=/(*) ........................(13)
решает задачу. Если она дает экстремум интегралу (12) по отно-
шению ко всем допустимым кривым, то она, наверное, даст ему
экстремальное значение и по отношению к более узкому классу
допустимых кривых, имеющих с ней одинаковые конечные точки.
Поэтому уравнения Эйлера для нее должны быть соблюдены, и
кривая (13) должна быть экстремалью.
Найдем теперь граничные условия, которые должны быть вы-
полненными в рассматриваемой задаче.
Составим выражение первой вариации интеграла (12). В нашем
случае = = ибо концы интервала остаются неизменными
при переходе от одной допустимой кривой к другой. Интеграль-
ный член выражений вариации (10) исчезает, ибо (13) является
экстремалью:
(xi, У\, yi) Zyi—Fy,(xo, Уь, у'о)Ъуа.
Из необходимого условия экстремума 87=0, благодаря произволу
и так как передвижение концов кривой не подчинено ни-
каким требованиям, следуют условия:
Fyl (Xi, yi, у1') = 0; Fy. (х0, у0, уо')=0 . . , . . (15)
называемые естественными граничными условиями.
Общин интеграл уравнения Эйлера содержит 2 произвольных
постоянных:
у—f (х, а, Ь)....................(16)
Для выделения искомой кривой среди всех кривых семейства
(16) имеем 2 условия (15), связывающие 2 неизвестных а и 6.
Мы предлагаем читателю показать, что кривая. С, дающая
экстремум интегралу
7/ Т7 (-£> yi у * • • j Уп у у 1 > * • , Уп ) <7х .... (17)
♦/
^0
при свободных граничных значениях для у,, должна удовлетворять
двум следующим требованиям:
7. Кривая С есть экстремаль:
2. Удовлетворяет естественным граничным условиям:
65
Сделаем еще одно замечание относительно полусвободных
границ.
Пусть допустимые кривые, кроме известных условий непрерыв-
ности, подчинены еще требованию проходить через точку с коор-
динатами (хо, t/о); второй конец кривых может лежать в какой
угодно точке прямой х — х^.
Пусть, как и раньше, кривая (13) решает задачу. Совершенно
очевидно, что эта кривая попрежнему должна быть экстремалью.
В общем выражении вариации (10) сохранится лишь слагаемое,
соответствующее правому концу с оу{, ибо в нашем случае
ох0“ох1 = 8г/о = 0.
(х1> Уъ Z/1') 8уг............(19)
-Г
и из необходимого условия экстремума ^/-=0 следует, в виду про-
извола 5 ух, естественное граничное условие для правого конца
кривой:
^(хь Уъ Уг')= 0....................(20)
Для определения двух постоянных, входящих в общий интеграл
уравнения Эйлера (16), имеем 2 уравнения
Уа—f (хо, a, b) Fy,. (xi, уъ y’i) — Q.
При закреплении правого конца и свободном левом, естествен-
ное граничное условие (20) переходит в
Fyt (д*0 , у yQ ) = 0..............(21)
Аналогичное имеет место и для интеграла (17).
§ 18. Условия трансверсальности.
Среди кривых класса С^\ соединяющих две заданные кривые
С и С, нужно найти такую кривую С, которая дает экстремум
интегралу
Относительно С и С мы будем
предполагав ь, что они имеют един-
ственную касательную в каждой точке-
Пусть А и В концы искомой кри-
вой (рис. 5) и
У~У (х) .... (24)
ее уравнение.
Выделим из всех допустимых кри-
вых 3 группы:
7. Кривые^ имеющие свое начало
в точке А и конец в точке В.
Рис. 5
с
5*
67
2. Кривые, имеющие свое начало в точке А и конец в любой
точке кривой С. __
3. Кривые, имеющие свое начало в любой точке кривой С и
конец в точке В.
Так как кривая С дает экстремум интегралу (23) относительно
всей совокупности допустимых кривых, то она будет давать экстре-
мум и по отношению к каждой из выделенных групп.
Но если кривая (24) дает экстремум по отношению кривых
первой группы, то она обязана быть экстремалью:
Выясним теперь, какому условию должна удовлетворять С,
чтобы она давала экстремум по отношению кривых второй группы.
Составим для этой цели выражения первой вариации интеграла Л
при переходе от С к некоторой* другой кривой группы 2.
Здесь, благодаря неподвижности точки А, ох0 —О, $ уо — 0.
Интегральное слагаемое в общем выражении (10) вариации о I про-
падает, так как С—экстремаль, и условие о 1с — 0 обращается в:
У\, У1')~ v'l Ру. (*ь V1, Vi')Fxi + (^i>Vi>yi')Syi = 0 • • (25i)
где о Xi и 3 pi суть компоненты бесконечно малого перемещения
вдоль кривой С из точки (xi, г/i), или, что то же самое, компоненты
перемещения вдоль касательной к этой кривой втой же точке.
Пусть, в частном случае, ордината у кривой С, по крайней мере,
по близости к точке (Xi, yi), может быть рассматриваема как одно-
значная непрерывная функция от X с такою же производной:
У—У (*)••••...................(26)
Отношение есть ничто иное, как угловой коэффициент касатель-
ной к кривой С в точке (х^, р<)
—у1 Ui) — уъ
Условие (251) поэтому примет вид:
В(хьуи У1)-г(у1— У\)РуАх^У\>У\) = 0 - . . . (252)
Пусть Г—любая кривая, пересекающаяся с С в некоторой
точке (х, у) и у’ угловой коэффициент касательной к ней в точке
пересечения.
Мы условимся говорить, следуя Кнезеру, что Г и С пересекаются
в точке (х,у) трансверсально, если выполнено следующее равенство:
IZ (х, у, у’) — у' Fv, (х, у, /)] а X 4- /у (х, у, у') 3 у = о,
где 5 х и оу есть составляющие по осям координат перемеще-
ния вдоль касательной к кривой Г в точке (х, у), или
68
Равенства (25i) и (25g) выражают ничто иное, как трансверсаль'
ность пересечения экстремали С и граничной кривой С в точке
В, Они устанавливают зависимость между координатами точки
пересечения С и С и их угловыми коэффициентами у\ и у^ в той же
точке. $
Совершенно аналогично, для того, чтобы кривая давала экстре*
мум относительно кривых группы 3, необходимо, чтобы экстре-
маль С пересекалась с граничной кривой С в А трансверсально
[Г(х0, Vo, У о) — У'о F'y> (*о> Уо, у'о)] *о +
Fy' у о» у о)°Уо:==О............(27j)
или
F Vo* Vo ) “4~ (Vo Vo ) Fy Vo* Vo ) ~ 0 • • • (27a)
Таким образом, если кривая С дает экстремальное значение
интегралу (23), то должны быть выполнены 3 следующие необхо-
димые условия:
7. С есть интегральная кривая уравнения Эйлера>
2. С пересекается с С трансверсально
о. С пересекается с С трансверсально*
Интегрируя уравнение Эйлера, мы найдем у как функцию от х
и двух произвольных постоянных:
Осталось еще определить постоянные интегрирования а, 6,
координаты х0, у$ точки А и координаты хь у± точки В. Мы про-
ведем все вычисления в предположении, что граничные кривые за-
даны уравнениями:
~у=у (А ?=? (*)
Очевидно, должны быть соблюдены следующие равенства:
Ui~ a, b), y0=f(x0, а, Ь), У\ ~fx' (*i a, b), уо =fx' (xQ, а, b);
подставляя эти значения в (25) и (27), получим 2 уравнения вида
Фо (х0> а9 Ь)~0 Ф{ (ль а, 6) —0.
Так как точки (л'о, Vo) н (xb Vi) лежат соответственно на кри-
вых С и С, то должны быть выполнены требования
f(xOt а, Ь}=у(х^> f(xi9 а, Ь)~у (*i).
Вместе с предыдущими, эти 2 уравнения дают систему 4-х
уравнений с четырьмя неизвестными х0, Xi , <т, 6.
В частном случае, одна из кривых, например, С, может выро-
диться в точку, и мы будем иметь задачу лишь с одним подвиж-
ным концом:
Среди кривых, принадлежащих классу Cir\ проходящих через
69
точку А и имеющих второй конец на заданной наперед кривой
С найти ту, которая дает экстремум интегралу (23).
Искомая кривая, как и в предшествующем случае, должна быть
экстремалью. Однако, здесь условия (27) отпадут, и останется лишь
условие трансверсальности для точки В.
Произвольные постоянные а, Ь интегрирования и абсцисса Xj,
точки В определяется тогда из следующей, не нуждающейся в по-
яснениях, системы уравнений:
/(х0, а, Ь) = уо Ф1=(хв а, 6) = 0 /(х19 а, Ь)=у(х}).
Обратимся теперь к условиям трансверсальности в пространстве
3-х измерений. _ __
Даны две поверхности S и 3, определенные уравнениями:
Фо (х, у, z) = 0 (х, у, z) = 0,..........(28)
и имеющие касательную плоскость в каждой точке.
Среди кривых, принадлежащих классу С^[\ имеющих начало на
поверхности S и конец на поверхности S, найти кривую С даю-
щую экстремум интегралу:
с
(29)
Пусть кривая С, решающая задачу, имеет начало в точке А
поверхности S, конец в точке В поверхности *S и определена
уравнениями
y=f(x)> z = ?(x).................(30)
Рассуждения, подробно изложенные для задачи двух измерений,
без изменений переносятся на разбираемый случай и приводят
к заключению, что С должно удовлетворять следующим необходи-
мым требованиям:
1. Кривая С есть интегральная кривая системы уравнений
2. В точке А поверхности S должно быть выполнено условие:
[F-y'.F'.-z' F,]q 3x04-[Fy]0 + S*o = 0, . (32)
где символ [ ]0 показывает, что выражение, стоящее в скобках,
должно быть вычислено в точке А, и Зх0, zo суть составля-
ющие по осям координат произвольного перемещения из А вдоль
касательной к S плоскости в этой точке.
3. В точке В поверхности S должно быть выполнено условие'.
[f—y Fy—z F^ S^ + ^Ъ 3^4-321 = 0 . . (33)
Символ [ ]i и 8*1, Sift, 5 , имеют то же значение для
точки В.
70
Условия (32) и (33) остаются справедливыми для любого спо-
соба аналитического задания поверхностей 5 и 5. Они, однако,
могут быть преобразованы, если S и S даны, как мы предполо-
жили, в форме (28).
Действительно, направление нормали к поверхности Ф£ (х, у, z)
дФ.
— О f = 0,1 определяется величинами —,
тому должно иметь место равенство:
дф;. дф
—, —з—~ И по-
ибо вектор с компонентами Зх,, %yi, 8zf-, лежит в касательной
плоскости к поверхности Ф£ = 0.
Два условия (32) и (33) могут быть переписаны поэтому в форме:
(34Д
(З43)
Пусть некоторая поверхность S, обладающая касательной пло-
скостью, пересекается с экстремалью С в некоторой точке
М (х, г/, z), и пусть 8х, &у, az суть компоненты перемещения от
М по касательной к *8 плоскости.
Мы условимся говоришь, что С и S пересекаются в М транс-
версально у если выполнено условие
[F—у Fy'— z'F'F\ Zx^Fy, by + Fz =
или, если поверхность S задана в форме Ф (х, г/, з) = 0, то в виду
будет
Эти уравнения устанавливают зависимость
х, г/, z точки пересечения, величинами у
правление касательной к Си величинами -
dx
между координатами
определяющими на-
ЭФ дФ
~дГоп^'
деляющими направление нормали к S.
Равенства (32), (33) или (34) суть условия трансверсальности
пересечения кривой С с поверхностями 5 и 5 в точках Л и В.
Найденные из уравнений Эйлера функции у и z будут зависеть
от 4 произвольных постоянных
y — f (х, а Ь, с, сГ), z — <? (х, а, 6, с, d).
71
Четыре уравнения трансверсальности (34) и 2 условия того, что
точки с координатами (х0, yQ9 zQ), (xu уь zj лежат на поверхно-
стях (28), т.-е. удовлетворяют уравнениям
Фо У& ^о) —О Ф1 (xi, уи ^) = 0,
дадут систему шести уравнений для определения шести неизвест-
ных хо, xi, а, Ь9 с, d.
Рассмотренный в предыдущем параграфе случай естественных
границ есть частный случай задачи настоящего параграфа, полу-
чающийся из нее, когда кривые С и С вырождаются в прямые,
которых соответственно будут х = х0 и х = Хр Здесь
б xi = 0 и, в виду произвола 3 у^ естественные граничные условия
(15) немедленно следуют из условий трансверсальности (25) и (27).
Наконец, укажем еще на задачу с подвижными концами в п-мер-
ном пространстве.
Между кривыми п- мерного пространства, принадлежащими
классу имеющими свое начало на гиперповерхности S:
сРо (х, У1) • • •> уп) — О
и конец на гиперповерхности S:
Ф1 (х, г/i, уп)~ О х)
наити кривую С, дающую экстремум интегралу:
F (х, уъ . уп, у\, уп) dx.....................(35)
с
Мы предлагаем читателю доказать справедливость следующего
утверждения:
Чтобы кривая С решала задачу, необходимо выполнение сле-
дующих требований:
1. С есть экстремаль, т.-е. является решением системы урав-
нений Эйлера:
г ~ 1, • • •, п,
dx У i
- (36)
2. В точках А и В встречи С с гиперповерхностями S и S
должны быть соблюдены условия трансверсальности
vFy,s Zys=n.(370
5“ 1
где 3 х, 6 у5 суть компоненты произвольного бесконечно-малого
перемещения по гиперповерхностям S и S в точках А и В.
*) Выражение „точка Л/ (х>У1, • - *, уп) лежит на поверхности F(x, yit . . уи) = G“
означает просто, что числа х, уу, ..., уп удовлетворяют уравнению Л— 0. И если
мы говорим, что кривая С начинается на поверхности 5, то это значит просто,
что должно быть /\) (xQ) z/i° ..., yQn)—$•
72
(37i) остается вновь справедливой для упобого способа анали-
тического задания гиперповерхностей S и S, Если допустить, как
это сделали мы, что граничные гиперповерхности заданы в форме
Ф (х, ylt ..., ул) = 0, то компоненты о х, &ys бесконечно малых пе-
ремещений вдоль них должны, очевидно, удовлетворять равенству:
п
Вместе с (371) это уравнение позволяет представить условие
трансверсальности в форме
п
дх ду, дУп
Отметим здесь еще, что формула (371) остается верной и для
того случая, когда концы искомой кривой должны оставаться на
пересечении нескольких гиперповерхностей, с тем условием, что ох,
$Уз будут тогда бесконечно малыми перемещениями вдоль указан-
ного пересечения.
Все предшествующие формулы относились лишь к задачам
с одной переменной. Что касается общего выражения первой ва-
риации кратных интегралов и различного рода граничных условий
для них, мы отсылаем читателя к более полным руководствам по
вариационному исчислению. Некоторые указания по этому вопросу
можно найти в дополнениях к настоящей глазе.
§ 19. Вариационные принципы механики.
I. ПРИНЦИП ГАМИЛЬТОНА.
Дана система п материальных точек, массы которых суть т, и
координаты Xj, гл, [v = 1, ..., п] суть функции времени Л Пусть
движение системы подчинено связям:
7л — 0 s ~ 1, 2, ..., т
и происходит под действием сил, обладающих силовой функцией U*
и U суть функции координат точек системы и времени.
Пусть Т — живая сила системы
п
ч ~ 1
Из некоторого положения Д, соответствующего моменту вре-
мени , система переместится к моменту времени Л , в некоторое
другое положение В.
73
Из всех возможных способов, которыми наша система мате-
риальных точек может переместиться из положения А в положе-
ние В, мы выбираем класс „допустимых" движений системы, удо-
влетворяющий следующим требованиям:
7) движение совместимо с заданными связями,
2) в момент tQ система занимает положение Айв момент
— положение В,
Принцип Гамильтона утверждает, что действительное движе-
ние системы отличается от всех допустимых тем, что оно удо-
влетворяет необходимому условию экстремума интеграла Га-
мильтона
л
7~ /'(7’+^) dt.
^0
№
Каждому „допустимому" движению системы будет соответство-
вать совокупность Зп функций х> (t), у, (/), z* (I) определенных
в интервале изменения независимого переменного t, удо-
влетворяющих уравнениям связи — 0 и тем обстоятельствам,
что система в моменты времени и занимает положения А
и В, что равносильно заданию функций х,, у,, z-> на концах про-
межутка интегрирования. »
Мы имеем, таким образом, вариационную задачу с голономными
связями и закрепленными границами. Для решения ее составим,
следуя правилу множителей Лагранжа, изложенному в предыдущей
главе, функцию
т
s — 1
где (f) суть некоторые функции переменного t, и напишем для
нее уравнения Эйлера:
т
5 = 1
S— 1
Они, очевидно, совпадают с дифференциальными уравнениями
действительного движения системы.
Итак, при сделанных нами предположениях о силах и связях,
уравнения действительного движения системы есть не что иное,
как необходимое условие экстремума интеграла Гамильтона по
74
отношению ко всем другим движениям, удовлетворяющим нало-
женным связям, при которых система в начальный и конечный
моменты времени занимает те-же положения, что и при дей-
ствительном движении.
Во многих случаях вместо прямолинейных координат выбирают
криволинейные координатные параметры q\, 72, qk сообразно
с наложенным на задачу связям и с числом k = 3 п — т степеней сво-
боды. Уравнения связи тогда отпадают.
Функции Т и U, как легко видеть, примут форму
Т—Т (?!, qk\ qi> qk' t)
U— и (7i> * • • > ^)j
ч
и наша задача переходит в задачу о минимуме интеграла (Т-+~ U) dt
А?
при закрепленных граничных значениях
связи.
Уравнения Эйлера для нее будут:
d d{T+U\ d[T+U)
dt dqf dqL
или, так как U не зависит от q!
функции без уравнении
i — 1, . •.,
z — 1, ... .. Zc •
II. ПРИНЦИП НАИМЕНЬШЕГО ДЕЙСТВИЯ В ФОРМЕ ЛАГРАНЖА.
1 Для доказательства нам потребуется одно предварительное
замечание. Пусть мы рассматриваем задачу типа (35) с закреплен-
ным левым концом (при х = хо функции yi принимают наперед
заданные значения) и подвижным верхним пределом интегрирова-
ния xi'; пусть, кроме того, значения функций ys для этого конца
будут заданы. Геометрически говоря, это значит, что правый конец
кривой может скользить вдоль прямой параллельной оси х. Как
известно, тогда должны быть выполнены уравнения Эйлера (36)
и условия трансверсальности (37) для конца х> Но так как ys за-
даны, то а ~ 0 и мы, в виду произвола о xi, имеем:
[Г
Допустим, далее, что F не содержит х; тогда
Отсюда следует, что вдоль любой экстремали выражения
п *
должно быть постоянным, н так как на конце x =
искомой кривой оно равно нулю, то и на всей кривой должно быть:
. . (38)
Рассмотрим движение системы п материальных точек, происхо-
дящее под действием консервативных сил с потенциалом U и под-
чиненное голономным связям ‘
?$=0 $ = 1, ..., т.............(39)
Мы будем предполагать здесь, что ни силовая функция £7, ни
связи не содержат явно времени Л
При наших предположениях имеет место интеграл живых сил
T—U—h,........................(40)
где А — определенная постоянная.
Перемещение системы из начального положения А в конечное
положение В мы называем „допустимым", если оно удовлетворяет
следующим требованиям:
7) удовлетворяет связям (39),
2) для нею соблюдено равенство (40) с тем же самым значе-
нием п, что и в действительном движении,
3) в момент времени система имеет то же положение, что
и при действительном движении; конечное положение В системы
совпадает с конечным положением, соответствующем моменту
Л при действительном движении, но время, в течение которою
система переходит из А в В — произвольно.
ЪЛежду всеми „допустимыми" движениями будем искать то, ко-
торое дает минимум интегралу действия
t
j= Г Tdt.
h>
Сейчас мы имеем вариационную задачу рассмотренного в пред-
варительном замечании типа с неголономною связью (40) и голо-
номными . связями (39).
По правилу множителей Лагранжа составляем функцию
т
5=1
где X и — некоторые функции времени А Докажем первоначально»
что X—постоянная величина. В самом деле, для функции У7 должно
иметь место равенство (38). Производные х ', у/, z4 от координат
точек системы по времени входят в F лишь через Т.
76
стоящая в левой части (38) в нашем случае выражается в
и так как Т есть однородная Функция второго измерения относи-
тельно , у 4 у эта сумма, по теореме Эйлера об однородных
функциях, принимает вид
2 (1 + л) Т
и (38) дает
F-2 (1 +>) Г=0,
откуда, в виду (39) и (40) следует
— (1 + 2 X) Г=0,
и так как вообще 7+0, должна быть Х==
m
s~ I
dF _ 1 , <JF _ 1 dU , y> d
“ dx,' — 2 m ‘ X‘ ' dx, 2 dx, । ~dT~
s~ 1
аналогично для у, и s,.
Уравнения Эйлера принимают вид:
5—1
совпадающий с уравнениями действительного движения.
Ill. ПРИНЦИП НАИМЕНЬШЕГО ДЕЙСТВИЯ В ФОРМЕ ЯКОБИ.
Мы будем рассматривать систему п материальных точек, дви-
жение которых подчинено голономным связям
z, — 0 s ~ 1, ..., т,
и происходит под действием сил, имеющих потенциал U. Функции
U и предположим независящими явно от времени Л
Обозначим через А начальное положение системы и через
В — ее конечное положение.
Как и в предыдущем случае, имеет место интеграл живых
сил:
T—U = h,
где h — вполне определенная для рассматриваемого движения по-
стоянная.
Рассмотрим одну какую - либо „допустимую** систему траекто-
рий движения, т.-е. такую систему их, следуя которой можно пе-
рейти из начального положения А в конечное положение В и для
которых удовлетворяются уравнения связи 0.
Эта система определится заданием Зп функций
удовлетворяющих определенным граничным условиям.
Здесь т некоторый параметр, определяющий положения точек
на траекториях. Б частном случае за этот параметр может быть
взято время. Мы не будем делать пока этого ограничения в выборе
параметра.
Указанную выше совокупность Зп функций хо yf, можно
условно рассматривать как „кривую** пространства с Зп измере-
ниями. Эта кривая проходит через точки А и В нашего пространства,
соответствующие начальному и конечному положениям системы,
и лежит на гиперповерхностях, определяемых уравнениями связи
= 0.
Наоборот, каждой кривой нашего пространства, обладающей
двумя перечисленными свойствами, будет соответствовать некото-
рая возможная система траекторий. В этом смысле механика си-
стемы точек есть вместе с тем геометрия линий многомерных про-
странств.
Поставим перед собой вопрос найти такие свойства кривой,
соответствующей действительному движению системы, которые по-
зволили бы выделить ее из всех других кривых, соответствующих
лишь возможным движениям.
Один из возможных ответов на поставленный вопрос дается
следующей задачей Якоби:
Среди кривых, удовлетворяющих условиям г?$ — 0 и проходя*
щих через две наперед заданные точки найти ту, которая дает
наименьшее значение „интегралу действия"
Прежде всего очевидно, что интеграл / зависит только от кривой,
но не от выбора параметра Это непосредственно следует, в виду
73
изложенного нами в главе I, из того, что функция, стоящая под
' знаком интеграла, положительно однородна первого измерения от-
носительно производных от искомых функций по параметру.
Мы обозначим, ради краткости,
п
Уравнения Эйлера для этого интеграла будут:
и аналогично для и z, •
Как известно из общей теории параметрической задачи, полу-
ченные уравнения не независимы между собой и определяют кри-
вую лишь с точностью до выбора параметра. Для получения опре-
деленных функций х,, у* , Z'i к системе должно быть присоединено
уравнение, определяющее выбор параметра.
Чтобы показать, что найденные уравнения определяют кривую,
соответствующую действительному движению, мы воспользуемся
произволом выбора добавочного уравнения. Мы будем требовать,
чтобы было соблюдено равенство:
и обозначим удовлетворяющий этому требованию параметр че-
рез Формула замены переменных будет,
в на
деть следующим образом:
ем случае, выгля-
II
Написанное выше уравнение, определяющее выбор параметра, есть
ничто иное, как интеграл живых сил Т—U~h. Поэтому выбран-
ный нами параметр t есть время.
Написанные выше уравнения Эйлера в параметре t принимает
форму уравнений динамики:
что и доказывает наше утверждение.
Итак, если силы консервативны, связи и силовая функция не
содержат времени явно, то уравнения траекторий движения си-
79
стемы получаются из записи необходимого условия минимума
„интеграла действия*1
*1 ___________
f /2 (У+Ъ
*
'О
£
при закрепленном начале и конце и связях = Л
Но поставленная нами задача может быть истолкована как за-
дача о нахождении геодезической линии, лежащей на пересечении
гиперповерхностей —0 и соединяющей точки А и В для случая,
когда метрика пространства определена квадратной формой
ds2 — 2(U-\
т< [ (dx6)2 4~ (dy6)2 + (cfev)2].
Благодаря этому обстоятельству всякое движение точки в про-
странстве может быть рассматриваемо как движение по геодезиче-
ским линиям. Наличие сил сводится тогда лишь к явлению изме-
нения метрики пространства.
Обозначим через 9Х,.....(k = 3n — т) независимые обоб-
щенные координатные параметры нашей системы точек. Уравнения
связи отпадут, и дифференциальные уравнения движения получатся
из необходимого условия несвязанного минимума интеграла:
"о 4 J — I
где atj—известные функции от 9/.
Эта задача равносильна разысканию
мерном пространстве, метрика которого
геодезических линий в k—
определена равенством:
§ 20.
К
= 2 \и (<?!,
п
Приложение вариационных принципов механика
некоторым задачам математической
изики.
1. Под струной в теории упругости понимают линейное много-
образие материальных точек, которое в состоянии равновесия под
влиянием некоторого натяжения располагается вдоль прямой линии.
Ниже мы эту прямую всюду будем принимать за ось х-ов. В де-
формированном состоянии струна будет обладать потенциальной
энергией. Для струны принимают, что потенциальная энергия де-
формации каждого малого элемента струны будет пропорциональ-
ная удлинению его по отношению к его величине в состоянии
равновесия. Коэффициент пропорциональности будет зависеть от
упругих свойств струны, времени, если мы рассматриваем струну
с переменными физическими свойствами и, наконец, от начального
80
натяжения рассматриваемого элемента. В. одном случае, о котором
мы будем говорить ниже, этот коэффициент совпадает с началь-
ным натяжением.
Колебания струны мы будем предполагать плоскими—когда
вся струна в любой момент времени лежит в некоторой постоян-
ной плоскости, проходящей через ось х-ов и поперечными — когда
каждая точка струны может перемещаться только по прямой, пер-
пендикулярной к оси х-ов.
Исследование движения струны в этом случае эквивалентно
изучению функции и (х, /), измеряющей расстояние точки струны
в момент времени t от ее положения х равновесия по оси х-ов
по перпендикуляру к этой оси-
Мы будем иметь в виду так называемые малые колебания
струны, когда можно пренебрегать высшими степенями функции
и и ее первой производной по отношению к низшим степеням.
Колебания струны мы будем предполагать пока свободными.
Рассмотрим кусок струны между х~а и х=Ь. Кинетическая
энергия этого куска будет равна’ х
ь
Т = У’ Р и/2 dx,
\ а
где р — плотность струны, могущая вообще зависеть как от поло-
жения точки на струне, так и от времени, если • иметь в виду
струну, меняющую с временем свои свойства.
Составим выражение для потенциальной энергии. Возьмем
малый участок dx струны в положение равновесия; в деформиро-
ванном состоянии длина этого участка, с точностью до бесконечно
малых величин высшего порядка, будет равна
р/ 1 и*2 dx
и линейное увеличение его есть
1 их2 dx— dx,
или, если пренебречь степенями выше второй, -4- их2 dx.
Обозначим через р упоминавшийся уже выше коэффициент про-
порциональности-
Потенциальная энергия деформации струны получит выражение
ь
— U= J* их2 dx.
а
Интеграл Гамильтона имеет вид:
Л h ь
I = /(ГЦ- U) dt =z±f f (р и/*-р их'2) dx dt.
а
Ваоиапвоннсе исчисление. — 6
81
Дальнейшее изучение поставленного вопроса потребует от нас
определенных предположении относительно концов струны. Мы
будем предполагать здесь движение концов струны известными;
в частном случае, концы могут быть закреплены. Знание этого
движения равносильно заданию функции и на сторонах х—а и
х — Ь прямоугольника интегрирования в интеграле Гамильтона для
струны. Читателя, пожелавшего ознакомиться с изучением движе-
ния струны при граничных условиях иного рода, мы отсылаем
к дополнениям к настоящему параграфу.
Для нахождения уравнения движений струны мы должны среди
всех функций и, принадлежащих классу С(1\ найти ту, которая
давала бы минимум интегралу / и при t — /о и t—t\ давала поло-
жение струны, совпадающее с ее действительным положением.
Последнее требование равносильно заданию функции и на сто-
ронах t — tQ и t=t\ прямоугольника интегрирования, и так как ее
значения для двух других сторон х = а и х — Ь прямоугольника,
как уже отмечалось выше, известно, что дело сводится к нахожде-
нию функции и, минимизирующей интеграл /, при заданных гра-
ничных значениях. Уравнения Эйлера для и имеют вид:
(р */)/ - (н */)/ = о
и представляют собой уравнение движения струны.
Если на струну действуют внешние силы, перпендикулярные
к оси х-ов, распределенные непрерывно по струне с плотностью
/ (х, /), то’ к выражению потенциальной энергии р- их" dx
деформации каждого элемента струны добавляется еще потен-
циальная энергия от внешних сил—/. и dx.
Интеграл Гамильтона здесь принимает вид:
to &
и уравнение движения струны (уравнение Эйлера для нового
интеграла) будет
(ри/)/ —(р- 0 = 0.
В частном, практически наиболее важном случае однородной
постоянной струны, р и р- будут постоянными, и предшествующее
уравнение переходит в:
р Utt' = р- Uxx + /•
2. Как мы уже упоминали, потенциальная энергия деформации
упругого стержня, прямолинейного в иедеформированном состоя-
нии, выражается интегралом вида
1 ,JL
где -------кривизна стержня и=---------коэффициент пропорциональ
Р
ности.
82
Мы будем рассматривать плоские поперечные малые колебания
такого стержня. Примем прямую положения равновесия стержня
за ось х-ов и определим функцию и (х, у) как и в предыдущем
случае. Кривизна его в деформированном состоянии равна:
или, если откинуть в виду малости колебаний члены высших изме-
рений:
Потенциальная энергия деформации всего стержня имеет по-
этому выражение
Живая сила Т стержня есть
ь
-у- J р и? dx.
а
По принципу Гамильтона, функция и, соответствующая действи-
тельному движению стержня, должна давать экстремум интегралу
Л А ъ
f (Г 'г £/) dt = ~ f f (P и/2 -!1 дх dt,
to Л
если известно начальное и конечное положение стержня, т.-е. зна-
чения функций И ДЛЯ /— tQ И
Остальные граничные условия будут зависеть от того, будут ли
концы стержня заделаны, закреплены или оперты на подставки и
т. д.; для исследования этих вопросов мы отсылаем читателя к до-
полнению, здесь же нам важно будет установить, что при любой
природе граничных условий функция и должна давать минимум по
отношению к классу функций с теми же граничными условиями,
что и и, и потому должна удовлетворять дифференциальному
уравнению Эйлера:
(р (р Кгжг^хх' = О'
В случае вынужденных колебаний стержня под действием сил,
распределенных непрерывно с плотностью f (х, f), перпендикуляр-
ных к оси х, потенциальная энергия стержня будет содержать лиш-
нее слагаемое, даваемое внешними силами
ь
J* f и dx*
а
Уравнение движения тогда имеет вид:
(р «/)/
(Н Uxx")xx"
/(х,/)=о.
6*
83
Для однородного постоянного стержня, когда р и р не зависят от
времени, получаем:
Р Utt" + Ихкг/" —/(х, t) = 0.
Дополнения и задачи.
1. Условия трансверсальности для параметриче-
ской задачи.
Среди кривых, принадлежащих классу начинающихся на
гиперповерхности Фо (х, г/, z ...) = 0 и кончающихся на гипер-
поверхности Ф1 (х, г/, z ...) = 0, найти такую, для которой
/г
''о
быЛ бы экстремальным.
Искомые функции должны удовлетворять системе уравнений
Эйлера:
и условиям трансверсальности
dz
2. Естественные граничные условия для случая
производных высшего порядка.
Среди функций надлежащего класса в промежутке от х0 до xt
и не подчиненных никаким граничным требованиям, найти экстре-
мизирующую интеграл
Обычным путем, при добавлении нескольких интегрирований
по частям, легко удается доказать следующею теорему:
Функция у, решающая поставленную задачу, должна быть
интегральной кривой уравнения Эйлера
интегри-
и удовлетворять на концах х — х0 и х = Xj промежутка
рования предельным условиям:
84
3. Условие трансверсальности для кратных инте-
гралов.
Поверхность z~z (л, ?/), дающая экстремум интегралу
(О)
____ dz __ dz
? dx dy
относительно всех других поверхностей, границы которых лежат
на заданной поверхности ? (х, уу z) = 0, должна удовлетворять
уравнению Эйлера и условию трансверсальности на границе
Читателю предлагается показать, что для случая минимальной
поверхности условие трансверсальности переходит в условие орто-
гональности пересечения поверхности = 0 с поверхностью
4. Смешанные задачи вариационного исчисле-
ния.
Мы ни в какой мере не имеем в виду затронуть здесь все хотя
бы основные типы смешанных задач и останавливались только на
самых простых случаях, которые мы ниже прилагаем к исследо-
ванию разнообразных задач математической физики и механики.
Лиц, желающих ознакомиться с различными типами смешанных
задач, являющимися естественным обобщением основных задач
математической физики и соответствующими им функциональными
уравнениями, заменяющими Эйлерово уравнение, мы отсылаем
к мему ару R. Courant’a „Ueber die Anwendung der Variationsrech-
nung in der Theorie der Eigenschwingungen" в 49 томе Acta
Mathematica от 1926 года.
1. Первоначально мы остановимся на наиболее простом типе
такого сорта задач, который нам будет полезен значительно позже.
Пусть заданный функционал А (у) имеет вид
•*1
А (у) = f F (х,у,у') (xQ, уъ, xlt yj,
Хо
где (xe, yQ) и (хь #]) суть концы кривой, для которой он вычис-
ляется.
Среди всех кривых, принадлежащих некоторой совокупности
(нам безразлично сейчас, какой именно), найти ту, которая дает
экстремальное значение А (у).
Первая вариация функционала А (у) при переходе от одной
кривой взятой совокупности к некоторой другой будет, очевидно,
состоять из первой вариации интегрального слагаемого плюс
вариация функции координат концов кривой
8А = 8 Г-Н?- * ’ *
85
Но общее выражение вариации для интеграла нам уже известно,
а общее выражение вариации ?(х0, ус>, xj, yi) дается формулой:
8 «71 •
Поэтому общее выражение вариации рассматриваемого функционала
имеет вид:
О
2. В плоскости х, у дана некоторая область D, ограниченная
контуром Л Рассмотрим функционал
о
г
Z$j d Sj
dz dz
где p jx, q -— s —
некоторой точки, и z's
длина дуги контура I, отсчитываемая от
__dz
~ ds'
Возьмем семейство функций, определенных в области D и удо-
влетворяющих известным нам из первой главы условиям непре-
рывности и составим общее выражение первой вариации функцио-
нала B(z) при переходе от некоторой функции z нашего семейства
к некоторой другой функции z того же семейства. Введем для этой
цели однопараме£ренное семейство функций
Z = Z + а т; (х, у),
где т] (х, у) есть произвольная, определенная в области D, функция,
удовлетворяющая тем же условиям непрерывности, что Z.
Подставим в В (z) вместо Z функцию Z. Результат будет зави-
сеть от параметра я.
Составляем первую вариацию B(z\ следуя обычным правилам
dB{z)
Так как область D интегрирования остается неизменной, диффе-
ренцирование по а выполняется под знаком интеграла:
а
^//1
Fz'bz-\-Fp'
! dx dy —
ds,
причем
3Z = 7)(х, у)а, 8р = 7)ха, 0^=7^,'a, Zzs'=^a.
86
Если обратить внимание на возможность перестановки опера-
ций вариирования и дифференцирования:
8р = /- 8z, 8<7 = -/- oz, 8zs'=^-8s,
г дх ду 9 ds 9
полученное для ЗВ выражение можно преобразовать следующим
способом
Fp 8р-|“-^/ dx
+ {F.'~ &V- ^F.'^zdxdy.
D
Первое слагаемое правой части может быть приведено к криво-
линейному интегралу по формуле Грина-Риманна и мы будем иметь
где символом / Ф?$ 3z обозначено приращение функции, стоя-
г
щей под знаком подстановки вдоль контура Г; когда контур не
имеет угловых точек, оно, очевидно, равно нулю, ибо одно-
значна и, при обходе по контуру, возвратится к исходному зна-
чению.
Иное будет в том случае, когда контур имеет угловые точки.
Здесь интеграл по Г тогда следует понимать как сумму интегра-
лов по гладким кускам контура и подстановка будет вообще от-
лична от нуля.
Пусть Si угловая точка и ф (s) любая функция дуги контура.
Скачок фувкции ф (s) при переходе через точку будем называть
через 5/ (ф).
Приращение выражения Ф^Ъ z вдоль контура будет равняться
сумме всех его скачков, вызванных прерывностью z s
г
Окончательно для 35 получаем:
Определим теперь каким условиям должна удовлетворять
функция zf дающая функционалу В (z) экстремальное значение по
отношению ко всем функциям рассматриваемого нами семейства.
87
Разделим для этого все функции семейства на 2 группы
К первой нз них отнесем те, которые имеют такие же контур*
ные значения, что и искомая функция г, н ко второй — все
остальные.
z должно давать экстремум относительно обеих групп. Но если
z дает экстремум по отношению функций первой группы, то, так
как в общем выражении вариации линейный интеграл в этом слу-
чае пропадает, ибо на контуре Г ог = 0, должен равняться нулю
двойной интеграл для всякого выбора оZ внутри области, что
может иметь место тогда и только тогда, когда выполнено урав-
нение Эйлера
р/ д у, д
дх ду ~ °’
Наконец, для второй группы функций получается^ что должен
равняться нулю линейный интеграл для всяких на контуре; это
приводит к естественным граничным условиям вида:
Ф' —-4-Ф',=о,
Z ds z ’
и для угловых точек к условиям: 5/(Фг’) = 0.
3. в пространстве 3-х измерений задан объем V, ограниченный
поверхностью 5. Положение точки на поверхности мы будем опре-
делять некоторыми параметрами и, -и, так, что когда точка с коор-
динатами и, v меняется в некоторой области, точка с координа-
тами x(u, v)f у (и, v), z (u, v) пробегает всю поверхность 5.
Пусть
c<W=fff F(x, У> и, Ux', Uy', UJ) dxdydz^
V
+ f f ф(и, V, U, Ua Uv')ds,
где Uu н Uv суть частные производные по координатным пара-
метрам от граничных значений функции U.
Допустимыми будем считать функции, определенные в объ-
еме V и удовлетворяющие там известным требованиям непрерыв-
ности.
Общее выражение первой вариации функционала С(Ц) при
переходе от одной допустимой функции к некоторой другой нахо-
дится, в виду того, что такой переход не изменяет области инте-
грирования, по обычным правилам дифференцирования под знаком
интеграла:
*C=ffdxdydz±
V z
+ ds.
s
88
По формуле Гаусса имеем:
V
cUds —
П COS 7
u z
= f J* {fu х cos a-\-FUy cos $-\-f
s
~ f f f^dx Fu x + 17 Fuy + "57 FU’Z\ 0 Udxdydz .
Преобразуем теперь интеграл, взятый по поверхности
5
f [\фи. А3м wdudv, *
J J I и и OU V V &v J
S
где w = \/EG—F2 и Е, F, G суть известные сокращения Гаусса.
Применив к последнему интегралу формулу интегрирования по
частям, предполагая, что 5 имеет непрерывно меняющуюся каса-
тельную плоскость, получим имея в виду замкнутость поверх-
ности S
-- (Ф„ ы) 4“ ? (Фп ds,
Ou v U и 7 ' OV ' U V 7
кончательно для 3 С имеем :
8 С J' fFu~TX FVx-dyFuy~TzFv'^ZudxdydZ +
V
ЛFu*
cos a Fuv cos P 4" Fu'z cos у 4“ Ф и —
}%Uds.
Соответствующее нашей задаче естественное граничное условие,
ак легко видеть, имеет форму
и> cos a + Fu1 cos p 4- Fy> cos 7
Л * Jr 1 * Л ’
Фи----- J- (Ф^и +
w Qu ' “ 1
4- (Фи' w)
Ov ' z’ f
на 5.
Если бы поверхность *5 имела особые линии или точки, вдоль
которых касательная плоскость неопределена, то выражение для 8 С
содержало бы в себе слагаемые, соответствующие этим особым
местам поверхности. Они появляются при интегрировании по
частям интеграла * и будут иметься налицо только в том случае,
когда Ф содержит Uu и t//. Мы не будем выяснять форму этих
дополнительных слагаемых, ибо в том примере, к которому мы
1
89
будем применять полученный результат, функция Ф будет зави-
сеть только от U.
4. Уравнение колебания струны. Мы рассмотрели
в основном тексте книги вопрос о колебании струны для случая,
когда известно движение ее концов. Допустим здесь, что о концах
струны мы знаем лишь только, что на них действуют силы: на
левый ро (и, 0 и на правый р\ (и, t) ортогональные к оси х-ов.
Потенциалы их соответственно будут:
J*ра (и, f)du — Pq (и, t)
I pi (и, t) d и — Pi (и, t).
* t
Мы получили раньше интеграл Гамильтона для струны, движу-
щейся под действием непрерывно распределенной внешней силы
ортогональной к оси х-ов.
В рассматриваемом нами случае мы должны присоединить
к нему дополнительные слагаемые, даваемые потенциалами сил,
приложенных на концах. Получим:
4 ь t
А» а
л
—J Pi (и, t)dt.
4
Функция и должна быть найдена из необходимого условия
экстремума написанного функционала.
К конкурренции сейчас допустимы все функции, принимающие
на сторонах t -- /0 и t — t\ прямоугольника интегрирования задан-
ные значения. Что же касается их значения на двух других сто-
ронах, то они, в противоположность рассмотренному случаю,
могут быть какими угодно (см. рис* 6).
Два дополнительных линейных интеграла, входящие в получен-
ный нами функционал /, суть собственно интегралы, вычисленные
для кусков х~а и х=Ь контура всей области интегрирования;
правда, в первом из них направление интегрирования противопо-
ложно направлению положительного обхода контура.
Как показано нами в дополнении 2, наличие в функционале
такого рода дополнительных слагаемых не имеет никакого влияния
на функциональное уравнение, которому должно удовлетворять
функция и; для нее, как и выше, должно быть справедливым
уравнение Эйлера
(р- и’х)'х — (р и t)'t 4- f (х, у) = 0.
Присутствие их отзовется только на граничных условиях для и.
В изучаемой задаче должны быть выполнены естественные гра-
ничные условия для х=а и х = 6.
90
Составим их сначала для правого конца струны:
dt__ j dx_ л
ds “ ds~ °
и должно быть
U-u/--Pi (и, t) = 0 при Х — Ь.
На левом конце ~—1, ибо, как отмечалось, направление воз-
растания t здесь противоположно положительному направлению
dx л
вдоль контура, О и естественным условием для левого конца
струны будет:
Н ро («, О s 0 при х = а .
5. Уравнение колебания мембраны. Под мембраной
понимается тонкое материальное тело, плоское в недеформирован-
ном состоянии, потенциальная энергия каждого малого куска
которого в деформированном состоянии пропорциональна измене-
нию его площади. Пусть в свободном состоянии мембрана зани-
мает часть D плоскости х у. Мы будем рассматривать лишь малые
поперечные колебания мембраны. Ее положение в любой момент
времени t определится функцией U (х, р, f), измеряющей удаление
каждой точки мембраны от ее плоского положения равновесия.
Пусть dxdy—элемент мембраны в свободном состоянии.
Тот же элемент в деформированном состоянии имеет площадь
и увеличение его площади, если ограничиваться членами низшего,
измерения, будет
Потенциальная энергия деформации всей мембраны имеет
поэтому вид
fv(U^+Uy'^dxdy,
где р- — коэффициент пропорциональности между потенциальной
энергией и изменением площади, характеризующий физические
свойства мембраны в каждый момент времени.
Решим сначала задачу о свободном равновесии мембраны
с закрепленными концами.
Функция U, определяющая искомое положение, должна давать
минимум интегралу потенциальной энергии относительно всех Дру-
гих функций U с теми же контурными значениями и должна,,
поэтому, удовлетворять уравнению Эйлера, принимающему здесь
вид
91
Допустим теперь, что дело идет о равновесии мембраны под
действием направленных перпендикулярно к плоскости ху сил
двоякого рода: распределенных по всей площади мембраны с плот*
ностью f (х, у) и распределенных по контуру с плотностью р (s, £/),
могущей зависеть от удаления краев мембраны от положения рав-
новесия; к такому типу сил принадлежат, например, силы упругой
связи краев мембраны с положением нх равновесия.
Полная потенциальная энергия мембраны будет состоять из
энергия деформации, выражение для которой мы уже получили,
слагаемого вида
f ff(x, у) Udxdy
даваемого поверхностными силами и слагаемого, зависящего от
линейно распределенных сил, вычислить которое не представляет
труда.
Возьмем элемент ds контура Г. На соответствующий элемент
края мембраны действует сила pds, потенциал которой есть
Гр d U d s ~ Р {s, U) d = р ( U, s)
и потому потенциал всех линейных сил будет
Искомое выражение для энергии есть
ff\^Wx*+Uy2)—f(x,y\U\dxdy—fP(s, U)ds.
D Г
Функция U должна давать минимум этому выражению при
любых граничных значениях. По доказанному в задаче 4 6, она
должна удовлетворять уравнению Эйлера
(lxtA'V+(^v);+/(x,
и естественным граничным условием
или, так как и —
мали к контуру Г и
есть направляющие косинусы внешней нор-
„ г*
имеем . '
р (s, U) = 0.
аи
!JQn
В частном случае,
когда линейные силы есть силы упругой
92
связи краев мембраны с положением их равновесия, р ($, и) —
~ — з(з) U и предельные условия примут форму
dU .
с (s) U — 0.
Мы будем иметь в виду теперь получить уравнения движения.
Пусть р плотность мембраны. Ее кинетическая энергия дается
интегралом
уУ* j*pUtldxdy.
О
По принципу Гамильтона мы получим уравнение, решающее
поставленную задачу, если напишем первое необходимое условие
экстремума для интеграла действия
Л л
f (u)dt=f f ui2 - <их'2 + tz;2) + f и d x d у dt~\->
Функция U должна быть определена в области и &
по переменным х и у, геометрически говоря, если иметь в виду
пространство х, у, Z, в отрезке цилиндра с образующими парал-
лельными оси построенного на контуре Г между плоскостями
t = to и t = (см. рис. ба). *
Рис. ба
К конкуренции допустимы движения, удовлетворяющие требо-
ваниям:
Начальное и конечное положения мембраны совпадают с на-
чальным и конечным положениями при действительном движении,
что равносильно заданию функции U на основаниях упомянутого
цилиндра.
Что касается боковой поверхности цилиндра, то здесь все
9S
будет зависеть от того, будут ли свободны или несвободны края
мембраны.
Если движения краев мембраны известны, то функция U на
боковой поверхности задана и мы имеем дело с вариационной
задачей для закрепленных граничных значений. Необходимым усло-
вием для нее будет выполнение уравнения Эйлера:
(Р (и Ux')x'~ У, t) = О,
представляющего собой уравнение колебаний мембраны.
Если же концы мембраны свободны, то должно быть, кроме
того, выполнено на боковой поверхности естественное граничное
условие
|x(t/xc’osa-j-t^zcos р) — р(и, $, £) = 0,
или
*
\
dU
dn
р (u, s, 0 — 0 .
6. Обобщения на случай производной второго
порядка и приложения к стержню. 1. Рассмотрим слу-
чай смешанной задачи когда под знак интеграла входят произ-
водные второго порядка.
Пусть
В (z) =//г(
д2 z
где р, <?, zs имеют уже поясненные значения и г — ,
__d2z ______d-z
Zss~ ds1’
d2z
дхду ’
Будем полагать контур Г имеющим конечное число угловых
точек. Контурный интеграл, входящий в выражение В (#), мы при-
нимаем как сумму интегралов, взятых по отдельным гладким
кускам контура. Мы уже имели случай убедиться выше, что нали-
чие таких особенностей границы вызывает, вообще говоря, по-
явление дополнительных слагаемых в общем выражении первой
вариации.
То же обстоятельство будет иметь место и в изучаемом
вопросе.
Допустимыми к конкуренции мы будем считать все функции Z,
определенные в D и принадлежащие так, что переход от од-
ной из них к некоторой другой не связан с изменением областей
интегрирования в функционале В (z).
Выкладки, необходимые для получения общего выражения пер-
вой вариации В (z), хотя и просты по существу и требуют для
своего выполнения лишь интегрирований по частям и применения
формулы Грина-Римана, слишком продолжительны, чтобы приво-
дить их здесь. Мы предоставляем читателю проделать все про-
межуточные вычисления и ограничимся только тем, что приведем
окончательный результат.
94
Введем следующие обозначения
Тогда
f [FY'Zdxdy^. /{м-^ + РФг'-^Ф^
D* Г
2. На конец х=а стержня действует сила р0 (t/> 0* ортого-
нальная к оси х-ов и имеющая потенциал (U, t) = J*po(U, t)dU
и наконец х = b сила pi (U, I) с потенциалом Pi (U, t) = / pi (U,t)d U.
Как мы уже видели, кинетическая энергия стержня есть
ъ
^fpU^dx,
а
потенциальная энергия деформации:
ь
а
и потенциал поверхностных сил:
'ч4
ffUdx.
а
Интеграл Гамильтона в нашем случае будет:
f(Т+ V)dt=ff{t W U'xx^+fU\ dxdt +
to а
Л 6
95
Составим первую вариацию интеграла, принимая за U функцию»
соответствующую действительному движению стержня.
Как и раньше, очевидно, должно быть
Далее
Frf— — pUxx”; Fs — 0; /7=0; Fp'—0; Fqf = pU/f,
&U равно нулю на сторонах t—te и t = прямоугольника F
интегрирования, ибо начальное и конечное положение стержня
задано. На тех же сторонах TV2 = 0 и останутся лишь интегралы
соответствующие сторонам х = а и х=Ъ (см. рис. задачи 5).
Неинтегральные слагаемые пропадают, ибо Ф не зависит ни от USy
ни от Uss и вдоль частей х = а и х~Ъ контура 7Vi=0, а вдоль
других двух частей *U— 0.
Вдоль же частей контура х=а и
£/? будет состоять из двух слагаемых, соответственно для
х =а (положительное направление обхода по контуру здесь про-
тивоположно возрастанию £):
и для х—Ь
К
- n^u^'-pd^t^udt- f^uxx^d^dt.
/о 4)
Изучим несколько типов предельных условий.
а) Концы стержня „заделаны^, т.-е. известно, как меняются
не только ординаты концов стержня, но и изменения касательной
в этих концах:
г*
и (а, 0 = Л (0; U(b, t) = f2 (/); Ux' (a, t) = ?1 (ty Ux' (b, t) = ?2 (/).
4
Решение находится тогда из уравнения движения написанных
предельных условий и начальных данных. Здесь на концах
Ь) Концы „оперты", т.-е. известно изменение их ординат, но
касательные могут быть какими угодно о £/= 0.
Решение ищется по граничным условиям:
U(a,1) = /х (/), U (b, I) = /2 (О, И UXF (a, t) = 0.
р Uxx” (b, t) = 0 плюс начальные данные.
96
с) Наконец, при свободных концах стержня должно быть:
(f1 U"xx)'x -f- р0 (и, t) = 0, х — а
С1 и"хх)'х— pi (и, 0=0, х=ь
И U'xx (а, 0 = 0 Р СГХХ (Ь, t) = 0.
S
7. Найти кратчайшее расстояние от точки до кривой (поверх-
ности) в плоскости (в пространстве).
Ответ: Нормаль из точки на кривую (поверхность).
8. Найти расстояние между двумя линиями (поверхностями)
в плоскости (в пространстве).
Ответ: Общая нормаль.
9. Найти брахистохрону для случая, когда исходная точка Ро
закреплена, а конечная точка может двигаться вдоль заданной
кривой А, лежащей в вертикальной плоскости. Найти геометриче-
ское правило построения искомой кривой для случая, когда L—
вертикальная прямая.
Ответ: Циклоида, выходящая из Ро и ортогональная к А.
10. Решить задачу о наименьшей поверхности вращения для
случая, когда одна из точек может двигаться вдоль заданной
кривой А и вторая — закреплена.
Ответ: Цепная линия, ортогональная к А и проходящая через
закрепленную точку.
11. Показать, что условие трансверсальности для
F(x> У> У‘> И = G(x, у, Z) ]/1 + у12 Z'2
вырождается в условие ортогональности.
12. Среди кривых, расположенных в верхней полуплоскости
(i/^O), проходящих через заданную точку Рг и вторым концом Р2
лежащих на прямой у~у^ найти ту, которая вместе с ординатами
точек Pi и Р> и соответствующим отрезком оси х ограничивает
площадь заданной величины и имеет наименьшую длину.
Решение'- Дуга круга с центром на оси х.
13. Пользуясь принципом наименьшего действия, показать, что
всякая материальная точка, двигающаяся вдоль поверхности без
действия сил, описывает геодезическую линию.
14. Найти все функци Р(х, у, yf), для которых условие транс-
версальности переходит в условие ортогональности.
Решение:
F = G (х, у) /14- у 2. 15
15. I — у у (у2 — у*)дх=т\п при условии у(0) = 0 и второй
б
конец движется вдоль кривой
Варвациоввое всчвслснме. — 7
97
Решение*
sin х2
где х2 — корень уравнения
sin 2 х2 = 0.
ГЛАВА IV.
Теория поля-
§ 21» Поле экстремалей.
Все семейство экстремалей, т.-е. интегральных кривых уравне-
ния Эйлера, в случае простейшей задачи вариационного исчисле-
ния, есть семейство, зависящее от двух параметров. Рассмотрим
часть этого семейства, а именно, семейство экстремалей, завися-
щее от одного параметра
у = ? (х, а) .....................(1)
Пусть это семейство кривых покрывает некоторую область D
плоскости; мы будем называть эту область D полем, если соблю-
дены следующие два условия:
1) область D просто перекрыта семейством (1), т.-е. через каж-
дую точку области D проходит одна и только одна экстремаль
семейства;
2) функция у имеет непрерывные частные производные первого
и второго порядка по обеим переменным х и а.
Особый интерес представляет частный вид поля, когда семейство
(1) есть семейство экстремалей, проходящих через точку (xt), yQ); за
параметр в этом случае может быть взят угловой коэффициент г
экстремали в точке (%о, У о), т.-е. уравнение семейства будет:
У == (х> т).......................(2)
В этом случае семейство экстремалей (2) называют семейством
лагранжевых путей, а поле D — центральным полем; точка (х0, у$)
находится при этом на границе поля, так как через нее проходит
бесчисленное множество экстремалей.
Через каждую точку поля проходит определенная экстремаль;
угловой коэффициент u=yf касательной к этой экстремали назы-
вают уклоном поля в данной точке. Эта величина и имеет опре-
деленное значение во всех точках поля и представляет функцию
переменных х и у, определенную в поле Z):
и —и (х, у).
Эта функция может быть явно выражена посредством исключе-
ния параметра а, с помощью уравнения (1) из уравнения
и (*, У) — У — (*> а) •
•(3)
98
Из этого ясно, благодаря сделанным относительно функции ср
предположениям, на основании общих теорем о неявных функциях,
что и есть функция непрерывная вместе со своими частными про-
изводными первого порядка.
Если поле задано, то тем самым определена функция и, но
и наоборот, задание функции и вполне определяет семейство экстре-
малей, образующее поле. Действительно, все экстремали поля удо-
влетворяют уравнению
у' = и (х, у).....................(4)
и могут быть найдены поэтому (если и известна) как интегральные
кривые этого дифференциального уравнения. Но функция и не может
быть задана произвольно, так как кривые семейства (1) должны
удовлетворять не только уравнению (4), но и уравнению Эйлера
[гл. I (13)]:
Это требование ^накладывает определенное ограничение на
и (х, г;); именно: любая удовлетворяющая уравнению (4) функция у
должна удовлетворять уравнению Эйлера и потому, найдя у" из (4):
„ d г ди t ди dy du । ди
У —~37 *•“ (х> ’ ~dx и • • (б)
и, подставив выражения у( и уг из (4) и (6) в уравнение Эйлера,
мы должны получить тождество, т.-е.
Р'у (*> у, u) — Fffyy' (х, у, и) и— F"Xy’ (х, у, и) —
— F"y'y’ (*> У> и) + и) =0...................<7)
Так как это равенство должно быть выполнено для всех значе-
ний х и у, то оно представляет уравнение в частных производных,
которому должна удовлетворять функция и.
Мы рассмотрели сейчас семейство экстремалей, покрывающее
область — поле экстремалей; введем теперь другое семейство кри-
вых, важное для изучения вариационной задачи.
§ 22. Поле трансверсалей.
В главе III было введено условие трансверсальности; именно,
мы говорили, что некоторая кривая пересекает данную экстре-
маль у трансверсально, если соблюдено условие:
[F (х, у, у')-у' F'y (х, у, у'^х + F'y (X, у, у') ^у = О, . . (8)
где у обозначает угловой коэффициент экстремали, а ох и к у —
дифференциалы координат точки на данной кривой. Это уравнение
устанавливает зависимость между угловым коэффициентом экстре-
мали у' и угловым коэффициентом данной кривой —в точке их
пересечения; так, что если дано одно из этих чисел у жли , то
другое определяется по нему на основании уравнения (8).
7*
99
Пусть нам дано некоторое поле D основной вариационной за-
дачи об определении минимума интеграла
и пусть
хг
ХО
.(9)
• (1)
есть соответствующее этому полю семейство экстремалей, тогда
кривая, пересекающая все экстремали поля трансверсально, т.-е. так,
что выполняется условие (13), называется трансверсалью поля*
Поставим теперь задачу нахождения уравнения семейства транс-
версалей для данного поля. Пусть и будет уклон данного поля,
а 3 х и В у дифференциалы переменных для искомой трансверсали,
тогда условие (9) дает нам, если заменить у> на и на основании (4),
уравнение:
*
[F (*, у, u) — F'y (х, у, и) и] Sx-f-F’y (х, у, и) ^у — 0 . (10)
Это уравнение представляет дифференциальное уравнение пер-
вого порядка, которое и определяет семейство трансверсалей.
Покажем, что левая часть его представляет полный дифферен-
циал; в самом деле для этого нужно проверить, что
[Fy (х, у, и)] = [F (х, у, и) —и Fу (х, у, и)],
но производя дифференцирование, получим
// ди
у’у! ду
Это же равенство, наверное, имеет место, так как функция и, пред-
ставляющая уклон поля, должна удовлетворять уравнению (7).
В таком случае общий интеграл уравнения (10) имеет вид:
е (х, У! = с,....................• . (11)
где 6 функция, удовлетворяющая условиям
. -(12)
Из этих условий функция 6, если и известна, может быть вы-
ражена с помощью криволинейного интеграла и записана в виде:
U 7)
в (х>у)= J (x,y,u) — uF'y (х, у, и)] </х +
(X, 7»)
+ F'y‘ (х, у, и) dy............................(13)
100
Заметим, что, если за кривую интегрирования взять экстре-
маль, то для нее —~~ = и [(4)], и интеграл (13) вырождается
в этом случае в основной интеграл (9), ибо:
Т?Г
---U Г у
dx 4~ F у Л/= 0.
Семейства экстремалей (1) и трансверсалей (11) образуют две
системы взаимно пересекаю-
щихся линий, покрывающие
поле (см. рис. 7). Вопрос о
физическом значении этих
линий подробнее будет осве-
щен дальше, пока укажем
только, что обычно в зада-
чах, имеющих физический
смысл, семейство экстрема-
лей, в том или ином виде,
Рис. 7
дает линии тока поля, а се-
мейство трансверсалей ли-
нии уровня — эквипотенци-
альные линии.
Проведенная аналогия
еще усиливается следующим
свойством поля:
Величина основного интеграла
*1
f С (х, У, у') dx,
-^0
(9)
взятого по участку экстремали, заключенному между двумя
данными трансверсалями поля, одна и та же для всех экстре-
малей.
Найдем величину интеграла (9) по участку экстремали
заключенному между двумя трансверсалями:
*1
ч.
® (*> ; в (х, у) =
Эта величина будет функцией от а, причем от а будут зависеть?
как подъинтегральная функция, так и пределы интегрирования, т.-е.
Xi (а)
*о (»)
Мы должны показать, что I (а) есть величина постоянная, т.-е.
d-^ = 0.
а а
Для доказательства этого воспользуемся общим выражением
101
для вариации основного интеграла, выведенным в главе III [см.
стр* 64, формула (10)]
8/=[(77_yF>) 5x + F> 5^о +
+ J (F'y-—ddx......................(13)
Из этого выражения ясно, что в рассматриваемом нами случае
6/=0, ибо внеинтегральный член обращается в нуль, так как
концы кривой интегрирования лежат на трансверсалях, так что
удовлетворено условие (8); подинтегральная же функция также
равна нулю, потому что кривая интегрирования есть экстремаль
и удовлетворяет уравнению Эйлера.
Итак, тождественно *1 — 0, откуда ясно, что / (а) есть вели-
чина постоянная, т.-е. одна и та же для всех рассматриваемых
экстремалей.
Еще проще это можно установить пользуясь интегралом (13).
Пусть 6 (х, у) = С\ и 0 (х, у) — С2 уравнения двух трансверсалей,
о которых идет речь, /Uj Af2 некоторая экстремаль поля, начало
которой точка ЛЛ (xi, у^} лежит на первой трансверсали, а конец
Л12 (х2, у2) на второй. По сказанному выше, величина основного
интеграла (9) по этой экстремали будет равна величине инте-
грала (13) по той же кривой, т.-е. равна:
(*> у, и) — и F'y (х, у, u)] dx + F'y' (х, у, и) dy =
(*1> Ут)
(х2, (X;, У,)
(х0, у0) (Хо, у0)
Н (*2 , У2) — в (*1 , У1) = С2 — С1 ,
и, как видим, есть величина постоянная для всех экстремалей, со-
единяющих две данные трансверсали.
§ 23. Уравнение ГамильтонаЯкобн.
Мы показали выше, что по любому семейству экстремалей мо-
жет быть найдено соответствующее ему семейство трансверсалей.
Обратная задача не всегда имеет решение, т.-е. не всякое семей-
ство кривых, зависящих от одного параметра, является семейством
трансверсалей для некоторого поля данной вариационной задачи,
ибо задание одной только кривой этого семейства определит все
семейство трансверсалей. В самом деле, пусть дана какая-либо
кривая (L), не являющаяся экстремалью. Покажем, что семейство
трансверсалей, содержащее данную кривую, строится единственным
образом. Для этого построим прежде всего поле экстремалей.
Возьмем любую точку (xi, yi) на кривой (Л), угловой коэффициент
касательной в этой'точке имеет вполне определенную величину
по нему на основании условия трансверсальности (8) найдется угло-
102
вой коэффициент у* касательной к экстремали, проходящей через
точку (xi, ух)* Зная точку (xi, ух) и направление экстремали в ней,
мы можем определить и самую экстремаль, как решение уравнения
Эйлера, удовлетворяющее при x='xi начальным условиям у — ух\
у,=ух- Проведя только что указанное построение для всех точек
кривой (Z), мы найдем все семейство экстремалей. После того, как
семейство экстремалей найдено, все семейство трансверсалей может
быть получено в форме (II), как было указано в прошлом параграфе,
после нахождения функции 0 (х, у) по формуле (13). Но кривые
этого семейства можем построить и иначе: именно, возьмем любое
постоянное число С и найдем на каждой экстремали такую точку,
чтобы величина основного интеграла (9), взятого по этой экстремали
от точки ее пересечения с кривой (Л) до данной точки, равня-
лась С. Покажем, что геометрическое место полученных точек есть
трансверсаль. В самом деле, величина интеграла /, взятого по
экстремали от кривой L до полученной, постоянно равна С, а по-
тому 8 / = 0, но полная вариация [см. (10)] слагается из вариации
на обоих концах и интегрального члена. Последний член равен
нулю, так как кривая интегрирования экстремаль, вариация на
конце, лежащем на кривой (Л), также равна нулю, так как по по-
строению экстремали здесь соблюдено условие трансверсальности;
далее, левая часть равенства есть нуль, из этого следует, что и ва-
риация на другом конце нуль, и следовательно построенная кривая
есть трансверсаль. Давая постоянной С различные действительные
значения, мы получим все семейство трансверсалей. Итак, задание
одной только кривой семейства трансверсалей определяет все се-
мейство, а потому не для всякой функции 0 (х, у) семейство кривых
0 (х, у) = С.......................(11)
представляет семейство трансверсалей.
Найдем, какому условию должна удовлетворять функция 0 (х, у),
чтобы это имело место.
Уравнения (15) дают величины
в случае, когда
дан уклон поля и* Поэтому для того чтобы найти общее условие,
которому удовлетворяет функция 6 (х, у), для любого поля, мы
должны из уравнений (12) исключить и. Провести зто исключение
мы можем, хотя бы решив каждое из уравнений (12) относительно
и и приравняв полученные выражения. Тогда мы получим некото-
рое уравнение вида
• .(14)
Это уравнение, которое представляет результат исключения ве-
личины и из уравнений (12), носит название уравнения Гамильтона-
Якоби.
Мы показали только что, что если уравнение 0 (х, у) = const дает
семейство трансверсалей нашей вариационной задачи, то функция 0
удовлетворяет уравнению Гамильтона-Якоби. Покажем и обратное,
что каково бы ни было решение уравнения (14)—функция 0 (х, у),
103
уравнение 0 (х, у) = const представляет семейство трансверсалей
для некоторого поля. Итак, пусть 0 решение уравнения (14). Из
каждого из 'уравнений системы (12) мы можем найти функцию
и (х, ?/); при этом оба значения и будут одинаковы в силу того, что
0 удовлетворяет уравнению (14), полученному исключением и из
уравнений системы (12). Для того, чтобы мы могли построить
поле с уклоном и (х, у), мы должны показать еще, что она удовле-
творяет уравнению (7), но в последнем мы убеждаемся непосред-
ственно, ибо дифференцируя первое из уравнений (12) по у, а
второе по х и приравнивая получившиеся выражения, мы прихо-
дим как раз к уравнению (7).
Итак, функция и (х, у) представляет уклон некоторого поля
экстремалей, семейство же трансверсалей для этого поля очевидно,
будет семейство
0 (х, и) = const
ч. т. д.
Чтобы написать уравнение (14) в более удобном виде, приме-
ним к системе (12) преобразование Гамильтона, которое уже встре-
чалось выше (см. гл. II, доб. 1, стр. 57).
Это преобразование заключается в том, что вместо функции и
мы вводим новую функцию v, полагая
v = Ffу: (х, у, и)..................(15)
и вводим вспомогательную функцию Гамильтона Н (х,у, <г>), обозна-
чая, таким образом, результат замены функции и на v в выражении
и F'y< (х, у, и) — F (х, у, и) — Н (х, ^).........(16)
При таком преобразовании, как мы видели выше, уравнение
Эйлера заменяется эквивалентной ему канонической системой
dy___дН (х, у, v) e dv __ дН (х, yt v)
dx dv ’ dx ду ................J
теперь это же преобразование и к системе уравне-
примет тогда [см. (15) и (16)] вид:
Применим
ний (12); она
. (18)
Для того, чтобы получить уравнение, которому удовлетворяет
функция 0 (х, у), мы должны исключить v из системы уравне-
ний (18), но теперь это исключение производится без труда, и по-
лучаем окончательно уравнение Гамильтона-Якоби в виде:
Мы покажем, что задача интегрирования уравнения (19) экви-
валентна задаче интегрирования уравнения Эйлера или равносиль-
ной ей задаче интегрирования системы уравнений (17). Это пред-
ложение является частным случаем общей теоремы Якоби, которая
104
будет доказана ниже в § 28, но мы дадим здесь доказательство этой
теоремы, основанное не на формальных преобразованиях, а на
развитой выше теории поля.
Прежде, чем перейти к этому доказательству, мы в следующем
параграфе напомним читателю основные понятия из теории инте-
грирования уравнений в частных производных первого порядка*
§ 24. Общий и полный интеграл уравнения в частных
производных.
Для простоты мы ограничимся здесь случаем, когда в уравне-
ние входят только две независимых переменных, ибо случай, когда
число независимых переменных больше двух, не отличается от него
существенно. Такое уравнение имеет вид:
Ф (х, у, = 0 . ...........(20)
Для того, чтобы выяснить постановку задачи об интегрирова-
нии уравнения (20), рассмотрим сначала простейший случай, когда
уравнение (20) есть линейное и однородное, т.-е. имеет вид
X У-^ = 0, 1).................................(21)
Ох 1 0у 1 7 4 7
где X и Y суть функции независимых переменных хну.
Интегрирование такого уравнения, т.-е. задача нахождения
общего его решения, приводится к интегрированию обыкновенного
дифференциального уравнения
dx
. .(22)
Действительно, если нам известен интеграл уравнения (22), т.-е.
такая функция двух переменных, которая при подстановке вместо у
решения уравнения (22) обращается в постоянную
9 О, «/) ~ с->.....................(23)
то эта функция ? представляет решение уравнения (21).
В самом деле, по (23)
Эф , дф J . л
-dt dx + =
откуда, заменяя dx и dy на пропорциональные им величины X и У,
найдем
d ср
d ср
0,
т.-е. что функция удовлетворяет уравнению (21). Легко видеть,
что не только функция <э, но для любой F и функция
(24)
J) Подробнее об этом см. Смирнов, т. II, стр. 127 иГурса, т. II. ч. 2,
гл. XXII
4
105
удовлетворяет уравнению (21), ибо
В случае, когда число переменных больше двух, уравнение (22)
заменяется соответствующей системой дифференциальных урав-
нений.
Нетрудно показать также, что всякое решение уравнения (21)
может быть получено в форме (24) при некотором выборе функ-
ции F, но мы иа этом не останавливаемся.
Отметим только то важное обстоятельство, что в решение
уравнения (21), как произвольный элемент, входит функция, в то
время, как в случае обыкновенного дифференциального уравнения
таким элементом была постоянная. Это же обстоятельство имеет
место не только в случае линейного однородного уравнения, которое
мы только что рассмотрели, но и для любого уравнения вида (20).
Дадим поэтому следующее определение: решение уравнения
(20), в состав которого входит произвольная функция, будем назы-
вать общим его решением или общим интегралом.
Как указал впервые Лагранж, для полного разрешения .урав-
нения (20) нет необходимости знать его общий интеграл, а до-
статочно найти его решение, зависящее от двух произвольных
постоянных
z — V (х, У) а, Ь).................(25)
и притом такое, что эти постоянные входят независимо, т.-е. так,
что их можно исключить из системы уравнений
z “ V (х, у, а, 6)
dz _____д V (х, у, а, Ь)
дх dx
dz дУ (х, у, а, 6)
ду ду
. . .(26)
и это исключение приводит к уравнению (20).
Решение (25), зависящее от двух постоянных, называют полным
интегралом уравнения (20).
Для того, чтобы доказать утверждение Лагранжа, мы покажем,
что, зная полный интеграл (25) уравнения (20), мы можем найти
и его общий интеграл.
Мы проведем здесь этот вывод, основываясь на геометрических
соображениях, именно, На следующем простом замечании.
Если
z — <l>(x,y,c)........................................(27)
есть семейство решений уравнения (20), зависящее от одного пара-
метра, то огибающая семейства поверхностей (27), т.-е. поверх-
ность
z z = X (х, у), .........................(28)
106
имеющая с каждой из поверхностей семейства (27) общую линию
и вдоль нее одинаковую касательную плоскость, также есть реше-
ние уравнения (20). Но последнее утверждение совершенно оче-
видно, ибо каждая точка поверхности (28), есть точка соприкосно-
вения ее с некоторой поверхностью семейства (27), а потому вели-
dz dz м
чины х, у, г, , в этой точке те же, что и для соприка-
сающейся поверхности семейства (27), и по условию удовлетворяют
уравнению (20).
Напомним х), что огибающая семейства поверхностей (28) может
быть получена исключением постоянной с из системы уравнений
• (29)
Воспользуемся теперь последним замечанием для получения
общего интеграла уравнения (20). Вернемся к полному интегралу
(25); мы можем получить из него бесчисленное множество различ-
ных семейств решений, зависящих от одного параметра, подставляя
вместо b любую функцию X (а). Каждое такое семейство:
Z = и (х, у, а, х (а))
порождает, согласно сделанному выше замечанию, решение уравне-
ния (20), которое по (29) получается посредством исключения по-
стоянной а из уравнений:
z— v (х,у, а, X (а)) —0; + (а) — 0........(30)
Найденное решение (30) зависит от произвольной функции X (а),
а потому представляет общий интеграл уравнения (20) 2).
Мы видим, таким образом, что задачу решения уравнения в част-
ных производных можно считать законченной, если найден его пол-
ный интеграл.
Заметим, наконец, что не все решения уравнения (20) могут
быть получены из полного интеграла указанным выше процессом;
такие исключительные решения, которые, таким образом не могут
быть получены, называются особыми. Таким особым решением
будет, если она существует—огибающая всего семейства (25), зави-
сящего от двух параметров, т.-е. поверхность, имеющая с каждой
из поверхностей семейства общую точку соприкосновения.
Исследование особых решений представляет вообще большие
трудности; мы не останавливаемся здесь подробнее на этом во-
просе и в дальнейшем не будем принимать их во внимание.
J) Смирнов, В. т. II, стр. 371.
3) Аналитический вывод этого предложения имеется у Г у р с а, т. II, ч. 2,
§ <44.
107
§ 25. Эквивалентность задачи интегрирования уравнения
Эйлера и уравнения Гамильтона-Якоби.
Мы покажем здесь, что задачи нахождения общего интеграла
уравнения Эйлера и полного интеграла уравнения Якоби-Гамиль-
тона равносильны.
а) Получение полного интеграла уравнения Гамильтона из
общего интеграла уравнения Эйлера.
Пусть дан общий интеграл уравнения Эйлера
У = ® (х, а, Р)
• .(31)
Фиксируя параметр мы получаем семейство экстремалей»
зависящее от одного параметра а, которое, при известных ограни"
чениях, можем считать образующим поле. Обозначим через и (х, у, р)
уклон этого поля — функцию, получающуюся в результате исклю-
чения а из уравнений
У — ^ (х»
и — (х.
• х \ >
. .(32)
Обозначим через в (х, у, Р) функцию, определяющую поле
трансверсалей, соответствующее данному полю экстремалей (31).
Эта функция в (х, у, Р) [см. (13)] может быть найдена с помощью
квадратур и удовлетворяет, как было показано выше, уравнению
Гамильтона-Якоби. В таком случае, прибавив к этому решению
аддитивную постоянную у, мы получим решение уравнения (19)
е = е (*, у, ₽)+т,
. .(33)
зависящее от двух параметров, которое представляет поэтому
полный интеграл уравнения Гамильтона-Якоби х).
6) Получение общего интеграла уравнения Эйлера из полного
интеграла уравнения Гамилътона-Якоби.
Пусть дан некоторый интеграл уравнения Гамильтона-Якоби
О (х> У> Р)> зависящий от постоянной р так, что
у Ь Ф (V)............................<34>
Заметим, что для того, чтобы доказать вполне строго, что (33) есть полный
интеграл уравнения (19), мы должны показать (см. предыдущий параграф), воз-
можность исключения постоянной 3 из системы уравнений
дв = де (х,у,3). (лг,у,Р)
д х д х ’ д у д у
для чего нужно показать, что -— не равно нулю тождественно, rle-
д У д 3
трудно показать, что в данном случае это условие выполнено, ио мы иа этом не
останавливаемся.
2) Заметим, что это условие нужно для того, чтобы в~в (х, у, 3) —|— -у было
полным интегралом уравнения Гамильтона-Якоби (см. примечание 1).
108
тогда общий интеграл уравнения Эйлера может быть получен ре-
шением относительно у уравнения
. .(35)
Действительно, при каждом р функция 0 (х, у, р), удовлетворяя
уравнению Гамильтона-Якоби, определяет некоторое семейство
трансверсалей, а вместе с тем и поле экстремалей данной вариа-
ционной задачи.
Уклон этого поля и будет зависеть не только от переменных
х и у, но и от параметра £:
и = и (х, у, 13).
Функции и
ряют системе
посредством дифференцирования по (3 системе уравнений.
д2 1?'г / \ cP 0 __ tv/ / \ д
yfyt (х, у. у—— л yfy, (х, у, и)~д
и 0 при
уравнений
всех значениях параметра р удовлетво-
(12), а потому и получающейся из нее
и . (36)
Пользуясь этим, найдем, что
Пусть теперь у есть функция от х, заданная уравнением (35),
покажем, что она удовлетворяет уравнению Эйлера; в таком случае,
так как она зависит от двух независимых параметров аир, она и
есть его общий интеграл. В том же, что она удовлетворяет уравне-
нию Эйлера, убеждаемся без труда. Эта функция обращает в нуль,
в силу уравнения (35), левую часть уравнения (37); в таком случае
уравнения (35), левую часть уравнения (37); в таком случае
Й = и (х, у, ₽),....................(38)
ибо, в
У
силу условия (34) и первого из уравнений (36), величина
(х, уу и) не нуль. Но последнее уравнение (38) есть диф-
ференциальное уравнение экстремалей данного поля (ср. 4) и раз
функция у ему удовлетворяет, она есть экстремаль и удовлетво-
ряет уравнению Эйлера, что и требовалось доказать.
§ 26. Примеры.
1. Рассмотрим прежде всего задачу о минимуме интеграла (см.
Уравнение Эйлера для данной задачи у" = $> и семейство экстре-
малей есть семейство прямых линий на плоскости. Условие транс-
версальности (8) в данном случае
/ ---77. У/2 \ , V л f * У
109
к
т.-е. представляет условие ортогональности. Система (12), связы-
вающая функции и и в, принимает в данном случае вид
откуда исключая и,
задачи:
найдем уравнение Гамильтона-Якоби данной
Поле экстремалей представляет здесь любое семейство прямых,
зависящее от одного параметра, покрывающее просто плоскость
или какую-либо часть ее; семейством трансверсалей этого поля
будет семейство ортогональных к ним кривых.
При построении поля трансверсалей мы можем одну кривую
этого семейства задать совершенно произвольно; в таком случае
все семейство трансверсалей можем построить, следуя методу, ука-
занному в § 23 (стр. 103). Именно, построив семейство нормалей
к данной кривой, мы получим поле экстремалей, а откладывая по
всем прямым равные отрезки, ибо в данном случае величина ин-
теграла / есть просто длина кривой, мы получим все кривые се-
мейства трансверсалей (рис. 8). Полученные кривые обладают тем
свойством, что расстояние между ними (отрезок нормали) со-
храняет постоянную величину.
Такое семейство кривых называют семейством параллельных
кривых. Простейший пример подобного семейства есть концентри-
ческие окружности, проведенные из некоторого центра.
Заметим, наконец, что на рассматриваемую задачу можно
смотреть как на задачу геометрической оптики, о распространении
света в однородной среде. В таком случае экстремали поля физи-
чески представляют световые лучи, а трансверсали волновые по-
110
верхности (точнее говоря, сечение их с плоскостью ХО К, поскольку
мы рассматриваем сейчас плоскую задачу), т.-е* геометрическое
место точек, до которых, идя от данной кривой свет дойдет в оди-
наковое время.
В частности, если источник света точка, то волновые поверхности
суть концентрические круги с центром в этой точке.
2. Рассмотрим поле для задачи о минимуме интеграла (гл. I
стр. 18)
У
Семейство экстремалей этой задачи есть семейство окружностей
с центром на оси абсцисс.’
(х--С1)2 -\-у2= С22
и прямых параллельных оси ординат.
Выделим из этого семейства экстремали, проходящие че>рез дан-
ную точку Л10 (х0, уо), тогда получим центральное поле, уравнения
экстремалей которого
(х — с)2 + у2 = Уо2 + (х0 — с)2.
Найдем семейство трансверсалей для этого поля. Для нахожде-
ния его найдем функцию 0 (х, у), исходя из формулы (13), при-
чем криволинейный интеграл (13), так как он не зависит от пути
интегрирования, возьмем по экстремали, соединяющей точки
Жо (хо, *7о) и М (х, у). В таком случае, как мы видели, он обра-
щается в основной интеграл, т.-е.
(*, у)
У<>)
Для вычисления последнего интеграла, примем за переменную
интегрирования угол ?, образованный радиусом, проведенным из
центра экстремали в точку на экстремали, тогда формулы пере-
хода, если R обозначает радиус, а с—абсциссу центра экстремали,
будут:
х = с R cos ©, y — R sin
ds — j/rfx2 -f- dy2 = Rd7
Отсюда
Теперь мы можем написать уравнение самых трансверсалей,
выраженное через параметр ъ и
111
Заметим, что приведенная форма уравнений трансверсалей
является наиболее удобной, так как дает удобный геометрический
прием построения кривых этого семейства. Самое поле дано на
рис. 9.
Рис. 9
3. В обоих последних примерах условие трансверсальности
производилось к условию ортогональности; рассмотрим теперь
пример, в котором это будет не так. Для задачи о минимуме
Хо
экстремалями являются прямые линии, а условие трансверсальности
[см. (8)] принимает вид:
т.-е. в каждой точке поля угловой коэффициент касательной
к трансверсали должен быть вдвое меньше углового коэффициента
экстремали.
Рассмотрим семейство прямых, проходящих через начало
Они образуют поле экстремалей для нашей вариационной задачи;
найдем семейство трансверсалей этого поля. Пользуясь последо-
вательно (1), (3), (12), получим:
у
ц~ тх\ и = т — — ;
' ду
112
Отсюда
(0,0)
Беря за кривую интегрирования экстремаль г/ = — х, получим
8 (хь dx + 2(-ff dx=^~
(0,0)
о
Итак, 0 (х, у)=^>
откуда видно, что семейство трансверсалей
у2 — сх
т. е. представляет семейство парабол, имеющих осью симметрии
ось абсцисс и вершину в начале.
Тот факт, что в полученном поле соблюдено условие трансвер-
сальности, очевиден и геометрически, ибо известно, что касатель-
ная к параболе имеет вдвое меньший угловой коэффициент, чем
прямая, соединяющая точку касания с вершиной.
§ 27. Теория поля для трех переменных.
Рассмотрим теперь задачу о минимуме интеграла:
7 —J F (х, г/, zy у, z ) dx
. .(1)
Экстремалями для этой задачи будут пространственные кривые
г/=г/(х); Z=Z (х),
где функции у (х) и Z (х) суть решения системы уравнений
Эйлера:
Для того, чтобы распространить понятие поля на рассматри-
ваемый случай, мы должны дать себе отчет в том, какое основ-
ное свойство поля мы желаем сохранить, проводя обобщение.
Таким свойством естественно считать то, чтобы для каждого поля
экстремалей существовало соответствующее ему поле трансверса-
лей, т.-е. семейство кривых, пересекающихся трансверсально со
всеми экстремалями поля. Дадим, исходя из этого, следующее
определение поля:
Будем называть полем экстремалей в пространстве семей-
ство экстремальных кривых, зависящее от двух параметров
У — У (х> Р) > % — % (х> Р).................................(3)
Вариациовное исчисление. — 8
ш
покрывающее просто некоторую область R пространства, и та-
кое, что существует семейство поверхностей:
Ф (х, у, z) = С . .
• -(4)
пересекающихся со всеми экстремалями поля (3) трансверсально.
Напомним, что условие трансверсальности [гл, III, (33) стр. 70]
для случая трех переменных заключается в соблюдении равенства
(F— y'F’y> — z' F’z>) 3x + Fz ^y + F'Z' 8z = 0 . . .(5)
где йх, 8 у и 8 z обозначают дифференциалы координат х, у и Z
точки на поверхности. Это условие устанавливает связь между
направлением касательной к кривой н нормалью к поверхности,
так что если известно одно из этих направлений, другое опреде-
ляется единственным образом на основании условия (5).
В случае двух переменных любое семейство экстремалей, зави-
сящее от одного параметра, могло быть принято, вообще говоря
(если только оно покрывало просто некоторую область), за поле
экстремалей.
Как мы увидим дальше, в случае трех переменных, это будет
ие так—за поле может быть принято не всякое семейство экстре-
малей, зависящее от двух параметров. Для того, чтобы найти, ка-
ким, именно, условиям должно удовлетворять это семейство, произ-
ведем преобразование переменных Якоби в системе уравнений
Эйлера (2) и в условии трансверсальности.
Введем вместо у' и Z' новые переменные v и w, полагая
V=F'y' (х, у, Z, у', z')
W = F'z' (х, у, Z, у', z}
и введем вспомогательную функцию
Н (х, у, Z, 'У, w)=y w—F,
(6)
• (7)
где y! и z должны быть заменены на v и w с помощью уравне-
ний (6). При этой замене система уравнений Эйлера (2) заменится
на канонического вида систему
dy __ дН. \
dx dv ’ dx dw
d<v dH w dw dH
dx dy ’ dx dz
• -(8)
Условие трансверсальности (5) на основании формул (6) и (7) при-
мет вид
! — /7(х, у, z, v, w) ox + v$y 4- w$z — 0..........(9)
Рассмотрим теперь семейство экстремалей, зависящее от двух
параметров (3)—такое, что через каждую точку некоторой области R
пространства проходит одна—и только одна—кривая семейства. В та-
ком случае в каждой точке этой области величины у' и Zf, а по-
тому на основании формул (6) и величины v и w, имеют опреде-
114
ленное значение. Итак, каждому семейству экстремалей (3) соот-
ветствуют две функции трех переменных
v(x, У> г) и ™(х> У, z)>
которые определяют уклон поля в каждой его точке. В свою оче-
редь задание этих функций вполне определяет семейство экстре-
малей (3), которое может быть найдено посредством интегрирова-
ния системы, составленной из двух верхних уравнений системы (8).
Но при этом функции v и w не могут быть взяты произвольно,
а должны удовлетворять некоторым условиям, подобно тому, как
для случая двух переменных уклон поля и должен был удовле-
творять уравнению (7) (§ 21).
Именно, функции
и (х> У> z) и w У, z)
должны быть таковы, чтобы четыре функции
переменной х:
у(х), z(x),
v [*> У (*)> z (*)] и w [*> У (х), z (х)]
удовлетворяли системе дифференциальных уравнений
в последних двух уравнениях этой системы полные
(8). Заменяя
производные
civ dw
dx И dx
их выражениями найдем:
dv ( dv dy . dv dz __ dH
dx dy dx dz dx dy ’
dw । dw dy , dw dz _ dH
dx 1 dy dx ‘ dz dx dz
Воспользовавшись теперь первыми уравнениями системы (8),
получим систему дифференциальных уравнений в частных произ-
водных, которым должны удовлетворять функции v (х, у, Z) и
w (*> У> z)>
dv I dv dH t dv dH_ dH
dx dy dv dz dw ду
, dw dw dH x^dw dH_ dH
dx dy dw dz dw dz -
Возьмем какую-либо пару функций v и w, удовлетворяющих
системе (10); эта пара функций определяет некоторое семейство
экстремалей (3), для нахождения семейства трансверсалей, соот-
ветствующего этому семейству экстремалей, мы получим из (9)
уравнение вида
М dx-4-N dy Л-Р dz ~0 ,............(11)
где М, N и Р будут некоторыми функциями переменных х, у и г.
Для того, чтобы уравнение такого вида имело решением неко-
торое семейство поверхностей
Ф(х, yt z)^C....................(12)
8*
115
необходимо, чтобы выполнялось условие
\ду dz ) \dz dz /
• (13)
В самом деле1), в таком случае правая часть уравнения (11) по
умножении на некоторый множитель
(•*> У у %) >
должна обратиться в полный дифференциал, ибо, именно, такого
вида уравнение мы получили бы, исключив постоянную С диффе-
ренцированием из (12).
Итак, должно найтись такое А, чтобы
дМ\ dNl. дМк дР I # _ дРУ
ду дх 1 dz дх * dz ду
Откуда
Умножая последние полученные равенства соответственно на
N и Р и складывая их, получим (13).
Применив полученное условие (13) к уравнению (9), придем
к следующему условию для функций v и w
Два последние слагаемые левой части равны нулю сами собой
в силу того, что функции уу с, v и w удовлетворяют системе
уравнений (8), а потому искомое условие, которому должны удо-
влетворять функции v и w, принимает вид
• • (15)
Полученное условие (15) является необходимым для того, чтобы
для семейства экстремалей (3) существовало соответствующее ему
семейство трансверсальных поверхностей, т.-е., чтобы по данному
определению это семейство давало поле.
Это условие (15), вместе с условиями (10), является в свою
очередь и достаточным. В самом деле, если эти условия выполня-
Смирнов, т. II, стр. 292.
116
ются, то левая часть уравнения (9) представляет полный диффе-
ренциал, а потому, интегрируя, найдем, что решение его может
быть записано в виде:
0 (х, у, z)~C .
(16)
Последнее уравнение и дает семейство
причем функция 0 найдена здесь из условий
трансверсалей
поля,
Исключая из уравнений (17) v и ы, мы найдем уравнение Га-
мильтона-Якоби, которому должна удовлетворять функция Н (х, г/, z):
дВ ( rjy дВ дВ
дх “Г п Iх, У, z>
• • (18)
Решения этого уравнения дают все семейства трансверсальных
поверхностей вида (16), отвечающие данной вариационной задаче.
Задача решения этого уравнения равносильна задаче решения
системы уравнений Эйлера или эквивалентной ей системы уравне-
ний (8). Доказательство этого утверждения составляет содержание
теоремы Якоби, которой посвящен следующий параграф.
Заметим, наконец, что основная теорема теории поля о том,
что величина основного интеграла, взятого по экстремали поля
между двумя данными трансверсалями, не зависит от выбора
экстремали, переносится без изменений на случай трех перемен-
ных. Эта теорема, как и в случае двух переменных, дает возмож-
ность полного восстановления поля, если дана одна его трансверсаль.
Действительно, пусть дана какая-либо поверхность (не составлен-
ная из экстремалей), тогда направление нормали к этой поверхно-
сти, на основании условия трансверсальности (5), определит вполне
направление касательной к экстремали, проходящей через эту
точку, т.-е. величины у и zf для нее. Взяв далее решение системы
уравнений Эйлера (2), удовлетворяющее полученным только что
условиям, мы получим самую экстремаль, а проделав такое же
построение для всех точек данной поверхности, мы построим
все поле экстремалей. После того, как поле экстремалей найдено,
мы можем получить трансверсальные поверхности этого поля, от-
кладывая на экстремалях от данной поверхности такие отрезки,
чтобы величина основного интеграла, взятого по ним, была одина-
ковой, и беря затем геометрическое место концов этих отрезков.
Задача геометрической оптики в трехмерной
с р е де. В качестве примера приложения результатов этого пара-
графа рассмотрим вопрос о распространении света в изотропной
неоднородной среде.
117
Если С(х, уу z) скорость света в данном месте
п (х, у, z) = е (Xj 2)
величина обратная ей, то указанный вопрос можно трактовать как
вариационную задачу и минимуме интеграла:
z'2 dxt
ибо, именно, этим интегралом (ср. гл. I, стр. 17) выражается время, нужное
для прохождения света между двумя точками вдоль по данной кривой.
Экстремалями для этой задачи будут решения системы уравне-
ний Эйлера, которая имеет вид:
Условие трансверсальности (5), в данном случае:
или после упрощений:
Отсюда ясно, что условие трансверсальности есть условие нор-
мальности экстремали к трансверсальной поверхности, так как,
заменяя ox, ьу и ftz на X—х, Y—уу Z—z, видим, что коэффициенты
уравнения касательной плоскости к трансверсальной поверхности
равны направляющим косинусам касательной к экстремали. Найдем
теперь уравнение Г амильтона-Якоби, которому удовлетворяет
функция © (л, г/, z)} определяющая семейство трансверсалей.
По (6) и (7)
или после упрощений:
Н (х, у, г, v,
w2.
118
Отсюда уравнение Гамильтона-Якоби (см. 18):
или
Рис. 10
Построение семейств трансверсалей может быть на основании
сделанных выше замечаний проведено и геометрически, именно,
двумя следующими способами. Если мы исходим от точки, то
нужно взять пучек экстремалей, проходящих через данную точку,
и на каждой отложить такой отрезок, чтобы величина основного
интеграла имела постоянную величину, и взять геометрическое
место концов полученных отрезков; найденные поверхности и
119
есть трансверсали — квазисферы данной среды, искривленные бла-
годаря ее неоднородности. Если исходной является поверхность,
то нужно построить семейство экстремалей, нормальных к этой
поверхности, и отложить на них отрезки, отвечающие равным зна-
чениям величины основного интеграла- Полученные поверхности и
представляют семейство трансверсальных поверхностей, ортого-
нальных к семейству экстремалей. При построении в обоих слу-
чаях роль функции @ играла величина основного интеграла, взя-
того по экстремали, т.-е. кратчайшее время, нужное для прохожде-
ния света от начальной точки (во втором случае от поверхностн)
до данной точки *).
Пример построения трансверсалей в случае преломления света
при переходе из одной среды в другую приведен на рис. 10.
§ 28. Теорема Якоби.
Теорема Якоби устанавливает связь между задачей интегриро-
вания системы обыкновенных дифференциальных уравнений и инте-
грирования одного уравнения в частных производных со многими
независимыми переменными. Теорема предполагает при этом си-
стему обыкновенных уравнений, написанную в каноническом виде,
и показывает, что задача нахождения всех общих интегралов этой
системы 2 п уравнений равносильна задаче интегрирования, т.-е.
задаче отыскания полного интеграла одного уравнения в частных
производных с (и + 1) независимыми переменными, которыми слу-
жат независимое переменное и первые п неизвестных функций си-
стемы.
Такая постановка вопроса историческн была вызвана задачами
динамики, о чем подробнее мы скажем ниже. Эта теорема была
установлена нами для простейшего случая п — 1 на основании
теории поля; сейчас мы изложим вкратце прямое формальное ее
доказательство для случая любого п. Более подробное ее изложе-
ние можно найти во многих курсах теории уравнений в частных
производных и динамики.
Теорема. Задача интегрирования канонической системы диф-
ференциальных уравнений:
dt ~~ dq > dt ~ dXi’ l~L'z...............
где H функция переменных xi, t и qr.
H---H (л*] , Xo , • • • , X„ , tf Cp , ^2 f • • • • (2)
Более глубокое и полное исследование вариационного поля этой задачи
было проведено С. Л. Соболевым в его работе*. „Волновое уравнение для
неоднородной среды" (Труды Сейсмологического Института, № 6, 1930) и было
применено нм для интегрирования волнового уравнения
Д2 и =
1
С3
dt
d и
в случае неоднородной среды, т.-е. для переменного С.
120
эквивалентна задаче интегрирования одного уравнения в част-
ных производных:
т,-е, задаче нахождения его полного интеграла,
Доказательство I, Покажем сначала, что имея полный инте-
грал уравнения (3), мы можем найти все интегралы системы (1).
Пусть дан полный интеграл (3)‘> так как в уравнение входит (n—|—1)
независимая переменная, то этот полный интеграл должен содер-
жать (п —J—1) независимую постоянную, но за одну из этих посто-
янных можно взять аддитивную, так как в уравнение (2) не входит
сама неизвестная функция.
Итак, этот полный интеграл должен иметь вид:
0 (xi, х2 > . . . , хп, , а2 > • • • аЛ) +const ... (4)
Покажем, что система полных интегралов системы (1) дается
равенствами:
в том смысле, что эта система интегралов получается в результате
решения уравнений (5) и (6) относительно неизвестных функций
^1 > > • • • , • • • Qn*
Для того, чтобы доказать, что последняя система 2п функций
есть система общих интегралов уравнений (1), достаточно прове-
рить, что эти функции удовлетворяют системе (1), ибо они зави-
сят от 2 п независимых параметров
СС\. j а2, • • * , Un , Ь\ , Ь2 f •
• J
Пусть функции
, Хп, Qly • • • f Qti
есть решения уравнений (5) и (6).
Рассматривая
ХЛ,
как неявные функции t заданные уравнениями (5), и дифференцируя
эти равенства по t, найдем:
020 020
da^t ' dajdxt tff
02e
^ = 0. z = l. 2, ...,n (7)
Эти линейные уравнения определяют величины производных
dxx
~dt ’
^xn
~dt
121
и нужно проверить, что
первых уравнений (1)
эти величины удовлетворяют системе и
dxj дН
~di~d^ 1~ 1’2,
Для этого, однако, в виду единственности решения системы (7),
достаточно убедиться в обратном, что правые части последних
равенств удовлетворяют системе (7), т.-е., что
&&
da^dt
{ && дН .
1 Оа^дхг dqx
^9 дН
daidxn dqn
= 0. z = l, 2, . .
n (8>
если в этом равенстве заменить
^1 9 * • • 5 5 Q • • • 9 Qn
на функции, определенные равенствами (5) и (6). Но мы покажем,
что равенства (8) выполняются тождественно для
9 ?2 9
Яп,
не связанных никакими равенствами.
Действительно, подставив полный интеграл (4) в уравнение (3)
и продифференцировав полученное тожество по параметрам
• > J
• » Qn •
= z== 1, 2, . . . , п (9)
да;ох_ 7 v
9 ^2 9 • •
найдем, что для любых
9 Q2 9 • •
д'Щ . дН № । j дН
dafdt ’ Oqx дс^дх^' * 1 dqn
Итак, первые п из уравнений системы (1) удовлетворены; мы
должны теперь показать, что функции
(71? (?2? • • • • ? Qn
удовлетворяют последним п равенствам этой системы:
d4i _ дН
~dt~ дх]: г=1> 2..............п.
Но, действительно, рассматривая как функцию
^1 ) «^*2 > • • • • 9 Xrl
заданную z-ым равенством (6), найдем:
dqt _ ^0 ( dx^ + . ... 4- д2в dxn^
dt Oxfit “Г дх^дх^ dt dxiZn ~dt ’ 1
n
или заменяя по доказанному выше
122
видим, что для доказательства вторых
должны показать, что
п равенств системы (1), мы
dxtdt "г* дх^дхг
. #8
* дх1дхп
п . (10)
Но это тождество мы получаем сразу, продифференцировав по
xi тождество, получаемое в результате подстановки полного инте-
грала (4) в уравнение (3), ибо, производя указанные действия,
находим:
<3^8 . дН . дН <3^8 дН ^8 .
dxjdt ~ дх- * dqx дх^дх^ ~ дц2 дх-дх^ ~
. дН д-Н
..............’ dxndxi~
Итак, тождество (10), а вместе с иим и то, что функции
*1,
заданные системой уравнений (5) и (6), удовлетворяют системе (1),
установлено. Наметим теперь доказательство второй части теоремы
Якоби.
Доказательство II, Если известна полная система интегралов
уравнений (1), то по ним может быть составлен полный интеграл
уравнения (3).
Пусть данные интегралы системы (1), зависящие от 2 п постоян-
ных, будут:
«1, а29
qi — (Л «1, а2,
. .(11)
Тогда полный интеграл уравнения (3) может быть составлен по
следующему правилу:
/
В = 61 + а2 Ъ2 4- . . . . ~гап6л4- J*U dt—С, . . . (12)
где U—обозначает функцию от ?, получающуюся из выражения
i — п
и=^д^-и................(13)
1=1 1
после замены х; и qt по формулам (11) на t, а/ и bi. Далее в вы-
ражении В постоянные 61, . . . . , Ьп предполагаются заменен-
ными иа Xi и а/ с помощью первых п формул (11).
Для доказательства того, что функция В есть полный интеграл урав-
нения (3), достаточно установить, что она удовлетворяет этому урав-
нению, ибо содержа (п 4-1) независимую постоянную аг, а2 , .,., ап;
С она будет тем самым полным интегралом. Последняя проверка,
на которой мы не останавливаемся, проводится без особого труда.
123
Применение к уравнениям динамики. Рассмотрим
движение системы материальных точек, подчиненной некоторым
связям под действием сил, имеющих потенциал.
В таком случае, как мы видели в гл. III, если за неизвестные
функции взяты обобщенные координаты 41 > #2 >••••> Qn, то они
должны быть такими функциями времени t, чтобы интеграл Га-
мильтона
Л
J'(T+lT)dt,.....................(14)
где Т — живая сила системы, a U— потенциал внешних сил, имел
бы наименьшее значение. Отсюда для этих функций
On J
была найдена система уравнений Лагранжа
, п) . . . (15)
Вместо написанной системы п уравнений второго порядка мо-
жем составить систему 2 п уравнений первого порядка, введя но-
вые неизвестные функции
Qi у 0.2 )••••? Qn
и добавив соответственные
уравнения, именно, получим систему
L д(т+^ d(T+U)_Q
& tiqt dqt
= (/=1, 2. . . , n) • • (16)
Чтобы применить к последней системе теорему Якоби, приве-
дем ее к каноническому виду. Следуя общему методу, указанному
в добавлении к главе II, мы должны вместо
J On f
л z ’
Hl 9 42 ? • • •
ввести новые неизвестные функции
Pl j Р2 ?••••> рп ?
по формулам
или, так как U не зависит от #/:
дТ
(17)
Мы должны далее составить функцию Н (см. гл. П, стр. 58),
представляющую результат замены
1 , . « . . , On на р\рп
l
в выражении
0\ Pi + Ог /ъ+ .... -г On рп — (Т+ U) —
Н iSLt j О2 > • * • • > 0п j Р^ * Р2 > • • • s рп) ... (18)
124
При такой замене, как мы видели, система уравнений (16)
должна замениться на каноническую систему:
dPi — дН
dt dPi ’ dt dqi
• (19)
Остановимся на одном важном частном предположении, при ко-
тором функция Н принимает особенно простой вид: именно, когда
в выражении декартовых координат точек системы
Xj> У] >
через обобщенные координаты
ч Qz.............................. Яп
не входит явно время t. Это упрощение основано на том, что
в указанном случае Т есть однородная функция второй степени от
Чтобы проверить последнее, составим
dxi дх^
Xl = • • • • + д^п ’
и аналогичным образом yi и z( и подставим эти величины в вы-
ражениях живой силы
п
1
ясно, что Т обратится в однородную функцию второй
степени от переменных (?/, . . . ♦ , Qn.
Применив к функции Т теорему Эйлера об однородных функ-
циях, найдем, что
или пользуясь (17)
р\ Qi Н“Р2 Яъ 4* .... рпЯп = <^Т...(20)
Откуда по (18), видим, что в данном случае функция Н при-
нимает следующий простой вид:
H=2T—(T^U)=T—U.................(21)
т.-е. представляет разность между живой силой системы, выражен-
ной через обобщенные координаты
Qi > Я2 , • • • > Яп
и новые переменные
Pl ’ Р2 > • • • > Рп >
и потенциалом внешних сил системы.
125
Применим теперь теорему Якоби к системе уравнений (19). Эта
теорема показывает, что для решения системы (19), т.-е. для на-
хождения общих интегралов движения нашей системы материаль-
ных точек, достаточно найти полный интеграл уравнения
77 — H(qt, q2, . . . , qn, t,
• s=0'- <22>
где в выражении (18) функции Н аргументы pi, р2, . . . . рп заме-
нены на частные производные неизвестной функции ©.
Отметим, один важный случай, когда уравнение (22) может быть
заменено более простым. Именно, предположим, что в выражения
декартовых координат через обобщенные, а также в выражение
потенциала внешних сил не входит явно время t. В таком случае
функция Н дается формулой (21) и не зависит от t, и уравнение (22)
принимает вид:
“Wb » • • • , Qн, 1 >
Э=«- • <23>
В таком случае мы можем полный интеграл его искать в виде
® (^ Я1 * Я%) * • • > Qn) — F' (? 1 > 0% 9 * * • > Я* * (2х!)
где h—постоянная, a w—функция только от , (J2, • • • j Яп*
Подставляя выражение (24) вместо в в уравнение (23), найдем
для w уравнение
Я1 >
дш
= О, . . . (25)
дЯп 1
содержащее на одну переменную меньше, чем уравнение (23).
Можно показать, что если в выражении (24) заменить w на
полный интеграл уравнения (25), то мы получим полный интеграл
уравнения (23).
Таким образом, при указанных предположениях окончательное
решение задачи динамики системы приводится к нахождению пол-
ного интеграла уравнения (25).
ГЛАВА V.
Некоторые дополнительные вопросы: достаточные усло-
ення, условие Якоби.
вия, разрывные ре
§ 29. Достаточные условия существования экстремума.
В предыдущих главах при рассмотрении различных вариацион-
ных задач, мы находили дифференциальное уравнение, которому
должна удовлетворять искомая функция, если она дает экстремаль-
ное значение рассматриваемому интегралу. Это уравнение вместе
с начальными условиями (прохождение кривой через данные точки,
условие трансверсальности в случае подвижных концов и т. д.),
определяло, вообще говоря, некоторую кривую. До сих пор мы
ограничивались ее нахождением, но совершенно не ставили вопроса
126
о том, дает ли в действительности полученная кривая экстремальное
значение данному интегралу, и какое, именно: максимум или минимум.
Таким образом, в первых главах мы рассматривали только не-
обходимые условия, которым должна удовлетворять кривая, здесь
мы дадим некоторые достаточные условия для того, чтобы полу-
ченная кривая давала интегралу задачи экстремальное значение
и критерии для суждения о характере полученного extrema.
Эти условия были найдены Вейерштрассом и Гильбертом в конце
прошлого века.
Вопрос о достаточных условиях мы разберем здесь только для
случая простейшей задачи с неподвижными концами.
В дальнейших рассмотрениях будем предполагать, что для зна-
чений х, у, у! соответствующих изучаемой экстремали:
f F [х, f (х) + О) (х), /' (х) + О)' (х)] dx -
F (х, у, у') п
В главе I при подходе к основной задаче о минимуме инте-
трала:
‘ 1 — J F (х, у, д') dx...............(1)
*0
было дано следующее определение: кривая y = f (л) дает минимум
интегралу (1), если величина интеграла, взятого по ней, меньше ве-
личины интеграла, взятого по соседней кривой, т.-е. существует
такое е > 0, что
-/ F [х, f(x), f(x)]dx>0...............(2)
*0
где ® (х) любая функция класса удовлетворяющая условиям
= ш (х0 = 0;
(х)|<е; .................(3)
со (х)^|=0.
Трудность установления того, что данная кривая дает экстре-
мум интегралу (1), при непосредственном пользовании приведен-
ным определением, заключается в необходимости сравнения значе-
ний интеграла (1), взятого по двум различным кривым — данной
и соседней.
Этой трудности можно избежать с помощью рассмотрения поля,
соответствующего данной вариационной задаче.
Мы будем предполагать таким образом, что рассматриваемая
экстремаль y^ffx) может быть окружена полем обыкновенным
или центральным. Будем предполагать, именно, (см. гл. IV, § 21),
что существует семейство экстремалей у~® (х, а), в число кото-
127
рых входит рассматриваемая экстремаль, т.-е. v (х, а$) = f (х),
которое при изменении параметра а в пределах а\ а аъ покры-
вает между прямыми х — xq и х — хг некоторую замкнутую об-
ласть S так, что при этом соблюдены следующие условия.
1) В случае обыкновенного поля :
а) при некотором достаточно малом в > 0 все точки области
Т?£, т.-е. открытой области заключенной между кривыми y — f (х) — е,
Z7— f (х)4"е и прямыми x = xQ и x~xlf будут внутренними точ-
ками области 5;
Ь) через каждую точку области 5 проходит одна и только одна
экстремаль семейства.
2) В случае центрального поля:
а) каждая точка рассматриваемой экстремали у — f (х) за исклю-
чением ее концов А и В есть внутренняя точка области S;
Ь) через каждую точку области 5 за исключением точки А
проходит одна — и только одна—экстремаль семейства. Все экстре-
мали семейства проходят через точку А*
Уклон поля и=и (х, у) представляет функцию определенную
и непрерывную во всей области S в случае обыкновенного поля
и в области 5 за исключением точки А в случае центрального
поля.
В точке А в случае центрального поля функция и не имеет опре-
деленного значения, но существует предел этой функции, если
приближаться к точке А по определенному направлению, и предел
этот равен, именно, угловому коэффициенту данного направления.
Воспользуемся теперь одним интегралом, который был введен
нами в гл. IV. Там было показано именно, что, в случае обыкно-
венного поля, криволинейный интеграл
У.
(х, У, и)-—и F> (х, у,
(*о,Уа)
и)] dx-j-F’y (х, у, и) dy . . (4)
Рис. 11
не зависит от пути интегриро-
вания, и что, если кривая инте-
грирования есть экстремаль по-
ля, то интеграл (4) приводится
к основному интегралу (1). Эти
же свойства интеграла (4) вер-
ны не только в случае обыкно-
венного, но и в случае цен-
трального поля. Мы должны
проверить эти свойства только
для того случая, когда кривая
интегрирования проходит через
точку А, так как если она не
проходит через точку А, ее
можно рассматривать как рас-
положенную в обыкновенном поле. Итак, пусть кривая интегрирова-
ния есть некоторая кривая Ап С*, в таком случае под значением ин-
теграла (4) будем понимать предел величины интеграла (4) по уча-
стку А'С, когда точка А' стремится к А То, что при таком опре-
делении интеграл (4) обладает двумя указанными выше свойствами
сразу следует из этого определения. Например, чтобы проверить
первое свойство, предположим, что есть два пути, соединяющие А
и С; АтпС и АпС (рис. 11); проведем прямую DE не параллель-
ную оси OY, в таком случае интеграл по замкнутому пути CD ЕС,
который лежит внутри поля будет равен нулю. Пусть теперь точки
D и Е стремятся к точке А; тогда этот интеграл будет стремиться
к интегралу по пути АтСпА, который также должен быть равен нулю,
а потому интеграл (4) не должен зависеть от пути. Что касается
второго свойства, то если ДСесть экстремаль, то величины интегра-
лов (1) и (4) по любому участку ее А'С совпадают, а потому при А'
А получим, что интегралы (1) и (4) по самой кривой АС совпадают.
Эти свойства интеграла (4) позволяют заменить в выражении
для A I (2) величину основного интеграла (1), взятого по исследуе-
мой кривой на равную ей величину интеграла (4), который, так как
он не зависит от пути интегрирования, можно считать взятым и по
соседней кривой. В таком случае левая часть неравенства (2) при-
водится, если еще заменить в (4) dy на y’dx к виду:
f [F (х, у, y')—F (х, у, и) —(у’ —и) F’y (х, у, u)] dx, . . (5)
Ус)
причем интеграл (5) взят по соседней кривой, т.-е. по кривой
y—f (*)+ш (А
Подъинтегральную функцию интеграла (5) называют функцией
Вейерштрасса и обозначают:
F (х, у, у', и)—F (х, у, у') — F(x, у, и) — (у’ — и) F'y (х, у, и) . (6)
При таком
шется так:
обозначении правая часть неравенства (2) напи-
• -(7)
Итак, вопрос о том, дает ли исследуемая кривая экстремум, сво-
дится к рассмотрению интеграла (7).
Именно, для того, чтобы интеграл (1) давал минимум, необхо-
димо и достаточно, чтобы интеграл (7) был больше нуля для вся-
кой соседней кривой, не совпадающей с исследуемой. Функция Е,
стоящая под знаком интеграла (7), есть функция величин х, у —
координат точки кривой, у—уклона кривой (углового коэффициента
касательной) и и = и (х, у) — уклона экстремали поля, проходящей
через эту же точку (х, у}*
Заметим еще, что функция Е обращается в нуль на каждой
экстремали поля, как это ясно из формулы (6), ибо в этом случае
у — и (х, у).
Применим прежде всего формулу (7) к выводу необходимого
условия того, чтобы экстремаль давала минимум интегралу (1);
именно, покажем, что:
Вариационное исчисление. — 9
129
Для того, чтобы экстремаль y~f (х), которая может быть
окружена центральным полем, давала минимум интегралу (1), не-
обходимо, чтобы было
Е [х, / (х), у, и (х, f (х))]^0........(8)
для всех значений у' и для всех х в промежутке (х0> х}) а).
Это условие носит название условия Вейерштрасса. Доказатель-
ство его поведем от противного.
Предположим, что в некоторой точке М (х, у) на исследуемой
кривой для некоторого значения переменного функция Л*
отрицательна: _ _ _ _
£ [х, у, у', и (х, y)\<Q • ..........(9)
Проведем через точку М прямую с уклоном уч
У~У=У' (х—х)
и выберем Л настолько малым, чтобы участок этой прямой при х,
изменяющемся в промежутке (х — h, х) лежал в поле, и чтобы не-
равенство Е <0 соблюдалось для точек (х, у), лежащих на этом
участке (последнее возможно в виду непрерывности функции Е),
Обозначим через N конечную
точку этого участка прямой, т.-е.
точку (х — Л, у — h у). Возьмем
теперь за соседнюю кривую, кри-
вую составленную следующим об-
разом : первый ее участок — экс-
тремаль, соединяющая начальную
точку А (х0, i/o) с точкой N (ко-
торая существует, так как точка
N лежит в поле), второй — прямо-
линейный участок NM, третий —
участок исследуемой экстремали
Рис* 12 от точки М (х, у) до конечной
ее точки В (xi, У1) (Рис. 12).
Сравним теперь величину основного интеграла по построенной кри-
вой ANMB с изучаемой, тогда по (7):
J* Е dx
ANMB
MB
NM
ибо первый и третий интегралы, как взятые по участкам экстремалей
поля, по указанному выше, обращаются в нуль, интеграл же по участку
NM меньше 0, так как функция Е на этом участке отрицательна.
Последнее заключение, что А 7< 0 противоречит предположению
о том, что кривая y~f (х) дает минимум интегралу (1); следова-
тельно? (9) невозможно, что и требовалось доказать.
4) Заметны, что приведенное условие Вейерштрасса должно выполняться не
только в случае, когда экстреыаль может быть окружена центральным полем, но
и без этого ограничения, так как в формулировке условия функция и (х,у) по
существу не участвует, а входит только ее значение на данной экстремали yf ~
u (х, / (х) ). Доказательство этого потребовало бы, однако, более сложного вывода.
130
Заметам, что проведенное рассуждение содержит некоторый
дефект: именно, кривая ANMB не могла быть взята за соседнюю
кривую, как ие принадлежащая классу Но от этого недостатка
легко избавиться, заменив кривую ANMB на близкую к ней кри-
вую класса С получающуюся из ANMB закруглением ее у точек
N и М и притом близкую к ней настолько, что и для нее
J* Edx < 0.
Для того, чтобы вывести некоторые следствия из условия Вейер-
штрасса преобразуем несколько функцию Е. Разложив для этой
цели F (х, у, у), как функцию от у!, по формуле Тэйлора около
значения у' = и, найдем
Отсюда, перенося все члены правой части кроме последнего
налево и замечая, что получившиеся слева выражения по (6) есть
ничто иное как функция Е, получим
р"у3 [*> У, и + & (у— и)] • • (10)
Из полученного представления вытекает, что F” у* не может
быть отрицательна вдоль изучаемой кривой, если последняя дает
минимум интегралу (1). Действительно, предположим, что в неко-
торой точке (х, у), уклон в которой у’ = и (х, у), имеем
F"y = (х> у, у') < 0;
в таком случае по непрерывности F"y* это же верно и для зна-
чений у’ близких к у , и применив (10) для и = у’ и у' близ-
кого к у', но не равного у', найдем:
Е (X, у, у', у') = F"y ^ [(х, у, у' -Н (у' - у')] < 0,
что противоречит условию Вейерштрасса (8). Последнее получен-
ное условие, представляющее следствие условия Вейерштрасса,
носит название условия Лежандра и формулируется так:
Для того, чтобы экстремаль y—f (х) давала минимум инте-
гралу (1) необходимо, чтобы F”y> была не отрицательна вдоль
нее, т.-е.
F'y* lx, f(x), /' (х)]^0. .
• (И)
Воспользуемся теперь формулой Вейерштрасса (7) для вывода
достаточных условий.
Из формулы (7) сразу находим, что для того, чтобы экстре-
маль у ~f (х) давала минимум интегралу (1) достаточно, чтобы
существовало собственное поле S, в семейство экстремалей ко-
торого входит изучаемая кривая y~f (х) такое, что во всех
9*
131
его точках (х, у) при всех конечных значениях у и (х. у
выполняется неравенство:
Е [х, у, и (х, у), У] > 0..............(12)
Действительно, если условие (12) соблюдено, то для всякой со-
седней кривой, так как он^Г лежит в области Т?£, лежащей внутри
поля S, применима формула (7), а потому Д I > 0, т.-е. кривая
y—f (х) дает минимум интегралу (1).
Заметим, что вообще этот минимум, есть относительный мини-
мум, но если поле 6* совпадает со всей рассматриваемой областью R
значений (х, у), то минимум, который дает кривая у —f (х), имеет
абсолютный характер.
Из формулы (10) видно, что условие (12) выполняется во всяком
случае, если для точек (х, у), лежащих в поле *$, при всех значе-
ниях у1:
F"y* (х, у, у') > О................(13)
Таким образом, условие (13), как более сильное, является также
достаточным для того, чтобы кривая у—f (х)л давала минимум
интегралу. Отметим также, что, если речь идет не о минимуме,
а о максимуме интеграла, то условия будут теже; нужно только
в неравенствах (12) и (13) знак > заменить на < .
Минимум, который мы только что рассматривали, когда требо-
вание ДI > 0 ставится для всех соседних кривых, т.-е. удовле-
творяющих неравенству | у—f (х) | < е носит название сильного
минимума. Наряду с ним рассматривают также минимум ограни-
ченный, когда допускаются соседние кривые, у которых производ-
ная удовлетворяет некоторым ограничительным условиям, напри-
мер, | у'—/' (х) I < М, и минимум слабый, когда у соседней кри-
вой не только ордината, но и угловой коэффициент мало отли-
чаются от данной, т.-е., когда соблюдаются условия | у — f(x) | < £,
' yf—/' (х) | < ег. В обоих случаях, чтобы был минимум в на-
званном смысле, требуется, чтобы для указанного класса соседних
кривых было Д У > 0. Получение необходимых, а также достаточ-
ных условий для этих видов минимума не представляет никакого
труда: именно, это будут те же условия (8), (12), (13), но они
должны соблюдаться не для всех значений уг, а только для допу-
скаемых данным видом минимума.
Остановимся особо лишь на условии Лежандра (11).
При выводе его мы пользовались соблюдением условия Вейер-
штрасса (8) только для значений у’ весьма близких к и [х, f(x)] =
~ f (х), но по сказанному только что, условие Вейерштрасса при
этих значениях у соблюдено даже в случае слабого минимума.
Таким образом, условие Лежандра является необходимым даже для
слабого минимума, а тем более для ограниченного и сильного.
Цермело дал интересную геометрическую интерпретацию усло-
виям Вейерштрасса. Она основана на следующем.
Рассмотрим кривую Y = F (х, г/, г/7), считая здесь у’ независи-
мым переменным, а х и у параметрами. Эту кривую называют
фигуратриссой (рис. 13). Вспомним [см. (10)], что функция
132
Е V» У> и) и представляет разность между самой функцией
F (х> V» У м) и первыми двумя членами ее разложения в ряд Тэй-
лора.
Если мы возьмем теперь на
построенной кривой точку, соот-
ветствующую значению у* = и
(х, у) и возьмем еще точку с абс-
циссой у', то ясно, что Е пред-
ставляет ничто иное, как разность
между ординатой кривой, соответ-
ствующей этой абсциссе, и орди-
натой касательной, на чертеже —
отрезок NM'. Благодаря этому
геометрическому представлению Е,
Рис. 13
мы можем высказать условие
Вейерштрасса (8) так: для того, чтобы кривая y — f (х) давала
минимум, необходимо, чтобы фигуратрисса не пересекала касатель-
ной проведенной в точке соответствующей абсциссе у’ = и (х, у),
при всех значениях параметров х, у, для которых точка (х, у) ле-
жит на изучаемой кривой.
Достаточное условие (12) заключается в том, чтобы фигура-
трисса лежала под касательной, проведенной в точке с абсциссой
— и (х, у) для всех значений параметров х и уу для которых
точка (х, у) лежит в поле Достаточное условие (13) которое
требует, чтобы фигуратрисса была выпуклой кривой, при тех же
значениях х и у представляет таким образом, более сильное требо-
вание, чем условие (12). Наконец, необходимые, а также достаточ-
ные условия, указанные выше для ограниченного и слабого мини-
мума, могут быть также сформулированы геометрически, только
требование, чтобы кривая лежала под касательной будет теперь
относиться не ко всей фигуратриссе, а только к некоторому ее
участку около точки касания. Рассмотрим теперь несколько при-
меров.
Пример 1. Задача геометрической оптики на плоскости.
Эта задача приводится к нахождению минимума интеграла (см.
причем из физических соображений ясно, что п (х, у) = > 0.
В предположении, что экстремаль может быть окружена полем,
покажем, что она доставляет минимум.
Для проверки воспользуемся условием (13), найдем
при всех значениях х, у и у.
Таким образом, экстремали^задачи, если могут быть окружены
полем, доставляют сильный минимум. В частном случае, когда
133
мы видели (см. гл. IV), что экстремаль может быть
окружена полем, таким образом, в этом случае экстремали — окруж-
ности с центром на оси абсцисс, дают сильный минимум интегралу
/ds
* 4
У
Задачу рассмотренного только что типа представляет и разо-
бранная в главе I задача о брахистохроне, именно, в этом случае речь
f ds 1
идет о минимуме интеграла / /--------, т.-е. п (х, у) — .
о у У V У
Семейство экстремалей — в данном случае семейство циклоид,
имеющих вершины на оси абсцисс.
Пусть начальная точка есть некоторая точка, лежащая на оси
абсцисс (х0,0), и дана некоторая циклоида, соединяющая ее, а по-
тому имеющая начальную точку вершиной, с некоторой другой
точкой плоскости. Покажем, что эта кривая дает рассматриваемому
интегралу сильный минимум. Для этого в данном случае, как для
всех задач, в которых подъинтегральное выражение есть п (х, у)
ds, достаточно проверить, что ее можно окружить полем.
Рассмотрим семейство вкстремалей, проходящих через эту
точку — это будет семейство циклоид, имеющих вершины в началь-
ной точке, общее уравнение которых
a (t — sin /); у = а (1 — cos 0.
Непосредственно ясно, что через каждую точку плоскости про-
ходит одна—и только одна — кривая семейства; следовательно, они
образуют поле ]), а потому циклоида дает сильный минимум в за-
даче о брахистохроне.
Пример 2. Рассмотрим задачу о минимуме интеграла
/ = Г у2 (1+У)2 dx.
Д1
Экстремали задачи прямые линии.
Проверим условие Вейерштрасса для экстремали у — mx-J-
найдем:
= у- (1 + у')2 — т2 (1 + т)2 — {у — [2т (IJ-j- m)2+2m2(l + m)]=
— (у' — т)2 [(«/ + т 4~ I)2 4~2т (т4~1)]-
Для того, чтобы прямая у=тх-\-п давала сильный минимум,
необходимо по условию (8), чтобы для всех значений у, функция
Е была положительна, а для этого в свою очередь нужно, чтобы
было zn(zn-j-l) > 0.
Таким образом, прямая у^тх-~п дает сильный минимум рас-
!) Заметим, что в точке А эти экстремали имеют производную равную СС,
так что поле не совсем подходит под данное выше определение. Эту неувязку
можно обойти, ио мы на этом не будем останавливаться.
134
сматрнваемому интегралу только при т > 0 или т < — 1, При mt
не удовлетворяющих этому условию, т.-е. при — 1 < т < 0, пря-
мая у—тх-\-п дает, как нетрудно видеть, только ограниченный
максимум или минимум, максимум при
и минимум, если эти неравенства не выполнены.
§ 30. Два примера иа абсолютный экстремум.
В некоторых случаях то, что экстремаль доставляет минимум
и даже абсолютный минимум рассматриваемому интегралу, может
быть установлено без помощи указанных в предыдущем параграфе
общих достаточных условий, а путем непосредственного рассмотре-
ния полной вариации А / изучаемого интеграла.
Рассмотрим два примера этого типа:
Пример 1. Найти кривую, дающую минимум интегралу
и проходящую через точки А (х0, у0), В (хь у^*
Экстремали задачи прямые линии.
Пусть у = тх-\-п прямая, соединяющая точки А и В; покажем,
что она дает интегралу I абсолютный минимум.
Пусть дана какая-либо другая кривая, соединяющая точки А
и В, тогда ее уравнение будет
у = тх п 4- *1 (х),
где Г; (х0) — 7) (Х1) ~ 0.
Рассмотрим теперь полную вариацию интеграла; найдем
*1 jfl X!
~2т f V (х) dx+ f [V (х)р dx = f[i{ (х)р dx>0,
if и
x0 x0
откуда видно, что прямая у — тх п дает интегралу I абсолют-
ный минимум.
Пример 2. Найти функцию u = f (х, у), принимающую данное
значение на коитуре С и доставляющую минимум двойному инте-
гралу:
где D область ограниченная контуром С.
135
Рассматривая эту задачу в гл. I, мы нашли, что уравнение Эйлера
для нее есть уравнение Лапласа:
___ д2и । д*и _________р
U дх2 ’ ду** *
а экстремали, следовательно, функции гармонические в области D.
Покажем, что гармоническая функция, принимающая на кон-
туре С заданные значения и такая, что интеграл 7 для этой функ-
ции имеет конечное значение, доставляет этому интегралу абсо-
лютный минимум, так что задача о минимизации интеграла 7 исчер-
пывается решением задачи Дирихле х).
Итак, пусть и (х, у) гармоническая функция, принимающая на
контуре С заданные значения, a v (х, у) какая угодно функция,
удовлетворяющая тому же условию на контуре; тогда:
v (х> У) = и (х> у) + 'l (х> у) >
где (х, у) функция, обращающаяся в нуль на С. Рассмотрим
разность Д 7 между значениями интеграла 7 для этих двух функ-
ций; найдем:
- ff =2 Jf £ 2+££ W+
D D
Преобразуем первый из интеграЯов правой части следующим
образом:
Второй из полученных интегралов равен нулю, так как по усло-
вию и функция гармоническая, первый же преобразуем еще, поль-
зуясь формулой Грина-Римана 2); получим
так как на контуре С функция у (х, у) = О-
J) Напомним, что в гл. I при рассмотрении этого примера было показано
обратно, что функция, решающая задачу о минимуме Л есть решение задачи
Дирихле.
3) С и и рн о в, т, II, стр. 273.
135
если v (х, у) ф и (х, у).
Таким образом, действительно, функция и (х, у) дает абсолют-
ный минимум интегралу L Заметим, что из этого следует между
прочим единственность решения задачи Дирихле. Действительно,
если бы наряду с одним решением и (х, у) существовало другое
решение (х, у)у то оно должно было бы давать интегралу /
абсолютный минимум, но всякая отличная от и (х, у) функция дает
как мы видели, большее значение интегралу /, и потому непре-
менно ui (х, у) и (х, у).
§ 31. Разрывные ре
tl
ения.
До сих пор мы допускали к рассмотрению в качестве экстре-
малей только кривые класса С(1\ В некоторых случаях предста-
вляется выгодным расширить класс допустимых кривых и ввести
кривые не принадлежащие классу так как благодаря этому
задача, которая не имела решения в прежнем, более узком, классе
кривых, может получить решение.
Такие решения вариационной задачи, которые не принадлежат
классу называют разрывными решениями, хотя они могут пред-
ставлять и непрерывные функции.
Мы будем рассматривать здесь, именно, такие разрывные реше-
ния, которые представляют сами непрерывную функцию, но эта
функция имеет некоторое число точек не существования производ-
ных, т.-е. угловых точек кривой.
Итак, мы будем рассматривать здесь кривые, состоящие из ко-
нечного числа кривых класса С(1\ непрерывные и имеющие неко-
торое число угловых точек. Такие решения были исследованы
Эрдманом, и им были найдены условия, которым должны удовле-
творять эти решения и, бла-
годаря которым, они могут
быть найдены. Перейдем к
выводу этих условий. Заме-
тим прежде всего, что если
такое разрывное решение су-
ществует, то каждый участок
его, представляющий кривую
класса есть экстремаль.
Действительно, так как вся
крив ая доставляет минимум
изучаемому интегралу, то
Рис. 14
рассматриваемый ее участок доставляет минимум величины инте-
грала между его концами и, как кривая класса С(1), должен удовле-
творять выведенному в главе I необходимому условию — уравне-
нию Эйлера.
Возьмем теперь любую угловую точку М решения (рис. 14).
Обозначим часть основного интеграла / до этой точки через Zt и
от нее до конечной точки через /2. Проведем через выбранную
угловую точку произвольную кривую MN и будем варьировать ее
по этой кривой, тогда как необходимое условие того, что вся
рассматриваемая кривая д^ет экстремум интегралу /; имеем
о/2 = 0
(14)
Но выражения для о Д ио /2 могут быть легко найдены, как ва-
риации величины интеграла при движении конца и начала экстре-
мали по некоторой кривой. Именно, обозначая через у^ производ-
ную слева и yi производную справа в рассматриваемой угловой
точке (*i, #1) и через ох и о у, как обычно, вариации точки на про-
веденной кривой MN будем иметь по гл. III [стр. 64, (10)]
f
S — уi F'y (*1, г/1, //1')] 5 х ~Ь
+ F'y (*i, г/i, г/i) о г/...................(15>
_ I I
—[Г (*1, 1/1, 1/1')— ух F'y (*!, г/1, г//)] ох-
1 _
— F'y’ (xi, г/i, г//) о г/.
Подставляя полученные выражения о Д и о /2 в (14) и прирав-
нивая нулю множители при о х и о у, так как они могут быть
взяты произвольно, благодаря свободе выбора кривой, получим
искомые условия Эрдмана:
F'y (xi, уу, yi)=F'y (xi, г/i, j/i')
F (хь г/i, г//) — г// F'y (хи ylt г/i') =
= F (xi, г/i, г/f) — г// F'y (xi, г/i, г//) ,
• • (16)
Заметим прежде всего, что полученные условия (±6) дают воз-
можность найти разрывное решение. Предположим для простоты,
что у искомого решения одиа угловая точка, тогда для его оты-
скания нужно найти две экстремали, т.-е. четыре величины С/, С/,
С", Сг , так как общий интеграл уравнения Эйлера зависит от
двух ПОСТОЯННЫХ С1 , С2 -
Для нахождения же этих параметров мы имеем как раз четыре
уравнения; именно: два уравнения дает то условие, что первая
экстремаль проходит через начальную, а вторая — через конечную
точку и еще два уравнения дают условия (16) в точке пересечения
этих экстремалей.
Таким образом, задача, вообще говоря, разрешима. Если бы число
угловых точек было больше одной, то мы имели бы то же самое,
так как прибавление каждой новой угловой точки вызывает увели-
чение числа экстремалей на одну, т.-е. числа неизвестных параме-
тров на 2, но одновременно вызывает добавление двух новых урав-
нений (16), т.-е. число уравнений остается равным числу неизвестных.
Вспомнив выражение функции Вейерштрасса, мы можем придать
второму уравнению Эрдмана более простой вид. Действительно»
перенося в нем все члены в левую часть, видим, сравнив с (6), что
она представляет ничто иное, как Е (хъ у у, у^, #/), а потому
условия Эрдмана (16) могут быть записаны проще:
__ _ j
_ J
F'y У1, У1) = F'y (xi, yi, yi)
__ _
E (л'ь yu у I, yi) = 0
(16')
Написанные в такой форме уравнения Эрдмана могут быть
весьма просто истолкованы геометрически. Вернемся к фигура*
триссе Y—F{x\, yit у'); тогда первое из уравнений (16z) пока-
зывает, что для значений аргу-
мента У=У\ И У —У1, фи-
гуратрисса имеет одинаковые
угловые
коэффициенты
каса-
тельной, а второе, на основании
геометрического значения функ-
ции Е, что точка отвечающая
значению у'— у\ лежит на ка-
сательной, проведенной в точ-
ке у — у\ \ а оба вместе пока-
Рис. 15
зывают, что фигуратрисса имеет общую касательную в точках, от-
вечающих этим значениям аргумента у’ (рнс. 15).
Таким образом, условия Эрдмана приводятся к такому геоме-
трическому условию: при значениях параметров х = х1, у — у\, со-
ответствующих угловой точке, фигуратрисса должна иметь общую
касательную в точках, отвечающих абсциссам у’ =у\ и у' =yi.
Укажем, наконец, что разрывных решений задача не имеет на-
верное, если при всех рассматриваемых значениях х, у и любом
у! соблюдено условие
Е"у ” (х, у, у) > 0, . .
(17)
ибо, если бы разрывное решение существовало, то на основании
первого условия Эрдмана по теореме Ролля при некотором значе-
нии у\ лежащем между yY и у\ было бы
г*// / л
г У! (*1, У , у ) = О,
что противоречило бы (17).
Пример 1. Найти минимум интеграла:
/у2 (1+У)2^-
Рассматривая эту задачу в предыдущем параграфе, мы видели,
что экстремали — прямые линии у = тх -j~ п не дают при — 1 < т <0
сильного минимума этому интегралу.
139
Попробуем найти разрывное решение с одной угловой точкой.
Оно должно состоять из двух прямолинейных отрезков. Составим
условия Эрдмана (16); они дают, если обозначить для краткости
У\'—Ру Ух—Я- '
р2, (1+р)+р ^\-\-р}2 — я2 (1+9)+ у 0 4-9)2-
Р2 (1+р)2_2 рз (1+Р)-2 (1+р)2 =
= 92) 14-9)2-2 93) 14-9) — 2 92 (1 9 4~)2
или преобразуя:
р (1 + р) (2р + 1) = 9 (14-9) (29 + 1);
Р2 (1+p) (—1 —Зр) = 92 (14-9) (-1-3 9).
Откуда ясно, что един-
ственное действительное
решение этой системы,
кроме тривиального р~^9
суть р — 0; <? =— 1 или
р —— 1, 9 = 0.
Итак, разрывное ре-
шение может быть со-
ставлено из отрезков па-
раллельных оси абсцисс
и прямой */=— х. Та-
Рис* 16 кое решение, очевидно,
доставляет . изучаемому
интегралу минимум, ибо обращает его в нуль.
Пример 2. Задача о преломлении света. В некото-
рых физических примерах разрыв у решения вызывается разрывом
подъинтегральной функции; такой, именно, пример представляет рас-
сматриваемая задача. Подъинтегральная функция, если y = f\ (х)
уравнение поверхности раздела, и п2=—— показатели
Ci
преломления первой и второй среды, задается так:
f (х, у, у') —
Th j/ 1 4- у'2 При у > f (х)
П2 у/14- у'2 » у < f (*)
Искомое решение может иметь разрыв на* линии раздела, при-
чем точку разрыва можем по этой линии варьировать (рис. 16)
Тогда, составляя 8 Л и 8 Д > приняв Ъу—f (xj 8х и пользуясь
для 8Д первым, а для 8/2 вторым выражением функции Т7, найдем
140
откуда после упрощений по (14) найдем, полагая
0 = arctg/ (xi); ® ==arctg z//; <р= arctg^i',
ЧТО
— _ Л
щ cos ф = П1 tg 0 sin <p = n2 cos <p-pn2 tg sin
или после упрощений приходим к закону Декарта: 1
cos (ср — $) ____________________ п2
’ _£ — — ”” >
cos (ср — о)
что косинусы углов, составленных лучами с плоскостью раздела»
обратно пропорциональны показателям преломления.
§ 32. Условие Якоби.
В § 29 при рассмотрении достаточных условий того, чтобы
экстремаль давала минимум интегралу задачи, мы ставили в числе
их требование, что экстремаль может быть окружена полем. Здесь
будут даны некоторые достаточные условия для того, чтобы это
поле существовало. Именно, будет показано, что для того, чтобы
экстремаль могла быть окружена полем, достаточным является со-
блюдение некоторого условия Якоби, о котором подробнее будет
сказано ниже.
Займемся прежде всего нахождением условий, достаточных для
того, чтобы данная экстремаль y=f (х), соединяющая точки
А (х0, уъ) и В (xi, j/i) могла быть окружена центральным полем.
Будем предполагать при этом, что на ней самой выполнено условие
Лежандра, т.-е.
F"y > (х, у, у') > 0................(17)
Рассмотрим семейство экстремалей, проходящих через точку
А (х0, уо). Это семейство зависит от параметра т—углового коэф-
фициента экстремали в начальной точке. Уравнение этого семей-
ства будет:
У = <? (х, Т),.....................(18)
причем при некотором значении параметра т=:т0 получается дан-
ная экстремаль
® (*, 'о) = / (х)...................(19)
Заметим при этом, что на основании общих теорем существо-
вания теории дифференциальных уравнений, которые применимы
в данном случае, благодаря соблюдению условия Лежандра (17),
функция представляет функцию непрерывную вместе со своими
частными производными до второго порядка по обоим аргументам.
Укажем теперь условия того, чтобы семейство кривых (18) об-
разовало поле вокруг исследуемой экстремали. Для этого нужно,
чтобы кривые этого семейства при значениях ", близких к "0, обра-
зовали семейство не пересекающихся кривых. Это условие, выра-
женное аналитически, означает, что у как функция от определен-
141
ная уравнением (18), должна быть однозначной; для последнего же,
на основании теорем о неявных функциях достаточно, чтобы было
при
. .(20)
Поставленное условие требует, чтобы была положительна
при значениях т, близких к т0, но можно показать, что достаточно
потребовать выполнения этого при т —Именно, что для того,
чтобы экстремаль можно было окружить центральным полем,
достаточно, чтобы выполнялось условие
О ПрИ Xo<X^Xj .
• .(21)
Чтобы показать это мы докажем, что выполнение условия (21)
влечет за собой выполнение условия (20) при достаточно малом s.
Заметим прежде всего, что:
Взяв произвольное число а можем найти, благодаря непрерыв-
ности функции и (22) число о, настолько малое, чтобы она
была положительна и в промежутке (х0, х0-*-б), а также выполня-
лось неравенство
> 0; при 4-2, "о — • -(23)
Возьмем теперь е < а настолько малым, чтобы было
>0 при хо~г^^х^х1> то — • - • (24)
'ду
величина
Это возможно благодаря непрерывности и неравенству (21).
Покажем, что при выбранном е выполняется условие (20). Но
действительно, если х^х04~о, то оно выполнено по (24); если же
х < хо -р то и в этом случае при рассматриваемом значении х
= 0 ив промежутке от хо до х она
d $
есть возрастающая функция, т. к. по (23) > 0.
Итак, условие (21) установлено. Оно говорит о том, что первая
точка рассматриваемой экстремали после х = хо, для которой
д“=0 лежит за точкой В. Эту точку называют сопряженным
с точкой А фокусом. Так как эта точка получается совместным
ду д «р (х,т) „
решением уравнения ' — 0 и уравнения данной экстре*
зияли, то геометрически она представляет точку пересечения оги-
бающей пучка экстремалей, исходящих из точки А, с данной
экстремалью (рис. 17).
Таким образом, усло-
вие (21) равносильно сле-
дующему условию: для
того, чтобы экстремаль
АВ можно было окру-
жить полем, достаточно,
чтобы фокус сопряжен-
ный с точкой А, лежал
за точкой В.
Полученное условие
носит название условия
Якоби.
Рис. 17
Условие (21) говорит о том, что функция
которую мы
обозначим теперь для краткости одной буквой v, должна быть по-
ложительна при xo<x^xi. Якоби показал, что эта функция v
может быть найдена без рассмотрения семейства (18), как решение
некоторого дифференциального уравнения. Для составления этого
уравнения подставим у ~ <р (х, "=) в уравнение Эйлера, продиффе-
ренцируем полученное тождество по т и положим затем т =
Найдем
Обозначая через Р, Q
д? F д-F d2 F
~д^ > 9 ’ веЛИЧИН У
иие (25) переписать в виде:
и R результат замены в выражениях
и уг на f (х) и f1 (х), можем уравне-
Pv 4- Qv! — -р- (Qv 4~ Rvf) — 0.........................(26)
с* X
или
Rv' + R'v' + tQ' — P)v — 0 . . ...........(27)
Полученное уравнение есть линейное уравнение второго порядка,
частным
ре
ением которого является функция V, при этом началь-
ные условия, которыми оно определяется, суть
Ых=х0 = о;
(28)
Уравнение (27) носит также имя Якоби, и условие Якоби может
быть с помощью его сформулировано так: решение уравнения (27),
удовлетворяющее начальным условиям (28), не должно обращаться
в нуль для значений х в промежутке xq < x^Cxt .
Мы показали пока, что условие Якоби является достаточным
для того, чтобы экстремаль можно было окружить центральным
полем. Однако центральное поле не является обыкновенным полем,
и поэтому построение его не является достаточным для нужд § 29.
143
Но можно показать, что условие Якоби является достаточным не
только для
Рис. 18
существования центрального поля, но и для существо-
вания поля обыкновенного,
т.-е. такого, что экстре-
маль АВ лежит вместе с
некоторой полосой, окру-
жающей ее, внутри поля.
Для доказательства этого
переместим начальную точ-
ку экстремали назад по
экстремали в некоторую
точку А (х0—А, /(х0—Л)),
(рис. 18).
В таком случае функ-
ция и, которая зависит не
только от х, но и от х0:
v — v (х, хо), перейдет в
» (х, хо — /?).
Достаточно показать теперь, что мы можем выбрать h настолько
малым, чтобы функция v (х, х0 — h) была положительна при
х0 — Л<х^Х1, так как, если это будет установлено, то для экс-
тремали АВ будет выполняться условие Якоби, а потому она мо-
жет быть окружена центральным полем, внутри которого лежит
экстремаль АВ, и, для которой это поле будет обыкновенным полем.
Но то, что можно найти указанное h, ясно непосредственно. В са-
мом деле, как легко видеть по (28), существует такое о0, что в про-
межутке (х0, хо“{-80) : > О, а в промежутке (х0 -j-o0, xi) :
v (х0, х) > 0. Далее из теорем существования дифференциального
/ \ &V (*П , *с)
уравнения следует, что v (х0, х) представляет вместе с -------
непрерывную функцию от обоих аргументов х0 и х, а потому, оче-
видно, при достаточно малом h будет v (.
жутке (х0 — h, х0-р%) и v (х, х0—h) > 0 в (л
чему, так как и (х0— h, х0—Л) = 0 будет
всех х, удовлетворяющих неравенству х. — h
Итак, указанное h существует, а потому условие Якоби является
достаточным для существования обыкновенного поля, содержащего
данную экстремаль АВ.
Пользуясь последним полученным результатом, мы можем ре-
зультаты § 1 сформулировать теперь в таком виде:
Для того, чтобы экстремаль АВ давала сильный минимум ин-
тегралу (1), достаточно, чтобы выполнялись следующие условия:
1) На эстремали условие Лежандра
О
0.
и
2) Условие Якоби
0, при х0
144
где v (х, хв) решение уравнения (27), удовлетворяющее усло-
виям (28).
3) Условие Вейерштрасса
Е (х, у, у', и) > О
при всех значениях х, (х0 < х < у =f (х)9 у =f} (х), цф/ (х).
Заметим, что выполнение первых двух условий само по себе
является достаточным для слабого минимума. В самом деле, если эти
условия выполнены, то экстремаль может быть окружена полем, а
функция Вейерштрасса Е (х; г/, у\ и) на основании (10) будет по-
ложительной при значениях и близких к г/, что и является доста-
точным для слабого минимума.
Покажем еще, что среди поставленных условий — условие
Якоби вызвано существом
Рис. 19
вопроса: именно, если это
условие не соблюдено, точ-
нее говоря, если существует
х2 (х0 < х2 < Xi) такое, что
v (х2) = 0, то экстремаль не
может дать интегралу (1).
даже слабого минимума.
Предположим, таким о бра-
зом, что в некоторой точке
х2, лежащей в промежутке
(х0, Aj), функция V (х, х0)
обращается в нуль.
Мы видели в гл. I, что кроме обращения в нуль первой вариа-
ции необходимым условием минимума для Z(а), как функции пере-
менного а, является:
d а2
Но вспоминая, что
л 1
/ (а)=у F (х, y-j-av), у +ат1') dx . . . . . (29)
*0
найдем легко
+ 2 Q -ф R т]'2) dx, .
(30)
где Р, Q и R обозначают то же, что и в уравнении Якоби (27).
Будем минимизировать полученный интеграл, считая Pt Q, R
данными функциями от х, а т] искомой функцией.
Уравнение Эйлера для функции у будет тогда
(31)
т.-е. представляет уравнение Якоби (26). Вдзьмем за функцию (х)
Вариационное исчисление. — 10
145
функцию равную v (х, х0) в (х0, х2) и равную 0 в (х2, Xi); график
ее дан на рис. 19. В таком случае имеем:
J -V Rfl'2) ^x—J* [(Pv+Qv')ti +(Q-ri-^-R-r]')7i']dx
*0 Xa
ИЛИ no (31)
d
= (Q^i^R^ri
HCh + ^')Y dx= j ~а~х
x9
1X,
= 0,
.1*0
(Qtj-H^V)7! dx =
/
так как по выбору т] она обращается в нуль в точках х0 и х2- Но
построенная функция у представляет разрывное решение, благо-
даря тому, что точка х2 есть угловая точка кривой y — i](x).
В самом деле, имеем (х2-|-0)=0, но не может быть
т/ (хг— 0)=0, так как v представляло бы тогда функцию, обра-
щающуюся в нуль вместе со своей производной в точке х2, а по-
= 1. Итак, т] представляет разрывное
О
тому, как решение линейного уравнения с коэффициентом при вто-
рой производной 7? | 0, была бы равна нулю тождественно, что
противоречит условию
решение, но между тем она не удовлетворяет условию Эрдмана,
так как
[Q + ВД= R (х2 - 0) = 0 •
х2—0
Следовательно, значение интеграла (30), которое дает ему
функция ^,не является наименьшим, а потому для соответственно
подобранной функции этот интеграл может быть сделан отри-
цательным.
Итак, необходимое условие слабого минимума
da*
оказывается не соблюденным.
ГЛАВА VI.
Прямые методы вариационного исчисления.
Приложения к математической физике.
§ 33. Общие замечания. Идея прямых методов.
Для решения вариационных задач до настоящего времени мы
прежде всего определяли семейство кривых, обладающих относи-
тельно заданного функционала тем характерным для них свойством,
что в общем выражении вариации функционала, вычисленной для
146
любой кривой этого семейства, сохранялись лишь члены, завися-
щие от вариаций концов кривой; слагаемые же, зависящие от ва-
риаций средних точек, давали нуль.
Для задач с закрепленными концами это требование равно-
сильно обращению в нуль первой вариации функционала.
Основным уравнением, характеризующим свойства таких кри-
вых, было во всех разобранных нами задачах уравнение Эйлера.
Искомая кривая, решающая задачу, если она существует, обязана,
как мы видели, принадлежать найденному таким путем семейству
кривых и должна быть выделена из него на основании граничных
требований, природа которых тесно связана с видом задачи.
Мы переходим теперь к краткому обзору так называемых пря-
мых методов вариационного исчисления, основанных на идее со-
вершенно отличной от только что изложенной. В них пытаются,
не прибегая к определению всего семейства экстремалей задачи,
т.-е. не пользуясь дифференциальным уравнением Эйлера, разыски-
вать непосредственно кривую, решающую задачу, обычно при
помощи построения последовательных приближений к ней; послед-
ние получаются, когда сводят решение задачи об экстремуме
функционала к задаче об обыкновенном экстремуме функции отно-
сительно некоторого числа п надлежащим образом выбранных па-
раметров и затем совершают предельный переход при п—> оо.
Чтобы иметь в виду что-либо определенное, мы остановимся,
при общих пояснениях непосредственных методов, на простейшей
задаче о минимуме интеграла
7*1
' 1 (и) =/ F (х, у, у') dx = min,
*0
хотя все наши рассуждения, при надлежащих изменениях, могут
быть перенесены на все типы задач вариационного исчисления,
рассмотренные нами до настоящего времени.
у = у (х) кривая класса С(1), лежащая в некоторой области 7?
плоскости (х, у). Будет ли класс допустимых кривых содержать
в себе лишь кривые с неподвижными концами, или же будет до-
пускать известную свободу в передвижении концов, для нас в на-
стоящий момент представляется безразличным.
Допустим, что нам какими-либо путями удалось установить
ограниченность снизу значений / (у) для всего класса допустимых
кривых.
Пусть g будет точной нижней границей этих значений. Напо-
мним некоторые соображения общего характера.
Задача прежде всего состоит в том, чтобы, во-первых, опреде-
лить, существует ли среди рассматриваемых нами функций такая,
что для нее достигается точная нижняя граница g, т.-е. найдется ли
среди допустимых функций такая, что для нее / (y) = g и, во-вто-
рых, дать прием построения такой функции. Если в теории обыкно-
венного экстремума для непрерывных функций в замкнутых обла-
стях мы обеспечены, по известной теореме Вейерштрасса, возмож-
ностью решения задачи для всех случаев, то первая трудность
кг
147
вариационного исчисления именно в том и состоит, что оно ли-
шено этого предложения, и достижимость границы g должна быть
доказываема в каждом отдельном случае; утвердительный ответ
вообще не всегда возможен. Мы напомним читателю, что, напри-
-4-1
мер, как показывалось нами в главе I, / = х2 у'2 dx для всех
—1
функций класса в интервале
— проходящих через точки ( — 1,—1), (-р
имеет нижнюю границу нуль, которая не может быть достигнута
ни для какой непрерывной функции.
Вне зависимости от того сможем ли мы или не сможем отве-
тить на первый из поставленных нами вопросов, можно утверждать,
что среди допустимых функций найдется такая последовательность
У1> Уг> • • > Уп, • • • , что lim 1 (уп) = g.
Л ->оо
Мы будем ниже называть ее минимизирующей последователь-
ностью задачи.
Если бы удалось указать процесс, позволяющий так выбирать
последовательность у^, у2, . • - , чтобы она сходилась к некото-
рой функции, и кроме того можно было бы переходить для этой
последовательности к пределу под знаком интеграла:
/ (lim — 1 (ya) = g
мы получили бы ответ на оба поставленные нами выше вопроса-
Эта мысль была принята за исходную точку большинства непо-
средственных методов вариационного исчисления.
Описанный здесь процесс есть вообще не что иное, как метод
последовательных приближений применительно к вариационным
задачам, но однако здесь он имеет существенное отличие от из-
вестных, классических случаев его применения к доказательству
теорем о существовании решений в теории дифференциальных, ин-
тегральных уравнений, уравнений с исчислимым множеством пере-
менных и т, д. В тех случаях аналитический аппарат самих иссле-
дуемых вопросов давал удобный алгорифм приближения к иско-
мому решению, позволяющий вообще по известному n-ому прибли-
жению немедленно и единственным образом построить „п -р 1 а-ое
приближение. Роль этого алгорифма сводилась к тому, что он
автоматически сглаживал ту ошибку, которую мы допускали, за-
менив точное решение первым к нему приближением.
Иное будет происходить в нашем случае. Здесь аналитический
аппарат задачи не дает такого алгорифма; знание уп из миними-
зирующей последовательности обычно еще не дает никаких ука-
заний на то, каким должно быть z/n-pi -»n-hlw-oe приближение
вычисляется вообще независимо от того, каковы были предше-
ствующие приближения. Здесь нет того автоматического сглажи-
вания ошибок, благодаря которому мы в случаях классических,
может быть отправляясь от неудачного первого приближения в
большинстве случаев приходим к точному решению.
148
Если нам каким-либо путем удалось построить минимизирующую
последовательность, то факт сходимости ее будет чаще всего за-
висеть только от того, удачное или неудачное мы взяли правило
построения такой последовательности. Наконец, от удачи в выборе
правила будет зависеть и быстрота сходимости процесса.
Требования, которым должно удовлетворять правило построения
yi, у2 9 - • , чтобы дать удобный способ нахождения решения,
обычно тесно связаны с самим характером задачи и от одной
задачи к другой меняются весьма сильно.
Это обстоятельство крайне затрудняет теоретическое исследо-
вание вопроса, но в практических приложениях неопределенность
правила имеет то несомненное достоинство, что позволяет при
решении каждой задачи возможно лучшим способом выбирать при-
ближенные решения.
§ 34. Метод Ритца.
Процесс выбора минимизирующей последовательности, предло-
женный Ритцем и примененный им с большим успехом к числен-
ному решению задач математической физики, состоит в следую-
щем: исходят из некоторой, определяемой обычно предельными
условиями и видом области интегрирования, системы функций
щ., ип, . , относительно которой известно, что каждая
из ип — допустимая функция и, кроме того, любая линейная ком-
бинация
п--- f j СЦ Hi
i- 1
функций и/, когда коэффициенты а/ меняются в некоторых обла-
стях, вид которых зависит от задачи, — также допустимая функция.
Будем пытаться теперь приближаться к искомому решению при
помощи линейной комбинации Yn, выбирая надлежащим образом
коэффициенты а/.
Дело теперь в том, чтобы указать такое правило выбора ко-
эффициентов а/, чтобы иметь известную надежду — в пределе при
п—получить решение задачи.
Для изучаемого нами класса задач наиболее естественны^ яв-
ляется следующий прием:
Подставим в / (у) вместо у линейную комбинацию полу-
ченное после подстановки выражение /(Yп) будет некоторой
W _ _ • •__.___
ЗЕ
Выберем теперь их так, чтобы /(Yn) было минимальным !).
Требование /(Yn)~ min представляет собой задачу на экстре-
мум функции п параметров сц; для определения их будем иметь
систему п уравнений
*) Мы допускаем здесь возможность такого выбора.
149
Найдя отсюда числа а/ и подставив их в Yn, получим некото-
рую линейную комбинацию функций и/, которую мы назовем
через Un •
Рассмотрим теперь последовательность чисел I (U2) . . .
Можно видеть, что эта последовательность не возрастающая;
в самом деле, переход от Yn к Y„+i равносилен расширению класса
функций, дл^ которых вычисляется интеграл, так как содер-
жит лишнее слагаемое tzrt+i сравнительно с Yn •
При расширении же класса функций минимальное значение ин-
теграла во всяком случае не увеличивается.
С другой стороны, эта последовательность ограничена снизу,
ибо = Поэтому она имеет предел*
Если окажется, что этот предел равен g, т.-е. последователь-
ность функций Ui, Ui, . . . будет минимизирующей, то тогда, сле-
дует думать, и сами функции £Л, (7г, • • • будут сходиться к ре-
шению задачи.
Но для того, чтобы быть уверенным в выполнении равенства
lim I(Un) = g
Л--> ОО
г
необходимо брать систему функций Ui, . достаточно пол-
ной; в противном случае может оказаться, что lim I (Un) > g, и
п —•—> ОО
тогда нет надежды на то, что после предельного перехода lim Un мы
п--> ОО
получим функцию решающую задачу.
Обычно требования полноты системы . берут в виде
требования „средней по отношению к F (х, у, у') полноты":
Какова бы ни была допустимая функция у, можно указать
такое п и такие at, т.-е. такую линейную комбинацию Yn, чтобы
I (Yn) отличалось бы от 1 (у) как угодно мало.
Если выполнено это требование средней полноты, то и по-
строенная нами выше последовательность
U\, U2 j • • • > Un > • •
будет, наверное, минимизирующей. Поясним это в двух словах.
Убедимся прежде всего в том, что из линейных комбинаций
Yn минимизирующая последовательность может быть построена.
В самом деле, пусть уь взято из минимизирующей последова-
тельности. По условию полноты для всякого можно выбрать
такую Yn(k)y чтобы
\I(Yn(kJ)-I(yk)\^k.
Если же s* взять при условии lim е^ = 0, то отсюда следует
к--------------------------------> ОО
lim I (Yn(kj)=lim I (yk) = g,
к--> co к--> co
что и доказывает наше утверждение.
Теперь не представляет никаких затруднений доказать выпол-
нение равенства lim / (Un) = g*
П -> СО
150
Действительно, так как Un(k) дает минимум I (у) относительно
всех линейных комбинаций из того же числа п (к) функций щ, то
/ {Yn(k))^I (Un(ky)^g,
откуда вытекает требуемый результат.
Заметим здесь, что уравнения для определения а/ будут осо-
бенно просты, если функция F (х, у, у) будет квадратичным вы-
ражением относительно у и у'. Это будет, например, иметь место
почти для всех задач математической физики. В этом случае пред-
шествующие уравнения дают систему п алгебраических линейных
уравнений с п неизвестными.
Как уже отмечалось выше, из факта lim f(Un) — g еще нельзя
Л-------------------------------------->со
вообще заключить, что существует lim Un , и если существует, то
п------------------------------------->оо
предельная функция будет допустимой.
Определение достаточно широких условий, которым должна
удовлетворять функция F, чтобы из факта lim / (Un) — g следо-
п-->оо
вало бы, что последовательность (Д, ••• сходится к функции, ре-
шающей задачу, представляет еще и до настоящего времени, на-
сколько нам известно, нерешенную задачу вариационного исчисле-
ния. Простейший случай таких исследований приведем нами ниже.
Насколько большой успех имеет этот метод при применении его
к задачам частного вида, будет видно из вычислений, приводимых,
нами ниже. Он будет, разумеется, связан с более или менее счаст-
ливым выбором функций И/.
Примеры применения метода Ритца. 1. Изо п е р и метри-
ческая задача. Среди всех плоских замкнутых кривых длины Z,
иайти ту, которая ограничивает наибольшую площадь.
Мы сузим немного задачу и будем считать допустимой всякую
кривую с конечным числом угловых точек.
Пусть:
уравнение такой кривой; 5 — длина дуги, отсчитываемая от некото-
рой точки.
Для упрощения дальнейших выкладок заменим переменную,
положим
Когда 5 меняется ат 0 до Z, t будет меняться от 0 до 2я.
Далее, очеввддо:
*
__( 1 у!).
\dtj "Г" W; ~ \2пу
1) Это непосредственно следует из равенства.
151
Интегрируя обе части в пределах от нуля до 2к, имеем
2тс
или
2к
О
Площадь s, ограничиваемая рассматриваемой кривой, будет
равна
2~
О
Поставим перед собой задачу о разыскании максимума инте-
грала (2) при условии (1).
Примем за «ь Kg , . . . тригонометрические функции
1, sin х, cos xt sin 2x, cos 2x. *
Вопрос, в какой мере для них удовлетворяются условия пол-
ноты, высказанные выше, мы оставляем здесь без исследования.
Пусть
(a* cos v х 4- bs sin v x)
До
2
n
yn = / j COS V X + c/v sin v x).
V== I
Подставим в (1) и (2); после простых вычислений, весьма упро-
щающихся, если воспользоваться ортогональностью тригономе-
трических функций, имеем:
п
• (3)
• • (4)
Выберем теперь числа а., Ь?, с<, d., так, чтобы при усло-
вии (3) S было максимальным.
По известным правилам дифференциального исчисления соста-
вляем функцию
152
4
и записываем для нее условия несвязанного максимума.
• • (5)
4tt2v2a<Zv = О
v= 1, . . . п
~ = — kvcv = О
-I- 4^2v2Xc> = О
ОС 1
• • (6)
Чтобы системы (5) и (6) имели отличные от нулевого решения,
на-
необходимо и достаточно, чтобы для какого-либо значения v,
пример k, определитель этих систем:
nk, 4к2 А:2 к
4тс3&3 к, Tzk
р
Л*
был бы равен нулю. Отсюда следует, что X должно иметь вид
“ 4nk ’
Но тогда определители всех систем (5) и (6) для
будут отличны от нуля, и потому все
CL-* , by , Cv , dy j - '
при
* v 4= k
*
равны нулю.
Мы выбираем у знак минус; выбор знака как легко вы-
ясняется, равносилен перемене направления интегрирования по
контуру.
dk ~ CLk bk~ — Ck
Z2 — 4^2 £2
5 = к £ (a? + 6*г) ==-^
Из последнего равенства видно, что максимум S достигается
при &=1. Системы (5) и (6) при
и
* v —1
дают
. И С}=—Ь1
153
и все остальные
и <4,
равны нулю, т.-е.
X = 55 *f- «1 cos t
bi sin t
bi cos/4“ ai sin t*
Предельный переход при n----> 00 ничего, очевидно, не изменит
в полученном нами выражении для х и yt и уже при конечном п
мы будем иметь случайно точное решение.
Можно видеть, что кривая, определенная предыдущим равен-
ством, есть ничто иное, как окружность.
2. Пусть
у)
I
непрерывная в прямоугольнике
D (0 х к, 0 г/ < тс)
функция, представляемая там абсолютно и равномерно сходящимся
тригонометрическим рядом
оэ
^(х, у) = Ст,п sinтх з\ппу.
т, п — 1
Будем искать функцию ?(х, г/), обращающуюся в нуль на гра-
нице области D и дающую минимум интегралу
1 =// 2+©2 ~2 g ' и dg.(6)
В противоположность предыдущему случаю, искомое решение
здесь есть функция двух переменных хну. Естественно поэтому
искать приближения к решению не в форме отрезков простого,
а двойного ряда. Положим
ij
J— sin тх sxnny...............(7)
/я, п — 1
При нашем выборе функций, по которым разлагается прибли-
жение к решению, граничные условия для каждого приближения
будут соблюдены.
Подстановка в (6) дает: , -
Отсюда непосредственно видно, что минимум достигается при
_ __ п
dm, п Г •
154
Предельный переход при z, J-> оо в равенстве (7) не изменит
величины уже найденных коэффициентов и приводит к функции
т, п ~ 1
sin тх sin пу
• • • (8)
1
Ряд, стоящий в правой части, так же как и ряды, получающиеся
от почленного дифференцирования его, сходятся абсолютно и
равномерно, что легко выясняется из требований, наложенных на
g(x> у)-
В этом примере, как и в предыдущем, приближение любого по-
рядка приводит к таким выражениям для коэффициентов, входящих
в него, которые не зависят от номера этого приближения. Это
происходит только благодаря удачному выбору функций и/. Но
в общем случае найденные для коэффициентов а/ выражения бу-
дут, вообще говоря, зависеть от номера приближения.
§ 35. Метод функций бесконечного множества аргументов.
Пусть дело идет об экстремуме некоторого интеграла J(y)- Будем
рассматривать семейство функций, зависящее от бесконечного мно-
жества параметров сц и такое, что каждая допустимая функция
может быть получена из уравнения семейства при частной системе
значений параметров, входящих в него. Наоборот, при всякой
частной системе значений параметров из некоторых областей их
изменения наше семейство дает допустимую функцию.
Например, мы можем предположить каждую допустимую функ-
цию разложенной в ряд по каким-либо специальным функциям
(тригонометрическим, Бесселя, Лежандра, степеням независимой
переменной, если у нас есть необходимость считать допустимые
функции аналитическими и т. д.). В этом случае каждая допусти-
мая функция определится последовательностью коэффициентов
разложения.
Подставим в I (у) вместо у общее выражение семейства. После
подстановки интеграл будет функцией параметров а/, и дело будет
заключаться в том, чтобы выбрать величины at так, что I (у) было
бы минимальным.
Разумеется, в каждом отдельном случае возможность примене-
ния такого приема должна быть оправдана дополнительными иссле-
дованиями сходимости и законности тех операций, которые проде-
лываются по ходу рассуждений.
Мы поясним эти общие рассуждения на частном примере.
Задача Дирихле для круга. Пусть область D — круг
единичного радиуса. Попытаемся определить функцию ср (./, у),
дающую минимум интегралу
и принимающую на контуре заданные значения.
155
Допустимыми к конкуренции будем считать все непрерывные
вплоть до контура функции с такими же частными производными
первого порядка и имеющие те же контурные значения, что и
?(*, у)-
Введем полярные координаты:
Заданные контурные значения будем предполагать некоторой
функцией полярного угла &, могущей быть разложенной в триго-
нометрический ряд
ОО
/(ft) = + 'V! (ch cos vft 4- bv sin vft).
Мы ие будем входить в исследование условий, которым должны
удовлетворять коэффициенты разложения, чтобы излагаемые ниже
преобразования задачи оставались справедливыми.
Рассмотрим семейство функций
(Ю)
Чтобы удовлетворить предельным условиям, мы потребуем вы-
полнения равенств
/у (1) -—- Ch g (1)-Ъу •
Определенная равенством 10 функция ?(х, у) зависит от вы-
бора бесконечного множества функций /,, g,. Если мы теперь во-
образим, что каждая из /, и g? разложена в ряд по специальным
функциям какого-либо вида, то получим -(х, у) в форме двойного
ряда с неопределенными коэфициентами, — как раз такое семейство,
о котором говорилось в предварительных объяснениях.
Мы, однако, не будем этого делать, ибо определение /у и
представляется здесь задачей исключительно простой.
Подставим (10) в интеграл (9):
Решение первоначальной вариационной задачи свелось, таким
образом, к решению целого ряда задач о минимуме для интегра-
лов вида
1 1
156
Очевидно, что написанные интегралы имеют смысл только тогда,
когда выполнено условие
Л(0) = ^(0) = 0, V = 1,2, . . .
Для определения функций f, и g, мы прибегнем к искусствен-
ному приему, весьма быстро приводящему к цели, хотя они могли
бы быть найденными, как отмечалось выше, по прямым методам
вариационного исчисления.
так как
/v(l) — а,
известно, то минимум достигается тогда и только тогда, если 4
и так как *
/v(l) = a,,
ТО - ; и ;
Решение поставленной задачи имеет таким образом вид:
СО
v xz 1
§ 36. Иетод Эйлера,
л
т-
Наконец, нельзя не упомянуть еще об одном методе построе-
ния минимизирующей последовательности, в существенных частях
совпадающем с приемом, примененным Эйлером при выводе урав-
нений, носящих его имя.
Ради простоты мы останавливаемся только на основной задаче,
хотя та же мысль о замене производных отношениями конечных
разностей с успехом может быть применяема к гораздо более ши-
рокому классу задач.
Класс допустимых кривых задачи мы определяем требованиями:
157
1) у принадлежит классу в интервале
Х° X < X 1
2) У (*о)_= Уо у(х1) = У1-
Какова бы ни была допустимая функция у, всегда можно ука-
зать такую ломаную линию р, проходящую через точки (х0, уо) и
С*ь У1)> чтобы I (р) отличался бы от I (у) как угодно мало. Это
утверждение является следствием того обстоятельства, что для
всякой кривой класса можно построить такую ломаную линию,
которая отличалась бы как угодно мало от кривой не только по
ординатам, но и по касательным. Наоборот, для всякой ломаной
линии, проходящей через точки (хо,г/о), (xi > *71) можно указать та-
кую допустимую функцию у, для которой интеграл I (у) отичался
бы от интеграла /(р) как угодно мало.
Из этих простых соображений следуют два утверждения:
1. Существует такая последовательность ломаных линий
* *
Р\ > Р2 f • • • • J • • • • J
р
проходящих через
(хо, Уо), (*! > У1) t
ЧТО
lim I (р„) = g •
п---> со
2. Для каждой ломаной линии р, проходящей через точки
(х0, Уо), (xij У!)
выполнено неравенства
т.-е. g будет также точною нижнею границею величин /(р).
Ибо, если только допустить, что существует такая ломаная ли-
ния, для которой
1 (р) < g>
то можно было бы, согласно предыдущему, найти такую допусти-
мую функцию г/, интеграл для которой 1(у) отличался бы от /(/?)
меньше чем на g—I(р):
/(y) — I(p)<g~I(p),
что представляет очевидную нелепость, ибо g есть иижияя гра-
ница величии I(y)f тогда как из предыдущего неравенства следо-
вало бы
1 (у) < ё-
Допустим, что иам каким-либо путем удалось построить мини-
мизирующую последовательность ломаных линий:
Р\ > Р2 f • • • > Рп •
158
Вполне естественно ожидать, что и сами ломаные линии будут
стремиться к решению вариационной задачи, если такое существует.
Само собой разумеется, что в каждом случае сходимость последо-
вательности ломаных линий должна быть предметом специального
исследования, и кроме того должно быть проверено, что интеграл
от предельной функции будет точно равен g. Другими словами,
должна быть установлена возможность предельного перехода под
знаком интеграла:
g = lim / (pn) = I (lim рЛ).
п > п -—> со
Дело вновь заключается в том,
ния такого рода минимизирующих
чтобы указать процесс построе-
последовательностей
Pi t Р2 f • * • •
Ради упрощения обо-
значений во всем после-
дующем мы будем обозна-
чать координаты точки А
через а и at и точки В
через b и р.
Рассмотрим какую-либо
ломаную линию pni состо-
ящую из п звеньев и про-
ходящую через А и В, Она
вполне определится поло-
жением своих п—1 вершин
0^1 > yi) ... (х/, у^ ... (хп— 1, уп—1) (рис. 20).
Подставим вместо у в 1(у) ординату ломаной линии. В проме-
жутке от х до 1 ордината ломаной линии будет равна
Рис. 20
п — 1
(Р«) = У f F^X, yi-{-
i = 0 Х(
После всех вычислений мы / (рп) получим как функцию от
Х„ --1 , Уп — 1
*1. yi >
(р^) (xj, • • • Уя — 1)*
Выберем теперь оставшиеся неопределенными числа Xi, yi из
того требования, чтобы / (р^) было бы минимальным; получим не-
которую ломаную линию рп. Можно легко видеть, что последова-
тельность построенных таким образом ломаных линий будет мини-
мизирующей.
Но это, разумеется, не единственный и не самый простой вы-
бор pi , р2, • • • хотя может быть и наиболее быстро ведущий
159
к цели. Можно, например, абсциссы вершин ломаной линии рп считать
совпадающими с точками, делящими отрезок аЬ на п равных частей
Тогда нахождение самих ломаных линий сведется к нахождению
только величин yi. Найденные таким образом рп вновь образуют
минимизирующую последовательность.
Этот прием, необычайно наглядный и простой по геометриче-
ской своей сущности, имеет сравнительно с методом Ритца тот
несомненный недостаток, что не может дать удобного аналитиче-
ского аппарата приближенного представления искомой функции во
всем промежутке, но может быть всеже с успехом употребляем
при численном нахождении решения.
Ниже мы даем пример применения метода Эйлера.
§ 37. Применения к интегрированию уравнении.
Насколько большое значение имеет вариационное исчисление
для теоретической механики мы имели случай видеть при разборе
принципов Лагранжа, Якоби, Гамильтона.
Развитие многих иных физических наук показало, что границы
применимости вариационного исчисления значительно шире чем те,
на которых мы останавливались до настоящего времени.
Это обстоятельство становится, впрочем, совершенно ясным,
если обратить внимание на полную формальную аналогию, напри-
мер, между многими уравнениями теории электричества, теплоты
и т. д. и механики непрерывной среды.
Перейдем теперь к дальнейшим простым применениям вариацион-
ного исчисления к математической физике.
Дадим приложение вариационного исчисления
к интегрированию обыкновенных дифференциаль-
ных уравнений. Мы ограничиваемся здесь ради простоты
уравнениями второго порядка. Читатель, проследивший внимательно
изложенные здесь рассуждения, без труда убедится в том, что тот
же порядок идей может быть легко перенесен и на уравнения
высшего порядка.
Пусть будет предложено иайти решение дифференциального
уравнения
a(x)y"-\-b(x)y'-\-c(x)y + d(x) = O.........(1)
удовлетворяющее предельным условиям:
у(<*) = А, у(3) = в.
будем предполагать непрерывными в промежутке от а до 0 и а(х)
отличной от нуля.
Мы не внесем никаких ограничений в общность рассматривае-
160
мого вопроса, если будем предполагать интервал a, S приводящимся
к интервалу (О, Z) около начала координат.
Можно также считать, что предельные условия однородны и
имеют вид
^(O) = y(Z) = O.
Этого можно достигнуть, введя вместо у(х) новую функцию и(х),
определенную равенством
у = и + -у- в 4- А................(4)
Мы будем считать, что это преобразование было уже сделано^
так что у должно удовлетворять условиям:
Л/(0) = (0 —о......................(5)
Нам будет полезно ниже еще одно упрощение задачи. Мы пред-
лагаем читателю проверить, что предложенное уравнение эквива-
лентно следующему:
i(p ..........(6)
Благодаря сделанным относительно а(х) и Ь(х) предположе-
ниям, р (х) будет положительной и дифференцируемой функцией, от-
личной от нуля в промежутке
Непосредственно видно, что (6) есть уравнение Эйлера для
интеграла
i
f {p(x)y2 + <i(x)y2 + ^f(x)y]dX.........(7)
О
и задача интегрирования равносильна, таким образом, задаче о раз-
ыскании кривой, дающей экстремальное значение интегралу (7) и
удовлетворяющей предельным требованиям:
ZZ(°) = y(O = °...................(8)
Все наши последующие рассуждения будут относиться к случаю,
когда
q (х) 0.
Будем искать решение задачи по методу Ритца.
Рассмотрим последовательность линейно-независимых функций
> ^2 > • • • • , . • • •
Вариационное исчисление. — 11
161
непрерывных в интеграле (О, Z) вместе с первыми производными и
удовлетворяющих предельным условиям (8).
Составляем линейную комбинацию первых п функций и с не-
определенными коэфициента>1и
п
уп = 2 Ui
i= 1
и подставляем в /(у). После производства квадратур получим ре-
зультат вида:
/
I, / i — 1
где для краткости обозначено
Z (уп) /а*
ч
Коэффициенты а/** должны быть найдены из условия стационар-
ности /о:
РУпШ 4"Яум-\-fu$dx — Q . . . . (9i)
I О
I = 1, . . . П
ИЛИ
п
k = \
Определитель найденной системы уравнений есть вместе с тем
определитель квадратичной формы, входящей в выражение для Л и
происходящей от интегрирования
РУ*2 + ЧУп2.
Так как р{х) и q(x) не отрицательны, то эта квадратичная форма
будет определенной положительной. В самом деле, она может быть
равна нулю только тогда, когда уп — 0, т.-е. числа выбраны
так, что линейная комбинация функций щ равна нулю тожде-
ственно. Но это означало бы, что либо щ между собой линейны
зависимы, что противоречит сделанным о них предположениям, либо
щ 0.
Определитель формы будет поэтому отличен от нуля, и си-
стема (9), наверное, имеет одно и только одно решение.
Найдя из (9) числа составим по ним n-ое приближение
п
162
При п, стремящемся к сю, следует думать, что уп будет стремиться
к точному решению поставленной задачи.
Обычно во всех практически важных случаях последовательность
уп сходится весьма быстро, и изложенный прием дает прекрасное ору-
дие приближенного интегрирования дифференциальных уравнений.
§ 38. Доказательство сходимости процесса Ритца.
Для доказательства сходимости построенных по Ритцу прибли-
жений уп нам удобнее будет употреблять уравнения (9J, в не-
сколько иной эквивалентной форме. Умножим каждое из них на
произвольно взятое число ДИ”) и сложим их. Если обозначить
п
то в результате суммирования будем иметь:
i
J (РУп'Чп + /fln)c/x = 0......... (10)
о
для любых комбинаций наоборот, если (10) выполнено для вся-
ких линейных комбинаций т]п, то должны иметь место уравнения (91).
В самом деле, чтобы убедиться в этом, достаточно положить в
все А равными нулю за исключением одного который взять
равным 1. Тогда т]Л = щ и уравнение (10) переходит в z'-oe уравне-
ние системы (91). Оценим теперь разность
/п 4~ т /п •
Заметим прежде всего, что разность между приближениями уп±т
и уп есть линейная комбинация из первых п-]-т функций и. Мы
обозначим ее через
4- т — Уп т Уп ,
откуда
Уп — Уп^т
Г т *
163
Первый интеграл, стоящий в правой части есть ничто иное, как
второй интеграл отличается от (10) только индексом, и так
как равенство (10) должно быть выполнено для всяких п и т), то
он равен нулю. Мы будем иметь поэтому
о
• • (11)
Отсюда следует прежде всего, что последовательность чисел
1ч, Л , . . . 1п, . - . будет не возрастающей.
С другой стороны, легко установить ограниченность снизу этой
последовательности. В самом деле, если функция у допустима и
обращается в нуль на концах промежутка (0, Z), то
Это неравенство доказывает наше утверждение, так как правая
часть не зависит от выбора функции у.
Упомянутая выше последовательность /2, Z3 . . • . значений
интеграла / (у) будет, следовательно, сходящейся, и разность
In Iп-т
может быть сделана меньше любого наперед заданного
е>0
для всяких т и п, если только п будет больше некоторого доста-
точно большого числа.
о
при
164
Последнее немедленно позволяет установить сходимость
У19 У2 • • • •
В самом деле,
Уп + т Уп
t
Применим к правой части известное неравенство Шварца-Буня-
ковского:
Полученное неравенство устанавливает не только сходимость
У\ ? У?, • • • • > но даже равномерную сходимость их, нбо правая
часть не зависит от х, и предельная функция у(х) этой последо-
вательности будет поэтому непрерывной.
Мы обращаем здесь внимание читателя на то обстоятельство,
что в доказательстве сходимости процесса Ритца мы существенно
пользовались кроме естественных условий непрерывности функций и
и соблюдения граничных условий только лишь линейной незави-
симостью щ. Процесс остается сходящимся независимо от того
будет или не будет полной система
j ^2 , • • • •
Но если эта система не полна, то далеко еще не обязательно
должно быть
п----► оо
и тогда надежда, что предельный переход
lim#n=#(x)
п -> оо
приведет к решению вариационной задачи, — крайне низка; только
случайно задача может оказаться решенной.
Естественно поэтому доказательство того, что предельная
функция удовлетворит уравнению (6) Эйлера, потребует дополни-
165
тельно ограничительных предположений для системы функций ип
относительно их полноты.
Мы приведем доказательство этого предложения, принадлежа-
щее родоначальнику изучаемого метода, В. Ритцу.
Ограничения, которым <5н подвергает функции ип слишком тя-
желы, и, как мы покажем немного ниже, тот же результат будет
иметь место при гораздо меньших ограничениях.
Мы будем требовать (это и является недостатком хода рас-
суждений Ритца), чтобы всякая функция т)(х) класса С(2), удовле-
творяющая граничным, требованиям..
71(O)=t1(Z)=:t1'(O) = <(/) = О
могла быть получена предельным переходом из линейных комби-
наций функций ип при надлежащем выборе постоянных Ai
и чтобы были выполнены равномерно следующие предельные ра-
венствах
у lim т] = т), Iim lim т)/'— т]".
n > CO n > GO П ► CO
Эти требования, как известно из общей теории рядов, равно-
сильны тому, чтобы можно было любую функцию т) класса О2>
разложить в ряд по линейным комбинациям и„ так, чтобы возни-
кающий после двукратного почленного дифференцирования его ряд
был бы опять равномерно сходящимся.
Для выяснения идеи доказательства Ритца обратимся к основному
в этом вопросе уравнению (10), характеризующему выбор функций уп*
Предельный переход в этом равенстве, если бы он был возмо-
жен, дал бы нам уравнение, характеризующее предельную функцию
г/(х). Но если нами доказана равномерность выполнения равенства
П ----► СО
то из всех предшествующих рассуждений еще никак не следует не
только сходимость
/ / /
У? 9 j/з > • • • Уп • • • • ,
но даже просто факт дифференцируемости предельной функции у.
Естественно поэтому пытаться преобразовать перед предельным
переходом равенство (10) так, чтобы освободиться в нем от уп’*
i i
Р Уп f\n dx =
о 0
РУп dx
166
(10) принимает вид
Перейдем теперь к пределу при п—>оо так, чтобы тн стреми-
лась указанным выше способом к (х), где г\(х) любая функция
класса С®\ удовлетворяющая требованиям
^(0) = 7j(Z) = V(0) = V(Z) = 0.
В пределе, так как
limin' (Z) = О,
получим:
о
о
или так как:
о
о
о о
J (яу4х =
О
(ЯУ Г)dx dx = ।
О
< f j\qy+f)dxdxdx.
о о
J \.py — jpydx
О 0 0 0
<dr = 0 (12,6).
J
о
Для дальнейших рассуждений нам потребуется доказательство
следующей обобщенной леммы Дюбуа-Реймона:
Если F(x) непрерывная функция и
i
J F(x)ri"dx = 0
to
для всякой функции ^](х) класса С^\ удовлетворяющей предель-
ным условиям
л (о)=л (О=< (о) = *1'(О == о
*
167
mo F(x) линейна:
В самом деле, из-за требовании наложенных на т](х), для каж-
дой линейной функции Ах~]?В должно быть
(i4x4-5)^dx = 0.
Чтобы
частям
убедиться в этом, достаточно вычислить интеграл по
(Ах 4- В) dx = <(Дх4-5) — А
о о
rf dx = О,
о
Поэтому, одновременно с
J F<dx = 0
о
7*
должно быть выполнено также
. . . (13)
о
Выберем теперь А и В так, чтобы функция
о о
удовлетворяла тем же требованиям, что и т](х).
Что касается условий для левого конца интервала:
? (0) = ?' (0) = о
то они, очевидно, соблюдены. Остались еще требования
?(0 = ?40=о,
систему двух уравнений для определения А и В.
I х
о о
которые дают
о
о
о
о
dx = I Fdx.
о
о
о
168
Решение этой системы всегда возможно, так как определи-
тель ее
6
/2
отличен от нуля.
Если положить теперь
•П = ? (А
то равенство (13) обращается в
z
(F— Ах — В)2 dx — 0.
о
Откуда сейчас же следует:
F— Ах — В = 0.
Так как относительно (х), входящей в интеграл (12,Ь) спра-
ведливы все предположения, указанные в лемме, мы имеем право
утверждать, что выражение, стоящее в фигурных скобках под зна-
ком интеграла, должно быть линейной функцией от х'а
РУ = I p’ydx-}- / I (qy-rf)dxdx-i-Ax4- В.
Правая часть этого равенства имеет производную по х, и так как
р(х) дифференцируема и отлична от нуля, должна иметь производ-
ную по х и функция у(х).
Беря производную по х от обеих частей предыдущего равен-
ства, будем иметь:
ру’ + р'у—р'у
(qy+f)dx
или, после сокращения,
РУ — I (ЧУ 4" f) dx 4- А.
* ’
о
Правая часть полученного равенства вновь дифференцируема и
поэтому опять должна быть дифференцируемой и левая часть. Беря
вторично производную по х от обеих частей, придем к заключе-
нию, что найденная нами функция у(х) должна удовлетворять за-
данному дифференциальному уравнению
(ру'У — чу'=/•
169
Наконец, последний вопрос, подлежащий исследованию, это
вопрос о том, действительно ли найденная нами функция у (х) дает
функционалу f(y) наименьшее значение.
Всякая допустимая функция у (х) рассматриваемой задачи мо-
жет быть представлена в Миде
где 7) некоторая функция класса С б), обращающаяся в нуль на
концах интервала (О, I),
i
iQ)= f {/’0'+<)2+^0+’))2 + 2/0+^)}</х=
о
или, так как первый интеграл правой части есть йичто иное, как
1(у) и
I I
J { РУ'V + (Чу+/) 1} dx =
3 о
г
I
чру' + j { чу+/—(ру'У }
О
tj dx — 0,
ибо т) обращается в нуль на концах интервала и у удовлетворяет
уравнению
(руУ —Чу—/—О,
I
1(у) — 1(у)=^ — уУ +-9(у —I/)2 . .(14)
О
Из этого равенства следует, что интеграл /, вычисленный для
всякой допустимой кривой у, отличной от у, будет больше, чем
интеграл /, вычисленный для кривой у.
Изложенные рассуждения Ритца устанавливают два обстоя-
тельства:
1) существование решения поставленной вариационной за-
дачи и
2) возможность его нахождения как предела минимизирующей
последовательности Ритца, если функции иа удовлетворяют пере-
численным весьма тяжелым требованиям. Но после того, как уста-
новлено существование решения, сходимость процесса Ритца может
быть очень просто доказана при гораздо более общих предполо-
170
жениях о функциях ип; достаточным для сходимости процесса ока-
зывается простое условие полноты функции ип .
Пусть в самом деле у(х) есть решение задачи и уп(х)— п-ое
приближение к нему, построенное по Ритцу, Так как уп(х) допу-
стимая функция, то для нее должно иметь место равенство (14).
Оценим теперь разность
Уп — у:
+ 1(ув)-1(у) .... (15)
Но если система функций полна в принятом
йри бесконечно возрастающем п
нами смысле, то
с
с
и последовательность функций
Уз j Уз > • • • Уп, • . •
W
равномерно сходится поэтому к предельной функции у(х).
Сравнительная простота вычислений и быстрая сходимость про-
цесса, в чем мы будем иметь случай убедиться ниже, делают ме-
тод Ритца удобным орудием приближенного решения вариационных
задач. В последние годы он начинает приобретать все более ши-
рокое применение в инженерной практике. Интересным, поэтому,
является вопрос об оценке ошибки, которая допускается, когда
вместо точного решения задачи, принимается n-ое приближение
к нему.
Эта ошибка должна быть оценена, по возможности, тщательно,
чтобы результаты имели значение практического характера.
Только тогда мы сможем удовлетворительно ответить на во-
прос какое нужно взять приближение, чтобы ошибка результата
вычислений не превосходила бы наперед заданной величины.
В практических вычислениях, чтобы не делать проведение их
заведомо невыполнимым или черезчур трудным, принуждены
ограничиваться, обычно, небольшими п (в громадном большинстве
случаев берут п = 1, 2, 3, 4, 5), и тогда даже небольшое преуве-
личение коэффициентон, входящих в оценку ошибки, сейчас же ска-
жется на оценке нумера приближения и, которое необходимо взять
при заданной точности вычислений.
Как мы уже говорили выше, быстрота сходимости будет, вообще,
зависеть от удачного или неудачного выбора системы функций ип.
171
Упомянутые оценки, для широких классов таких функций, едва
ли будут иметь практическое значение, ибо они должны пред-
усмотреть и случаи самого неудачного выбора мп. Если же мы вы-
брали их не совсем несчастливо, то можно быть заранее уверен-
ным в том, что то значение нумера приближения, которое мы
должны бы были взять согласно этих оценок для получения же-
лаемой точности, наверное, будет сильно преувеличено.
Большую практическую цену имеют оценки для сравнительно
узких классов задач и конкретных способов выбора функций ип.
Но даже и здесь результат, даваемый оценкой, повидимому, нужно
рассматривать как ориентировочный, и вычислитель предпочтет,
вероятно, несколько уменьшить полученное из оценки значение п
и работать с меньшим числом неизвестных, проделав после попра-
вочные вычисленияДчем сразу же проводить вычисления для боль-
ших и, так как трудность их возрастает, обыкновенно, гораздо
быстрее чем растет п.
Ниже мы приведем несколько таких оценок.
Вернемся сейчас на некоторое время к нашей общей задаче.
Вопрос, который нас интересует в настоящее время, мы сфор-
мулируем следующим образом:
Известно, что решение дифференциального уравнения (6) при
предельных условиях
^(0) = ^(/) = 0
существует. Для некоторой системы
Щ > ^2 г • • •
построено п-ое приближение к нему уп по Ритцу* Нужно оценить
разность
У”—У-
Для того порядка идей, которого мы придерживались в нашем
изложении, естественно пытаться оценить
у* — у\
и
посредством величины, характеризующей оценку разности,
Л#”)—
другими словами говоря, быстроту сходимости в смысле функций
оценивать быстротой приближения по функционалу; соответству-
ющая формула была нами получена раньше
/ /(Уп)—Ц у) •
Это неравенство можно бы было принять за исходную точку
оценки погрешности. Но, к сожалению, такой путь, хотя и наибо-
лее естественный, имеет почти неопреодолимые затруднения, ибо
найти величину, более или менее точно оценивающую правую
часть, представляется крайне трудным.
Мы покажем только, на одном примере, как пользуясь (15)
можно, правда, довольно грубо, оценить порядок малости ошибки.
172
Пусть
ип — sin
Попрежнему будем обозначать уп приближение, построенное по
Ритцу, а через Yn назовем сумму первых п членов разложения
в ряде Фурье решения по
. пг.х
где .
Так как дает минимум 1(у) относительно всех линейных
комбинаций с тем же п, то должно быть
I
Yn есть первые п членов разложения уг по
ппх
COS —г- .
что сразу выясняется в силу предельных условий, так как
i
Yn')2 dx.
4
173
Из теории тригонометрических рядов известно, что
о
будет величиной порядка
и неравенство (15) приводит к следующей оценке порядка малости
ошибки:
Определять, как зависит В от q, /, мы не будем, ибо в на-
стоящее время известно более точное выражение для погрешно-
стей, чем найденное здесь.
Как пример более точной оценки верхней границы погрешности,
мы приведем здесь результаты исследований акад. Н. М. Крылова !),
основанных на совершенно иных соображениях чем те, которыми
мы пользовались выше.
Дело идет о приближенном решении уравнения
У' —
• (16)
Как и раньше
Н. М. Крылов пытается сравнивать ошибку, даваемую методом
Ритца, с ошибкой, даваемой отрезком ряда Фурье разложения
искомого решения по sinus'aM кратных дуг. Если уп и Yn имеют
прежние значения, то результат, к которому он приходит, записы-
вается в следующей форме:
Эта формула позволяет оценить погрешность n-го приближения
в смысле Ритца, если известна ошибка
У— Уп
отрезка п членов ряда Фурье, превосходящая величина для кото-
рой может быть найдена на основании классической теории рядов
Фурье.
9 Крылов, Н. М. „Les methodes de solution approchee des problemes de la
hysique mathematique* в Memorial de sciences mathematiques. Fas. XLIX, 1931.
174
Среди оценок такого рода мы укажем
только следующую:
/
о
• • (18)
Если q (х) обладает дополнительно интегрируемой со своим
квадратом второй производной, то неравенство (17) может быть
заменено следующим:
• (19)
доказывающим интересное обстоятельство эквивалентности ошибки
приближения по Ритцу и ошибки приближения по Фурье;
Пт
п -> ОО
max | д — дп |
max 1 у — Y„ I
1 П *
. . . . . (20)
§ 39. Приложение метода Ритца к приближенному вычислению
характеристических чисел и фундаментальных функций.
Рассмотрим дифференциальное уравнение, часто встречающееся
в исследовании вопросов теплопроводности, упругих, электрических
и других колебаний н других вопросах физики.
—?(*)]«/= о, ..... (21)
где р, р, q, суть непрерывные в интервале от 0 до Z функции,
р(х) отлична от нуля и имеет там непрерывную производную пер-
вого порядка.
Будем искать интеграл уравнения (10), удовлетворяющий пре-
дельным условиям.
У (0) - у(1) = о...............(22)
и не обращающийся тождественно в нуль.
Задача эта (как известно), может быть решена только для
некоторых значений параметра X, называемых характеристическими
числами уравнения (10). Соответствующие им решения уравнения
получили название фундаментальных функций.
Поставленная проблема эквивалентна следующей задаче вариа-
ционного исчисления: среди функций класса С1 в промежутке
(0, I) удовлетворяющих предельным условиям (11) и не равных
тождественно нулю> найти ту, которая дает стационарное зна-
чение интегралу:
Пу) = / [р(*)/2 + (<7(*)-М*))1/2]^ . . . (23)
о
175
Действительно, уравнение Эйлера для интеграла (12) совпадает
с (10).
То же уравнение (10) можно рассматривать, как уравнение Эйлера
для интеграла
f (pul2 + ЯУ2) dx
, о
при связи
I
J ?y2dx = l,
о
т.-е. как задачу изопериметрического характера. К такой поста-
новке вопроса мы возвратимся ниже.
Существование решения мы принимаем без доказательства.
Будем искать характеристические числа и фундаментальные
функции по методу Ритца. Так же как и в предыдущем параграфе,
берем систему функций и/, удовлетворяющую перечисленным там
требованиям, составляем линейную комбинацию из конечного числа
этих функций
п
И/,
•»
подставляем ее в интеграл и записываем условия стационарности
его поведения. Получим систему п линейных однородных уравне-
ний с п неизвестными
коэффициенты которой будут линейными функциями параметра X.
Эта система может иметь решение отличное от нуля тогда и
только тогда, если ее определитель равен нулю.
Это требование, вообще говоря, даст уравнение степени п от-
носительно X. Корни его
т, (*) ) (л)
Л1 j л2 > •
1
могут быть приняты за приближенные значения первых п характе-
ристических чисел задачи. Для каждого из них Хт^
найдена своя система чисел а?
_ (п)
щая функция ут
может быть
и по ней построена соответствую-
(х), которая приближенно может быть взята за
фундаментальную функцию ут.
При п—>оо можно ожидать, что найденные нами таким путем
приближенные выражения для характеристических чисел и фунда-
ментальных функций стремятся к точным значениям их.
Доказательства сходимости этого процесса слишком сложны, и
приводить их здесь мы не будем.
В виде примера мы приведем некоторые результаты из упоми-
навшихся уже мемуаров акад. Н. М. Крылова.
176
Дело идет о нахождении характеристических
ментальных функций для уравнения
чисел и фунда-
при условиях
Вот,
оценок.
Если
наиболее
простые из большого числ$
полученных им
положить,
например,
ип — у/2 sin тгкх,
2XjL max р2
т *
3
У'(т 1Пах Р
Л, • \ / max Р
= (тахр—гтпр)|/ —:—
' г ' V тт р
В — 2 тахр.
И для П'Ого приближения у'т к т-ой фундаментальной функции
ут (мы ограничиваемся формулой, характеризующей только бы-
строту сходимости):
т
л
где М некоторое число, зависящее от т.
В практических вычислениях столь же часто, как и тригономе-
трическими функциями, если даже не чаще, пользуются многочле-
нами, так как вычисления с ними во многих случаях бывают проще.
Мы считали полезным, поэтому, привести несколько формул, отно-
сящихся к этому случаю !).
Так, например, пусть дело идет о решении уравнения:
и” -4- кр (х) и — 0 р(х)>0
при
Примем:
п — 1
j) Крылов, Н. М.: »Sur la solution approchee des problemes...“ Известия
Академии Наук, 1929, № 5.
Вариационное исчисление. — 12
177
Множитель (1 — х2) выделен, чтобы удовлетворить граничным
требованиям.
Здесь имеют место следующие неравенства:
Формула эта справедлива при простой непрерывности р (х).
Если же р(х) имеет кроме того непрерывные производные пер-
вого или второго порядков, то соответственно будет:
'т
где
М = < max
max p5l
min p J
I — X
где
max V р |
Nf — । max
min V p
maxp2
§ 40. Примеры применения прямых методов.
Приводимая ниже задача заимствована из мемуара Ритца „Но-
вый метод решения вариационных задач математической физики"
(Journal fur reine und angew. Mathem. Bd. 135, 1909).
Изучение колебаний однородной струны по методу Фурье, как
известно, приводит к интегрированию дифференциального уравне-
ния второго порядка вида:
Допустим, что наша струна имеет длину 2 и закреплена в точ-
ках — 1 и —1.
1,( —1) = 1/(1) = 0.
Общее решение уравнений есть
у — A sin (кх 4“ ?)•
Из предельных условий непосредственно видно, что основной
тон струны дается решением
тех
У = COS у ,
178
первый обертон:
# = sinrcx, k = гс;
второй обертон:
у — cos у, к — и т. д.
Ищем приближенно четные решения (четные тоны струны),
в форме многочлена, расположенного по четным степеням х. Об-
щий вид такого многочлена, удовлетворяющего предельным усло-
виям, будет:
^Л(х) = (1— х2) (оо + Gix2 4“ ^х4 4- . . . 4-аЛх2я).
Ограничимся сначала лишь двумя членами
yi = (1—х2) (ao4~aix3)
' yi = 2 (ai — а©) х — 4Я1Х3.
/* О//2 — ^i2) dx =
—1
F
= [(105 — 42 Оо2 4- (42 —12 к*) айах + (33 — 2 к*) а?].
О X J
Система (9), после некоторых сокращений, принимает вид:
(35 —14 к2) аь + (7—2 к2) а. = О
(21 — 6 &2) ао4- (33 — 2£2) ai = 0.
Приравняв нулю определитель, имеем уравнение для определе-
ния к2,
к± — 28А24-63 = 0,
корни которого будут
£12 = 2,46744; £22 = 25,6.
Из точных же решений получается
Ы = ^ = 2,467401100; к^~ ^ = 22,207.
Отсюда видно, что уже при первом приближении характеристи-
ческое число, соответствующее основному тону струны, определено
с ошибкой меньшей 0,00004 и второй обертон с точностью до 15%.
При втором приближении
у2 = (1 — х2) (а0 4“ а1*2 4" а2х4)
для определения к будет иметь место уравнение:
4 — 450 -|-8910 А2 —19305 = 0 ,
из которого находим:
Ы = 2,467401108; к2* = 22,301.
12»
179
Ошибка второго приближения характеристического числа основ-
ного тона не превосходит 0,000000008 и для второго обертона
ошибка меньше 42%.
Далее, подставим второе приближенное значение для в урав-
нения для определения '
а0, аг и а2.
Из полученной системы коэффициенты
а1)> Я] ? ^2 ,
найдутся с точностью до множителя. Если затем найти этот не-
определенный множитель из условия нормированности
которому удовлетворяет точное решение
у — COS
то
у 2 (х) = (1 — X2) (1 — 0,233430 X2 + 0,018962 х<).
При
х = —1 и x=-j-l
первая фундаментальная функция и ее второе приближение У2(х)
совпадают по самому построению. Насколько мало отличается
COS у от У2
дующая таблица, в которой приведены мантиссы логарифмов этих
функций.
(х) во всем промежутке (— 1, 4-1), показывает сле-
0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9
logcos
994620
994 621
978206
978212
949 881'907 958 849485
949 889 907 952849493
769219 657047 489 982
769 221 657 0431489 978
194 332
194 345
Различие в мантиссах в одном лишь только месте превышает
единицу пятого знака.
Наконец, такие же вычисления для второго приближения к фун-
даментальной функции
Зп
COS -о
соответствующей второму обертону дают:
у. (,г) = (1 — х2) ( — 1 + 9,3335 х» — 6,219.x4).
*
180
Узлы этого обертона, найденные теоретически по
Зя*
cos
располагаются в точках
Значения же х для узлов, найденные на основании доС?)» будут
х=±1, х = ± 0,3408.
Ошибка меньше 2%.
Покажем теперь на примере применение метода Эйлера прибли-
женного решения задач. Рассмотрим ту же струну, что и в при-
мере Ритца, и будем искать приближенно первую нечетную фунда-
ментальную функцию sin ~х и ее характеристическое число
Разделим, например, весь промежуток от —1 до 1 на 10 рав-
ных частей. Длина каждой из них Л = 0,2.
Из-за симметрии у (х) относительно точки 0, 1(у) вычисленный
для всего промежутка (— 1, -{-1) будет равен удвоенному инте-
гралу, вычисленному для интервала (0,1).
1
1 (у) — J (у'2 — к2у2) dx = 2 f (у'2 — k2y2) dx.
—1 о
Во всех наших рассуждениях поэтому достаточно находить вер-
шины ломаной линии лишь для 5 точек — 0; 0,2; 0,4; 0,6; 0,8 при
этом мы, очевидно, должны считать j/0 = 0, так как ломаная ли-
ния должна проходить через начало координат, и дело определения
ломаной сводится к разысканию лишь
У1 , У 2 , Уз , #4 .
Для нашей ломаной
1
о
Что касается второго интеграла
1
о
то мы его весьма просто получим приближенно, применяв правило
прямоугольников:
1
о
I
181
Итак ,
4
. i (р)=2 2 ~kiy?
i =0
где при суммировании мы должны считать
Уо = У5=0-
Уравнения
<?/(?)_ А
“°’
из которых должны быть определены все у/, после "очень неслож-
ных преобразований приводятся к виду:
mi/i —у2 = 0
' — У1 + ту2 —1/3 = 0
— У2 + тУз — yi — 0
— i/з 4~ nu/4 = 0,
где
т — 2 — h2k? = 2 — 0,04 к?.
Будем решать эту систему последовательно:
1/2 = туг.
Уз = — yi + туг — — i/i 4~ тгУ1 = (т2 — 1) yt.
yi ~—У1 + тУз = ~ myi-\-m(m2 — l)yl = (m3 — 2m)y1.
Наконец, подставляя полученные значения в последнее из урав-
нений, будем иметь:
— у3-\-ту4 = — (m2~l)y1-\-m(m3 — 2m)(yi =
= (тп4 — 3 m2 4-1) г/i,
откуда следует, что т должно быть корнем уравнения
гп4— 3 m2 4“ 1—0.
Заметим, что наименьшему значению к2 соответствует наиболь-
шее значение т и, следовательно, при решении этого биквадрат-
ного уравнения достаточно определить только самый большой из
его корней. Результат вычислений показывает, что с точностью
до 4-х десятичных знаков
ш = 2 —0,04 £2 = 1,6181,
откуда
£2 = 9,55.
Точное же значение для к2 есть
^2 = K2 = 9j87
182
и ошибка грубо вычисленного нами приближения не превосходит
3,3Точность достаточная для многих практических приложений.
Для нахождения всех yi осталось еще найти пока неопределен-
ный yi . Мы определим его из условия нормированностн
/ y*dx = l,
> в/
—I
которому удовлетворяет sin ях. Вычисления не представляют затруд-
нений, если для нахождения интеграла опять воспользоваться сим-
метрией и правилом прямоугольников.
Результаты указаны в приводимой ниже таблице в строке „р*.
Из нее видно, что ошибка, даваемая нашим приближением при
значениях х, приведенных в таблице, сказывается только в 5 деся-
тичном знаке.
0,2 0,4 0,6 0,8
sin тс* . Р • • • 0,58779 0,58778 0,95106 0,95105 0,95106 0,95105 0,58779 0,58778
§ 41. Экстремальные свойства характеристических чисел и
фундаментальных функций. Теорема Куранта.
Возвратимся вновь к интегрированию уравнения
4 +№ ы - я =°..................<24>
Прн предельных условиях
у(0)=у(1) = 0.
Функции
Р (*)> Q (*)> Р (х), р' (х),
непрерывны в промежутке
Мы будем, кроме того, считать р(х) и р(х) всюду положитель-
ными; это будет иметь место в громадном большинстве физиче-
ских задач.
Попытаемся дать определение характеристических чисел и со-
ответствующих им фундаментальных функций, исходя исключи-
тельно из их минимальных свойств.
Рассмотрим для этой цели интеграл
i
<х) У'2 + Я (*) У2] dx.......(25)
О
х
183
4
Условимся считать допустимыми все функции, принадлежащие
классу С(1\ и обращающиеся в нуль при
х — 0 и х — /.
Поставим перед собой задачу разыскания среди допустимых
функций той, которая дает наименьшее значение интегралу (25)
при условии
р у2 dx ~ 1
(26)
Легко установить ограниченность снизу рассматриваемого инте-
грала для взятой нами совокупности функций. В самом деле:
max ( q |
min р
max ' q |
min р
и, следовательно,
I(y)^ f py'-dx
t'
о
max q
min p
max | q
min p
Вопрос: существует ли такая допустимая функция, удовлетворя-
ющая условию (26), для которой точная нижняя граница значения
интеграла (25) достигается — подлежит, вообще говоря, дополни-
тельному исследованию. Мы примем здесь без доказательства ее
существование и отсылаем читателя, желающего ближе ознако-
миться с этим вопросом к уже цитированному мемуару Р< Куранта.
Для ее разыскания, мы, согласно правилу множителей Лагранжа,
составим комбинацию
F* — РУ1 + Qy" — 'ру2.......................(27)
и запишем для нее "уравнение Эйлера.
F*' — 2 ру'; F*' — 2 (<? — Хр) г,
^F*' ~F^2[(py')' -V^-q)y] = 0 . . . .(28)
Полученное дифференциальное уравнение совпадает, с точностью
до несущественного множителя 2,с (24), и функция, решающая ва-
риационную задачу, будет поэтому фундаментальной функцией
уравнения (24).
Определенную таким путем первую фундаментальную функцию
мы будем ниже обозначать через у^ (х) и соответствующее ей зна-
чение множителя Лагранжа X через Kj. Чтобы выяснить значе-
ние Xj, умножим уравнение
(рууУ+01 р — ?) yi—°
(29)
184
которому удовлетворяет yi(x) на yi и проинтегрируем в пределах
от 0 до L Преобразуем слагаемое
i
I (ру/УуЫ*,
получающееся в левой
части, интегрированием по частям:
(РУ1УУ1 dx —
РУ1 У1
О
I
J pyx'-dx= —
О
f pyi'2dx.
О
Подстановка дает нуль, так как у^ обращается в нуль на кон-
цах интервала интегрирования.
Мы будем иметь поэтому:
1 1
— f (pyi 2 + Qyi2)dxA-^ f pyddx — 0. . . .(30)
У . о
э *
Откуда следует
i ’
. : У* + <№?) <**
Ь=--------t---------. . . . (31а)
О
или, в виду нормирование) сти (26) фундаментальной функции у\ (х),
i
Ь = f (pyi'2JrQyi2)dx,..................(32)
О
т.-е. характеристическое число Х2 есть наименьшее значение
интеграла (25) при условии (26) относительно всего класса допу-
стимых функций.
Вторую фундаментальную функцию и соответствующее ей ха-
рактеристическое число мы определим аналогичным способом.
Среди допустимых функций будем искать ту, которая дает
наименьшее значение интегралу (25) при условиях
о
/ Pyyidx = 0
о
(33)
Опять, предполагая существование решения, составляем комби-
нацию Лагранжа для нашей новой задачи:
F* = РУ2 + ЧУ2 — 'РУ' — V-pyyi •
. . . (34)
Уравнение Эйлера для нее имеет вид
(РУ'У ~Г (' 9 ~ <1) У
. . . (35)
9У1 = 0 . .
/
185
и отличается от (24) дополнительным слагаемым1 /2 H-PZ/i • Но мы по-
кажем сейчас, что постоянная р- должна равняться нулю. Присоеди-
ним для этой цели к (35) уравнению для у\*.
(pyi'Y^ (ziP — я) yi = о
умножим первое из них на у19 второе на у, вычтем второй резуль-
тат из первого и проинтегрируем полученное выражение от 0 до L
Слагаемые вида Яуу\ сократятся при вычитании. Интегралы
i
J 9УУ\йх
О
обратятся в нуль, благодаря условию ортогональности (33) и, на-
конец, так как
i
f
о
получим:
i
f { (py’Y У1 — (РУ 1'У У }dx + = 0.
о
Но легко видеть, что интеграл стоящий в левой части, равен
нулю; в самом деле
о
— (pyi'Yy М* = [ру'у—pyi'yi
о
Z
f { РУ1 у' — ру У1' j dx = o,
к
ибо на концах интервала и у± и у равны нулю.
Предшествующее равенство поэтому дает р- = 0, и уравнение (35)
совпадет с (24).
Функция, решающая нашу новую вариационную задачу, будет
вновь фундаментальной функцией уравнения (24).
Мы будем обозначать ее через у2 (х) и значение параметра X
для нее — через
Применение такого же способа, что и при определении сей-
час же позволяет получить ^2
Z
+ W22) р
х2 = ------t-------= / (руг2-\-ЯУл)йх, . . . (31Z>)
J РУ22^
о
т.-е. Л2 есть наименьшее значение интеграла (25) при условиях (33)
и граничных требованиях
Z/(O)=Z/(Z) = O.
186
Заметим прежде всего, что из условия (33) ортогональности у^
и уъ следует их линейная независимость. Действительно, допустим
противное: пусть
У2 = Cy!l
очевидно,
СФ О, . ‘
ибо иначе была бы нарушена первая из связей (33). Но если
так, то
i i
f ?У1У2<?х = С. J ,
о о
что противоречит второму из равенства (33).
Далее, из того обстоятельства, что условия (33) при определе-
нии второй фундаментальной функции у2 выделяют более узкий
класс допустимых функций, чем одно условие (26), сразу же следует
^2 = ^1
ибо оба числа, и Х2 и Хь равны наименьшим значениям инте-
грала (25) для соответствующих классов функций.
Для доказательства невозможности равенства между Xj и Х2 до-
пустим противное; пусть
Xi —— Хо.
Тогда одному значению X соответствовало бы два линейно неза-
висимых интеграла уравнения (24), обращающихся в нуль при х = 0.
Всякий иной интеграл у того же уравнения должен получаться»
согласно общей теории линейных уравнений, как линейная комби-
нация этих двух линейно-независимых интегралов:
У — С\У1 ф С^У2 •
Но из
следует
Ух (°) = Уг (°) = 0
У (0) = 0,
что представляет очевидную нелепость, ибо начальное значение
интегралу, по теореме о существовании, можно задавать про-
извольно.
Итак,
Х2 > Xj и т. д.
Пусть, следуя этому способу мы определим п — 1 фундамен-
тальную функцию
Ух, ................... , :
ь
и п — 1 характеристическое число
Xi <с Х2 <с • • • • Хд—1
187
п-ую фундаментальную функцию мы определим как допусти-
мую функцию, дающую наименьшее значение интегралу (25) при
условиях:
i i •
J* Р (*) У2 dx — 1 и J* ?(x)yytdx~G 7=1, .и— 1 . (36)
о о
Приемами, совершенно такими же, какие мы употребляли при
изучении второй фундаментальной функции у^ можно показать,
что искомая функция у удовлетворяет уравнению (24),
i
J (ру„'* + qyn3)dx Л
5---Z---------— / (руп2 + Qyn2)dx . . . (33с)
f <?(х)Уп4х о
о
и
^п —1 •
Идя таким путем, мы получим бесконечную последовательность
фундаментальных функций.
Но, может быть, еще не совершенно очевидным является то об-
стоятельство, что мы получим все фундаментальные функции.
Убедиться в этом не представляет, однако, труда.
Мы предлагаем читателю допустить противное: существует такая
фундаментальная функция, которая не принадлежит совокупности
построенных нами функций у.^ и показать, что это предположение
немедленно приводит к противоречию. Для проведения рассужде-
ний достаточно знания просто доказываемой теоремы о том, что
любые две фундаментальные функции уравнения (1) ортогональны
между собой в смысле равенства
z
/ P(x)yiyjdx—0.
е/
О
Изложенные рассуждения позволяют определять фундаменталь-
ные функции постепенно, так что для нахождения n-ой фундамен-
тальной функции нужно знание всех предшествующих.
Можно дать такое вариационное определение n-го характери-
стического числа и n-ой фундаментальной функции, которое не
требует знания фундаментальных функций с меньшими нумерами.
Возьмем произвольную систему каких угодно п—1 функций
9 • • • J &П—1
класса и поставим перед собой задачу найти среди допустимых
функций ту, которая давала бы наименьшее значение интегралу (25)
при связях
i i
J ?(х)у2 dx — 1; J* 9{х) yzidx = 0 i = 1, . . . , n — 1 . (37)
о ы
188
Искомое наименьшее значение т интеграла будет зависеть от
выбора функций Zt
Докажем следующую теорему Куранта:
Какова бы ни была система функций
Zi --ij • , 72 1)
соответствующее ей число
m^Zx • • . %п—1)
не превосходит .
п-ое характеристическое число есть точная верхняя гра-
ница всех возможных чисел
т (-2^1 .... Zfi—;
она достигается для
?1=Уъ z2=y2, . . . Zn~i=yn-i и у = уп.
Формулированное нами экстремальное свойство характеристи-
ческих чисел и фундаментальных функций может быть положено
в основание их определения.
Доказательство последней части теоремы не представляет за-
труднений. В самом деле, если
Zi = yi (z —1, . . . п — 1),
то равенства (37) совпадают с условиями (36), принятыми нами
при определении n-ой фундаментальной функции и n-го характери-
стического числа. В виду этого
У — Уп
и
777 (<2^i , • • . , Zn~\} — .
Для доказательства теоремы осталось еще показать, что при
всяком ином выборе 27 число т будет не больше, нежели X/.
Пусть система функций Zt какая угодно. Если бы мы смогли ука-
зать функцию т/, удовлетворяющую требованиям (20) и такую, что
соответствующее ей значение интеграла (25) было бы не больше
то наименьшая величина т интеграла и подавно была бы и
формулированная нами теорема была бы доказана вполне.
Будем искать такую функцию в форме
у = С\у1 + С2у2 + • • • -\-СпУп,
где ух . . . уп фундаментальные функции и Cj . . . Сл неопреде-
ленные коэффициенты, выбором которых мы так распорядимся,
чтобы удовлетворить условиям (36). В виду ортогональности и нор-
мированности фундаментальных функций, первое из них дает
Сх2 + С22 + . . . + Сп2 = 1..........(38)
189
Оставшиеся п — 1 условия дадут систему п — 1 однородных
уравнений с п неизвестными
С\ , хСз > • • • Сп •
Такая система, как известно, имеет, по крайней мере, одно реше-
ние, отличное от нулевого и содержащее произвольный множитель.
Остается подобрать этот неопределенный множитель так, чтобы
удовлетворить равенству (38). Возможность этого очевидна. Внесем
найденное нами выражение функции у в интеграл (25). После рас-
крытия скобок, получим члены с квадратами и их производных
и члены с произведениями различных yi и их производных. Дока-
жем, что члены второго ряда исчезнут»
Рассмотрим
I 1р(х)уь yi-\-q(x)ykyi]dx— I p(x)yk'yi~
о 5
i i
~f yi~^^P^yk'^dx^ f q(x)ykyidx.
о 0
Внеинтегральное слагаемое пропадает, ибо yi
вала обращается в нуль, и остается
на концах
интер-
z
f yi{q(x)yk—±
о
I
[р (х) у*] I dx = X* / Р (x)yk yi dx = 0.
J •/
0
Если же рассматривать члены с квадратами yi и их произ-
водных, т.-е., когда то
f p(x)ykykdx 8= С р(х)yk2 dx == 1
о о
и последний интеграл дает значение ХА.
Мы будем иметь, поэтому, следующее равенство:
/(х) С?Xj + С22х2 + . . . Спг X„g(Ci2 4- С22 + . . .
что и требовалось доказать.
§ 42, Приложение к оценке роста характеристических чисел.
В этом параграфе мы будем предполагать функцию q (х) не от-
рицательной; р(х) и р(х) удовлетворяют прежним требованиям.
Заменим в уравнении (24) р (х), q (х) новыми функциями р\ (х)
Qi (х) не меньшими их во всем промежутке (0, /):
Функцию р(х) оставим прежней. Обозначим характеристические
числа измененного уравнения через Хя' и докажем неравенство
190
Воспользуемся для этого только что доказанным свойством ха-
рактеристических чисел. Условия (36) при нашей замене остаются
неизменяющимися, и класс допустимых к конкурренции функций для
исходного уравнения будет таким же, как и для измененного. Но инте-
грал (25) при замене р (х) из (х) и q (х) на q^ (х) во всяком случае
не уменьшается. Не будут, поэтому уменьшаться его наименьшие
значения и наибольшее значение всех наименьших значений, т.-е.
числа Это и доказывает наше утверждение.
Оставим теперь неизменными функции р (х) и q (х). Заменим р(х)
на Pi (х), причем
р1(*)^р(*) о<;х<7.
В этом случае нельзя уже говорить о сохранении класса кон-
куррирующих функций, ибо если у удовлетворяет первому из усло-
вий (36), то после подстановки вместо р (х) функции pi (х) будем
иметь
I
f Pl (x)y2dx^l.
Легко, однако, из функции у получить допустимую функцию но-
вой задачи. Для этого достаточно подобрать число в, удовлетво-
ряющее условию
О < 0 < 1,
так, чтобы
J* Pi (*) & У dx = 1.
о
Докажем, что функция 0 у удовлетворяет и остальным усло-
виям (36), правда, для иных функций Zi. Действительно, так как 0
не зависит от х, то
i
р (х) 0 yZi dx = О
о
или
rfx = 0
о
1
но это и есть условия (36) для видоизмененного уравненнж, только
вместо функций Zt здесь взяты функции
Pl w ’
*
Каждой системе функций Zi будет соответствовать система функ-
ций Zi, Доказательство обратных предложений проводится таким
же образом.
Каждому минимуму исходной задачи, достигаемому функцией у
191
будет соответствовать некоторый минимум новой задачи, дости-
гаемый функцией 0#, и наоборот.
Но от введения числа 0 значения интеграла (25), наверное, не
увеличатся; не увеличится, следовательно, каждый из минимумов и
максимум всех этих минимумов, т.-е. характеристическое число Ki
также не увеличится.
Итак, при увеличении р (х) и q (х) в промежутке от 0 до I
характеристические числа могут только увеличиваться, а при
увеличении р (х) — только уменьшаться.
будут наибольшие и наименьшие значения соответственно для
функций
Заменим в заданном уравнении р(х), q (х) на Q, Р и р(х) на г.
Полученное новое уравнение с постоянными коэфициентами:
будем иметь характеристические числа во всяком случае не
меньшие, чем заданное.
Они легко могут быть найдены. В самом деле, общий интеграл
уравнения есть:
_ / Хг—Q t z-v . _ / Хг— Q
у— Cl COS 1/ р X С-2 Sin 1/ Из у (0) = 0 следует Сг — 0 из у (Z) = 0, быть равным нулю, ,/Хг— Q . У Р Z=nK, откуда n^P+Q in' = . Г Следовательно, n^P+Q 4—• Совершенно так же, заменяя р(х), q(x), р(х) соответственно через р, q, R, докажем, что ' п2/ГР + <7 Xn R • так как С2 не может и J ч S ь S * 4
192
Мы имеем, таким образом, следующую оценку
Из последнего неравенства следует, что есть величина по-
рядка п2 и ряд
оэ
сходится.
Пользуясь найденной оценкой для , легко получить более
точную, если предварительно преобразовать уравнение (24). Пред-
положим, что р(х) и р(х) имеют непрерывные производные второго
порядка и преобразуем уравнение (24) подстановкой
ч
и = [>(*)р(*)]4 у t=
О
Интервал (О, Z) переменной х преобразуется в интервал 0, х
переменной Z, где
’=//таdx-
ч
а
Уравнение для и будет:
и"4-[Х —5(0]и = 0
s(x)— непрерывная функция.
Так как из
у (0) = у (Z) = 0 следует и (0) — и (т) — 0
и наоборот, то каждой фундаментальной функции исходного урав-
нения будет соответствовать фундаментальная функция нового
уравнения, и, наоборот, характеристическое число старого уравне-
ния будет им и для нового.
Но так как, вообще, нельзя быть уверенным в положительности
функции S(x), мы не можем применять полученных оценочных
формул к уравнению для и.
Мы, однако, легко избегнем этого затруднения следующим
простым способом.
Характеристическое число есть максимум минимумов ин-
теграла
*
J* [и'2 4“ s (/) и2] dt
° ♦
среди которых при некоторых условиях, входит Н<егда
*
*
J и2 dt — 1,
о
Вариационное исчисление. — 13
193
Выбросим из нашего интеграла слагаемое
J* su1 2 dt
о
и будем решать соответствующую задачу для
о
при тех же самых условиях, что, как очевидно, равносильно за-
даче об отыскании характеристических чисел для уравнения
— ри ~ О
При отбрасывании упомянутого слагаемого рассматриваемое
нами интегральное выражение изменится на величину, ограничен-
ную для всех н, ибо
= max
s j • J и- dt — max I s
о
может отличаться от не больше чем на max I s
и поэтому
lim — = 1.
U-
п----> ОО ' п
Если теперь заметить, что
и возвратиться к старым обозначениям, будем иметь:
ополнения и задачи»
1, Кручение бруса. Пусть призматический невесомый брус
закреплен неподвижно в точке О и скручивается касательными
усилиями, распределенными по нижнему концевому сечению и при-
водящимся к паре сил.
В теории упругости доказывается, что можно в этом случае
считать, если взять обычные обозначения компонентов тензора на-
пряжения:
194
Остальные компоненты должны удовлетворять уравнениям
(а)
Д Yz = 0 ДХ = 0..................................(Ь)
Zx cos (xv) + Zy cos (t/v) = 0
• • (c)
на боковой поверхности бруса; v — нормаль к поверхности.
Уравнение (а) будет удовлетворено, если положить
7 ___7 ___________
Лх~ду дх
Вставляя в (Ь) вместо
К* — Z»
w У
F
X2 = Zx
*
их значения, будем иметь:
~ Д^ = О -4- Дер — О
Ох ' оу
т.-е.
Дер = const.
Рис. 21а
Можно выяснить, что постоянная, стоящая в правой части
уравнения, равна—2рьт, где —известная постоянная Лямэ, и « угол
закручивания стержня, отнесенный к единице его длины.
В виду того, что
cos (xv) = g
где s длина дуги контура сечения, условие (с) на поверхности
бруса будет
дор dy । дор dx dv
ду ds ’ дх ds ds ’
т.-е. <р должна иметь на контуре постоянное значение, и так
как <? определена вообще с точностью до постоянного слагаемого
мы можем считать ее равной нулю на контуре.
Момент всех касательных усилий, действующих в плоскости
поперечного сечения бруса, будет
- ff xrxdxdy- f ffyydxdy- '
D D
Выполнив интегрирование по частям и приняв во вникание по-
стоянство <р на контуре, имеем:
f 4 ' *
2 J' J* <р dx dy.
13*
195
Это выражение должно равняться моменту М внешней скручи-
вающей пары.
Пусть брус имеет квадратное поперечное сечение со сторо-
нами 2а. Направим оси координат как указано на рис. 216.
Наша задача будет состоять в том, чтобы
внутри квадрата найти функцию <?, удовле-
творяющую уравнению
А'Р — — 2 рь*
и обращающуюся в нуль на контуре Г.
Как нами было выяснено раньше, эта за-
дача равносильна разысканию функции, да-
ющей минимум интегралу,
Рис. 216
при тех же граничных условиях.
Будем искать ? по методу Ритца в форме полинома. Чтобы
удовлетворить предельным условиям, выделим множитель
и положим
i-Ь л
Здесь, в силу симметрии, нужно сохранить лишь четные сте-
пени х и у.
Ограничимся сначала только первым членом ряда
Подставив в интеграл /, совершая квадратуру и Приравнивая
нулю производную паоо, получим для Oqo значение
Величина скручивающего момента получается равной
Af=2 J* J* % dx dy = р/со4 ~ 0,1388 (2а)4
Точное же значение для М есть 0,1406 И* (2 а)4. Ошибка на-
шего результата
В качестве второго приближения возьмем
?2 = (х2 —а2) (у2 —а2) [аоо + аог(х24-1/2)].
Подстановка в I и условия его минимальности приводят к сле-
дующим значениям коэффициентов:
__ 5 259 _ _ 5 3 35
“оо — 8 ' 277 ' а2 ’ а°2 — 8 ‘ 2 ’ 277 ‘ а* *
196
Как легко видеть, здесь
х 20 4 /259 । 2 3 35 л -i лпд /эл\4
zw —- а. ^277 ' 5 * 2 277/ * 0)1404 р •
Ошибка в определении М меньше 0,15%.
2. Прогиб балки. Стержень со свободным концом А и за-
деланным горизонтально в В лежит на сплошном упругом основа-
нии и изгибается сплошной нагрузкой,
Рис. 22
увеличивающейся пропорционально уда-
лению от А (рис. 22).
Q = qx.
Функцию р, характеризующую упру-
гие свойства стержня, мы примем равной
Р = Лх3,
где h некоторая постоянная. Так будет,
например, в случае балки, поперечное
сечение которой есть прямоугольник постоянной ширины, и высота
меняется по закону треугольника, возрастая от точки А до В.
Жесткость основания примем также меняющейся по линейному
закону и положим равной kx.
Внешние силы, действующие на стержень, будут состоять из
нагрузки Q=9* и силы сопротивления упругого основания рав-
ной — кху>
Кривая равновесия стержня должна быть определена, как из-
вестно из дополнения к главе III, из уравнения
или
при граничным условиях
*г
при
и
dx
при
Последние два условия удовлетворяются сами собой.
Эта задача равносильна, как в свое время было установлено,
разысканию функции, дающей минимум интегралу потенциальной
энергии
i
1= А** у"2 + кхуг — qXy\ dx
о
197
при условиях заделанности на правом конце и свободной границе
при х — 0.
После преобразования
он приводится к форме
1
1== f Ц ”у"2 + 4 ^у2 — у} dz,
о
где у и X постоянные, вычисление которых не представляет за-
труднений.
Ищем приближенное решение по методу Ритца в виде поли-
нома. Общий вид многочлена, удовлетворяющего предельным
условиям
v(D = v'(i)=o
есть
= — 1)2[ао + а1 £ + а2£2 + • . • +ая£л].
Положим п=2. Система уравнений для определения чисел
из условия minZ имеет вид
Пр у —100, решив эти уравнения, будем иметь:
ао = 0,01251 X ах = 0,0212 X а2 = 0,00079 X.
По известным Oq , ai, а2, сейчас же определяется функция уп,
приближенно дающая прогиб.
Если же взять п=1, получим
По = 0,0124 х аг = 0,0218 X.
Сравнение этих двух результатов позволяет, в известной мере,
судить о быстроте сходимости процесса.
Сравнение же результата, полученного при п = 2, с точным ре-
шением задачи, которого мы здесь не приводим, показало, что
ошибка даваемая у2 не превосходит 1%. Такая точность является,
разумеется, совершенно достаточной для практических приложений.
3. К олебание стержня. Определение частот свободного
колебания стержня, как известно, приводится к нахождению харак-
теристических чисел дифференциального уравнения
№ру = О.
198
Рассмотрим стержень, имеющий ту же длину АВ ~ I и те же
упругие свойства, что и в предыдущей задаче:
у = hx3.
Пусть он заделан горизонтально
свободен.
Мы предположим кроме того, что
пропорциональна удалению от конца А
в точке В; его конец А—
линейная плотность стержня
что совершенно естественно, если рассматривать клин, о котором
говорилось выше.
Интеграл, для которого написанное выше уравнение будет урав-
нением Эйлера, имеет вид
I^=~2j (РУ"2
о
Положим
тогда, с точностью до постоянного множителя
f
о
В точке В должны быть соблюдены условия
^ = 0 / = 0 s
при
В точке А функция у не подчинена никаким требованиям.
Ищем приближенное решение уравнения в форме
уп = (£ — I)2 (ао + а2 £ + • • • 4“ ап •
Положим п = 1.
#2 = (£—I)2 (ao4-aiO
Уг” = 2 (до — 2 а{ + 3 а{ %).
Подставляя в интеграл и обозначая ради простоты
имеем
\2 I 24 / Q
ti)2 у ai(aQ — 2at
ао3 I 2 а0 ах . at2 X
30 "Г 105 “г 280/ •
2
f
199
Условия минимума 1(уз) будут
Эта система имеет решения, отличные от нуля только тогда,
если
Наименьший корень, соответствующий основному тону стержня,
дает
Р = 5,319 /Л .
Точное значение есть
5,315 |/ Л;
ошибка не превосходит 0,1%.
4. Изложенные нами рассуждения для уравнений второго по-
рядка естественно могут быть обобщены и на случай иных пре-
дельных условий чем те, которые мы рассматривали.
Так, уравнение Штурма Лиувилля
(руУ+(' р — я) у—°
при предельных условиях
у'(0) - Л, у (0) = 0, у' (I) + h,.у (I) — 0
равносильно смешанной вариационной задаче вида
i
Ф(у) = f (ру’2Яу-) dx + hx р(О)у2(О) +
♦/
о
+ Л2/»(0 у2(1) = тт
при условии
I
/ Р У2 dx~l
о
со свободными границами. Это сейчас же дает возможность обоб-
щить полученные результаты, включая и асимптотическое выраже-
ние для характеристических чисел. Изменение скажется лишь в том,
что вместо интегралов, стоящих в формулах 31а, 32, 316, 33с бу-
дут стоять значения выражения Ф(у) для соответствующих фунда-
ментальных функций.
Совершенно то же можно высказать и для некоторых уравн -
ний в частных производных. Так, например, интегрирование час о
встречающегося уравнения второго порядка:
(pitx ) х (pit у) у Q It Кри —* 0 ,
200
где р и q положительные и непрерывные вместе со своими част*
ными производными первого порядка в области D функции, при
предельных условиях
ди
дп
на контуре Г области Z), а непрерывная функция точек контура Г*
равносильно задаче нахождения минимума
р(«х'2“
Uy2) dx dy 4
j* J* qu2dxdy-\~ J* рай2 ds
при условии
J* pu2 dxdy~ 1
и со свободной границей. обозначает производную по внешней
нормали к контуру Г»
В этом случае существенно иным будет лишь то обстоятельство,
что здесь не будут применимы формулы для оценки характеристи-
ческих чисел, ибо поведение их для областей с двумя измерениями^
конечно, будет отличным от поведения для линейных областей.
Для более подробного ознакомления с этим вопросом см.
Courant und Hilbert „Methoden der mathematischen Physik*.
5. Исследовать следующие вариационные задачи и определить
характеристические числа соответствующих им задач Штурма-
Лиувилля.
при
и граничном условии: у конечно при
Решение: Полиномы Лежандра,
при
с.
2
------- dx ~ 1.
Граничные условия: у регулярно при
Решение: Полиномы Чебышева
у'2 dx при
— ОО
201
Граничные условия: у растет как полином при
Решение: Полиномы Эрмита,
л = 2 и.
СО 20
...» f е-л ху2 dx при J* е
о а
Граничные условия: у конечно при
и растет как полином при
Решение: Полиномы Лагерра,
А — П.
4-1
-е)....................f [(1 — (1 + х)$ х] у'2 dx
при
у2 dx — 1.
Граничные условия: у конечно при
Х= zt 1.
Решение: Полиномы Якоби,
К = п (р 4~ п).
1
d *' / т при
о
Граничные условия’.
= = ° при
1
о
пт > О
и естественное граничное условие для конца
х — 0 в случае т — 0.
Решение: Функции Бесселя, а — квадрату корня функции Бесс<
ОГЛАВЛЕНИЕ.
Стран.
ГЛАВА I. Уравнения Эйлера............................................. 3
§ 1. Общие замечания ....................................... 3
§ 2. Две задачи.......................................... 3
§ 3. Понятие о функционале. ............................... 4
§ 4. Две леммы ............................................. 6
§ 5. Постановка основной задачи -.......................... 8
§ 6. Первая вариация. Уравнение Эйлера .....................10
§ 7. Некоторые случаи интегрируемости уравнения Эйлера .... 13
§ 8. Некоторые обобщения основной задачи................... 14
§ 9. Примеры............................................... 17
§ 10. Экстремум двойного интеграла... 20
§ 11. Уравнения Эйлера для параметрической формы задания кри-
вых ............................................................24
§ 12. Геодезические линии л-мерного пространства 29
Дополнения и задачи ..................................... 32
ГЛАВА II. Связанные задачи иариациониого исчисления.............. 38
§ 13. Голономные связи.....................*................... 38
§ 14. Неголономные связи.................................. • 44
§ 15. Изопериметрическая задача ...............................47
Дополнения и задачи ...................................... 57
ГЛАВА Ш. Общая форма первой вариации. Предельные условия.
Приложении к механике..............................................- 61
§ 16. Общая форма первой вариации ............................. 61
§ 17. Естественные предельные условия..............•........... 65
§ 18. Условия трансверсальности................................ 67
§ 19. Вариационные принципы механики........................... 73
§ 20. Приложение вариационных принципов механики к некоторым
задачам математической физики ................................ 80
Дополнения и задачи . .................................... 84
ГЛАВА IV. Теория поля ........................................... 98
21. Поле экстремалей.................................. . . .
22. Поле трансверсалей.....................................
23. Уравнение Гамильтона-Якоби....................... . . .
24. Общин и полный интеграл уравнения в частных производных .
25. Эквивалентность задачи интегрирования уравнения Эйлера и
уравнения Гамильтона-Якоби ............................. . .
26. Примеры. . ........ . ...............................
27. Теория поля для трех переменных................... . . .
28. Теорема Якоби.........................................
98
99
102
105
108
109
113
120
ГЛАВА V. Некоторые дополнительные вопросы: достятлтама усло-
вия, разрывные решения, условия Якоби.................126
§ 29. Достаточные условия существования экстремума........126
§ 30. Два примера на абсолютный экстремум............... 135
203
Стрм.
§ 31, Раврывные ревеиия...................................
§ 32. Уемам Яков».........................................
Г Л А В А VI. Пиши нтды Ыфидшмг* асчаммш. Пралммаш
146
133. Общие вамечвния- Идея прямых методов......................
34. Метод Ритца..............................................
35. Метод функций бесконечного множества аргументов..........
36. Метод Эйлера.............................................
37. Применения к интегрированию уравнений ...................
38. Докавательство сходимости процесса Ритца.................
39. Приложение метода Ритца к приближенному вычислению харак-
теристических чисел и фундаментальных функций................
§ 40. Примеры применения прямых методов........................
§ 41. Экстремальные свойства характеристических чисел и фунда-
ментальных функций. Теорема Куранта............................
§ 42. Приложение к оценке роста характеристических чиеел . . . .
Дополнения
►1
«адача .
146
149
155
157
160
163
175
178
183
190
194
Ота. р<дактар В. И. Смярваа: Таха. ртдактвр М. А. Паямяяе* Вр«жя сдач* * 9/ik~32 г*
Падявеаяа к начато 21/vm—32 г. Калач, макаа а ласта 10 400. Калач, лметча 12е.**- Тираж 5200 ива*
Зама М 410. Лмгарлят М 21787. 21 тип. ОГИЗа РСФСР траста .Пммграфсевга4* ям. Маава Фадарааа
Лааанград. Заавягарадсаая. 11