Текст
                    А. Д. ИОФФЕ
В.М.ТИХОМИРОВ
Теория
ЭКСТРЕМАЛЬНЫХ ЗАДАЧ
НЕЛИНЕЙНЫЙ АНАЛИЗ
И ЕГО ПРИЛОЖЕНИЯ
А. Д. ИОФФЕ,
В. М. ТИХОМИРОВ
ТЕОРИЯ
ЭКСТРЕМАЛЬНЫХ
ЗАДАЧ
ИЗДАТЕЛЬСТВО «НАУКА»
ГЛАВНАЯ РЕДАКЦИЯ ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ
МОСКВА 1974
517.2 И 75
УДК 519.3
Серия «Нелинейный анализ и его приложения» выпускается под общей редакцией
Н. Н. Боголюбова, М. А. Красносельского, Ю. А. Митропольского
Теория экстремальных задач. А. Д. Иоффе, В. М. Тихомиров. Главная редакция физико-математической литературы изд-ва «Наука», М., 1974.
Книга посвящена необходимым и достаточным условиям экстремума и теоремам существования решений экстремальных задач. Особое внимание авторы уделяют общим принципам теории экстремальных задач. С единых позиций изучаются задачи математического программирования, вариационного исчисления и оптимального управления. Исследуются специальные классы задач — линейное программирование, квадратичные задачи, дискретные и линейные задачи оптимального управления. Большое число решенных задач и разобранных примеров показывают, как применять теорию в конкретных случаях.
Книга может служить учебным пособием по курсам, связанным с оптимизацией. Она рассчитана на студентов старших курсов университетов, а также на аспирантов и научных работников, занимающихся решением экстремальных задач.
Книга содержит 15 илл., библ. 313 назв.
© Издательство «Наука», 1974.
и 20203-083 _ __
И 053 (02)-74 65'73
ОГЛАВЛЕНИЕ
Предисловие ................................................. 5
Список основных обозначений	.......................... 8
0. Введение. Предварительные сведения........................11
§	0.1.	Функциональный анализ..........................22
§	0.2.	Дифференциальное исчисление....................33
§	0.3.	Выпуклый анализ............................... 56
§	0.4. Дифференциальные	уравнения	. . в...............62
Глава 1. Необходимые условия	экстремума.....................73
§	1.1. Постановки задач и формулировки основных теорем 73
§	1.2. Гладкие задачи. Правило множителей Лагранжа 85
§	1.3. Выпуклые задачи. Доказательство теоремы Куна — Таккера .............................................88
§	1.4. Гладко-выпуклые задачи. Доказательство экстремального принципа ...................................92
Глава 2. Необходимые условия экстремума в задачах классического вариационного исчисления и оптимального управления...............................................101
§ 2.1.	Постановки задач...............................101
§ 2.2.	Элементарный вывод необходимых условий экстремума для простейших задач классического вариационного исчисления.................................109
§ 2.3.	Задача Лагранжа. Уравнение Эйлера — Лагранжа 134
§ 2.4.	Принцип максимума Понтрягина. Формулировка и обсуждение .........................................143
§ 2.5.	Доказательство принципа максимума..............158
Глава 3.	Элементы выпуклого	анализа......................172
§ 3.1.	Выпуклые множества	и теоремы	отделимости . .172
>	§	3.2.	Выпуклые	функции ..............................178
§ 3.3. Сопряженные функции. Теорема Фенхеля — Моро 183
v	§	3.4.	Теоремы	двойственности.........................188
>	§	3.5.	Выпуклый	анализ в конечномерных	пространствах	194
Глава 4.	Локальный выпуклый анализ.......................202
§ 4.1.	Однородные функции и производные по направлениям ...............................................202
§ 4.2.	Субдифференциал. Основные	теоремы..............207
§ 4.3.	Конусы опорных функционалов....................216
1*
4
ОГЛАВЛЕНИЕ
§ 4.4.	Локально выпуклые функции......................219
§ 4.5.	Субдифференциалы некоторых функций .... 223
Глава 5. Локально выпуклые задачи и принцип максимума для задач с фазовыми ограничениями....................234
§ 5.1.	Локально выпуклые задачи.................234
§ 5.2.	Задачи оптимального управления с фазовыми ограничениями ..........................................244
§ 5.3.	Доказательство принципа максимума	для	задач
с фазовыми ограничениями..................251
Глава 6.	Специальные задачи.......................267
§ 6.1.	Линейное программирование................267
§ 6.2.	Теория квадратичных форм в гильбертовом пространстве ..........................................272
§ 6.3.	Квадратичные функционалы в классическом вариационном исчислении ................................ 280
§ 6.4.	Дискретные задачи оптимального управления	.	.	292
Глава 7.	Достаточные условия экстремума............299
§ 7.1.	Метод возмущений ..............................299
§ 7.2.	Гладкие задачи ................................305
§ 7.3.	Выпуклые задачи...........................314
§ 7.4.	Достаточные условия экстремума в классическом вариационном исчислении.........................318
Глава 8.	Измеримые многозначные отображения и выпуклый
анализ интегральных функционалов...........336
§ 8.1.	Многозначные отображения и измеримость	.	.	.	336
§ 8.2.	Интегрирование многозначных отображений	.	.	.	348
§ 8.3.	Интегральные функционалы..................355
Глава 9. Существование решений в задачах вариационного исчисления и оптимального управления.....................368
§ 9.1.	Полунепрерывность функционалов вариационного исчисления и компактность их лебеговских множеств 368
§ 9.2.	Теоремы существования решений..................384
§ 9.3.	Конволюционный интеграл и линейные задачи . . 401
Глава 10. Приложение теории к решению задач................421
§ 10.1.	Задачи геометрической оптики..................421
§ 10.2.	Неравенство Юнга и теорема Хелли..............431
§ 10.3.	Оптимальное возбуждение осциллятора .... 435
Задачи.....................................................440
Литература ................................................461
Предметный указатель.......................................477
ПРЕДИСЛОВИЕ
В последние годы усилия многих математиков были направлены на то, чтобы обозреть проблематику экстремальных задач с единой точки зрения, выделить общие черты в методах их исследования, разработать необходимый математический аппарат. В результате стало возможным говорить о создании теории экстремальных задач.
Три раздела этой теории приобрели ныне вполне оформленные очертания; это разделы, посвященные математическим основаниям теории, необходимым условиям экстремума и, хотя и в меньшей степени, теоремам существования решений. Бурно развивается глава теории, посвященная численным методам оптимизации. Теория достаточных условий еще не достигла полной завершенности, хотя и там получены некоторые результаты общего характера.
В предлагаемой книге затронуты все перечисленные выше основные разделы теории экстремальных. задач, кроме численных методов. Математическому аппарату и необходимым условиям экстремума посвящены первые пять глав. Достаточные условия изучаются в седьмой Главе. В восьмой и девятой главах сосредоточены теоремы существования решений задач вариационного исчисления и оптимального управления, вместе с необходимым для их доказательства математическим аппаратом. В шестой главе из общей теории, развитой в предыдущих главах, извлекаются следствия для классов задач со специфической структурой — линейной, выпуклой, квадратичной и дискретной. Последняя, десятая глава посвящена некоторым приложениям теории к решению конкретных задач. В книге имеется, кроме того, раздел «Задачи», и многие задачи снабжены решениями.
При отборе материала мы не стремились охватить все последние результаты. Главная цель книги — рас-
6
ПРЕДИСЛОВИЕ
крыть и обозреть методы, накопленные в теории экстремальных задач, и показать, как эти методы применяются в конкретных разделах: математическом программировании, вариационном исчислении и оптимальном управлении.
Первоначальным стимулом для создания теории экстремальных задач служили попытки уложить принцип максимума Понтрягина в рамки общих концепций. Эти попытки привели к рассмотрению задач со смешанной, гладко-выпуклой структурой. Один класс таких задач подробно исследуется в книге. К тем же проблемам возможны и другие подходы, — какие из них окажутся наиболее плодотворными, покажет будущее.
Книга рассчитана прежде всего на студентов старших курсов университетов, на аспирантов и научных работников, занимающихся решением экстремальных задач. При написании книги был использован опыт преподавания на механико-математическом факультете МГУ. Мы надеемся, что книга сможет служить учебным пособием по различным курсам, связанным с оптимизацией, читаемым в университетах и технических учебных заведениях.
Для полного понимания всех частей книги нужно владеть университетским курсом функционального анализа, но многое в книге рассчитано на более широкую аудиторию.
Дело в том, что формулировки большинства важнейших теорем, дающих рецепты для решения задач, можно освоить, имея существенно меньшую математическую подготовку по сравнению с той, которая нужна для понимания доказательств. Поэтому мы старались так построить изложение, чтобы формулировки основных результатов, общие комментарии к ним и решения задач были отделены от доказательств.
Книгу не обязательно читать подряд. Многие темы можно изучать независимо от остального материала. Выделим несколько таких тем. Элементарный курс вариационного исчисления и оптимального управления образуют параграфы 2.1, 2.2, 2.4 и 6.4. Они опираются, в основном, лишь на факты классического анализа. Начальный курс линейного и выпуклого программирования содержится в §§ 0.3, 1.3, 6.1 и 7.3. Теме «Необходимые и достаточные условия экстремума в задачах миними
ПРЕДИСЛОВИЕ
7
зации в линейных пространствах» посвящены глава 1 и §§ 7.1—7.3. Параграфы 2.1—2.3, 6.3, 7.4, 10.4 и пункт 9.2.4 образуют расширенный курс вариационного исчисления, хотя здесь недостаточное место уделено теории Гамильтона — Якоби. В главе 8 и §§ 9.1, 9.2 освещаются проблемы существования решения в задачах оптимального управления. Глава 8 совместно с § 9.3 дает представление о двойственных методах в теории оптимального управления. Главы 1—5, 8 и 9 образуют расширенный курс теории оптимального управления. Наконец, в главах 3, 4 и 8 содержится достаточно подробное введение в бесконечномерный выпуклый анализ.
Первоначально планировалось включить в книгу еще ряд тем: расширения вариационных задач, скользящие и особые режимы, численные методы. Однако этот материал не удалось уложить в запланированный первоначально объем, и от изложения перечисленных разделов пришлось отказаться. Следует назвать еще несколько важных вопросов, не затронутых в книге. Прежде всего это относится к вопросам взаимосвязи вариационного исчисления с классической механикой, к теории Гамильтона — Якоби и к динамическому программированию.
В комментарии после введения указаны монографии и статьи, по которым можно составить представление о темах, оставшихся за пределами книги.
В заключение нам хотелось бы поблагодарить Б. Т. Поляка, любезно предоставившего нам некоторые материалы, способствовавшие выработке принятого в книге подхода к классификации экстремальных задач. Мы признательны М. А. Красносельскому, просмотревшему рукопись и давшему ряд полезных советов, В. М. Алексееву и С. В. Фомину, с которыми обсуждались отдельные аспекты, связанные с изложением материала книги; очень существенными для нас были многочисленные дискуссии с А. А. Милютиным; мы благодарны А. В. Барыкину, Б. Лудереру, Г. Г. Магарил-Ильяеву, Е. С. Половинкину, М. А. Рвачеву, В. М. Саф-ро, М. И. Стесину и М. Тагиеву, помогавшим нам при подготовке рукописи.
Авторы,
СПИСОК ОСНОВНЫХ ОБОЗНАЧЕНИИ
V — квантор общности: «для всех»,
3 — квантор существования: «существует», — квантор следования: «из ... следует
фу квантор эквивалентности,
х е А — элемент х принадлежит множеству А,
х & А — элемент х не принадлежит множеству А,
0 — пустое множество,
A U В — объединение множеств А и В,
А П В — пересечение множеств А и В,
А \ В — разность множеств А и В,
АаВ — множество А содержится в множестве В,
А X В — декартово произведение множеств Л и В, 2а — совокупность всех подмножеств множества А, {х | Рх} — совокупность элементов х, обладающих свойством Р, {хь хп, множество, состоящее из элементов
*1....хп......
F: X -> Y — отображение F множества X в множество Y,
х-> F (х) — отображение F сопоставляет элементу х эле* мент F (х),
FcG — суперпозиция отображений G и F,
F (А) — образ множества А при отображении F,
f"1 (Л) — прообраз множества Л при отображении F,
F |л — ограничение отображения F на множество Л,
R — совокупность всех действительных чисел,
R" — аффинное или евклидово n-мерное пространство,
R* = (х = (х1, ..., хп) 1 х* >О] — неотрицательный октант в R",
inf Л (sup Л) — нижняя (верхняя) грань чисел, входящих в множество Л cz R,
ал ф а (ап fa) — последовательность an, не возрастая (не убывая), сходится к а,
1х I — евклидова норма в Rn,
х || — норма элемента х в банаховом пространстве,
Р (х, у) — расстояние от элемента х до элемента у,
В (х, г) — замкнутый шар с центром х радиуса г,
U (х, г) — открытый шар с центром х радиуса г,
Л — замыкание множества Л,
int Л — внутренность множества Л,
3?af == {х ] f (х) «С а} — лебеговское множество функции f на уровне а,
X* — пж остранство, сопряженное с X,
СПИСОК ОСНОВНЫХ ОБОЗНАЧЕНИЙ
9
х* — элемент сопряженного пространства, (х*, х) — значение линейного функционала х* на элементе х, (х I У) — скалярное произведение элементов х и у, L1 = {х* | (х*. х) = 0} — аннулятор подпространства L, dim L — размерность пространства L, codim L — коразмерность пространства L, X/L — фактор-пространство пространства X по подпространству L,
I — единичный оператор,
Л* — оператор, сопряженный с оператором Л,
Ker Л — ядро оператора Л,
Im Л— образ оператора Л,
(X, У) — пространство непрерывных линейных отображений пространства X в пространство У,
Л >0 —матрица Л положительно определена,
Л ^0 —матрица Л неотрицательно определена, ind Q — индекс квадратичной формы Q, (Т, 2, ц) — пространство Т с ог-алгеброй S и мерой ц, (ц~) — положительная (отрицательная) составляющие меры ц, j р, | — полная вариация меры ц, mes Л — лебеговская мера множества А, Сп (Т) — пространство непрерывных на компакте Т п-мерных вектор-функций с равномерной метрикой,
([/0, ^]) ~ пространство m раз непрерывно дифференцируемых /i-мерных вектор-функций на отрезке [/0. Л].
(Л — пространство n-мерных вектор-функций, каждая компонента которых принадлежит LP(T> S, pi),
m ({70> ^]) — пространство /г-мерных вектор-функций, у которых m-я производная абсолютно непрерывна и принадлежит
f' (х; h) — производная функции f в точке х по направлению А, 6F (х, h) — первая вариация отображения F в точке х, t)nF (х, h) — п-я вариация отображения F в точке х, Fp (х) — производная отображения F в точке х по Гато, F' (х) — производная отображения F в точке х по Фреше, /" (х) (A, h) — значение второй производной функции f на элементе А,
(хр х2)(ХР хг)) частная производная по х{ (по х2) отображения X] -> F (х!, х2) (х2 -> F (xi, х2)),
[Xi, х2] —- отрезок, соединяющий точки xi и х2, dom f — эффективное множество функции f, epi f — надграфик функции f, б(х1 Л) — индикаторная функция множества Л. s (х) Л) — опорная функция множества Л, ц (х [ Л) —- функция Минковского множества Л, N (х | Л) —- конус опорных функционалов к множеству А в точке х,
КА — конус, порожденный множеством Л, Л
10
СПИСОК ОСНОВНЫХ ОБОЗНАЧЕНИИ
lin А — линейная оболочка множества Л,
aff А •— аффинная оболочка множества А, ri А — относительная внутренность множества А, cony А — выпуклая оболочка множества А, сопу А — замыкание выпуклой оболочки множества Л, df (х) ~ субдифференциал функции f в точке х, dxf (х, у) — субдифференциал функции х -> f (х, у), f* (х*) — функция, сопряженная с функцией f, или преобразование Юнга — Фенхеля функции ft
Л° — поляра множества А,
Л + В — алгебраическая сумма множеств Л и В,
h ® /г ~ конволюция функций fi и f2,
fi V f 2 •~ верхняя грань функций fi и f2*
/Л — прообраз функции f при отображении Л,
Л/ — образ функции f при отображении Л,
ft — конволюционный интеграл функций х -> f (/, х) по мере р,,
J ft — интеграл функций x->f(t, х) по мере р,,
f (х) -> inf (sup); хе С - обозначение экстремальной задачи, х* — решение экстремальной задачи,
У ~ функционал в задачах вариационного исчисления и оптимального управления,
УС — квадратичный функционал в задачах вариационного исчисления,
L = L (t, х, х) — лагранжиан,
2? — функция Лагранжа,
<8 — функция Вейерштрасса,
Н — функция Понтрягина,
$6 — гамильтониан.
0. Введение
ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
Первые задачи геометрического содержания, связанные с отысканием наименьших и наибольших величин, были поставлены в древности. Упоминание об изопери-метрическом свойстве круга относится к V веку до н.э.; вопросы о максимумах и минимумах встречаются в трудах Евклида, Аполлония, Архимеда. Потребность решать экстремальные проблемы способствовала созданию математического анализа и вариационного исчисления. В XVII и XVIII веках были открыты вариационные принципы в оптике и механике и вариационное исчисление стало языком естествознания.
В наши дни в связи с запросами техники и экономики теория экстремальных задач переживает второе рождение. Бурно развиваются новые разделы: математическое программирование, теория оптимального управления, численные методы оптимизации.
Экстремальные проблемы очень разнообразны, и все-таки, несмотря на то, что старинные геометрические задачи на экстремум кажутся совсем не похожими на проблемы оптимального управления летательными аппаратами, в исследовании их можно усмотреть много общего.
Расскажем вкратце об общих свойствах, присущих экстремальным задачам, и об основных принципах исследования проблем экстремального характера. Начнем с постановок задач.
Проблема отыскания наибольшей или наименьшей величины возникает обычно не в аналитической, а в описательной форме. Для того чтобы применять математические средства, необходимо формализовать задачу. Обычно можно выделить три компоненты, составляющие математически точно поставленную проблему. Это — функция fQ(x) вместе с областью X ее определения и некоторое подмножество С множества X, которое задает ограничение в поставленной задаче. Множество
12
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
X называется классом допустимых элементов, подмножество С — множеством допустимых элементов или просто ограничением. (Под словом «функция» понимается далее отображение в расширенную вещественную прямую, когда значения +оо и —оо допускаются наряду с обычными вещественными числами.) Словесно экстремальная задача формулируется так: найти нижнюю (верхнюю) грань функции fQ(x) по всем х, принадлежащим ограничению С. Для обозначения такой экстремальной задачи используется стандартная запись:
f0 W -> inf (sup); х е С.	(1)
При строгой постановке задачи должен быть точно описан класс допустимых элементов X.
Нижняя (верхняя) грань функции fo(x) в задаче (1) называется значением этой задачи, а та точка х*, где достигается эта нижняя (верхняя) грань, называется решением задачи или ее абсолютным экстремумом — минимумом или максимумом.
Если пространство X наделено топологией, то точка х# такая, что fQ(x) fo(**) (соответственно fo(x)^2 igfo(x*)) для всех х из пересечения С с некоторой окрестностью точки х*, называется локальным минимумом (максимумом) в задаче (1).
Заметим, что всегда можно ограничиться лишь рассмотрением задач на отыскание нижней грани; для этого достаточно (если нужно) заменить fo на —fo. Значение задачи об отыскании нижней грани мы называем иногда минимумом, а ее решение — минималью.
Обычно одна и та же задача допускает разные формализации.
Рассмотрим, например, задачу о брахистохроне. Начнем с описательной постановки. В «Беседах» Галилея обсуждается такой вопрос. Пусть два одинаковых шарика начинают одновременно двигаться: один — по дуге окружности, другой — по ее хорде. Какой из шариков быстрее достигнет нижнего конца хорды? Оказывается, — тот, который движется по окружности. Напрашивается более общая постановка задачи: какую форму следует придать желобу, скатываясь по которому без трения под воздействием силы тяжести, шарик попадал бы из одной заданной точки в другую за кратчайшее время. Так описательно ставится задача о брахистохроне. Перевести ее на математический язык можно по-разному. Обычно принята такая формализация. Введем в плоскости систему координат (х, у) так, чтобы ось х была горизонтальна, а ось у
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
13
направлена вертикально вниз. Пусть у(х) есть форма' желоба. В соответствии с законом Галилея скорость шарика в точке (х,у(х)) не зависит от формы желоба, а зависит лишь от самой ординаты у(х). Эта скорость равна V 2gy (х). Следовательно, время dt, требуемое для преодоления участка кривой длины dst равно dsl^lgy (х).
Так мы приходим к следующей постановке:
V1 + у/2 (X) V^sy (*)
dx-» inf;
(2)
у (.v0) = 0, у (xt) = уь
Полученная задача относится к числу простейших задач классического вариационного исчисления. Легко понять, что минимизация функционала в (2) равносильна минимизации интеграла
J V%gy
(3)
по всем кривым (х(/), y(t))t соединяющим точки (х0, 0) и (xi,z/i). Такие задачи относятся к классу задач вариационного исчисления в параметрической форме.
Но к той же задаче можно подойти и как к проблеме о быстродействии. Выше говорилось уже, что в точке (х, у) скорость движения шарика равна	Представим себе теперь плоскую изо-
тропную оптическую среду, в которой локальная скорость распространения света в точке (х, у) равна V 2gy. Принцип Ферма в геометрической оптике гласит, что при своем движении в неоднородной среде свет выбирает такую траекторию, чтобы минимизировать время прохождения участка пути между заданными точками. В применении к среде, где скорость равна }^2gy, получается следующая постановка задачи о распространении света:
Т-> inf;
х2 4- у* = 2gy,
(4)
х(О) = хо, #(0)=0, х(Л = Х1, у(Т)=у{.
Ясно, что решение этой задачи плоской геометрической оптики дает ответ и в задаче о брахистохроне. (Отметим, что оптико-механическая аналогия послужила И. Бернулли путеводной нитью при решении задачи о брахистохроне.) Наконец, еще один путь формализации. При движении шарика по желобу у(х) на него действуют две силы, а именно, сила тяжести и реакция опоры, перпендикулярная скорости. В силу закона Ньютона ускорение шарика пропорционально действующей суммарной силе. В итоге приходим к следующей постановке задачи:
Г inf;
х = и, у = g + и, хи + yv — 0,
X (0) = х0, У (0) = 0, х (7) = Х1, у (Г) = Ух.
(5)
14
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
Такие постановки характерны для оптимального управления. Отметим еще разные модификации в пределах некоторых из указанных постановок. Например, можно, следуя Эйлеру, в (2) поменять местами х и у и рассмотреть такую простейшую задачу классического вариационного исчисления:
У 2g у
dy-> inf;
л(О) = хо, x(t/i) = xi.
Можно вместо уравнения х2 + у2 = 2gy в (4) рассмотреть включение:
(*> у) е= В (о, У 2gy ),
где В(0, г) есть круг с центром в нуле радиуса г. Допустимо еще вместо последнего включения рассмотреть систему уравнений с управлениями:
X = U У2gy , у = V V2gy , и2 + V2 < 1.
Получилось довольно большое число формализаций, и каждая из них обладает и своими преимуществами и своими недостатками. Но нам хочется подчеркнуть, что сама проблема формализации решается неоднозначно, и выбор наиболее естественной формы записи задачи является искусством, которое постигается при решении большого числа задач. Следует отметить, однако, что с математической точки зрения ни одна из задач (2) — (5) еще не поставлена полностью, ибо нигде не очерчен точно класс допустимых элементов. Этот класс также может выбираться по-разному. Скажем, задачи типа (2) рассматривают обычно в классе непрерывно дифференцируемых функций. Но в этом классе решения задачи (2) не существует. Действительно, решением задачи о брахистохроне является, как известно, циклоида, которая имеет в начальной точке бесконечную производную. Если же рассмотреть класс функций, являющихся непрерывными и непрерывно дифференцируемыми на отрезке [х0, Xi] всюду, кроме, может быть, точки хо, то к этому классу циклоида будет принадлежать. Обычно рассматривают менее специальные классы: класс кусочно дифференцируемых функций, класс абсолютно непрерывных функций и др.
Ограничения в экстремальных проблемах стараются записать в виде равенств и неравенств. Такие ограничения называются функциональными. Помимо функциональных ограничений, встречаются ограничения типа включений: /еЛ, нефункционального характера. В результате экстремальная задача (1) приобретает такую
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
15
форму:
f0(x)->inf;
F(x) = y0, fi (*) < 0» i Д хе А.
Здесь У и I — некоторые множества, F: X-+Y, ff. X->R, i^I и AczX. Отметим, что различие между функциональными и нефункциональными ограничениями, вообще говоря, условно (ибо каждое включение хе А можно записать функционально), но часто оно оказывается полезным.
Перейдем теперь к обсуждению общих принципов теории экстремальных задач. Предметом этой теории является точно поставленная экстремальная проблема. В связи с каждой такой проблемой естественно возникают три вопроса. Во-первых, существует ли решение задачи? Если можно предполагать, что решение существует, то надо выяснить, каким условиям оно должно удовлетворять. Наконец, в-третьих, как фактически найти решение задачи или минимизирующую последовательность для нее? Поставленные вопросы соответствуют разделам теории экстремальных задач, где изучаются существование решений, необходимые и достаточные условия экстремума и вычислительные методы нахождения решений. Эти разделы связаны между собою, но вместе с тем каждый из них обладает достаточно большой самостоятельностью.
Расскажем сначала о необходимых уело* виях экстремума. Первый общий принцип полу-* чения необходимых условий в экстремальных задачах без ограничений был найден Ферма. Идея Ферма, выра-< женная современным языком, состоит в том, что решения гладкой задачи	следует искать среди
стационарных точек функционала f0(x), т. е. среди решений уравнения
W = 0.	(6)
Этот результат называют иногда теоремой Ферма. Для задач с ограничениями общий принцип получения необходимых условий экстремума был выдвинут Лагранжей.
16
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
Замысел Лагранжа можно распространить далеко за пределы тех задач, которые он сам рассматривал. Мы раскроем его на примере той общей постановки, с которой постоянно будем иметь дело в этой книге. Пусть X и У— линейные пространства, F: X—♦ У, Д-: X—>R, i = 1, .... т, А с: X. Рассмотрим задачу:
f0(x)->inf; F(x) = 0,	1
i= 1, ..., m, x^. A. J '
Следующую функцию:
tn
2 (x, y\ Ao...........Am) = </, F (x)) + s AJi (x),
z=o
где у* — линейный функционал на У, а — числа, назовем функцией Лагранжа задачи (Г). Функционал у* и числа Af, 0 i т, называются множителями Лагранжа. (Отметим, что функция Лагранжа составлена с учетом только функциональных ограничений.) Принцип Лагранжа состоит в следующем:
Пусть точка х* есть точка локального минимума в задаче (Г). Тогда найдутся такие множители Лагранжа у*	(O^f^/n), не равные одновременно нулю,
что х# удовлетворяет необходимому условию локального минимума в задаче
2?(х, •)->inf; хе А, и при этом
=	(7)
Иными словами, необходимые условия минимума в исходной задаче совпадают с необходимыми условиями минимума функции Лагранжа (при выборе некоторых множителей Лагранжа) по множеству хе А, состоящему из ограничений, не включенных в функцию Лагранжа. Соотношения (7) называются условиями дополняющей нежесткости. Они означают, что отличные от нуля множители Лагранжа надо приписывать только тем ограничениям типа неравенства, которые существенны в данной точке, т. е. тем, где ^(х#) = 0.
Проиллюстрируем принцип Лангранжа на конечномерных задачах. Пусть в (1') X — А — Rn, т. е. X — и-мер-
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
17
ное евклидово пространство, и неравенства отсутствуют. Равенства задаются конечным числом соотношений вида
А(х)=о,.... fm(x) = O.
Таким образом, F = (fi, fm) есть отображение из Rn в R™ Все функции fo(x), .... fm(x) предполагаются гладкими. В соответствии с принципом Лагранжа надлежит составить функцию Лагранжа
ml
i=0
и написать необходимое условие в задаче без ограничений Z -+ inf. Но такое необходимое условие дается теоремой Ферма (см. (6)):	= 0. В итоге получается
система уравнений:
т ?,=2^W-o.
Полученный результат широко известен под названием правила множителей Лагранжа.
В гл. 1 мы выделим три класса задач, для которых верен принцип Лагранжа. Это — гладкие задачи, задачи выпуклого программирования, а также задачи со смешанной гладко-выпуклой структурой. Классическое вариационное исчисление относится к числу гладких задач, задачи оптимального управления могут быть редуцированы к гладко-выпуклым задачам. Эти вопросы освещаются в первых двух главах книги и в пятой главе.
Принцип Лагранжа верен для многих важных задач, но всякий раз его необходимо обосновывать. Каковы же методы доказательства принципа Лагранжа и других необходимых условий? В основе большинства подобных доказательств лежит метод вариаций. Объясним существо этого метода. Рассмотрим общую задачу (1), где X — топологическое пространство. Вариацией точки х# называется непрерывное отображение X-*x(Z) отрезка [0, е] в X такое, что х(0) = х*. Вариация называется допустимой, если для достаточно малых X все точки кривой x(Z) принадлежат С. Пусть теперь вариация х(А) такова, что функция ф(А) = fo(x(k))
18
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
является дифференцируемой в нуле. Тогда, если есть точка локального минимума в задаче (1), то функция Ф должна иметь минимум в точке нуль и, значит, должно выполняться неравенство (р'(О)^О, являющееся необходимым условием минимума функции одного переменного, заданной на отрезке [0, е]. Метод вариаций состоит в том, что ищется достаточно широкий класс допустимых вариаций и затем извлекаются следствия из соотношений д/(0)^0, написанных для каждой вариации из заданного класса.
На первом этапе развития теории применялись простейшие вариации — вариации по направлениям. Так были получены необходимые условия в задачах конечномерного анализа и в классическом вариационном исчислении. Вывод необходимых условий экстремума в классическом вариационном исчислении непосредственным применением метода вариаций проводится у нас в § 2.2. Помимо вариаций по направлениям, в вариационном исчислении применялись вариации иной природы. Для вывода необходимых условий сильного минимума Вейерштрасс применял вариации, получившие название «игольчатых». При помощи таких вариаций можно вывести простейшие варианты принципа максимума (см. § 2.4).
Как правило, множество допустимых вариаций стараются выбрать так, чтобы оно оказалось локально устроено, как выпуклое. Выпуклые задачи обладают многими замечательными особенностями. В них всякий локальный минимум является абсолютным, кроме того, с каждой выпуклой задачей можно сопоставить другую, называемую двойственной к ней; при этом решения любой из них являются множителями Лагранжа для другой. Часто двойственная задача проще устроена, чем исходная.
Вернемся снова к принципу Лагранжа. Если для поставленной задачи (или для задачи, полученной из нее применением метода вариаций) этот принцип оказывается применимым, то он приводит к некоторым уравнениям (алгебраическим, дифференциальным и т. п.). Решения этих уравнений называются экстремалями. Обычно найти экстремали удается лишь при помощи очень трудоемких вычислений. И все-таки случается, что
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
19
уравнения, полученные из необходимых условий экстремума, удается разрешить в общем виде.
Зададимся вопросом, какие свойства задачи могут облегчить решение этих уравнений. Отметим несколько таких обстоятельств. Во-первых, это — линейная структура задачи. Задачи с линейной структурой наиболее полно изучены. Сюда относятся задачи линейного программирования (ему посвящен § 6.1), квадратичные задачи в гильбертовом пространстве (см. §§ 6.2 и 6.3) — здесь линейными оказываются те уравнения, которые выражают необходимые условия, — и линейные задачи оптимального управления (см. § 9.3). В качестве второго обстоятельства отметим выпуклую структуру задачи. Об одном замечательном свойстве выпуклых задач— о возможности двойственного описания их — уже говорилось. Особенно плодотворны методы, связанные с выпуклостью, когда эта выпуклость сочетается с конечномерностью. Этим последним обстоятельством объясняется обилие решенных задач об аппроксимации в пространствах с метрикой С. В заключение отметим также, что если задача обладает какой-то инвариантной структурой, то это, как правило, влечет за собой много важной информации относительно решений задачи — теорема Нётер в вариационном исчислении и т. п. На этом мы закончим обсуждение вопросов, связанных с необходимыми условиями экстремума, и перейдем к достаточным условиям.
Раздел книги, посвященный достаточным условиям (гл. 7), занимает в ней скромное место. Дело в том, что если часть теории экстремальных задач, посвященная необходимым условиям экстремума, имеет ныне устойчивые очертания — там выработан свой язык, своя методология и получены общие и содержательные теоремы, то этого нельзя еще сказать про принципы получения достаточных условий. Здесь нам хочется обсудить возможные перспективы теории и примерный план ее построения. Суть дела видится нам в следующем. Получение достаточных условий связано с глобальным подходом, когда индивидуальная задача включается в совокупность подобных ей задач, зависящих от некоторых параметров. (Эту процедуру называют методом возму* имения.) Минимум в полученных задачах становится
20
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
функцией параметров возмущения. Эту функцию мы называем S-функцией задачи. Цель состоит в том, чтобы по данным поставленной задачи можно было судить о характере S-функции, о ее гладкости и т. п. В случае, если S-функция обладает гладкостью, принцип Лагранжа, о котором много говорилось выше, допускает фундаментальное усиление: тогда можно нелинейно подправить функцию Лагранжа так, что задача об условной минимизации становится равносильной задаче о безусловной минимизации этой подправленной функции Лагранжа. Такое утверждение мы называем принципом снятия ограничений.
Поясним сказанное на том же конечномерном примере, на котором иллюстрировался принцип Лагранжа. Пусть все функции Д-, i — 0, 1, ..., m, входящие в определение конечномерной задачи с ограничениями fi — 0, i = 1, ..., tn, являются дважды непрерывно дифференцируемыми, кроме того, функция F'(x) — =(/{(*),	отображает Rn на все Rw. Тогда при
условии, что данная точка х* является экстремалью задачи и в ней вторая производная функции Лагранжа строго положительна на ядре оператора F'(x*), получается, что поставленная задача становится равносильной следующей безусловной проблеме минимизации:
m
Z + (ф о F) (X) = f0 (х) + 2 kfi (х) + (Ф ° Л (X) -> inf,
где ф: Rm->R— некоторая эффективно строящаяся гладкая добавка к функции Лагранжа. Смысл полученного результата в том, что если выполнены некоторые условия невырожденности, то ограничения могут быть сняты. Если же из каких-то, пусть даже эвристических, соображений удается снять ограничения, то тем самым сразу оказывается, что в данной точке имеется локальный экстремум, т. е. снятие ограничения является достаточным условием экстремума.
Особой спецификой обладают задачи динамического содержания, в которых описываются процессы, изменяющиеся во времени. Таковы задачи классического вариационного исчисления и оптимального управления. Для этих задач имеется весьма плодотворная процедура
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
21
их возмущения. Такие задачи возмущают при помощи граничных условий. Полученная при помощи этого возмущения S-функция называется в вариационном исчислении функцией действия. Для нее можно написать дифференциальное уравнение в частных производных — уравнение Гамильтона — Якоби, что дает новый путь к решению поставленных задач. Аналог теории Гамильтона— Якоби в оптимальном управлении называется динамическим программированием, а основное уравнение динамического программирования называется уравнением Беллмана. При выводе уравнений Гамильтона — Якоби и Беллмана основополагающим является тот факт, что любая часть минимали сама является минималью некоторой задачи.
Скажем несколько слов относительно аппарата, при помощи которого доказываются необходимые и достаточные условия. Исчисление, разработанное для исследования экстремальных задач, базируется на двух основаниях. Это — дифференциальное исчисление в банаховых пространствах (см. § 0.2) и выпуклый анализ в линейных топологических пространствах (см. § 0.3 и гл. 3, 4). В последнее время интенсивно разрабатывается новая глава выпуклого анализа, специально ориентированная на задачи оптимального управления — выпуклый анализ интегральных функционалов (см. гл. 8). Стержнем той части дифференциального исчисления, которая обращена к экстремальным задачам, является принцип сжимающих отображений. В основании выпуклого анализа лежат теоремы отделимости. Именно эти факты решающим образом участвуют в доказательствах теорем относительно необходимых и достаточных условий. Важнейший результат выпуклого анализа интегральных функционалов — выпуклость интегралов от многозначных отображений.
Что же касается теорем существования решений в теории экстремальных задач, то в большинстве своем они основываются на том, что у всякой полунепрерывной функции на компакте нижняя грань достигается. Поэтому основное внимание в теоремах существования уделяется условиям полунепрерывности функционалов и критериям компактности множеств в функциональных пространствах (см. § 9.1). Как
22
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
правило, естественные условия полунепрерывности и компактности, с одной стороны, и необходимые условия экстремума, с другой, получаются в разных топологиях и для разных классов допустимых элементов. Преодоление этого разрыва — одна из основных задач в теории существования решений.
Перейдем к описанию математической базы теории экстремальных задач.
В § 0.1 собраны нужные нам факты из функционального анализа, важнейшие из которых — принцип сжимающих отображений, теорема Хана — Банаха и теорема Банаха об открытом отображении. Параграфы 0.2 и Q.3 содержат необходимые для первоначального знакомства с книгой факты, относящиеся к аппарату теории экстремальных задач — дифференциальному исчислению и выпуклому анализу. Главные из них — теоремы Люстерника и Моро — Рокафеллара. В § 0.4 излагается теория дифференциальных уравнений с измеримыми правыми частями. Многие доказательства, которые можно прочесть в известных учебниках (Дьедонне [1}, Картан [1], Колмогоров и Фомин [1], Люстерник и Соболев [1], Шварц (1] и др.), опущены.
§ 0.1. Функциональный анализ
0.1.1. Компактность. Напомним, что множество в топологическом пространстве называется компактным, или компактом, если всякая покрывающая его система открытых множеств содержит конечную подсистему, также покрывающую данное множество.
Элементарные свойства компактности.
1)	Топологическое пространство компактно тогда и только тогда, когда всякая центрированная система его замкнутых подмножеств имеет непустое пересечение. (Напомним, что система множеств называется центрированной, если всякая ее конечная подсистема имеет непустое пересечение.)
2)	В компактном топологическом пространстве всякое бесконечное множество имеет предельную точку.
3)	Всякое компактное множество замкнуто, и всякое замкнутое подмножество компакта компактно.
4)	Образ компактного множества при непрерывном отображении есть компакт^
§0.1. ФУНКЦИОНАЛЬНЫЙ АНАЛИЗ
23
5)	Метрическое пространство компактно тогда и только тогда, когда всякая бесконечная последовательность его элементов содержит сходящуюся подпоследовательность.
Под словом функция всюду в этой книге понимается отображение в расширенную вещественную прямую [—оо, оо], т. е. значения ±оо допускаются наравне с вещественными числами. Пусть f(x)—функция, заданная на топологическом пространстве X. Говорят, что функция f полунепрерывна снизу в точке х е X, если (когда f(x)<oo), для всякого в > 0 существует такая окрестность U точки х, что
в
для всякой точки у е U, а если f(x)=oo, то для любого N > 0 существует такая окрестность U точки х, что
ШЖ
для всякой точки у Функция f называется полунепрерывной снизу, если она полунепрерывна снизу в каждой точке из X.
Для того чтобы функция f, заданная на топологическом пространстве X, была полунепрерывной снизу, необходимо и достаточно, чтобы все ее лебеговские множества
gaf = {xt=X\f(x)^a}
были замкнуты.
Теорема Вейерштрасса. Полунепрерывная снизу функция f, заданная на топологическом пространстве X, достигает нижней грани на всяком компактном подмножестве пространства X.
Следствие. Пусть f — полунепрерывная снизу функция на топологическом пространстве X. Если некоторое лебеговское множество функции f не пусто и компактно, то f достигает нижней грани на X.
Этот факт лежит в основе большинства теорем существования решения в теории экстремальных задач.
0.1.2. Принцип сжимающих отображений. Пусть Л метрическое пространство и F — отображение пространства X в себя. Говорят* что отображение сжимающее,
24
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
если существует такое число 0, 0 < 0 < 1, что
p(F(x), F(z/))<ep(x, у)
для всех пар х, у из X. Элемент х е X называется неподвижной точкой отображения F, если F(x)=x. Отображение
F о р о ... о р k раз
обозначается символом Fk (т. е. F2(x) = F (F(x)), F3(x) = F(F(F(x))) ит. д.).
Принцип сжимающих отображений. Пусть X — полное метрическое пространство и F — отображение пространства X в себя такое, что для некоторого натурального & > 0 отображение Fk — сжимающее. Гогда в X существует ровно одна неподвижная точка отображения F.
0.1.3. Теорема Хана — Банаха. Пусть X — линейное топологическое пространство, А с: X — выпуклое открытое множество и LciX — подпространство, не имеющее общих точек с множеством А. Тогда на X существует не* прерывный линейный функционал х* такой, что
<х*, х) > 0 для всех х е А, (х*, х) = 0 для всех хе L.
Укажем три важных следствия из теоремы Хана — Банаха.
Следствие 1. Пусть X — отделимое локально выпуклое линейное топологическое пространство. Тогда для всякого х е X, х У= 0 найдется функционал х* е X* такой, что (х*, х)=#0.
Доказательство. Положим L = {0}, в качестве А возьмем произвольную выпуклую окрестность точки х, не содержащую нуля, и применим теорему.
Аннулятором линейного подпространства L локально выпуклого линейного топологического пространства X называется множество
L1 = {.V* е Г | (Z, х) = 0, Vx е L}.
§ 0.1. ФУНКЦИОНАЛЬНЫЙ АНАЛИЗ
25
Следствие 2. Пусть L — замкнутое подпространство отделимого локально выпуклого линейного топологического пространства X. Тогда ' аннулятор подпространства L содержит ненулевой элемент.
Доказательство. Пусть х ф L. Возьмем в качестве множества А выпуклую окрестность точки х, не пересекающуюся с L, и применим теорему к А и L.
Если X — нормированное пространство, то, выбирая в качестве А шар радиуса ||х|| с центром в точке х, получим из следствия 1
Следствие 3. Пусть X — линейное нормированное пространство. Тогда для всякого хеХ, х =/= 0 найдется функционал х* е X* такой, что
(X, х) = ||х||, ||х*||=1.
Часто теореме Хана — Банаха придают форму теоремы отделимости, во многих случаях более удобную для применений. Скажем, что линейный непрерывный функционал х* разделяет множества А и В, если для всех х е А, у В справедливо неравенство
<х’, х) < <х‘, у).
Теорема отделимости. Пусть А и В — выпуклые непересекающиеся множества в линейном топологическом пространстве X. Предположим, что inti4#=0. Тогда на X существует ненулевой непрерывный линейный функционал х*, разделяющий множества А и В.
В § 3.1 мы вернемся к теоремам отделимости.
Лемма о биортогональном базисе. Пусть X — отделимое локально выпуклое линейное топологическое пространство и {хь ..., хп}—конечный набор линейно независимых элементов пространства X. Тогда существуют такие элементы х*<= X*, i — 1, ...» п, (xj, х/) = б//, где
( 1, если i — /, li 1 0, если i^j.
Доказательство. Обозначим через Ц линейную оболочку векторов хь хг-1, xi+i, хп.
26
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
Подпространство £< конечномерно и, значит, замкнуто ^(поскольку X отделимо). Коль скоро векторы Xj, ..., хп линейно независимы, х; ф. Lt. Поэтому существует функционал y*t е X* такой, что х{) ф 0 и — 0 при / I. Положим х* =	хг)-1 у\. Функционалы
xj, ..., х* — искомые.
0.1.4. Теорема Банаха об открытом отображении и обратном операторе. Пусть X и Y — банаховы пространства и A: X —► Y — линейный непрерывный оператор, множество значений которого есть все Y, т. е. 1тА=У. Тогда образ всякого открытого подмножества пространства X открыт в У. В частности, если в дополнение к сформулированным условиям оператор Л взаимно однозначен, т. е. если КегЛ = {0}, то Л — линейный гомеоморфизм.
Мы будем пользоваться не столько этой теоремой, сколько следствиями из нее, которые сейчас докажем.
Лемма о тройке. Пусть X, Y и Z — банаховы пространства и Л: X-*Y, М: X->Z— линейные непрерывные операторы такие, что 1mA = У и Ker Л с Ker М. Тогда существует такой линейный непрерывный оператор N: У -*Z, что М = N ° Л.
Доказательство. Если Axi = Лх2 = у, то и Mxi = Мх2, поскольку по условию Ker Л с Ker М. Поэтому для всякого {/еУ множество М(Л-1(у)) содержит ровно один элемент. Положим Ny = М (Л-1 (</)). Линейность отображения N и равенство N°A = M очевидны. Наконец, если U — открытое подмножество пространства Z, то множество M-1(t/) открыто в X из-за непрерывности оператора М, а по теореме об открытом отображении и множество Л (М-1 (U)) = N-1 (U) открыто в У. Поэтому оператор N непрерывен. Лемма доказана.
Напомним, что если X и У — локально выпуклые линейные топологические пространства и Л: X —♦ У — линейный непрерывный оператор, то сопряженный оператор Л*: У*—►%* определяется равенством (Л*у*,х)= = {у*, Ах) для всех у* е У*, х е X.
Лемма об аннуляторе. Пусть X и У — банаховы пространства мА: X —> У — линейный непрерывный оператор такой, что Im А — У. Тогда
(Кег А)х = 1тА‘ .
§ 0.1. ФУНКЦИОНАЛЬНЫЙ АНАЛИЗ
27
(г. е. аннулятор ядра равен множеству значений сопряженного оператора).
Доказательство. Если	т. е. если
х* * = А*у* при некотором у* е У*, то для любого х е е КегА справедливо равенство
<х*, х) = (А*у\ х) = {у*, Ах) = 0, откуда следует, что х* е (Кег А) .
Пусть, наоборот, х*е(КегА)±, тогда
Кег А с {х е X | <х*, х) = 0} = Кег х*.
Мы можем рассматривать х* как линейный оператор из X в R. Тогда для А: Х-*У и х*: X->R выполнены все условия леммы о тройке. Поэтому существует такой линейный непрерывный функционал у* е У*, что (//*, Ах) = (х*, х) для всякого х. Это значит, что х* = = А*г/*, т. е. х* е 1mA*. Лемма доказана.
Следствие. Пусть Хр ...» х*—линейные непрерывные функционалы на банаховом пространстве X. Положим
L=[x^X|(x*, х) = 0, /=1, ..., п].
Тогда аннулятор подпространства L совпадает с линейной оболочкой точек Хр ..., х’.
Доказательство. Без ограничения общности можно считать, что функционалы х*,..., х* линейно независимы. Рассмотрим оператор A: X->Rn, ставящий в соответствие каждому хеХ вектор Ах, равный (^Хр х), ..., (х*, х)), и применим лемму.
Отметим, что последнее предложение верно для произвольных отделимых локально выпуклых пространств.
0.1.5. Некоторые конкретные пространства. 1. Пространство Сп(Т). Пусть Т — компактное хаусдор-фово пространство. Через Сп(Т) обозначается банахово пространство непрерывных отображений (вектор-функ-ций) из Т в Rn с нормой*)
IIХ( •) 11 = 11 x(«)||c = max|x(0|. ieT
/ п Х’/г
*) Напомним, что ] х | = I (xf)2 ) .
\i=l /
28
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
Нормированная топология пространства Сп(Т) называется топологией равномерной сходимости.
Теорема Рисе а. Всякий линейный непрерывный функционал х* на пространстве С(Т)—СХ(Т) можно единственным образом представить в виде
(х*, х (• )> = J X (/) du,
т
где р— регулярная борелевская мера на Т. При этом Цх’1КрЫ = |ц|(Г), т
где | р | = р+ 4- р-, а р+ и р- — положительная и отрицательная составляющие меры р.
Напомним, что подмножество А компактного хаусдорфова пространства Т называется борелевским, если оно получается из открытых множеств с помощью не более чем счетного числа операций объединения, пересечения и перехода к дополнению. Совокупность всех борелевских подмножеств пространства Т обозначается SB (Г). Множество S3 (Г) содержит дополнения и счетные объединения и пересечения своих элементов. Действительная функция р(4), определенная на S3 (Г), называется борелевской мерой на Г, если она о-аддитивна, т. е. если из 4<eS3(T), i=l, 2, Ai f) Af = 0 при i =£ j следует, что
/°°	\	оо
и U А‘ = 2 и(М
4=1 /	i=l
Если р — борелевская мера на Г, то функции р+(4) = sup {р (В) | В с: А, В<=Ъ(Т)}. р-(4) == — inf {р (В) | В с: 4, ВеЗЗ(Т)}
называются положительной и отрицательной составляющими меры р. Эти функции тоже являются борелевскими мерами на Т. При этом р = р+ — р~. Положительная борелевская мера | р | = р+ + Р~ называется полной вариацией меры р. Борелевская мера р называется регулярной, если для всякого 4е$В(Т) и всякого 8>0 можно указать такое замкнутое множество В cz 4 и такое открытое множество С А, что | р | (4 \ В) < 8, | р | (С \ 4) < е.
Пусть р — борелевская мера на Г и а(0—действительная непрерывная функция на Т. Тогда предел
оо
lim У НШеГ|Ь<а(0<(^ + 1)8})« I а(0^
Е->0	’
£=—оо
существует и называется интегралом по мере р от функции a(f). i
§ 0.1. ФУНКЦИОНАЛЬНЫЙ АНАЛИЗ
29
Подобным образом описывается сопряженное с пространством СП(Т): всякий линейный функционал на Сп(Т) единственным образом представляется в виде
п
где Ц1,	— регулярные борелевские меры на Г;
при этом
В случае, когда Т — [/0, 6L —оо < /0 < 6 < теореме Рисса можно придать такой вид. Именно, всякий линейный непрерывный функционал х* на пространстве Сп ([ Аъ Л]) можно единственным образом представить в виде
п
<х\ х( • )) = (а |х(/о)) + у; f х'(0
i=l ta
где а^Цп, а щ(/), ..., цп(0— функции ограниченной вариации, непрерывные справа и обращающиеся в нуль в точке tQ. (Можно записать по-другому:
п Ц
<x-,x(-)) = 2Jx'(0^(0, 1=1tb
где p/(Z) — функции ограниченной вариации, непрерывные справа, всюду за исключением, быть может, точки /о-) При этом / п	\’/а
||х‘||=|а|+ 2l !»<(•) Р \Z=1	/
/	/ П	у/Л
(соответственно || х* || = 21 И/ (•) I2 /> где через | (•) [
\	М=1	/ /
обозначена полная вариация функции иЛО.
2.	Пространство 61). Это пространство образовано m раз непрерывно дифференцируемыми
30
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
отображениями отрезка [/<>, в Rn. Норма в пространстве Ст задается равенством
Н*(-)И = 11*(-)1|сп = max И*(0(-)11сп.
Покажем, что всякий линейный непрерывный функционал х* на пространстве С“ (|7о, 6]) можно единственным образом представить в виде
п tt
(*., X (•)) = (а | х (t0)) + (6| х (/<>)) + 2 / X1 (0 dHi (О, 1=1
где a^Rn, b^Rn, a p,i(/), .... pn(t) —функции ограниченной вариации, непрерывные справа.
В самом деле, рассмотрим отображение d: Ci->Cn, ставящее в соответствие каждой вектор-функции x'fJeCf ее производную х(-)<^Сп. Ясно, что оператор d линеен и непрерывен, а множество его значений совпадает со всем пространством Сп (Imd = Сп), т. е. он удовлетворяет условиям леммы об аннуляторе. Наконец, ядро оператора d совпадает со множеством тождественно постоянных вектор-функций. Пусть х* е (С?). Обозначим через а, значение функционала х* на вектор-функции, i-я компонента которой тождественно равна единице, а остальные тождественно равны нулю. Рассмотрим функционал х*, определенный формулой
<%;, х(.)> = (х’, х(-))—(a|x(Q),
где a — (alt ап~). Очевидно, x*e(Kerd)x. По лемме об аннуляторе существует функционал	такой,
что x* — d*y*, т. е. такой, что для всех х(-)еС]* справедливо равенство
<х;,х(-)> = </, х(.)>,
из которого в силу теоремы Рисса следует существование вектора b е R" и непрерывных справа функций ограниченной вариации И1(0» •••» Нп(0 таких, что
п tt
{х\, х (•)) = (& | X (Q) + 2 J X1 (о (0.
/=1 /0
§ 0.1. ФУНКЦИОНАЛЬНЫЙ АНАЛИЗ
31
откуда п tt
« х (•)) = (а | х (/0)) + (Ь | х (to)) + 2 J х1 (0 dHi (t).
Z=1 /а
Единственность этого представления проверяется непосредственно.
3.	Пространства £р([4ъ 6]). При 1^р< оо символом Lp ([/о, Л]) обозначается банахово пространство измеримых по Лебегу отображений отрезка [f0, ^i] в для которых интеграл
ft
/ I X(t) fdt
fo
конечен. Норма в пространстве Lp ([Zo, 6]) задается равенством
/ Л	х 1/Р
Цх(-)||=||х(.)||р = Н|х(0ГЛ .
Vo	/
Через А«([А), Л]) обозначается банахово пространство измеримых отображений отрезка [f0, Л] в R", ограниченных на некотором множестве полной меры. Норма в пространстве L«([/o, 0]) задается равенством
Цх(-)||=||х( •)||00 = sup vrai|x(0l, где
sup vrai a (t) — inf { sup В (t) | В (t) — a (t) почти всюду}.
t- <<</,
В дальнейшем мы вместо supvraia(Z) пишем обычно просто supa(/).
При 1 p<ot> пространство, сопряженное с Lp ([/о, 01), отождествимо с Ар'фо, 0]), где 1/р+!///=!; иначе говоря, всякий линейный непрерывный функционал х* на пространстве Lp единственным образом можно представить в виде
ft
(х‘, х( •)) = J (у (01 X (t)) dt, f®
32
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
где у (•) е LnP’. При этом
II х-11=11 H-)IU
При р = 2 пространство Л"(По, Л]) превращается в гильбертово пространство, если задать скалярное произведение следующим образом:
И•)!«/( • )) = f (х(0
4.	Пространства Wp, от([/о, 6]). Символом Wp,m([^o, б]) обозначается банахово пространство абсолютно непрерывных вместе со своими производными до порядка гп — 1 включительно отображений отрезка [/0, 0] в R", m-я производная которых принадлежит L*. Норма в Wp, т может быть задана многими эквивалентными способами. Например,
m—1
||х(.)||=2 |х(0('о)1 + 1|х(т>(-)11р»
i=0
ИЛИ
т
||х( .)||= 2||х<‘>(-)||р.
i=0
Всякий линейный непрерывный функционал х* на пространстве	Л]) (1	< оо) можно единствен-
ным образом представить в виде
m—1	tt
<Л *(•)> = £ («I|x(i)tfo))+ / <=а	t.
где a0 (= R", .... am_i <= Rn, a #(•)<=	(1/p + !//== l)t
Доказательство этого факта строится по той же схеме, что и для функционалов на С?.
При р = 2 пространство W2, m ([fo, 61) превращается в гильбертово пространство, если задать скалярное произведение следующим образом:
m—1	ti
(X (•), у (•)) = X (*(i) (*о) I y{i} (^0)) + J (х^ (0 | уМ (0) di.
§ 0.2. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ
33
Подобным же образом можно ввести пространства Ст(Г), Ар(Г), Fp,m(r), где Т — ограниченная (в случае пространства — замкнутая) область в A-мерном линейном пространстве.
§ 0.2. Дифференциальное исчисление
0.2.1. Первая вариация и производные Гато и Фреше. Пусть X и У — линейные топологические пространства, [/ — окрестность точки хвХ и F: U -+Y. Допустим, что для любого вектора h е X существует предел
Нт Г1 (F (х + th) — F (х)) = 6F (х, /г). *->0
Тогда отображение h—+8F(х, ft) называется первой вариацией отображения F в точке х. Если первая вариация— линейное непрерывное отображение, т. е. если существует линейный непрерывный оператор A: X -> У такой, что Aft=6F(x, ft), то оператор А называется производной, или дифференциалом Гато отображения F в точке х и обозначается F'r(x) или просто F'(x), если это не вызывает недоразумений. Про само отображение F в этом случае говорят, что оно дифференцируемо по Гато в точке х. Другими словами, отображение F дифференцируемо по Гато в точке х в том и только том случае, когда существует линейный непрерывный оператор A: X —> У такой, что для всякого ft е X:
F(x + ih) = F (х) + tAh + о (0.
Пусть X и У—банаховы пространства и F — отображение окрестности U точки хеХвУ. Говорят, что отображение F дифференцируемо по Фреше, или сильно дифференцируемо в точке х, если существует такой линейный непрерывный оператор A: X -* У, что
F (х + А) == F(x) + Ай + г (h), где
IIГ (А) пг - IIЛ Ц-1-> 0 при ||Л||х-^0.
Сам оператор А называется при этом производной, или дифференциалом Фреше отображения F в точке х и
2 А. Д. Иоффе, В. М. Тихомиров
34
0. ВВЕДЕНИЕ, ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
обозначается Ff(x), а чаще — просто F'(x). Отображение F: X —* Y назовем регулярным в точке х, если оно дифференцируемо по Фреше в этой точке и
ImF' (х) = У.
Напомним: если X и У—банаховы пространства, то равномерной операторной топологией в пространстве S?(X, Y) линейных непрерывных отображений из X в У называется топология, порождаемая нормой
|| A ||= sup (||Ах ||г/|| х ||х). х е X
Пусть U — открытое подмножество пространства X, F: X-+Y и пространства X, Y — банаховы. Если для всех точек множества V существует производная Е'(х) и отображение х—*F'(x) непрерывно относительно равномерной операторной топологии пространства S£(X, Y) в U (в точке Xq е U), то говорят, что F непрерывно дифференцируемо в U (в точке Хо), или еще, что F есть отображение класса С\ в U (в точке Хо).
Производная функционала f(x) есть элемент сопряженного пространства. При этом
f(x + h)-f(x) = {f'(x), h) + о(||Л||).
Точка х, где f'(x) — O, называется стационарной.
Если X — гильбертово пространство, то X* можно отождествить с X. В этом случае производные функционалов, заданных на X, оказываются элементами самого пространства X и их называют градиентами. Иногда градиент функции f в точке х обозначают символом gradf(x).
Предложение 1. Справедливы следующие утверждения:
а)	операторы F'v (х) и F'f (х) определены однозначно*
б)	если отображение F окрестности точки х банахова пространства X в банахово пространство Y дифференцируемо по Фреше в точке х, то оно непрерывно в этой точке, дифференцируемо в этой точке по Гато и
F'(x) = ^(x);
в)	если отображение F окрестности точки х линейного топологического пространства X в линейное топо-
§ 0.2. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ
35
'логическое пространство Y дифференцируемо в точке х по Гато, то в этой точке определена первая вариация этого отображения и
F'r(x) h = 6F(x, h).
f Доказательство элементарно.
Пусть F: Rn—>Rm, т. е. F(x) = (f{(x), ..., fm(x)). Если отображение F дифференцируемо по Фреше в точке х, то его производная в стандартных базисах пространств Rn и Rm задается матрицей
hi. = ---:-- .
называемой матрицей Якоби. Другими словами, для всякого вектора зе Rn
(F(x)z)ft = 2
dxl
Введенные выше понятия оказываются различными даже для функций на плоскости R2. Вот два примера, иллюстрирующие эти различия.
1. Функция f(x), заданная равенством (х = (х1, х2)) z . fl, если х1 = (х2)2, х2 #= 0, f (х) = <
i 0 в остальных точках, дифференцируема по Гато в начале координат, где она даже не непрерывна, и тем более, не дифференцируема по Фреше.
2. Рассмотрим функцию, заданную в полярных координатах равенством
f (х) = г cos Зф.
В этом случае 6/(0, h)= f(h). Мы видим, что f имеет первую вариацию, но не дифференцируема по Гато, ибо первая вариация нелинейна по h.
Пусть банахово пространство X есть декартово произведение банаховых пространств Ад и Х2, т. е. X =. —	и F — отображение некоторой окрестности
точки (хь х2) е X в банахово пространство У. Тогда мы можем рассмотреть частные отображения
Fi. Xi-^P(xi, х2), Р2: x2-^F(xi, х2).
2*
36
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
Будем говорить, что отображение F сильно дифференцируемо по первой (соответственно по второй) координате в точке (xi,x2), если отображение Fi (соответственно F2) дифференцируемо по Фреше в точке (соответственно х2). Производные отображений и F2 обозна-
г. г. (	дР dF \
чаются символами FXl и Fx, I или и и называются частными производными по Xi и х2 соответственно. Очевидно,
FXi: Xi-+Y> Z=l, 2.
Если же отображение F дифференцируемо по Фреше, то
F' (xi, х2) (xi, х2) = FXl (хь х2) xi + FX2(xi, хг- х2
для всех (xb х2) U.
0.2.2. Старшие производные. Пусть снова X и У — линейные топологические пространства, t/czzX — окрестность точки х и F: U —► У. Допустим, что для любого вектора h^X функция фЛ(/) = F(x +/й) дифференцируема в нуле п раз. Тогда отображение ft-*6nF(x, й) (из X в У), где
d"F(x, й)=-^фЖо.
называется n-й вариацией отображения F в точке х.
Определение старших производных по Гато далее не понадобится, и мы его не приводим. Определение старших производных по Фреше строится индуктивно. Пусть X и У — банаховы пространства и F: X —♦ У. Первую производную мы уже определили. Допустим, что отображение F дифференцируемо по Фреше в некоторой окрестности точки х. Тогда х—*F'(x) есть отображение этой окрестности в пространство 2 {X, У). Если оно дифференцируемо по Фреше в точке х (при условии, что пространство £ (X, У) рассматривается вместе с сильной операторной топологией), то его производную называют второй производной отображения F в точке х и обозначают F"(x) и т. д.
Можно указать и другое равносильное определение второй производной. Пусть Z] и Z2— линейные пространства. Отображение В: Zy^Z^-^Y называется билинейным, если частные отображения zt —»В (zb z2) и
§ 0.2. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ
37
z2) линейны при всяких 22gZ21 z\ е Zb Если пространства Zb Z2 и У — банаховы, то отображение В непрерывно в том и только том случае, когда при некотором с > 0 неравенство
||B(2l, z.,) || <с|| z, ЦП *2 II
выполняется при всех Z\ е Zb z2 е Z2. Множество всех непрерывных билинейных отображений из Z[ X 22 в У есть линейное пространство, являющееся банаховым относительно нормы
|| В || = sup{|| В (zb z2)||| || z, ||< 1, ||z2IK 1}.
Это пространство будем в дальнейшем обозначать символом 2?((ZbZ2), У). Билинейное отображение называется симметричным, если Z] = Z2 и B(zltz2) = = B(z2, Zi).
Пусть теперь F — непрерывно дифференцируемое по Фреше отображение открытого множества U банахова пространства X в банахово пространство У. Мы скажем, что отображение F дважды дифференцируемо по Фреше в точке х е U, если существует такое симметричное билинейное отображение В: Х%Х—> У, что
F(x + h) = F(x) + F'(x)h + l/2B(h, h)+r(h), где
II г (А) ||Г/Ц А ||2 -0 при ||й||л->0.
Квадратичная форма В(й, й) называется второй производной отображения F в точке х и обозначается F"(x) (h,h). Нетрудно понять, что оба введенных определения действительно равносильны. Таким же образом при помощи полилинейных отображений можно ввести определения производных более высокого порядка, однако в книге эти производные не встречаются, и мы опускаем эти определения.
Если в рассмотренной выше ситуации отображение F дважды дифференцируемо по Фреше в каждой точке множества U и при этом отображение x-*F"(x) непрерывно, то говорят, что отображение F дважды непрерывно дифференцируемо в U, или еще, что F есть ото* брожение класса С2.
38
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
Непосредственно из определений следует
Предложение 2. Если отображение F дважды дифференцируемо по Фреше в точке х, то в этой точке определена и вторая вариация отображения F. При этом
62F(x, h) = F"(x) (ft, ft).
0.2.3. Основные теоремы дифференциального исчисления.
Теорема о дифференцировании сложной функции. Пусть X, Y и Z — банаховы пространства, U — открытое подмножество пространства X, а V — открытое подмножество пространства У. Пусть, далее, заданы отображения F: U—+Y и G: V—>Z. Предположим, наконец, что точка x^U такова, что F(x)<= е V. Тогда, если отображение F дифференцируемо по Фреше в точке х, а отображение G дифференцируемо по Фреше в точке F(x), то отображение Н = G°F дифференцируемо по Фреше в точке х и при этом
H'(x) = G'(F(x))<>F'(x).
Из этой теоремы сразу следует линейное свойство производных: производная отображения аЛ + pF2 (где a, peR) в точке х равна aF' (х) + pF' (*)» если, разумеется, отображения F\ и Р2 дифференцируемы в точке х.
Теорема о среднем значении. Пусть X и Y — линейные топологические пространства, U — открытое множество в X и отображение F: U -> У дифференцируемо по Гато в каждой точке отрезка*) [%, x + ft]cz cz U. Тогда
а)	если отображение z-+F'T (г) h является непрерывным отображением отрезка [х, х + ft] в У, то
1
F(x + h)~F(x) = J F'T(x + ih) h dt;
о
б)	если, кроме того, пространства X и У —банаховы, то
|| F (х + ft) - F (х) II<o<sup 11|F'T (x + th)]\ -ИЛИ
*) Отрезком, соединяющим точки xi и х2, называется множество вида [xi, х2] = {х|х = axi + (1 — a)x2, 0 a 1}.
§ 0.2. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ
39
и для всякого Л (X, У)
|| F(х + h) — F(x) — Ah ll<o|up (||F'r(x + th) — A| • || h ||.
В частности, для всякой точки z е [х, х + h]
||F(x + ^)-F(x)-FH2)a||<
< о suР , II F'r (х + /А) ~ Fr (2> || • IIh II-
Доказательство. Положим <p(Q — F(x 4- th), По определению производной Гато
^Р- = ^(х + /Л)й
при всех ^^[0, 1]. Утверждение а) следует теперь из классической формулы Ньютона — Лейбница. Утверждение б), в свою очередь, является простым следствием из а), поскольку
1
J Fp (х + th) h dt
о
sup
F'r (х + th)
•IIЛ ||.
О t < 1
Доказанная теорема может рассматриваться как бесконечномерный вариант классической формулы конечных приращений Лагранжа. Заметим, что формула конечных приращений для отображений в пространства размерности, большей единицы, уже не верна.
Следствие. Пусть X — банахово пространство и F — непрерывное отображение окрестности U точки xQ s X в банахово пространство У. Предположим, что отображение F дифференцируемо по Гато в каждой точке множества U и при этом отображение x->Fr(x)' из U в У) (рассматриваемое с равномерной операторной топологией) непрерывно. Тогда F дифферент цируемо на U по Фреше и для всех х е U
F'r(x) = F'p(x).
Доказательство. По теореме о среднем зна* чении
И(«„ + Ч- F(xa)-
< ,Prh + "")-
40
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
Поскольку отображение x->Fp(x) непрерывно, для всякого в > 0 найдется б > 0 такое, что из
IIX — х0||< б следует, что
Поэтому
IIF (х0 + h) - F (х0) - F' (х0) h || = о (|| h ||),
а это и означает дифференцируемость отображения F по Фреше. Наконец, заключительная формула следует из предложения 1.
С последним утверждением близко связан следую-щий известный результат.
Теорема Ш в а р ц а. Пусть Хь Х2, Y—банаховы пространства и F — отображение открытого множества U czX! Х^2 в Y. Предположим, что F дифференцируемо по обеим координатам в множестве U и что отображения
(xi, x2)->FXl(xi, х2), (Xi, X2)“>FX2(Xi, х2)
множества U в Y) и 3?(Х2, У) соответственно непрерывны. Тогда F непрерывно дифференцируемо по Фреше на U.
Теорема о неявной функции. Пусть X, Y, Z — банаховы пространства, U — окрестность точки (х0, Уо) в декартовом произведении X X У и F: U —+Z — отображение класса Предположим далее, что F (х0, г/о) — 0 и частная производная Fy (х0, у о): У —► Z есть линейный гомеоморфизм. Тогда найдутся числа в > 0, б>0 и отображение х—*у(х) шара U(xQ,6)c7.X в шар U (yQ,E)czY такие, что
а)	на множестве U(х0, б) X U(f/o, е) соотношения F(x,y)= 0 и у = у(х) равносильны;
б)	у(х) есть отображение класса Сх и для всякого х<=и(х0, б)
у' (х) = —	(х, у (х))]-1 о Fx (х, у (х)).
0.	2.4. Теорема Л юстерника. Пусть М — подмножество банахова пространства X. Вектор хеХ'называют касательным к множеству М в точке х0 е М, если суще-
§ 0.2. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ
41
ствуют 8>0 и отображение	отрезка [0, е] в X
такие, что
х0 + ^х + г (/) е М при всех t е [0, е],
II г (/) II// -> 0	при/—>0.
Нетрудно проверить, что совокупность векторов, касательных к множеству М в некоторой точке, есть замкнутый конус (непустой, ибо он содержит нуль), называемый обычно касательным конусом к множеству М в точке х0. Если этот конус является подпространством, то он называется касательным пространством к множеству М в точке х0 и обозначается ТЛ1(Хо).
Теорема Люстерника. Пусть X и Y — банаховы пространства, U — окрестность точки х0 е X и F — дифференцируемое по Фреше отображение множества U в Y. Предположим, что отображение F регулярно в точке х0, т. е.
Im F' (х0) = У,
и его производная непрерывна в этой точке {в равномерной операторной топологии пространства 2? (X, У)). Тогда касательное пространство к множеству
M = {x^U\F(x)==F(xQ)}
в точке х0 совпадает с ядром оператора Fz(x0):
ТЛ4 (х0) = Ker F'(х0).
Более того, при выполнении условий теоремы существуют окрестность U' cz U точки х0, число К > 0 и отображение >х(£) множества U' в X такие, что
F£ + x®) = F(x0), \\x^\\^F\\F^-F(x0)\\ при всех g е U'.
Прежде чем доказывать теорему Люстерника, отметим, что первое ее утверждение является очевидным следствием второго утверждения и определений. В самом деле, в условиях теоремы всякий касательный вектор к множеству М в точке х0 принадлежит ядру оператора F'(xq), т. е.
ТМ (х0) cz KerF' (х0).
42
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
Это сразу вытекает из определения касательного вектора. С другой стороны, если второе утверждение теоремы верно и g е Ker F'(xq), то при достаточно малых t > 0, очевидно, Хо + е U', ||F(x0 +.	— F (xQ) || =
= о(0» F(xq + + r(t))= F(xo), где r(t) = = x(xo + ^) и \\r(t)\\^K[\F(xQ + tl)-F{xQ)\\ = o(t).
Второе утверждение теоремы Люстерника выведем из несколько более общей теоремы, которой, в свою очередь, предпошлем три вспомогательные леммы. Первая из этих лемм представляет собой «многозначное» обобщение принципа сжимающих отображений и имеет вполне самостоятельное значение.
Пусть X и У — некоторые множества. Через 2Г обозначается совокупность всех подмножеств множества У. Всякое отображение Ф: X —>2Г называется многозначным отображением из X в У.
Пусть Z — метрическое пространство с расстоянием р. Если Ai cz Z и А2 cz Z, то уклонением множества At ат множества А2 называется величина
б (Ль Л2) = sup р (г, Л2) = sup inf р (г, w).
z^At	z^AlW^Ai
Хаусдорфовым расстоянием между множествами At и Л2 называется максимальное из уклонений б(Ль Л2), б(Л2, Л1):
h (А[, Л2)== шах {б (Л{, Л2), б(Л2, Л^)}.
Из определения сразу следует, что в случае, когда й(Л1, Л2)<а, для всякого Zie^ найдется такое г2 е А2, что p(zi, z2) < а.
Пусть Ф — многозначное отображение пространства z в себя. Мы назовем его сжимающим на множестве Л cz Z, если найдется такое число 0, 0 < 0 < 1, что неравенство
/г(Ф(£1), O(z2)X0p(zb Z2)
выполняется для любых Zi и Z2 из А.
Лемма 1 (принцип сжимающих многозначных отображений). Пусть Z — полное метрическое пространство с расстоянием р и в некотором шаре U(z0,r) = = {z|p(z, z0)<; г] (г > 0) определено многозначное отображение
Ф: U (ze, r)->2z,
§ 0.2. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ
43
причем множества Ф(г) не пусты и замкнуты для всякого z <= U (z0, г). Предположим далее, что существует число 0, 0 < 0 < 1, такое, что
a) h (Ф (zd, Ф (z2))^0p (zb z2) для любых zbz2^U (z0, г), б) p(z0, <D(z0)) < (1 — 0)г.
Тогда для всякого числа ri, удовлетворяющего неравенству
р(20, Ф (Zq)) < Г] < (1 — 0) г,
существует такой элемент z^B (z0, у 2. е)={ ® IР 2о)^
<тМ’ что
z е Ф (z).	(1)
Более того, среди точек z, удовлетворяющих этим условиям, найдется такая, что
Р (2. 2о) < Т~0 Р (2о> Ф (2о))•	(2)
Доказательство. Начнем с построения последовательности ?о, 21, ... такой, что
Zn «= и (z0, г) 2„еФ(гп_!) р (z„+b z„) < eVj
при п = 0, 1, ..., при п— 1, 2, ..., при п = 0, 1, ...
Эту последовательность будем строить индуктивно. Элемент Zq — тот же, что и в условии леммы, a zt — произвольный элемент из Ф(го) такой, что p(z0, Zi) < Допустим, что мы уже выбрали первые п -f- 1 элементов последовательности Zo, .... zn. Тогда
h (Ф (z„), Ф (z„_,)) < 0р (z„, zre_!) < eVp
Отсюда следует существование такого zn+i^O(2n)J
ЧТО p(zn+i, zn) < 0%
Далее, по неравенству треугольника, если m
п + 1,
Р	Р 2& + 1) “Ь • • • + Р 4-т—1> ^Л+m) <
< (0й + ... + О6*'"-1) гх < гь (3)
44
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
Отсюда следует, что
Р (г0, г„+1) <	< г,
т. е. zn+1 е U (г0, г). Элемент гп+1 построен, индукция закончена.
Из (3) следует, что последовательность z0,	...
фундаментальна, и, поскольку пространство Z полно, она сходится к некоторому элементу ге 4 Переходя к пределу в неравенстве
Р	< 1 __q »
мы получаем, что zgB(20Ji/(1—0))cz U(zot г). С другой стороны,
р (гп+1, Ф (г)) < 6 (Ф (г„), Ф (г)) <
<й(Ф(гп), Ф(г))<0р(гп, г)->0.
Отсюда следует существование последовательности Wo, ... элементов множества Ф(г), которая сходится к z. Поэтому 2ЕФ(г), поскольку по условию множество Ф(г) замкнуто. Соотношение (1) доказано.
Если р(г0, Ф(го)) = 0, то гоеФ(го) и (2) очевидно. Если же р(2о,Ф(го))> 0, то мы выберем и так, чтобы
•у-<р(*о. ф(го)) <n < (1 —9)г.
и для этого и найдем точку ге B(zo, п/(1 — 0)), удовлетворяющую соотношению (1). Тогда
Р (2о, Z) < ~g- <	Р (z0, Ф (г0)).
Лемма доказана.
Лемма 2. Пусть X — банахово пространство и Mlf М2 — линейные многообразия в X, являющиеся сдвигами одного и того же подпространства L. Тогда
h (Afb М2) = б (Мь М2) = б (М2, Мг) =
= inf (II Xi — х2 HI Xi e= Mh x2e=M2}.
Доказательство. Достаточно проверить, что
Р (Xi, М2) = р (х2, АГ,)
§ 0.2 ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ
45
для всяких XjeAlb х2<=М2. Пусть х^М1г х2еМ2; положим а( = р(хь Af2), а2 = р (х2, AfJ. Если х2 — произвольный элемент многообразия Af2 и x{ = x2 + (xi—х2), то, очевидно, х{еЛ1(. Имеем
а2<||х2 —xi|| = || Xi — х2||.
Это неравенство справедливо для всякого х2 <= ЛГ2. Поэтому
а2^а,.
Так же проверяется, что ai а2. Лемма доказана.
Л е м м а 3. Лусть X и Y — банаховы пространства и Д ^3? (X, У). Положим
С (А) = sup (|| у Г1 • inf {|| х || | х е X, Ах = у}).
у^У
Тогда, если ImA — Y, то C(A)<Z оо.
Доказательство. Если 1шА~У, то по теореме Банаха об открытом отображении образ единичного шара пространства X при отображении А содержит окрестность нуля в Y, т. е. существует такое б > 0, что для всякого у е У, \\у\\ б, найдется х^Х такой, что Hxll^l и Ах = у. Поэтому для любого у е У, У =/= 0,
inf {||х|| |хе X, Ах = у]~
= б-1 IIУII • inf {IIXII |х е X, Ах = бII у Г1 i/} < d-‘ II у II
и, значит, С(А)^ б'1. Лемма доказана.
Обобщенная теорема Люстерника. Пусть X и Y — банаховы пространства, A е 3? (X, У) и F — отображение некоторой окрестности U точки Xq^X в У. Предположим, что 1mA = У и существует число б > 0 такое, что, во-первых,
6С (А) < ’/2
и, во-вторых,
|| F(x) - Fix') - А (х - х') ||<б|| х - х'||	(4)
для всех х, х' из U. Тогда существуют окрестности, U' с U точки Хо, число К > 0 и отображение g—*х(^,
46
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
окрестности U' в X такие, что
для всех g е U'.
Доказательство. Выберем г>0 так, чтобы шар U (х0,2г) принадлежал окрестности U. Из (4) следует, что отображение F непрерывно в точке Хо. Поэтому можно указать такую окрестность U' с: U (хо, г) точки Хо, что
С (Л) sup||F(|)-F(x0)||<£	(5)
£el/'	2
(С (Л) < оо в силу леммы 3).
Зафиксируем некоторое § е U' и рассмотрим многозначное отображение х—►Ч^(х) шара {7(0, г) в X, определенное формулой
ЧЧ (х) = х - Л-’ (F Й + х) - F (х0)),
где через A-1(z/) обозначен полный прообраз точки у при отображении Л. В силу выбора г и U', g + х е J7 при всяких l^U', x^U(0,r), так, что множества ЧЧ(х) не пусты при всех хе 1/(0, г). Для всякого у <= У. множество Аг1 (у) есть линейное многообразие, параллельное подпространству КегЛ, таковы же и множества ЧЧ(х). В частности, все они замкнуты. Имеем в силу лемм 2 и 3
h (ЧЧ (х,). ЧЧ (х2)) = inf {|| Zl - z21| \Zl e= ЧЧ (xz), /=1,2} = = inf {|| z, — z21|| Azt- = Ax; - F (g + xz) + F (x0), i = 1,2}= = inf {|| z HI Az = Л (X! - x2) - F (* + *.) + F (g + x2)} <
< C (A)|| F (g + x.) —F (g + x2) - A (x, — x2) ||.
Отсюда, используя неравенство (4) и полагая 0=бС(Л) (0 < 1/2 по условию), получаем
M¥UxI),'I4(x2))<0|1x1-x2||.	(6)
Далее, в силу (5)
Р (0, **Ч (0)) = inf {|| z || | Kz = - F ® + F (х0)) <
< С (Л) || F (|) - F (х0) || < >/2 г < (1 - 0) г. (7)
§ 0.2. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ
47
Соотношения (6), (7) показывают, что отображение цг^(х) удовлетворяет всем условиям леммы 1. Поэтому существует такой вектор х=х(1), что, с одной стороны, хЙ)е^(х(Ю), т. е.
и, следовательно,
F£ + x®) = F(x0), а, с другой, в силу промежуточного неравенства в (7) — И*ШК-14ё-р(0, ЧМО))<
< IIР (I) - F (х0) || = К || F (I) - F (х0) II.
Теорема доказана.
Теорема Люстерника, точнее, ее второе утверждение, является очевидным следствием только что доказанной обобщенной теоремы. В самом деле, пусть выполнены условия теоремы Люстерника. Положим А = = F'(xq). Поскольку по условию отображение х—>Fz(x) непрерывно, мы можем указать такую выпуклую окрестность t7i cz U точки х0, что для всех х е Ut
|| F' (х) — Л || = sup (|| z Г* (F' (х) z — Az)) <	*Л) .
Тогда по теореме о среднем значении для всяких х, х' из
||F(x)-F(x')-A(x-x')||<
< sup (||F'(z) — Л||-||х — х'||) <2т4лг11х — x'lk z<=[x,x']
откуда все и следует. Теорема Люстерника полностью доказана.
0.2.5. Дифференцируемость некоторых функционалов и отображений. Пример 1. Аффинные отображения. Отображение А: X—* У одного линейного пространства в другое называется аффинным, если
А (х) = Ах + а,
48
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
где а е У, а Л — линейное отображение из X в У. Если X и У — банаховы пространства и Л — линейное непрерывное отображение, то отображение А всюду дифференцируемо по Фреше и
А' (х) = Л,
а вторая и последующие производные отображения А равны нулю. Это следует прямо из определений. В частности, для аффинной функции
а (х) = <х‘, х) + а
производная Фреше в любой точке х равна х*.
Пример 2. Квадратичные функции. Пусть X — банахово пространство, В (xi, Хг) — непрерывная билинейная функция на X X X и Q(x) = B(x, х)—соответствующая квадратичная форма. По определению
Q(x + h) = В(х, х) + В(х, Л) + В (h, х) + B(h, h) =
= Q (х) + В (х, ft) + В (h, х) + о (|| h ||).
Таким образом, функция Q дифференцируема по Фреше и
Q' (х) h = В (х, fi) + В (fi, х).
В частности, если X — гильбертово пространство, то всякая квадратичная форма имеет вид
Q(x) = 4-(Лх |х), At=£(X, X), Л‘ = Л /л
и
Q' (х) = Ах.
Квадратичной функцией в гильбертовом пространстве называется сумма квадратичной формы и аффинной функции:
k (х) = у (Лх |х) + (х Iа) + а.
Очевидно,
k'(x) = Дх + а.
Вторая производная функции k(x) равна, конечно, Л:
£"(х) = Л,
§ 0.2. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ
49
а остальные производные равны нулю. В частности, если
е(х)==1/2||Х||2=1/2(х|х))
ТО
е' (х) = х, е" (х) = I, е"’ (х) = ... =0.
Отметим следующее соотношение для квадратичных форм:
Q (х0 + х) = Q (х0) + Q' (х0) х + Q (х).
Пример 3. Норма в гильбертовом пространстве. Функция
f(x)=||x|| дифференцируема по Фреше в любой точке х, отличной от нуля, а ее производная равна
f (х) = ||х|Г,х.
Это сразу следует из формулы дифференцируемости сложной функции, если учесть, что
f = g°h, где /г(х) = (х|х), a g(t) = Vt.
Переходим к получению формул для производных конкретных функционалов и отображений, которые понадобятся нам при выводе необходимых условий экстремума в вариационном исчислении и теории оптимального управления.
Пример 4. Пусть отображение h\ Rn->Rm: /г (х) =	(х), .... hm(x))
определено и непрерывно дифференцируемо в окрестности U точки Хо е R". Рассмотрим отображение
Ят(х(-)): С’(Ко, определенное соотношением Ят(х(.)) = Л(х(т)), где т — некоторая фиксированная точка отрезка [/о, М-Это отображение определено на множестве таких х(-)е Cn([/o, ^i]), что х(т)е(Л Покажем, что если при
60
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
этом хо(т) = хо, то отображение Нх дифференцируемо по Фреше в точке х0(-), и вычислим его производную. Имеем
h (х0 + х) = h (х0) + (h' (х0) I х) + о (| х |).
Поэтому
Нх (х0 (•) + х (•)) = h (х0 (т)) + (h' (Хо (т)) | х (т)) + о (| х (т) |).
Но | х (т) | || х (•) ||. Следовательно, Нх(х0(-) + х(-)) =
= Нх(х0 (•)) + (h'(х0(т)) |х (т)) 4- о (|| х(•) ||). Это значит, что отображение Нх дифференцируемо по Фреше в точке х0(-) и его производная равна
Нх (хо (•)) х ( •) = (h' (хо (т)) |х (т)), или в координатной форме
(Ят(х0( •)х(• ))f = У-д-‘ xJ(т),	1=1, ..., т.
OXJ
Пример 5. Пусть gi(t,x), ..., gm(t, х) — действительные функции, определенные, непрерывные и непрерывно дифференцируемые по х в открытом множестве U cz R X Rn. Положим
g{t, x) = (gi(t, х).gm(t, х)).
Предположим, что график непрерывной вектор-функ-ции хо(О: I'o, ^i] ~* Rn принадлежит области (7, и рассмотрим отображение
G: Cn(no,M)->Cw([/o,M), определенное соотношением [G(X(.))](O = £(/,X(O), Покажем, что это отображение дифференцируемо по Фреше в точке Хо(-), и вычислим его производную.
Для этого мы воспользуемся следствием из теоремы о среднем. Проверим, что отображение G дифференцируемо по Гато в некоторой окрестности точки Хо(-) и его производная Гато непрерывна. Поскольку множе
§ 0.2. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ
51
ство U открыто, мы можем указать такое е > 0, что из |хо(О_х1<8 следует, что (/, x)t=U. Если же ||х(->—Хо(-)11с < е, то
lim Г G.(x(,) + Zz(l)).~G(x<-)11 (/) = gx (/, х (/)) z
Л->0 L	л	J
т. е.
[<?г (*(•))г (•)] (0 = gx (t, х (0) z (0-
Непрерывность отображения х (•) —> G'r (х (•)) сразу следует из непрерывности отображения (t, x)—*gx(t, х), Итак, отображение G дифференцируемо по Фреше и
[G'(x0( • ))z( -)](0 = ^(Л x0(0)z(0.
Пример 6. Пусть <Р1(Л х, и), q>m(t,x,u)—действительные функции, определенные, непрерывные и непрерывно дифференцируемые по х и и в некоторой области V пространства R X Rn X Rr. Положим
Ф (t, х, и) = (ф! (t, х, и), ..фт(/, х, и)).
Предположим, что вектор-функции Хо (•) С" ([/0, Л]) и «0( •) е Сг([£0» М) таковы, что (t, х0(/), м0 (/)) V при всех t е [Zo, Рассмотрим отображение
Ф: С? ([f0, t,]) X сг ([f0, М) -> Ст([/0, Л]),
[Ф(х(-), «(•))](0 = ф(^, x(t), и (t)),
Дословное повторение рассуждений из предыдущего примера позволяет доказать, что отображение Ф дифференцируемо по Фреше в точке (хо(-), Но(-)) и
[Ф'(х0(-)» Ho(-))(z(-).M-))](0 =
= фх (t, Х0 (0, «0 (0) 2! (0 + Фи (Л XQ (0, «о (0) (0.
Пример 7. Пусть m(t, х, у) — отображение в Rm, определенное, непрерывное и непрерывно дифференцируемое по х и у в некоторой области W с: R X Rn X X Rn. Предположим, что непрерывно дифференцируемая на [Zq,вектор-функция Xo(t) такова, что (t,x0(t), xo(t))e W при всех t е [/0Д1]. Рассмотрим отображение
52
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
определенное соотношением
[М (х (.))] (0 = tn (t, X (/), X (/)), /о < t < tx.
Отображение М есть, как легко видеть, суперпозиция двух отображений:
М ==М2° Мь
где Mi— линейное отображение из Сх в Сп\Сп:
[А11(х(-))](0 = (х(0,х(0)> t0<t <0,
а отображение М2: Сп \Сп->-Ст определяется так:	••
[М2(х( •), у (•))](/) = m(t, x(t),
Из предыдущего примера и из теоремы о производной суперпозиции отображений следует, что отображение М дифференцируемо по Фреше в точке х0(-) и
[М'(х0(•))*( •)](/) =
= тх (t, х0 (0, х0 (0) z (0 + ту (t, х0 (0, х0 (0) z (0.
Пример 8. Пусть в условиях предыдущего примера т (t, х,у)= L (t, х, у) — действительная функция. Рассмотрим функционал
5r(x(-)) = J L(t, х (0, x(t))dt.
*0
Этот функционал есть суперпозиция двух отображений
^ = а2о^1г где
СГ([/о,0])^С([/о,0]),
(х(•))] (0 = L (t, х (0, х (0), t0 < t < а
fl
^2(а(-))= f а(0 dt.
fo
Отображение 3f\ есть частный случай отображений, рассмотренных в предыдущем примере, а функционал Sf2 линеен и непрерывен. Сопоставив результаты при
§ 0.2. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ
53
меров 1 и 7, приходим к следующей формуле для производной Фреше отображения
= J (t, x(t),x (0) z (0 + Ly (t, x (0, x(t)) z (01 dt. tf)
Пример 9. Пусть U — некоторая область в Rn и отображение ф: fo,	*RW обладает следующими
свойствами: при всяком t е (/0, Л] отображение х-*ф(/,х) непрерывно дифференцируемо, а при всяком х е U вектор-функция >ф(/, х) измерима. (Мы покажем в гл. 9, что в этих предположениях вектор-функция /->ф(/, х(/)) измерима, если только вектор-функция х(/) измерима и принимает значения в U.) Предположим далее, что определенная и непрерывная на RoJi] вектор-функция х0(/) принимает значения в U при всех	вектор-функция /->ф(/, х0(/)) сум-
мируема и существуют такие 8 > 0 и суммируемая действительная функция р(/), что
Х)1<Р(0.
ЛИШЬ только
I X — хо(0 [< е.
Рассмотрим отображение Т: Сп([/о,	Л]),
определенное соотношением
ГУ(х(-))](0 = Ш х(0),
Пусть ||х(•)—х0(-)||с<е. Тогда при достаточно малых Л > О
I ГУ(х(-) + М-))-У(х(-))-| (/) I =
I L	A	J I
В силу теоремы Лебега об ограниченной сходимости предел левой части последнего соотношения при X—>0 существует и равен
4\(0 X(0)Z(t),
54
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
При ЭТОМ
I ФИ*, x(t)) |<р(0, т. е., поскольку |z(/)| ограничена, вектор-функция фя(/, x(t))z(t) принадлежит пространству Li1 ([to, 6]). Таким образом, отображение Т дифференцируемо по Гато в е-окрестности точки х0(*), [Т'г(х(-))2(-)](/) = фД/,Х (0)2(0,
и |фх(0 x(t)) |	р(0- Отсюда и из непрерывности ото-
бражения х-»фх(7, х) следует, что производная Гато Тг непрерывна. Поэтому отображение Т дифференцируемо по Фреше и
[¥' (х0 (•)) z (•)] (0 = Фх (t, х0 (0) z (0.
Пример 10. Пусть в условиях предыдущего примера ф(/, x)=L(t х)—действительная функция. Тогда, как и в примере 8, убеждаемся, что функционал
л
(х(•)) - J L(/, X(0) dt: Cn([t0, 0D -+ R tj
дифференцируем по Фреше в точке х0(-) и
(Хо ( • )) « ( • ) == J Lx (t, Хо (0) Z (t) dt.
Пример 11. Пусть отображение ф(/, х): [/о,/л]Х XRn-*Rrt — такое же, как и в примере 9. Однако в отличие от примера 9 предположим, что вектор-функция хо(О абсолютно непрерывна, т. е. что х0(-)е е lF"i([fo> 6]). Рассмотрим отображение
F: 1Г”1([/о,М)^Ж>'1]), определенное соотношением
[F(x(-))](t) = x(t) — ^(t,x(t)).
Это отображение есть разность двух отображений: линейного и непрерывного отображения F{: Wi,i ([/о, 6])-»-->Li(Ko, Л]),
Л (*(•)) = *(•)
§ 0.2. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ
55
и отображения F2:	(1Хо, 6] )->£?( [/о, 6]),
Как мы показали, второе отображение дифференцируемо по Фреше, если его рассматривать как отображение из Сп в L". Однако, если х(-) е IFm, то
1|х(.)||с</<||х(.)||^
Поэтому отображение F2:	тоже дифференци-
руемо по Фреше. Сопоставляя результаты примеров 1 и 9, приходим к выводу, что отображение F дифференцируемо по Фреше и
[F' (х0 (•)) z (•)] (0 = г (/) — фх (t, х0 (0) z (/).
0.2.6. Регулярность функционалов и отображений. Рассмотрим здесь лишь несколько самых простых примеров регулярных отображений.
Пример 12. Пусть X — банахово пространство и f — функция на X, дифференцируемая по Фреше. Тогда f регулярна в любой нестационарной точке х.
Действительно, если f'(xo)¥=O, то найдется такой элемент х еХ, что
а =	(х0), х) 0.
Это значит, что множество чисел
/а = <f (х0), tx)
совпадает со всей вещественной прямой R, т. е. f регу' лярна в точке х0.
Пример 13. Пусть отображение F: X->Rn, F(x) = = (f i (х), ..., fn (х)) дифференцируемо по Фреше в точке Хо. Оно регулярно в точке х0 тогда и только тогда, когда векторы f{(х0), .... f'n (х0) линейно независимы.
Необходимость этого условия очевидна. Докажем достаточность. По лемме о биортогональном базисе найдем элементы х{<=Х, i = 1, .... п, такие, что --3'
56
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
Тогда каков бы ни был вектор g = (£*, ..., ^)eRn, (п \
i=l /
т. е. множество значений отображения Fz(x0) есть Rn.
Пример 14. Рассмотрим то же отображение, что и в примере 5, предполагая однако, что т= 1. Если это отображение дифференцируемо по Фреше в точке х0(-), то оно регулярно в этой точке в том и только том случае, когда gx(t,x0(t))=^ 0 при всех
Необходимость этого условия очевидна. Наоборот, если gx(t, xQ(t)) #= 0 при всех	G], то функция
l/gx(t, xQ(t)) непрерывна по условию и какова бы ни была функция z(-)e С([/о,/J),
[G'(M ‘ ))^( • > *о( * И * )](0 = г(0,
т. е. производная G,(x0(-)) отображает С([/о, М) на С([/о, М).
§ 0.3. Выпуклый анализ
В этом параграфе рассказывается о простейших фактах выпуклого анализа, используемых в гл. 1. Более подробно и полно выпуклый анализ изучается в главах 3, 4. Всюду в этом параграфе X — отделимое локально выпуклое линейное топологическое пространство.
0.3.1. Выпуклые множества и функции. Отрезком, соединяющим точки х{ и х2 из X, называется множество
[xi, х2] = {х	X | х = axt + (1 — а) х2, 0 a 1}.
Подмножество А пространства X называется выпуклым, если оно вместе с каждой парой своих точек содержит соединяющий их отрезок. Пустое множество считается выпуклым по определению.
Примеры выпуклых множеств: подпространства и линейные многообразия, треугольники и круги на плоскости, тетраэдры и шары в трехмерном пространстве, единичный шар в банаховом пространстве и т. п. Множество К cl X называется конусом, если из х е К следует, что Zx е К при всяком Л > 0. Конус К будет выпуклым тогда и только тогда, когда из Xi е К и х2 е К
§ 0.3. ВЫПУКЛЫЙ АНАЛИЗ
57
следует, что х\-\- х2^ К. Действительно, если К — выпуклый конус, то Xi + х2 = V2 (2%1 + 2x2) cz К. Наоборот, если конус К содержит суммы своих элементов, то ccxi +(1 — а)х2 е К, лишь только Xi (= К, х2^К, 0
а 1. Важный пример выпуклого конуса в Rn — неотрицательный ортант:
R^ = {x = (x1,	xrt)|x£^0, z=l, п).
Напомним, что функциями мы называем отображения в расширенную вещественную прямую. С каждой функцией f, заданной на X, можно связать два множества
domf = {х е X \f (х) < оо}, epi f = {(a, x)(=RXX|a>f (х)}.
Первое из них называется эффективным множеством функции f, а второе — ее надграфиком. Функция f называется собственной, если domf #= 0 и f (х) > —оо для всех х. Функции, не являющиеся собственными, называются несобственными.
Функция f называется выпуклой, если множество epif выпукло в пространстве RX^. Примерами выпуклых функций являются: аффинная функция
f (х) = (х*, х) + а (х* е Г, а е R);
индикаторная функция выпуклого множества A cz X
( о,
= | +„
если хеА, если х ф. А;
опорная функция множества A cz X*
s (х | Л) = sup (х‘, х). х* е А
Заметим, что норма в банаховом пространстве есть опорная функция единичного шара сопряженного пространства (это вытекает из определения нормы в сопряженном пространстве и следствия 3 из теоремы Хана — Банаха).
0.3.2. Субдифференциал. Пусть f — выпуклая собственная функция на X. Функционал х* е X* называется субградиентом функции f в точке х, если
— f (х)	(х*, z х) для всех z е X.
58
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
Множество всех субградиентов функции f в точке х называется субдифференциалом функции f в точке х и обозначается df(x), т. е.
df W — {х* е X*| f (г) — f (х) > <х*, z — х), Уг е /).
Роль субдифференциалов в выпуклом анализе подобна роли производных в классическом анализе. Если функция f дифференцируема по Гато в некоторой точке, то легко показать (и это будет показано в гл. 4), что ее субдифференциал в этой точке содержит единственный элемент — производную Гато.
Если X — банахово пространство, то субдифференциал его нормы в нуле совпадает с замкнутым единичным шаром сопряженного пространства. Это следует прямо из определений. Если же х =И= 0, то
д II х || = {х‘ е Г ||| х’ || = 1, <х‘, х> = || х ||}.
Действительно, если (х*, х) = || х ||, ||х‘||=1, то ||z||^ (х‘, z) для всякого z е X и, значит,
II z || —1| х || > <х‘, z — х),
т. е. х‘ед||х||. Наоборот, если х* е д || х ||, то
- II х || = || 01| -1| х || > <х\ 0 - х) = - <х\ х),
|| х || = || 2х || —II х || > <х’, 2х — х> = <х\ х), откуда || х || = <х’, х) и для всяких z е X, К > 0
||Xz + x||—||х||>(х’, Az), т. е.
|г + г!”	г},
откуда при К —> оо следует, что ||z||>(x*z)
для всех г^Х, т. е. ||х*||	1. Но поскольку (х*, х) =
= ||х||, необходимо, чтобы ||х*|| = 1.
Субдифференциал индикаторной функции б(х|Л) не пуст в любой точке хе Л, ибо, если хе Л, то 0 е е<?6(х|Л). Вообще же по определению
д$(х | А) — {х*е X' |<х‘, z — х)<0, Vz е Л).
Легко понять, что <5б(х|Л) — это конус. Он называется конусом опорную функционалов, или нормальным кону
§ 0.3. ВЫПУКЛЫЙ АНАЛИЗ
59
сом множества А в точке х и обозначается 2У(х|Д)а В частности, если А = L есть подпространство, то
dl>(x\L)=N(x\L) = L^.
Субдифференциал функции (X = R)
,, ч ( — К1 ~	если | х I С 1,
fM = j	। । ^ f
I оо, если | х I > 1,
в точке х — 1 пуст. Однако, если функция f непрерывна в точке х, то ее субдифференциал в этой точке не пуст (см. § 4.2).
Далее нам будут встречаться функции двух (и более) переменных f(x,y). Для таких функций символами dxf(x,y), dyf(x,y) и т. д. будут обозначаться «частные» субдифференциалы, т. е. субдифференциалы функций X-*f(X,y) и y-*f(x,y).
0.3.3. Теорема Моро—Рокафеллара. Пусть fi и f2— выпуклые собственные функции на X. Тогда
d(f^f^{x)=>dfl(x) + df2(x).	(1)
Если же одна из функций непрерывна в некоторой точке, принадлежащей эффективному множеству другой функции, то
d(fl + f2)(x) = df1(x) + df2(x)	(2)
для всех х.
Напомним, что dfi(x) и df2(x) суть множества в X* и выражение d/\(x)-j- df2(x) означает алгебраическую сумму множеств.
Этот результат может рассматриваться как обобщение теоремы классического анализа о производной суммы двух дифференцируемых функций.
Доказательство. Включение (I) сразу следует из определения субдифференциала. Докажем второе утверждение теоремы. Пусть х* е д(Л + f2) (х). Нам нужно проверить, что х* допускает представление в виде суммы x* = xJ4~X2, где х,^д^(х), х^еdf2(x).
Допустим для определенности, что функция fi непрерывна в точке Хо, принадлежащей dom f2. Тогда внутренность множества epi fi cz R X X очевидно, не пуста. (В самом деле, по заданному е > 0 мы можем выбрать
60
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
такую окрестность U точки х0, что |fi(z) — А(х0)|<8 для всякого z^U. Но тогда множество
{(а,г)еКХХ|а>Л(х0)+е, z е U}
открыто и содержится в epifi.) Рассмотрим в RX^ два множества (рис. 1)
С{ = {(а, г) g= R X X |a>f, (х + z) -f, (х)},
С2 = {(а, 2) е R X X | а < <х*, z} — f2 (х + z) + f2 (х)}.
Множество есть сдвиг надграфика функции fb имен-» но,
Ci = epi Л — (f (х), х).
Поэтому С*! выпукло и int Ci = 0. Выпуклость второго
множества тоже непосредственно следует из выпуклости функции f2. Наконец, множества Ci и С2 не пересекаются, ибо иначе в некоторой точке z выполнялось бы неравенство
Рис. 1.
По теореме отделимости
<х’, z> — f2 (х + z) + + A>W >fi(x + z)— f,(x), противоречащее предположению о том, что x*<=d(f{+f2) (х).
множества С] и С2 можно
разделить ненулевым линейным непрерывным функцио-
налом, т. е. существуют такие 0 <= R и х* е X*, что либо 0#=О, либо х? #= 0 и
sup (0а + <х1, z>) < inf (0а + <xL z)).	(3)
(а, г) е Ci	(а, z) <= С2
Очевидно, р 0, так как при р > 0 верхняя грань в (3) равнялась бы + оо, а нижняя грань равнялась бы —оо. Кроме того, р =# 0, ибо при р = 0 неравенство (3) принимает вид
sup (хГ, z) inf (xj, z).
z е dom fi—х	z е dom f2-x
§ 0.3. ВЫПУКЛЫЙ АНАЛИЗ
61
Последнее соотношение, однако, противоречит условиям теоремы. В самом деле, xj #= 0, так как р = 0. Поэтому
(х*, хо — х) < sup (хТ, z) sup (xt, г) zedomfj—х
и, следовательно, inf (xj, z) (xj, Хо — х) < sup (xi, z). zedomfj-x	ZEdomh-х
Итак, р < 0 и без ограничения общности можно считать, что р = —1. Таким образом, доказано, что множества и С2 отделены гиперплоскостью а—(x*,z) = = 0 (см. рис. 1). Тогда из (3) следует неравенство
sup [(Хр z) — f, (х 4- z) — (х)] <
< inf [(х[ — х*, z) 4- f2 (х + z) - f2(x)].
При z = 0 выражения в квадратных скобках как в левой, так и в правой частях неравенства обращаются в нуль. Поэтому
f! (X 4- Z) — fl W > (Хр z)
для всех z е X и, если обозначить хг = х*— xf, то
f2(x + z)-f2(x)^(x'2, z)
для всех z е X. Первое соотношение означает, что х*едД(х), второе — что x2^.df2(x). Теорема доказана.
Теорема Моро — Рокафеллара по индукции распространяется на любое конечное число слагаемых. Именно, если ..., fn — выпуклые собственные функции на X, то
d(fi + ... 4- fn) (х) о dfi (х) 4- ... +dfn(x)
для всякой точки х. Если же в некоторой точке, принадлежащей пересечению эффективных множеств всех функций fi, ..., fn, все они, за исключением, быть мо* жет, одной, непрерывны, то
d(fi+ ... +fn)(x) = dfi(x)+ ... 4-<?fn(x) для всех х.
62
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
§ 0.4. Дифференциальные уравнения
Нам придется иметь дело с обыкновенными дифференциальными уравнениями вида
х==ф(^х)>	(1)
где ср — отображение некоторой области V cz R X Rn в пространство Rn. Как правило, мы не будем предполагать отображение ср непрерывным по совокупности переменных, как это обычно делается в большинстве руководств по теории дифференциальных уравнений. Поэтому все утверждения в этом параграфе сопровождаются полными доказательствами.
Решением уравнения (1) мы будем называть всякую определенную и абсолютно непрерывную на некотором интервале Т вектор-функцию х(/), если ее график принадлежит области определения К отображения ср и если почти при всех t выполняется соотношение
х (0 =ф (<> X (/))•
0.4.1. Линейные уравнения. Начнем с изучения линейных уравнений
х — А (/) х + а (/),	(2)
где t->A (t) — отображение отрезка [/0, в пространство 3? (Rrt, R”) линейных операторов из Rn в Rrt, а а (/): [/0, h] -> R” ~ вектор-функция. Отображение	называется измеримым, если для
всякого х е Rrt вектор -функция t -> А (/) х измерима, и суммируемым, если, кроме того, суммируема действительная функция /-> -> ||А (/)||*, где через || • || обозначена норма в пространстве 3 (Rrt, R”). (Для суммируемости отображения £->A(f) необходимо и доста, точно, чтобы были суммируемы действительные функции (A (t) ej еД Z, /=1, ..., п, где {еь ...,	— некоторый базис в Rn.)
Лемма 1. Предположим, что отображение £->A(f) и вектор-функция a(t) суммируемы на отрезке [to, /1]. Тогда для всякой век-тор-функции z(-)e Cn([tQ, ^]) и всякого tg[VJ существует одна и только одна вектор-функция х(-)е Cn([to, £i]) такая, что для всех t е= [/о, /1]
x(0=z(0+ J [A (s) х (s) + a (s)] ds.	(3)
Доказательство. Оператор Q:
t
x(-)->[Qx(-)](0=2(0+ f [A(s)x(s)4-a(s)]ds
T
отображает пространство Cn([/o> M) в себя. Положим
t
c (t) = |[A (OH. C (t) = J c (s) ds, ca = C (/,) - C (0).
%
§ 0.4. ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ
63
Имеем
|[QX) (•)] (0 - [Qx2(-)j (ОК t
< J с (s) I Xj (s) — х2 (s) I ds
X
<1C (01 Iix, (•)-x2(-)||c;
I [Q2x, (•)](/)-[<2% (•)](/) К
t
J C (s) I [Qxi (•)] (s) — [Qx2 (•)] (s) [ ds T
< llxi (•) - x2(. )HC .
t
J c (s) C (s) ds
X
= '/2c* (0 ||X! (•) -X2(• )||c;
j[Qrax1 (-)](0 - [Qmx2( •)] (OK
1	cj1
< I С (0 Г II x, (•) - x2 (• )|| <	||X1 (•) - x2 (. )||c,
fill	[11Л
t. e.
c1?
IIQW X, ( . ) - Q™x2 (. )HC <	||X! (.) - x2 (• )||c.
Ho c™jm\<\ при достаточно большом m, т. е. m-я степень отображения Q — сжимающая. Требуемый результат следует теперь из принципа сжимающих отображений.
Теорема 1. Пусть отображение /~>А(/) и вектор-функция a(t) удовлетворяют условиям, указанным в формулировке леммы 1. Тогда для всяких z^Rn, т е [Zo, ^i] на отрезке [Zo, /±] существует единственное решение x(t) уравнения (2) такое, что х(т) = z.
Доказательство следует из леммы 1, если положить
Следствие. Рассмотрим отображение F:	([f0, ^]) ->
*>	(|70, определенное формулой
[Fx(-)J (0 = ^(0-ф(^ x(t)).
Предположим, что в некоторой окрестности графика вектор-функции х0 (•) е	fj]) отображение (t, х)-> ф(£, х) удовлетворяет
условиям, указанным в примере 9 из § 0.2. Тогда отображение F. регулярно в точке хо (•).
Доказательство. В примере 9 из § 0.2 было показано, что отображение F дифференцируемо по Фреше в точке Хо (•) и что его производная в этой точке есть линейный оператор из в Lj, действующий по формуле
I/7' (^о( ’)) X (.)'] (О = х (t) - А (/) х (О,
64
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
где A (0 =	(t, хо (/))• По теореме 1 уравнение
х~А(0 x = y(t)
имеет решение (принадлежащее по определению ^^д) при всяком у (•) <=	(р0, /j]), а это и означает регулярность отображения F.
Решение уравнения (2), удовлетворяющее в точке т условию x(t) = z, будет в дальнейшем обозначаться через x(t;x,z). Из о и-ределения и из теоремы 1 сразу следует равенство
х (/; т, х (т; s, z)) = х (/; s, z),	(4)
справедливое для всех t, т, s из [Zo, £±], z е Rn.
Предположим, что уравнение (2) однородно, т. е. что а(0^0, Тогда, очевидно, для всех z, zlt Z2 из Rn, Хе R,
х (/; т, Kz) = Лх (/; т, z), х (/; т, zi +z2) = x (/; т, zx) + x (t\ t, z2).
Другими словами, отображение z~>x(/;r, z) линейно, т. е. для каждых /, т из [/о, 6] существует однозначно определенный линейный оператор R(t,x)\ Rn~>Rn такой, что х(/; т, z) = R(t, t)z. При этом R(t,t) =/ (тождественный оператор) для всякого / s [/0,6]. Отображение (/, т) R(t, т) называется резольвентой однородного уравнения
х = Л(/)х.	(5)
Предложение 1. Пусть R(t,x) —резольвента уравнения (5). Тогда
а)	отображение t-^R(tfx) является решением дифференциального матричного уравнения
(6)
с начальными условиями R (т) «= /;
б)	для всяких /, т, 5 из [/о, / J справедливо равенство
R(t, т)Я(т, $) = /?(/,$).
В частности, R (/, т) R (т, t) = /, т. е.
«“'у. т) = /?(т,0;
в)	если Q (£, т) — резольвента однородного уравнения
y = -K*(t)y,	(7)
то
/г1 (А Т) = Q* (/, т).
Уравнение (7) называется обычно сопряженным с уравнением (5).
§ 0.4. ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ
65
Доказательство, а) По определению для всякого ze Rn /	/ t	\
R (t, т) z = z 4- J A (s) R (s, t) z ds = I I + J A (s) R (s, r) ds j z, т	V т	/
откуда следует, что
t
R(t, T) = /4- J A(s)fl(s, r)ds.
X
б) Согласно равенству (4) для всякого zg R'1
R (/, s) z — x (/; s, z) =x (t; r, x (r; s, z)) =
— R (t, t) x (t; s, z) — R (t, r) R (r, s) z откуда
R(/> s)=R(A t)R(t, s).
в) Пусть Q (t, т) — резольвента уравнения (7). Тогда по доказанному Q (/, т) удовлетворяет дифференциальному уравнению
Q = - Л* (0 Q
и начальным условиям Q (т, т) = I. Имеем
4 - (4«')к+°' (4	+°‘AS - »
т. е. Q* (f, т) R (f, т) = const для всех ^g[/0, Л]. Но Q*(t, т) R (т, т) = /. Следовательно, Q* (t, т) R (t, т) s Z, т. е. R-1 (/, т) = Q* (t, т). Предложение доказано.
Вернемся к неоднородному уравнению (2).
Теорема 2. Пусть выполнены условия леммы 1 и — резольвента однородного уравнения (5). Тогда
t
х (t\ х, z) — R (t, т) z + R (/, т) J R (r, s) a (s) ds. т
Доказательство. Будем искать x (t; т, z) в виде
x (t; x, z) = R (t, т) у (0,	(8)
где у (t) абсолютно непрерывна и y(x)=z. Имеем в силу предложения 1
d	г d 1
х (/; т, z) == R (/, т)] у (0 + R (/, т) у (0 =
= A(0R(/, t)i/(0+R(/, т)//(0
3 А. Д. Иоффе, В. М. Тихомиров
66
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
откуда
R (Л т) у (0 = а (/), т, е.
t	t
У (/) == 2 + J /С1 (S, т) a (s) ds = z + J R (т, s) a (s)
ds.
Подставляя полученные выражения в (8), получаем требуемый результат.
0.4.2. Существование решений и их зависимость от начальных условий. Обратимся к уравнению (1). Пусть ф— отображение некоторой области V в пространстве RXRn в Rn. Скажем, что отображение ф ограничено на множестве Q cz V функцией r(t), если
| Ф (/, х) К г (/) при (/, х) s Q.
Если для каждой точки (т, х)е V найдется интервал Г,те Г, такой, что Т X {х} cz V и отображение /->ф(/, х) измеримо на Г, то мы скажем, что отображение ф измеримо по t.
Говорят, что отображение ф удовлетворяет условию Липшица по х на множестве Q cz V, если для всех /, х, х' таких, что (/, х) е Q и (f, xz) е Q, справедливо неравенство
I ф (/, х) — ф (t, х') |< k | х — xz |, k > 0.
Отображение ф называется локально липшицевым по х, если каждая точка области V может быть окружена окрестностью, в которой отображение ф ограничено суммируемой функцией и удовлетворяет условию Липшица по х.
Предположим теперь, что измеримое множество A cz R и область U с Rn таковы, что произведение А X И принадлежит области определения V отображения ф. Говорят, что ф удовлетворяет условию Каратеодори на А X если при каждом t е А отображение х~>ф(/, х) непрерывно на U, а при каждом хе(/ отображение /~>ф(/, х) измеримо на А. В гл. 9 будет показано, что при выполнении условия Каратеодори отображение ф суперпозиционно измеримо, т. е. всякая вектор-функция t-+ q(t, x(t)} измерима на А, если только х(/) — измеримое отображение множества А в R\ Если отображение ф измеримо по t и локально липшицево по х, то, очевидно, для каждой точки (/,x)eV можно указать интервал Г, содержащий i и окрестность U точки х таким образом, что Т cz V и отображение ф удовлетворяет условиям Каратеодори на Т X Поэтому, если вектор-функция x(t) непрерывна и ее график лежит в области V, то вектор-функция /->ф(/, х(/)) измерима.
Теорема 3 (локальная теорема существования и непрерывности). Пусть в области V cz R X Rn определено отображение q(t,x): V~*Rn, измеримое по i и локально липшицево по х. Тогда для всякой точки (to, Xo)eV можно указать отрезок То, содержащий внутри себя t0, и окрестность Uq точки х0 такие, что: Tq X Uo о cz V и для всякого z&Uq на отрезке То существует ровно одно решение xz(t) уравнения (1) с начальными условиями xz(to)—z. При этом, если z е Uo и Zk~+z при k~> оо, то xz& (t) -> xz (/) равномерно на То.	п
§ 0.4. ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ
67
Доказательство. Выберем интервал Т и открытое множество U czRn так, чтобы Т X V cz V, to е Г, хо е U, отображение ф было ограничено на Т X U суммируемой функцией r(t) и удовлетворяло условию Липшица по х (с некоторой константой fc>0). Пусть число б таково, что замкнутый шар радиуса 26 с центром в точке хо принадлежит множеству U\ обозначим через Uo шар радиуса 6 с центром в точке хо. Выберем далее число е > 0 так, чтобы	/в+в	t.
efe<l, j r(/)rf/<6, j r(t)dt<6
tfi	t^—B
и положим To = ki, ti}* где to — e < ti < tQ< t2 < to + e, кь /2] <= T. Множества To и Uo — искомые. Действительно, рассмотрим в пространстве СП(ТО) множество
X = {х (•) е= Сп (То) 11 х (0 - хо | < 26, у/ е= То}.
Это — замкнутое подмножество пространства СП(ТО), т. е. оно само является полным метрическим пространством относительно расстояния р(х(«), //(•))= II *(-)—£/(-) 11с-
Зафиксируем z е Uo и рассмотрим отображение Pz, ставящее в соответствие каждому элементу х(-)еХ вектор-функцию
t
У (0 = [Ргх (•)] (0 = Z + | <р (т, X (т)) rfr. t.
Тогда при t е То
I \PzX (•)] (0 — z I = | ф (т, X (т)) dx <
t
t
Далее, если xi (•) е X
т. е. Р2 отображает множество X в себя, и х2 {•) G то
Р (PzXi (•), Ргх2 (•)) = max
t
j (ф (т, Xi (t)) — Ф (t, x2 (t))) dx <
t
max I k | Xi (r) — x2 (r) | dx efcp (xi (•), x2 (•)), t^T, /
т. e. отображение Pz — сжимающее. Согласно принципу сжимающих отображений существует единственная вектор-функция xz (•) е X такая, что
т- е. такая, что
существует
PzXz ( • ) == Xz ( • ).
t
Xz (0 = Z + J Ф (т, хг (t)) dx.
Первое утверждение теоремы доказано.
3*
68
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
Предположим теперь, что z^ е Uo и z2 е UQ. Тогда по доказанному х2 (0 и xZi (0 определены на То и принимают значения в U. Имеем
р (xzi (’ )• хгг (‘)) Р (?zxxzx (’ )* ?z2xz2 (•))“" t
=	2[ - z2 + J (<р (r, xZi (т)) - <р (т,
хг2 W)) dT
т. е.
<| zl-z2\+ekp(xZi(.), xZ!(-)).

Поскольку zk < 1, отсюда следует второе утверждение. Теорема доказана.
Следствие. Пусть выполнены условия теоремы и Xi(t), x2(t)—dea решения уравнения (1), определенные на одном и том же отрезке [/о, 6]. Тогда, если хотя бы в одной точке этого отрезка xx(t) = x2(t), то xx(i) = х2(0 во всех точках отрезка [6, 61-
Доказательство. Достаточно проверить, что множество Д тех точек из [6,6], в которых %i(/)= x2(t), открыто и замкнуто в [6,6]. Замкнутость множества Д очевидна. Если же те Д, то в силу теоремы xi(t)—x2(t) в некоторой окрестности точки т, т. е. Д открыто в [6, 6], что и завершает доказательство.
Зафиксируем точку (т, z) е V и рассмотрим множество всех пар (Д,*(•)), где Д — некоторый интервал, содержащий точку т, a x(t)—решение уравнения (1), определенное на Д и такое, что х(т)=г. В силу теоремы 3 множество таких пар не пусто (если, конечно, отображение ф удовлетворяет наложенным в теореме условиям), а согласно следствию всякие две такие пары обладают тем свойством, что Xi(t) = x2(t) на пересечении Д1Л Дг (которое содержит точку т и, следовательно, не пусто). Обозначим через Т(т, z) объединение интервалов Д, входящих во все такие пары. Тогда на T(t,z) определена вектор-функция t x(t; t,z), обладающая тем свойством, что для всякой пары (Д,*(•)) ограничение век-тор-функции х(-;т,z) на Д совпадает с х(-). Поскольку каждая точка t е Т(т, г) содержится хотя бы в одном таком Д, вектор-функция /~>х(/;т, z) есть решение уравнения (1). Она называется максимальным решением уравнения (1) с начальным условием Х(т)= Z.
Для максимальных решений, как и в линейном случае, справедлива очевидная формула
х (t\ т, х (т; s, г)) — х (/; s, z).	(9)
Зафиксируем некоторый отрезок [6, 6] и положим
А = {z е R" | [6, 6] с Г (6, г)}.
Тогда на множестве А (если оно не пусто) определено отображение F: А -> Сп ([6,6]), ставящее в соответствие каждому z^A ограничение максимального решения х(-;6,z) на [6,6].	"
§ 0.4. ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ
69
Теорема 4 (глобальная теорема существования и непрерывности). Пусть выполнены условия теоремы 3 и множество А не писто. Тогда оно открыто и отображение F непрерывно на А.
Доказательство. Пусть г s Л и последовательность {zs} сходится к z. Для доказательства теоремы нужно проверить, что, с одной стороны, отрезок [/0, ^i] принадлежит множеству T(tQ, zs), если $ достаточно велико, и с другой, что при s -> оо последовательность вектор-функций x(t\ /о, z&)_ равномерно сходится к х(/; to, z) на [/о, М. Обозначим через т верхнюю грань тех те R, для каждого из которых существует такой номер s(t), что [/0, т] cz Т(t0, zs) при s>s(t) _h x(t\ to, zs)-> x(t\ to, z) равномерно на [/о, т]. В силу теоремы 3 f > to. Для доказательства теоремы достаточно проверить, что f > ti.
Предположим, что f С /ь Тогда точка (т, х (т, t0, z)) содержится в V. По теореме 3 существует такое е > 0, что [f — е, f + е] cz cz Т (т, у) при всех т и у, удовлетворяющих неравенству | т — т |	8
и | у — т № to, z) | < е. По определению числа т найдется такое т, что т — 8 < т т, Ro, т] cz Т (to, zs) при всех s, больших некоторого s (т), и х (t; tQ, zs) -> х (t; to, z) равномерно на [f0, т]. Поэтому можно указать номер Sj такой, чтобы неравенство
|х(/; tQ, zs) — x(t-, to, z) [ < 8
выполнялось для всех s>s0 и t e [f, т]. Но в этом случае в силу выбора т, т и е решения х (/; т, х (т; tQ, zs)) определены на отрезке [т —8, т-|-8] при s^so и сходятся на этом отрезке равномерно к х (t; т, х (т; t0, z)). Однако в силу (9)
х (/; т, х (т; t3, zs)) = х (/; 10, zs).
Мы получили таким образом, что при s s0 максимальные решения x(t;_to,za) определены, по крайней мере,_ на [f0, т-j-s] (т. е. [/о,т-f- е] cz T(tQ, z&)) и сходятся на [/о.^+ е] равномерно к x(t; t0,z). Полученный результат, однако, противоречит определению т, Теорема доказана.
Теорема 5. Пусть выполнены условия теоремы 4 и z0 & А. Обозначим через xQ(t) ограничение максимального решения x(t',to,Zo) на [/о, ^i] и предположим, что отображение х-хр(/, х) непрерывно дифференцируемо во всех точках некоторой окрестности графика вектор-функции Xo(t). Тогда отображение F дифференцируемо по Фреше в точке z0(«) и для всякого z(=Rn вектор-функция [F'(z0)z](t) = y(t-, to, z) есть решение линейного дифференциального уравнения
У = Чх (Ь *о (0) У
с начальными условиями
У (to) = z.
Докажем сначала один вспомогательный результат.
•Лемма 2. Пусть V — область в RXRn w отображение <р: V -> Rn удовлетворяет условиям, указанным в теореме 3. Пусть далее вектор-функция x(t) определена и непрерывна на некотором отрезке Т и ее график принадлежит области V. Тогда в
70
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
некоторой окрестности графика вектор-функции x(t) отображение ф ограничено суммируемой функцией и удовлетворяет условию Липшица по х.
Доказательство. Пусть т е Т. Тогда по определению существует такой интервал Д(т), содержащий точку т, и такая окрестность L/(z)c:Rn точки х(т), что Д(т) X U(т)cz V, отображение ф ограничено на Д(т)Х^(т) суммируемой функцией r(t\x) и удовлетворяет условию Липшица с константой k(x). Обозначим через G график вектор-функции х(/). Тогда G — компактное подмножество области V и
ос (J (д(Т)хг/(т)).
% е Т
Поэтому можно выбрать конечное число точек Tj....тт из Т
так, чтобы
m
Gc=U(A(^)XI/(t/)).
i=l
Положим, далее, 31 = {z11 е Д (tJ),
W = {(/, х) е= V 11 е= Т, х €= U (rz), v i k = max {k (ti).........k (rm)},
r (/) = max {r (f; Tf) | i e Sf }.
Тогда W — окрестность множества G, 0 < k < оо, и функция r(t) суммируема на T. Если (/, х)е W, то /еД(тг), x^U(Xi) при некотором i и, значит,
I <Р (t X) К г (/; rz) < г (/).
т. е. отображение ф ограничено на W суммируемой функцией r(t). С другой стороны, если (t,x)&W и (^x')eW7, то точки х и х' принадлежат всем множествам U(Ti) с теми номерами t, при которых /еД(т»). Поэтому
IФ (Л х) — ф (Л х') К k (т,) |х — x'K^|x — х'|,
т. е. отображение ф удовлетворяет на множестве W условию Липшица по х с константой k. Лемма доказана.
Доказательство теоремы 5. В силу леммы мы можем выбрать числа е > 0, k > 0 и суммируемую на [^о, 6] функцию r(t) так, чтобы из t е [/0, |х — x0(f) | < е, |х' — хо(О1<® вытекали бы неравенства
IФ (Л х) — ф (/, х') |< k | х — х' |,
|ф(Л *)|<г(0.
§ 0.4. ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ
71
Первое из этих неравенств приводит, в частности, к тому, что |фх (t х) К k
при всех таких t и х. Поэтому (см. пример 9 в § 0.2) отображение t
х (•) -> [й(х( •))] (0 = | ф (т, х (т)) dx
*0
дифференцируемо по Фреше в малой окрестности точки Хо(-) (в пространстве Cn([/o, h])) и его производная непрерывна и определяется формулой
[Л' (*(•)) И • )1 (0 = J Фх (*• х (*)) У wdT-
Рассмотрим отображение
G: 1ГХС»([<о,М)->С’([4». М).
определенное следующим образом:
[G (г, х (•))](/)=	{
= X (0 — z — j ф (т, X (т)) dx = X (t) — г — [ft (х {•))] (0 t,
По доказанному это отображение непрерывно дифференцируемо по х(-) в малой окрестности точки *о(-) и
t
[Gx(.) (2> X (•)) у (•)] (О = у (о — J Фх (т, X (т)) у (г) dx.
tl
Далее, G(zo, х0(’)) = 0 и в силу леммы 1 оператор Gx^ (zQ, осуществляет взаимно однозначное и непрерывное (и, следовательно, по теореме Банаха — гомеоморфное) отображение пространства Сп([/о,М) на себя. По теореме о неявной функции в малой окрестности точки Zq определено отображение z->x2(«) в Cn([t0, ^]) такое, что х2л (•) = х0 (•), G (z, хг (•)) = 0. Это отображение дифференцируемо по Фреше и его производная есть линейный оператор, ставящий в соответствие каждому zg Rn вектор-функцию
У (•) = Gx (zq9 х0 (•))	(z0,	(•)) z] = — Gx 0 (z0> Xq (•)) z (•)
(10) где z (0 s z.
Условие G (z, xz (•)) = 0 означает, что
t
Xz(t)==z + J ф (r, xz (t)) dx,
72
0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ
т. е. что х2(/) = х(/;/о, z). Отсюда следует дифференцируемость отображения F в точке zQ. С другой стороны, равенство (10) можно переписать в виде
°х(-)(20- *0(-)) '/(•)=2(-)-
или
t
У (0 — J Фх (Т, х0 (т)) у (т) dr = z (t) = г.
Но последнее соотношение как раз и означает, что y(t)	z)\
Теорема доказана.
Комментарий ко введению. Литература по теории # экстремальных задач огромна. Наш список не претендует на полноту/В нем собраны наиболее известные монографии, учебники и обзорные статьи, а также некоторые работы, непосредственно связанные с излагаемыми в книге вопросами.
Упомянем сначала несколько работ, посвященных осмысливанию с общих позиций принципа максимума Понтрягина, в которых развиваются общие концепции теории экстремальных задач и которые в наибольшей степени повлияли на отбор и характер материала в книге: Гамкрелидзе и Харатишвили [1]—[3], Гирсанов [1], Дубовицкий и Милютин [1]—[4], Нойштадт [2], Пшеничный [4], Рокафеллар [5], [6], [9], [14], Халкин [4], Хестенс [3].
Для ознакомления с темами, оставшимися за пределами книги, отсылаем читателя к монографиям Варги [4], Экланда и Темама [1] (расширения и скользящие режимы), Габасова и Кирилловой [1] (особые режимы), Моисеева [1], Пшеничного и Данилина [1], Cea [1] (численные методы).
К § 0.1. Материал параграфа изложен во многих учебниках и монографиях: Дапфорд и Шварц [1], Колмогоров и Фомин [1], Лю-стерник и Соболев [1] и др.
К § 0.2. Более подробно о дифференциальном исчислении см. в книгах: Дьедонне [1], Картан [1], Люстерник и Соболев [1], Шварц [1]. Обзор современного состояния предмета см. в статье Авербуха и Смолянова [1]. Теорема Люстерника доказана в работе Люстерника [1]. Наше доказательство — обработка доказательства, изложенного в книге Люстерника и Соболева [1]. О сжимающих многозначных отображениях см. Надлер [1].
К § 0.3. Выпуклый анализ комментируется в конце гл. 4.
К § 0.4. Подробнее о дифференциальных уравнениях см. в книгах: Картан [1], Коддингтон и Левинсон [1], Сансоне [1] и в статье Филиппова [2].
Глава 1
НЕОБХОДИМЫЕ УСЛОВИЯ ЭКСТРЕМУМА
В этой главе доказываются необходимые условия экстремума для трех основных классов экстремальных задач. Мы увидим, что они формулируются в полном соответствии с высказанным во введении принципом Лагранжа. Материал этой главы опирается на §§ 0.2 и 0.3.
§ 1.1. Постановки задач и формулировки основных теорем
1.1.1. Гладкие задачи с ограничениями типа равенств. Правило множителей Лагранжа. Пусть Хи Y — банаховы пространства, f — функция на X и F: X -> Y — отображение X в Y. Рассмотрим задачу
f(x)->inf;	(1)
F(x) = 0.	(2)
Соотношения вида (2) называются ограничениями типа равенств. Задачи вида (1), (2) мы будем называть гладкими задачами с ограничениями типа равенств, если функция f и отображение F удовлетворяют некоторым требованиям гладкости.
Составим функцию Лагранжа задачи (1), (2):	;
^(х, Хо, /) = W(x) + {/, F(x)>,
где Xo^R, у*еУ*. Величины Хо и у* мы называем множителями Лагранжа.
Теорема 1 (правило множителей Лагранжа). Пусть функция f и отображение F дифференцируемы по Фреше в точке х*, где F(x*)= 0, и образ пространства X при отображении х F'(х*)х замкнут. Тогда, если х*— точка локального минимума в задаче (1), (2), то найдутся такие не равные одновременно нулю множители Лагранжа Хо и у\ что
(х„ Ло, у*) = Xof' (xj + F* (хJ у* = 0.	(3)
74
ГЛ. 1. НЕОБХОДИМЫЕ УСЛОВИЯ ЭКСТРЕМУМА
Если же отображение F принадлежит классу Ci в точке х* и является регулярным отображением в этой точке, то Хо #= 0 и можно считать, что Хо = 1.
Уравнение (3) будем называть уравнением Эйлера— Лагранжа задачи (1), (2). Оно означает, что точка х* является стационарной точкой функции Лагранжа. Таким образом, теорема 1 утверждает, что необходимое условие локального экстремума в задаче (1), (2) при некоторОхМ выборе множителей Лагранжа совпадает с необходимым условием безусловного минимума по х функции Лагранжа. Итак, для задачи (1), (2) верен принцип Лагранжа.
Пусть имеет место регулярный случай. Условие (2) и уравнение (3) означают тогда, что решение задачи х* и множитель Лагранжа у* удовлетворяют следующей системе уравнений:
<?х = 0, JZ> = 0.
Таким образом, здесь правило множителей Лагранжа утверждает, что выполнено условие стационарности функции Лагранжа по совокупности переменных (х, у*), ибо в регулярном случае множитель Лагранжа Хо равен единице. Если оба пространства X и Y конечномерны, скажем, X = Rm, Y = Rn, то написанная выше система есть система уравнений с /п + п неизвестными. Такая система имеет, вообще говоря, лишь изолированные решения. Это последнее обстоятельство и составляет алгоритмическую суть правила множителей Лагранжа.
Отметим два специальных случая задачи (1), (2). Пусть пространство Y конечномерно. Тогда, как легко понять, задача может быть записана в такой форме:
f0(x)->inf;	(4)
Ш = 0, .... fn(x) = O.	(5)
Множители Лагранжа в этом случае суть числа Хо, Xi, ..., Хп, так что функция Лагранжа здесь имеет вид
S(x, х0,.... Ч)=2Ш
/==0
5 1.1. ПОСТАНОВКИ ЗАДАЧ
75
Следствие 1. Пусть функции f0, ..., fn принадлежат классу Ci в точке х*, удовлетворяющей условиям (5). Тогда если точка х* есть точка локального минимума в задаче (4), (5), то найдутся такие не равные одновременно нулю числа Ко, .... Ап, что
v;w+  +««-»•
Если же, кроме того, функционалы П(х), • ••> линейно независимы, то Хо #= О и можно считать, что Хо = 1-
Доказательство этого утверждения немедленно следует из теоремы, поскольку всякое подпространство конечномерного пространства замкнуто и, как уже отмечалось в примере 13 из § 0.2, условие регулярности отображения х—» (fi(x),	/п(я)) означает просто
линейную независимость функционалов f'x, f'.
Другой специальный случай возникает, когда отображение F распадается на регулярное отображение в некоторое банахово пространство и отображение в Rn, т. е. когда задачу можно записать в таком виде:
f0 (х) -> inf;	(6)
F(x) = Q,	(7)
Л(х) = 0, .... Mx) = 0.	(8)
Следствие 2. Пусть функции fo, ..., fn и ото-
бражение F принадлежат классу в точке х*, удовлетворяющей равенствам (7), (8). Предположим, кроме того, что отображение F регулярно в точке х*. Тогда, если точка х* есть точка локального минимума в задаче (6) — (8), то найдутся такие не равные одновременно нулю числа Хо, ..., Хп и вектор у*, что
Ш*.)+  +».№.)+ Н*.)/»0-
Следствие 2 тоже немедленно вытекает из теоремы 1, если принять во внимание, что всякое подпространство банахова пространства, имеющее конечную коразмерность, замкнуто.
76
ГЛ. 1. НЕОБХОДИМЫЕ УСЛОВИЯ ЭКСТРЕМУМА
1.1.2. Выпуклые задачи. Теорема Куна — Таккера. Пусть X — линейное пространство, fo, .... fn — конечные функции на X и А — подмножество пространства X. Рассмотрим задачу
fo (х) -► inf;	(9)
AW<0--------fn(x)<0,	(Ю)
хеЛ.	(11)
Соотношения (10) называются ограничениями типа неравенств. (Соотношение (11) не имеет функционального характера, хотя и может быть записано в функциональной форме, скажем, в виде неравенства б(х|Л)^0.) Если функции f0, ..., fn и множество А выпуклы, то задачу (9) — (11) называют задачей выпуклого программирования.
Из-за того, что ограничения в нашей задаче разделены на две группы — ограничения типа неравенств и ограничения (11), мы можем по-разному составлять функцию Лагранжа задачи (9) — (11). Главным образом, мы будем иметь дело с функцией Лагранжа, в которую не включены ограничения (11):
п
S£ (X, Ло, . . .,	W*
z=o
Однако можно рассмотреть и «удлиненную» функцию Лагранжа
3? 1	Ао, • • • 9 Атг) = 2	(х) + б (х | -Д).
/=1
Условия экстремума в задачах выпуклого программирования можно записывать в двух почти эквивалентных формах: в нелокальной форме (см. ниже теорему Куна — Таккера) и в локальной форме, с помощью субдифференциалов. Это связано с тем фактом, что в таких задачах всякий локальный экстремум является и абсолютным.
Теорема 2 (теорема Куна — Таккера). Пусть функции f0, ..., fn и множество А выпуклы. Предположим, что вектор х* удовлетворяет ограничениям (10), (11). Тогда, если х*— решение задачи (9) — (11), то существуют такие не равные одновременно нулю мно
§ Lt. ПОСТАНОВКИ ЗАДАЧ
77
жители Лагранжа Zo 0, ..., Кп 0, что
2! (**, ^о> • • •> М = min 2 (х, Ло, ..Л„)	(12)
х е= А
= 0 пРи *=1» •••» п. (13)
Если же, кроме того, существует такой вектор хе Д что fi(x) <Z 0 при всех i = 1, ..., п {условие Слейтера), то Ко 0 и можно считать, что Ко — 1. В последнем случае соотношения (12), (13) достаточны для того, чтобы точка х*, удовлетворяющая условиям (10), (11), была решением задачи (9) — (11).
Соотношение (12) называется условием Куна — Так-кера, а равенства (13) — условиями дополняющей не-жесткости. Условие Куна — Таккера показывает, что для задач выпуклого программирования принцип Лагранжа справедлив даже в усиленной форме: функция Лагранжа достигает в точке х* абсолютного минимума при ограничениях, не включенных в эту функцию. Смысл условий дополняющей нежесткости в том, что отличны от нуля лишь те множители Лагранжа, которые соответствуют ограничениям, существенным в данной точке х*, т. е. таким, которые в этой точке обращаются в равенства.
Теорема 2' (субдифференциальная форма условий экстремума в выпуклом программировании). Пусть X — отделимое локально выпуклое пространство и все функции fo, ..., fn непрерывны в некоторой точке множества А (хотя они могут и не быть всюду конечными) < Пусть далее точка х* удовлетворяет условиям (10) —• (11). Если х*— решение задачи (9) — (11), то найдутся такие не равные одновременно нулю множители Лагранжа Ко 0, ..., Кп 0, что
Oe=KQdfo(xJ + ... +Wfn(xJ + tf(xJX), (12') Wi W =	* = 1, • • •» я,
где Af(x*|4) — д6(х*|Л) —нормальный конус к множеству А в точке х*. Если, кроме того, выполнено условие Слейтера, то Zo #= 0 и можно считать, что Zo= 1. В последнем случае написанные соотношения не только необходимы, но и достаточны для того, чтобы вектор хф был решением задачщ
78	гл. I. НЕОБХОДИМЫЕ УСЛОВИЯ ЭКСТРЕМУМА
Соотношение (12') мы также будем называть уравнением Эйлера — Лагранжа. Оно означает, что Ое ^.dxS\ и может рассматриваться как естественное распространение уравнения Эйлера — Лагранжа (3) на выпуклые задачи.
В гладком случае, когда все функции f0, ..., fn дифференцируемы, X = Rra и выполнено условие Слейтера, уравнение Эйлера — Лагранжа совместно с условиями дополняющей нежесткости образуют систему из т + п уравнений с m + п неизвестными, т. е. мы снова приходим к замкнутой системе, где число уравнений совпадает с числом неизвестных. Этот факт отражает алгоритмическую сущность теоремы Куна — Таккера.
В конце параграфа мы снова вернемся к задачам выпуклого программирования и сформулируем теорему Куна — Таккера в форме теоремы о седловой точке, которая позволит взглянуть с новых позиций и на сам принцип Лагранжа.
1.1.3. Гладко-выпуклые задачи. Экстремальный принцип в гладко-выпуклых задачах. Пусть X и У — банаховы пространства, U — произвольное множество, fo, .... fn — функции на X X U и F: Х\ U —► У — отображение произведения X X в У. Рассмотрим задачу
f0(x, м)—> inf;
F (х, и) = О,
(14)
(15)
Л(х, «)<0, .... fn(x, м)<0,	(16)
и е U.
(17)
Задачи такого типа мы будем называть гладко-выпуклыми, если функции fo, ..., fn и отображение F удовлетворяют некоторым условиям гладкости по х и выпуклости по и, точно формулируемым ниже.
Нас будут интересовать необходимые условия локального минимума в задаче (14) — (17). Однако в данном случае содержание термина «локальный минимум» требует уточнения, поскольку множество U не предполагается топологизированным. Мы скажем, что пара (х«, «*), удовлетворяющая ограничениям (15) — (17), есть точка локального минимума в задаче (14) — (17), если для всякого х из некоторой окрестности тоЧ
§ 1.1. ПОСТАНОВКИ ЗАДАЧ
79
ки х* и всякого и из U, удовлетворяющих тем же ограничениям, выполняется неравенство
fo(x„ u,)^f(x, и).
Рассмотрим, как и в предыдущих случаях, функцию Лагранжа задачи (14) — (17), включив в нее только функциональные ограничения:
S (х, и, к0,	А„, у*) = 2 Ufi (х, и) + </, F (х, и)),
t=0
где, как обычно, Ао, .... Ап — действительные числа, а у* е У*.
Теорема 3 (экстремальный принцип в гладковыпуклых задачах). Пусть точка (х#, uj удовлетворяет условиям (15) — (17). Предположим далее, что точка х» обладает такой окрестностью V с X, что
а)	при всяком u^U отображение x-+F(x,u) и функции х —► fi(x,u), i = 0...п, принадлежат клас-
су Ci в точке х*;
б)	при всяком хеУ отображение u-*F(x,u) и функции u-*fi(x, и), i = 0, ..., п, удовлетворяют следующему условию выпуклости-, для всяких «1 е U, и2еИ и	найдется такое и е U, что
F (х, и) = aF (х, «]) + (! — a) F (х, и2), ft (х, и) afi (х, щ) + (1 — а) fi (х, и2), i — 0, ..., п.
Допустим, кроме того, что
в)	множество значений линейного оператора Fx{x*,u*}-. X -> У имеет конечную коразмерность в У.
Тогда, если (x*,ut) — точка локального минимума в задаче (14) — (17), то найдутся такие не равные одновременно нулю множители Лагранжа Ао 0, ... ..., Ап 0, у* <= У*, что
X (Х,, Ut, Ад, . . . , А„, у ) = hjfix (х,, И.) -J-i=0
+ Fx(x„ ut)y- = 0, (18)
^(x., и,, Ao, ...» A„, y*) = min Z (x„ u, Ao, .... A„, /), (19)
AJi(x,, иж) = 0 при i=\,...,n.	(20)
Если же в дополнение к сформулированным условиям
80
ГЛ. 1. НЕОБХОДИМЫЕ УСЛОВИЯ ЭКСТРЕМУМА
г)	образ множества X X U при отображении (х, u)^Fx(x*, U,)x + F(x„ и)
содержит окрестность нуля в Y и существует точка (х, и) такая, что
Рх (*., «.) X + F(х„ и) = 0, {fix (х„ и,), х) + ft (xt, ы) < О при всех I, при которых fi(x*, и*) = 0, то Хо =# 0 и можно считать, что Хо = 1.
Соотношения (18) и (19) мы будем называть соответственно уравнением Эйлера — Лагранжа и условием Куна — Таккера, а равенства (20) суть не что иное, как условия дополняющей нежесткости. Уравнение Эйлера — Лагранжа, как и в случае гладких задач, означает, что в точке х* функция Лагранжа удовлетворяет необходимым условиям минимума по х, а условие Куна — Таккера, как и в случае выпуклых задач, означает, что функция Лагранжа достигает минимума по и в точке а*. Таким образом, согласно теореме 3, принцип Лагранжа применим к гладко-выпуклым задачам,^. е. необходимые условия минимума в задаче (14) — (17) совпадают с необходимыми условиями минимума функции Лагранжа при единственном не включенном в эту функцию ограничении u<=U.
Условие в) теоремы 3 выполняется, в частности, когда отображение F распадается на отображение Fi: X X -* У1 (где — некоторое банахово пространство) и отображение в Rw так, что отображение x->Fi(x, п*) регулярно. Таким образом, справедливо утверждение:
Следствие. Предположим, что в задаче (14) —> (17) условие F(x,u)=0 записывается следующим об* разом:
Fj (х, и) = 0,
/гг (х, и) = 0, ..., hm (х, и) = 0,
где Fc X \ U -> Уь У! — банахово пространство и hi, ..., hm — действительные функции на X X U. Предположим далее, что условие в) в формулировке теоремы заменяется следующим:
§ 1.1. ПОСТАНОВКИ ЗАДАЧ
81
в') отображение х—►7ч(х, и*) регулярно в точке х*. Тогда, если выполнены остальные условия теоремы, то ее утверждение остается в силе.
1.1.4. Замечания и обсуждения. Каждая из трех сформулированных теорем распадается на две части: первую — общую и вторую — содержащую условия регулярности, выполнение которых обеспечивает неравенство коэффициента Хо нулю. Случай Хо = 0, вообще говоря, неинтересен, поскольку при этом необходимые условия никак не связаны с минимизируемым функционалом и определяют только некоторую экстремальную структуру ограничений. Тем не менее применять теоремы удобнее в общей форме. Во-первых, зачастую Хо ¥= 0, даже если не выполнены условия регулярности. Во-вторых, что особенно важно, прямая проверка неравенства Хо =# О во многих случаях проще проверки соответствующих условий регулярности.
Равенство или неравенство коэффициента Хо нулю зависит, в частности, от того, какие ограничения включены в функцию Лагранжа, а какие оставлены за ее пределами. Это лучше всего проследить на примере задачи выпуклого программирования. В функцию Лагранжа этой задачи мы не включили ограничение хеЛ. Выше отмечалось, что это ограничение можно задать функционально, например, так: А = {x|fn+i (х)< 0}. Однако здесь возможна такая ситуация, когда не существует ни одной точки х такой, что fi(x)<0 для всех i = 1, ..., п + 1. Если бы в этом случае мы включили ограничение fn+i(x)^0 в функцию Лагранжа, то условие Слейтера было бы нарушено и нельзя было бы гарантировать неравенство коэффициента Хо нулю. Итак, стремление обеспечить неравенство коэффициента Хо нулю побуждает отбирать ограничения, включаемые в функцию Лагранжа, так, чтобы условия регулярности не нарушались. Однако, с другой стороны, чем больше ограничений включено в функцию Лагранжа, тем эффективней соответствующее необходимое условие минимума.
Заметим, кстати, что из теоремы 2 следует простое правило определения знаков множителей Лагранжа, соответствующих ограничениям типа неравенства. В задаче на минимум их следует выбирать так, чтобы
82
ГЛ. 1. НЕОБХОДИМЫЕ УСЛОВИЯ ЭКСТРЕМУМА
функция Лагранжа стала выпуклой по х. (Это замечание надо иметь в виду, поскольку в выпуклых задачах | часто встречаются ограничения вида g(x)^0, где g— вогнутая функция.) Конечно, в задачах на максимум J знаки множителей Лагранжа должны быть такими, что- ' бы функция Лагранжа была вогнутой. В невыпуклых i задачах знаки надо выбирать такими, как будто задача — выпуклая, и т. д.
Нетрудно видеть, что классы задач, охватываемых ! теоремами 1 и 2, не пересекаются и, наоборот, теорема • 3, по существу, содержит в себе теоремы 1 и 2, хотя и j не охватывает их целиком. В самом деле, если в уело- j виях теоремы 3 множество U состоит из единственного | элемента, а ограничения f\(x, п)^0, ..., fn(x, и) <5 О J отсутствуют, то мы получаем утверждение, аналогичное 1 теореме 1, но с дополнительным требованием конечной | коразмерности. Наоборот, если отсутствует ограничение .1 F(x,u)=0, U есть выпуклое подмножество линейного 1 пространства и функции fo, ..., fn не зависят от х и I выпуклы по и, то из теоремы 3 следуют все утвержде- I ния теоремы 2, за исключением, конечно, достаточности. I
С помощью теоремы 3 можно получить и некоторые | обобщения теорем 1 и 2. Рассмотрим такую задачу:	1
f0(x)—>inf;
F(x) = Q, fiW<0, .... f„(x)<0, х<^ А,
(21)
(22)
(23)
(24)
где, как обычно, F: X —* Y, fo, .... fn — функции на X, : A cz X и У — банахово пространство.	;
Теорема 4. Пусть X — банахово пространство и ] А = X. Предположим, что отображение F и функции < fo, ..., fn непрерывны и дифференцируемы по Фреше в J некоторой окрестности точки х*, удовлетворяющей уело- 1 виям (22) — (24), причем производная F'(x) отображе- 1 ния F непрерывна в точке х*. Допустим, наконец, что | образ пространства X при отображении x-*F'(x*)x 1 замкнут. Тогда, если х»— точка локального минимума | в задаче (21)— (24), то существуют не равные одно- | временно нулю множители Лагранжа Хо^.0,	< 1
§ 1.1. ПОСТАНОВКИ ЗАДАЧ
83
..., Хп 0 и у* g Р такие, что
..../)=2м:(\)+';'’(\)/=о.
(х.) — О» i = 1. • • •. п.
Если же, кроме того, отображение F регулярно в точке xt и существует такой вектор х е X, что
F' (xj х — 0, f' (xj х < О
для тех индексов i = 1, ..., п, при которых fi(x^) = О, то Хо 0 и можно без ограничения общности считать, что Хо = 1.
Точно так же с помощью теоремы 3 можно получить следующее обобщение теоремы 2.
Те о р е м а 5. Пусть в задаче (21) — (24)< X — линейное пространство, fa, ...» fn — выпуклые функции на X, F — аффинное отображение (г. е. F (х) = #о + Ах, где y0<=Y, а Л: Х->У— линейный оператор) и А — выпуклое множество. Тогда, если х* — решение задачи (21) — (24), то существуют не равные одновременно нулю множители Лагранжа Хо О.............Хп 0 и
у* е У* такие, что
п
& (х., Хо.....х„, у*) = 2	(х.) 4- </, F (х.)) =
i=i
= min Z (x, Xo....Xn, y')\
x e A
Xifi (xj = 0,	1=1, ...» n.
Если же, кроме того, образ множества А при отображении x-+F(x) содержит окрестность нуля пространства Y и существует такой вектор х е А, что
F(x) = 0, fi(x)<0,	i=\,...,n,
то Хо 0 и можно считать, что Хо = 1. В последнем случае написанные выше соотношения достаточны для того, чтобы точка х*, удовлетворяющая условиям (22) — (24), была решением задачи (21) — (24).
При формулировке теорем 1—3 мы всякий раз обращали внимание на то, что основные соотношения в этих теоремах находятся ЬJ Соответствии с принципом Лагранжа. Согласно этому принципу
84
ГЛ. 1. НЕОБХОДИМЫЕ УСЛОВИЯ ЭКСТРЕМУМА
при подходящем выборе множителей Лагранжа решение задачи с ограничениями удовлетворяет условиям стационарности (или минимальности при наличии выпуклой структуры) в задаче
без ограничений или при ограничениях, не включенных в функцию Лагранжа. Однако в теоремах фигурируют и другие условия, характеризующие множители Лагранжа. Это — условия неотрицательности множителей Лагранжа, соответствующих ограничениям типа неравенства, и условия дополняющей нежесткости. На самом деле и эти условия, как и условия, которые выводились из принципа Лагранжа, носят экстремальный характер и могут быть получены из другого, более общего экстремального принципа.
Для иллюстрации рассмотрим следующую задачу. Пусть X и У— банаховы пространства, fo— функция на X, дифференцируемая в окрестности точки х*, Ф: X -> Y — отображение, тоже дифференцируемое по Фреше в окрестности точки х*, и U — выпуклое подмножество пространства У. Тогда можно сформулировать такую задачу;
/0 (х) -> inf;	(25)
Ф (х) е U.	(26)
Эту задачу можно рассматривать как некоторое обобщение гладкой задачи из п. 1.1.1. С другой стороны, она легко сводится к гладковыпуклой задаче, если положить
F (х, и) = ф (х) — и,
а условие Ф(х)е U переписать в виде
F (х, м)=0,	(27)
и е U.	(28)
Допустим, что в получившейся гладко-выпуклой задаче выполнены все условия теоремы 3 (в точке х*). Введем функцию
(х, У*) = h fo (х) + {У*. Ф (х)) - s (/ | U),
где s(-1U)—опорная функция множества U, определенная в § 0.3. Покажем, что утверждения теоремы 3 для получившейся задачи равносильны следующей теореме.
Теорема о седловой точке. Для того чтобы х* была точкой локального минимума в задаче (25), (26), необходимо существование таких не равных одновременно нулю числа Хо 0 и вектора у* е У*, что
^х(*..у’) = Мо(х.) + ф'*(\)^ = 0-	(29)
& (х*. У*) = max S (хф, г*).	(30)
г*еУ*
Выведем из сформулированной теоремы результат теоремы 3 для задачи (25), (27), (28) (обратный вывод совсем прост). Сдбт^
§ 1.2. ГЛАДКИЕ ЗАДАЧИ
85
ношение (29) эквивалентно равенству (18) в теореме 3. Далее, поскольку Ф(х-)е[7, из определения опорной функции следует, что
{у*, Ф (ж.)) < sup (</’• «) = S (у* I U), u<=U
т. е. <//*» Ф (**)) — 5 (У* I < О- С другой стороны, (О, Ф (х,)) — з (0| £/) =0.
Поэтому
0 < max «г*. Ф (х.)> - з (г* | U)) = (у*. Ф (х.)> - з {у* | U) < 0, 2*
откуда
{у*. Ф(Х.))=3(У*|17).
Полученный результат означает, что inf (/,—«) = — sup (у',и) = u^U	u^U
= — s(y* \и) = (у*, - Ф (х j) = (у'о, - и),
и мы сразу получаем соотношение (19) из теоремы 3.
Совершенно аналогичным образом можно записать и теорему Куна — Таккера. Для этого, обозначив через R1 множество векторов из Rn с неположительными компонентами, введем функцию
$ (X, Ао, Л) = Vo (х) + 2	(х) + 6 (X | А) - з (Л | R1),
Z=1
где X = (Xi, ..., Хп). Предоставляем читателю проверить, что теорема 2 равносильна следующей теореме.
Теорема Куна — Таккера о седловой точке. Пусть выполнены условия теоремы 2, включая условие Слейтера. Для того чтобы вектор х* был решением задачи (9) —(11), необходимо существование таких не равных одновременно нулю числа Хо 0 и вектора X е Rn, что
min & (х, Хо, X) = % (х*, Хэ, X) == max 3>	х0, р).
ne=R"
§ 1.2. Гладкие задачи.
Правило множителей Лагранжа
Сформулированное в предыдущем параграфе правило множителей Лагранжа содержит условие локального экстремума. Поэтому его доказательство строится на использовании метода вариаций. Элементарный характер ограничений в гладких задачах позволяет
86
ГЛ. 1. НЕОБХОДИМЫЕ УСЛОВИЯ ЭКСТРЕМУМА
ограничиться простейшими вариациями — вариациями по направлениям.
1.2.1. Задачи без ограничений. Пусть X — линейное топологическое пространство и f — функция на X. Рассмотрим сначала задачу без ограничений, т. е. задачу о безусловном минимуме этой функции:
f(x)->inf.	(1)
Предложение 1. Пусть в точке х* определена первая вариация Sf(x*,h) функции f. Тогда, если х* — точка локального минимума функции f, то
bf(x„ й) = 0
для всех h X.
Доказательство. Зафиксируем h е X и положим <р(0 — f(х, + th). Если х, — точка локального минимума функции f, то t — 0 — точка локального минимума функции <р и, следовательно,
О = Ф' (0) = lim t~' [f (х. + th) - f (х.)] = df (х„ h).
<->о
Следствие. Пусть X — банахово пространство. Предположим, что функция f дифференцируема по Фреше в точке х*. Тогда, если х* — точка локального минимума функции f, то
f'(x,) = O.
Те точки, в которых первая вариация или производная функции f обращаются в нуль, называются стационарными точками функции f, а уравнение
f' (х) = 0 или 6f (х, h) = 0, VA
— условием стационарности. Таким образом, условие стационарности есть необходимое условие минимума в задаче без ограничений. Этот результат называют иногда теоремой Ферма.
Предложение 2. Пусть х. — точка локального минимума функции f. Предположим, кроме того, что в этой точке определена п-я вариация функции f. Тогда
§ 1.2. ГЛАДКИЕ ЗАДАЧИ
87
существует такое целое число I, 21 п, что df (х^ h) = 0, ...,	(х„ h) = О,
б<2/>Ж, 4)>о
для всякого вектора h е X.
Доказательство сразу следует из определения n-й вариации и соответствующей теоремы для функций одного переменного.
Следствие. Пусть X — банахово пространство. Предположим, что функция f дважды дифференцируема по Фреше в точке %*. Тогда, если %* — точка локального минимума функции f, то
Последнее соотношение означает, что квадратичная форма х -* f" (х,) (х, х) неотрицательно определена.
1.2.2. Гладкие задачи с ограничениями типа равенств. Доказательство правила множителей Лагранжа. По условию теоремы 1 множество L = F'(x.)X является замкнутым подпространством пространства У. Возможны два случая: регулярный, когда L = У, и вырожденный, когда L есть собственное подпространство пространства У.
Рассмотрим сначала регулярный случай. Если L = У, то отображение F удовлетворяет в точке х» условиям теоремы Люстерника и, следовательно, пространство, касательное к множеству {х е X |F(x) — 0} в точке х«, совпадает с ядром оператора F'(xt). Если h е Ker F' (х*), то в соответствии с определением касательного вектора мы можем построить вариацию x(t, h) = х* -f- th + r{t) точки x* такую, что
F(х(/, Л)) = 0 при — 6	1	8, 8 > 0,
Г1||г(0||->0 при /->0.
В этом случае функция <р(/) = f(x(t, h)) достигает локального минимума в точке t = 0. Поэтому
ф'(0) = <Г(х.), Л) = 0.
Это равенство должно выполняться для всякого
Кег Г,(х*). Поэтому
f'K)e(KerF'(^))X.
88
ГЛ. 1. НЕОБХОДИМЫЕ УСЛОВИЯ ЭКСТРЕМУМА
По лемме об аннуляторе из § 0.1 найдется такой элемент у* е У*, что
откуда
Итак, правило множителей Лагранжа в регулярном случае доказано. В процессе доказательства мы сразу получили, что Хо У= 0. Однако в регулярном случае константа Ао и не может равняться нулю. Действительно, если Zo = 0, то
(t/\ F' (х.) х) = <F'* (х.) у’, х) = 0
для всех х g X, что в силу условия регулярности влечет равенство //* = 0, а это противоречит требованию теоремы, согласно которому все множители Лагранжа не должны обращаться в нуль одновременно.
Обратимся к вырожденному случаю. Поскольку L — собственное замкнутое подпространство пространства У, аннулятор подпространства L содержит ненулевые элементы (согласно следствию 2 из теоремы Хана — Банаха). Пусть у* — такой элемент. Тогда для всех х^Х
О = (у\ F' (х,) х> = {F'* (х.) у*, х\
т. е. (если Ло = О)
&х(х., 0, /) = Х(х.)/ = 0.
Правило множителей Лагранжа полностью доказано.
§ 1.3.	Выпуклые задачи. Доказательство теоремы Куна — Таккера
Этот параграф построен по схеме § 1.2. Как и там, начнем с изучения простейших вариантов задач выпуклого программирования.
1.3.1.	Задачи без ограничений. Пусть X — локально выпуклое линейное топологическое пространство и f — выпуклая функция на X. Рассмотрим задачу о безусловном минимуме функции f:
f(x)->inf.	"(О
§ 1.3. ВЫПУКЛЫЕ ЗАДАЧИ
89
Предложение 1, Для того чтобы функция f достигала минимума в точке х*, необходимо и достаточно, чтобы выполнялось соотношение
(х,).
Последнее соотношение есть аналог теоремы Ферма из § 1.2 для гладких задач без ограничений.
Доказательство следует прямо из определения субдифференциала.
1.3.2.	Задачи с ограничениями типа равенств. Пусть снова X — локально выпуклое линейное топологическое пространство, f — выпуклая функция на X и М — линейное многообразие, параллельное подпространству L. Задачу
f (х) —> inf;	(2)
х е М	(3)
мы называем выпуклой задачей с ограничениями типа равенств.
Предложение 2. Для того чтобы точка х* была решением задачи (2), (3), достаточно, а если функция f непрерывна в некоторой точке из М, то и необходимо, чтобы
dfWFU1 #=0.
Доказательство. Достаточность сразу следует из определений. Для доказательства необходимости рассмотрим функцию
^(x) = f(x)+6(x|M).
Очевидно, х* будет решением задачи (2), (3) в том и только том случае, когда в точке х* функция Z достигает минимума. Сопоставив предложение 1 с теоремой Моро — Рокафеллара (см. § 0.3), получим
Оенд/ (х) + ^&(х, |М).
Остается заметить, что d6(x*|M) = L1-. Предложение доказано.
90
ГЛ. 1. НЕОБХОДИМЫЕ УСЛОВИЯ ЭКСТРЕМУМА
Следствие. Пусть х*, х*—конечный набор линейных функционалов из X*, аь ...» ап — действительные числа и
М = {х е Х| (х*, х) = а., Z= 1, ...» л].
Пусть, далее, f(x) —выпуклая функция на X, непрерывная в некоторой точке множества М. В этих предположениях точка х* доставляет минимум функции f на множестве М тогда и только тогда, когда существуют такие числа Ль ..., Лп, что
лх+...
Это точный аналог правила множителей Лагранжа для выпуклых задач.
Доказательство. В силу следствия из леммы об аннуляторе есть линейная оболочка множества {4 •••.<}•
1.3.3.	Задачи с ограничениями типа неравенств. Доказательство теоремы Куна — Таккера. Обратимся к задаче (9) — (11) из § 1.1. Пусть х»— ее решение. Рассмотрим в Rn+1 множество С, чьими элементами являются те и только те векторы (go. •... p,n)^Rn+1. для каждого из которых найдется такой вектор х е А, что
fo W — fo (х.) < Pol f i W < Hi. • • •. fn (x) < jx„.
Внутренность множества С не пуста, ибо оно содержит внутренность неотрицательного ортанта в Rn+‘. (Если цо > 0, .... цп > 0, то go > fo(x*) — fo(x*) = 0 и ц, >Л(х*) при i= 1, .... п.) Далее, С —выпуклое множество, поскольку функции fi, i — 0, ..., п, выпуклы. Наконец, 0 ф. С, ибо, если 0 е С, то существует такой хе/1, что f0(x)< fo(x«) и f,(x)^O, i = 1, .... п, т. е. х* — не решение задачи.
По теореме отделимости множество С можно отделить от нуля ненулевым линейным функционалом, т. е. существуют не равные одновременно нулю числа Хо, ...» Хп такие, что
п Зх/И/>о /=0
(4).
4 1.3. ВЫПУКЛЫЕ ЗАДАЧИ
91
для всех (цо, цп)е С. Так как С содержит внутренность неотрицательного ортанта, все U неотрицательны. Тогда из (4) при p/ = fi(x),	Цо4 (fo(x)—
—fo (*.)) следует, что
(5) 1=0
для всех х е А. Если при некотором i #= О fi(x.) — = —а < 0, то при всяком е > 0 множество С содержит ТОЧКУ Цо — . . . — Щ-1 = Щ+1 = . .. = Цп = е,
= —а. Подставляя эти числа в (4) и устремляя 8 к нулю, получаем —0, откуда Ai 0. Поэтому А» — 0. Итак, А, — 0, если Д (х») < 0, и, значит,
Ki ft (х.) = 0 для всех 1=1.....п.
Но в этом случае из (5) следует, что при всех хе Л
п	п
i=0	i=0
Соотношения (12), (13) из § 1.1 доказаны.
Предположим теперь, что выполнено условие Слейтера, т. е. существует х^А такой, что fi(x)<0 при i= 1, ..., п. Если при этом Ао = 0, то, поскольку среди чисел Ai, ..., Ап есть положительные, У.Mi(x)< <0 = 2 &ifi (х„) в противоречии с доказанным утверждением. Поэтому Ао =# 0.
Наконец, если для данных х, е A, Ai 0, ... ..., Ап 0 выполнены соотношения (10), (12), (13) из § 1.1 с Ао = 1, то для всякого хеЛ такого, что. А(х)^ 0,
fo (х.) = fo (х.) + 2 Kfi (X.) < f0 (X) + 2 Kfi (X) < fo (X), t=l	i=l
t. e. x*, действительно, решение задачи. Теорема доказана.
Доказательство теоремы 2' из § 1.1, содержащей условия экстремума в субдифференциальной форме, есть простое следствие из теоремы Куна — Таккера и Моро — Рокафеллара. В самом деле, утверждение
92
ГЛ. 1. НЕОБХОДИМЫЕ УСЛОВИЯ ЭКСТРЕМУМА
теоремы Куна — Таккера означает, что «удлиненная» функция Лагранжа
(х, х0,..., х„)= 2 Х^ (х) + S(x I Л)
1=0
достигает минимума по х в точке х*. Согласно предложению 1 отсюда следует включение
0Е=дх2\(х*, А,о, ..М,
откуда в силу теоремы Моро — Рокафеллара следует требуемый результат:
О е kodfo(х.) + ... + Х„dfn(х.) + N(х, | Л).
§ 1.4. Гладко-выпуклые задачи. Доказательство экстремального принципа
Этот параграф целиком посвящен доказательству экстремального принципа в гладко-выпуклых задачах (теорема 3 из § 1.1). Все доказательство разбито на несколько этапов. Доказательство первой части теоремы связано с исследованием трех частных случаев, двух вырожденных и одного невырожденного, которые мы последовательно рассмотрим. На последнем этапе будет доказано заключительное утверждение теоремы, содержащее условия, гарантирующие неравенство Хо=#=О.
Будем использовать следующие обозначения:
Ло == Irn (х4, и,)сУ
— множество значений линейного оператора Fx(x«, «*), B = L0 + F(x„ U)c.Y
— совокупность тех у е У, для каждого из которых найдутся хеХ и u^U такие, что у = Рх(х*, и*)х +4 U+F(x„a),
L — lin В — линейная оболочка множества В.
По условию подпространство Lo имеет конечную коразмерность, так что Lq и L — замкнутые подпространства.
§ 1.4. ГЛАДКО-ВЫПУКЛЫЕ ЗАДАЧИ
93
1.4.1. Первый вырожденный случай. Предположим, что
L^Y.
Тогда в силу второго следствия из теоремы Хана — Банаха существует ненулевой функционал у* У*, принадлежащий аннулятору подпрострайства L. Имеем
{у\ U,)x + F(xt, U)) = 0	(1)
для всех х е X, u е U. В частности, при и — и* отсюда следует (так как F (х,, и,) = 0), что (z/*, Fx (xt, mJ х) = 0 для всех хет. е.
П(х„ и,)у’ = 0.	(2)
С другой стороны, при х = 0 для всех и е U
W, F(x„u)') = {y\F(x„u^ = 0.	(3)
Полагая Хо = ... = Хп = 0, получаем из (2) и (3) соотношения (18) — (20) из § 1.1. Итак, в данном случае утверждение теоремы 3 из § 1.1 верно.
1.4.2. Второй вырожденный случай. Пусть L = Y. Покажем, что в этом случае intBy=0. В самом деле, поскольку codim Lq < оо, фактор-пространство Y/Lq конечномерно. Обозначим через л: Y -> Y/Lq каноническое отображение в У/Lo, т. е., в частности, = nt/2 тогда и только тогда, когда yi — у2^ Lq. Поскольку линейная оболочка множества В совпадает с У, линейная оболочка множества л (В) совпадает с Y/Lq. Множество В, очевидно, выпукло (как сумма подпространства и множества, выпуклого в силу условия б) теоремы). Поэтому и множество л (В) выпукло. В § 3.5 (теорема 2 из § 3.5) мы покажем, что в конечномерном пространстве выпуклое множество, аффинная оболочка которого совпадает со всем пространством, имеет непустую внутренность.
Итак, ш1л(В)У= 0, с другой стороны, л~1(л(В)) — = В. Поскольку л — непрерывное отображение, это значит, что int В У= 0.
Предположим теперь, что
0 ф int В.
94
ГЛ. 1. НЕОБХОДИМЫЕ УСЛОВИЯ ЭКСТРЕМУМА
Тогда по теореме отделимости существует ненулевой функционал у* е У*, разделяющий В и 0, т. е. такой, что
</.
для всех у е В. Это значит, что для всех х е X, U
<//*, u.)x + F(x„	(4)
Полагая в этом неравенстве и = и*, получаем
</>	ы.)х>>0
для всех х е X. Следовательно, Fx (х,, uj у* — 0. Если же взять х = 0, то из (4) следует, что неравенство
<У\ F(xt, «))>0 = </, F(x„ «.)>
выполняется для всех и е U. Поэтому в данном случае, как и в предыдущем, Хо = ... — Хп — 0, у* — искомые множители Лагранжа.
1.4.3. Невырожденный случай. Предположим, наконец, что
L = Y, OeintB.
Пусть для определенности f 1 (х„, «,)=.. .=fk (xt, и,)=0, fk+i u,) < О, ..., fn (x„ u.) < 0. Рассмотрим в R*+1 X Y множество С, образованное теми векторами (go, •••» Мл, у)^ е Rft+1 X Y, для каждого из которых найдутся хе X, u^U такие, что
> {fix (х„ и), Х> + fi (х„ «) — (х„ «,),	1=0....k,
y = Fx (х„ и,) х + F (х„ и) — F (х., и,).
Для доказательства теоремы 3 из § 1.1 достаточно проверить, что
intC=/=0, 0&С.	(5)
В самом деле, поскольку множество С, очевидно, выпукло, при выполнении условия (5) найдется ненулевой функционал (Ао, ..у*) е Rft+I X К*, отделяющий С от нуля, т. е. такой, что
k
2	+ {у» у) о
i=0
S 1.4. ГЛАДКО-ВЫПУКЛЫЕ ЗАДАЧИ
95
для всех (ц0> •••» Нъ У)^С. Последнее неравенство означает, что при х е X, u^U
2 Ь «fix (х.> и,)> х) + h (х.> и) — h (х,, и,)) +
+ </, Fx(xt, u.)x + F(xt, u) — F(x„ u.))>0
или (если положить = ... = An = 0),— что
(3?х (•’“<> «», ^0» • • •» ^п> У )» х) +
Н" 3F (х,, м, Ад, ..., Zn, у )	3£ (х(, и,, Лд, ..., %п, у )	0.
Полагая в этом неравенстве последовательно и — и, и х = 0, снова приходим к соотношениям, которые требуется доказать. (При этом условия дополняющей не-жесткости, очевидно, выполняются, так как Л/ = 0 при
fi (х„ и,) < 0.)
Таким образом, осталось проверить соотношения (5). Коль скоро OeintB, то, очевидно, 0eint«(B), где, как и раньше, л: У-*У/£0— каноническое отображение. Поскольку пространство У/Lg конечномерно, можно ука^ зать конечное число точек zb ..., zm из пВ, линейная оболочка которых совпадает с Y/Lo и таких, что Zi + ... -f- zm = 0. (Например, если codim Lo = г, то, отождествляя Y/Lo с Rr, можно в качестве Zj, .... zm взять вершины достаточно малого r-мерного куба, центр которого совпадает с началом координат.) По определению найдутся такие Uj е V, j = 1, .... т, что n(F(x*,«j))== Zj, т.е.
Uj)j = O.
(6)
Положим (Щ0,1)= {хеХ|||х||< 1}):
с0 = max (х„ uz) -HI fix (х„ и.) ||);
0</<£
{и е U 13aj>0, 1 m, У a, = k F (x*, и) =
= 2	2 ajfi(X',Ui)>
Bo = Fx (x., u.) U (0,0 + F (x„ Uo).
96
ГЛ. 1. НЕОБХОДИМЫЕ УСЛОВИЯ ЭКСТРЕМУМА
Множество Во выпукло в силу условия б) теоремы и intBo¥=0 (последнее следует из п. 1.4.2, поскольку множество л(Во) содержит точки ..., zm, а Fx(**,u*)U1) открыто в Во)-
Пусть Со = Во X (RJfe+1, где RCo — полупрямая {p R | и > с0}, т. е. произведение множества Во и к + 1 экземпляров полупрямой {ц е R | р > Со}- Ясно, что int Со У= 0 и Со с: С, значит, int С =# 0. Первое соотношение в (5) доказано.
Предположим теперь, что второе соотношение в (5) неверно, т. е. существуют е X, Uq е U такие, что
Рх (х„ и.) х0 + F (х„ «о) — р (* , и,) = 0,	(7)
<fix(x„ и,), хэ> + А(х., «о)— fi(X„ «.)< — б<0,
1 = 0...k.	(8)
Зафиксируем некоторое е > 0 и рассмотрим следующее отображение пространства X X Rm+1 в Y:
& (х, а0...ая) = 11 -aj-e 2 а/}/7(х, + х, ut) +
+ Ujp(х„ 4-Х, и0) 4-е 5 Я/Р(х. + х> и/)-j=l
Отображение 3", очевидно, дифференцируемо по Фреше на множестве (V — х*) X Rm+1, где V — окрестность точки х*, участвующая в формулировке теоремы, производная Зг' непрерывна в начале координат и
(о, ..., 0) (х, аэ, .... ат) = Fx (х., и.) х 4-
т
+ аэ (Р (*.. Щ)~Р (х„ и,)) 4- в 2 а/ (Р(х„ и})—Р (х„ и,)). (9)
Очевидно, #~(0,	0) = F(x*, н«) = 0. Множество значений оператора ^"'(0,	0) содержит Во и, следова-
тельно, совпадает с Y. Далее, в силу (6) существует такой вектор х' е X, что
т
Fx(x„ u^x' + ^F^u^O.	(10)
§ 1.4. ГЛАДКО-ВЫПУКЛЫЕ ЗАДАЧИ
97
Из (7), (9), (10) следует, что
^'(0,	О)(хо4~ех', I, 1) = 0,
т. е. вектор (х0 + ex', 1,	1) принадлежит ядру one-
ратора ^'(0,	0). По теореме Люстерника найдутся
такие отображения
t -> х (0, t -> йо (0, • • •, t йш (0
некоторого отрезка [—е0, 80] (где 80, вообще говоря, зависит от е) в X и R соответственно, что при t->Q \\х (0 II + 2|	(0 1^“>0 и (при всех 0 ST (/(х0 + ex' +
+ х (0), t (Т + Йо (0), . . . Л (1 + (0)) = 0.
Полученный результат верен для всех 8 > 0. Выберем теперь е так, чтобы
8
т
{fix (х„ и,), х'} + S fi (Х„ Uj) i=i
<6/2
) ft (xt + х, ы,) 4-
gi (х, а3, .... ат) =
при всех i = 0, ..., k, и рассмотрим функции
1 — «Э — 8 з а,-/=1
+ W; К + X, но) + 8 2 a.jfi (х. + х, Uj). /=1
Тогда
( fo(x*> Ю, если / = 0,
*<°......о4 0, если i=l......................k,
функции gt дифференцируемы в нуле и
.... 0), (х, а0, .... ат)> = (^(х., ц,), х) +
+ аэ(Л(*., «о)— fi(x., н,)) + еЗ	и})—f{ (х„ «,)). (11)
J-1
Отсюда и из (8) в силу выбора е следует, что
<g;(0, ...» 0), (х0 + 8Х', 1,	1)> < - 6/2
4 А. Д. Иоффе, В. М. Тихомиров
98
ГЛ. 1. НЕОБХОДИМЫЕ УСЛОВИЯ ЭКСТРЕМУМА
при всех z = 0, .... k, т. е.
gi (t (х0 + гх' + х (/)), t (1 + й0 (0), ..., t (1 + ат (/))) = = gj(O,...» 0) +/<^(0.....О),(хо4-ех', 1,..., 1)> + о(0<
<gi(0.......0)-/6/2 4-0(0. (12)
Положим х (/) = х, 4~/(*о4- ex' + х (/)). Тогда, очевидно, х(/)->х, при /->0. Далее, при достаточно малых t
t 1 4" й0(0 + е 2 (1 + йу(/)) <1, L	/=i	J
1 4-йа(/)>0,	14-ат(/)>0.
Согласно условию б) теоремы 3 из § 1.1 при таких t можно указать элемент и (/) е U такой, чтобы выполнялись соотношения
F(x(t), u(t)) =
= (1 -1 (1 + й0 (0) - е/ 2 (1 4- й, (0)] F (х (/), и.) 4-
4- i (I 4- йо (0) F (х (0, «о) + е/ 2 (1 4- йу (/)) F (х (/), Ы/) =
= ^-(/(хо4-ех'4-х(0),/(1 4-йо(О). ...,/(14-йт(0)) = 0, А(х(/), и(О)<(1-/(14-йо(О)-
-8/1(1 + й/ (0)] fl (х (0, И,) + / (1 4- й0 (/)) ft (X (/), Ыо) 4-4-6/20+ “/ (0) ft (х (/), И/) = gi (/ (хЭ 4- 8Х' 4- X (/)), /(1 + йо(О).........../(1+йт(/))), 1 = 0, ..., т.
Из них и (10) — (12) следует, что при малых />0 Г(х(/), «(/)) = 0, /0(х(/), u(/))<f0(x„ «,), (х (/), и (/)) < 0, i=l,
Наконец, при	1, очевидно, Пт/г(х(/), ы(/))<2
/->0
^sfz(x., «,) < 0. Таким образом, если / достаточно
§ 1.4. ГЛАДКО-ВЫПУКЛЫЕ ЗАДАЧИ
99
мало, то (х(/),	— допустимый элемент нашей задачи, fo(*(O, и(0) <	и*) и %(/)-> х* при / 0. Но
это значит, что точка (х#, и*) не может быть точкой локального минимума, вопреки условию теоремы. Поэтому предположение о том, что 0 е С, было ошибочным и, значит, соотношения (5) верны. Первая часть теоремы 3 из § 1.1 доказана.
1.4.4. Регулярный случай. Нам осталось доказать вторую часть теоремы 3 из § 1.1. Для этого достаточно проверить, что при выполнении условия г) теоремы (предполагающего, что образ множества X X U при отображении
(х, u)->Fx(x., u,)x + F(x<f и)
содержит окрестность нуля в У и что существуют х0 е X, ий^.и такие, что
Рх (х„ ut) х0 + F (xt, и0) = 0,	(13)
и,), Xo) + f,-(x„ «о) <0 при	(14)
т. е. при тех I, при которых fi(xt, u,) = 0), соотношения
к
Рх (Х„ и,) у' + 2 htflx (х„ и,) = 0,	(15)
1=1
k
о = F (х„ «.)) + 2 h{f{ (х., «.) =
1=1
k
= min {у*, F(x„ и)> 4- 2	(х., и)
u^UL	i=l
(16)
не могут выполняться ни при каких	...,
е У*, хотя бы один из которых отличен от нуля.
В самом деле, если хотя бы одно из чисел отлично от нуля, то из (14) следует неравенство
k
2 hi [<fix (x„ и,), x0> 4- fi (x,, Uo)l < 0. f=l
откуда в силу (15)
k
- W, Fx (x., «.) XO> 4- 2 hifi (x„ u0) < 0 j=l
4*
100
ГЛ. Т. НЕОБХОДИМЫЕ УСЛОВИЯ ЭКСТРЕМУМА
и, значит, согласно (13)
k
{у,	«о)> + 2 hfi (х,, м0) < 0
1=1
в противоречии с (16). Поэтому Xi = ... = Хн = 0. Если при этом у* 0, то в каждой окрестности нуля пространства Y найдется точка у такая, что {у*, у} < 0. Поэтому мы можем выбрать xg X и и е U так, чтобы
</. Fx (х., U,)x + F (х„ и)) < 0.
Но поскольку все числа X,- равны нулю, из (15) следует, что {у*, Fx(x*, и*)х} — 0 и, значит, {у*, F(x„ «))< <0 в противоречии с (16). Этим завершается доказательство экстремального принципа для гладко-выпуклых задач.
Комментарий к гл. 1. К § 1.2. Правило множителей Лагранжа для бесконечномерных задач было доказано Люстерником [1] и Голдстайном [1]. Задачи с неравенствами рассматривал Джон [1].
К § 1.3. Выпуклое программирование ведет начало с работы Куна — Таккера [1]. Условие Слейтера появилось в работе Слейтера [1]. Различные обобщения содержатся в работах Фана, Гликс-берга и Гоффмана [1], Удзавы, Гурвица (см. Эрроу, Гурвиц, Уд-зава [1]), Гольштейна [1], [2], [4], Рубинштейна [1], [2] и др.
К § 1.4. После того как был сформулирован принцип максимума Понтрягина, появились исследования, где разрабатывались общие методы получения необходимых условий экстремума, и работы, где необходимые условия выводятся для более широких классов задач. Кроме исследований на эти темы, упомянутых в комментарии ко введению, укажем на работы Гамкрелидзе [5], [6], [8], Пшеничного [3], Халкина [6]. Задачи, подобные тем, которые мы назвали гладко-выпуклыми, рассматривались Пшеничным [3]. Теорема 3 обобщает результат Пшеничного и Ненахова [1].
Глава 2
НЕОБХОДИМЫЕ УСЛОВИЯ ЭКСТРЕМУМА
В ЗАДАЧАХ КЛАССИЧЕСКОГО ВАРИАЦИОННОГО ИСЧИСЛЕНИЯ И ОПТИМАЛЬНОГО УПРАВЛЕНИЯ
В §§ 2.3, 2.5 с использованием теорем 1 и 3 из гл. 1 дается вывод уравнений Эйлера — Лагранжа для задачи Лагранжа классического вариационного исчисления и принципа максимума Понтрягина для задач оптимального управления; § 2.2 и п. 2.4.2 посвящены независимому от гл. 1 элементарному выводу важнейших необходимых условий минимума для простейших классов задач вариационного исчисления и оптимального управления.
§2.1. Постановки задач
2.1.1. Функционалы, ограничения, граничные условия. Мы будем рассматривать лишь одномерные задачи, когда независимое переменное /, называемое иногда временем, принадлежит некоторому отрезку [/0, М, —оо /о < Л ^ °°- В задачах, с которыми приходится иметь дело, как правило, участвуют две группы переменных: х = (ли, хп) и u = (u1, ur). Переменные х называются фазовыми, переменные и — управлениями. В задачах, относящихся к классическому вариационному исчислению или оптимальному управлению, присутствуют три элемента: функционал, ограничения на фазовые координаты и управления и граничные условия, накладываемые на фазовые координаты на концах рассматриваемого в задаче отрезка времени. На самом деле не всегда разумно устанавливать разделение на ограничения и граничные условия, но в большом числе случаев это разделение выглядит естественно и оказывается удобным.
Функционалы встречаются трех видов. Интегральные функционалы имеют такую форму:
Л
(X (•), и (•)) = J f (t, х (/), х (t), и (/)) di, (1) ^0
102
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
где ft R X R” X Rn X Rr~*R; функция f называется интегрантом.
Функционалы, зависящие от конечных значений фазовых координат, т. е. функционалы вида
У2(х( -)) = ф(/с, x(t0), tit х(О),	(2)
где ф: RXR"XRXRn-*R, называются терминальными. Наконец, встречаются функционалы смешанного вида
Ш’),	=	«(-)) + ^2(х(-)),	(3)
где — интегральное, а <72— терминальное слагаемое.
Ограничения, с которыми мы столкнемся, будут двоякого рода. Это — либо функциональные соотношения, выражаемые равенствами и неравенствами:
Gdt, x(t), x(t), u(t)) = 0, | G2(/, x(t), x(t), m(/))^0, J
где Git RXR"XR',XRr -*R4 Z=l, 2, либо нефунк-циональные соотношения, например:
и (0 е U cz Rr, A cz [/b f2J- (5)
Функциональные ограничения вида (4), не зависящие от производных и управлений, т. е. соотношения
х(/)) = 0, g2(t, х(/))<0,	(6)
будем называть фазовыми ограничениями.
Ограничения типа
х(/) = Фа, х(0,	(7)
где <р: R X R” X Rr Rn, называются ограничениями в разрешенной форме.
Уравнением (7) описываются многие управляемые объекты. Отсюда и названия — фазовые координаты и управления. Если управление задано, то уравнение (7) становится обыкновенным дифференциальным уравнением относительно х. Всякое его решение, соответствующее управлению и(-), называется фазовой траекторией, а пара (х(-),и(-)), связанная уравнением (7), называется управляемым процессом.
Граничные условия задаются выделением в пространстве R X R” X R X Rn некоторого множества Г, ко-
§ 2.1. ПОСТАНОВКИ ЗАДАЧ
103
торому должны принадлежать концы траектории, т. е. точка (/о, х(/о),	х(6)). Часто встречаются такие гра-
ничные условия:
—	закрепленные, когда значения траектории закреплены на обоих концах отрезка [/0, Л] (при этом сам отрезок предполагается фиксированным): х(/0) = Хо, x(^l)=Xi;
—	свободный правый или левый конец, когда соответствующий конец отрезка [/о, 6] предполагается фиксированным, но на нем условия на фазовую траекторию отсутствуют;
—	периодические, когда отрезок [/0, М фиксирован и фазовая траектория принимает равные значения на концах: х(/0) = х(Л).
2.1.2. Задачи классического вариационного исчисления и оптимального управления. Общая постановка:
^ (%(•), и (•))-> inf (sup);	(8)
Gi(/,x(0, х(/), w(0) = 0, G2(f, х(0, x(0, u(0)<0, (9) u(t)^U(t),	(10)
(11) охватывает большинство задач оптимального управления и вариационного исчисления. (Отрезок |70, Л] не предполагается закрепленным. Если же он фиксируется, то соответствующую задачу называют задачей с закрепленным временем.)
Если функционал (8) является интегральным, задача (8) — (11) называется задачей Лагранжа', если функционал— терминальный, то она называется задачей Майера и, наконец, если функционал — смешанный, то соответствующая задача называется задачей Больца.
Все три постановки являются в значительной мере равносильными. Если, например, задан интегральный функционал, то, введя новую координату xn+1 и пополнив систему (9) уравнением
xn+1 — / = о
с граничным условием хп+1(/о)=О, мы задачу о минимизации функционала
104
ГЛ 2. НЕОБХОДИМЫЕ УСЛОВИЯ 7
сведем к минимизации терминального функционала .
5<2 = хп+1 (Л).
Наоборот, если требуется минимизировать терминальный функционал «7г = ф(/1, *(М), скажем, при фиксированных значениях to и x(to) (тогда без ограничения общности можно считать, что ф(/о, x(to)) = 0), то, предполагая, что функция ф дифференцируема, можно положить
№^>-^4^-14
и мы получим, что
=	Х(Л))
Особенности задач классического вариационного исчисления состоят в следующем. Во-первых, в задачах классического вариационного исчисления все функции, входящие в описание задачи, предполагаются гладкими, по меньшей мере — непрерывно дифференцируемыми. С другой стороны, там отсутствуют нефункциональные ограничения вида (10). (Эти обстоятельства позволяют относить задачи вариационного исчисления к числу гладких задач, о которых речь шла в п. 1.1.1.) В задачах же оптимального управления нефункциональные ограничения играют весьма существенную роль. Само по себе множество U(t), задающее ограничение (10), может иметь самую разнообразную природу, например, оно может быть дискретным множеством. Это делает неестественным рассмотрение в задачах оптимального управления гладких и даже непрерывных управлений, а вместе с этим и допущение о гладкости отображений Gi, G2 в (9) и т. д. по управлениям и. Так что стандартные допущения в задачах вариационного исчисления—-непрерывная дифференцируемость по всем переменным, а в задачах оптимального управления — непрерывность по совокупности переменных и гладкость по переменным tux. Задачи оптимального управления будут редуцированы к гладко-выпуклым задачам, о которых речь шла в п. 1.1.3.
Приведем несколько примеров частных задач, укладывающихся в общую схему.
§2.1. ПОСТАНОВКИ ЗАДАЧ
105
Простейшей векторной задачей называется задача следующего вида:
3 (х (•)) = J L (t, х (/), X (0) -> inf;
^0
(12)
(х(/0), хОеГ.
В (12) отрезок [Mi] предполагается фиксированным, функция L — определенной и непрерывно дифференцируемой в некоторой области пространства R X X Rn, множество Г, задающее граничные условия, — произвольным подмножеством пространства Rn X Rn- Если п = 1, то задачу (12) называем коротко простейшей задачей.
Буква L для обозначения интегранта простейшей векторной задачи выбрана в честь Лагранжа. При этом производится неявная апелляция к языку и символике классической механики. В основании классической механики лежит принцип наименьшего действия (или как иногда его называют — принцип стационарного действия— что более точно). Согласно этому принципу траектории движения системы частиц в силовом поле U являются стационарными точками функционала действия
Под знаком интеграла стоит лагранжиан системы, являющийся разностью кинетической и потенциальной энергии:
L = Т - U.
В силу сказанного, интегрант L иногда называют лагранжианом, даже если задача взята не из классической механики.
п
Выражения p^L*, Н— 2 Pi*i L называются в механике 1 i=l
импульсами и энергией системы. В дальнейшем мы иногда будем употреблять эти термины, навеянные классической механикой.
Задачей Лагранжа с ограничениями в разрешенной форме и фазовыми ограничениями типа равенств и
106
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
неравенств называют следующую проблему:
У(х(- ),«(.)) = J f(t,x(f), и inf-, (13) fo
x = <p (t, x, и),	(14)
g\(t,x (/)) = 0, g2 (t, x (0) <0,	(15)
hQ (to, x (Q) = 0, (tu x (Л)) = 0,	(16)
u<=U.	(17)
Здесь интегральный функционал не зависит от х. Ограничения разделены на разрешенные — (14) и фазовые— (15). Граничные условия описываются соотношениями (16). (Так можно задать не все встречающиеся в приложениях граничные условия. Скажем, периодические условия таким путем описать нельзя. Но вместе с тем, соотношения (16) дают возможность выразить достаточно широкий класс граничных условий.)
При рассмотрении задачи Лагранжа в рамках классического вариационного исчисления будем предполагать, что отрезок [/о, fi] является фиксированным и ограничение (17) отсутствует.
Задача (13) — (17) называется автономной, если во всех входящих в ее определение функциях и отображениях отсутствует явная зависимость от времени.
Линейными задачами оптимального управления дем называть задачи с закрепленным временем следующего вида:
J ((a(01x(0)44H0l«(0)X->inf;
t,
x=A(t)x + B(t)u,
(gi (01 x (OX az (0, i = 1, ..., m,
(Aft/l*(^)) = Pft/. *=0,1, j=\,...,sk, u<=U.
Иногда требование о закрепленности времени при определении линейных задач опускают. Эти и более
§ 2.1. ПОСТАНОВКИ ЗАДАЧ
107
общие задачи оптимального управления будут исследованы в § 9.3 методами выпуклого анализа.
2.1.3. Сильный и слабый экстремум в задачах классического вариационного исчисления. Поставленные выше задачи обладают все еще неопределенностью, ибо не описан класс допустимых элементов. Задача Лагранжа (13) — (16) с фиксированным временем в рамках классического вариационного исчисления будет исследоваться в банаховых пространствах Сл([/0, Л])Х X Сг ([/о, Л]), где С?([tQl Zi]) — пространство непрерывно дифференцируемых вектор-функций, а Сг([/0, Л]) — пространство непрерывных вектор-функций. (Норму в пространстве Ci условимся обозначать для сокращения П-Ili, норму же в пространстве С, если мы хотим сопоставить ее с нормой в пространстве Ci, иногда обозначаем || • По-) Исследование простейших задач проводится в банаховых пространствах СГ([/0, М)*
Локальный минимум в пространстве С? X Сг в случае задачи Лагранжа (или в пространстве С” в случае простейших задач) называется слабым. Иначе говоря, пара (*♦(•), tt*(’)) доставляет слабый локальный минимум функционалу ЗЧх( •),#(•)) в задаче (13) — (16), если найдется такое число е > 0, что для любой допустимой пары (х(-), м(-))е Ci X Сг такой, что
Пх( •)—*.(•) Hi < е, II г/( •) — «^ (’ )По < выполняется неравенство
При этом пара называется допустимой в задаче, если она удовлетворяет ограничениям (14) и (15) и граничным условиям (16).
Совершенно аналогично определяется слабый минимум для простейшей задачи (12).
Локальный экстремум в топологии пространства С? (по х) называется сильным. Иначе говоря, допустимая пара (%*(•), «*(•)) доставляет сильный локальный минимум функционалу 3 в задаче (13) — (16), если найдется такое число 8 > 0, что для любой допустимой пары (х(-), м(-)), для которой
108
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
выполняется неравенство
Аналогичным образом определяется сильный минимум для простейшей векторной задачи (12).
Но мы будем в термин «сильный экстремум» вкладывать несколько расширенное толкование, которое свойственно этому понятию в задачах оптимального управления. Об этом речь пойдет в следующем пункте.
2.1.4. Допустимые управления и управляемые процессы в задачах оптимального управления. Оптимальные процессы. Уже упоминалось, что требование непрерывности управлений во многих случаях не является естественным. Нередко из самой постановки задачи вытекает необходимость рассматривать более широкий класс допустимых управлений. Иногда в качестве такового берут класс кусочно-непрерывных управлений. Мы же будем обычно рассматривать в качестве допустимых произвольные ограниченные измеримые управления, принимающие значения из множества U(t).
При таком выборе допустимых управлений требуется уточнить понятие управляемого процесса. Процесс (x(t),u(t)) называется управляемым на отрезке [/0, Л], если на этом отрезке функция u(t) —допустимое управление, х(/)—абсолютно непрерывная вектор-функция, удовлетворяющая почти всюду уравнению (14):
х(/) = ф(/, x(i), u(t)).
В понятие допустимого управляемого процесса включается и отрезок времени, на котором этот процесс рассматривается. Таким образом, управляемый процесс, допустимый в задаче (13) — (17), это тройка (х(/), u(t), [/о, 6]) такая, что вектор-функции х(/) и u(t) образуют управляемый процесс на отрезке [Zo, ti] и при этом фазовые переменные x(t) удовлетворяют фазовым ограничениям (15) и граничным условиям (16).
Допустимый процесс (^(0,^(0, [/0*Д1*]) назовем оптимальным, если найдется 8 > 0 такое, что для всякого другого допустимого процесса (х (/), и (/), fo, М), для которого | /о —/о* I < е, | Л — J < 8, ] x(t) —х* (/) [< е
§ 2.2. ЭЛЕМЕНТАРНЫЕ ВЫВОДЫ
109
(V/ <=Ro,^i]CIRo*, Л*]) имеет место неравенство
<?(*( J,a( J)>^.K(-), MJ).
В описанной ситуации говорят еще, что процесс (%*(/), Ro*, 6*]) доставляет сильный минимум в задаче (13) — (17).
Таким образом (возвращаясь к задачам классического вариационного исчисления), в расширенное понимание сильного минимума вкладывается следующий смысл. Проиллюстрируем его на векторной задаче классического вариационного исчисления.
Мы говорим, что вектор-функция x*(f) доставляет сильный минимум в задаче (12), если существует е > 0 такое, что для всякой функции х(/)е i(Ro, М)> удовлетворяющей граничным условиям и неравенству
||*(')~х.(’)11о<е,
имеет место неравенство
(*,(•)).
§ 2.2. Элементарный вывод необходимых условий экстремума для простейших задач классического вариационного исчисления
В этом параграфе мы даем вывод необходимых условий Эйлера, Вейерштрасса, Лежандра и Якоби, используя самые элементарные средства. Наши рассуждения всюду основаны на непосредственном применении метода вариаций.
2.2.1. Элементарный вывод уравнения Эйлера. Начнем с простейшей задачи с закрепленными концами:
^(x(.))=f L(t, x(t), x(t))dt-> ini;
t,
x(tQ) = xQt xit^x^
Предположим, что функция L(t,x,y) непрерывно дифференцируема в некоторой области U пространства R3. Задачу (1) будем исследовать на слабый экстремум, т. е. — в пространстве Ci(Ro, 6]).
110
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИ,
Вывод уравнения Эйлера состоит из трех этапов. Первый этап состоит в доказательстве того, что функционал Sf обладает первой вариацией (в любой точке х*(-) такой, что точки (/,х* (£),%*(/)),	принад-
лежат области 17), и в получении необходимого условия в терминах первой вариации. Рассмотрим функцию одного переменного
<р(А) = ^(х.(-) + Ах(-))= J ЧЧЛ А)<# = ffl
= J L (t, x, (0 + Kx (0, x, (0 + Ax (0) dt, (2) f(J
порожденную вариацией x(t, X) = x.(0 + Ax(0 точки x.(-) по направлению точки x(-). При наших допущениях относительно L, х,(-) и х(-) функция Чг(0А) является дифференцируемой по 1 при достаточно малых А, и при этом производная непрерывна, ибо
о л
= Lx (t, х. (0 + Ax (0, х. (0 + Ах (0) x (0 +
+ U (t, x, (0 + Ax (0, x, (0 + Ax (0) x (0.
Следовательно, допустимо дифференцирование в (2) под знаком интеграла и при этом
fl
ф' (0) = б5< (х. (•), х (.)) = J (q (0 х (0 + р (0 X (0) dt, t,
где
q (0 = Lx (t, x, (0, x. (0), p (0 = L, (0 x. (0, x, (0).
Далее, если функция x.(0 подозреваема на экстремум, то она допустима, и значит, для любой функции х(0, принадлежащей подпространству Lo:
Lo = {х (0 6= Ct ([f0, 0]) | х (0) = x (0) = 0}, функция x#(/)+ Ax(0 будет проходить через те же граничные точки, что и функция х»(0. Следовательно, если х.(0 есть решение задачи (1), то при условии, что
§ 2.2. ЭЛЕМЕНТАРНЫЕ ВЫВОДЫ
111
x(/)eLo> функция, определяемая соотношением (2), должна иметь минимум в точке нуль. В итоге мы приходим к такому необходимому условию экстремума:
ф'(0) = дЗЧМ-).*(-)) = 0, Vx(-)eL0.	(3)
Первый этап вывода закончен.
Второй этап состоит в преобразовании выражения для первой вариации на пространстве Lo посредством интегрирования по частям. Делают это двумя путями: следуя Лагранжу, когда интегрируют по частям второе слагаемое, и — Дюбуа-Раймону, когда интегрируют первое. Преобразование по Лагранжу предполагает дополнительное условие гладкости, а именно, допущение, что функция р (0 = L-t | (() является непрерывно дифференцируемой. При этом дополнительном предположении проинтегрируем по частям второе слагаемое в выражении для первой вариации при условии, что х(-)е£о- Мы получаем:
d^(x,(-),x(.))= J a(f)x(t)dt,	(4)
где
а(0 = <7(0-р(0'=(“4^ + £*)| ’
'	/ lx,(О
Приведем теперь преобразование первой вариации по Дюбуа-Раймону. Для этого проинтегрируем по частям первое слагаемое на пространстве Lg:
t,	t, ft,	\
J q(t)x(f)dt— — rfl J <7 (t) dx 1 x (/)— /•	t,	/
fl / fl	\
— | I j q (t) dx j x (/) dt fo м	/
и получим, что выражение для первой вариации имеет такой вид:
ft
бЗЧх.(-),х( •))==/ b(t)x(i)dt,	(5)
112
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
где tt	и
b(t)= / q(x)dx + p (0= J Lx |xUT) dx + L* |xUf). t	t
Переходим к третьему этапу вывода уравнения Эйлера.
Лемма Лагранжа. Пусть функция a(t) непрерывна на отрезке [/0, М- Предположим, что для любой непрерывно дифференцируемой функции x(t), обращающейся в нуль на концах отрезка [/о, /1], выполнено равенство
J a(t)x(t) dt = Q. to
Тогда a(t) = 0.
Доказательство. В силу непрерывности функции a(t) достаточно проверить, что а(/)== 0 во внутренних точках отрезка [/о, ti]- Предположим, что в некоторой внутренней точке отрезка т значение а(х) #= 0. Без ограничения общности можно считать, что а(т) > 0.
Выберем е>0 столь ма-’	лым, чтобы, с одной сто-
|---и ।	---1----ч—роны, отрезок До — [т— 8,
t0 r-е г г+5	1 т + е] целиком лежал бы
Рис. 2.	внутри отрезка [/0, /1], а с
другой стороны, чтобы на этом отрезке функция a(t) была бы больше некоторого положительного числа а. Возьмем теперь любую неотрицательную, но не тождественно равную нулю финитную функцию из С1ф0, Л]) с носителем в До. Например, в качестве такой функции можно взять (рис. 2)
.	( (^ —т + е)2(^ —т —е)2, t е= До,
Применив теорему о среднем из интегрального исчисления, получим:
J а (/) х (0 dt = J а (/) х (/) dt a J х (/) dt > 0. До	До
Мы пришли к противоречию. Лемма доказана.
§ 2.2. ЭЛЕМЕНТАРНЫЕ ВЫВОДЫ
113
Завершим вывод уравнения Эйлера по Лагранжу. На первом этапе было установлено, что если х*(/) — решение задачи (1), то выполнено равенство (3). На втором этапе было показано, что на подпространстве Lo первая вариация (правда, при дополнительном предположении) представима в виде (4). Сопоставив эти два факта с леммой Лагранжа, приходим к выводу, что если х*(/) есть решение задачи (1), то необходимо должно выполняться соотношение
(- 4 +1.) | = - 4 и (i.x.«), i. (о) +
+ МЛ хД/), хД/)) = 0,
называемое уравнением Эйлера задачи (1) в форме Лагранжа.
Отметим, что при выводе использовались вариации х(/, Z) = хД/)+Zx(/, т, s) экстремали х*(/) по направлению х(/, т, в), изображенному на рис. 2.
Для того чтобы вывести то же самое уравнение по Дюбуа-Раймону докажем следующую лемму.
Лемма Дюбуа-Раймона. Пусть функция b(t) непрерывна на отрезке [/0, 6]- Предположим, что для любой непрерывной функции v(t), в среднем равной нулю, выполнено равенство ц
J dt — O. h
Тогда b(t)= bo = const.
Напомним, что функция v(t) называется в среднем равной нулю, если
ц
Доказательство. Допустим, что заключение леммы неверно. Тогда должны найтись две точки Ti и т2, лежащие внутри отрезка [/оЛ1], Для которых &(ti)¥= =/=&(т2), скажем, ti < т2 и 6(ti)>&(t2). Выберем
114
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
с > О столь малым, чтобы интервалы
Д1 = [Т1 — е, Т1 4- е]
и
Д2 = [т2 — е, т2 Ч- е]
не пересекались друг с другом, лежали внутри отрезка [/о, Л] и .при этом выполнялось неравенство:
р( = min b (/) > max b (t) = р2.
Очевидно, что этого можно добиться. Рассмотрим теперь любую непрерывную функцию и(/), которая вне Al U Аг равна нулю, на Ai неотрицательна и не тождественно равна нулю, а на Аг принимает противоположные значения. В качестве примера нужной функции можно взять
v(t) = v (t, tf, т2, е) =
(t — т, + е)2(— t + Т1 + 8)2. — (t — Т2 + 8)2(— t + Т2 + в)2,
f е Ди /еД2,
/е[/0, ММД^Дг).
Снова по теореме о среднем получим 1\
J b(f)v(f)dt — j b(t)v(t)dt + j b(i)v(t)dt^
Ai	A2
XP1- p2) J v(t)dt >0.
Д,
Противоречие с условием доказывает лемму.
Сопоставив соотношения (3) и (5) с леммой Дюбуа-Раймона, получаем, что если х*(/) является решением задачи (1), то необходимо должно выполняться соотношение
Л
J q(x)dr + p{t)^c0, t или, подробнее, fi
J Lx (т, х, (т), х. (т)) dr + Ц (t, х, (/), х, (/)) = с0. t
§ 2.2. ЭЛЕМЕНТАРНЫЕ ВЫВОДЫ
115
Это соотношение называют уравнением Эйлера в форме Дюбуа-Раймона.
Первое слагаемое в последнем соотношении можно продифференцировать, откуда вытекает, что и второе слагаемое является непрерывно дифференцируемым.
Итак, мы пришли к следующему утверждению.
Предложение 1. Пусть в задаче (1) лагран* жиан L непрерывно дифференцируем в некоторой области U cz R3 такой, что ей принадлежат точки (/,	/ е [/о, Л], где	Ci([/0, ZJ). Для
того чтобы функция x*(Z) доставляла слабый локальный минимум в задаче (1), необходимо, чтобы было выполнено уравнение Эйлера в форме Лагранжа-.
(t, X, (t), х, (/)) + Lx (t, xt (/), x. (/)) = 0.	(6)
Функции x#(/), вдоль которых выполнено уравнение Эйлера, называются экстремалями.
Приведем несколько частных случаев, когда у уравнения Эйлера имеются интегралы.
Следствие 1. Если функция L не зависит от х, то для экстремальности х*(/) необходимо, чтобы было выполнено соотношение
Lx(t,xt(t)) = O,	(7)
Следствие 2. Если функция L не зависит от х, то уравнение Эйлера допускает интеграл импульса-.
р (0 = Li (t, xt (/)) =ра = const.
Следствие 3. Если функция L не зависит от t, то уравнение Эйлера допускает интеграл энергии:
H(t) = p(t)xt(t)-LM), *.(0) =
= Ei (х, (0, х„ (/)) х, (/) — L (х, (0,	(0) Но — const.
Следствия 1 и 2 непосредственно вытекают из (6). Для доказательства следствия 3 надо взять производную dff	/сч
и, воспользовавшись (6), показать, что она равна нулю.
116
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
Итак, для экстремали х*(/) найдено дифференциальное уравнение (6) второго порядка. Общее решение этого уравнения зависит от двух произвольных постоянных. Они «тратятся» на удовлетворение краевых условий.
Наметим путь вывода необходимого условия экстремума для простейшей задачи Больца:
(X ( • )) = ф0 (х (/0)) 4- 1|>1 (х (/,)) + tl
+ j L(t, х (0, х -> inf, (8) h
где, в отличие от задачи (1), нет краевых условий, но функционал имеет терминальные слагаемые.
Этапы доказательства те же. В предположении о непрерывной дифференцируемости всех входящих в (8) функций, легко проверить, что для функции х»(/), лежащей в области дифференцируемости ф0, ф> и L, у функционала $ существует первая вариация и она равна
б^ (х, (•), х (•)) =
= Фо (*. (4>)) х (/0) + Ф1 (х, (Л)) х (^) + 65" (х. (•), х (•)) =
+ J (LJxUOx(/) + LJXi(Ox(f))^. (9)
-
Если х, (f) есть решение задачи (8), то очевидно, что б$(х, (•), х( • )) = О,
VxDeCUtMJ).	1 }
На подпространстве Lq, введенном нами ранее, первые вариации	и 6.7 совпадают и, следовательно, в силу
предложения 1, L*[ = р (t) есть непрерывно дифференцируемая функция и выполнено уравнение Эйлера (6). Интегрируя по частям выражение (9) для первой вариации функционала 6«$(х*( •),%(•)) по Лагранжу и
§ 2.2. ЭЛЕМЕНТАРНЫЕ ВЫВОДЫ
117
воспользовавшись уравнением Эйлера, мы приходим к тому, что
6$ (х. (•), X (•)) = (t' (х. (Q) — р (/„)) х (t0) +
+ W (*.('>)) + ? 044-
В силу соотношения (10) отсюда следует, что
^0 (х* (М)= Р (М> “ (*• (М) = Р (Q-
Мы пришли к следующему утверждению.
Предложение 2. Пусть в задаче Больца (8) функции -фо, t|)i и L являются непрерывно дифференцируемыми. Для того чтобы функция x*(t) доставляла слабый локальный минимум в задаче (8), необходимо, чтобы было выполнено уравнение Эйлера
(-4l*+l‘)I , =°	(и>
\ at	/	(0
с краевыми условиями
р (Q=Lx L. «.у=(х* (М)’
',W=L*L«.1=-4’:W'1))-	(12)
Все сказанное нами выше безо всякого труда распространяется на векторный случай. Например, если рассмотреть простейшую векторную задачу, где в (1) х(.)еС?([/0,/1]), хоеГ,	L: R X R" X R"-> R,
то мы придем к уравнению Эйлера, имеющему в векторной записи вид (6). На самом деле это — система п уравнений второго порядка:
— -^-L.i (^ х1, ..., хп, х1, ..., хп) +
+ Lxi (/, х1, ..., хп, хх, ..., хп) = 0,	(6')
где i= 1, п. Общее решение этого уравнения зависит от 2п параметров, которые «тратятся» на удовлетворение краевых условий.
Аналогично дело обстоит и с простейшей векторной задачей Больца, когда в (8) х (•) е С\ ([/0, /J), *ф0: R" —> R, R"->R, L: R X R" X R"-> R. Здесь снова уравнение Эйлера имеет в векторной записи тот же вид (11)
118
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
и при этом выполняются краевые условия (12), имеющие также векторный смысл.
Доказательство этих утверждений мы предоставляем читателю.
2.2.2.	Иллюстрации и обсуждения. Уравнение Эйлера для простейшей задачи является полным аналогом уравнения Ферма = 0, о котором мы говорили во введении. Чтобы показать это, проведем «неэлементарный», функциональный вывод уравнения Эйлера.
Рассмотрим подпространство Lo пространства Ci([/o, Л]), о котором говорилось в предыдущем пункте, и задачу (1) представим, как задачу без ограничений:
f (Х(.)) = / L(t,x, (0 + х (О, X, (0 + х (0) dt -> inf; (13)
где x#(f)—функция, подозреваемая на экстремум в задаче (I), х(-)е Lo-
Совершенно аналогично тому, как это было проделано нами в примере 8 из § 0.2, показывается, что функционал f в (13) дифференцируем по Фреше в пространстве Lo и его производная в нуле имеет вид
<f' (0), Х( •)) = / (q (t) x(t) + p (0 х (0) dt, h
где функции q(t) и p(t) были введены в предыдущем пункте.
Уравнение Ферма f'(0) = 0 равнозначно тому, что г,
j (q (t) х (/) + р (0 х (/)) dt == 0, Vx (•) <= Lo. (14)
Проинтегрировав первое слагаемое в (14) по Дюбуа-Раймону и воспользовавшись тем, что в качестве функции y(t) — x(i), x(-)eL, можно взять любую непрерывную функцию, в среднем равную нулю, мы получим, что линейный функционал в пространстве С (Ro, L]), равный
ft / ft	\
J I J Я (т) dx + р (0 I у (t) dt,
§ 2.2. ЭЛЕМЕНТАРНЫЕ ВЫВОДЫ
119
обращается в нуль на подпространстве тех функций y(t) из С([/0Л1]), Для которых
J y(t)dt = Q.
В силу следствия из леммы об аннуляторе (см. § 0.1) мы сразу получаем:
J q (т) dx + р (/) = Ло, t
а это и есть уравнение Эйлера.
В силу отмеченного обстоятельства простейшая задача вариационного исчисления есть бесконечномерный аналог задач на отыскание безусловного экстремума функций нескольких переменных. Но вместе с тем в задачах вариационного исчисления возникают дополнительные в сравнении с классическим анализом эффекты, связанные со спецификой этих проблем. Переходим к иллюстрациям.
Пример 1. Решение уравнения Эйлера существует, единственно и доставляет абсолютный экстремум в поставленной задаче:
1
J1(X(.))= [ х2(0dt-*inf; х(0) = х(1) = 0.
6
Уравнение Эйлера здесь таково: х = 0. Решение, удовлетворяющее граничным условиям, единственно: х*(/)=0. Ясно, что оно доставляет абсолютный минимум в поставленной задаче.
Пример 2. Решение уравнения Эйлера существует, единственно, дает слабый экстремум, но не дает сильного экстремума:
1
^2(х(-)) = [ х3(/)<//->inf;
6
х(0) = 0, х(1) = 1.
120
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ '
Здесь уравнение Эйлера таково: -~(3x2) = 0. Единственное решение, удовлетворяющее граничным условиям: х*(/)=/. Пусть функция x(t) принадлежит пространству Ci([0, 1]) и х(0) = х(1)=0. Тогда функция %*(/) + х(/) является допустимой. Мы получаем:
1
^2(х.( •) + *(•)) = ^(t + x(t)))3dt== о
1 1
= 5Ш(-)) + з|х(/)Л + J(3x2(/) + x3 (/))<# = о	о
1
= ^2(Х. ( •)) + J (3x2(0 + x3(0)dZ.
6
Таким образом, если	,
3х2(0 + х3(/)>0, в частности, если
||х( • ) ||!<3,
ТО 3^2 (Х. ( • ) + X ( • ))	5^2 (*. ( • )). т- е- функция X, (0 — t
доставляет слабый локальный минимум в поставленной задаче.
С другой стороны, на последовательности функций х„(0 = х.(0 + йп(0,
где ft(0) = /i(l) = 0 и
• f — У~п, 0 t 1/п, hn(t)=	.
I /п (п-i)-1, 1/п<;<1, мы получаем значения
^2(ХП( •)) = -/» +0(1)-*-оо.
Остается заметить, что функции hn(t) сколь угодно близки к нулю в метрике С([0, 1]), если п—► оо. Получилось, что сильного экстремума здесь нет и inf J2 — = —оо. Причина первого явления — невыполнение уело-
§ 2.2. ЭЛЕМЕНТАРНЫЕ ВЫВОДЫ
121
вия Вейерштрасса. Причина второго вскрывается теоремой Боголюбова (см. п. 9.2.4).
Пример 3. Решение уравнения Эйлера существует, единственно, дает абсолютный экстремум, но не является функцией класса Ср
1
«73 (х (•)) = [ ^2/з*2 (0 dt -> inf;
6
х(0) = 0, х(1) = 1.
Этот пример принадлежит Гильберту. Здесь уравнение Эйлера имеет вид
4(2ГМ =0.
Его общее решение: x(t) = С/1/3 + D. Через заданные точки проходит кривая х*(/) = /1/3. Непосредственной проверкой легко убедиться, что функция x*(t) доставляет абсолютный экстремум в поставленной задаче. Но функция x*(t) не является непрерывно дифференцируемой.
Пример 4 (сопряженная точка): т
5<4(х(.))= J (х2(0— х2(0) rf/-*inf; х (0) = х (Г) = 0. о
Покажем сначала, что если Т тс, то нижняя грань функционала «74 равна нулю. Для этого достаточно привести функционал на подпространстве LQ={x(t)^ €еС{([0, Т]), х(0) = х(Г) = 0} к виду:
т
J (* (0 — x(t) • ctg О2 dt, о
из которого следует, что при Т < л функция х#(/)=0 — единственная минималь, а при Т = л все минимали суть x*(t, С) = С sin t.
(Отметим, что из-за того, что x(t)^Ci и х(0) = = х(Т) = 0, функция ctg/-x(O не имеет особенностей на [0, Т], если Т л.)
122
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
Действительно, интегрируя по частям, мы получаем: т	т
| (х — х ctgО2 dt = J (х2 + х2 ctg2/ — 2хх ctg/) dt = о	о
т	т
= j (х2 + (ctg21 — 1 /sin2 /)) dt = J (x2 — x2) dt, о	0
что и требовалось.
Разберем теперь случай, когда Т > л. Легко подсчитать, что если x(t, Х) = Хзт(л//Г), то
3, (х (•, Л)) -	(л2/Г - 1) -+ - ОО
при X—>оо.
При малых же значениях % функционал 3 ± отрицателен, в то время как сама функция х(/, X) сколь угодно близка к нулю в метрике Ci([0,7]), т. е. экстремаль х# (/) = 0 не доставляет даже слабого минимума.
Уравнение Эйлера нашего функционала имеет вид х + х = 0. Нули нетривиальных решений этого уравнения, удовлетворяющих условию х(0) = 0, называются точками, сопряженными с точкой нуль. В нашем случае такие решения имеют вид x(f, С) = С sin t. Важнейшее значение имеет то, принадлежит первая сопряженная точка отрезку [0, Т] или нет. Условие минимума, касающееся сопряженной точки, — условие Якоби — мы обсуждаем в п. 2.2.5.
Подведем итог. Мы обнаружили случаи, когда
— решение уравнения Эйлера существует, единственно, но не дает ни сильного, ни слабого экстремума: Т > л, Т #= kn\
—	решений бесчисленное множество и все они доставляют абсолютный минимум в поставленной задаче: Т = л;
—	решений бесчисленное множество, но ни одно из них не доставляет ни сильного, ни слабого минимума: Т > л, Т = kn, k > 1.
Пример 5. Не существует ни одного решения уравнения Эйлера, более того, нет абсолютно непрерывного
$ 2.2. ЭЛЕМЕНТАРНЫЕ ВЫВОДЫ
123
решения вообще:
1
^5(х(.))= р2х2 (/)<#-> inf; х(0) = 0, х(1) = 1 о
(ср. с примером 3).
Этот пример принадлежит Вейерштрассу. Он выдвигался Вейерштрассом в качестве аргумента против римановского обоснования принципа Дирихле.
Здесь уравнение Эйлера (2/2х) = 0. Его общее решение x(t) = Ct~x + D. Через нужные нам точки че проходит ни одна кривая этого семейства. Более того, решение задачи не существует в классе абсолютно непрерывных функций, ибо на любой такой функции 0, в то время как значение задачи равно нулю. Действительно, если взять минимизирующую последовательность Вейерштрасса
хп (0 = arctg nf/arctg п
или xn(t)— tl/n, или еще проще —
| nt, 0^/s^l/n, = | 1, !/«</< 1,
то обнаружится, что (х„ (•))-> 0 (3^ (уп (•))-> 0).
Примеры 3 и 5 являются частными случаями задачи 55; они обсуждаются в § 9.2. Там же разъясняется причина, по которой в примере Вейерштрасса нет решения.
2.2.3. Необходимое условие Вейерштрасса. Условие Вейерштрасса в отличие от уравнения Эйлера есть условие сильного экстремума. При выводе этого условия будем использовать специальные вариации, которые были введены по сути дела самим Вейерштрассом и потому мы называем их вейерштрассовскими. Производная той добавки, которая входит в определение вейер-штрассовской вариации, напоминает иголку, которая при стремлении параметра X к нулю делается более узкой, но не уменьшается в равномерной метрике. Подобные вариации будут использованы нами и при выводе простейшего варианта принципа максимума в § 2.4.
124
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
Пусть f(x)— некоторая гладкая функция на прямой. Функция двух переменных (х, £): R X R-* R,
^(хд)=/а)-нх)-гт-х)	(15)
называется функцией Вейерштрасса функции f.
Геометрически <^/(х, £) есть разность между значением f в точке g и значением в той же точке аффинной функции, касательной к f в точке х (рис. 3). Отсюда, в частности, следует, что если f выпукла, то ее функция
Вейерштрасса является неотрицательной.
Данное нами определение легко распространяется на конечномерный случай. Пусть X=Rn и f: Rn—>R — гладкая функция. Функцией Вейерштрасса называется функция
&f(x, g): R"XR"->R, определяемая равенством
&) =
(15')
Переходим к выводу необходимого условия Вейерштрасса. Начнем с простейшей задачи (1). Будем предполагать, что выполнено стандартное для вариационного исчисления требование относительно гладкости, а именно, потребуем непрерывную дифференцируемость интегранта в некоторой области U пространства R3, в которой содержатся точки (/, х*(/), х*(/)), /е[/0, М, где	С1([/0Д1]). Функцией Вейерштрасса интег-
ранта L называют следующую функцию четырех переменных:
8 {t, х, х Д) = L (/, х Д) — L (t, х, х) -
— &-х)Ц(1,х,х). (16)
Мы видим, что это — функция Вейерштрасса & L относительно последнего аргумента х, a t и х играют здесь роль параметров. Наша цель теперь — доказать такое утверждение.
§ 2.2. ЭЛЕМЕНТАРНЫЕ ВЫВОДЫ
125
Предложение 3. Пусть в предположениях относительно гладкости L и %*(•), о которых говорилось выше, функция x*(t) является экстремалью в задаче (1). Тогда для того, чтобы функция %*(•) доставляла сильный локальный минимум в задаче (1), необходимо, чтобы для любой точки t(=(to, /О и любого ее-	’I /X
щественного числа g	Ц /
было выполнено нера- >-------LL__________________
г г+Л
О, *Л), W
(17)
Последнее соотношение и называется условием Вейерштрас-са сильного минимума
задачи (1).
т+Л
Отметим, что условие Вейерштрасса все-
Рис. 4.
гда выполнено, если
интегрант L является выпуклой функцией последнего аргумента х. Такие интегранты называют квазирегу-лярными.
Доказательство. Нам надлежит описать класс вейерштрассовских вариаций. Пусть	Выбе-
рем 8 > 0 так, чтобы т + 8 < i[. Пусть X— число, заключенное между 0 и 8. Через h(t, X) обозначим следующую непрерывную функцию:
h (t, Л) =
О, если t ф. [т, т + в], если / = т + Л, линейна на отрезках [т, т + AJ
и [т + Л, т + е]-
На рис. 4 мы изобразили и функцию h, и ее производную. Производная функции h напоминает иголку, что и дало повод (как уже говорилось) вариации такого вида называть «игольчатыми» вариациями. Класс вейерштрассовских вариаций строится теперь так:
x(t, Л) = хД0 + Ш Л).

126
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
Функция х(/Д) соединяет те же точки, что и функция х*(/). (Правда, она не является непрерывно дифференцируемой функцией, но является допустимой в том смысле, что она принадлежит IT», 1 и на ней функционал 3 определен.)
Составим функцию
ф(Х) = 5<(г(., Л)).
Распишем ее подробнее:
Ф (Л) = J L (t, х (t, Л), х (t, Л)) dt =
*	Т+Л
=	+ f L(t, x.(0 + ('-tR. *Jt) + t)dt +
T
T+e
4- j L(t, x,(t) + ^-^(e-K)-'(t-r-X),xt(t)-Т4-Л,
— Xg (e - Л)-1) dt - j L (t, x, (0, xt (0) dt. %
Дифференцируя ф (Л.) по параметру Л и положив Z = 0, мы получаем, что
ф' (+0) = L (т, х, (т), х. (т) + £) — L (т, х, (т), х. (т)) +
+ &/ Lx dt-&~l jLx dt + O^). т x.(t)	*	x*(t)
Теперь воспользуемся тем, что x*(t) есть экстремаль, т. е. тем, что она удовлетворяет уравнению Эйлера. Здесь нам удобнее форма Дюбуа-Раймона:
/ k(т)dx + к t
Используя это соотношение, мы получим:
т+е
J LX к(0 dt = (т + е> Х. (т + е)> (т + е)> — t
х((т), х. (т)),
$ 2.2. ЭЛЕМЕНТАРНЫЕ ВЫВОДЫ
127
следовательно,
<р' (+0) = L (*> х* (*)» А (т) +1) — L (т> (*)> (*)) —
— gix (т, х* (т), х* (т)) + g (Lx (т + 8, х* (т + е), хф (т + е)) —
Т+8
- £&-1 J Ц (/. х, (0, х, (0) dt) + О (8). %
Если x*(t) доставляет сильный минимум в задаче (1), то должно выполняться неравенство <р'(+0)^0. Переходя в последнем соотношении к пределу при е-*0, получаем неравенство
L (т, х, (т), х, (т) +1) — L (т, х, (т), х, (т)) —
— Ш (т, х. (т), х, (т)) > 0,
которое и есть искомое условие Вейерштрасса.
Для простейшей векторной задачи все наши рассуждения обобщаются очень просто. Функция Вейерштрасса для интегранта простейшей векторной задачи есть такая функция Зп + 1 переменных:
<£ (/, х, х, g) = L (/, х, g) — L (/, х, х) — (g — х | Ljt (/, x, x)).
Вейерштрассовские вариации имеют тот же вид:
х(/, Л) = хД/) + А(^ А),
где, однако, функция Л(/Д) зависит не от трех, как это было раньше, а от п + 2 параметров (ибо g = = (g1, ..., здесь вектор). В итоге мы приходим к совершенно аналогично формулируемому условию Вейерштрасса: для сильного экстремума простейшей векторной задачи необходимо, чтобы на экстремали х*(/) выполнялось неравенство
^(0, У>0, VgeR", /е(/0, Л).
Выше отмечалось, что необходимое условие Вейерштрасса всегда выполнено для квазирегулярных функционалов. В п. 9.2.4 будет доказана важная теорема Боголюбова, из которой следует, что для любой простейшей векторной задачи классического вариационного исчисления существует эквивалентная ей задача с квази-регулярным интегрантом. Это позволяет, по крайней
128
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
мере теоретически, считать, что необходимое условие Вейерштрасса всегда выполнено.
2.2.4. Условие Лежандра. Условие Лежандра, а также условие Якоби, о котором речь пойдет в следующем пункте, суть условия «второго порядка», т. е. условия, связанные со вторыми вариациями. Вторая вариация для функционалов классического вариационного исчисления — это квадратичный функционал, а условия Лежандра и Якоби — это условия, при которых этот функционал является неотрицательным. Теории квадратичных функционалов специально посвящены §§ 6.2, 6.3. Развитая там теория позволяет получить условия Лежандра и Якоби для общих задач классического вариационного исчисления. Здесь же ограничимся рассмотрением лишь простейшей задачи.
Итак, рассмотрим задачу (1). Сначала вычислим вторую вариацию функционала <7(х(-)), входящего в определение задачи (1). Здесь надлежит наложить дополнительные требования гладкости на интегрант £(/, х, у). Для того чтобы обеспечить себе полную свободу при проведении дальнейших выкладок в этом, а также и в следующем пункте, будем требовать, чтобы лагранжиан L был трижды непрерывно дифференцируемой функцией своих переменных в некоторой области t/czR3, в которую входят точки (/, x*(/),x*(0), е [/о, tij, где х* (/) — некоторая дважды непрерывно дифференцируемая функция, являющаяся экстремалью, что означает выполнение уравнения Эйлера
-»
При сделанных предположениях возможно двукратное дифференцирование функции
<р(Л) = 5<(х.(.) + М-)) =
= J L (t, xt (t) + kx (t), х, (0 + kx (/)) dt (18) ^0
под знаком интеграла. Произведя это дифференцирование, после элементарных выкладок придем к следующей
§ 2.2. ЭЛЕМЕНТАРНЫЕ ВЫВОДЫ
129
формуле:
Л
Х(х(-))==62^(хЛ-), *()) =	x(t), x(t))dt =
^0
Л
= J (Л (0 х2 (/) + В (0 х2 (/) + 2С (0 х (О X (/)) dt = 6
= ]’(л(0х2(0 + (в(П--^-С(0)х2(0)^,	(19)
где
=	В(0 = ^|хио,
С(0 = ^1хио.
В силу того что х*(0 есть экстремаль нашей задачи, получаем, что первая вариация 6«7(х*(-), %(•)) обращается в нуль на всякой функции х(/), обращающейся в нуль на концах отрезка [t0, t\]. (Совокупность таких функций, так же как и в п. 2.2.1, мы обозначим Lq.) В силу сказанного, функция <p(Z) имеет в нуле производную, равную нулю, если только функция
А из необходимого условия минимума для функции одного переменного ф,,(0)^0 получаем следующее необходимое условие минимума в задаче (1): для того чтобы экстремаль х*(/) доставляла слабый локальный минимум в задаче (1), необходимо, чтобы квадратичный функционал У^(х) был неотрицателен на пространстве Lq.
Предложение 4. Пусть выполнены все предположения относительно гладкости лагранжиана L и функции x*(t), о которых говорилось выше. Пусть, кроме этого, функция x*(t) является экстремалью задачи (1). Тогда для того, чтобы функция x*(t) доставляла слабый локальный минимум в задаче (1), необходимо, чтобы для любого t s [/0, ^i] выполнялось неравенство
A(t) = L^(t, xj/), хД0)>0.	(20)
Это соотношение называется условием Лежандра,
5 А. Д. Иоффе, В. М. Тихомиров
130
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
Доказательство. В силу сказанного выше достаточно показать, что если в некоторой внутренней точке отрезка выполнено неравенство
А (т) < 0, tQ < т < tb
(21)
то квадратичный функционал Jjf(x) не является неотрицательным. (В силу наших допущений относительно L и %*(•) функция A(t)
1	Д	является непрерывной и
I	/\	даже дифференцируемой,
УГ	/ \kit,A,r)	поэтому допущение о
2	/ \	том, что неравенство (21)
I /	\	выполнено во внутрен-
;---------4ней точке, не нарушает
'°	‘ г+~г	общности наших рас-
смотрений.)
Рис- 5-	Пусть через /?*(/) обо-
значена функция, тождественно равная нулю. Рассмотрим следующую вариацию функции /гД/) (рис. 5):
Л /V2 —I /т |/]А при |/ —т|<Х/2, I 0 при \t — т |> Х/2.
Из определения функций h(t, %, т) сразу можно усмотреть, что при X—>0 они сами стремятся к нулю, а произведения Л(/, X, т)/г(/, X, т) при этом равномерно ограничены по модулю некоторой константой, которую мы обозначим буквой С. Следовательно:
б2У (хД • ), h (•, X, т)) max А (/) +
|т I С Л./2
+ ХС max С (t) + max В (/) • о (Л) -> А (т) < 0. р-т|<Х/2	| т | < Л/2
Мы получили, что при некотором Хо функционал (Л(«, Хо, т)) принимает отрицательное значение. Для того чтобы полностью доказать предложение, остается сгладить три угла у функции Л(-,Х0, т) с тем, чтобы получилась функция h\(t) из Ci, на которой функционал X(hi (' •)) = д2^ (хД •), /ti (•)) отрицателен. (Напомним, что речь идет о слабом экстремуме!) Предложейй^ доказано.
§ 2.2. ЭЛЕМЕНТАРНЫЕ ВЫВОДЫ
131
Замечание. Предложение 4 может быть сразу выведено из условия Вейерштрасса. Действительно, если Д(т)<0, то условие Вейерштрасса для функционала в точке т не выполнено (ибо <^(/, х, х, |) равна здесь Д(/)(£— х)2). Значит, существует ломаная х(/), сколь угодно близкая в метрике С к нулю, на которой Д^(х(-))<0. Сгладив ее и умножив на малую константу, мы приходим к доказательству предложения 4.
2.2.5. Условие Якоби. Все три необходимых условия экстремума, о которых речь шла выше, а именно, уравнение Эйлера, условие Вейерштрасса и условие Лежандра, имели локальный характер в том смысле, что требовали для своей проверки вычислений в отдельных точках*). С другой стороны, ясно, что одних локальных условий недостаточно, чтобы получить удовлетворительные необходимые условия в классическом вариационном исчислении. Это видно, скажем, из такого примера. Дуга большого круга является кратчайшей линией на сфере, соединяющей две заданные точки, только при том условии, если внутри нее нет диаметрально противоположных точек сферы. Если же такие точки существуют, то она не будет давать решения о кратчайшей линии, соединяющей заданные точки. Вместе с тем любая малая часть этой дуги является кратчайшей и, следовательно, в любой точке этой дуги выполнены все локальные необходимые условия экстремума. Все дело в том, что более короткий путь, соединяющий концы нашей дуги, получается не локальной, а глобальной вариацией.
Условие Якоби как раз и является основным глобальным необходимым условием локального минимума. Так же, как и условие Лежандра, оно есть условие неотрицательности квадратичного функционала.
Итак, снова рассмотрим простейшую задачу (1) и будем считать, что выполнены все допущения, при которых мы вывели условие Лежандра. Рассмотрим квадратичный функционал, являющийся второй вариацией
*) То понятие локальности, которое обсуждается здесь, имеет иной смысл, чем ранее, когда мы говорили, скажем, о локальном экстремуме. Здесь говорится о локальности и глобальности необходимых условий (локального экстремума!), т. е. об условиях, требующих для своей проверки отдельных точек кривой или кривой В целом.
5*
132
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
функционала У(х(•)):
Х(х(-)) = д25<(%,(•), х(.)) =
f.
= | (л (О у? (О + (в (0 -4 с (0) х2 (о) dt. ta
Уравнение Эйлера функционала X имеет вид
- 4 И (О X) + (в (/) - 4с (о) X = 0.	(22)
Уравнение (22), т. е. уравнение Эйлера второй вариации функционала «7(х(-)), называется уравнением Якоби задачи (1). Уравнение Якоби — линейное дифференциальное уравнение второго порядка. Предположим, что выполнено следующее строгое неравенство:
A(t) = L^(t, хД/), О))>0.
Это неравенство называется усиленным условием Лежандра. Пусть это условие выполнено. Уравнение (22) можно переписать так (предположения относительно L и х* позволяют это сделать):
— А (/) х — А (0 х + (В (0 — С (0) х = 0, или
х— P(t)x — Q(t)x = O.	(23)
Для таких уравнений имеет место теорема существования и единственности для задачи Коши. В частности, решение Ф(/, to) уравнения Якоби с краевыми условиями Ф(/0До)=О, Ф(/оЛо) = 1 существует и единственно.
Нули этого решения, отличные от точки /0, называют точками, сопряженными с точкой to.
Предложение 5. Для того чтобы функция x*(t) доставляла слабый минимум в задаче (1) (при предположениях относительно гладкости L и х*(-), при которых было выведено предложение 4, и при выполнении усиленного условия Лежандра), необходимо, чтобы на интервале (to, t\) не было точек, сопряженных с точкой t0.
Это условие называется необходимым условием Якоби.
§ 2.2. ЭЛЕМЕНТАРНЫЕ ВЫВОДЫ
133
Доказательство. Допустим, что имеет место обратное, т. е. существует точка т (/о<т<6) такая, что
Ф(т, /о) = О.
Заметим, что Ф(т, /о) ¥= 0, ибо иначе в силу единственности решения задачи Коши уравнения (23) с данными Коши х(т) = х(т) = 0 мы получили бы, что ф(/,/о) = О, что проти-воречило бы равен-ству Ф(/,/0)= 1.	уГ	X.
Обозначим через	л л
/?(/) функцию, совпа; *о	т~^т г+е t,
дающую с Ф(^До) на	Рис. 6.
[/о, т] и равную нулю при t т. Это — «ломаная экстремаль», она состоит из двух экстремальных кусков.
Покажем, что JSf (А (•)) = 0. Действительно, интегрируя по частям, мы получим:
Ж (h (•)) = J (А (I) Ф2 (t, t0) + (В (/) - С (/)) Ф2 (/, /0)) dt =
*0
=П-4и(оф(^/о)1+
+	(/)) ф (/, /о)) Ф(Л *о) dt=Q.
Построим теперь вариацию функции h (t) (рис. 6)
h (t, А, т, e) =
h (0>	г — A,
линейна на отрезке [т — X, т-|-е],
(0,	/>т + е.
Вычислим <p(Z) = Ж (h (• , Я,, т, е)). Имеем *): Ф (X) — <р (0) = ф (А) =
т+е	т
= J К(/, h(t, A.), h(t, b))dt— J K(t, h (t), h(t))dt, X—к	т—A,
*) Для сокращения мы вместо /г(^,Х,т, е) пишем h(t, X).
134
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
при этом по теореме о среднем из дифференциального исчисления	.
|й(т — Л, Л)|==|й(т —Л)| = |ЛА(О1)|, т — Л С 0!<т,
1/;(Лх)| =|-/,-^. ех) |=т^-|й(е|)|> т-л</<т + е, | Л т с I Л Е
откуда по теореме о среднем из интегрального исчисления
ф (Л.) = (Л + е) А (02) Л2 (9,)	- Ы (03) h2 (03) + о (Л),
где т — А, 62 т + в, т — Л 03 т.
Отсюда сразу
получаем, что
Ф'(+ 0) = - А (т)/г2(т) < 0.
Значит, существуют такие и 80, что Ж (А (•; Л,о, т, 80))<0. Остается «сгладить» h (/, Ло, т, 80). Предложение 5 доказано.
§ 2.3. Задача Лагранжа. Уравнение Эйлера — Лагранжа
В этом параграфе выводятся уравнения Эйлера — Лагранжа для задач классического вариационного исчисления с ограничениями. В основе вывода лежит правило множителей Лагранжа, доказанное в гл. 1. Отрезок [/0, Л] в этом параграфе предполагается фиксированным.
2.3.1. Задача Лагранжа в разрешенной форме без фазовых ограничений. Рассмотрим следующую экстре* мальную проблему:
3 (х (•), и (•)) = [ f (/, х, и) dt -> inf;
	(1)
Х = ф(/, X, и),	
Ло(х(/о)) = О, Л1(хО = 0.
Мы видим, что здесь дифференциальные ограничения имеют разрешенную .форму и фазовые ограничения отсутствуют. Будем считать, что выполнены стандартные для классического вариационного исчисления требова
§ 2.3. ЗАДАЧА ЛАГРАНЖА
135
ния гладкости, а именно, предположим, что отображения f: RXR"XRr->R, <p: R X R" X Rr-> R"
непрерывно дифференцируемы по совокупности переменных в области U cz R X R" X Rr, содержащей точки (/, х, (/)» иЛ0),	а отображения
ht-.	j = 0, 1,
непрерывно дифференцируемы в областях Vt, i = 0, 1, содержащих точки z = 0, 1. При этом (х. (t), и, (/)) принадлежит пространству С" ([/о, Л])ХСг(^о. Л]).
Обозначим через L = L(t, х, х, и, р, Лэ) функцию £ = A.of(/, х, и)-\-(р\х— q>(t, х, и)), L: R X R" X Rn X Rr X R" X R -* R.
Эту функцию будем называть лагранжианом задачи (1).
Функцию S = 2! (х (•), и (•), р ( •), /0, /i, AJ:
г,
2 = [ L(t, x(t), x(t), u(t), p(t), ka)dt +
+ (/0|Ло(хО) + (/1|А1(х(^1))),
S-. Cf ([fo, /J) X Cr ([fo, M X С? ([fo, M) X RSoXRS1XR->R, назовем функцией Лагранжа задачи (1).
Теорема 1. Для того чтобы пара (**(•), «*(•)) доставляла слабый локальный минимум в задаче (1), необходимо, чтобы нашлись такие не равные одновременно нулю множители Лагранжа XaeR, Ло^О, / = 0, 1 и р( • )е Cf ([/о, ZJ), что
а)	выполнено уравнение Эйлера для лагранжиана L по х:
с краевыми условиями
l(x# — ho (х* (/о)) 1о,
136
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
б)	выполнено уравнение Эйлера для лагранжиана L по и:
LU 1(х#(/), и* (t)) = 0-	(4)
Совокупность уравнений (2) и (4) называется уравнением Эйлера — Лагранжа задачи (1). Приведем развернутое выражение полученных уравнений. Уравнение (2) в развернутом виде имеет форму дифференциального уравнения в векторной форме:
- Р (0 = ф; (*, (О, и* (/)) р (/) - Wx (t, ** (О, и* (/)).	(2')
(На самом деле это система п уравнений.) Его называют сопряженным уравнением. Соотношения (3) суть краевые условия для уравнения (2х):
р (/о) = ho (х. (/о)) /о,	|
= — hi (х, (Л))/ь )
Они называются обычно условиями трансверсальности. Наконец, уравнение (4) имеет вид
ч>; (t, х, (о, и, (0) р ю=(t, х, (о, и, (0).	(4')
В теореме 1 снова находит свое подтверждение принцип Лагранжа. Составив функцию Лагранжа мы пишем затем необходимые условия экстремума для задачи без ограничений:
-> inf.
Если в этой последней задаче зафиксировать «*(/), то получается простейшая векторная задача Больца и соотношения (2), (3) находятся в полном соответствии с предложением 2 предыдущего параграфа, где мы вывели необходимое условие для простейшей задачи Больца. Далее, если в функции Лагранжа зафиксировать то мы получим по и простейшую векторную задачу, где лагранжиан не зависит от й. Уравнение (4) написано в полном соответствии со следствием 1 из предложения 1 предыдущего параграфа.
Доказательство теоремы 1. Задача (1) относится к числу гладких задач, к которым применимо правило множителей Лагранжа (теорема 1 из § 1.1). Покажем это.
В силу того, что в теореме речь идет о слабом экстремуме, мы нашу задачу должны рассматривать в пространстве С\ ([/о, ^i]) X Сг ([/0» Л])‘ Для краткости обозначим это пространство через Z, а пару (х(-),и(-)) бу
5 2.3. ЗАДАЧА ЛАГРАНЖА
137
дем обозначать z. Обозначив через У пространство С" (Ко, Л])> положим:
f0(z) = ^(x(-), «(•)),	f0: Z —> R,
F(z)(t) = x(t)-q(t, x(t),	F: Z^Y,
Hi(z) = ht(x(ti)), Ht-. Z->Hsi, 1 = 0, 1.
Тогда задача (1) примет вид (6)—(8) из § 1.1: f0(z)->inf; F(z) = 0, |
Ht (z) = 0, z = 0, 1. J	'1 ’
Нужно проверить условия следствия 2 из теоремы 1 из § 1.1. Все функции и отображения, входящие в формулировку задачи (Г), являются непрерывно дифференцируемыми в окрестности точки г* = (**(• ),«*(•)). Действительно, функция fo(z) является суперпозицией fo = 3^2 aSf\ отображения
(г) = f (t, х (t), и (0),	3f{-. Z -> С ([/0> К]),
дифференцируемость которого была доказана в примере 6 из § 0.2, и линейного непрерывного функционала:
ti
= J	Sf2-. С (Ко,
fo
дифференцируемость которого была установлена в примере 1 из § 0.2. Приведем формулу для производной функции fo(z):
f'0(z.)z = Sfr(xt(-), «.(•))(х(-), «(•)) =
= J((a(0|x(0) + (b(0l«(0))^, (5) ^0
а (0 = fx У, (0, (/)), b (/) = fu (/, х, (0, и. (0).
Отображение 77(z) есть сумма непрерывного линейного отображения
z-> х
и отображения
— <р(/, х(0, и(/)),
138
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
дифференцируемость которого была доказана в примере 6 из § 0.2. Таким образом, F (z) является дифференцируемым отображением и его производная равна:
А (0 = Фх (/, xt (0, «. (/)), в (о = ф„ (/, %,(/), ил)). J
Наконец, отображения H^z), i = 0, 1, являются дифференцируемыми в силу доказанного в примере 4 из § 0.2, и их производная равна
H'i(z*)z = ViXtti), z = 0, 1,	|
/ = 0, 1. J	U
Осталось доказать регулярность отображения F(z) в z*. По определению понятия регулярности это означает, что для любого #(•)<= О ([/о, Л]) мы должны решить уравнение
х (/) — А (/) х (/) — В (/) u(t) = y (/),
где матрицы Л(/) и В (Г) определяются соотношениями 6). В силу условий, наложенных на отображение ф(/, х, ц), и в силу того, что (х*(/),и+(/))еС1 ХСГ, получаем, что матрицы 4(/) и В(1) непрерывны. Воспользовавшись теоремой 1 из § 0.4 о разрешимости системы линейных уравнений, мы получим регулярность отображения F.
Теперь применим правило множителей Лагранжа. Составим функцию Лагранжа задачи (Г):
& = Wo (2) + </, Р (*)> + (/о I Яо (г)) + (/, | /7, (г)).	(8)
В соответствии с правилом множителей Лагранжа найдутся такие множители Лагранжа z/*, /0> А, Хо, что в точке z* выполнены соотношения
<2\ = 0, ^0,	(9)
равносильные соотношению 2?z = 0.
Но Y = Сп ([/0, /J). Следовательно, в силу теоремы Рисса об общем виде линейного функционала в про
§ 2.3. ЗАДАЧА ЛАГРАНЖА
139
странстве О, существует регулярная борелевская мера и такая, что
Л
GA */(•)) = /(//(01^(0).	(Ю)
tfi
Соотношение (10) можно переписать по-другому: п tx
{у\ ?(•)) = ? f	(109
i=l fo
Здесь Цг(/)—функции ограниченной вариации, непрерывные справа, за исключением, быть может, точки /о- Подставляя (10) в (8), получаем, что
Л	Л
S = J w dt + J (X - ф I rfjx) + (/о I h0(x Ш + (/i IЛ 1(х (/,))).
Сначала исследуем первое из уравнений (9). Имеем: fi
^(г.)х(-)= / (koa(t)\x(t))dt + ffl
t,
+ J (* (t) - A (t) X (0 | du (0) + (/о I rox (Q)+(/i I r,x ao). (11)
Проинтегрируем по частям слагаемые, содержащие под знаком интеграла x(t):
t,
j (/) | х (/)) dt = t c
f./ Л	\	/ fl	X
= | I | Кйа (т) dx | x (t) j dt + I J A.oa (t) dx | x (t0) I,
fo f	'	\fo	/
J (Л (о X (t) | du (t)) = ( f	f
; = j ( J 4*(t)dH(T) |x(0j dt+'( J A'(x) dp(x) |x(/0)
X. V	J \t,	J
140
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
Подставив эти выражения в (11) и воспользовавшись тем, что
f« x(*i) = x(A>) + J x(r) dr, h получим: ty / ь
(z.) X (•) = j I x (t) I J koa (x) dr — /. \ t
X	ti
- J Л* (x) du (T) + П/l | dt + J (x (/) | dp (/)) +
t	J t,
/	ft	fi	\
+ х(/0)|Го/о + П/1 +j koa(r)dr— J Л*(т)с?ц(х) . (12) \	t,	/
Выражение (12) представляет собой непрерывный линейный функционал в пространстве С":
^(z.)x(-)= J(x(O|dv(/)) + (a|x(to)),	(13)
fo где f fi
v (0 = j* (0 + / J Ka (T) dr dt — t. t
t ti
4*(T)dp(-r)^+lW, fo f fl	fl
a = Г5/о + П/i + J Aoa (x) dr - j A* (x) dp (x).
t,	f
(13')
В силу единственности представления линейного функционала в пространстве С" в виде (13) и из уравнения ^х = 0 получаем, что
v(/)s0, а = 0.	(14)
Из (14) и (13') видно, что вектор-функция ц (/) абсо. лютно непрерывна. Положим p(t) = p(t). Тогда из (14)
§2 3. ЗАДАЧА ЛАГРАНЖА
141
и (13) следует, что p(t) удовлетворяет уравнению ti	h
p(t)+ J (т) dx — j 4* (т) p (t) dx + rjZi = 0. (15) t	t
Подставив в (15) t — tQ и воспользовавшись выражением для а в (13х), получим:
р (Zo) = Го/о-
Если положить t = t{i то мы придем к равенству p(^i)= = — TiZi. Наконец, продифференцировав (15), приходим к уравнению:
— /?(/) = 4*р (/) — кда (/).
Соотношения (2х), (3х) доказаны. Подставив теперь вместо rfjui(Z) в формулу для 3?и выражение p(t)dt, получим, что линейный функционал в пространстве Cr([ZoJi]) вида
(г‘) «(•) = /	(0 - В* (0 Р (0 I и (0) dt
^0
равен нулю. По теореме Рисса отсюда следует, что
О)р(0 = W)-
Соотношение (4х), а вместе с ним и теорема 1 доказаны.
2.3.2. Изопериметрическая задача. Изопериметриче-ской задачей в вариационном исчислении называют такую проблему минимизации:
Л
3 (х (•)) = J /о *) dt -> inf; ^0
j fl (t, x, x) dt = a/t j=l, m,
Ao(x(Q) = A1(x(/1))=O,
(16)
fa RXR"XRn-*R, /=0, .... m, ht:	i = 0, 1.
142
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
Если ПОЛОЖИТЬ и1 — xl,	/ = 1, ..., п,
х,+п = ff (/, X, и), j = 1, .. ., tn, то получится такая задача Лагранжа:
З' (х(-), u(-))=J fo((> я1....хП> • • •> и") dt -> inf;
*0
X1 = Ul, 1= I, . . ., П, Xn+i = Xх, Хп, UX, Un), hL(xx(t^, хп(/0)) —О, i= 1, 2, х"+/(/о) = О, xn+l =
Применив теорему 1 к этой задаче, приходим к следующему результату.
Теорема 2. Для того чтобы вектор-функция х*(0 доставляла слабый локальный минимум в задаче (16), необходимо, чтобы нашлись такие множители Лагранжа XjGR,	/iGR\ /==1, 2, не все равные
нулю, что для лагранжиана m
L (t, х, х) = S lift (t, х, х) i=<)
выполнено уравнение Эйлера
(—^Li + Lx)\ = 0;
' ai	7 lx* (О
при этом удовлетворяются следующие краевые условия'.
L* L* (tQ)=
ЬЩ) ~
Можно предложить читателю в виде упражнения получить вид необходимого условия в задаче со старшими производными:
Ц
J f (/, х, х, х, ..., х(п ) dt -> inf; to
сведя ее к задаче Лагранжа. Кроме того, непосредственно из тео
§ 2Л. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА
143
ремы 1 § 1.1 легко вывести необходимое условие для задачи с фазовыми ограничениями, например, для такой:
Л
J f (t, х, х) dt -> inf; Ф(/, х) = 0, х (tQ) = xQ, х(/1) = х1,
f; R X Rn X R" -* R. Ф; R X R" -* Rw, m < n.
Для того чтобы обеспечить регулярность, достаточно потребовать выполнения условия
rank Фх (/, х (/)) = т, t^[t0, /J.
Необходимое условие в этой задаче будет также иметь вид уравнения Эйлера для лагранжиана
L = f(t,x, х) —(р (/) | Ф (t, х)).
§ 2.4. Принцип максимума Понтрягина.
Формулировка и обсуждение
Этот параграф посвящен формулировке и обсуждению основного необходимого условия экстремума в теории оптимального управления — принципа максимума Понтрягина. Мы приводим здесь также элементарное доказательство принципа максимума для специального случая задачи со свободным правым концом. Доказательство принципа максимума в полной общности содержится в § 2.5. Мы ограничиваемся в этой главе задачей оптимального управления без фазовых ограничений, отложив обсуждение задач с фазовыми ограничениями до гл. 5.
2.4.1. Формулировка принципа максимума. Задача оптимального управления без фазовых ограничений, как следует из объяснений, данных в § 2.1, формулируется следующим образом:
3 (х (•), и (•)) = J f (/, х, и) dt -> inf; (1) h
x==(f(t, x, и),	(2)
и е U cz Rf,	(3)
h0 (tQ, х(/о)) = О, AJ/j, х(/])) = 0	(4)
(f: RXR"XRr->R, <p: R X R" X Rr-> R",
hf. RXRre->R4 i = 0, 1).
144
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
Предполагается, что все входящие в условие задачи функции и множества удовлетворяют условиям, указанным в п. 2.1.2. В качестве допустимых управлений, как уже отмечалось, рассматриваются ограниченные измеримые вектор-функции u(t), принимающие значения в U, а в понятие «локальный экстремум» или «оптимальный процесс» вкладывается тот же смысл, что и в п. 2.1.4.
Мы сформулируем принцип максимума в двух эквивалентных формах — «гамильтоновой» и «лагранжевой». Начнем с гамильтоновой формы.
Рассмотрим функцию
//(/, х, и, р, ^o) = (pl<₽(A	и))— W(A и)
(где peRn, Xo^R+), которую мы будем называть функцией Понтрягина. Переменные, обозначаемые буквой р, обычно называются импульсами. Наряду с функцией Понтрягина введем функцию
х, р, Хо) = sup Я (/, х, и, р, Ao), ue U
называемую гамильтонианом.
Теорема 1 (принцип максимума в гамильтоновой форме). Пусть (x*(t), u*(t))—оптимальный управляемый процесс в задаче (1) — (4), определенный на отрезке [/о*, Л*]. Тогда существуют не равные одновременно нулю число Хо 0, векторы lQ^ Rs°, 1Х s RSl и вектор-функция p(t) такие, что
а)	вектор-функция p(t) удовлетворяет сопряженному уравнению
p = — Hx = — (f>*x(t, х, (0, и, (/)) р + \fx (t, Xt (t), и, (/)) (5)
и условиям трансверсальности
Р (М ==: ^Q'C (Ah, (А)*)) А),	1
р(/ь) = ~йи(/ь, хДА*))/г, )	(6)
б)	почти при всех t из [Аг, Л*]
Н Ц, ** (0,	(0, Р М = max H(t, х* (/), и, р (/), Хо) =
и <= U
= ^x^,P®,hY, (7)
§ 2.4. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА
145
в)	гамильтониан x*(t), p(t), Л}) непрерывен на отрезке [/о*, Л*] и на концах его удовлетворяет соотношениям
х* (/о*)» р (Zo*)» Хо) — {h&t (Zos, х* (Zo*)) I Zo), ) Ж (6*, X. (6*), р (tu), М = (hxt (tu, xt (tu)) I /1). i
(8)
Отметим выражение для гамильтониана
получающееся в процессе доказательства, а также единообразную гамильтонову запись х = Нр, р — —Нх уравнений (2) и (5).
Перейдем к описанию лагранжевой формы принципа максимума. Напишем функцию Лагранжа задачи (1) — (4), такую же, как и в § 2.3:
= (/о I Йо (t0, X О) + (/, I ht (/,, х Ш + jLdt,
где
L (Z, х, х, и, р, Ло) = (р | х — ф (Z, х, и)) + W (Z, и)
— лагранжиан задачи (1) — (4).
Теорема V (принцип максимума в лагранжевой форме). Пусть (x*(Z), w*(Z))—оптимальный управляемый процесс в задаче (1) — (4), определенный на отрезке [Zo*, 6J. Тогда существуют не равные одновременно нулю число Хо 0, векторы Zo Rs°, l\ R*1 и непрерывная п-мерная вектор-функция p(t), при которых а) почти всюду на отрезке [Zo*, Л*] лагранжиан L удовлетворяет уравнению Эйлера по х\
= 0 (t) и=и* (Ц
и краевым условиям
L__f — hox (Zoi=, х* (Zo.)) /о»
1—-о*
Их — Н\х (^l*j X* (^н)) /1»
(5')
(6')
146
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
б) почти при всех t из [/о,, 1ь] лагранжиан L достигает минимума по и при u — ut (t):
L(t, х, (I), х-. (О, «. (О, Р(0> Ао) =
= min L(l, х, (I), х, (I), и, p(t), Ао); (7') u^U
в) функция Лагранжа 2? дифференцируема по справа в точке no t\ слева в точке 6» и
«TToL,..= 0' ^L.. = °’	,8'>
где через 0 [соответственно обозначены правая (левая) производные.
Проверка эквивалентности обеих формулировок принципа максимума не представляет труда. Действи-
Поэтому соотношения (5) и (5х), (6) и (6х) и (7) и (7х) попарно эквивалентны. Осталось проверить эквивалентность соотношений (8) и (8х). Отметим, что непрерывность гамильтониана не является независимым условием. Она вытекает из (5) и (7) (это будет видно из доказательства) и, следовательно, из (5х) и (7х). Далее, в силу (7х)
('о, Л, х. (•),...) = (/о I Ао do. х. (/о))) + U. IА! (Л, X. (I, ))) + л
4- / l(Pd)lx.(l))-^(i, х.(1), p(D, A0)]dl.
Поэтому при 8 > О
do. 4-е, Л, ...) — ^(to., ti, ...) =
= (lo I ЙО (to., 4- e, X. (lo. + e)) — ho (lo., X, (lo-))) — i
*o * +8
- J I(P (I) IX. (I)) - (I, X (I), p (I), A9)] dt =
= 8 (lo I hot (t0„ x. (lo.))) +
/	^0*4-8	\	/	?o*+8	\
+ I lol hox.(to„ x»(to.)) J x. (I) dt j — ip(/o»)j [ xjl)d/l4-
4- 8 Ж (lo., x. (lo.), p (to,), Ao) 4-0 (e) =
§2 4. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА
147
(в силу первого равенства в (6))
= е[(/о|/7оИ/о , хД^о ))) + ^(/о>, хД/оО, М] + о(е).
Полученное равенство влечет эквивалентность первых соотношений в (8) и (8'). Аналогично проверяется и эквивалентность вторых соотношений.
Теорема 1' и, следовательно, принцип максимума Понтрягина, является еще одной реализацией сформулированного во введении принципа Лагранжа, согласно которому необходимые условия экстремума в задаче с ограничениями совпадают с необходимыми условиями экстремума функции Лагранжа при ограничениях, не включенных в эту функцию. В самом деле, если множители Лагранжа Хо, /о, A, p(t) фиксированы, то функция Лагранжа 2 зависит от трех групп переменных: фазовых траекторий х(/), управлений u(t) и моментов времени /0, ti. Если теперь отрезок [to, ti] и управление u(t) зафиксировать, то задача о минимуме функции Лагранжа по x(t) имеет вид классической задачи Больца, а утверждение а) теоремы Г означает, что х#(0 удовлетворяет необходимому условию минимума функции Лагранжа по x(t) при фиксированных u(t) = u*(t) U to = to*, ti = /1*.
Точно так же, утверждение б) теоремы Г необходимо и достаточно для того, чтобы функция Лагранжа достигала минимума по всем допустимым управлениям (это единственное ограничение, не включенное в функцию Лагранжа, поскольку оно не носит функционального характера!) при фиксированном отрезке [/0*Д1*] и траектории x*(t) в точке u(t)—u*(i). (Это утверждение следует из интуитивно очевидной формулы
inf f g(t, u(t))dt= f inf g(t, u)dt, a{t)EU f	u(=U
*0	f0
строго доказанной в гл. 9 при значительно более общих предположениях.)
Отметим далее, что вектор-функции %*(/), u*(t) и p(t) можно продолжить левее точки и правее точки так, чтобы функция Лагранжа стала дифференцируемой по to и ti в точках и 6* соответственно. Для
148
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
этого нужно, чтобы х*(/) и p(t) оставались непрерывными, a u*(t) удовлетворяла соотношениям
lim H(tt %♦(/),	p(t), ko)=3@(to*, x*(M, p(tQ*)9 Zo),
t 4 ^o*
lim//(?, xt(t), ut{t), p(t), ho) = a@(ti*, x*(6*),	^o).
В этом случае из приведенной выше выкладки следует, что в силу (8') производные функции Лагранжа по /о и /1 в точках /о* и /1* соответственно равны нулю. Другими словами, утверждение в) теоремы Г означает, что моменты времени ^0* и удовлетворяют необходимым условиям минимума функции Лагранжа по /о a ti-
Выше мы отметили, что единственным ограничением, не включенным в функцию Лагранжа в теореме Г, было условие (3). Однако в конкретных случаях в функцию Лагранжа можно не включать и некоторые другие ограничения, главным образом граничные условия типа закрепленных концов и закрепленного времени. При этом соответствующие условия трансверсальности исчезают и (снова в подтверждение принципа Лагранжа) оставшиеся соотношения совпадают с необходимыми условиями минимума функции Лагранжа при ограничениях, которые в эту функцию не были включены. Действительно, если, например, hQ = х — х0 (закрепленный левый конец), то первое условие в (6) означает, что р(/0)= /0; если йо == t — а (закрепленный левый момент времени), то первое условие в (8) принимает вид 2$ |f==f =—lQ и т. д. Таким образом, множители Лагранжа, соответствующие закрепленным концам, совпадают со значениями p(t), а множители Лагранжа, соответствующие закрепленным моментам времени, — со значениями гамильтониана в соответствующих точках и не несут более никакой информации. Если р(/)==0, то и все эти множители равны нулю. Мы не коснулись условий, гарантирующих неравенство Хо =/= 0. Они очень громоздки и обычно проще непосредственно проверить, что Хо =/= 0.
До сих пор мы говорили о задаче с интегральным функционалом. В задаче с терминальным функционалом
§ 2.4. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА
149
ф(Л,х(Л)) функция Лагранжа имеет вид
£ == (Zol Ло Ро, х (/0))) + (/j I Al tfi, х (/,))) +
+ M>(/b х (ti)) + J (p(t) |x — ф (t, X, u)) dt,
и все соотношения принципа максимума получаются из нее так же, как и в теореме 1'. Соответствующее доказательство ничем, по существу, не отличается от доказательства принципа максимума для задач с интегральными функционалами.
2.4.2. Элементарное доказательство принципа максимума для задачи со свободным правым концом. Рассмотрим задачу оптимального управления со свободным правым концом и закрепленным временем:
(х( •), и (•)) = J f(/, х, и) inf; (9)
^0
х — qp (t, х, и),	(10)
и е U,	(11)
*(А)) = *о-	(12)
Принцип максимума для такой задачи доказывается совсем просто, если предположить, что оптимальное управление кусочно-непрерывно.
Прежде всего выясним, что мы должны доказать. Пусть управляемый процесс (х*(/), оптимален, причем управление u*(t) кусочно-непрерывно. Тогда по теореме 1 должны существовать не равные одновременно нулю число Ао 0 и вектор-функция p(t) такие, что а) вектор-функция p(t) удовлетворяет дифференциальному уравнению (5) и второму краевому условию в (6), принимающему в данном случае вид
р(О = 0;	(13)
б) почти при всех t выполнено соотношение (7). Если бы Хо равнялось нулю, то p(t) была бы решением уравнения
<л'	р = — <pZ<z> X, (t), u,(t))p	(14)
150
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
с условиями (13), т. е. p(t) должна была бы тождественно равняться нулю. Поэтому, случай Хо = 0 исключается, и без ограничения общности можно считать, что Хо = 1. Таким образом, нам нужно проверить, что равенство
(р (О I ф (t, X. (0, и, (/))) — f (t, xt (/), м. (/)) =
= max[(p(0 |ф(/, х.(0. u))—f(t,	u)] (15)
и e U
выполняется почти всюду на [/о, Л], если p(t)—решение сопряженного уравнения
р = —ф’((,	u*(t))p + fx(t, xt(t), (16)
с конечным условием p(ti) = 0.
Мы докажем, что равенство (15) выполняется в каждой точке непрерывности управления п*(/), принадлежа-
щей интервалу (/0, Л)-Доказательство основано на непосредственном применении «игольчатых» вариаций управления u*(t) и, по существу, представляет собой модификацию доказательства условия Вейерштрасса, которое было изложено в § 2.2.
Итак, пусть т — точка непрерывности управления Зафиксируем некоторый элемент v е U и рас-
смотрим управление
( и At), если — X, т), и(Л, т, X) = uJ/) =	*	.	. [
7	Л'7	(и, если /ет- X, т)
(17)
— игольчатую вариацию управления u*(t) (рис. 7). Обозначим через %х(/) = х(/; т, X) решение уравнения (10) с начальными условиями (12), соответствующее управлению ux(t). По условию а(/)=х*(0, если to t т — X. Кроме того, поскольку задача Коши
§ 2.4. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА
для уравнения
Х = ф(/, х, у)
разрешима в окрестности точки (т, х*(г)), вектор-функция xK(t) определена и на отрезке [т — X, т], если X достаточно мало.
Коль скоро управление u*(t) непрерывно в точке т, оно непрерывно и в некоторой ее Х-окрестпости. Поэтому и х*(/) непрерывна в этой окрестности и, следовательно,
х, (т) = х. (т — Z) + Л.х, (т —X) + о (X) =
— хДт — Л) + Лф(т — Л, хДт — X), «Дт — Л)) + о(Х).
Точно так же
хх (т) = х* (т — Л) + Лф (т — Л, х* (т — Л), v) + о (Л).
Отсюда следует, что предел
У (Т) = hm -----------
МО Л существует и равен
г/(т) = ф(т, хДт), v)— ф(т, хДт), «Дт)).	(18)
На отрезке [т, / J и хД •), и хх(-) удовлетворяют уравнению
х = ф(/, х, и ДО).
Из теоремы о непрерывности и дифференцируемости решения дифференциального уравнения по начальным данным следует, что при достаточно малых X > 0 век-тор-функции хД/) определены на [т, 0], сходятся равномерно к хД/) и предел
у (0 = hm ------------
мо	Л
существует при всяком /е[т, /J. Имеем при / > т
t
(0 = хк W + J Ф («, хк (s),	(s))ds,
т
t
щ. х. (О = xt (т) + J ф (s, xt (s), и, (s)) ds,
152
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
так что
xK(t)-x, (0 _
л ~ t
х, (т) — X, (т) Г ф(з, х. (s), и. (s)) — <p(s, х„ (s), и, (s))
= —-------------Ь —------±--------5----------------- as.
Л»	J	А*
%
Переходя к пределу при X | 0, получаем
t
y(t) = y (х) + J Фх (s> х, (s), u, ($)) у (s) ds. т
(Переход к пределу под знаком интеграла возможен, поскольку <р непрерывно дифференцируема по х, а u*(t)—ограниченная вектор-функция.) Таким образом, y(t) есть на [т,решение уравнения
Р = Фх(Л х,(/), u,(t))y
с начальными условиями (18).
Имеем при t т
4 (р (О I у (0) = (р (О I у (0) + (р (01 у (0) =
= - (ф; (t, х. (0, и, (0) р (01 у (0) + (fx (Л х. (0, н* (0) I у (0) +
+ (р (0 1фх {i, х.(0, «.(0) У (0) = (/х (^. X. (/), н,(0) IУ (0).
т. е. поскольку р (/[) = 0,
(Р (0 IУ (0) = — / (fx (s, X, (s), н, (s)) | у (s)) ds. t
В частности, согласно (18)
(р(т)|ф(т, хДт), И.(т))—ф(т, хДт), и)) =
tl
= / (fx(t, x,(t), U,(t))\y(t))dt.	(19)
т
Далее, поскольку (х, (/), и, (0) — оптимальный процесс,
Нт ^^(хД •), иД-))-5<(х.(-), «.(-))]>0,
МО	ЬЦ
§ 2.4 ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА
153
Вычислим этот предел. Он, очевидно, равен
I
limV1 [[/(/, xK(t), —	u*(t))]dt-\-
x-K ti
+ limV' f[f(^ xK(i),	x,(t), u,(t))]dt =
Л 0 J
= f(x, x,(t), v)—f(x, x. (t), m.(t)) + r,
+ J‘(M. *.(0, u,(t))\y{t))dt.
T
Отсюда, используя равенство (19), получаем
(р(т) |ф(т, хДт), мДт)))—/(т, хДт), «Дт))>
Хр(т)|ф(т, хДт), v))—f(x, х*(т), и).
Но т — произвольная точка непрерывности управления п*(/) и v — произвольный элемент множества U. Отсюда следует, что соотношение (15) выполняется во всех точках непрерывности управления u*(t), что и требовалось
2.4.3. Принцип максимума и вариационное исчисление. Принцип максимума Понтрягина содержит необходимые условия (первого порядка) в классическом вариационном исчислении. Мы покажем сейчас, как из принципа максимума можно получить уравнение Эйлера и условия Вейерштрасса, а также канонические уравнения и условия Вейерштрасса — Эрдмана, о которых мы ранее не упоминали. Ограничимся простейшей вариационной задачей. Читатель при желании может проделать соответствующие выкладки для задач более общего вида.
Итак, рассмотрим простейшую задачу
г,
J L (/, х, x)d/->inf; x(/n) = x0, x(/i) = xb
и предположим, что функция x#(Z) (непрерывно дифференцируемая) доставляет сильный минимум в этой задаче. Можно переписать задачу в форме задачи
154
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
оптимального управления следующим образом: it
[ L (/, х, и) ^0
х = и, и е R, х(/0) = х0, х(/1) = х1.
Тогда, если положить u*(t) = х*(/), то управляемый процесс (х*(«), ц*(-)) оптимален в последней задаче. Имеем
Н = ри — XqL (/, х, и).
Сопряженное уравнение имеет вид
р = Я.0М(Л х.(0.
а из принципа максимума следует (поскольку ограничения на и отсутствуют), что
«,. = р-М.Д,......,„„ = 0	(20)
почти везде. Но поскольку управление w*(/) непрерывно, написанное соотношение должно выполняться при всех t. Если бы Хо равнялось нулю, то в силу (20) и p(t) равнялась бы тождественно нулю, что невозможно. Поэтому можно считать, что Ао — 1, и мы приходим к уравнению Эйлера
p(0 = ^M, ut(t)) = Lx(t, х, (/))•
Далее, из принципа максимума следует, что почти при всех t
max(р(0и — L(/, х. (/)> «)) = Р (0 «, (0 — Mt x,(t), и
Это равенство, очевидно, выполняется во всех точках непрерывности функции w*(Z), т- е при всех Принимая во внимание формулу (20), получаем
L(t, x,(t), u) — L(t, x„(t), *.(/)) —
— (и — х (/)) Lx (t, x, (/), x, (/)) > 0
при всех t и и. Мы пришли к условию Вейерштрасса.
Эти рассуждения позволяют, в частности, сделать вывод о том, что обычно используемое в вариационном
§ 2.4. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА
155
исчислении требование непрерывной дифференцируемости экстремальной функции является излишним. Те же соотношения выполняются (но уже не при всех, а только почти при всех /), когда экстремальная функция абсолютно непрерывна, а ее производная ограничена.
В частности, с помощью условия принципа максимума легко получаются необходимые условия Вейерштрасса — Эрдмана для так называемых ломаных экстремалей. Действительно, если сильная минималь x*(f) имеет кусочно-непрерывную производную, то уравнение Эйлера и условие Вейерштрасса должны выполняться в каждой точке ее непрерывности. Пусть при t — х функция %*(/) не дифференцируема (т. е. ее производная терпит разрыв первого рода). Во всех точках непрерывности х*(/) верна формула
х xj/), хД/))-£(/, хДО, О)) =
= W, хДО, Р(0).
Согласно принципу максимума, гамильтониан непрерывен, отсюда следует, что
X* (т — 0) Ах (т, х* (т), х* (г — 0)) — L (т, х* (т), х* (т — 0)) =
* (т + 0) Ах (т, х* (т), х* (т + 0)) — L (т, х# (т), хф (т + 0)).
Точно так же, поскольку функцияр(/)=АД/, х*(/),х*(/)), будучи решением сопряженного уравнения, непрерывна,
*+С0, хДт —0)) = £х(т, хДт), хДт + 0)).
Эти два соотношения называются условиями Вейерштрасса — Эрдмана. Они характеризуют возможные значения разрывов производных у ломаных экстремалей. Для простейшей векторной задачи условия Вейерштрасса — Эрдмана пишутся совершенно аналогично.
В заключение скажем несколько слов о канонических уравнениях. Мы уже отмечали, что в задаче оптимального управления фазовая траектория и решение сопряженного уравнения удовлетворяют системе уравнений ,
156
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
Предположим теперь, что лагранжиан L простейшей задачи вариационного исчисления дважды непрерывно дифференцируем и удовлетворяет усиленному условию Лежандра:	> 0, к е., в частности, — это выпуклая
функция по последнему аргументу. Тогда по теореме о неявной функции в окрестности каждой точки (/, х*(/), х*(/)) уравнение
р = £^(/, х, и)
однозначно разрешимо относительно и, т. е. существует такая непрерывно дифференцируемая функция и(/, х, р), что
p = Lx(t, х, u(t, х, р)),
где и(/, х* (/), р(/)) = х* (/), р(/) = £Д/, х* (/), х*(/)). В точке u = u[t, х, р) производная функции и~>ри— — L(t,x,u)= H(t,x,u,p) равна нулю. Коль скоро эта функция вогнута, она достигает максимума в точке ц(£ х, р), т. е.
И (/, х, и (/, х, р), р) =
= рц(£ х, р)—£ (£ х, ц(£ х, р)) = 5^(/, х, р).
Последнее соотношение определяет так называемое преобразование Лежандра функции £ по последнему аргументу. Обобщение этого преобразования — преобразование Юнга — Фенхеля — мы будем подробно изучать в следующей главе. Имеем	_____
_ дН_ .	i f J 1 du
дх их ’ du dx dx * v x dx
Но на экстремали p = Lx(t, x* (/), x* (/))• Поэтому дЖ (/, x* (/), p (/)) OH (t, x, (Q, x* (/), p (/)) dx	dx
<	dffl dH	zni\	/ \
Аналогично = ^др и из следует, что x*(-) и p(-) являются решениями такой системы уравнений:
Полученная система уравнений первого порядка, оче;ч11 видно, эквивалентная уравнению Эйлера, называется
§ 2.4 ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА
157
канонической формой уравнения Эйлера или просто — канонической системой.
2.4.4. Некоторые иллюстрации. Как и в классическом вариационном исчислении, при решении задач оптимального управления с помощью принципа максимума можно встретиться с самыми различными ситуациями. Для линейных задач с ограниченным множеством управлений типична ситуация, когда существует единственный допустимый управляемый процесс, удовлетворяющий принципу максимума, и этот процесс оптимален.
Пример 1. В задаче
1
| х dt -> inf; х = и, | и |	1, х (0) = 0,
о
принципу максимума удовлетворяет только процесс (%(/) =—/, u(t)=—1), очевидно, являющийся оптимальным. В самом деле, в этой задаче
Н = ри —х, сопряженное уравнение имеет вид р = 1, откуда (так как мы рассматриваем задачу со свободным правым концом и, значит, р(1) =0) p(t) — t — I и максимум функции Н достигается при и = —1.
Вообще же, в задачах оптимального управления можно столкнуться с теми же ситуациями, что и в вариационном исчислении: отсутствие решения, существование множества допустимых процессов, удовлетворяющих . принципу максимума и являющихся или не являющихся оптимальными и т. д. Тот факт, что в задачах оптимального управления часто рассматривают ограниченные множества допустимых управлений, может породить (и порой порождает) иллюзию, будто решения в таких задачах непременно существуют и всегда могут быть найдены с помощью принципа максимума. Это, конечно, неверно. Для иллюстрации рассмотрим пример, который позволит нам заодно, обратить внимание на весьма важное явление — скользящие режимы.
158
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
Пример 2. Скользящий режим. Рассмотрим такую задачу
1
J x2d/->inf; х = и, | и [= 1, х(0) = а, х(1) = 0. о
При |а| > 1, очевидно, не существует ни одного допустимого управляемого процесса. При |а|= 1 такой процесс единствен и соответствует управлению u(t) = — sip’n а. Пусть теперь а = 0. Легко понять, что любому допустимому управ-ляемому процессу соответ-уч	ствует положительное зна-
X.	чение функционала. Вместе
X.	с тем на последовательно-
/Х сти	*з(0> • ••>
Ух хХ	изображенной на рис. 8,
функционал стремится к ну-°	t лю. Заметим, что здесь по-
Рис. 8.	следовательность фазовых
траекторий сходится равномерно, а последовательность управлений, наоборот, ни к чему не сходится. Такие последовательности называются скользящими режимами.
Итак, задача не имеет решения. Предлагаем читателю проверить, что ни один управляемый процесс не удовлетворяет принципу максимума (при а = 0).
§ 2.5. Доказательство принципа максимума
Напомним, что мы рассматриваем следующую задачу:
^(х(-),	«(•))= Jf(Z, х,	u)d/->inf;	(1)
*0
x = q(t, х, и),	(2)
и е U,	(3)
h0(t0, rW) = 0, h^, х(/,)) = 0.	(4)
Мы не можем воспользоваться здесь правилом множителей Лагранжа из-за ограничений, наложенных на управления, и из-за невозможности дифференцирования
$ 2.5. ДОКАЗАТЕЛЬСТВО ПРИНЦИПА МАКСИМУМА
159
по и. Наше доказательство опирается на экстремальный принцип для гладко-выпуклых задач. Связь его с задачей оптимального управления не столь очевидна, как, скажем, связь правила множителей Лагранжа с классической задачей Лагранжа, да и вывод принципа максимума Понтрягина из экстремального принципа для гладко-выпуклых задач требует больших усилий.
Первым шагом в наших построениях будет редукция задачи (1) — (4) к эквивалентной в некотором смысле гладко-выпуклой задаче. Мы сделаем это с помощью предложенного А. Я. Дубовицким и А. А. Милютиным
приема, использующего замену времени.
2.5.1. Редукция задачи. Пусть управляемый процесс (х,(/), «*(/)), определенный на отрезке 6*], оптимален в задаче (1) — (4). Выберем неотрицательную, ограниченную и измеримую на отрезке [0, 1] функцию у*(т), подчиненную условию
1
J v, (т) dr = — tot,	(5)
О
и положим
т
/ = ^(т)=^+ / о.(|)^, О
(6)
А (».) = |те [0, 1]|ц. (т) > 0).
Зафиксируем далее измеримую r-мерную вектор-функцию щ*(т), принимающую значения в U и почти всюду на множестве А (у*) удовлетворяющую равенству
(т) = и, (t, (т)).	(7)
Теперь мы можем сформулировать ту редукционную задачу, о которой говорилось в начале параграфа:
1
J vf(t, у, w, (т)) t/т—> inf;	(8)
о
'	/=Уф(<>	У, оу.(т)),	(9а)
t' = v,	(96)
у>0,	(10)
йо(/(0), у(0)) = 0, А,(/(1),	HD) = 0	(Ч)
(штрихами обозначены производные по т).
160
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
Это тоже задача оптимального управления, и управляющим параметром в ней служит скаляр v. В качестве допустимых управлений в этой задаче мы будем брать всевозможные неотрицательные, ограниченные и измеримые функции п(т), каждая из которых обращается в нуль на одном из множеств
А* = {т е= [0, 1]| 1	(т)\^k]
(fe = 0, 1, ...)
(своем для каждой функции). Множество таких функций обозначим буквой Т.
Положим
У. =
где /*(т) определяется формулой (6).
Лемма	1. Управляе-
мый процесс (/*(т), z/*(r),
п*(т)) допустим в задаче (8) — (11) и доставляет ей локальный минимум.
Для доказательства леммы нужно более подробно рассмотреть преобразования
вида (6). Пусть функция п(т) неотрицательна, ограничена и измерима на отрезке [0, 1] (рис. 9, а). Положим
т
t (т) = t (0) + J v (я) б/т), о
Д(0=[те[О, 1]| v (т) > 0}.
Функция /(т) непрерывна и не убывает. Обратная функция тоже не убывает, но может, вообще говоря, иметь разрывы первого рода в не более чем счетном множестве точек	••• (рис. 9,6). Положим для
определенности
т(/) == min [т е [0, 1]|	= если /#=/(1), т(/(1))=1.
§ 2.5. ДОКАЗАТЕЛЬСТВО ПРИНЦИПА МАКСИМУМА
161
Предложение 1. Справедливы < следующие равенства:
<(*(£)) = £ пРи всех £е R(°). *U)b т (t (т])) = 1] почти при всех г] е А (у).
При этом т(/)еД(у) почти всюду на отрезке [/(0) /(!)]•
Доказательство. Первое равенство следует из определения функции т(0 и непрерывности функции /(т). Далее, т(/(ц))=,п, если ц не принадлежит объединению полуинтервалов (т(Ь — 0), т(£л + 0)]. На каждом из этих полуинтервалов функция /(т) постоянна и равна т. е. пересечение Д(у) Г) (r(gft — 0),	+ 0)]
имеет меру нуль. Отсюда следует второе равенство. Наконец, поскольку функция /(т) монотонна, мера образа каждого измеримого множества Acz(0,l] равна
v (т) dx,
т. е., в частности, образ множества Д(у) имеет полную меру в [/(0), /(1)]. Отсюда следует последнее утверждение.
Предложение 2. Пусть функции z(t) на [/(0), /(1)] и w(x) на [0, 1] измеримы и
z(t (т)) = ау(т)
почти при всех теД(у). Тогда, если t = t(x), то t	т
I z (g) dl = J v (л) W (ti)
t(0)	о
если эти интегралы имеют смысл.
Доказательство следует из очевидной выкладки t (т)	т	т
J z(g)dg= j z (t (я)) d (t (n)) - J v (n) w (n) dn-t (0)	о	0
Предложение 3. Пусть x(t) — определенное на [/(0),f(l)] решение уравнения (2), соответствующее допустимому управлению u(t). Если у(т) = х (/(?)) и
6 А. Д. Иоффе, В. М. Тихомиров
162
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
измеримая на [0, 1] вектор-функция w(r) такова, что u(tM)=wM почти всюду на Д(^), то у(т) есть ре* шение уравнения
/ = у(т)ф(/(т)) у, ^(Т)).	(12)
Наоборот, если w(t) ограничена, измерима на Д (у) и принимает значения из U, и у(т) — решение уравнения (12), то u(t) = w(y(t)) — допустимое управление в задаче (1) — (4), и х(/)=г/(т(/)) есть решение уравнения (2), соответствующее управлению u(t).
Доказательство. Первое утверждение сразу следует из предложения 2, поскольку почти всюду на Д(у)
<р(/(т), х(/(т)), и (I (т))) = ф (/ (т), у(х), ге»(т))	(13)
и, значит,
t (т)
У (т) = X (t (х)) = х (/ (0)) + J ф(/, x(t), u(t))dt =
НО)
%
= y(ty + J у(п)ф(/(п)> у(п), u>(n))^n-о
Для доказательства второго утверждения достаточно заметить, что и здесь равенство (13) справедливо в силу предложения 1, а затем снова применить предложение 2.
Перейдем к доказательству леммы 1. Из первой части предложения 3 сразу следует, что управляемый процесс (t*(x), у*(х), и.(т)) допустим в задаче (8) —(11). Пусть теперь (t(x),y(x),v(x))— другой допустимый управляемый процесс в этой задаче и |/(т) — /*(т)|<в, |у(т) — у*(х) | < е для всех т и некоторого.в. Коль скоро ц(т) обращается в нуль на одном из множеств Д*, вектор-функция а>«(т) ограничена на Д(о) и, значит, «(/)== — w*(x(t)) тоже ограничена в силу предложения 1. Поэтому (согласно предложению 3) (х(/),«(/)), где x(t) = y(x(t)),— допустимый управляемый процесс в задаче (1) — (4). Далее, по условию 11(0)—/о»|<е и |/(1) — /ь | < е. Тогда, если |ф(/,%,(/),	почти
всюду (такое k заведомо существует), то для всякого t,
§ 2.5. ДОКАЗАТЕЛЬСТВО ПРИНЦИПА МАКСИМУМА
163
принадлежащего пересечению отрезков [/(0), /(1)] и [/о., Л*].
I X (Z) — X, (0 I = I х (t (х)) — X, (t (т)) I <
< I X а (т)) - X, (Z. (т)) I + | х, (Z. (т)) - X. (Z (т)) I =
= I У (т) — У. (-г) | +1 X. (Z. (т)) — х. (t (т)) | < е + fee.
Если е достаточно мало, то, поскольку (х* (/), и* (/)) — оптимальный процесс в задаче (1)—(4),
1
J v(x)f у(х), w(x))dx = j f(t,x(t),u(t))dt^ о	t (0)
*1*	1
> f f(A xt (Z), ut (t))dt= J v,(x)f(t,(x), y,(x), w, (x))dx, 0
t. e. (t, (x), y„ (t), v, (?)) действительно есть оптимальный процесс в задаче (8)—(11). Лемма доказана.
2.5.2.	Необходимые условия экстремума в задаче (8)—(11).
Лемма 2. Существуют не равные одновременно нулю число Х0^0, векторы ZoeRs’, Z( е Rs‘, п-мерная вектор-функция q(x) и скалярная функция з(т) такие, что
a)	q (т) удовлетворяет дифференциальному уравнению q'= — v,(x)Hx(tt(x), yt (х), w, (х), q, %0)
и краевым условиям
q(Q) = h'Qx(t.(ty, Z/.(O))Zo, q(l) = -hlx(t,(^,
6)	s(t) удовлетворяет дифференциальному уравнению
s' = — v,(x)Ht(t,(x), у,(х), w,(x), q(x), Ло)
и краевым условиям
s(O)-(feO(a.(O), Z/.(O))|Zo), s(l) = -(feh(Z,(l), «/.(!))[/);
в)	почти при всех т е [0, 1]
У. W. ау.(т)> ?(т)> ^э) +
|=0, если т е А (ц*), + S(T)| если
6*
164
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
Нетрудно видеть, что лемма 2 есть не что иное, как принцип максимума Понтрягина для задачи (8) — (11).
Доказательство. Мы покажем сначала, что задача (8) — (11) — это гладко-выпуклая задача, удовлетворяющая всем условиям теоремы 3 из § 1.1 (точнее, следствия из этой теоремы), а затем применим это следствие.
Свяжем с уравнением (9а) отображение Фр 1ГЬ1Х X НИ*, 1X W* —►	ставящее в соответствие каждым
М-)е=Ги1([0, Ц),	II) и 0(.)еГ
(напомним, что Т — множество допустимых управлений в задаче (8) — (11)) вектор-функцию
z(t) = /(t) —о(т)ф(Цт), </(т), ау,(т)).	(14)
Поскольку и(т) обращается в нуль на некотором множестве вектор-функция т-*г>(т)ф(£(т), z/(r), а>*(т)) ограничена и, значит, z(-)si". Таким же образом уравнение (96) порождает отображение Ф2: W7), 1XF-* -*Li, действующее по формуле
£(т) = Ф2(|(-), о(.))(т) = Г(т)-о(т).	(15)
Рассмотрим, наконец, отображение Ф:	i X Wi, i X
Li, являющееся «декартовым произведением» отображений Ф2 и Фь т. е. Ф(|(-), «/(•), ц(•)) = .= (£(•), z(-)), где £(т) определяется формулой (15), а z(t) — формулой (14). С помощью отображения Ф уравнения (9а) и (96) записываются в виде
Ф(/(«). У(-), о(-)) = 0.
Проверим, что при всяком п(-)е^ отображение Ф непрерывно дифференцируемо по Фреше на НТ), i X W7" i и регулярно в точке (/*(•),*/*(•))• Действительно, непрерывная дифференцируемость отображений Ф( и Ф2 следует из результатов, доказанных в § 0.2 (см. пример 11). При этом производная отображения Ф! в точке
>У*(')) есть линейный оператор
Ш У(т))->/(т) — »(т)фД/.(т), z/Дт), (т)) | (т) — — v (т) фх (/. (т), «/. (т), w, (т)) у (т), (16)
§ 2.5. ДОКАЗАТЕЛЬСТВО ПРИНЦИПА МАКСИМУМА
165
а производная отображения Ф2 — линейный оператор
§(т)->Г(т).	(17)
Если теперь £ (т) az (т) — произвольные элементы пространств L\ и Li соответственно, то, как следует из теоремы 1 из § 0.4, всегда найдутся	, и
^(•)eU7"i, связанные с £(•) и г(-) соотношениями (16) и (17). Поэтому отображение (£(•), #(•))-* ->Ф(В( •). !/(•)> *>(•)) регулярно в точке (/, (•), у* (•)) при всяком u(-)eF.
Заметим, далее, что функционал (8) тоже непрерывно дифференцируем по Фреше на IF], i X Wf, i при всяком фиксированном o(-)sF и его производная в точке (• )> У, (•)) есть линейный функционал
1
(£ (т), у (т)) -> J V (т) [ft (t, (т), у, (т), W, (т)) I (т) 4-о
+ (М^(*)» У„ (т), w, (x))[y(x))]dx.
Наконец, если и, () е Т, о2(-)еГ’, то, очевидно, при всяком фиксированном O^a^l функция оа(т) = = ао, (т) + (1 —а) о2(т) тоже принадлежит множеству F, и поскольку отображение Ф и функционал (8) линейны по v( •), то
I
J VaWMlW, у(х), йУ.(т))«/т =
О
1
= a J о, (т) f (£ (т), у (т), w, (т)) dx + о 1
+ (1 — a) J v2 (т) f (g (т), у (т), w, (т)) dx-, о*
ф(и-), у(-), »«(•)) =
= аФЙ( ), у(), ^(-)) + (1-а)Ф(и-), У(-), п2(-)),
Таким образом, задача (8) — (11) удовлетворяет всем условиям следствия из экстремального принципа для гладко-выпуклых задач (теорема 3 § 1.1). Отметим, что в условии (11) участвуют отображения в конечномерное
166	ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
пространство. Для того чтобы окончательно удостовериться в возможности воспользоваться этим следствием, нам осталось заметить, что (/*(т), z/Дт), и*(т)) — точка локального минимума в задаче (8) — (11), даже если Цт) и у(т) рассматривать в топологиях пространств 1Г1,| и IT?, 1 соответственно (это следует из леммы 1 и того факта, что топология пространств VTi.i и IFl 1 сильнее топологии пространств С и Сп). Таким образом, упомянутое следствие действительно применимо.
Напишем функцию Лагранжа задачи (8) —(11):
<? = (/о|йо(/(О), у (0))) + (/< |М/(1), х/(1))) + 1
+ J [(<7 (т) I У' (т) — v (т) <р (/ (т), у (т), wt (т))) + 6
+ s (т) (/' (т) — v (т)) + Xov (т) f (t (т), у (т), w„ (т))] dx =
= (/о|Ло(НО), У (0))) 4- (/<1/2, (7(1), 2/(1))) + 1
+ J [(<7 W Iу' W) — V (т) Н (t (т), у (т), w. (т), q (т), Ло) + о
+ s (т) (/' (т) — V (т))] dx,
где /0 *= Rs’» Л е Rs‘> Я (•) е L~, s(-)^Lx. (Отображение Ф действует в Л"+1, а пространство, сопряженное с L\+l, есть L«+1. Поэтому </(-)eLS>, s(-) е Lx.) При некотором выборе множителей Ко, l0, Ц, q(x), s(x) функция Лагранжа должна удовлетворять условиям, перечисленным в формулировке теоремы 3 из § 1.1. Выпишем эти условия, учитывая найденные ранее выражения для производных отображения Ф и функционала (8) в точке (/,(•), У, (• ))• Обозначим для краткости /г0 = = Ао(/о., у.(0)),	= МП), Я(т) = Я(7.(т), уДх),
wt(x), Хо) и т. д., Имеем
^инУ (•) = (АУо\У (0)) + (h\xh \у (1)) +
1
+ J К<7 W I У' (т)) — v, (т) Нх (т) у (т)] dx = 0 (18) о
§ 2,5. ДОКАЗАТЕЛЬСТВО ПРИНЦИПА МАКСИМУМА
167
для всех у (•) Wi, 1;
• ) = (41ЛоЛ(О) + (/i |А.Л(1) +
+ J [S Ь) Г (т) - V, (т) Ht (х) g (т)] dx = 0	(19)
О
для всех £( •)	W{>! и
I
J (v (т) — (т)) (Н + s) dx < 0	(20)
о
для всех v ( •) е К.
Интегрируя по частям второе подынтегральное ела-гаемое в (18) и полагая у(1) = у(0)+ j у' (x)dx> полу-о чаем
1 \
Шо + h\xh - Ju, (т) Нх dx I у (0) + о	/
1 /	I	\
+ J и(т) 4- h\xh — J v, (Т]) Нх dx\\у' (г) j dx = 0 0 \	т	/
для всех у( •) е W*, ь Это означает, что
1
hoxlo + h’xh — Ju, (т) Нх dx = 0, о
1
q (т) + h*xl\ — J и, (n) Нх dr) = 0 почти везде, т
Изменяя, если нужно, q(x) на множестве меры нуль, получаем отсюда, что q(x) абсолютно непрерывна и удовлетворяет всем условиям, сформулированным в утверждении а) доказываемой леммы.
Таким же образом из (19) следует утверждение б). Осталось проверить, что утверждение в) вытекает из (20). Действительно, если, например, Н + во всех
168
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
точках имеющего положительную меру подмножества множества Д(^*), то полагая в этих точках у(т) = = 2уДт), а в остальных у(т)=у*(т), получаем
/ (и (т) — V. (т)) (И 4- s) dx > О О
в противоречии с (20). Столь же просто доказывается и второе соотношение в условии в). Лемма доказана.
2.5.3. Завершение доказательства принципа макси* мума. Положим
т* (/) = min {т е [0, 1] К(т) = /},
Р (t) = Я (*. (0). г (t) = $ (т. (/)).
Согласно предложению 1
Р (t. (т)) = Я (т), г (tt (т)) = s (т)
почти при всех те A (t\).
Применяя предложение 3 к q(x) и p(t), получаем в силу утверждения а) леммы 2, что p(t) удовлетворяет дифференциальному уравнению
p = — Hx(t, МО, «.(0, Р, М
и граничным условиям
р (Ah) == Аох (A)к* (А)<))/о>
р (^1*) — h\x (^i*, х* (^i+))
Этим доказывается первое утверждение в формулировке принципа максимума.
Точно так же r(t) удовлетворяет дифференциальному уравнению
r =	хД/), МО, р(0, ло) (21)
н граничным условиям
г (0) = (Ао/ (Аъ, х* (/оЗ) | /о),	1
г(1) = -(М0*, хДМ JZJ. /	(22)
До сих пор нас не интересовал конкретный вид функций у*(т) и и>*(т), лишь бы выполнялись равенства (6)
§ 2.5. ДОКАЗАТЕЛЬСТВО ПРИНЦИПА МАКСИМУМА
169
и (7), оставляющие, разумеется, большую свободу выбора этих функций. Предположим теперь, что у*(т) обращается в нуль на системе (замкнутых справа) полуинтервалов Ih = (ть Xk + p/tL k=l, 2,..., устроенной таким образом, что образ их объединения при отображении т > ^*(т) плотен в [/0«,
Вот один из способов построения такой функции. Пусть {gi, g2, •••} — счетное плотное подмножество отрезка [/о*, Выберем числа Pi > 0, р2 > 0, ... так, чтобы 2 Ра = 1/2. Положим
2 (г1* го*) ~
причем суммирование справа ведется лишь по тем индексам i, при которых < g*. Тогда полуинтервалы Ik = (т£, xk + Pfc] попарно не пересекаются. Пусть теперь
V, (т) =
0	, если т е
k
2(6* — 60, если k
Проверим, что образ объединения 0Л при отображении т->/Дт) плотен в [6*, 6*] (равенство 6(1) = 6* здесь очевидно). Для этого достаточно убедиться, что t* (?) = %k для всякого т е Ik. Заметим, что rz < xk тогда и только тогда, когда	и 6 (т) = 6 (т*) для всех
х е Ik. Имеем при теб
К (т) = 6* + J Ц* (n) dx\ = о
= 6*+ 2 (6*—6ъ)2 Pi) =
k Ti<Tfe /
= 6*+ 2 (6*—6 J (xk— 2 Pi) = k	I
= 6* -h (^i* —^o*) "3
что и требовалось.
Предположим теперь, что каждый полуинтервал Л есть объединение счетного множества замкнутых справа
170
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
непустых полуинтервалов ha, .{^ь ^2, .. } — счетное плотное подмножество множества U и вектор-функция w*(r) выбрана так, что
^*(T) = ^o если
В силу неравенства в утверждении в) леммы 2
H(t. (t), г/.(т), W, (т), <7(т), Хо) + «(т)<о
почти всюду на объединении U Ik- Всякий полуинтервал Iki имеет положительную меру (ведь он не пуст по условию). Поэтому для каждых k и i найдется такое т е 1м, что
Н (t. (*)> У, СО, (О, q (О, Ао) + $(?)==
= Н (U, х, (|Д uit р &), М + г (Ь) < 0.
Так как точки £2, ••• образуют плотное подмножество отрезка [/0*, Л*], векторы мь и2, ... — плотное подмножество множества U и функция
—»//(/, х(/), ц, р(/), Хо) непрерывна, отсюда следует, что
H(t, х,(0, и, p(t), Ла) +г(0<0	(23)
для всех / е [/о*, Л*], U.
С другой стороны, равенство в утверждении в) леммы 2 в силу предложения 1 влечет почти при всех t равенство
Н (t, х. (0, и, (/), р (0, Хо) + г (0 = 0.	(24)
Поэтому почти при всех t
H(t,	p(t), Xo) =
= max H(t, u, p(t), K0) = 3@(t, xt(t), p(t), Лэ). (25) ue U
Этим доказывается второе утверждение в формулировке принципа максимума.
Поскольку управление «*(/) ограничено и функция Н(I, х,(<), и, р(0> Хо) непрерывна, из (24) следует, что
5^ (t, х, (I), р (/), Ло) + г (/) = 0.	(26)
§ 2.5. ДОКАЗАТЕЛЬСТВО ПРИНЦИПА МАКСИМУМА
171
Но r(t) — непрерывная функция. Поэтому непрерывна и функция	р(/), Хо). Сравнивая (26) с (22),
получаем
<Wo>, **(М, р(М, А,о) = —(йо/(/Ом х»(/о*)) |/о), (Лх> х* (//*), р (^i*), Л0) = (йц(6», х* (/{*)) |Zj).
Наконец, из (21) и (24) следует (8а) из § 2.4. Принцип максимума Понтрягина полностью доказан.
Комментарий к гл. 2. К § 2.2. Вариационное исчисление изложено во многих монографиях и учебниках: Адамар [1], Ахиезер [1], Больца [1], Гельфанд и Фомин [1], Каратеодори [2], Курант и Гильберт [1], Лаврентьев и Люстерник [1], [2] и др.
К § 2.3. Подробный обзор работ о задачах вариационного исчисления с ограничениями содержится в книге Блисса [1]. О многомерных задачах см. монографии Морри [1] и Клотцлера [1].
К §§ 2.4—2.5. Принцип максимума Понтрягина был выдвинут в 1956 году, и это заложило основы теории оптимального управления. Из работ раннего периода упомянем статьи Гамкрелидзе [1], [2] и обзорную статью Понтрягина [1]. Итоги этих исследований были подведены в монографии Понтрягина, Болтянского, Гамкрелидзе и Мищенко [1].
Первое доказательство (Болтянский [1]) принципа максимума было усовершенствовано Розоноэром [1] и Егоровым [2]. Дубовицкий и Милютин [2] и Xалкин [4] предложили доказательства, основанные на новых идеях. В книге мы трижды возвращаемся к доказательству принципа максимума. В § 2.4 мы следуем Понтрягину [1], в § 2.5 — Дубовицкому и Милютину [2]. Третье доказательство (в гл. 5) связано с идеями Халкина.
Укажем еще руководства и монографии по оптимальному управлению: Беллман, Гликсберг, Гросс [1], Болтянский [4], Брайсон и Хо Ю-ши [1], Красовский [3], Кротов и Гурман [1], Ли и Маркус [1], Хестепс [3], Янг [2] и др.
Глава 3
ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
В этой главе изучаются свойства выпуклых множеств и функций, характеризующие их устройство «в целом». Основные результаты связаны с возможностью двойственного описания выпуклых множеств и функций, следующей из теорем отделимости (§ 3.1). В дальнейшем наиболее важны теорема о непрерывности выпуклых функций (§ 3.2), теорема Фенхеля —Моро (§ 3.3), теоремы двойственности (§ 3.4) и теорема Каратеодори (§ 3.5). Остальные результаты при первом чтении можно опустить. На протяжении всей главы, за исключением специально оговариваемых случаев, предполагается, что X, У, ... — отделимые локально выпуклые пространства. Материал этой и следующей глав опирается только на § 0.1 и § 0.3.
§ 3.1.	Выпуклые множества и теоремы отделимости
3.1.1.	Определения и элементарные свойства. В § 0.3 мы уже ввели определения выпуклого множества и конуса. Непосредственно из первого определения следует, что
а)	сумма (алгебраическая) конечного числа выпуклых множеств — выпуклое множество;
б)	пересечение любого семейства выпуклых множеств — выпуклое множество;
в)	декартово произведение выпуклых множеств — выпуклое множество, т. е. если X = X • • • X Хп, А- — выпуклые подмножества пространств Х^ соответственно, то А = А}\...% Ап —выпуклое подмножество пространства X;
г)	образ и прообраз выпуклого множества при линейном отображении — выпуклые множества, т. е. если A: X —> Y — линейный оператор, А — выпуклое подмножество пространства X и В — выпуклое подмножество пространства У, то множества А(А) и А~1(В) выпуклы.
В дальнейшем нам удобнее использовать для обозначения образа и прообраза множеств при линейном отображении специальные символы. Именно, образ мно-
§ 3.1. ВЫПУКЛЫЕ МНОЖЕСТВА
173
жества А будем обозначать через АД (а не А (А)), а прообраз множества В —через В А (а не А*1 (В)).
Пусть A cz X. Пересечение всех выпуклых множеств, содержащих множество А, есть выпуклое подмножество пространства X, называемое выпуклой оболочкой множества А и обозначаемое через convA. Пересечение всех замкнутых выпуклых множеств, содержащих множество А, есть замкнутое выпуклое подмножество пространства X, называемое выпуклым замыканием множества А и обозначаемое через convA. Пересечение всех выпуклых конусов, содержащих множество А и начало координат, есть выпуклый конус, называемый (выпуклым) конусом, порожденным множеством А, и обозна-» чаемый Ка- Пересечение всех линейных подпространств, содержащих множество А, называется линейной оболочкой множества А и обозначается ПпА. Очевидно, что Гт А = Ка — Ка-
Если {хь ..., хп} — конечный набор точек из X, то всякая точка х е X, представимая в виде
п
X = 2 <4*1, i—1
где az^0, /= 1, ..., п, 2a/= L называется выпуклой комбинацией точек xh ..., хп- Если А — выпуклое множество, то из определения сразу следует, что всякая выпуклая комбинация любого конечного набора его точек принадлежит множеству А.
Предложение 1. Выпуклая оболочка множества А совпадает с совокупностью всех выпуклых комбинаций точек из А.
Доказательство. Непосредственно проверяется, что совокупность всех выпуклых комбинаций точек множества А есть выпуклое множество. С другой стороны, всякое выпуклое множество, содержащее А, содержит выпуклые комбинации своих точек, в частности, точек множества А.
Предложение 2. Замыкание выпуклой оболочки множества А совпадает с его выпуклым замыканием: convA = convA.
Доказательство. Согласно предыдущему предложению, всякое замкнутое выпуклое множество,
174
ГЛ. 3. ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
содержащее А, содержит и сопуД и, значит, сопуД. Все следует теперь из определений и предложения 4, приводимого ниже.
Предложение 3. Конус, порожденный множеством А, совпадает с конусом, порожденным множеством сопуД. Если же А — выпуклое множество, то
Ка — (J А,Д = {хе X\x = Kz9 2ЕД}.
Доказательство очевидно.
Предложение 4. Пусть A czX — выпуклое множество. Тогда его внутренность inM и замыкание А выпуклы. Если XieinM и х2еД то все точки отрезка [хь х2], за исключением, быть может, точки х2, принадлежат множеству int А. В частности, если ш1Д=#0, то А = int А и int Д = int А.
Доказательство. Пусть Xi е int А и х2е.4. Пусть U — окрестность точки хь содержащаяся в Д, и x = aXi+(l—а)х2, 0 < а < 1. Тогда а(/ + (1—а)х2 есть окрестность точки х, лежащая в А. Поэтому xeinM. Отсюда также следует, что внутренность вьь пуклого множества выпукла.
Рассмотрим далее точки Xi и х2 из Д. Пусть
х = ах1 + (1 —а)х2, 0 < а < 1.
Возьмем выпуклую окрестность нуля U. Йзхг-еД следует, что (Х; + £7) А А =/= 0, i = 1, 2. Выберем х' е(х£ + £7) П А и пусть х' = аХ| + (1—а)х'. Тогда xz + + (1—а) (х2 + U) — х + U. Мы получили, что каждая окрестность точки х пересекается с А, т. е. хе! Таким образом, замыкание выпуклого множества выпукло. Предложение доказано.
3.1.2.	Отделимость. В § 0.1 мы сформулировали теорему отделимости, утверждающую, что два непересе-кающихся выпуклых множества, одно из которых имеет непустую внутренность, можно разделить ненулевым линейным непрерывным функционалом. С помощью предложения 4 можно получить некоторое усиление этой теоремы.
Теорема 1 (первая теорема отделимости). Пусть А и В — выпуклые подмножества пространства X, и
§ 3.1. ВЫПУКЛЫЕ МНОЖЕСТВА
175
внутренность одного из них, например А, не пуста. Тогда А и В можно разделить ненулевым линейным непрерывным функционалом в том и только том случае, когда (int А) П В = 0.
Доказательство. Пусть (int/4)AB = 0. Тогда по теореме отделимости существует ненулевой функционал	разделяющий множества int Л и В, т. е.
такой, что (х*, х)^(х*,у} для всех хе int Л, у^В. В силу предложения 4 ЛстМ. Поскольку функционал х* непрерывен, получаем, что
(х*, х)<<х*, у}	(1)
для всех х е А, у е В, т. е. функционал х* разделяет множества А и В.
Предположим теперь, что функционал х* е X разделяет множества Л и В, т. е. справедливо соотношение (1). Если бы нашлись точки хе int Л и у^В такие, что (х*, х) = (х*, у), то, поскольку х* =# 0, в любой окрестности точки х и, следовательно, в Л можно было бы указать точку Xi таким образом, что (х*, Xi)>(x*, у} в противоречии с предположением. Поэтому
<х’,х)<(х*, у)
для всех хе int Л, у^В. А это означает, что множества int Л и В не могут пересекаться. Теорема доказана. Скажем, что линейный функционал х* е X сильно разделяет множества Л и В, если
<х‘, х) < (х‘, у} — 8
для всех х е Л, у В и некоторого е > О, или, что то же, если
sup (х*. х) «С inf <х‘, у) — е
хе А	у^В
при некотором е > 0.
Теорема 2 (вторая теорема отделимости). Пусть А—замкнутое выпуклое подмножество пространства X и хф А. Тогда существует функционал х*^Х*, сильно разделяющий А и х.
Доказательство. Множество XXЛ открыто и содержит х. Поэтому найдется такая выпуклая окрестность нуля U, что х -|- U cz X \ Л, т. е. (х + U) Г] Л = 0.
176
ГЛ. 3. ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
По теореме отделимости множества х + U и А можно разделить ненулевым линейным функционалом т. е.
у) < {х\ х) + « Z)
для всех //G Л, ZEzU. Поскольку х* У= О,
— е = inf (х*, z} < 0.
zg= и
Поэтому
<Х*, у) < <**, х> — 8
для всех у А, что и требовалось.
Отметим, что все результаты п. 3.1.1 и теорема 1 справедливы для произвольных линейных топологических пространств. Наоборот, теорема 2 верна только в локально выпуклых пространствах. Разъясним геометрическую природу отделимости.
Пусть х*еР, х* #= 0, ае R. Введем следующие обозначения:
Н (х*, а) = {х е X | <х*, х) = а}, Н+ (х\ а) = {х g= X | (х\ х) < а}, Н~ (х*, а) = {х g= X | (х*, х) > а}.
Множество /7(х*, а) есть замкнутое линейное многообразие коразмерности единица. С другой стороны, следствие 2 из теоремы Хана — Банаха показывает, что всякая замкнутая гиперплоскость в X есть множество уровня некоторого ненулевого функционала. Поэтому замкнутые гиперплоскости в X суть в точности множества вида /7(х*, а), где х* У= 0. При этом элементы х* и а, задающие гиперплоскость, определены с точностью до множителя, отличного от нуля.
Д1ножества Я+(х*, а) и Я~(х*,а) называются полупространствами, Полупространства Я+(х*, а) и Н~(х*,а) называются (противоположными) полупространствами, порожденными гиперплоскостью Н — = Н(х\ а).
Пусть теперь функционал х* X, х* У= 0 разделяет множества А и В, Это значит, что существует такое число а, что
sup <х*, х)^а< inf (х*, у),
хе А	у^В
§ 3.1. ВЫПУКЛЫЕ МНОЖЕСТВА
177
Тф е. множества А и В принадлежат различным полупространствам, порожденным гиперплоскостью Я(х*, а)==Я (рис. 10). В этом случае говорят, что гиперплоскость Н разделяет множества А и В.
Из теоремы 2 следует ряд важных свойств отделимых локально выпуклых пространств.
Следствие 1. В отделимом локально выпуклом пространстве выпуклое замыкание всякого множества совпадает с пересечением всех полупространств, содержащих это множество.	/	\
Доказательство. Пусть / д / ц .S A cz X. Поскольку всякое полу- /	/
пространство выпукло и замкну-	./S
то, оно содержит множество А тогда и только тогда, когда оно	}
содержит сопуД. С другой сто-	\	$ J
роны, если хф сопуД, то в силу теоремы 2 существует полупро-странство, содержащее сопуД и не содержащее точки х.
Доказанное следствие есть, по существу, первая теорема двойственности; Из него следует, что всякое замкнутое выпуклое множество можно описать двояким образом: внутренним, как совокупность принадлежащих ему точек, и внешним, как пересечение всех содержащих его полупространств.
Следствие 2. Замыкание выпуклого множества в отделимом локально выпуклом пространстве замкнуто в слабой топологии этого пространства.
Доказательство. Множества линейных функционалов, непрерывных в исходной и слабой топологии, совпадают по определению слабой топологии. Поэтому все полупространства слабо замкнуты и остается применить следствие 1.
Следствие 3 (теорема Мазура). Пусть X — банахово пространство и точка х принадлежит слабому замыканию множества A cz X. Тогда существует последовательность выпуклых комбинаций элементов множества Д, сходящаяся к х по норме.
178
ГЛ. 3. ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
Доказательство. Пусть convА — выпуклое замыкание множества А в метрической топологии пространства X, Тогда согласно предыдущему следствию множество conv Л слабо замкнуто. Поэтому xeconvA = = conv А (предложение 2) и, следовательно, существует последовательность элементов множества conv А, сходящаяся к х по норме. Следствие доказано.
§ 3.2.	Выпуклые функции
3.2.1.	Определения и элементарные свойства. В § 0.3 мы определили эффективное множество и надграфик функции /, а также понятия выпуклая функция, собственная функция, несобственная функция. 1Аъ\ будем иметь дело главным образом с собственными выпуклыми функциями.
Однако несобственные функции часто возникают в результате различных операций с собственными, и их нельзя исключать из рассмотрения.
Если f — собственная функция (или хотя бы всюду большая —оо), то для выпуклости функции f необходимо и достаточно, чтобы неравенство
f (ах, + (1 —а) х2) < af (xt) + (1 — а) f (х2)	(О
выполнялось для всех Xi е X, х2еХ, OsSja^l. Проверка этого утверждения не представляет труда. Написанное неравенство называется неравенством Йенсена. Отметим, что, если f — выпуклая (не обязательно — собственная) функция, то неравенство (1) выполнено для любой пары хь х2, если только f(xt) и f(x2) не являются бесконечностями разных знаков. Эффективное множество и все лебеговские множества выпуклой функции выпуклы. Обратное заключение неверно. Например, функция |хр на R имеет выпуклые лебеговские множества, но не является выпуклой.
Функция f называется замкнутой, если ее надграфик epi f замкнут в R X X. Условие замкнутости функции (в отличие от выпуклости) можно выразить в терминах лебеговских множеств. Именно, функция f замкнута тогда и только тогда, когда все ее лебеговские множества замкнуты, т. е. когда функция f полунепрерывна
§ 3.2. ВЫПУКЛЫЕ ФУНКЦИИ
179
снизу. Действительно,
= {х е X | (а, х) <== epi f}.
Поэтому, если множество epi f замкнуто, то и все множества 3?af тоже замкнуты. Пусть, наоборот, все множества S?af замкнуты. Имеем
n
Р > a
Пусть (ao, Xo)^epif. Для доказательства замкнутости множества epi f нам достаточно проверить, что некоторая окрестность V точки (ао, Хо) не пересекается с epi/. Коль скоро (ао, %о) Ф epi f, то и хо ф . Это означает, что Xo^«2?pf при некотором 0>ао. Отсюда, в свою очередь, следует, что некоторая окрестность U cz X точки %о не пересекается с Пусть
V = {(a, x)eRXX|a<₽, хе U}.
Тогда V есть окрестность точки (ао, х0) в RXX. С другой стороны, если (a, x)eV, то	и, так как a < 0,
то x^3?af. Поэтому a<f(x) и, значит, (epi f) А V = 0.
3.2.2.	Операции с выпуклыми функциями. Перечислим наиболее употребительные из операций с выпуклыми функциями.
Пусть fi, ..., fn — собственные функции. Функция / п \	п
(А+ ... + fn)W = 2b W = Sh(x)
\i=l J	i=l
называется суммой функций /ь ..., fn. Инфимальной конволюцией fi, ..., fn называется функция Дф ... п
• • • Ф/п = ® f>> определенная равенством
©fi')(x) = inf|2A(x1)
7=1 /	I /=1
п
2 Xt- = X
i=l
Ясно, что сумма и инфимальная конволюция собственных выпуклых функций— выпуклые функции, однако они могут и не быть собственными. Например, если f\ и f2 — индикаторные функции непересекающихся выпуклых множеств, то их сумма тождественно равна
180
ГЛ. 3. ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
4-оо. Если же fi и f2 — линейные функции, не равные друг другу, то их инфимальная конволюция тождественно равна —оо.
Пусть {fv} (v е N) — произвольное семейство . функций. Функция
(V M(x) = SUp{fv(x) |V€=M
\v е= N )
называется верхней гранью функций fv, а функция
(conv ( Д fv\\ (х) = inf J а е R | (а, х) е conv ( II epi f JI
\ \ve^ J)	(	Ц
— выпуклой оболочкой нижней грани функций fv. Верхняя грань любого семейства выпуклых функций всегда выпукла, так как ее надграфик равен пересечению надграфиков исходных функций. Выпуклая оболочка нижней грани любого семейства функций выпукла по определению. И в этих случаях результирующие функции могут быть несобственными, даже если исходные функции — собственные.
Пусть Л: X —>У— линейный оператор, g— функция на У и f — функция на X. Функции gA и Af, определенные равенствами
(gA)(x) = g(Ax),
(Af) (у) = inf {f (х) | х е X, Ах = у},
называются соответственно прообразом функции g и образом функции f при отображении Л. Как и выше, при этих операциях выпуклые функции переходят в выпуклые, но вообще говоря, собственные функции могут переходить в несобственные.
Функция f, определенная условием
epif = epTf,
называется замыканием функции f, а функция convf: epi (conv f) = conv (epi f)
— выпуклым замыканием функции f. Разумеется, замыкание выпуклой функции выпукло, но замыкание собственной функции может быть и несобственной функцией. Отметим еще, что сумма конечного числа и верх
§ 3.2. ВЫПУКЛЫЕ ФУНКЦИИ
181
няя грань произвольного семейства замкнутых функций— замкнутые функции, а операции инфимальной конволюции и выпуклой оболочки могут переводить замкнутые функции в незамкнутые. Например, инфималь-ная конволюция индикаторных функций множеств
A = {xeR2|x'x2> 1, х1 > 0, х2 > 0},
В = {х eR2 |х2 = 0},
замкнутых, поскольку множества А и В замкнуты, равна индикаторной функции открытой полуплоскости
{х €= R2 |х2 > 0).
Посмотрим что получается при применении перечисленных операций с индикаторными функциями. Доказательства всех последующих формул мы опускаем, поскольку они не представляют труда:
б(.| Л,) + б(-| Л2) = б(-| Д) V6(.| Л2) = б(-| л,пл2),
б(-| Л1)®6(-|Л2) = 6(.|Л1 + Л2),
conv (6 (• | Л0 А 6 (• I Л2)) = б (• | conv (Л] U Л2)), б( .| Л)А = б( -| ЛА), Аб(-| Л) = б(-|АЛ),
б ( | Л) = б (• | Л), conv (б (• | Л)) = б (• | conv Л).
3.2.3.	Непрерывность выпуклых функций *).
Теорема 1. Пусть f — собственная выпуклая функция на X. Тогда следующие утверждения эквивалентны:
a)	f ограничена сверху в окрестности некоторой точки х;
б)	f непрерывна в некоторой точке х;
в)	int(epif) =/= 0;
г)	int(domf)y=0 и f непрерывна на int(domf).
При этом
int (epi f) = {(а, х) <= R X X | х е int (dom f), а > f (х)).
Доказательство. Докажем сначала эквивалентность утверждений а) и б). Если f непрерывна в точке х, то она, конечно, ограничена в некоторой
*) Все утверждения и доказательства, содержащиеся в этом пункте, сохраняют силу, если X — произвольное линейное топологическое пространство.
182
ГЛ. 3. ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
окрестности этой точки, т. е. из б) следует а). Пусть f ограничена сверху в окрестности U точки х0, т. е. для всех x^U f(x)^z с < оо, с > 0. Заменяя, если нужно, V на U — хо и f(x) на f (х + х0) — f (х0), можем считать, что Хо = 0 и /(0) = 0. Выберем 0< и положим
Тогда Ve есть окрестность нуля. Покажем, что из x^V9 следует |/(х)|<8, а это в силу произвольности 8 и означает непрерывность функции f в нуле. Действие тельно, пусть xeV£. Тогда хе(е/с)У, т. е. (c/e,)x^U и из-за выпуклости функции f
x) + (i-f)f(0)<8
С/ \ о /	\	и /
по неравенству Йенсена. С другой стороны, хе—(e/c)Ut т. е. —(с/е)х е U и из
п	1	. е/с (	с \
0 — 1 + е/с Х + 1 + е/с \	е Х/
следует, что
е/с
1 + е/с
т. е. /(х)^—8. Таким образом, из а) следует б). Во* лее точно, f непрерывна в каждой точке, в окрестности которой она ограничена сверху.
Импликация г)=>б) тривиальна; из а) следует в), поскольку если а0^/(х) для всех	то
{(а, х) е R X X | а > а0, х е U] cz epi /.
Итак, осталось доказать, что из в) следует г).
Пусть int(epi/) У= 0. Если (а, х)е int(epi /), то f, очевидно, ограничена в окрестности точки х и, значит, непрерывна в этой точке. Поэтому нам достаточно про* верить, что int (dom f) = {х е Х| За: (а, х) е int (epi /)}. Однако это сразу следует из предложения 4 § 3.1.
Наконец, заключительное утверждение теоремы тоже очевидно: если (а, х) е int (epi /), то необходимо х& int(dom/) и а>/(х). Наоборот, если функция f непрерывна на int(dom/), хе int(dom/) и а>/(х), то (а, х)е int(epi/). Теорема доказана.
§ 3.3. СОПРЯЖЕННЫЕ ФУНКЦИИ
183
§ 3.3. Сопряженные функции. Теорема Фенхеля — Моро
3.3.1. Преобразование Юнга — Фенхеля. Пусть f — функция на X. Преобразованием Юнга — Фенхеля функции Д или функцией, сопряженной с Д называется функция на X*, определенная равенством *)
f (х*) = sup «х‘, х) — f (х)). (1) X
Это означает, что гиперплоскость а —(х*, х)+ f* (х*) = О является опорной к epi f (рис. 11).
Следует иметь в виду, что верхнюю грань в (1) можно брать лишь по хе dom Д
Точно так же, по функции g на X* равенством
g-* (х) = sup «X*, х) — g (X*)) X*
определяется сопряженная функция на X. В частности, функция /*♦=(/*)* называется второй сопряженной функции f. Из определения сопряженной функции следует неравенство
f (х) + Г (х') > <х‘, х>,
справедливое для всех хеХ, х* е X*. Это неравенство называется неравенством Юнга — Фенхеля.
Примеры сопряженных функций. 1. Сопряженной с аффинной функцией f(x)={xQ, х} + а будет функция
f* (х*) = sup (х* — xj, х) — а =
— а, если х* =« xj, оо, если x*=/=xj.
*) В случае, если f(x)—выпуклая гладкая функция в Rn, растущая на бесконечности быстрее линейной функции, преобразование Юнга — Фенхеля превращается в преобразование Лежандра'.
Г (х*) = (х*|хо)-/(хэ).
где Хо определяется равенством х* = /'(х0). •
184
ГЛ. 3. ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
2. Пусть A cz X и f (х) == д (х | Д). Тогда Г (х*) = sup {(х*. х) | х €= Д) = s (х* | Д),
т. е. сопряженной с индикаторной функцией множества А будет опорная функция этого множества. Множество
Д° ==	(• | Д) = {х* е= X* | $ (х* |Д) < 1}
называется полярой множества Д. Если К — конус, то и № — конус:
№ = {х*еГ|(Лх)<0, ух<=К}.
Конус К* = —К° называют сопряженным с конусом К. Если L — подпространство, то
L° = {х* е X* | (х*. х)=0,
— аннулятор подпространства L. Проверка этого не представляет труда.
3. Пусть А с X. Функция
(О,	если х = О,
Ш |1 >0 I = А), если ^0.
называется функцией Минковского множества Д. Найдем с ней сопряженную:
Г (х*) = sup {(х*, х) — f (х) | х €= X} «
в sup {(х*, х) — inf {Л >0 | Х~1х еД) |х е Х} =
= sup {(х*, х> — X | Л > 0, Х“!х еД] =
= sup {sup {(X*, х) | х е ЛД} — А | Л >0} =
= sup (X ( sup (х*, х) — 1)) = 6 (х* I Д°). Ь>0 хееА
3.3.2. Элементарные свойства сопряженных функций.
Условимся писать fi f2> если fi(x)^f2(x) при всех х. Тогда из fi > f2 следует, что
Предложение 1. Для всякой функции f справедливо неравенство
f>r.
Доказательство. По неравенству Юнга— Фенхеля
Г (X) - sup «х‘, х) - Г (X*)) < f (х). X*
§ 3.3. СОПРЯЖЕННЫЕ функции
185
Предложение 2. Пусть f — функция на X. Тогда сопряженная функция f* замкнута в слабой * топологии пространства X* и выпукла*).
Доказательство. По определению f* есть верхняя грань семейства аффинных (и, значит, выпуклых) и непрерывных в слабой * топологии функций х* —► х}— f (х) (xedomf). Поэтому /* выпукла и слабо * замкнута.
Точно так же, если g— функция на X*, то ее сопряженная g* выпукла и слабо замкнута и, значит, замкнута на X. Для выпуклых функций на X в силу следствия 2 из второй теоремы отделимости (теорема 2 из § 3.1) замкнутость эквивалентна слабой замкнутости. С другой стороны, мы нигде в книге не будем рассматривать X* с топологиями, отличными от слабой *. По-поэтому в дальнейшем мы вместо слабо * замкнутая выпуклая функция будем говорить просто замкнутая выпуклая функция.
Предложение 3. Пусть f — собственная выпуклая замкнутая функция на X. Тогда f* — собственная функция.
Доказательство. Если %о dom f, то
Г (х‘) > <Х*, Хо) — f (х0) > — ОО
для всех х*. С другой стороны, точка (f(x0)—1,х0)<£ epi f. По второй теореме отделимости существует пара
(Ро. г/’) такая, что
sup (₽оа + (у'о, х» < р0 (f (х0) - 1) + (у'о, Хо).
(а, х) е epi f
Ясно, что Ре =/= 0. С другой стороны, Ро не может быть положительным числом, ибо иначе верхняя грань слева равнялась бы 4-оо. Поделив на | Ро|, получаем:
х €= dom т
< 1— / (хо) + <^о | Ро I-1 ’ Хо)<
*) Напомним, что базу окрестностей нуля в слабой * топологии пространства X* образуют всевозможные множества вида {х* е X* | | (х*, Xi) | < е, i = 1, ..., k}, где е > 0, Xi g X, ...,	,
еХД < оо; пространство линейных непрерывных функционалов в слабой * топологии X* совпадает с X.
186
ГЛ. 3. ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
Из доказанного следует, в частности, что собственная выпуклая замкнутая функция f(x) ограничена снизу на всяком ограниченном подмножестве пространства X, поскольку она мажорирует хотя бы одну аффинную функцию.
Предложение 4. Пусть A: X-+Y— линейный гомеоморфизм X и У, a g — функция на У. Положим
f (*) = hg (Ax + у0) + (xj, х) + Yo,
где y0^Y, х‘еХ’, у0 <= R, А, > 0. Тогда
Г (Л=W (Va-1* (х‘ -х;)) - <х’ - х; A-ly0} - Ye.
Доказательство. Имеем
f * (Х*) -* sup (<х\ х) - Kg (Ах + Уо) — (X*, х) — у0) =
(полагая у = Лх 4- Уо)
= A,sup(A.-1(A-l*(x* — xj), у}- g(у)} —
- <х- - х”, Х~'у0) - у0 = Kg' (V’A-’- (х* - х0’)) -— (x’-xj, ЛЛо>-То-
Из этого предложения следует, в частности, что
f (х) = g (х + х0) г (х‘) = g' (х‘) — <х‘, х0>;
f (х) = g (х) + (х;, х) =Ф f (х-) = g' (х* — х’);
f(x) = Kg(x), К > 0=^>f*(х*) = Kg* (К~‘х');
f (х) = Kg(K~lx), К > 0 => Г (х*) = Kg' (х‘);
f (х) = g (Кх), K>Q=^f* (х‘) = g* (А,-1х‘).
3.3.3. Теорема Фенхеля — Моро.
Теорема 1 (Фенхель — Моро). Пусть f — функция на X, всюду большая —оо. Тогда f — f** в том и только том случае, когда f выпукла и замкнута.
Доказательство. Если / = /**, то f выпукла и замкнута (см. предложение 2). Далее, если f(x) = 4-оо, то равенство f = f** очевидно. Значит, в силу предложения 1 нам достаточно проверить, что для собственной выпуклой и замкнутой функции f справед-
§ 3.3. СОПРЯЖЕННЫЕ ФУНКЦИИ
187
лйво неравенство

Идею дальнейшего доказательства и его основные этапы иллюстрирует рис. 12. Допустим, что f*(x0)<
< f (х0) в некоторой точке x0G=domf**. Тогда epi f как непустое выпуклое и замкнутое множество можно сильно отделить от точки (f * (х0), х0) ненулевым линейным функционалом (р, у*) е R X X*, т. е.
РГ (*о) + {у', Хо) > sup {р<х +
+ (у‘, y)l(a.	(2)
Тогда р 0, так как иначе
Рис. 12.
в силу предложения 3),
верхняя грань справа равнялась бы + оо. Если р — 0, то, выбрав z/*edomf* (domf*^=0
получим для t > О
Г (У*1 + *У*) = sup {(^ 4- ty*, y') — f(y)\y^ dom f] <
< SUP {{y'v У) — f (У) ly e dom f} +
+1 sup \{y\ у} I у <= dom f} =
= fO/J) + *sup {<#*, y) ]y<== domf), и согласно (2)
(*o)> {У\ + ty\	- r (y\ + ty*)>{y\, x0) - f {y\) +
+ 4</> x0) — sup {</, z/) 11/e dom/}]-> 00
при t —♦ 00, т. e. Хо ф dom f**, вопреки предположению. Таким образом, случай р = 0 тоже исключается.
Остается случай р <; 0. Поделив обе части неравенства (2) на |р| и полагая х* = |р|-1«/*, получим
<х‘, х0) — Г * (х0) > sup {<х‘, у} — а | (а, у) е epi f} = f * (х’), т. е. гиперплоскость а = (х‘, х)—/* (х*) проходит выше точки х0):
<<х0)>Г(х0) + Г(х’)
188
ГЛ. 3. ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
в противоречии с неравенством Юнга — Фенхеля. Теорема доказана.
Из теоремы сразу следует «двойственное» описание собственных замкнутых выпуклых функций.
Следствие 1. Всякая собственная выпуклая замкнутая функция на X совпадает с верхней гранью семейства всех не превосходящих ее непрерывных аффинных функций.
Доказательство. По теореме Фенхеля — Моро f(x) есть верхняя грань семейства аффинных функций вида
х -> (х\ х) — Г (х*)	(х* с= dom П
и, тем более, всех не превосходящих ее непрерывных аффинных функций.	____
Следствие 2. Если convf — собственная функция, то	___
f** = convf.
Доказательство. Надграфик epif** — выпуклое замкнутое множество, содержащее epif (поскольку Поэтому epi f cz conv (epi f) cz epi f**. Это значит, что f convf f**. Из левого неравенства следует, что f* <c(convf)* и, следовательно, f** (convf)** = = conv f, поскольку	conv f — выпуклая	замкнутая
функция.
§ 3.4. Теоремы двойственности
Теоремы двойственности показывают, как связаны преобразования Юнга — Фенхеля функций, получающихся в результате тех или иных операций, с преобразованиями Юнга — Фенхеля исходных функций. Оказывается, что операции, описанные в п; 3.2.2, распадаются на пары двойственных операций.
Приведем сначала формулировки всех теорем двойственности, а затём перейдем к доказательствам.
Теорема 1. Пусть ..., fn — функции на X. Тогда
§ 3.4. ТЕОРЕМЫ ДВОЙСТВЕННОСТИ
189
Если же fi, ...» fn — выпуклые собственные функции и их эффективные множества содержат общую точку, в которой все эти функции, за исключением, может быть, одной, непрерывны, то
(А+/2+...
Более того, в этом случае для всякого х* edotn (fi+.. • +/«)’ найдутся такие точки x’edomf’, i=l..п, что
х*=х;+ ... +х‘,
(Z.+ ••• +ц-(х-)=/;«)+ ... +£(<).
Теорема 2. Пусть fb fn — функции на X. Тогда
(conv (А Л f2 л... л /„))• = П V f; V ... V Гп,
(Л V f2 V ... V Q’Cconv^ Л г2 Л ... Л Q.
Если же fi, fn — выпуклые функции, конечные на всем пространстве X, и все они, за исключением, может быть, одной, непрерывны, то
(f, V f2 V.. • V f„)‘ = conv(f; л Г2 л ... л Q.
Более того, в этом случае для всякого x‘edom (Л V • • • V/«)* найдутся такие векторы х*{ е dom f*., i = 1, ..., п, и такие неотрицательные числа a,-, i— п, сумма которых равна единице, что
х’ = а,х;+	+м;,
(f, v... V f J (V)=«,?;«)+...+ а л К).
Теорема 3. Пусть Л: X->Y — линейный непрерывный оператор. Если g — функция на X и f — функция на Y, то
(A^)’ = g‘A\ (fA)‘<A*f.
Если же f — выпуклая функция, непрерывная в некоторой точке множества 1mA, то
(fX)' = AT.
190
ГЛ. 3. ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
Более того, в этом случае для всякого x*edom(/A)* найдется такой вектор у* е У*, что
x* = AV, (/ЛГ(г*) = Г(/).
Отметим, что в каждой из сформулированных теорем первое утверждение носит безусловный характер, в то время как второе справедливо лишь при дополнительных предположениях. Причина этого кроется в различной природе двойственных операций в каждой паре. Одна из них локальна (значение результирующей функции в каждой точке определяется только значениями исходных в соответствующей точке) и преобразует замкнутые функции в замкнутые. Таковы сумма, верхняя грань и прообраз при линейном непрерывном отображении. Вторая операция нелокальна (значение результирующей функции в каждой точке зависит от всей совокупности значений исходных) и, вообще говоря, не сохраняет замкнутость.
Приведем примеры, показывающие, что условия, фигурирующие в заключительных частях теорем, существенны.
Пусть fi и fz — функции на прямой, заданные равенствами
Тогда
A W = 11ЖI - 11, fi (X) = I X |.
/;(</)=(|г/Ь I °°»
(А + АГ(«/) = [
I °°>
С другой стороны,
если | у | < I,
если если если
если если если если
1</1> 1: 1</|< I.
|»1> к I Х|< 1, |х|> I; I у I <2. \У I > 2.
о; ® $ (У) = inf {?; (У - Z) 11 21 с 1} =
0, если
| у | — 1, если
оо, если
1</К 1.
1 <1 </|'<2.
I У 1>2.
Таким образом, преобразование Юнга — Фенхеля суммы невыпуклых функций (функция fi не выпукла) может не совпадать с инфималь-ной конволюцией сопряженных функций, даже если исходные функции всюду непрерывны. Рассмотрим еще один пример, показываю-
§ 3.4. ТЕОРЕМЫ ДВОЙСТВЕННОСТИ
191
ший, что требование непрерывности, присутствующее в формулировке теоремы 1, существенно. Пусть
f (х)—( — К2х’х2, если х1 >0, х2>0, 1 I оо»	если х*<0 или х2<0;
р , .	(0, если х1 <0, х2 > 0,
/2 W = 1
I оо, если х1 > 0 или х2 < 0,
где х = (х1, х2) s R2. Обе функции выпуклы, а их эффективные множества пересекаются по полуоси х1 == 0, х2 > 0, в каждой точке которой обе функции терпят разрыв. В частности,
. «ч/ч Г °’ если *1=0, х2>0, (/1 + L) (*) == {	1 / л 9 л
I со, если х1 =/= 0 или х2 < 0.
Имеем для у = (у*. у2) е= R2
* ГО, если у'у2>\,	<0, ^2<0.
/1 \У) — 1
I оо в остальных точках;
♦ ГО, если	,2<0,
2	[ оо, если у1 <0 или у2>0;
। * ч* / ч ( °’ если У2«>> (tl + /2) (У) - ]	2 л
V оо, если у2 > 0.
С другой стороны, функция	как инфимальная конволюция
индикаторных функций равна индикаторной функции суммы эффективных множеств функций f1 и f2. Сумма этих множеств состоит из всех точек полуплоскости у2 0, за исключением точек прямой i/2 = 0, т. е. она не совпадает с эффективным множеством функции (А + М*. Аналогичные примеры можно привести в подтверждение существенности условий остальных теорем.
Переходя к доказательствам, заметим сразу, что первые две теоремы достаточно' доказать для случая двух функций, так как общий случай легко получается по индукции.
Доказательство теоремы 1. Первое равенство устанавливается прямой выкладкой:
(А ©/2)* (X*) = sup {(х*. х) — inf (ft (х — z) + f2 (z))} =
X	z
= sup {<x\ y} - («/) + (x‘, z> — f2 (z)} = fl (x‘) + f2 (x‘).
y.z
Далее, по неравенству Юнга — Фенхеля f; (*э+п (*;) > <*;+x> - f, w -
192
ГЛ. 3. ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
ДЛЯ любых X* G X*, Х*2 е Г, х е X. Поэтому да)+од>№. + ш<+'‘Э-
Это неравенство, в частности, верно для всех х* и хг таких, что х* + Х2 = х*. Поэтому
Первая часть теоремы доказана.
Перейдем к доказательству второй части. Из последнего неравенства, в частности, следует, что третья из доказываемых формул верна, если
dom(fj + f2)*= 0.
Предположим теперь, что (fi + f2) *(х*) = ао < оо и функция непрерывна в некоторой точке из domf2. Тогда dom(fi + f2) #= 0 и, значит, (fi + f2)* всюду больше —оо; в частности, —оо < ао < оо. Рассмотрим множество
А = {(а, х) е R X X | а < (х*, х) — f2 (х) — аэ}.
Очевидно, это множество выпукло. Покажем, что A A int(epifi) = 0. (Множество int(epifi) не пусто в силу теоремы 1 из § 3.2.) Действительно, если (а, х)<= еДП int(epifi), то
f 1 (х) < а < <х*, х) — f2 (х) — аэ, т. е.
«о < <х*, х) — f j (х) — f2 (х) С + f2)* (х*) = аэ.
По первой теореме отделимости (теорема 1 из §3.1) существует ненулевой линейный непрерывный функционал (₽,f/*)GRXA4, разделяющий А и int(epifi), г. е. такой, что
sup [ра + (/, х) |(а, х) g= epi fj <
<inf {ра + <£/*, х> |(а, х)еЛ]. (1)
Ясно, что р 0. Если р = 0, то из (1) следует, что //* разделяет множества domfi и domf2 (у* У= 0, коль скоро Р = 0). Последнее в силу первой теоремы отделимости невозможно, поскольку по условию (см. также теорему 1 из § 3.2) множества int(domfi) и domf2 пересекаются.
§ 3.4. ТЕОРЕМЫ ДВОЙСТВЕННОСТИ
193
Итак, р < 0. Разделив обе части неравенства (1) на | р | и положив x*i = | р |-1 у*, получим
fi(ХЭ = sup {<xi’ х> —Мх) Iх е *} =
= sup {(х*, х) — а | (а, х) е epi f,J inf {(Хр х} — а | (а, х) е Л} =
— inf {(х* — х*, х) + f2 (х) |х s dom f2] + а0 =
Из этого соотношения следует неравенство
(f; ® (**) = П (<) + r2 (X’ - xj) < а0 = + Г2)‘ (х'),
доказывающее теорему.
Доказательства теоремы 2 мы не приводим; оно нам не понадобится.
Доказательство теоремы 3. Как и в предшествующем случае, первое соотношение тривиально следует из определений, второе вытекает из неравенства Юнга — Фенхеля, и нам остается доказать неравенство
(ЛТ)(х*Х(/Л)*(х-)
в предположении, что функция f непрерывна в некоторой точке, принадлежащей множеству Im Л, и что fe е dom (fA)*.
Положим ао = (/А)* (х*). Поскольку (domf)A П(1тА)У=0, функция /Л принимает конечные значения и, значит, (fA)* всюду больше —оо; в частности, а0— конечное число. Рассмотрим в RX линейное многообразие
М = {(а, у) е R X Y |3х е X: а = (х*, х) ~аэ, у = Лх}.
Оно не пересекается с внутренностью множества epi f, так как иначе для некоторого х е X было бы
f (Ах) < <х*, х) — аэ,
а0<(х\ х>-/(Лх)<(/Л)‘(х-) = ао.
7 А. Д. Иоффе, В. М. Тихомиров
194
ГЛ. 3. ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
По первой теореме отделимости множества М и epi f можно разделить ненулевым линейным функционалом (Р, у') е R X Y*, т. е.
sup {ра + («/*, у) | (а, у) е epi f} <
< inf {ра + (у”, у} | (а, у) 6= М}.
Как обычно, убеждаемся, что р^О. Если Р = 0, то у* не равен нулю и разделяет множества dom f и Im Л вопреки предположению о том, что int (domf) f| (1тЛ)^=0. Итак, р < 0. Разделив обе части последнего неравенства на | р | и положив г/о = 1РГ1У*> получим
Г (Уo') < inf {{Уу У} — а | (а, у) G= М) =
= inf ((z/*, Лх) — <х‘, х> + а0 [ х (=Х}.
Так как (у*) > — оо для всех у*, отсюда следует, что %* = Д*у*. Иначе
inf ((г/*, Ах) — (х*, х)) = inf (Л*у* — х*, х) = — оо.
Таким образом, х*е!шЛ*, x* = A*yJ и (Л*/*)(х*)^ </*(у*)^а0 = (/Л)*(х*). Теорема доказана.
§ 3.5. Выпуклый анализ в конечномерных пространствах
3.5.1. Теорема Каратеодори. В конечномерных пространствах многие общие теоремы выпуклого анализа могут быть значительно усилены. В § 3.1 мы показали, что выпуклая оболочка множества совпадает с совокупностью всех выпуклых комбинаций точек этого множества (предложение 1 из § 3.1). Аналогичным образом были описаны выпуклые конусы, порождаемые множествами (предложение 3 из § 3.1). В конечномерных пространствах справедливы более сильные утверждения.
Теорема 1. Пусть А — непустое подмножество пространства Rn. Тогда каждая отличная от нуля точка х, принадлежащая выпуклому конусу КА, порожденному множеством А, может быть представлена в виде
х = Л|Х| 4" • • • И- КГхп
§ 3.5. КОНЕЧНОМЕРНЫЙ ВЫПУКЛЫЙ АНАЛИЗ
195
где Xi > 0, ...,	> 0, а точки е Л, ..., хг (= А ли-
нейно независимы. В частности, г п.
Доказательство. Пусть х е Ка и х #= 0. Тогда в силу предложений 1 и 3 из § 3.1
х —	+ ... +
где pi > 0, ..., рь > 0, а точки хь ..., xfe принадлежат множеству А. Предположим, что векторы хь Хь линейно зависимы, т. е. существуют не равные одновременно нулю числа у1, ..., уь такие, что
ул+ ... +ул = о.
Без ограничения общности можно считать, что среди чисел Yi, •. •, \k есть положительные (в противном случае мы заменим их на противоположные). Обозначим через У множество тех индексов 1, 1 i k, при которых у« > 0, и положим
П ~ m i t-i р = min —.
Пусть, далее, =	— ₽Yr
Тогда , все числа неотрицательны и по крайней мере одно из них равно нулю. С другой стороны,
2	= 2 нл- — Р 2 УЛ = 2 НЛ = х.
Таким образом, мы представили х в виде суммы не более k— 1 ненулевых слагаемых.
Повторив проделанную процедуру необходимое (но всегда конечное!) число раз, получим в конце концов требуемый результат. Теорема доказана.
Следствие 1 (теорема Каратеодори). Пусть A ci Rn. Тогда каждая точка множества conv Л есть выпуклая комбинация не более п 4; 1 различных точек множества А.
Доказательство. Рассмотрим в пространстве R X Rn множество В = {1} X Л, т. е. совокупность точек вида (1, х), где хеЛ. Очевидно, conv В = {1}Х(сопуЛ)<
7*
196
ГЛ. 3 ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
Пусть Кв— выпуклый конус, порожденный множеством В. Тогда conv В с: Кв- Если (l,x)econvB, то по теореме существует г^п-f-l точек	(1,хг) из
В и г чисел он > 0, ..., аг > 0 таких, что
(1, x) = cti(l, х0+ ... 4-аг(1, Хг).
Но это равенство означает, что
«1 + • • • + аг = 1, «1^1 + • • • + ^гхг =
Теорема Каратеодори доказана.
Следствие 2. Пусть А — замкнутое ограниченное подмножество пространства Rn. Тогда выпуклая оболочка множества А замкнута, т. е. conv 4 = conv А
Доказательство. Рассмотрим множество
S={a = (ai, а„+1) |az>0, i=l, .... «4-1, 2az = 1) cRn+l
и отображение <p: Rn+IXR’tX ••• XRn~*R,l> которое n 4-1 раз
каждому набору a = (ab ..., a„+1) e Rrt+1, Xi <= Rn, ...
..., x„+1e R” ставит в соответствие вектор
п + 1
<p(a, xb .... х„+1)= 3 azx'. t=i
Отображение <p непрерывно, а множества ЗиЛ компактны. Поэтому и множество S X А X • • • X А ком-п+1 раз
пактно. Отсюда следует, что и qp(S, А, .Л)—компактное и, значит, замкнутое множество. Но по теореме Каратеодори
<p(S, Л, Л) = convЛ.
3.5.2. Аффинная оболочка и относительная внутренность. Говорят, что точка х е R" есть аффинная комбинация точек х19 ..., хг, если
Г	г
х — s Z,xb где е R, Е = 1. i=i	i=i
§ 3.5. КОНЕЧНОМЕРНЫЙ ВЫПУКЛЫЙ АНАЛИЗ
197
Совокупность всех аффинных комбинаций точек множества А называется аффинной оболочкой множества А и обозначается aft А. Легко понять, что aff А есть линейное многообразие, параллельное линейной оболочке множества А — х0, где ха — произвольная точка множества А. Действительно, если x = 2Vi> х( е А, 2^ = 1 и то точка х — x0 = 2zz(.rz—*о) принадлежит линейной оболочке множества А—х0. Наоборот, если x =	— хо), где х^А, то х + хо = 2м,+
+ (1 — S Л,) xQ е aff А. Если А—выпуклое множество, то размерность его аффинной оболочки называется размерностью множества А и обозначается dim4.
Точки Хь ..., хг из Rn называются аффинно независимыми, если из
Л^х* = 0,	= О
t=i	/=1
следует, что Zi = ... = Лг — 0. Приведенное выше рассуждение показывает, что точки хь ..., хг аффинно независимы тогда и только тогда, когда векторы Хь — xi9 k=l, ..., г, k=^=i, линейно независимы для всякого фиксированного номера i, 1 i г. Поэтому, если хь ..., хг аффинно независимы, то всякий вектор х е aff {хь ..., хг} единственным образом представляется как аффинная комбинация точек хь ..., хг, т. е. существует единственный набор чисел Ль ..., Лг, равных в сумме единице и таких, что х = ZjXi	Лгхг.
Эти числа называются барицентрическими координатами точки х.
Выпуклая оболочка k + 1 аффинно независимых точек хь xfe+1 называется k-мерным симплексом, а сами точки Xi, ..., Х&+1 — его вершинами.
Предложение 1. Пусть S есть п-мерный симплекс в Rn. Тогда int S =# 0.
Доказательство. Без ограничения общности можно считать, что Xi + ... + xn+i = 0 (где хь ..., хп— вершины симплекса S). Пусть xeRn, х#=0, и М, ... ..., Лп+1 — барицентрические координаты точки х. Положим Л = гпах{|Л1|, ..., |Лп+1|}. Предположим, что
198
ГЛ. 3. ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
1/е > (п +	1. Тогда 1 > е > 0 и
п+1	п+1
ех = (1 — е) •0 + ех=^(-^=-у + еХ<)х/ = 2аЛ^5, i=l 4	1=1
так как а1 + ... + ап+] =1 и а( > 0 в силу выбора е. Отсюда следует, что, если {вь ..., еп} — стандартный базис в Rn, то найдется такое е>0, что ±ее; еЗ для всех / = 1, .... п. Поэтому и
conv {± еву |/ = 1.п] с: S.
Но множество conv{±ее,|/ == 1, .... п} содержит шар п ___________
радиуса 8/]/п. Предложение доказано.
Пусть А cz Rn. Внутренность множества А относительно affX называется относительной внутренностью множества А и обозначается ri А. Точки множества ri А называются относительно внутренними точками множества А,
Теорема 2. Пусть A cz Rn — выпуклое множество. Тогда ri4 =# 0 и aff (ri Д) = aff А,
Доказательство. Предположим сначала, что dim4 = n, т. е. что aff4 = Rn. Пусть	хт—не-
которая максимальная система аффинно независимых точек множества А. Очевидно, т п+ 1. С другой стороны, множество А не лежит ни в каком собственном линейном многообразии. Поэтому если т<п+1, то в А найдется вектор, не принадлежащий аффинной оболочке точек %1, ..., хт, т. е. эти точки не образуют максимальной аффинно независимой системы, в противоречии с предположением. Итак, /п = п+1, и в силу предложения 1 симплекс S с вершинами хь ..., xn+i имеет внутренние точки. Из предложения 4 из § 3.1 следует теперь справедливость утверждения теоремы в случае, когда dim А — п.
Пусть dinM<n. Тогда без ограничения общности можно считать, что ОеЯ, т. е. aff А есть подпространство размерности г, которое мы можем отождествить с Rr и, таким образом, снова прийти к рассмотренной выше ситуации. Теорема доказана.
Отметим в качестве непосредственного следствия доказанной теоремы, что размерность выпуклого множе
§ 3.5. КОНЕЧНОМЕРНЫЙ ВЫПУКЛЫЙ АНАЛИЗ
199
ства равна максимальной размерности содержащихся в нем симплексов. Заметим еще, что из определений и из предложения 4 § 3.1 следует, что д = пЛ, riA== .= ri А.
3.5.3. Выпуклые функции на Rrt.
Теорема 3. Пусть f — выпуклая собственная функция на Rn. Тогда f непрерывна относительно aff(dom/’) во всякой точке xeri(domf) и f*— собственная функция.
Доказательство. Пусть dim (dom f) = k. Выберем в ri(dom/) некоторый ^-мерный симплекс S с вершинами X], ..., Xfe+], Тогда в силу выпуклости функции f для всякой точки xeS справедливо неравенство /(xXmaxfHx!)................f(xft+I)}.
Из предложения 1 следует, что внутренность симплекса S относительно множества aff(domf) не пуста. Поэтому в силу теоремы 1 из § 3.2 функция f непрерывна относительно aff(domf) во всякой относительно внутренней точке множества dom f. Первое утверждение теоремы доказано. Из него следует, в частности, что функция f совпадает со своим замыканием на множестве ri(domf)« Если f(xQ)=—оо в некоторой точке х0 и Xi е ri(dom f), то при некотором е > 0 точка Х2 = Xi + e(xi — х0) содержится в domf (так как х0 е domf cz aff (domf))« Тогда для всякого аЕ R точка
(?, «Нтт^ + ттг-. *0
принадлежит epi т. е. f(xi) = —°© вопреки выбору х{. Таким образом, f = f**—собственная функция и, следовательно, f* — тоже собственная функция. Теорема доказана.
Отметим еще один полезный результат о выпуклых оболочках функций на Rn, следующий из теоремы Кара-
теодори.
Предложение 2. Пусть f — собственная функция на Rn. Тогда
( П + 1
(conv f) (х) = inf j 2 «if (xi) I t=l
X, s R",
n + 1
и/ o, 2 — i,
n+1
5 «Л = x i=l
200
ГЛ. 3. ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
В частности, если f — замкнутая функция и dom f** — ограниченное множество, то
f** = convf.
I Доказательство. По теореме Каратеодори
( п+2
(conv f) (х) — inf \ 2 atf (xt) l i=l
Xi e R",
az>0,
n+2
S a;= 1, /=!
n+2
S a;x; = x i=l
Зафиксируем xt e R" (i = 1..n + 2) и x e R" и рас-
смотрим такую задачу:
n+2
aj (xf) —> inf;
1=1
n+2	n+2
af o, 2^ = 1» 2 aixi = x-i=l	i=l
Для доказательства первой части предложения достаточно проверить, что в том случае, когда значение задачи конечно, среди ее решений найдется хотя бы один набор чисел (ои, ..., ап+2), У которого хотя бы одна компонента равна нулю. (Решение задачи заведомо существует, если ее значение конечно, поскольку множество допустимых элементов в задаче компактно, а минимизируемая функция линейна.)
Пусть (аь ..., (Zn+2)—решение задачи. Если хотя бы одно из чисел щ равно нулю, то доказывать нечего. Пусть аг > 0, i = 1, ..., п + 2. По теореме Каратеодори можно выбрать числа а{^0,	а„+2^0, среди
которых не более п + 1 отличны от нуля и такие, что
П+2	п+2
2 а/ = 1,	5 n'iXt — х.
/=1	i=i
Если Sa/f (xzXUaJfo),
то все очевидно. Допустим,
что S а</ (х.) > 2 aif Тогда, если 0, = ^— а<, то
§ 3.5. КОНЕЧНОМЕРНЫЙ ВЫПУКЛЫЙ АНАЛИЗ
201
2 = 0,2 Рл = 0 и при достаточно малом Л > 0
^ + ^>0, /=1, .... П + 2; 2(а/ + Л₽/) = 1;
п+2
2 (аг + Лр.) Xi = х;
1=1
п + 2	п+2
5 (аг + Я,р.) f (х^ < 2 aj (хг),
вопреки выбору (аь ап+2). Первая часть предложения доказана.
Пусть теперь f — замкнутая функция и domf— ограниченное множество. Если х е dom f**, то из следствия 2 теоремы Фенхеля — Моро вытекает существование последовательности наборов {(aim, .... an+i,т, xim, ..., xn+i,m)} таких, что axm>0, ^а1т=1, xim<= i
dom f и n+1 2 i=l
n+1 2 ®чтх1т x i=l
при in—> оо. Поскольку последовательности {aZw} и ограничены, мы можем считать, что azw->az, xim — при т —> оо для всех /. Тогда az ^0, Sat-= 1, S aiXi = x. Наконец, если f (xim) -+ co для некоторого номера i, то, поскольку f ограничена снизу, >0 и almf (xim) -> 0. Если же limf (Xjm) < оо, то, из-за замкнутости функции f, f(X{) < оо. Поэтому
п+1	п+1
Г (х) < (conv f) (х) < 2 aj (Х{) < lim 2 aimf (xim) = f" (x). i=l	---i=l
Предложение 2 доказано.
Глава 4
ЛОКАЛЬНЫЙ ВЫПУКЛЫЙ АНАЛИЗ
Эта глава посвящена систематическому изучению субдифференциалов. Субдифференциалы характеризуют локальное поведение выпуклых функций и функций, локально устроенных как выпуклые, подобно тому, как производные определяют локальное поведение гладких функций. И на самом деле, между «субдифференциальным исчислением», с одной стороны, и дифференциальным исчислением гладких функций, с другой, существует глубокая связь, хотя некоторые результаты о субдифференциалах и не имеют аналогов в дифференциальном исчислении. Практически все результаты этой главы существенно используются в дальнейшем; отметим важнейшие из них — теорему Моро — Рокафеллара и теорему об очистке (§ 4.2), Всюду в этой главе, как и в предыдущей, предполагается, что X, Y, ... — отделимые локально выпуклые линейные топологические пространства.
§4.1. Однородные функции и производные по направлениям
4.1.1. Однородные функции. Функция f, определенная на пространстве X, называется положительно однородной степени а > О, если /(0) = 0 и
f (U) =	(х)
для всех х е X, Л > 0. У нас в книге будут встречаться, главным образом, положительно однородные функции степени единица, для краткости будем называть их просто однородными. Очевидно, надграфик однородной функции — конус. Поэтому однородная функция вполне определяется своими значениями в сколь угодно малой окрестности нуля. Вспоминая условие выпуклости конуса (§ 0.3), немедленно получаем, что однородная собственная функция f выпукла тогда и только тогда, когда
f (х) + f(,y)>f(x + y}
для всех х, у g= X. z
$ 4.1. ОДНОРОДНЫЕ ФУНКЦИИ
203
Наиболее важные примеры однородных функций — опорная функция и функция Минковского. Их однородность проверяется непосредственно. Более существенно то обстоятельство, что всякая собственная замкнутая выпуклая однородная функция есть опорная функция некоторого непустого множества.
Предложение 1. Пусть f — собственная замкнутая выпуклая однородная функция на X. Тогда f есть опорная функция некоторого непустого множества. Доказательство. Рассмотрим множество
Л = {х*еГ |/(х)>(х*, х}, Vxg=X} и покажем, что
f (х) = sup {х', х} = s (х | Л).
Если х’еЛ, то (х*, х) — f(x)^O для всех х и f*(x*) = — — f (0) = 0- Если же х* 0 А, то (х*, х) — f (х) >0 для некоторого х е X и
Г (х‘) > Нт (« tx} — f (tx)) = оо.
Наконец, согласно предложению 3 из § 3.3 f*— собственная функция. Поэтому Л #= 0 и /* — б(«|Л). В силу теоремы Фенхеля — Моро отсюда следует, что / = /** = 6*(. |Л) = $(• |Л), т. е. / — опорная функция множества А.
Отмеченное обстоятельство порождает двойственность между собственными замкнутыми выпуклыми однородными функциями на X и непустыми замкнутыми выпуклыми подмножествами пространства X*. Именно, это соответствие относит каждому непустому замкнутому выпуклому множеству A cz X* его опорную функцию, а каждой собственной замкнутой выпуклой однородной функции — эффективное множество функции, сопряженной с ней.
Отметим еще одно полезное свойство однородных функций.
Предложение 2. Пусть f — однородная функция на X. Если f непрерывна во всех точках множества U cz X, то она непрерывна и во всех точках конуса Ки,
ГЛ, 4. ЛОКАЛЬНЫЙ ВЫПУКЛЫЙ АНАЛИЗ
2Э4
порожденного множеством U, за исключением, возможно, нуля. В частности, если f непрерывна в некоторой окрестности нуля, то f непрерывна на X.
Доказательство. Пусть Хо е Ки, Xq ¥= 0- Тогда Хх0 е U при некотором X > 0. Пусть V — окрестность точки Хх0, во всех точках которой выполнено неравенство |f(x)— f(Xx0) | < Хе. Тогда (1/X) V — окрестность точки Хо и при xe(l/X)V
I f (*) - f W I = V11 f (Xx) - f (Xx0) | < e.
Отсюда следует, что f непрерывна в точке %о- Если же f непрерывна в окрестности начала, то по доказанному f непрерывна всюду, за исключением, возможно, нуля. Но в нуле f непрерывна по условию. Предложение доказано.
4.1.2. Производные по направлениям. Пусть f — функция на X и \f(x) |< оо. Если существует конечный или бесконечный предел
МО	л
то он называется производной функции f по направлению у в точке х. Если в точке х функция f имеет произ* водные по каждому направлению, то простая выкладка
Г(х; Xt/) = lim +	=Mim .Нх + 8У)-Нх)
е|0	8	е^О	8
показывает, что f'(x\ •) — однородная функция. Эта функция называется производной функции f по направлениям.
Отличительной особенностью выпуклых функций является существование производных по направлениям во всех точках их эффективных множеств. Мы покажем сначала это для выпуклых функций на прямой, а затем в общем случае.
Пусть <р(/) — собственная выпуклая функция на R, tx < t2 < /3, причем точки t\ и /2 содержатся в dom ф. Тогда по неравенству Йенсена
фМ^Т^фИ + ^фМ-
§ 4.1. ОДНОРОДНЫЕ ФУНКЦИИ
205
Отсюда следуют два соотношения:
Ф (4) — Ф (^1) < у ~ \\ [ф (*з) — Ф (Л)].
*3	11
Ф &) - Ф &) > [ф (/3) - Ф (/J]
или
<Р«г) — <Р(Л) < ф(/з)~ <Р(<1) <- <Р (<з) — <Р (G)	,*ь
ti — t\ '	/3 — ti	' ti — ti
Пусть iedomif'. Из (1) следует, что разностное отношение
Ф (< + X) - <р (/) Л
при убывании Л к нулю не возрастает (если /—крайняя правая точка богпф, то это отношение тождественно по Z > 0 равно + со). Поэтому во всех точках множества богпф функция ф имеет правую производную
ф' (/) = ф' (/; 1) = Ит Ф(< + Х)~У(О-. +	Л40	Л
Далее, если и t2 принадлежат domq) и 0<б</2—
то снова в силу (1)
, Ф (^ + д) — Ф (М ф(*2)-ф(6)	Ф^г + М—ф(^)
Отсюда следует, что ф^_ (Q ф* (Q, т. е. правая производная не убывает по t и |ф^_(0 | < оо, если /e=int (богпф).
Обратимся к общему случаю.
Предложение 3. Пусть f—собственная выпуклая функция на X. Тогда функция f имеет производную по направлениям в любой точке множества domf. При этом
Г{х. y)=\nt
Л>0	А
Доказательство. Пусть х е dom f, у^Х. Положим ф(/) — f(х + ty). Тогда ф есть выпуклая собственная функция на R и нуль принадлежит ее эффективному множеству. Поэтому правая производная ф^.(0) существует. Однако по определению ф^ (0)= f'(x; у). Предложение доказано.
206
ГЛ, 4. ЛОКАЛЬНЫЙ ВЫПУКЛЫЙ АНАЛИЗ
Мы уже отмечали, что производная по направлениям— однородная функция. Если f выпукла, то простая выкладка
г (х; у + г) = lim У <* + U/2) (у + *)>-f W <
НО	А/2
<lim .H<+^)-fW + f(x + M-f,(x) = f, (х. у} + fr(х. z} МО	А
показывает, что ее производная по направлениям тоже выпукла.
Предложение 4. Пусть f — собственная выпуклая функция на X, непрерывная в точках множества UczX. Тогда, если для некоторого х^Х такого, что x-f-xet/, производная f'(x-,x) конечна, то функция f'(x-, •) непрерывна во всех точках конуса Ки-х, порожденного множеством U — х, за исключением, возможно, начала координат. Если же f непрерывна в точке х, то производная по направлениям f'(x\ •) конечна и непрерывна на X.
Доказательство. В силу предложения 2 нам нужно проверить, что функция f'(x\ •) непрерывна во всех точках множества U — х. Покажем сначала, что fz(x; •)— собственная функция. Так как |fz(x; х) | < оо, то xedomf. Поэтому fz(x; у) f (х + у) — f(x) для всех у (предложение 3). Предположим, что f'(x;xi) = = —оо в некоторой точке Xi е X. Поскольку х + х g 'е int(dom f) (теорема 1 из § 3.2), для достаточно малого 8 > 0 точка х + (х + е(х — Xj)) = х + х2 принадлежит множеству domf. По неравенству Йенсена для всякого Л > 0
f(x + U)< (х + Лх2) + (х + Лх,).
откуда следует, что
f(x; xXq-^-Hx; х2)
щП*; xj = —оо
в противоречии с условием. (Заметим, что fz(x;x2)< оо, поскольку x + x2edomf.) Таким образом, наше предположение было ошибочным и fz(x; •) — собственная функция.
§ 4.2. СУБДИФФЕРЕНЦИАЛ. ОСНОВНЫЕ ТЕОРЕМЫ
207
Если Xi е U — х, то f ограничена сверху некоторым числом с в достаточно малой окрестности V точки x-|-xi. Поэтому для всякого y^V— х выполнено неравенство
f'(x; yXf(x + y) — f(x)^C — f (x),
т. e. Л(х; •) конечна и ограничена на V — хи, следовательно, по теореме 1 из § 3.2 непрерывна в точке хь Этим завершается доказательство первой части предложения.
Для доказательства второй части достаточно заметить, что, если f непрерывна в нуле, то (из-за выпуклости) она непрерывна в некоторой окрестности нуля, и применить снова предложение 2.
§ 4.2.	Субдифференциал. Основные теоремы
4.2.1.	Определения и элементарные свойства. В § 0.3 субдифференциал выпуклой функции f в точке х определялся следующим образом:
^{х) = (х*еГ|/(г)-/(х)>(х*, z-x), УгеХ}.
Этот параграф мы начнем с другого определения, пригодного не только для выпуклых функций, но совпадающего с первоначальным в случае, когда функция выпукла.
Пусть f — однородная функция на X. Субдифференциалом функции f в нуле называется эффективное множество сопряженной функции f*. Оно обозначается df(O). В силу предложения 1 из § 4.1
df (0) = {х* <== Г \f (х) > (х*, х>, Vxe/).
Замечание. Функционал х* е X* такой, что
f (х)	(х*, х), Vx е X,
называют иногда опорным функционалом однородной функции f(x). Таким образом, df($)—множество всех функционалов х*, опорных к однородной функции f(x). Точно так же, если g — однородная функция на X*, то множество
dg (°) = d°m g* = [х X | g (х*)	<х*, х), Vx* е X*}
208
ГЛ., 4. ЛОКАЛЬНЫЙ ВЫПУКЛЫЙ АНАЛИЗ
называется субдифференциалом функции g в нуле. Пусть теперь f — функция на X, имеющая производную по направлениям в точке х. Множество
df(x) = df'(x; 0)
называется субдифференциалом функции f в точке х. Элементы этого множества называются субградиентами функции f в точке х. Говорят, что функция f субдифференцируема в точке х, если df (х) =И= 0.
Как следует из доказываемого ниже утверждения, для выпуклых функций это определение субдифференциала совпадает с тем, которое было приведено в § 0.3.
Предложение 1. Пусть f — выпуклая функция на X. Тогда следующие условия эквивалентны:
а)	х* е df (х);
б)	f(z)—	z— х) для всех z е Х\
В) f(x) + f(x‘) = (x‘,x).
Доказательство. Если х*edf(x), то в силу предложения 3 из § 4.1
<х‘, z — х)< f' (х; г — х)< f (х + z—х) — f (х) = f (z)—f (х). Если <х‘, z — x)^f(z) — f (х) для всех z е X, то (х*, z) — .— f (z)	<х‘, х) — f (х) для всех z е X, откуда, принимая
во внимание неравенство Юнга — Фенхеля, получаем f(x*) + fW = <x‘, х>.
Если, наконец, (х‘, х) = f (х) 4* Г (х*)> то поскольку f (х + ez) <х‘, х + ez) — f* (х‘), для всякого е > 0
и? следовательно,
f (х; z)>« z).
Предложение доказано.
Примеры функций и их субдифференциалов.
1.	Аффинная функция f (х) = (х*, х)'+ а субдифференцируема в любой точке х и df(x)={x*}. Вообще, субдифференциал функции, дифференцируемой по Гато в данной точке, содержит единственный элемент — производную Гато в этой точке.
§ 4.2. СУБДИФФЕРЕНЦИАЛ. ОСНОВНЫЕ ТЕОРЕМЫ
209.
Верно и обратное: если f — выпуклая функция, непрерывная в /точке х и субдифференциал df(x) содержит единственный элемент х*, то f дифференцируема по Гато в точке х и f'r (х) = х*. В самом деле, в силу предложения 4 из § 4.1 функция f'(x; •) непрерывна и, следовательно, замкнута. Поэтому
f'(х; г) = (Г (х; •))“ (г) = sup {<г\ г} |г* <= df (х)] = (х‘, z), что по определению означает, что f'r (х) = х\
2.	Субдифференциал индикаторной функции б(-|Л) в точке х мы вычислили в § 0.3, он оказался равным конусу опорных функционалов множества А в этой точке:
56(x|A)==Af(x|A)={x*er |<х*, z—х><0, Vze= Л}.
Если К — конус, то N (01 К) = К° — полярный конус; если М — линейное многообразие, параллельное подпространству L, то N(x\M) — L1 — аннулятор L для всякой точки х^М (ср. с п. 3.3.1, пример 2).
3.	Пусть f — однородная выпуклая функция и х =И= 0. Тогда df (х) = {х* е df (0) | f (х) = (х*, х)}. Это сразу следует из предложения 1 § 4.1 и утверждения в) предложения 1.
4.	Субдифференциал нормы в банаховом пространстве мы вычислили в § 0.3:
Г {х’е Л”|||х’||= 1, <х‘, х) = ||х|Ц, если х#=0, I В‘(0, 1)=={х’<=Г |||х‘||< 1}, если х = 0.
В § 4.5 мы вычислим субдифференциалы и других функций.
В этом параграфе мы основное внимание уделяем субдифференциалам выпуклых функций. Аналогичные результаты для невыпуклых, но субдифференцируемых функций будут получены в § 4.4.
Из определения прямо следует, что функция f может быть субдифференцируема только в точках множества dom f. При этом, если f выпукла и субдифференцируема в некоторой точке х, то f — собственная функция, f* — тоже собственная функция и df(x)cz dom f*. Далее, поскольку индикаторная функция субдифференциала сопряжена с производной по направлениям, субдиффе
210
ГЛ._ 4. локальный выпуклый анализ
ренциал — выпуклое и слабо* замкнутое множество в силу предложения 2 из § 3.3. Заметим еще, что в силу теоремы Фенхеля — Моро выпуклая однородная функция субдифференцируейа в нуле тогда и только тогда, когда она полунепрерывна снизу в нуле. Действительно, в этом случае замыкание функции f в нуле равно нулю. Поэтому f (из-за однородности) не может принимать значения —оо ни в одной точке, а это, в свою очередь, означает, что f*(x*)— собственная функция и dom/*=/=.
0. Отсюда следует
Предложение 2. Выпуклая собственная функция f субдифференцируема в точке х <= dom f тогда и только тогда, когда ее производная по направлениям в этой точке полунепрерывна снизу в нуле.
Пр едложение 3. Пусть f(x)—выпуклая собственная функция, непрерывная в точке Хо. Тогда ее субдифференциал df(x0) не пуст и ограничен в слабой* топологии.
Доказательство. Согласно предложению 4 из §4.1. функция f(xo; •) непрерывна на X. Из предыдущего предложения следует, что df(xo)#=0. Далее для всякого х е X
sup «х*, х) |х* е df (х0)} = f (х0, х) < оо, что по определению означает ограниченность множества df(xo) в слабой* топологии пространства X*.
Замечание. На самом деле, в условиях предложения 3 множество df(x0) слабо* компактно, но мы не будем этим пользоваться.
Отметим в заключение три очевидных формулы, ко-, торые полезно иметь в виду:
если ф (х) = f (х + х0), то
д<р (х) = df (х + хй)-,
если ф(х) —Af(x), где А > 0, то
d<f(x) = hdf (х);
если ф (х) = f (Ах), где % > 0, то
5ф (х) == A df (Ах).
§ 4.2. СУБДИФФЕРЕНЦИАЛ. ОСНОВНЫЕ ТЕОРЕМЫ
211
4.2.2. Основные теоремы о субдифференциалах. Эти теоремы позволяют вычислять субдифференциалы функций, получающихся в результате некоторых операций, через субдифференциалы исходных функций. Поскольку субдифференциал связан с локальным поведением функции, такие теоремы, конечно, могут существовать только для локальных операций.
Теорема 1. Пусть flf ..., fn — выпуклые собственные функции на X. Тогда для всякого х<=Х
dfj(x)+ ... + dfn (х) с д (f! 4- ... +f„)(x).
Если же в некоторой точке х е (dom /ч) А ... П (domfn) все функции ..., fn, за исключением, возможно, одной, непрерывны, то
ал(х)+ ... +^„(х) = <9(Л+ ... +м(х)	(1)
для всех х е X.
Это теорема Моро — Рокафеллара, доказанная нами в § 0.3. Мы сейчас приведем другое доказательство этой теоремы, связанное с тем определением субдифференциала, которое было дано в начале параграфа.
Доказательство. Проверка первого утверждения теоремы не представляет труда, и мы не будем делать это заново. Второе утверждение, как и в § 0.3, достаточно доказать лишь для случая п = 2.
Итак, пусть f 1 и f2 — выпуклые собственные функции на X и одна из них, скажем, ft, непрерывна в некоторой точке х, в которой ft конечна. Если д (fi + f2) (х) = 0, то равенство (1) следует из первой части теоремы. Пусть d(fi + f2)(x)=/= 0 и x*(=d(fi + f2)(x). Тогда хе е dom (fi + f2) — (dom f^ A (dom f2). В силу предложения 4 из § 4.1 функция ft(x; •) непрерывна в точке х — х. С другой стороны, f2(x; х—x)^f2(x) — f2(x) < оо, т. е. х—х е domft(x; •). Таким образом, нам достаточно проверить, что f'2(x; •)—собственная функция, ибо в этом случае теорема 1 из § 3.4, примененная к функциям f[(x; •) и f2(x\ •), дает
df, (х)df2 (х) = dom (х; • ))* + dom (% (х; •))* =
= dom (ft + f2y (х; •))* = <? ft + /2) (*)•
212
ГЛ, 4. ЛОКАЛЬНЫЙ ВЫПУКЛЫЙ АНАЛИЗ
Предположим, что f'2(x; z—х) —— оо для некоторой точки zeX. Тогда при достаточно малом А > 0 точка у = х + A (z—х) принадлежит dom f2 и f2 (х, у — х) = — оо (из-за однородности f2 (х; •)). Для всякого 0 а 1 положим х(а) = ах-{-(1—а) у. Тогда x(a)edom/2 и при а, достаточно близких к единице, х (а) е dom flt поскольку х s int (dom /,). Но тогда
— оо < <х‘, х(а) —	+ /2)'(х; х(а) —х) =
= f{ (х> х (а) — х) + f2 (х; х (а) — х)
^/{(х;х(а) — х)-|-а/£(х; х—х) + (1 —a)f'2(x; у—х) — — оо.
Противоречие доказывает теорему.
Теорема 2. Пусть Л: X —»• Y — непрерывный линейный оператор. Тогда, если f — функция на Y, то для всякой точки х е X
Л* df (Лх) <= д (/Л) (х).
Если же функция f выпукла и непрерывна в некоторой точке, принадлежащей множеству 1mA, го для всех хеХ
Л‘ df (Ax) = d(fA)(x).
Доказательство. Включение
Л* df (Ах) cz д (fA) (х)
сразу следует из определений. Поэтому теорема справедлива, если d(fA)(x)—0. Предложим теперь, что f выпукла и непрерывна в точке Лх, хе А', и что д(/Л)(х)=#0. Очевидно, (/Л)'(х; z) =f'(Ax\ Az). В силу предложения 4 из § 4.1 функция /'(Лх; •) непрерывна в точке Л(х- х), принадлежащей множеству 1mA. Применяя к функции /'(Лх; •) теорему 3 из § 3.4, получаем
<? (/Л) (х) = <?(/'(Лх; -)Л)(0) =
= Л* df' (Ах-, 0) = Л* df (Лх)
Теорема доказана.
Теорема 3. Пусть S — компактное топологическое пространство и f(s,x) — функция на S\X, выпуклая по х при каждом s е S и полунепрерывная сверху по s
§ 4.2. СУБДИФФЕРЕНЦИАЛ. ОСНОВНЫЕ ТЕОРЕМЫ
213
при каждом х X. Положим
f (X) = sup f (s, х); So (х) = {s <= S | f (s, x) = f (x)}.
Тогда, каково бы ни было х е X, conv/ (J dfs(x)\a:df(x). \s G= So (x)	/
Если же при всяком seS функция x->f(s,x) непрерывна в точке л'о, то
conv/ (J dfs(x0)] = df(x0) \s е So (Хо)	/
(где через fs(-) обозначены функции на X, определенные равенствами fs(x)= f(s,x), а замыкание берется в слабой* топологии пространства X*).
Из этой теоремы, конечно, следует соответствующий результат о субдифференциале максимума двух функций.
Доказательство. Функция f(x) выпукла как верхняя грань семейства! выпуклых функций. Если sgSq(x) к х* ^.dfs(x), то
(х‘, z — x)<f(s, z) — f(s, х)</(г) —f(x),
т. е. x*^df(x). Таким образом, объединение множеств dfs(x) по всем s^Sq(x) принадлежит df(x), а поскольку последнее множество выпукло и слабо * замкнуто, то и
Q = conv / (J dfs(хЙ cz df (х). \sf=S0(x)	/
Предположим теперь, что функция f(s, х) непрерывна по х в точке Хо при всех s. Тогда д/(хо)=И= 0, поскольку функция s—>f(s, хо) конечна и полунепрерывна сверху, т. е. So(xo)=# 0, и все множества dfs(xo) тоже не пусты в силу предложения 3. Предположим, что Q^df(xo), т. е. существует x*^df(xQ), не принадлежащий множеству Q. Пространство, сопряженное с пространством X*, наделенным слабой* топологией, есть X. Так как множество Q выпукло и слабо * замкнуто, то из второй теоремы отделимости (теорема 2 из § 3.1) следует существование такого х е X, х У= 0, что
<х*, х) sup {(г*, х) | z* ее Q) + е, 8 > 0.	(2)
214
ГЛ, 4. ЛОКАЛЬНЫЙ ВЫПУКЛЫЙ АНАЛИЗ
Без г ограничения общности можно считать, что f(xo4-x)<oo. Действительно, поскольку функции fs(x) непрерывны в точке х0, при всяком se S можно указать такое Z(s)>0, что fs(xo + Z(s)x)^ fs(x0) + 1. Из-за полунепрерывности функции f по s множества
U(s) = {1^S\f& xo + %(s)x)<f(Xo) + 2} открыты в S и (J U (s) = S. Поскольку S — компакт, s
мы можем выбрать точки $]........sn так, чтобы мно-
жества £/(«]), ..., U(sn) по-прежнему покрывали S. Тогда X = min [%(sO, ...,%(«„)}> О и f(s, х0 + Ах) < <f(xo) + 2. Заменяя, если нужно, х на Ах, получим требуемое.
Пусть 0<Z< 1. Тогда x0 + /xedomf. Выберем точку s(e S таким образом, чтобы f (st, х0 + tx) = = /(х0 + /х). В силу (2)
у (х0 + fx) - f (х0) sup ху |2. е q) + 8
и по неравенству Йенсена
(1 — 0 f (st, х0) + tf (sit х0 4- х) > f (St, Х0 + tx) = f (х0 + tx), откуда
(1 — t) f (st, Xo) > f (x0 + tx) — tf (St, XQ + x) >
> f (Xo + tx) — tf (x0 + x).
Из этого неравенства при /->0 следует, что
f (х0) > lim f (st, Xo) > f (*o).	(3)
/->0
Пусть s0 — предельная точка множества {sj. Тогда из (3) в силу полунепрерывности сверху функции f по s можно извлечь, что f(s0, x0) — f(xQ). Имеем
f (st> хо + ^х) f (sr *о)	f (*о)
t	t
f' (ХО; X) >
><х’, х> > sup {<z\ х) |z* е= dfSo(x0)} +е=/Цх0; x)-f-e. (4) Выберем tf столь малым, чтобы
f (Sq, Хо + /1Х) f (So, Хо) — t, /„ . „\ । ®
_	^„(5). Х)-Г~2- W
§ 4.2. СУБДИФФЕРЕНЦИАЛ. ОСНОВНЫЕ ТЕОРЕМЫ
215
Тогда при 0 < t < получаем, используя (4) и (5),
Xf (st, х0 + М + (1 - -£) f (st, х0) >
> f (Sp Хо + tx^f (st, Xo) + t (Xfl, X) + 8] >
£ /с v \ I / Г *o + ^jX) — f ($q, Xp) i _8_1
I \st> xo) i 1 L	‘ 2 J
ИЛИ
f(St, Xo + ^lx)^ f (Sq, Xq + t{x) + f (sif Xq)—f(SQ9 Xq)
Так как по доказанному lim f (sti xQ) = f(sQi x0), to t-»o
lim f (st, x0 + ^x) > f (s0, x0 + tix) + M/2. /->0
Полученное неравенство показывает, что функция 5 —► f (s, Хо + /ix) не является полунепрерывной сверху по s в точке So, в противоречии с условиями теоремы. Таким образом, предположение о том, что Q#=df(xo), оказалось ошибочным. Теорема доказана.
4.2.3. Субдифференциалы выпуклых функций в R".
Предложение 4. Пусть f — выпуклая собственная функция на Rn. Тогда f субдифференцируема во всякой относительно внутренней точке множества dom f.
Доказательство. Из теоремы 3 § 3.5 и из предложения 4 §4.1 следует, что при xeri(domf) функция f'(x\ •) конечна на подпространстве aff(domf)—х. Поэтому в силу той же теоремы 3 из § 3.5 (f'(x\ •))* — собственная функция, т. е. д/(х)#=0. Предложение доказано.
С помощью теоремы Каратеодори можно доказать усиленный вариант теоремы 3.
Теорема 4 (теорема об очистке). Если в условиях второй части теоремы 3 X = Rn, то каждый элемент У^д[(хо) может быть представлен в виде
У = ЩУ\ + ... + агУ„
где г < п + 1 и г
2 а. = 1; а, > 0, yt е dfs. (х0), st <= So (х0), i = 1,'..., г.
216
ГЛ. 4. ЛОКАЛЬНЫЙ ВЫПУКЛЫЙ АНАЛИЗ
Доказательство. Нам достаточно проверить, что множество Р= (J dfs(xQ) ограничено и замкнуто.
sgS0(x0)	____
Тогда в силу следствия 2 теоремы 1 из § 3.5 convP = — conv Р.
Из доказательства теоремы 3 следует, что Vx найдется X > 0 такое, что Xq + \х е dom f. Поэтому domf'(xo; •)= Rn и, так как f'(xQ\ •)—собственная выпуклая функция, она непрерывна согласно теореме 3 из § 3.5. Из предложения 3 следует теперь, что субдифференциал д/(хо) ограничен, а значит, и множество Р, содержащееся в df(xo), ограничено. Осталось проверить замкнутость множества Р. Пусть последовательность 2i, z2, ... элементов множества Р сходится к некоторому z:
Zk е Sk (Хо)’ Sk е 50 (хо).
Посколку множество So(xo) компактно, последовательность 5i, s2, ... имеет предельную точку so^5(xo). Так как функция f полунепрерывна сверху по s, для любого X Е Rn
f (s0> х) — f ($0, х0) = f (s0, x) — f (x0) >
>lim f (sk, x)—f(x0) = lim [f (sk, x) — f (sk, x0)]> A-»OO	&->oo
lim (zk |x — x0) = (z\x — x0), k-><x>
т. e. 2Е(?Цх0)сР. Теорема доказана.
§ 4.3. Конусы опорных функционалов
Напомним (см. § 0.3), что конусом опорных функционалов, или нормальным конусом выпуклого множества А в точке х е Л называется множество
N(x\A) = {х* е X* |<х*, z — х)< 0, Уг е Л),
совпадающее с субдифференциалом индикаторной функции б(-|Л) в точке х. Конусы опорных функционалов — один из важнейших классов субдифференциалов. В частности, в их терминах естественно формулируются условия непересечения выпуклых множеств,
§ 4.3. КОНУСЫ ОПОРНЫХ ФУНКЦИОНАЛОВ
217
лежащие в основе большинства необходимых условий экстремума.
Предложение 1. Пусть До, Дь ..., Ап— выпуклые множества в X, До A (int ДО А ... A (int Ап) =^= 0 и д = До А ... П Ап, Тогда для всякой точки хе Л
N(x\A) = N(x\A^ + ... +П(х\Ап).
Другими словами, нормальный конус пересечения множеств равен сумме нормальных конусов этих множеств. Доказательство. По условию 6(.|Д) =
= 6(- |Д0) + ... + б(- |Дп) и функции 6(-|Д1) непрерывны в точках множеств intДг-, i= 1, ...» п. Требуемый результат следует теперь из теоремы 1 предыдущего параграфа.
Предложение 2. Пусть f — выпуклая собственная функция на X, непрерывная в точке х0. Предположим, что для некоторого х^ справедливо неравенство f(xi)< f(xo)= ао. Тогда конус опорных функционалов множества в точке xQ совпадает с конусом Kdfix^ порожденным субдифференциалом функции f в точке xQ:
N (Xq\2> aof) = Kof (x0).
Доказательство. Обозначим для краткости
Д = ад={хеХ|Нх)<а0}.
Если x*ed/(x0), то {х\ х — х^^Цх)—f(xo)^O для всякого хе Л, т. е.
^f(Xo)c=jV(xoM).
Пусть теперь х*е#(х0|Д), х* =# 0. Из определении отсюда сразу следует, что линейное многообразие
Ж={(а, x)eRX^I« = f(4 « х —хо) = О}
не пересекается с int epi f. По первой теореме отделимости существует гиперплоскость, содержащая Ж и не пересекающая int epi f. Эта гиперплоскость не может быть вертикальна (т. е. задаваться уравнением (z*,x) = c) в силу того, что f непрерывна в точке х0. Значит, она задается уравнением а={у*,х — х0)+ + f(xo). Из того, что эта гиперплоскость содержит 5^, следует, что у* = ух*, а из того, что она опорна к epiвытекает, что z/*e^(x0). Предложение доказано.
218
ГЛ, 4. локальный выпуклый анализ
Предложение 3. Пусть Ао, ..., Ап — выпуклые множества, int Ар^ф при /=1, ..., п и А—Ло Л ... f| Ап, х0^А. Тогда следующие утверждения эквивалентны'.
а)	Ло П (int ЛОЛ ... Л (int Л„) = 0;.
б)	существуют функционалы x'^.N (х01 Лг), I =• = О, .... п, не равные одновременно нулю и такие, что
хоxi 4* ... -|-хл = 0.
Доказательство. Пусть выполнено а). Тогда существует такой набор индексов q...ir (l^r^n), что
(int Л^Л ••• Л (int Л<г)^0,
ЛоЛ(intЛ,,)Л ... Л(intЛ/г)=0.
Положим В = Л^ Л ••• Л Air. Тогда int В = (int Л/J П • • • ... Л (int Л/г) и, следовательно, Ло Л (int В) = 0. По первой теореме отделимости (теорема 1 из § 3.1) множества Ло и В можно разделить ненулевым линейным функционалом Хо е X*, т. е.
<xS, х)<<хг, у}	(О
для всех х е Ло, у е В. Поскольку х0 е Ло Л В, отсюда следует, что Xq&V (х01 Ло), — xo^N (х0 |В). В силу предложения 1 N (х0 |В) = N(x01 Л/() 4- ... -j- N (х01 Л<г). Поэтому существуют такие x’ft еУ(ха| Л^), k — 1, .... г, что —хо = х*(4- ... 4-*1г. Полагая xJ = O при i ф ik, приходим к б).
Наоборот, пусть выполнено б). По условию хотя бы один из функционалов х$.....х„, например х<, отличен
от нуля. Положим С — Ло П Л1Л • • • П Ai-[ Л Л/+1Л ... Л Лга. Если i = 0 и intC=0, то условие а), очевидно, выполнено. В ицом случае либо пДЛ/^ 0, либо intC=/=0. Имеем:
— Х/ = Хо4" ... 4“ x*i-l + x*i+l 4" ... Атхп^
е N (х01 Ло) + ... 4- N (х01 Лг_[) + N (х01Л/+1) 4- ...
... 4* N (х01 Лп) cz AZ (х01 С).
Отсюда следует, что функционал х/ разделяет Л; и С, и значит, внутренность одного из этих множеств не мо
§ 4.4. ЛОКАЛЬНО ВЫПУКЛЫЕ ФУНКЦИИ
219
жет пересекаться с другим, т. е. справедливо утвержде-ние а).
Доказанным результат можно обобщить следующим образом.
Предложение 4. Пусть До........Ап— непустые
выпуклые подмножества пространства X и int Д,- #= 0 при i=l, п. Тогда До Л (int Д1) П ... П (int Ап) — 0 в том и только том случае, когда существуют линейные функционалы хо, ..х*п, не равные одновременно нулю и такие, что
Хо + ... + х*п = 0,	(2)
5(4|До)+ ... +*(4|Д„)<0	(3)
(где $(• |Д) — опорная функция множества Д).
Доказательство. Простой подсчет показывает, что из (2) и (3) следует, что До Г) (int Д1) Л ... ... Л (int Дп) = 0. Наоборот, если выполнено последнее соотношение, мы, рассуждая, как при доказательстве предыдущего предложения, придем к неравенству (1), из которого следует, что
$ (хо | До) + s (— Хо | В)< 0.
Но
s(-x5|B) = S‘(- |B)(-x5)=[id(. |Д/Й)') (-хо). \£=1 /
Теорема 1 из § 3.4 влечет теперь существование таких функционалов х|р х}г из X*, что
X/j + ... + x*ir = — Xq,
s (-Л I В) = 2 б- (	(«У = 2 S № I лу.
Полагая снова xj = О при ik, k = 1, ..., г, получаем требуемое.
§ 4.4. Локально выпуклые функции
4.4.1. Определения и примеры. Если выпуклая функция непрерывна в некоторой точке, то ее производная по направлениям непрерывна в этой точке (предложение 4, § 4.1) и, следовательно, полностью определяется суб-Дифференциалом функции,в этой точке (предложение 1,
220
ГЛ., 4. ЛОКАЛЬНЫЙ ВЫПУКЛЫЙ АНАЛИЗ
§ 4.1). С другой стороны, как следует из определения, субдифференциалом могут, вообще говоря, обладать не только выпуклые функции. Естественно попытаться описать тот класс функций, локальное поведение которых полностью характеризуется их субдифференциалом.
Пусть, как обычно, X — отделимое локально выпуклое линейное топологическое пространство. Скажем, что функция f, определенная на X, локально выпукла в точке х, если ее производная по направлениям в этой точке существует и выпукла. Пусть У— другое отделимое локально выпуклое линейное топологическое пространство и G: X -> У. Скажем, что отображение G дифференцируемо по направлению х в точке х0, если существует предел
G'(х0; х) = lim ° (x° + Xx).~G(х°> .
JLJzft	А
Мы будем говорить, что отображение G равномерно дифференцируемо по направлению х в точке х0, если для всякой окрестности нуля V cz У найдется окрестность U cz X точки х и число Zo > 0 такие, что
9	_ G' (Xoi х) е V,	(1)
А
лишь только 2G У и 0 < Z < Ао- (Заметим, кстати, что отображение G: X —► У, имеющее в точке Хо первую вариацию 6G(x0; х), дифференцируемо в этой точке по всем направлениям и Gz(x0; х) = 6G(xo; х).)
Если отображение G равномерно дифференцируемо по каждому направлению в точке Хо, то, какова бы ни была фиксированная точка х, для всякой окрестности нуля V cz У найдется такая окрестность U cz X точки х, что
G' (хо; z) — G' (х0; х) 6= V
для всех z е U.
Таким образом, если дифференцируемо по всем производная отображения прерывное отображение X
отображение G равномерно направлениям в точке х0, то G по направлениям есть не-
J У. Z
§ 4.4. ЛОКАЛЬНО ВЫПУКЛЫЕ ФУНКЦИИ
221
функцию f, определенную на X, мы будем называть регулярно локально выпуклой в точке х, если она локально выпукла и равномерно дифференцируема по всем направлениям в этой точке. Таким образом, производная по направлениям в точке х функции, регулярно локально выпуклой в этой точке, — непрерывная выпуклая функция.
Мы покажем сейчас, что класс регулярно локально выпуклых функций достаточно широк. Он включает, в частности, непрерывные выпуклые функции и функции, дифференцируемые по Фреше.
Предложение 1. Выпуклая функция f регулярно локально выпукла в точке Хо тогда и только тогда, когда она непрерывна в этой точке.
Доказательство. Если функция f регулярно локально выпукла в точке х0, то, полагая в определении равномерной дифференцируемости х = О, получаем, что f непрерывна в точке х0. Пусть, наоборот, f непрерывна в точке Хо. Поскольку f — выпуклая функция, нам достаточно проверить, что она равномерно дифференцируема по любому направлению. Другими словами, нам нужно проверить, что каков бы ни был вектор х е X, для всякого 8 > 0 найдутся окрестность U cz X точки х и число Ао > 0 такие, что
| f(x0 + kz)-f(x0)  (Хо. | < 8
для всех ге1/и всех 0 < X < Хо. Так как функция f непрерывна в точке х0, то она непрерывна и в некоторой ее окрестности t/0 (теорема 1, § 3.2). Выберем число Хо так, чтобы, во-первых, Хо + ХоХ cz Uo и, во-вторых,
f (хр + Хох) — f (х0) _ г, ,	х)< —
Хр	’	2
Так как х0 + Хох е Uo, функция f непрерывна в точке Хо 4- Хох. Поэтому можно указать такую окрестность U точки X, что
f (х0 + Xoz) — f (х0 + Хрх) . е Хр	^2
Для всех г е U. Без ограничения общности можно считать, что множество U симметрично относительно точки
222
ГЛ. 4. ЛОКАЛЬНЫЙ ВЫПУКЛЫЙ АНАЛИЗ
х, т. е. что вместе с каждой точкой z оно содержит и точку у = 2х — z, так что х = Vo (*/ + z), иначе можно вместо (7 взять (U — х)П(—t/ + x)+x- Если z е U, О <С К <. Хо, то
f (х0 + kz) — f (х0) f(x0 + Xoz) — f (х0)
X	Xp
(см. формулу (1) из § 4.1). Поэтому при z е U, 0 f (x0	&Z) f (x0) С/ / ,	\
'0
X
f (xp ~F" Xpz) f (xp) (Xq* x)
Xp
f(Xo + M)-f(Xo)  f, (Xo. x) + | < 8,
Хэ
Далее, если z^U9 то y = 2x— z<=U и 2f Vo + f (x0 + Xz) + f (xq + Xr/), откуда (так как Xf' (x0, x) f (x0 + Xx) — f (x0)) у / v f (x0 + Xz) — f (x0) f (x0 + Xx) — f (x0 + Xz) I Ho, X)	£
f (Xq + X#) — f (x0 + Xx) f (x0 + ky) — f (x0) e, , X
X
X
Таким образом, при zet/ и 0<Л<Л0
+ w	x)]<s.
Предложение доказано.
Предложение 2. Пусть Хи Y — банаховы пространства и отображение G: X дифференцируемо по Фреше в точке х. Тогда оно равномерно дифференцируемо по каждому направлению в этой точке. В частности, если f — функция, определенная на банаховом пространстве X и дифференцируемая по Фреше в точке х, то она регулярно локально выпукла в этой точке.
Доказательство следует сразу из определений.
4.4.2. Основные теоремы о локально выпуклых функциях. Мы покажем сейчас, что класс локально выпуклых функций устойчив относительно тех же локальных операций, что и класс выпуклых функций. Поэтому
§ 4.4. ЛОКАЛЬНО ВЫПУКЛЫЕ функции
223
0 всех теоремах о субдифференциалах непрерывные выпуклые функции можно заменять на регулярно локально выпуклые.
Теорема 1. Пусть функции fi и f2 регулярно локально выпуклы в точке х. Тогда и их сумма fi + f2 регулярно локально выпукла в этой точке, +	-) — fi(x; -) + f'2(x; •)
и, следовательно, d(fl + f2)(x) = dfl(x) + df2(x).
Доказательство теоремы сразу следует из определений и из теоремы 1 § 4.2.
Теорема 2. Пусть отображение G: X-> У равномерно дифференцируемо по направлению Xi в точке xQ. Пусть, далее, g — функция на Y, равномерно дифференцируемая по направлению = G'(xo; Xi) в точке уо= G (хо). Положим
f(x) = g(G(x)).
Тогда функция f равномерно дифференцируема по направлению Xi в точке Хо и
ff(xQ: x1) = g'(f/o; #i) = g'(G(*o),	(х0; xj).
В частности, если в точке х0 отображение G дифференцируемо по Фреше, а функция g регулярно локально выпукла в точке у о — G(xo), то функция f регулярно локально выпукла в точке х0,
/' (х0; X]) = g' (у0; G' (х0) х) и
df (x0) = G'* (х0) dg(G(x0)).
Доказательство. Вторая часть теоремы, очевидно, является следствием первой и теоремы 2 из § 4.2. Пусть выполнены условия первой части теоремы. Тогда Для заданного е > 0 можно указать такие окрестность Ус У точки z/i и число 2ц > 0, что
I g(^+xg)-g fe), _ , I
224
ГЛ. 4. ЛОКАЛЬНЫЙ ВЫПУКЛЫЙ АНАЛИЗ
если у е V, 0 < А < Ai. Далее, в силу определения равномерной дифференцируемости, существует такая окрестность U с X точки Xi и такое число Аг > 0, что
G (х0 + Ах) — G (х0) у
лишь только хе {7, 0 < А < А2. Тогда при хе U и
О < А < Ао = min {A,b А2}
I f(xp + Xx)-f(x0) _ ,	11
| X------------------g \Уо> Ун —
_ I 8 (G (*o + Ax)) - g (y0)	, , J _
—	-------------g 4/o> Уд\ —
t/ 4- A &	"I" ^x^	&	0 (u }
g I У о • A--------------т--------------I — g \Уо)
—------------------------л-----------------------------g' У1)
поскольку V1 (G (x0 + Xx) — G (x0)) s V в силу выбора Xo и U. Отсюда следуют и равномерная дифференцируемость функции f, и утверждение теоремы относительно равенства для производных по направлениям. Теорема доказана.
Теорема 3. Пусть S — компактное топологическое пространство и f(s,x)— функция на SX%, непрерывная по s для всех х из некоторой окрестности точки Хо, а при каждом s g S равномерно дифференцируемая по всем направлениям в точке х0. Предположим, более того, что для всяких zeXu е>0 можно указать такие окрестность U точки z и число Хо > 0, что неравенство
|	+	Хр) 	| < е	(2)
выполняется при всех seS, у U, 0 < А < Ао (где, как и раньше, fs (х) — функция на X, определенная равенством fs(x) = f(s, х). Положим
f (х) — max f (s, х),
seS
S0=(seS|f(s, x0) = f(x0)}.
Тогда функция f равномерно дифференцируема по каждому направлению в точке х0 и
f'(.x0’ z) = max£(x0; z).
s £= So
§ 4.4. ЛОКАЛЬНО ВЫПУКЛЫЕ ФУНКЦИИ
225
Если же, в дополнение к сформулированным усло-биям, функции fs(-) локально выпуклы в точке х0 (и, значит, регулярно локально выпуклы), то и f регулярно локально выпукла и
df(x0) — convl (J dfs(x0)\.
\s е= S«	/
Доказательство. По условию, если z е X фиксировано, то f's(xoi г) есть предел равномерно сходящейся последовательности непрерывных на S функций (s) = п [f (s, х0 + г) — f (s, х0)).
Поэтому функция	z) непрерывна при вся-
ком 2G X. Отсюда следует, в частности, что вторая часть теоремы вытекает из первой и из теоремы 3 § 4.2.
С другой стороны, коль скоро функция	z)
непрерывна, она достигает максимума на всяком непустом замкнутом подмножестве пространства S, в частности, на множестве 50, которое не пусто и замкнуто из-за непрерывности функции f(s,x) по s и компактности пространства S.
Для доказательства теоремы нам нужно убедиться в том, что всякому z е X и всякому 8 > 0 можно поставить в соответствие окрестность U cz X точки z и число А,о > 0 таким образом, чтобы при всех у е U и О < Л < Ло выполнялось неравенство
I	 тах (Хо. 2) | < 8.
Итак, пусть 2Е X и е > 0 заданы. Тогда найдется окрестность W cz S множества So такая, что
sup £(х0; z)<max£(x0; z) + y.
SG W 4	' SG=S0 4	' Z
(Это сразу следует из непрерывности функции s~>^(xo; 2)-) С ДРУг°й стороны, точку Хо можно окружить такой окрестностью UQ, чтобы максимум функции f(s, х) по s при всяком х из этой окрестности достигался на множестве W. В самом деле,
max f (s, х0) = f (xQ) — а,
8 А. Д. Иоффе, В. М. Тихомиров<
226
ГЛ. 4. ЛОКАЛЬНЫЙ ВЫПУКЛЫЙ АНАЛИЗ
где а > 0. Полагая в (2) г = 0, убеждаемся в существовании такой окрестности Uq точки х0, для всех точек которой неравенство
| f (s, х) — f (s, х0) I < «/2
выполняется при всяком se S. Эта окрестность — искомая, так как при х е UQ и s ф W
f (s> х) < f (s, х0) + а/2 < f (х0) — а/2 < f (х),
т. е. максимум функции	х) достигается на W.
Выберем теперь в соответствии с (2) число А( > 0 и окрестность J71 точки z так, чтобы
|f(s, x0 + Ky)—f(s, х0) —А£(х0; z)|<A-|-
при у е Uх, 0 < А < Аь Пусть, наконец, А2 > 0 таково, что х0 + A2z е ий. Положим
Ao = min{Aq, А2), U — АГ1 [A2t/t П (Uo—х©)]-
Тогда U — непустая (поскольку zeU) окрестность точки z. Кроме того, если 0 < А < Ао и у ^U, то х0 + Ay е Uo. Поэтому для таких А и у
f (х0 + At/) = max f (s, x0 + ty) < ssW
< maxf(s, x0) + A sup f's(x0-, z) + A-|-<
< f (*0) + z К (xo’> 2) + Я-е, с одной стороны, и f (Xo + ^y) > ma* f (s, XO 4- Al/) > SESo
>max(f(s, x0) + Af'(x0; z) — A^) = <S Ez So '	'
= f (*o) + max f's (x0; z) — A-| — с другой. Следовательно,
I f (x0 + Ai/) — f (x0) — A max f's (x0; z) | < Ae,
лишь только у e U и ОСАСАо. Теорема доказана.
§ 4.4. ЛОКАЛЬНО ВЫПУКЛЫЕ ФУНКЦИИ
227
Замечание. Условия теоремы 3 заведомо выполняются, если, например, функция f'(s, х; y) — f's(x; у) непрерывна пб совокупности переменных при всех s g S, у X и х из некоторой окрестности точки х0. Действительно, пусть г е X и е > 0 заданы. Тогда функция ($, Л, У} f'(s>xo + Uh У) непрерывна в каждой точке вида (s, 0, г), и, используя компактность множества S, мы можем выбрать Zo > 0 и окрестность U точки z таким образом, чтобы неравенство
I f' (S, х0 + At/; z/) — f' (s, x0; z) | < e
выполнялось при всех s e S, 0	у e U. Без
ограничения общности можно считать, что все точки Хо + ty при 0 < Л < Ао, у е U принадлежат той окрестности точки Хо, в которой функция f'(s,x,y) непрерывна. Поэтому по формуле Ньютона — Лейбница
к
f (s, х0 + At/) = J f' (s, x0 + pt/, y) dy 4- f (s, x0) 0
и, следовательно,
f(s. xo + Ay)-f(s. x0)	Xo. 2)
*о4-1Ч/; y) — f' (s, XO; z)[dy.<e 0
для всех seS, 0 < К < Ло, y^U.
4.4.3.	Субдифференциалы и производные. В заключение параграфа мы кратко обсудим связь субдифференциалов и производных. Мы уже отмечали (см. пример 1 в § 4.2), что выпуклая (и, очевидно, регулярно локально выпуклая) функция дифференцируема по Гато в некоторой точке тогда и только тогда, когда ее субдифференциал в этой точке содержит ровно один элемент.
Таким образом, понятие субдифференциала обобщает понятие производной по Гато. В этой связи полезно отметить, что теоремы 1 и 2 являются обобщениями соответствующих теорем дифференциального исчисления. Именно, теорема 1 обобщает теорему о том,
8*
228
ГЛ. 4. ЛОКАЛЬНЫЙ ВЫПУКЛЫЙ АНАЛИЗ
что производная суммы функций равна сумме производи ных, а теорема 2 обобщает теорему о суперпозиции дифференцируемых отображений. Теорема о среднем тоже имеет «субдифференциальный» аналог, однако он нам нигде в дальнейшем не понадобится. С другой стороны, теорема 3 не имеет эквивалента в дифференциальном исчислении.
§ 4.5. Субдифференциалы некоторых функций
4.	5.1. Субдифференциалы норм. Субдифференциал нормы в абстрактном банаховом пространстве был вычислен в § 0.3:
Г {-V* е X' | II х* ||< 1},	если х = 0,
Iх II I {х*еГ III Г ||=1, <х‘, х) — ||х||}, если х=/=0.
Таким образом, в конкретных случаях сложности могут встретиться лишь при вычислении субдифференциалов в ненулевых точках. Для этого нужно описать множества всех функционалов х*, удовлетворяющих равенствам
IIX-11=1, <х\ х> = ||х||.	(1)
Мы не будем рассматривать здесь пространств, в которых норма дифференцируема в отличных от нуля точках, таких, как Lp (1 < р < оо) или гильбертово пространство. В этих случаях для вычисления субдифференциала нормы достаточно ее продифференцировать (см. п. 4.4.3).
1.	Субдифференциал нормы в L" ([/о, 6]). Напомним, что (£" ([/о, Л]))* = ^([^о, 6]), так что, если г/(-)еА", х( •)<=/.? и у( •) е д|| х( •) Ih, то равенства (1) означают следующее:
IIZ/(-)lloo = sup|z/(Z)l=I,
Л
<£/(•), х(-))=J(z/(o\x(t))dt= Ji
ffl	fo
Эти равенства могут выполняться тогда и только тогда, когда (за исключением некоторого множества меры нуль) y(t) = |х(/) |-1х(/) при х(/)#=0, y(t) произвола
§ 4.5. СУБДИФФЕРЕНЦИАЛЫ ФУНКЦИЙ
229
но, но не превосходит по модулю единицы при х (•) = 0. Таким образом, если х( •) =/= 0, то
£||х(-)И1 =	• )L= 1,
у (t) = I X (0 Г* X (t) при X (t) =£ о) .
В частности, норма в L\ дифференцируема по Гато в тех и только тех точках х(-), у которых мера множества {/eKo, ^]|х(0 — 0) равна нулю.
2.	Субдифференциал нормы в С (Т). Напомним (см. § 0.1), что пространство, сопряженное с С (Т), образовано всеми регулярными борелевскими мерами на Г и норма в этом пространстве задается равенством
Ии11=р||*|.
т
Таким образом, если х(-)еС(Г) и х(-)т^0, то субдифференциал <?||х(-) ||с образован теми и только теми мерами, которые удовлетворяют соотношениям
(2)
т
j х(0^ = ||х(-)1|.	(3)
т
Положим
T.t = {f€=T|x(O = K(-)ll),
Т* ={t <= Т |х(/) = -||х( •) ||}.
Множества Тх и Тх, очевидно, замкнуты.
Говорят, что борелевская мера ц сосредоточена на замкнутом множестве Л, если | р, | (В) = 0 для всякого борелевского множества В, не пересекающегося с Л.
Мы покажем сейчас, что мера ц удовлетворяет усло-вияхМ (2) и (3) тогда и только тогда, когда
J <^ + + J фГ = 1, т	т
мера рЛ сосредоточена на Т%, а мера р.” — на Г7.
230
ГЛ. 4. ЛОКАЛЬНЫЙ ВЫПУКЛЫЙ АНАЛИЗ
Написанное выше соотношение равносильно равенству (2). Поэтому нужно проверить лишь последнее утверждение. Имеем
II х (•) II — J X (0 dll = J х (t) d[i+ — | x (t) dll- < T	T	T
<l|x(-)llpn+ + llx(-)ll/^-=||x(.)l|. T	T
Таким образом, при выполнении условий (2) и (3)
Цх( •) II / dp+ = / Х(О dix+,	(4)
т т
— 1|х(-)|| J dii-= J x(t)dy~. т г
Если существует борелевское множество В, не имеющее общих точек с Тх и такое, что |	1 (В) = рЛ (В) > 0, то
/ x(0dp+<t[ |х(0 |#+ < J ||х( • )||ф+ + т	т	т+
х
+	/ Цх(-)|Мц+=||х(.)||/ dy+.
г\т+	т
Но это противоречит равенству в (4). Так же проверяется и соотношение (5).
3.	Субдифференциал нормы в А«([/о, 6]). Пространство Z-Хфо, 6]) сопряжено с L"([/o, 6]). С другой стороны, пространство, сопряженное с £« ([/о, А])» не совпадает с L} ф0, ZJ), однако последнее изометрически вкладывается в (l£([/01 6]))*. Нас будет интересовать следующий вопрос. Пусть х (•) <= В каком случае субдифференциал д||х( •) ||то содержит элементы из L" и как описать эти элементы? Если у (•) е ^<5||х(-)||ооП-^1\ то в соответствии с (1)
/, 1
J 10(01^=1, f (y(i) |х(0)Л = ||х( • )IL = sup|x(f) |.
t,	о	*
§ 4.5. СУБДИФФЕРЕНЦИАЛЫ ФУНКЦИЙ
231
Легко понять, что эти соотношения справедливы тогда и только тогда, когда выполняются следующие условия•
а)	множество Тх = {t (= Т| |x(f) | = Цх(-) ||«,} имеет положительную меру;
б)	sign z/(/) = sign х(/) почти всюду на Тх и y(t) — = 0 почти всюду вне Тх;
в)	Jiy(t)i^=i. to
4.5.2.	Субдифференциал функции f (х( • )) = maxx(/)» t
Пусть Т — компактное хаусдорфово пространство. Рассмотрим в пространстве С (Т) функцию
/(*(•)) = maxx(Z). teT
Эта функция, как легко видеть, выпукла и однородна. Субдифференциал df(O) образован теми регулярными мерами на Г, которые удовлетворяют условию
maxx(Z) Г x(t)dp для всех х(-)еС(Г).	(6)
Отсюда следует, что
J dp = 1 т
и что мера ц. неотрицательна. Действительно, в силу (6)
I х (0 dp	— шах (— х (0) = min х (t).
J	tesT	t<=T
Поэтому, если х (/) ^ О для всех t е Т, то и J х (t) dp	0.
т
Очевидно, что и наоборот, при выполнении этих условий соотношение (6) справедливо. Итак, субдифферен-Циал функции f в нуле мы вычислили. Если теперь х (•):/= 0, то (см. пример 3 из § 4.2)
df (х (•)) = f ц <= df (0) I f х (/) dp = max x (/) 1.
I	U	I
232
ГЛ. 4. ЛОКАЛЬНЫЙ ВЫПУКЛЫЙ АНАЛИЗ
Дословное повторение рассуждений, использованных нами при вычислении субдифференциала нормы в пространстве С (Г), позволяет сделать следующий вывод: субдифференциал функции f в точке х(-), отличной от нуля, образован неотрицательными борелевскими мерами на Г, имеющими единичную норму и сосредоточенными на множестве
Tx = {t<=T\x(t) = f(x (•))}.
4.5.3.	Субдифференциал функции g (*(.))== = max (t, х (t)). Пусть, как и выше, Т — компактное t
хаусдорфово пространство и ф(/,х): TXRn~*R— функция на Г X R”, непрерывная по совокупности переменных и непрерывно дифференцируемая по х при всяком /еГ Рассмотрим на СП(Т) функцию
g(x( • )) = тахф(/, х(0). t&T
Мы покажем сейчас, что субдифференциал функции g в точке х(-) содержит те и только те линейные функционалы х*, которые допускают представление
(х*, г (.)>== J (фх (/, X (0) IZ (0) du, т
где р — регулярная неотрицательная борелевская мера на Г, имеющая единичную норму и сосредоточенная на множестве Тх — {t Т| ф(/, х(/)) = g (х (•))}.
Рассмотрим отображение G: Сп(Т)-> С(Г), определенное соотношением
[G (х( •))](/) = ф (t, х(0), и функцию f на С(Т’), заданную формулой /(«/(•)) = max i/(0.
1еТ
Отображение G дифференцируемо по Фреше и >'
[G'(X( • ))Z( • )](0 = (фх(Л X (0)1 2(0)
(см. пример 5 в § 0.2). С другой стороны, f — выпуклая функция на С(Т) и f(z(-))^ 11г(-)||, т. е. f непрерывна. Таким образом, для вычисления субдифференциала
§ 4.5. СУБДИФФЕРЕНЦИАЛЫ ФУНКЦИЙ
233
функции g мы можем применить теорему 2 из § 4.4. Имеем
5g(x(.)) = G'’(x(.))^(G(x(-))).
Субдифференциал функции f мы вычислили в предыдущем пункте. Он образован всеми регулярными неотрицательными мерами на Т, имеющими единичную норму и сосредоточенными на множестве Тх. Осталось вычислить оператор, сопряженный с G'. По определению для всяких г(.)еО(Т),це(С(Г))‘
(?(•), G'‘(x(-))g> = <G'(x(-))2(.), ц) =
= f (gx(t, X(O)I z(i))dn, т
откуда и следует требуемый результат.
Комментарии к гл. 3 и 4. Теория выпуклых множеств ведет свое начало с работ Минковского [1], [2]. Эта теория изложена в монографиях Боннезена и Фенхеля [1], Валентайна (1], Рокафеллара [14] (гл. 1 и 2), Эгглстона [1].
Теория сопряженных функций началась с работ Фенхеля [1], [2], хотя преобразование Лежандра было определено еще в XVIII веке. Окончательное оформление выпуклого анализа произошло в 60-е годы после работ Бронстеда [1], Моро [1]—[5], Рокафеллара [1] и др. Наиболее полное изложение конечномерной теории содержится в монографии Рокафеллара [14], где имеются богатая библиография и подробные сведения исторического характера. Обзоры бесконечномерных результатов содержатся в лекциях Моро [9], Асплунда [1] и статье Иоффе и Тихомирова [3].
За пределами перечисленных работ находится теорема об очистке из § 4.2. Такого рода теоремы возникли в теории приближений, причем первый намек на подобный результат содержимся в статье Чебышева [1]. Варианты теоремы об очистке, близкие по форме к нашей, содержатся в работах Гольштейна [2], [4] и Пшеничного [4]. О дальнейших обобщениях см. работу Иоффе и Левина И], где имеются дополнительные ссылки на литературу.
Глава 5
ЛОКАЛЬНО ВЫПУКЛЫЕ ЗАДАЧИ
И ПРИНЦИП МАКСИМУМА
ДЛЯ ЗАДАЧ С ФАЗОВЫМИ ОГРАНИЧЕНИЯМИ
В этой главе мы продолжаем изучение необходимых условий экстремума, начатое в первой и второй главах. Задачи, рассмотренные в § 5.1, удовлетворяют более слабым условиям гладкости и выпуклости по сравнению с гладко-выпуклыми задачами из § 1.1. Теорема, доказанная в § 5.1, распространяет на эти задачи экстремальный принцип для гладко-выпуклых задач. С помощью этой теоремы в §§ 5.2, 5.3 доказывается принцип максимума Понтрягина для задач оптимального управления с фазовыми ограничениями. При первом чтении эту главу можно пропустить.
§ 5.1. Локально выпуклые задачи
5.1.1. Постановка задачи и формулировка основной теоремы. Пусть X и У — банаховы пространства, U — произвольное множество, fo, .... fn — функции на X\U и F: X \ U -»Y — отображение произведения X X U в У. В этом параграфе мы будем рассматривать задачи, по форме совпадающие с гладко-выпуклой задачей из § 1.1:
f0(x, u)->inf;	(1)
F(x, и) = 0,	(2)
ft (х, ц) < 0, i = 1, ..., п,	(3)
и е U.	(4)
В гл. 1 предполагалось, что участвующие в формулировке задачи функции и отображения удовлетворяют в окрестности экстремальной точки определенным условиям гладкости и выпуклости. Однако, сопоставляя доказательство экстремального принципа для гладковыпуклых задач с результатами, полученными в § 4.4, нетрудно заметить, что это доказательство останется без изменений и в случае, когда функции x-*fi(x,u) предполагаются не гладкими, а только регулярно локально выпуклыми. Более внимательный анализ дока-
§ 5.1. ЛОКАЛЬНО ВЫПУКЛЫЕ ЗАДАЧИ
235
зательства, данного в § 1.4, позволяет сделать вывод, что и условие выпуклости в формулировке экстремального принципа тоже может быть ослаблено. В этом параграфе доказывается теорема, обобщающая экстремальный принцип для гладко-выпуклых задач в указанных направлениях, а в §§ 5.2—5.3 извлекаются следствия из этой теоремы, относящиеся к задачам оптимального управления. Оказывается, что замена условия гладкости функций х —и) условием их регулярной локальной выпуклости позволяет распространить принцип максимума Понтрягина на задачи оптимального управления с ограничениями на фазовые координаты, а ослабление условия выпуклости позволяет дать доказательство принципа максимума, не использующее искусственных приемов типа замены времени.
Как обычно, нас будут интересовать необходимые условия локального минимума в задаче (1) — (4). Термин «локальный минимум» понимается здесь в том же смысле, что и в гл. 1: точка (х*, н*), удовлетворяющая условиям (2) — (4), называется точкой локального минимума в задаче (1) — (4), если для всякого х из некоторой окрестности точки х* и всякого u^U, удовлетворяющих тем же ограничениям (2) — (4), выполняется неравенство
/о К»	и).
Как и в гл. 1, рассмотрим функцию Лагранжа задачи (1) — (4)
S (х, и, Ао, ..., А„, у*) = 2 Wi (X, и) + {у', F (х, «)). 1=0
Если функции x-+fi(x, и) локально выпуклы, а отображение х —► F (х, и) дифференцируемо, то и функция Лагранжа локально выпукла по х. Через dxft и дх3? обозначаются, как обычно, субдифференциалы функций и Z как функций от х, а через f<(x, и\ z) и S?'(x, иДо, Хп, —их производные по направлению г в точке х. Символом в этом параграфе обозначается такой m-мерный симплекс в Rm:
Sm=|a = (ab ..., ат)еГ|а/>0,
236
ГЛ. 5. ЛОКАЛЬНО ВЫПУКЛЫЕ ЗАДАЧИ
Теорема 1. Пусть (х*, и*) — допустимый элемент в задаче (1) — (4). Предположим, что точка х* обладает такой окрестностью V, что
а)	при всяком u^U отображение x-+F(x,u) принадлежит классу Ci в точке х*;
а') при всяком и U функции х fi(x,u), i = 0, ... ..., п, непрерывны в окрестности V и регулярно локально выпуклы в точке х*;
б)	для всякого конечного набора точек и{, ит из U и всякого д > 0 существуют окрестность V' cz V (х* е У')» число е>0 п отображение v: V' X С/, обладающие следующими свойствами:
6j) v (х, 0) = и* для всех х е И',
б2	) для всяких х, х' из V' и а, а' из выполнены неравенства
||F(x, v (х, a)) — F(x', t)(x', а'))—Fx(x*, z/J(x—-х')— rn
- 2 («/ - «9 (F (*.> «9 - F K. «.))II <
x' 11+ S|a/ —«J |j, tn
fi (x, V (x, a)) — fi (x, ut) — 3 О/ (fi (x, Uf)—ft (x, u,)) <
— x.ll+SaJ, i = 0, 1.........n.
\	/=i	/
г Предположим, наконец, что
в) множество значений линейного оператора х->Fx(x*, и*)х имеет конечную коразмерность в Y.
Тогда, если (х#, и*) — точка локального минимума в задаче (1) — (4), то для задачи (1) — (4) выполнен принцип Лагранжа, т, е. найдутся не равные одновременно нулю множители Лагранжа %о 0, ..., Хп 0, у* е у* такие, что
0еа,2"(х., и,. I,....y) = F-^„ u,yj- +
i==0
• • •, У ) — min	A/q, .. •, у ),
ые U
^ifi(x„ «.) = 0,	1=1,
§ 5.1. ЛОКАЛЬНО ВЫПУКЛЫЕ ЗАДАЧИ
237
(Проверим, что эта теорема действительно обобщает теорему 3 из § 1.1. Условия в) в обеих теоремах одинаковы. При выполнении условия а) теоремы 3 из § 1.1 условия а) и а'), очевидно, выполняются. Наконец, условие б) теоремы 3 из § 1.1 влечет условие б): чтобы удостовериться в этом, достаточно выбрать v(x, а) так, чтобы выполнялись соотношения
т
F (х, v (х, а)) = F (х, w,) + 5 «/ (F (х, uj) — F (х, и,)),
т
fi (х, v (х, а)) < fi (х, и.) + 2 <*/ (fi (х, u^—fi (х, и,)),
и воспользоваться условием а).)
Доказательство теоремы строится по той же схеме, что и доказательство экстремального принципа для гладко-выпуклых задач (см. § 1.4). Положим, как и в § 1.4,
La= ImFx(x,, ut), В = Lo + convF(x„ U),
L = linB — линейная оболочка множества В.
Рассмотрим отдельно вырожденные и невырожденный случаи.
5.1.2. Вырожденные случаи. Вырожденные случаи исследуются дословно так же, как и в § 1.4. Если L =/= Y и у* — отличный от нуля элемент аннулятора подпространства L, то Ао = ... = Ап = 0, у* — искомые множители Лагранжа.
Если L = У, то из конечности codim Ц следует, что int В =7^0.
Этот факт был доказан в § 1.4. Если при этом О ф int В (очевидно, 0 е В) и у* — ненулевой элемент конуса N(Q\B), то снова Ао = ... = Ап = О, у* — искомые множители Лагранжа.
5.1.3. Невырожденный случай. Предположим теперь, что L = У и 0 е int В. Примем для определенности, что Л(х„н,) = 0 при 1 = 1, .... A, fi(x#, ы«)<0 при 1 = = k 4-1, ..., п, и рассмотрим множество С наборов (go, ...» уь, у) е Rft+1 X Для каждого из которых
238
ГЛ. 5. ЛОКАЛЬНО ВЫПУКЛЫЕ ЗАДАЧИ
найдутся такие х е X, me U, что
Fx(xt, m.)x + F(x., «)—F(x„ uj = y, f'i (*., x) + ft (*.> «) — ft «.) < P/» 1 = °> • • • > k-Так же, как и в § 1.4 показывается, что внутренность множества conv С не пуста и что для доказательства достаточно проверить, что 0 conv С.
Допустим, наоборот, что 0 е conv С. Покажем, что в этом случае точка (х*, и*) не может быть точкой локального минимума в задаче (1) — (4). Для доказательства последнего утверждения достаточно проверить, что если 0 е conv С, то найдутся векторы х е X, а = (аь ..., dm), dj > 0 и точки щ, ..., йт из U такие, что
рх (х„ и„) х + 5 ay (F (х., йу) — F (х„ и,)) = 0,	(5)
/=1
(/ т	\ \
тои й/)> = г> ® \/=1	//
т
f'i (х., и,} х) + s ay (fy (х,, йу) — fi (х„ и$ < 0,	(7)
I = 0, ..., k.
В самом деле, предположим, что соотношения (5) — (7) выполняются. Зафиксируем некоторое б > 0. Тогда по йь ..., йт и 6 можно выбрать окрестность V' точки х*, число е > 0 и отображение v. V' X (е2т) —» -* U, удовлетворяющие условию б). Обозначим для всякого a G R
а+ = max (а, 0), а~ = а — а+ = min (а, 0)
и для всякого а = (а[, affl)sR"
a+ = (ai+...ат)> а“ = а-а+=(ар..........а").
Тогда в окрестности точки (х*, 0) е X X Rm определено отображение в У, заданное формулой
т
ф (х, а) = F (х, V (х, а+)) + S af (F (х„ йу) — F (хф, и$.
Очевидно, Ф(х«, 0) = F(x*, и») — 0 (из-за условия 6i)) t
§ 5.1. ЛОКАЛЬНО ВЫПУКЛЫЕ ЗАДАЧИ
239
Обозначим, наконец, через Л линейный оператор из X X Rm в определенный следующим образом:
Л (х, а) = Fx (х,, и.) х + 2 «/ (F (х,, Uj) — F (х., и.)).
В силу условия б) для всяких (х, а) и (х', а') из области определения отображения Ф справедливо неравенство
|| ф (х, а) — Ф (х', а') — Л (х, а) + Л (х', а') || =
=|| F (х, v (х, а+)) — F (х', v (х', а/+)) — Fx (х„, и,) (х — х')—
т
VII+s।у (st
Положим
(Г	т
IIГ/1Г1 inf{||x|| + 21 а/1 Л(х, а) = у
I	/=1
Из определения оператора Л и из условия (6) следует, что 1тЛ= У. Кроме того, оператор Л, очевидно, непрерывен. Поэтому в силу леммы 3 из § 0.2 С (Л) < оо. Тогда, если б-С(Л)< V2, то согласно (8), отображение Ф и оператор Л удовлетворяют условиям обобщенной теоремы Люстерника из § 0.2.
Заметим теперь, что в силу (5) вектор (х, а), где а = (си, ..., ат), принадлежит ядру оператора Л. Поэтому при б-С(А)< V2 по обобщенной теореме Люстерника (см. § 0.2) существуют числа t > 0, К > 0 и отображения	—
f->(x(O, a{t))
отрезка [0, ?] в X X Rm такие, что
Ф (х, 4* tx + х it), ta-}- а (/)) = 0	(9)
240
ГЛ. 5. ЛОКАЛЬНО ВЫПУКЛЫЕ ЗАДАЧИ
при всех t е [0, /] и
IIX (01| + s | а, (0 |< АН Ф(х. + «, ta) ||. /=1
Из последнего неравенства в силу (5) и (8) следует, что
цх(он+ Si м) к
i=i
< КН ф(*. + tx, ta) — Ф (х„ 0) - /А (х, а) || <
<^Ц||х|| + 2 а/)- (Ю)
Поэтому, в частности, х(/)->0 и a(t)-+O при #->0.
Далее, в силу (7) существует такое число с > 0, что
при всех Z = 0, ..., k выполняются неравенства
т
fi (xt, ut\ х) + 2 й/ (fi (х., й{) — fi (x„ «,)) < — 4c.	(11)
Из-за регулярной локальной выпуклости функций x-*fi (х, и,) можно указать такое число а > 0, что при всех 0ст, ||х — х||^ст и 1 = 0, ..., п справедливы неравенства
fI (\ + tx> u.) < fi (х,> “,) +1 (f'i (\> х) + с).	(12)
Предположим теперь, что 6 > 0 было выбрано таким образом, чтобы, кроме неравенства б • С (А) < 1/2, оно удовлетворяло трем следующим условиям:
/<б(||х||+Sarmin(Й!......ат, ст), (13)
(б + /(б2)(||х|Ц-laz)<c,	(14)
Аб(||х|1+2 aj max | fi (х., us) — ft (х„ a,) | < с. (15) \ /=1 /
1 < / < /и
Такое 6 заведомо существует, так как по условию az > 0, I = 1, ..., т.
§ 5.1. ЛОКАЛЬНО ВЫПУКЛЫЕ ЗАДАЧИ
241
Из (10) и (13) сразу следует, что taj + at(t) >0 при вСех t е (0, /], так что
Ф (х, ta 4- а (/)) = F (х, v (х, ta-\- а (/)))>
откуда, полагая
х (0 = X, + tx + х (0, й (/) = v (X (0, ta + а (/)), получаем в силу (9)
Г(х(0, й(0) = 0.	(16)
С другой стороны, из второго неравенства в условии 6J следует, что при t е (0, /] и всех i = 0..........п
fi (х (/), й (0) < ft (х (0, «J +
+ 2 (ta} + а/ (0) (fi (х (0, mJ — fi (х (/), и,)) +
+ d(||/x + x(/)|| + 2(/az + a/(0)).	(17)
Согласно (10) и (13) /~’||х(0 ||«Са. Поэтому в силу (12) при 0 < t < min (F, ст)
fi (х (0, «J < fi (х., «J +1 (f'{ (x*, uj x) + c).	(18)
Сопоставляя далее соотношения (10), (13) и (15) и учитывая, что x(f)->-xt при t->0, получаем
2 (taj 4- at (0) (fz (х (t), Uj) — ft (x (0, «.)) =
= t 2 Й/ (fi (x., Uj) — fi (x„ mJ) 4-
4- 2 8/ (0 (fi (X., My) — fi (x„ ut)) 4-7=i
4-	2 (faj 4- ay (/)) [fi (x (0, йу) — f{ (x., mJ —
— fi(x(O, M.)4-fi(x„ m.)]<
“J-fi(x.’ м.))4-^4-о(0- (19)
242
ГЛ. 5. ЛОКАЛЬНО ВЫПУКЛЫЕ ЗАДАЧИ ,
Наконец, согласно (10) ц (14)
б(|| /х + х (I) || + 2 (fa} + а,- (/))] <
</(6 + Я62)( ||х||+ 2 a,]<tc.	(20)
\ /=1 /
Из (17)—(20) следуют неравенства
fi(x(t),	«,) + ф'Дхш, «; х) +
+ 3 й/ (fi (х,, й/) -— fi (х„ и,)) + Зс] + о (/),
справедливые при всех i — Q, 1..п, t е [0, min(?, а)].
Если k, то согласно (11),
fi (х (t), й (/)) < fi (х„ и,) —tc + o(t) (21)
при достаточно малых t. Если же k 4- 1 i п, то
lim fi (x(f), й (/)) < fi (xt, и.) < 0. t->Q
(22)
Соотношения (16), (21) и (22) показывают, что при достаточно малых />0 пара (x(t), il(t)) допустима в задаче (1)—(4) и fa(x(t), й(О)</о(х*, и*). Поскольку х(0~>х, при /->0, это значит, что точка (х„ и„'} не может быть точкой локального экстремума, в Противоречии с условием теоремы.
Таким образом, осталось проверить, что при OeconvC найдутся хеХ, ..., йт<= U и ai > 0, ..., ат > 0, удовлетворяющие соотношениям (5)—(7). Если OeconvC, то по определению существуют х0еX, uOi^U, ...
е I/ и числа уП| > 0, ...,	>0 такие, что
7 U По	1UI	7	1 *	7
m0
(х., «,) х0 + 2 Vo; (Р (х„ «0/) — Р (х., «.)) = о, (23)
то
f'i (х.> хо) + 2 Vo/ (fi (*., «о/) — fi (х., «.)) < о, (24)
1 = 0, ..., k.
§ 5.1. ЛОКАЛЬНО ВЫПУКЛЫЕ ЗАДАЧИ
243
Далее, коль скоро 0 е int В, как и в § 1.4, можно выбрать векторы %] е X и у}............ из convf(x>, U)
таким образом, чтобы линейная оболочка множества Lo и {У!...уд совпадала с У и
Fx (х., mJ х, + yt + ... + yi = 0.
Тогда для каждого номера s— 1.........I найдутся числа
у51 > 0....ysms > 0, в сумме равные единице, и точки
Mib ...» usms из U такие, что
ms
VsjF(x., usj). i=i
Поэтому линейная оболочка множества
W(x„ Usi) |s = 0, .... I; /=1, ..., ms} совпадает c Y и l ms
Fx (xt, u,) Xt + 5 S ysjF (x„ usl) = 0.	(25)
Наконец, воспользовавшись соотношением (24) и непрерывностью функций x—>f'.(x , и ; х), можно выбрать такое число 8>0, что при всех z = 0, 1, ..., k
f'i (* > u.‘> xo + exi) + 2 Yo/ (fi (x„ u0J) — ft (x„ mJ) + i—i
l ms
+ e 2 5 ysl (ft (x., us)) — fi (x., mJ) < 0.
S=1 /=1
При этом в силу (23) и (25)
Fx (х„ ut) (x0 4- ex J 4- 3 Vo/ (F (x„ m0 J — F (x,, mJ) 4-l ms
+ eS Sv5/(^(^> usj)—F(xt, mJ) = O.
S=1 /=1
Таким образом, набор, образованный вектором x04-exi, точками моь ..., щт1 из J7 и числами у01, ... •••’ YOmo» -еуц, •••» еугот^, обладает требуемыми свойствами (5) — (7). Теорема полностью доказана.
244
ГЛ. 5. ЛОКАЛЬНО ВЫПУКЛЫЕ ЗАДАЧИ
§ 5.2. Задачи оптимального управления
с фазовыми ограничениями
Этот параграф содержит формулировку и обсуждение принципа максимума Понтрягина для задач оптимального управления с фазовыми ограничениями. Доказательство приводится в следующем параграфе.
5.2.1. Формулировка принципа максимума. Рассмотрим сначала задачу оптимального управления с закрепленным временем:
Л
3 (%(•), «(•))= х, M)d/->inf; (1)
tl
х — ф (t, х, и),	(2)
и U,	(3)
Ло (х (/0)) = h{ (х (/,)) = 0,	(4)
gi(t, х(/))<0, t(=[t0, /J, i=l, k. (5)
На протяжении этого и следующего параграфов, за исключением специально оговариваемых случаев, предполагается, что функции
f: RXR"XRr->R, gi- RXR"->R
и отображения
Ф: RXR"XRr-*R", Az: Rrt->RS/ (Z=l, 2)
непрерывны и непрерывно дифференцируемы по х. (Как обычно, U cz Rr.) Подчеркнем, что, в отличие от § 2.4, дифференцируемости функций и отображений по t не требуется. В качестве допустимых управлений, как и в § 2.4, рассматриваются произвольные измеримые ограниченные вектор-функции, принимающие значения из множества U.
Как и в гл. 2, сформулируем принцип максимума Понтрягина в двух эквивалентных формах — гамильтоновой и лагранжевой. Введем снова функцию Понтрягина
Н (t, х, и, р, Ло) = (р |ф(/, х, u))—A,of(/, х, и)
и гамильтониан
х, р, Ло) = sup Я(/, х, w, р, Ло). не и
§ 5.2. ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ
245
Теорема 1 (принцип максимума в гамильтоновой форме). Пусть (х*(-),	—оптимальный управляе-
мый процесс в задаче (1)#— (5). Тогда существуют не равные одновременно нулю число Хо 0, векторы /0f= Rs°, /1 е RS1, вектор-функция р(-): [/0, Л]-* Rn и неотрицательные регулярные меры цг-, i = 1, ..., k, на [/о, /1], сосредоточенные соответственно на множествах
Л={/е=[/0,	*Л)) = 0},
такие, что
а)	вектор-функция р(-) является решением интегрального уравнения
p(t) = — h{ (хж(Л))/1 +
h	k tx
+ J" ^*(т,х,(т),а,(т),р(т), Л0)йт—2 j gix (т, x, (t)) dfii (6) t	i=l t
р(/о) = Ло*(х# (/o))Zo,
(7)
б)	почти при всех t из [70, ^i] выполняется равенство
Н (t, х, (0, щ (t), р (t), Хо) = (t, х* (/), р (О, М- (8)
Уравнение (6), как и в задаче без фазовых ограничений, называется сопряженным. Нетрудно видеть, что в случае, когда все меры цг- — нулевые, т. е., в частности, при отсутствии ограничений на фазовые координаты, это уравнение сводится к дифференциальному уравнению, полученному в гл. 2. В задачах без фазовых ограничений функция р(-)—абсолютно непрерывная функция. При наличии фазовых ограничений из-за присутствия в уравнении (6) интегралов по мерам рг функция р(-) может иметь разрывы. Однако она всегда является функцией ограниченной вариации, непрерывной слева (из-за регулярности мер цг).
В формулировке теоремы не исключается случай, когда одна или обе концевые точки оптимальной траектории лежат на фазовых ограничениях. Поэтому меры Pi могут содержать ненулевые массы, сосредоточенные
246
ГЛ. 5. ЛОКАЛЬНО ВЫПУКЛЫЕ ЗАДАЧИ
в точках to и ti. В этом случае, как следует из соотношений (6) и (7),
lim р (/) = — h{* (х, (6)) /1 + 1] gix (th х, (/,)) ((/J); (9) t->ti	i=l
t<ti
.	b
lim p (/) = h’o (x. (/«)) /о + 2 Six (to, x, О И<({/0})>	(10)
t->h	i=[
t>t0
t. e. p(t) может иметь разрыв в точке /0. Если же £;(/1..*.(О) < 0 и Si (to, х, (t0)) < 0, то точки /0 и /t не принадлежат ни одному из множеств Ть |л<({/о}) = = рг ((/,)) — 0, p(f) непрерывна в точках /0> ti и выполнено условие трансверсальности р (to) — ho (х, (to)) to» p(tl) = -h'lt (X. (/,))/!.
Сформулированная теорема представляет собой еще одну реализацию принципа Лагранжа. Если записать функцию Лагранжа задачи (1) — (5) в виде
S’ = (/olAo(x(/o))) + (/1|Ai(x(/I))) +
Л
+ ] [(р (/) IX (/) - ф (/, X (/), и (/))) + W (/, X (/), и (/))] dt +
k ti
+ J] J Si (i, x (/)) dph t = l f0
то окажется, что соотношения (6), (7) эквивалентны условию стационарности функции Лагранжа как функции переменного х(-) в точке х*(*), а равенство (8) есть, очевидно, необходимое и достаточное условие того, чтобы функция Лагранжа достигала минимума по и(-) в точке Читатель сможет убедиться в этом, анализируя доказательство теоремы 1 в следующем параграфе. Поэтому теорема 1 допускает такую эквивалентную формулировку.
Теорема Г (принцип максимума в лагранжевой форме). Пусть (х*( •),**♦(•))— оптимальный управляемый процесс в задаче (1) — (5). Тогда существуют та" кие не равные одновременно нулю число Хо 0, векторы lQ Rso, li е Rs‘, вектор-функция ограниченной в а-
§ 5.2. ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ
247
риации p(t) и неотрицательные регулярные меры цг-, f==: 1, .k, сосредоточенные на множествах 1\ соответственно, что
а)	при и(-)=«*(•) вектор-функция %*(•) является стационарной точкой функции Лагранжа как функции переменного х (•);
б)	при х (•) — х* (•) функция Лагранжа достигает абсолютного минимума по и(*) в точке и*(*).
5.2.2. Задачи с незакрепленным временем. Мы уже обращали внимание читателя на то обстоятельство, что теорема 1 (в отличие от результатов гл. 2) справедлива без предположения о дифференцируемости по времени функций и отображений, участвующих в формулировке задачи. В определенной степени это связано с тем, что предлагаемое в следующем параграфе доказательство использует иную технику. Существует, однако, и причина принципиального характера. Дело в том, что задачи с закрепленным временем естественно формулируются как задачи в некотором банаховом пространстве, именно, в том или ином пространстве функций на заданном отрезке. Что касается задачи с незакрепленным временем, то ее, по-видимому, нельзя сформулировать подобным образом без какого-либо ее преобразования, связанного, в частности, с тем, что время трактуется как фазовая координата. При этом требование дифференцируемости по времени становится неизбежным.
В гл. 2 для этой цели использовалась замена времени. Однако там она несла значительно большую нагрузку и с этим были связаны многие технические сложности в доказательстве. Если же принцип максимума для задач с закрепленным временем доказан, то замену времени можно использовать только для сведения общей задачи к задаче с закрепленным временем. Тогда она оказывается совершенно естественным приемом, применение которого не связано с какими-либо трудностями.
Покажем, как с помощью теоремы 1 можно (используя замену времени) получить принцип максимума для общей задачи оптимального управления;
л
| f(t, х, и) dt-> inf;	(Г)
f о
i = <p(f, х, и),	(2')
и е= U,	(3')
Ло (to, х (t0)) = hi (ib x (t^) = 0,	(4')
gi(t, x(t))^0, t e [/о, Л],	(5')
В отличие от задачи (1) — (5) моменты времени to и здесь уже не предполагаются фиксированными, w все
248
ГЛ. 5. ЛОКАЛЬНО ВЫПУКЛЫЕ ЗАДАЧИ
функции и отображения считаются непрерывно дифференцируемыми по времени.
Пусть управляемый процесс (**(•), м*(-)) определен на отрезке [/0*, 6*] и оптимален в задаче (!') — (5'). Введем новую независимую переменную т, меняющуюся на отрезке [0, 1], и рассмотрим такую систему уравнений:
W=v’ = У’	(И)
Если (/(т), у(х))—некоторое решение этой системы, соответствующее управлению (у(т), о>(т)), и при этом ^(т)>0, то t(x)—строго возрастающая непрерывная функция. Обратная ей функция, обозначим ее т(0, тоже непрерывна и возрастает. В этом случае x(t) = = y(x(t))—решение уравнения (2Z), соответствующее управлению u(t) = w(x{t)), и при этом
* (1) 1
I f (t, х (/), и (0) dt = J v (т) f (t (т), у (т), w (т)) dx. (12) <(0)	о
Так как у(т) всюду больше нуля, эти утверждения тривиальны. Наоборот, если x(f)—определенное на отрезке [Mi] решение уравнения (2Z), соответствующее управлению a(f), то
t{x) = tQ-{-(ti—tQ)x, y(x) = x(t(x))
— решение системы (11), соответствующее управлениям и(т)=/1 — /0, w(x) = u(t(x)), и при этом справедливо равенство (12).
Поэтому
СО =А>»+ (*!» — /о*)т, у, (т) = X, (t, (т)), у. (т) s V. = Л. — *о», W, (т) = и, (/, (т)) — оптимальный управляемый процесс в задаче
J vf(t, у, w)dT->inf;	(1")
о
= у> <2")
v > 0, w е U,	(3")
А» (/ (0), у (0)) = hx (t (1), у (1)) = 0,	(4")
^(т))<0, те[0, 1], i=l............k. (5")
§ 5.2. ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ
249
Это уже задача с закрепленным временем, и к ней применима теорема 1. Обозначим через Н функцию Понтрягина в задаче (1") —(5"):
Н (t, х, и, v, р, q, %0) =
= (р | П<р (t, х, и)) + qv —	(Z, х, и) —
= v(H(t, х, и, р, Ло) + <7), (13)
где Н — функция Понтрягина в задаче (Г) — (5'). Положим далее
Az={t<=[0, l]|g£(m Z/.(t)) = O}, Z=l, k.
Тогда, в соответствии с теоремой 1, существуют не равные одновременно нулю число Ао^О, векторы /0 е RS|1, Ц е RS|, вектор-функция р (х), функция ^(т) и неотрицательные регулярные меры Цг, I = 1, ..., k, сосредоточенные на множествах Дг соответственно и такие, что
p(T) = -Mx(Z.(l), У, (1))/i + 1
+ J НХ(Ш> УЛ), ™Л),	q®,
% k I
“SI уЛ))^,
i=\ %
<Л) = -МЛ)> MD)IA) +
+ / УЛ), ....
T
k 1
УЛ)) dHi, f=l T
P (0) = h*Ox (t, (0), y. (0)) Zo, q (0) = (h0l (Z. (0), y, (0)) | Zo), H(Z.(t), y,(x), wt(x), vt, p(x), q(x), Ao) =
= max H (Z, (r), yt (x), u, v, p (x), q (x), Ao).
и e U v> 0
250
ГЛ. 5. ЛОКАЛЬНО ВЫПУКЛЫЕ ЗАДАЧИ
Пусть (0 — функция, обратная (т), т. е.
Тогда, если обозначить
р (0 = р (т. (0)» q (0 = q (*. Ю) >
*Л0) = 0)=ч(Аг), = k, и определить меры рг формулами ti*	1
/ Ф (t) d[it= J ф (/. (т)) dfif, Уф (•) s С ([U fь])
<о»	0
(pz, очевидно, сосредоточены на Tt), то с учетом (13) написанные выше соотношения преобразуются к следующему виду:
^1*
Р (t) = - h*lx	xt (tu)) h+ J Hx (g, x, G), u. (0, P (g), Ao) d$-
t k *1*
-SJ SiAl, *.(В)Ш: (14) i=l f
q (!) = — (hlt (tit, Xt (tit)) | /i) + ^1*	k ^1*
+ / Ht(t, x,(t), .... AoX-JJ gtt&Xt^din, (15) t	i=l t
p (to*) — hox (to*, x* (Ah)) to,	(15)
q (to*) = (hot (to*, x* (t0*)) | Го),	(17)
о. (H (t, x, (t), u, (t), p (t), Ao) + q (t)) =
= max v (H (t, x, (/), u, p (t), Xo) + q (t)). (18) u^U о >0
Из (18) следует, что
Н (t, х, (t), и, (f), р (t), Ао) = max Н (t, xt (t), и, p(t), Ao), (19) ue U
и поскольку vt > 0 также следует, что W(t, Xt(t), p(t), h) = -q(t).
§ 5.3. ДОКАЗАТЕЛЬСТВО ПРИНЦИПА МАКСИМУМА
251
Сравнивая последнее соотношение с (15) и (17), полу-чаем
^(;, х*(0> p(t), м = (hit (Л*, Х*(Л*)) |/1) —
^1*
-J Htd, хл), ню, лот+ t
k}
+ £/	*.(|))^; (20)
i=l t
(to*, p (to*), Zo) =— (Ao/(Ah, X* (A)*)) I A))» (21)
Таким образом, если (**(•), ^*(*)) — оптимальный управляемый процесс в задаче (1) — (5), то найдутся не равные одновременно нулю число Zo 0, векторы Z;eRS/, /=1, 2, вектор-функция p(t) и неотрицательные регулярные меры цг-, сосредоточенные на множествах 1\ соответственно, такие, что выполняются соотношения (14), (15) и (19) — (21). При этом гамильтониан <Ж(/, х* (/),/?(/), Zo) есть функция ограниченной вариации, непрерывная слева.
Так выглядит принцип максимума Понтрягина для задач с фазовыми ограничениями и незакрепленным временем.
§ 5.3.	Доказательство принципа максимума для задач с фазовыми ограничениями
Напомним, что рассматривается задача оптималь
ного управления
^(х(.),и(.))= J/(f, X, и)Л->тГ;	(1)
^0
x = q(t, х, и),	(2)
u^U,	(3)
Ao(x(/o)) = Ai(x(/1)) = O,	(4)
gi(t, МОХ °, М. *=1.......................(5)
в которой начальный и конечный моменты времени предполагаются фиксированными.
252
ГЛ. 5. ЛОКАЛЬНО ВЫПУКЛЫЕ ЗАДАЧИ
5.3.1.	Редукция задачи. Обозначим через 'U совокупность допустимых управлений в задаче (1) — (5):
<2/= {«(•)(=	([f0, Л])|«(0е U почти всюду).
Рассмотрим далее отображение F из Сп([/0, /1])Х^ в Cn([/0> M)XRS’XRS':
F(x( •), Ы(.)) = (у(.), а0, ai)^Cn([t0, M)XRSOXRS'.
где t
y(t) = x (0 — х (t0) — J <p (т, x (т), u (t)) dx, to
aa = h0(x(t0)), at = h[(x
Определим, наконец, функции Gt на	/J) еле-
дующим образом:
Gt-(*(•)) = max gift, t 1*0» *l]
Используя эти обозначения, можно придать задаче (1) — (5) такой вид:
^(х(-), «(•))—> inf;
F(x(-), «(.)) = 0,
G,(x(-))<0, i=l........k,
Таким образом, по крайней мере по форме, задача (1)—• (5) является частным случаем общей задачи, рассмотренной в § 5.1. Для того чтобы применить теорему 1 из § 5.1, необходимо проверить, что функционал У, отображение F и функции Gt обладают перечисленными в ее формулировке свойствами.
Некоторые из этих свойств, именно, дифференцируемость функционала У и отображения F по х(-), непрерывность и регулярная локальная выпуклость функций G,, проверяются без труда.
В самом деле, дословно так же, как и в п. 2.5.2 (с той лишь разницей, что ссылку на следствие из теоремы 1 из § 0.4 следует заменить ссылкой на лемму 1 из того же параграфа), показывается, что отображение (%(•),«(•)) непрерывно дифференцируемо по
§ 5.3. ДОКАЗАТЕЛЬСТВО ПРИНЦИПА МАКСИМУМА
253
фреше и что его производная в точке (х,(-), «,(•)) имеет вид
Fx<-AxA-), «.(•))*( •) = (!/(•), а0, at), (6) где	t
У (f) = x (0 — х (/0) — J <рх (т, х, (т), и, (т)) х (т) dx, t<b
ао = ho (х, (to)) х (t0), ai = h( (x, (t\)) x (tt).
Точно так же функционал £7 как функция от х(-) непрерывно дифференцируем по Фреше и его производная в точке (хД-), «,(•)) вычисляется по формуле
<^(.)(х.(-), «.(•)), х(-)) =
= $ (fx(t, xjt), u,(t))\x(t))dt.	(7)
*0
Наконец, функции Gi регулярно локально выпуклы в Сп([^о,Л]) в силу теоремы 3 из § 4.4, а в п. 4.5.3 было показано, что субдифференциал функции Gi в точке х*(-) содержит те и только те линейные непрерывные функционалы %* на Cn([/0, 6]), которые можно представить в виде
<х\ х (• )> = J (gix (t, х, (t)) |х (t)) dfii,	(8)
h
где jlz — неотрицательная регулярная мера на [f0, Л], сосредоточенная на множестве
Ti = [t е Ко. 1 gi (i, X. (f)) = Gi (x. (•))}
и имеющая полное изменение, равное единице.
Таким образом, осталось проверить, что условие б) теоремы 1 из § 5.1 также справедливо для задачи (1) — (5). Это будет сделано в п. 5.3.3 при помощи подготовительных лемм, которые доказываются в следующем пункте.
5.3.2. Подготовительные леммы. Условие б) теоремы 1 из § 5.1 предполагает существование специального отображения v. Построение такого отображения
254
ГЛ. 5. ЛОКАЛЬНО ВЫПУКЛЫЕ ЗАДАЧИ
для задач оптимального управления основано на одной конструкции, относящейся к теории функций действительного переменного. Мы рассмотрим сначала простейший вариант.
Пусть у(-)— измеримое ограниченное отображение отрезка [f0, fi] в конечномерное пространство, А1 —измеримое подмножество этого отрезка и хм(-)— характеристическая функция множества М, т. е.
1, если
О, если t ф М.
Хм (0 = I
Наконец, через Y(t) и YM(t) обозначим первообразные вектор-функций y(t) и х,м(()у(0, равные нулю в точке t0: t	t
Y (0= J y(i)dx,	J хм(т)г/(т)</т.
Лемма 1. Для любой ограниченной измеримой век-тор-функции y(t), определенной на [f0, fi], и любого б>0 можно построить однопараметрическое семейство {М(а)} = {А1(а; у( •), б)} (O^a^l) измеримых под-множеств отрезка [fo, fi] такое, что
mes (a) = a (/!—tQ), М (az) cz М (а), если а'^а, (9) шах | Ум(а)(0 — УмшУ)— (a — a')Y(I) |<б| а —а'|. (10)
Замысел описываемого ниже построения проще всего понять в том случае, когда вектор-функция y(t) является константой: y(f)sC. Тогда, если разбить отрезок [fo, fi] на равные отрезки Дг-, i — 1, ..., г, длины, меньшей б/С, то в качестве М(а) можно взять объединение отрезков ДДа), f = 1, ..., г, у которых левый конец совпадает с левым концом отрезка Дг-, а длина составляет a-ю долю длины этих отрезков.
Доказательство. Всякая ограниченная измеримая вектор-функция есть равномерный предел «простых» вектор-функций, каждая из которых принимает лишь конечное множество значений. Очевидно, лемму
§ 5.3. ДОКАЗАТЕЛЬСТВО ПРИНЦИПА МАКСИМУМА
2Б5
достаточно доказать лишь для таких простых вектор-функций. В самом деле, для заданной ограниченной измеримой вектор-функции y(t) можно подобрать такую простую вектор-функцию //(/), что
sup I у (О — у (?) К 7~~Т‘	(11)
fe[fe, h]	‘1	г<>
Если для простых вектор-функций лемма верна, то можно построить семейство Л1(а) = Af(a; £(•), 6) измеримых подмножеств отрезка [t0, Л]. Тогда, если, скажем, а а', то
| Ym (a) (0 — Тм (а) (О — Ym (а') (0 + fМ (а') (О I =
= I Yм. (а)\М (а') (0 — Ym (а)\М (а') (0 |	61 а — а' |
в силу (9) и (11) и
| (а - a') (Y (0 — Y (/)) |<6| а - а' |
в силу (11). Сравнивая эти неравенства с (10), получаем
I YM (a) (0 - YM М (0 — (a — o') К (0 К 361 a — a' |,
т. е. M(a) = M(a; у(-), 36).
Итак, пусть у(-)— простая вектор-функция. Для описания конструкции множеств Л4(а) нам удобно ввести одно обозначение. Пусть А — измеримое подмножество отрезка [/о, Л], имеющее положительную меру. Тогда
t
J%A(T)dr h
непрерывная неубывающая функция, изменяющаяся от нуля до гпезЛ. Пусть /(а) — ближайшая к to точка отрезка [/о, Л], в которой XA (t) = amesA Тогда через (Л)а обозначим пересечение множества А с отрезком [М(а)1
Пусть ’’	/
У (0 = S (0
256
ГЛ. 5. ЛОКАЛЬНО ВЫПУКЛЫЕ ЗАДАЧИ
и шах|у7| = С. Разобьем отрезок (70, 6] на равные отрезки Ль Дг длины, не превосходящей 6/(2С). Тогда множества
M(a) = U(MMx
i,i
— искомые. В самом деле,
mes М (а) = 5 mes (Ay |"| AJa = а 5 mes (Ay f| A J =
= а(Л —10).
Если а^а', то (АуПАг)а/С (АуП &i)a и, следовательно, М (а') с: М (а). Наконец,
J y(t)dt = a J г/(О<й = ш/утез(А/ПА;), (л/пл/)а	л/п лг
поскольку на множествах А} вектор-функция y(t) постоянна и равна г/у. Отсюда следует, что на концах отрезков Аг значения вектор-функций (а — a')Y (t) и Ум (а) (О — Ум (а') (0 совпадают. Если же А< = [т/, т<+1], т, < t < Tf+1, то
I Км (a) (О - Км (a') (0 - (a - а') к (О К
J (Хм (а) (т) — Хм (<и СО) У (т) dr xi
^2С| а — а' 11/ — ti
Лемма доказана.
Теперь можно доказать общий результат.
Лемма 2. Пусть yt( •): [/0, Zj] —>i — 1, ..., zn, — ограниченные измеримые вектор-функции. Тогда для всякого S > 0 существуют однопараметрические семейства All (а), ...» А4т(а) измеримых подмножеств отрезка
§ 5.3. ДОКАЗАТЕЛЬСТВО ПРИНЦИПА МАКСИМУМА 257
ZJ, где параметр а пробегает значения от 0 доЛ/т, такие, что
mes Mi (а) = а (t j — tQ) для всяких /=1, tn*
1/т;
М( (а) П Mk (а') = 0, Mt (а') с М,- (а), если O^a'^a^l/zn, i =Y= k;
max I Кш, (а)(0 — ^ш.<ао(О —(a—a') Yt (/) |<6[ а — а' |
«еКо.М1 ‘	1
для всех i=l, m, О^а, a'^l/m.
Доказательство. Пусть п = п1-]- ... + пт. Т огда
Z->z(O = (z/i (О.ym(t))
есть измеримое ограниченное отображение отрезка [Zo, ZJ в Rn. Выберем семейство {M(a)} (O^a^l) измеримых подмножеств отрезка [Zo, Л], удовлетворяющее соотношениям леммы 1 вместе с г(-) и 6. Пусть, наконец, О а 1/т. Положим
МДа) = М((/~ 1)/т + а)\М((/~1)/т), Z=l, ..., т
Семейства {МДа)}, /=1, т,— искомые. В самом деле, множества МДа) и M/Да') при любых i =/= k, O^a, a' 1/m, очевидно, не пересекаются, тезЛ1Да) = = аД1 —Zo) и (при 0 a'sC а 1/т) Л4Да')<= МД а).
Наконец, последнее соотношение в формулировке леммы также следует из леммы 1 и того очевидного факта, что для всякого вектора z = (y{, ..., ут) е Rn, f=l, m, справедливы неравенства |уг|^
|г|, i = 1, ..., т. Лемма доказана.
5.3.3. Конструкция отображения v. Вернемся к задаче (1) — (5). Нужно проверить, что эта задача обладает свойствами, указанными в условии б) теоремы 1 из § 5.1. Для этого достаточно доказать следующее. Пусть иД-), ..., ит(-) — некоторый набор допустимых управлений (т. е. иД-)е<2/) и 6 > 0. Тогда найдутся окрестность VczCn([Z0, ZJ) точки %*(•), число е>0 и отображение а —> v (а) (•) множества eL"1 в °1£ (напомним, что
2m = |a = (aI, am)G=R'n|a/>0, SayCl},
9 А. Д. Иоффе, В. М. Тихомиров
258
ГЛ. 5. ЛОКАЛЬНО ВЫПУКЛЫЕ ЗАДАЧИ
так что
eSm = 1 а = (аь
такие, что
и (0) (0 = и* (t) почти для всех t
И для всех х(-),	a, a' eeS"1 справедливы
неравенства
t
max
[to, М
ф(т, х(т), v(a)(r))—<р(т, х'(х), v(a')(x)) —
— Фх (b X, (т), U, (?)) (х (?) — х' (т)) —
т
— 2 (а/ — «/) (Ф (т- х, (т)> «/ (*)) — Ф (т> х, (т), и, (т))) /=1
(т	\
IIX (•) — х' (•) ||с +	| а/ — а/11,
/=1	/
dx
(12)
У (*(•), 0(а)(.))-5<(х(.), «.(•))-
- 1 а/ V (х (•), «/ (•)) - 3 (х (•), и, (•))) < 6 1 а/. (13)
(В этом случае отображение v даже не зависит от %(•).) Формула (12) получается из соответствующего неравенства в условии б) теоремы 1 из § 5.1 после подстановки в него явных выражений для отображения Ft и его производной, данных в п. 5.3.1.
Итак, пусть набор щ(-),	ит(-) допустимых уп-
равлений и число б>0 заданы. Рассмотрим (n^-l)-мерные вектор-функции
г//(О = (ф(<. Х.(0, «/(0) —
— ф(Л xjt}, f(t, x,(t),	—	x,(0. «.(0)).
Они измеримы и ограничены, поскольку измеримы и ограничены управления w*(/), tZi(Z), ..., а отображения ф и f непрерывны. Поэтому с помощью леммы 2 можно построить однопараметрические семейства
§ 5.3. ДОКАЗАТЕЛЬСТВО ПРИНЦИПА МАКСИМУМА ’-У" 259
ШДа)} (Oc^a^l/m), / = 1, т, измеримых подмножеств отрезка [/0, Л] такие, что
М} (a) fl Mk (а') = 0 при j =£ k, Mj (а') с Мj (а) при а'^а, mes Mj (а) = a (it — /0) и
IYiMj (а) (0 — YjMj (а') (0 — (а — а') К/ (f) | < | а — а' |
(14) при всех /е[/0, /J, О^а, а'<Л/т.
Положим теперь
Qm — {а = (аь aj е= Rm |0<ау< Мт] и для всякого а е Qm определим вектор-функцию
v (a) (f) = и, (0 ч- 2 Хм. (а(/) (tij (t) — ut (i)).
Отображение	— искомое. Прежде чем дока-
зывать это утверждение, обратим внимание на то, как устроены вектор-функции v(a)(t). Поскольку множества Mj(aj), j= 1, ..., m, попарно не пересекаются, v(a)(t) при всяком t принимает одно из значений и*(1), ^1(0, •	ит(/). При этом, если отрезок А достаточно
велик, то доля той его части, на которой v (а) (/) = мД/), близка к aj. Таким образом, вектор-функция v (a)(1) получается как бы в результате «перемешивания» управлений u*(t), ux(t), ..., um(t) в пропорциях, определяемых вектором a = (ai, am). Отметим еще, что поскольку множества Л4Да?), j — 1, m, не пересекаются, имеет место очевидная формула g(t> v (a) (t)) = g (t, «„(/)) +
т
+ 2 XAf/ (ay) (0(Я	«/ (0) — g И. (0)).	(15)
справедливая для всякой вектор-функции g, заданной на [Zo, М X Rr-
Из определения следует, что при всяком ae Q™ вектор-функции	измеримы, ограничены и
9*
260	. Гл- 5. ЛОКАЛЬНО ВЫПУКЛЫЕ ЗАДАЧИ
принимают значения из множества U. Кроме того, очевидно, о(0) (/) = «*(/).
Далее, поскольку все управления «»(•), «](•), ... ..., ит(-) ограничены, их значения содержатся в компактном множестве U\ a Rr. Поэтому, используя непрерывность <р и f, можно выбрать такое о >0, что неравенства
|<р(/, х, и) — q>(t, x,(t), и) |<,	(16)
|f(Z, х,	x,(fl, u)|< g7 -б ,	(17)
| Ф (t, X, и)—ср (t, х', и)—срх (t, X, (/), и) (х—х')	Г (18)
2 (ti —
выполняются для всех /, х, х', и, удовлетворяющих соотношениям |х — хД/) |< о, | х'— х# (/) | < a, uet/j. Положим
У={х(.)еСл([/о, M) HIM • )-*,(•) Ис < о)
и выберем число е>0 таким образом, чтобы 8^1/т и е(^—/0) max | фх (t, xt (t), и) |< 4.	(19)
ue и,
Здесь | фх | есть норма фх как линейного оператора из R" в R".
Пусть теперь х (•), х' (•) s V, а, а' е (тогда a, a'^Qm, поскольку е^1/т). Имеем
Ф(т, х(т), v (а) (т)) — ф (г, х'(т), »(а')(т)) —
— Фх (т, х. (т), и. (т)) (х(т) — х'(т)) —
т
—	(а/ — а?) (Ф <т>х. (т)> и/ (т)) — ф (т, X, (т), ы. (т)))
/=1
t
< J [ф (т, х (т), V (а) (т)) — ф (т, х' (т), v (а) (т)) —
— Фх (х> х. (т), v (а) (т)) (х (т) — х' (т))] dx 4-
§ 5.3. ДОКАЗАТЕЛЬСТВО ПРИНЦИПА МАКСИМУМА
261
-I- J [(фх(т> *.(т)> С*(л)(т)> —
^0
— Фх (т, X, (т), и, (т))) (х (т) — х' (т))] dr | +
t
4- f [ф (т> х' (х)> V (а) (т)) — Ф (т> х' (т)» v (<*') (т)) — t*
— ф (т, х, (т), V (а) (т)) + <р (т, х. (т), V (а') (т))] dr | +
f г
+ | ф (т, х, (т), v (а) (т)) — ф (т, х, (т), V (а') (т)) —
*0
т
“ 2?а/ “ (т> х* Ы/ W ~~
/=1
— Ф (т, X, (т), ы, (т)))] dr|. (20)
Оценим каждое из четырех слагаемых в правой части
(20). Согласно (18) первое слагаемое не превосходит
у||х(-)-х'(-)Нс.	(2D
Второе слагаемое, согласно (15), равно t / т	\
h '/^1	'
— Фх (х, X, (т), W, (т))) (х (т) — х' (т)) dr | и в силу (19) оценивается следующим образом: 2||х(.)-х'(.)||сХ
г / m	\
Х( max |фх(^, хД/)> zz)|) | I ( Л/)и/ = '?^11	Мм Н/) /
(т \
У ) = /-1	7
= 4l|x(-)-x'-(.)||c. (22)
262
ГЛ. 5. ЛОКАЛЬНО ВЫПУКЛЫЕ ЗАДАЧИ
Третье слагаемое, снова используя формулу (15), можно переписать в виде t т
J X («/)—Хм/(а;)(т)) х'и>(т)) “ *0 /=1
— ф(г, х, (т), u,
В силу (18) оно не превосходит т *1	т
2 (/i - /0) X J I Хл1; (°.) — Х'м; (<•) I dt = 7 X I а1 ~ a'i I • /=1 /0 1 J J " 1 /=1
(23)
Наконец, четвертое слагаемое, опять же с помощью формулы (15), переписывается так: т t
X / [(*М/ (a,.) W (aj) W) (ф (ь х. (т)> «/ <*)) -
— Ф (*> X, (т), и, (т))) — (а/ — а/) (ф (т, х, (т), «/ (т)) —
— Ф (т> х, (т), м. (x)))j dx |. Разность ф(т, хДт), иДт))—ф(т, х*(х), и*(х)) содержит первые п компонент вектор-функции уj (т). Поэтому написанное выше выражение не превосходит (см. (14)) т г
5 J [(Хм/(“/)(т) ”Хл,/(“/)(т)) у> У, W] /—1 ^0
т
< 21 у.«, е,)» - у«, («;.)» - (“) - “Э у!»| <
т
»;i- <24>
/=1
Из (21)—(24) следует, что левая часть в (20) при всех t не превосходит б (|| х (•) — х'( •) ||с -f- S | а;. — а< |Соотношение (12) доказано.
§ 5.3. ДОКАЗАТЕЛЬСТВО ПРИНЦИПА МАКСИМУМА gj 263
Наконец, в силу (14), (15), (17)
J f (t, х (/), v (а) (0) — f(t,x (t), и, (0) —
<0	т
—	x(t), Uj (0) — f(t,x (0, и, (0) dt =
/=1
== S J [Z"/ (ay) ® (f x ui —f^X U*
т


т
+ Е / X» (а.) (О(I/ Ц, X (0) - f (/, X, (0, Ut (0) I + у—j	*
+ I f {t, X (t), U, (0) - f (t, X, (t), U. (t)) I) dt +
+ a, J (| f (t, x (/), ut (0) - f (t, xt (t), и, (0) I +
*0 m
+1 f (t, x(/), a,(0) — f (t, x, (0, (0) I) dt <62а/, J /=i т. e. неравенство (13) тоже верно.
Таким образом, задача (1)—(5) обладает всеми свойствами, перечисленными в формулировке теоремы 1 из § 5.1.
5.3.4. Завершение доказательства принципа максимума. Функция Лагранжа задачи (1) — (5) имеет вид
x(t), u(t))dt +
h
и /	*	X
+ f I x (0 —x (/о) — f Ф (т, x (т), и (т)) dx |dv I 4-
и
+ (/о 1*0 (X О + (/! |Л1 (X Ш + 2 ^Gi(x( . )), i=l
26(4	гл. ix ЛОКАЛЬНО ВЫПУКЛЫЕ ЗАДАЧИ
где v — регулярная векторная мера на [/0,	(т. е. v =
= (vb vn), где Vi — регулярные меры на [^0, М), Zo <=	/, е Rs‘. В силу теоремы 1 из § 5.1 найдутся
не равные одновременно нулю множители Лагранжа Ло^О, ...,	/0 е Rs', li s Rs‘ и векторная мера v
такие, что
О	(25)
(х.(•),«.(•), ...) = min 2Дх,(•),«(•), ...),	(26)
«(•)
Ш(х,(-)) = 0, i=\,	(27)
Рассмотрим подробнее каждую из написанных формул. Обозначим для краткости L (^, х* (О,	^о =
= Aq(^(/0)) и т- Д- Используя выражение (8) для субдифференциалов функций /=1, k, получаем из (25), (6), (7), что для всех x(-)eCn([f0, /J) должно выполняться равенство
^0 J (fx IX (/)) di + j ( x (0 — x (t0) — J <pxx (x) dx | dv I 4-to '	t0	'
k ti
+ (/о Ih'ox (f0)) + (/1 |й[х (ti)) + 2 / (gix |x(/)) djli = 0, i=l 4
где i— 1, ...,&, —регулярные неотрицательные меры с полным изменением, равным единице, сосредоточенные на множествах Tt = [t е [f0, /J | gt (/, х, (/)) = Gt (х* (•))} соответственно. Изменяя порядок интегрирования во втором слагаемом и полагая	приведем напи-
санное выше соотношение к виду
tx / /	/Л \ \	k	\
J ( (Ух — <Рх I I dt + dv + S gixdVi I* (0 I +
to W	^t II	t = l	/
/	tx	\
+ (ЛД- J dv\x(t0) +(Af/1|x(/l))=O. t
§ 5.3. ДОКАЗАТЕЛЬСТВО ПРИНЦИПА МАКСИМУМА
265
Это равенство должно выполняться для всех х(-)е
Сп\[Zo, ). Применяя теорему Рисса о единственности представления линейного функционала в пространстве
Сп фо» ^11) и обозначая p(t) = J dv, получаем t
л
Тем самым доказаны соотношения (6), (7) из § 5.2.
Далее, соотношение (26) эквивалентно следующему / \ -
J	МО) dt~ I J ф(*, и* (т))г/т | tZv I ==
= min I %of(/, x* (t), и (t)) dt —
ro
/ t	Y
— I J <p (т, х.(т), м (т))с?т |dv I .
Но
t, / t
Щ Ф (г, x, (т), u (t)) dx \dv
tt (
= / (<P0> x,(t), u(t))
tl
= / (p(0 I<P (C x*(0> u(t)))dt.
to
Из этих двух равенств следует соотношение (8) из § 5.2.
Заметим, наконец, что если Gi(x»(-))<0, то в силу (27) Aj = 0. Поэтому среди мер ц, отличными от нуля
266
ГЛ. 5. ЛОКАЛЬНО ВЫПУКЛЫЕ ЗАДАЧИ
могут быть лишь те, которые соответствуют номерам I с Gi(x*( •)) = 0. В этом случае
= =	|^. (/, хД/)) = 0}.
Поэтому без ограничения общности можно считать, что все меры цг- сосредоточены на множествах Tit Принцип максимума полностью доказан.
Комментарий к гл. 5. Различные аксиоматические схемы для экстремальных задач, близких в том или ином отношении к выпуклым, разрабатывались Гамкрелидзе [5], [7], [8], Гамкрелидзе и Хара-тишвили [1]—[3], Нойштадтом [2], Халкиным [4] и др. Теорема 1 из § 5.1 написана под влиянием результатов Халкина. Думается, что эта теорема может оказаться полезной при доказательстве принципа максимума и для более широкого круга задач.
Первый вариант принципа максимума для задач с фазовыми ограничениями был доказан Гамкрелидзе [3]. Теорема 1 § 5.2 была доказана Дубовицким и Милютиным с помощью замены времени. Интересные проблемы возникают в задачах со смешанными ограничениями вида g(x(t), u(t)) =0 или g(x(t), u(t))	0. Первые ре-
зультаты для таких задач получены Дубовицким и Милютиным [3], [5].
Глава 6
СПЕЦИАЛЬНЫЕ ЗАДАЧИ
§ 6.1.	Линейное программирование
Здесь доказываются теорема существования и теорема двойственности для задач линейного программирования.
6.1.1.	Существование решений. Рассмотрим задачу линейного программирования:
(f|x)->inf; Ax^b, х^О.	(1)
Здесь Л: Rn->RW— линейный оператор, ceRn, fteR^. Символ х у означает, что координаты вектора у не превосходят соответствующих координат вектора х. Мы будем рассматривать пространства Rn и Rw только со стандартными базисами. Это позволяет нам отождествить оператор А с его матрицей в этих базисах. Обозначим через ai, ..., ап векторы, стоящие в столбцах матрицы А. Тогда
Ах — а{х1 + ... + апхп,
где х1, ..., хп — координаты вектора х.
Следующая лемма играет центральную роль в дальнейшем изложении.
Лемма 1. Всякий выпуклый конус в конечномерном пространстве, порожденный конечным множеством точек, замкнут.
Доказательство. Пусть конус К cz RA порожден точками Zi, ..., zh. Это означает, что
{k ^sRjV|z=SMb ^г>0, z=l, i=l	)
Доказательство его замкнутости проведем индукцией по числу k. При k= 1 лемма очевидна, ибо тогда К—полупрямая. Допустим, что лемма верна для k — s—1, и предположим, что k = s. Рассмотрим два случая.
268
ГЛ. 6. СПЕЦИАЛЬНЫЕ ЗАДАЧИ
1)	Конус К содержит векторы —zb	—zs. Тогда
К — подпространство размерности, не большей s, и следовательно, К замкнуто.
2)	Хотя бы один из векторов —zb i= 1, ..., s, например, —zs, не принадлежит конусу К. Обозначим через К\ конус, порожденный векторами zb ..., zs-\, По индуктивному предположению конус замкнут. С другой стороны, всякий вектор 2Е К можно представить в виде
z = zf + KzS9
где /Сь X > 0.
Пусть	£п, ... — последовательность элемен-
тов конуса К, сходящаяся к вектору z. Имеем
£ = zf 4“ Az.
п 1 ns
Имеются две возможности: а) — неограниченная и б) — ограниченная последовательность. В случае а) существует подпоследовательность	—>оо и тогда
поскольку Отсюда следует, что последовательность векторов knlkz'nk сходится к вектору z' = —zs. Но z'e/Ci, так как Kt—замкнутый конус, следовательно, —zs е вопреки предположению. Остается допустить, что имеет место случай б). Тогда можно выбрать последовательность чисел Xnfe, сходящуюся к некоторому числу Хо 0. В этом случае гп.г~^пк — ^nkzs~>z~Kzs==z'- В СИЛУ замкнутости конуса Kt точка z' <= Kt и, значит, z = z' + kozs е К. Лемма доказана.
Теорема 1 (теорема существования). Если множество допустимых элементов задачи (1) не пусто и ее значение конечно, то задача имеет решение.
Доказательство. Рассмотрим в пространстве Rm+1 множество К, образованное такими векторами (а, г), aeR, ze R”», для каждого из которых найдется хотя бы один вектор xeR", х 0, удовлетворяющий неравенствам
(с|х)=Са, Ax^z.
Множество К есть конус, ибо если (а0, z0)^K и (с|х0)^а0, Ах0 zt), то для любого t > 0, (c,txo)^
§ 6.1. ЛИНЕЙНОЕ ПРОГРАММИРОВАНИЕ
269
/ао, Л/х0^/г0, т. е. (/а0, /z0) К. Покажем, что конус К порожден конечным множеством векторов. В самом деле, если aiy ..., ап суть (m + 1)-мерные векторы вида (сг, #г), где Ci — /-я компонента вектора с, сц— вектор, координаты которого суть элементы f-го столбца матрицы Л, а е0= (1,0, ..., 0), ..., ет= (0, ..., 0, 1) — стандартный базис в Rw+I, то, как легко видеть, конус, порожденный векторами аь ..., а„у еОу —е1у ..., —ет, совпадает с К.
По лемме 1 конус К замкнут. Если х— допустимый элемент задачи (1) и а = (с|х), то (а,	С другой
стороны, если ао — значение задачи (1) и (а, Ь)^КУ то а^(с|х) для некоторого допустимого элемента задачи (1) и, значит, а^(с|х)^ао. Таким образом, множество
{aeR|(a, b) <= К}
не пусто и
аа = inf (aeR |(a,
(2)
Так как по условию ао >—сю и конус К замкнут, то (ао, Ь)^КУ т. е. существует такой элемент ^gR?1, х* 0, что Лх* Ьу (с|х#) ао. Но это значит, что х* — решение задачи (1). Теорема доказана.
6.1.2.	Теорема двойственности. Конус К, рассмотренный при доказательстве предыдущей теоремы, — выпуклый, замкнутый и обладает следующим свойством: если (a, z)^K и р а, то (р, г)еК. Поэтому конус Л является надграфиком выпуклой замкнутой функции
S (г) = inf {aeR |(a, г) е К}.
Из доказательства предыдущей теоремы следует, что S(z) есть значение задачи линейного программирования:
(с|х) —>inf; Лх^г, х^О,	(3)
отличающейся от задачи (1) тем, что вектор b заменен некоторым вектором z. Задачу (3) мы называем возмущением задачи (1). Найдем функцию, сопряженную с S(z). (Дальнейшие выкладки в более общей ситуации
270
ГЛ. 6. специальные задачи
встретятся в § 7.3.) Имеем
S* (у) = sup ((у \z)—S (z)) =
z
= sup((z/|z)— inf {(c |x) |x e R", x^O, Ax^z}) = z
= sup{(z/|z)— (c|x)|.r£R'1, zgR", x^O, Ax^z}.
Очевидно, rsup {(у |г) \z e R"1, z^ Ax} =(Ax\y) < oo в том и только том случае, когда т. е.
s*(y} =
sup (А*у — с |х), если у <= R™, оо, если у ф
или
s*(y) =
о, оо
если А*у с, у^О,
Поэтому
в остальных случаях.
S**(z) = sup {(// |г) |Л*у
В частности,	совпадает со значением такой
задачи линейного программирования:
(у \b) -> sup; А*у^с, у^О.	(4)
Задача (4) называется двойственной с задачей (1). Нетрудно видеть, что она имеет, по существу, ту же форму, что и задача (1). Поэтому двойственной с задачей (4) будет снова задача (1), и имеет смысл говорить о паре двойственных задач линейного программирования, Читатель без труда обнаружит те формальные правила, с помощью которых строится двойственная задача.
Теорема 2 (теорема двойственности). Для пары двойственных задач линейного программирования справедлива следующая альтернатива', либо значения задач конечны и равны и в обеих задачах существует решение, либо в одной из задач множество допустимых элементов пусто, а в другой или множество допустимых элементов пусто, или значение задачи бесконечно.
§ 6.1. ЛИНЕЙНОЕ ПРОГРАММИРОВАНИЕ
271
В первом случае векторы g Rn и y*^Rm в том и только том случае будут решениями задач (1) и (4) соответственно, когда они допустимы в этих задачах и удовлетворяют одному из двух эквивалентных соотношений:
(dx.) = (</.!*).	(5)
(У, I Лх. - b) = (A*yt - с I х.) = 0.	(6)
Доказательство. В силу замкнутости S(z) получаем, что если S(z)— собственная функция, то по теореме Фенхеля — Моро S(b) =	Если при этом
b g= dom S, то значения обеих задач конечны и, в силу теоремы 1, обе они разрешимы. Если же ft^domS, то S(b) = S**(b) = оо. Это значит, в частности, что в первой задаче множество допустимых элементов пусто. (Напомним, что inf f(x)—-\- оо.) Рассмотрим случай, ког-да S(z)— несобственная функция. Если S(z)= со, то и 5**(г)= оо, и мы приходим к уже рассмотренному случаю. Если S — несобственная функция и dom 5=^0 (в этом случае S(z) =—оо на domS), то S**(z) = —оо. Это значит, что £**(&)==—оо, т. е. во второй задаче множество допустимых элементов пусто, а в первой либо это множество пусто (когда £(/>)= оо), либо минимизируемая функция неограничена снизу на допустимом множестве (когда S(b) = —оо). Первая часть теоремы доказана.
Если х* и у* — решения задач (1) и (4), то по доказанному (с|х*) = (#*|6). Наоборот, для всяких допустимых элементов х и у
(с\х)^(^у\х) = (у\Ах)^(у\Ь).	(7)
Поэтому, если выполнено равенство (5), то х* и у* — решения задач. Далее, если выполнено (6), то
(с I х.) = (Л*#„ | х.) = (у, | Лх.) = (Ь | Z/.).	(8)
С другой стороны, если х и у — допустимые элементы в задачах (1) и (4) и выполнено равенство (5), то в силу (7) выполнены равенства (8), эквивалентные условию (6). Итак, условия (5) и (6), действительно, равносильны. Теорема доказана.
272	ГЛ. 6. СПЕЦИАЛЬНЫЕ ЗАДАЧИ
§ 6.2.	Теория квадратичных форм в гильбертовом пространстве
В этом параграфе излагается фрагмент вариационной теории квадратичных форм.
6.2.1.	Определения. Для полноты изложения приведем все необходимые для дальнейшего определения. Часть из них уже приводилась нами ранее.
Функция Q(x), заданная в линейном пространстве X, называется квадратичной формой, если существует такая билинейная симметричная функция В(х, у), что
Q(x) = B(x, х).	(1)
Отметим, что билинейная форма В определяется по Q однозначно: В(х, у) = х/4(Q (х + у) — Q(x — y)).
Квадратичная форма Q называется положительной (неотрицательной), если Q(x)>0 при х =# О (соответственно Q(x)^0 при всех хеХ). Аналогично определяются отрицательная и неположительная формы.
Функция k(x) называется квадратичной, если k{x) = Q(x) + l(x) + a,
где Q — квадратичная форма, I — линейный функционал и а — константа.
Далее X — это сепарабельное гильбертово пространство. Квадратичную форму Q называют слабо непрерывной, если она непрерывна относительно слабой топологии X; слабо полунепрерывной снизу, если она полунепрерывна снизу относительно слабой топологии пространства X. Наконец, квадратичную форму Q называют лежандровой, если она слабо полунепрерывна снизу и если из слабой сходимости хп к х и сходимости Q(xn) к Q(x) следует сильная сходимость хп к х. Максимальная размерность тех подпространств, на которых квадратичная форма Q неположительно определена, называется ее индексом *) и обозначается ind Q.
Пусть В(х,у) — непрерывная в сильной топологии билинейная симметричная функция. Тогда отображение _______________ х -> В (х, у)
*) Иногда индексом квадратичной формы называют максимальную размерность подпространства, на котором форма отрицательно определена.
§ 6.2. ТЕОРИЯ .КВАДРАТИЧНЫХ ФОРМ
273
есть при фиксированном. у^Х лицевдая непрерывная функция на X. Следовательно, по теореме об .общем виде линейного функционала в гильбертовом пространстве найдется такой элемент т] = Лу, что
в (х, У) = (х 1л).
Легко понять, что оператор	X), т. е. является
линейным и непрерывным оператором, а в силу симметрии функции В он является самосопряженным. Отсюда и из формулы (1) получается, что непрерывная квадратичная форма допускает следующее представление:
Q(x) = V2 (Лх |х),
где Л — непрерывный линейный самосопряженный оператор. Коэффициент */2 мы выбрали ради удобства. (Отметим, что ранее в п. 0.2.5 мы последнее соотношение принимали за определение квадратичной формы.)
Если Л — самосопряженный оператор, то символ Л 0 (соответственно Л > 0) означает, что квадратичная форма Q(x) = V2(Ax, х) неотрицательно (соответственно положительно) определена.
Пусть Л: Х—*Х— линейный непрерывный оператор. Число X называется собственным значением оператора Л, если существует вектор х =# 0 такой, что
Ах = Лх.
Сам вектор х называется при этом собственным вектором. Оператор Aej?(X,X) называется компактным. если он всякое ограниченное множество переводит в относительно компактное или, что равносильно, всякую слабо сходящуюся последовательность — в сильно сходящуюся.
6.2.2.	Гладкие экстремальные задачи с квадратичными функциями. Рассмотрим задачу с ограничениями типа равенств:
&0(x)->inf (sup); ^(х) = 0, i—	(2)
где
^W = 1/2(Afx|x)-f-(aJx) + az, Z = 0, ..., и,
— квадратичные функции. В п. 0.2.5 было показано, что квадратичные функции являются дифференцируемыми
274
ГЛ. 6. СПЕЦИАЛЬНЫЕ ЗАДАЧИ
по Фреше. Следовательно, задача (2) относится к числу гладких задач, к которым применимо следствие 1 из теоремы 1 § 1.1. Из этого следствия сразу вытекает такое утверждение.
Предложение 1. Для того чтобы элемент х* доставлял экстремум в задаче (2), необходимо, чтобы нашлись числа Zo, ..., Zn, не все равные нулю и такие, что выполнено следующее соотношение*.
1мАл + аг)-0.	(3)
х—О
Следствие 1. В задаче без ограничений kQ (х) -> inf (sup)
решение х* удовлетворяет соотношению
ЛоХ# + ао = О.	(4)
Следствие 2. Решение х* экстремальной задачи (Лх |x)->inf (sup); (х|х) = 1	(5)
является собственным вектором оператора Л, и при этом собственное число является значением задачи (5).
Действительно, уравнение (3) дает
АчЛх* + ZjX* = 0.
При этом Zo =/= 0, ибо иначе и второй множитель Лагранжа равнялся бы нулю, чего не может быть. Следовательно,
Лх* — Кх*.
Домножая это равенство на х*, мы получаем, что Z = (ЛхДхД, что и требовалось.
6.2.3.	Слабо непрерывные формы. Теорема Гильберта.
Теорема 1 (Гильберт). Для того чтобы квадратичная форма Q(x) = 72(Лх|х), где Л — линейный непрерывный самосопряженный оператор, была слабо непрерывной, необходимо и достаточно, чтобы оператор Л был компактным. При этом существует ортонормирован-ный базис	еп, ... в пространстве X, состоящий
§ 6 2. ТЕОРИЯ КВАДРАТИЧНЫХ ФОРМ
275
из собственных векторов оператора Л, в котором форма Q принимает вид
оо
Q(x) = ’/2 2 Ы*Ы2,	(6)
/г=1
Лв£ —	(&i I £/) — I Aq I I I •••>	0*
Доказательство. Докажем сначала достаточность. Пусть Л — компактный оператор. По определению это означает, что всякую слабо сходящуюся последовательность он переводит в сильно сходящуюся. Покажем, что форма Q — слабо непрерывна. Пусть хп слабо сходится к х. Тогда по теореме Банаха — Штейн-гауза эта последовательность является сильно ограниченной, т. е. существует такое число С, что ||хп|| С и, следовательно, ||х|| С. В итоге получается:
2 I Q (хп) — Q (х) | = | (ЛхЛ |хп) — (Лх |х) |<
| (Ахп | xrt) (Лх | хп) | | (Лх„ | х)	(Лх | х) |
< || Лхп—Лх || || хп (I +1| Лхге—Лх || || х || < 2С || Лх» - Лх || -> 0
Достаточность доказана.
Необходимость докажем, выведя предварительно соотношение (6). Базис eit ..., еп, ... будем строить индуктивно. Для определения ei рассмотрим экстремальную задачу:
>/21 (Лх |х) | = | Q(x) |->sup; (х|х)<1.	(7)
Значение этой задачи обозначим В силу того, что единичный шар В(0, 1) = {х| (х|х)	1} является слабо
компактным, а форма Q слабо непрерывна по условию, решение задачи (7) существует. Допустим сначала, что ai = 0. Тогда (Лх|х)е=0 на X и, значит, любой вектор х является экстремумом в задаче без ограничений (Ax|x)->inf. По следствию 1 из предложения 1 получаем, что тогда Лх = 0, т. е. любой вектор является собственным с собственным значением нуль. В этом случае теорема Гильберта доказана. Если же «1 У= 0, то решение е^ принадлежит единичной сфере {х| (х|х) = 1} и является экстремумом такой задачи:
V2 (Ax|x) = Q(x)->inf (sup); (х(х) = Ь
276
ГЛ. 6. СПЕЦИАЛЬНЫЕ ЗАДАЧИ
В силу следствия 2 из предложения 1 вектор ei является собственным вектором оператора Л:
| j = •
Пусть теперь п ортонормированных векторов , еп, являющихся собственными векторами оператора Л с собственными значениями М, ..., Zn, уже построены. Рассмотрим экстремальную задачу:
|Q(x)|->sup; (х|х)^1, (x|ez) = 0,	и.
Значение этой задачи обозначим an+i. Существование решения в этой задаче сразу вытекает из слабой компактности единичного шара в X. Ясно и то, что если an+i 0, то решение en+i принадлежит единичной сфере и, следовательно, является решением задачи:
Q(x)-> inf (sup); (х|х)=1, (x|ez) = 0,	n.
В силу предложения 1 найдутся числа Zo, Цо, •••, И» такие, что
^оАе„+1 + иое„+1 + 2	= 0.
1=1
Домножив это равенство последовательно на	еп
и использовав ортонормированность системы ... ..., en+i, получаем:
Ло (Л^л+1 | ek)	(Лв£ | вп+1) “F Н& = Н& = 0»
т. е. цл = 0, k = 1, ..., и, а значит, Хо =И= 0 (ибо иначе все множители Лагранжа были бы нулями) и Aen+i = = (—go/Xo)en+i. Таким образом,
+ l === hn+l&n + 19 I ^« + 1 | ==: Оп+1»
Итак, en+i — собственный вектор, и мы можем продолжать наше индуктивное построение. Если же an+i = 0, то получается, что на подпространстве L£9 ортогональном к elt ..., еп, оператор Л является нулевым и,
5 6.2. ТЕОРИЯ КВАДРАТИЧНЫХ ФОРМ
277
значит, х = 2 xkek + g, g е ZA и
(/ п	\ п	\
л 2 хЧ + d X xkek + l =
\fc=I	/ k=l	/
п	п
= ’/2 2 М**)2='/2 S Ьк(х\еку. /2=1	/2=1
В этом случае теорема Гильберта уже доказана.
Подведем итоги. Либо наше индуктивное построение приводит к тому, что оператор А оказывается конечномерным, либо оно продолжается неограниченно. Неравенства |Xi|^|Z2|^ ... следуют сразу из наших построений. Далее, последовательность единичных векторов еп слабо стремится к нулю, откуда
1^ | = 1 (Аеп\еп) | = 2|
Рассмотрим, наконец, ортогональное дополнение к подпространству L, натянутому на все векторы elf ... ..., еп, ..., и следующую задачу:
| Q(х) | —>sup; (х|х)<1, хе/А
Ее значение есть нуль, ибо оно не может превосходить никакого ап+1, a an+i-> 0. Значит, на подпространстве Z.1 квадратичная форма Q(x)=0. Взяв базис fi, ..., fs, ... в подпространстве L1 и дополнив его векторами eif ..., еп, ...» получим базис в пространстве X, состоящий из собственных векторов оператора А. При этом имеет место равенство
Q W = '/2 (A (х |eft)ек + 2 (х f) 2 (х |eft) ек + \	\/г=1	/	/ /г=1
+ 2(x|fz)f/)-2 Mxk*)2.
i	fe=i
Образ AB(0, 1) — {y\y = Ax, (x|x)^l) единичного шара B(0, 1) при отображении А есть эллипсоид 2(У	1 с осями	|Х„|е„, ... Этот
эллипсоид в силу условия | Хп | —► 0 является компактным. Итак, оператор А является компактным. Теорема Гильберта полностью доказана.
278
ГЛ. 6. СПЕЦИАЛЬНЫЕ ЗАДАЧИ
6.2.4.	Минимаксное свойство собственных значений. Допустим, что Q(x) = V2(Ax|x) — неотрицательная слабо непрерывная квадратичная форма. Тогда в силу теоремы Гильберта Л—компактный оператор и существует базис в X, состоящий из собственных векторов
..., еп, ... оператора Л. Собственные значения Х2 ^ ... являются неотрицательными в силу неотрицательности Q. Покажем, что если Xn+i ¥= 0, то
Лп+1 = inf sup {Q(x) |(х |х) = 1, хеАп1}, (8) где нижняя грань берется по всем подпространствам Ln размерности п. Действительно, по доказанному в теореме Гильберта
^п + 1 = sup [Q (х) | (х |х) = 1, х 6= (^п) } >
где Ln есть линейная оболочка eh ..., еп- Значит,
inf sup {Q(x) |(х |х)= 1, хе£„].
Ln
Пусть теперь Ln — любое n-мерное подпространство. Рассмотрим единичный вектор х0, лежащий в подпространстве Лп+ь натянутом на векторы ..., en+i, и ортогональный к Ln (такой, очевидно, всегда найдется). Имеем:
п+1	п+1
XQ ~ (Хо I	2(Xo)2 = W2=
«=1	к~{
Следовательно:
sup {Q(x) |(х|х) = 1, xgeZ^}>Q(x0) = n+1	n+1
- 2 \ (X, I > ( mln I,) 2 «)’ = /2— 1	I <S Tt Ч" 1	R~ 1
Итак, минимаксное соотношение (8) доказано.
6.2.5.	Лежандровы формы. Теорема Хестенса.
Теорема 2 (Хестенс). Лежандрова квадратичная форма имеет конечный индекс.
Доказательство. Снова, подобно тому, как это было в теореме 1, рассмотрим экстремальную
§ 6.2. ТЕОРИЯ КВАДРАТИЧНЫХ ФОРМ
279
задачу:
i/2 (Дх |х) = Q(х)->inf; (х |х)< 1.	(9)
Существование решения в задаче (9) обеспечивает теорема о существовании минимума полунепрерывного снизу функционала на компакте. Следовательно, по следствию 2 из предложения 1 всякое отличное от нуля решение задачи (9) есть собственный вектор оператора Л. Пусть
Лв| =	(#1 1^1) === i, 0.
Будем опять индуктивно строить ортонормированную систему , еп, ..., последовательно решая экстремальные задачи:
V2 (Лх |х) = Q (х) —> inf; (x|x)^I, (x|ez) = 0, (10) i = 1, ..., п.
Покажем, что наше построение оборвется через конечное число шагов. (Это выразится в том, что экстремальная задача (10) не будет иметь ненулевого решения.) Действительно, допустим, что мы построили счетную систему векторов
#1» •••» &П9 •••>	|вге|=1,
Л2	0.
Последовательность единичных векторов {еп} слабо сходится к нулю. Значит, в силу полунепрерывности формы Q снизу в точке нуль, мы получаем (использовав монотонность последовательности Хп)
lim кп = lim кп = lim (Леп \ еп) = п“>°°	п-»оо	П->оо
= lim 2Q(e„)>2Q(0) = 0.
П->оо
Итак, lim Xn = 0. Следовательно, {еп} слабо сходится к нулю и Q(en)X„/2—*0. По условию форма Q — лежанд-рова, отсюда должно следовать, что ||еп||->0, но это не так. Значит, через конечное число шагов наше построение закончится. Пусть построение оборвется через N шагов. Тогда на ортогональном дополнении L±,
280
ГЛ. 6. СПЕЦИАЛЬНЫЕ ЗАДАЧИ
£jV = lin{e1,	форма обязана быть положитель-
ной. Любое подпространство L размерности большей, чем Л7, имеет непустое пересечение с и, значит, на этом подпространстве форма Q не может быть неположительной. Отсюда следует, по определению индекса, что ind Q N. С другой стороны, на самом пространстве Ln форма Q, очевидно, неположительна, т. е. indQ^A. Итак, indQ = M Теорема Хестенса доказана.
В заключение приведем формулировку теоремы, характеризующей слабо полунепрерывные снизу формы.
Теорема 3. Для того чтобы квадратичная форма Q(x) = 1/г(Ах|х) была слабо полунепрерывна снизу, необходимо и достаточно, чтобы пространство X можно было бы разложить на два подпространства и L_, причем на L+ форма Q неотрицательна, а на L- — отрицательна и слабо непрерывна.
Доказательство ее основано на тех же идеях, что и доказательство теорем 1 и 2.
§ 6.3. Квадратичные функционалы в классическом вариационном исчислении
6.3.1.	Определения и простейшие свойства. Мы будем изучать квадратичные формы одномерного вариационного исчисления следующего вида:
<Х
Ж (х (•)) = J к (f, X, х) dt =
to
tx
= J ((Дх|х) + 2(Сх|х) + (Вх|х))^,	(1)
t.
матрицы А = Л(/), В — B(t) и С — C(t) имеют размеры п X п и непрерывно зависят от t. Матрицы A(i) и B(t) можно считать симметричными. Роль квадратичных форм такого вида в классическом вариационном исчислении весьма велика, ибо вторая вариация простейших функционалов классического вариационного исчисления, как это следует из § 2.2, является квадратичной формой вида (1).
§ 6.3. ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ
281
Квадратичную форму (1) будем рассматривать в гильбертовом пространстве №2. i Фо, Л]). Напомним, что пространство №2,1 фо, 6]) состоит из абсолютно непрерыв* них вектор-функций x(t) = (x' (/), .... xn(t)), у которых квадрат нормы производной является суммируемой функцией:
п
J|X(OM= / 2 (xk(t)fdt<0O. t„	fe=l
Скалярное произведение в пространстве W", 1Ф0Ф1]) задается формулой
Л
(X (•) IУ (• )) = (X (/о) I у О + / (X (Г) I у (0) dt.
^0
Через №2,1 ([/о, Л]) обозначается далее подпространство пространства И?", 1 ([Ль 6]), состоящее из вектор-функций х(/), обращающихся в нуль на концах отрезка: X (/0) = X (/,) = 0.
Докажем два важных утверждения о пространствах НИ? i; на них опираются теоремы следующего пункта.
Предложение 1. Для всякого вектора
£ =/= 0, и числа т е [/0, существует последовательность xm(t\ I, т), слабо, но не сильно сходящаяся к нулю в пространстве W2, i ([Лъ Л]) и при этом такая, что
lim X(x/n(.)) = (4(T)g|g). m~>oo
(2)
%тkt\ т) —
Доказательство основано на построении, подобном конструкции вариации Лежандра, см. рис. 5 на стр. 130. Проведем его для внутренней точки т отрезка [/о, ^]. Обозначим Д7П = р | \t —	Рассмотрим после-
довательность
((g/2/m) ——т|) при ts=!xm, 0	при' t&.\m.
(При этом m /по, где т0 должно быть настолько велико, чтобы отрезок Дт целиком принадлежал [/о, Л])
282
ГЛ. в. СПЕЦИАЛЬНЫЕ ЗАДАЧИ
Покажем, что она — искомая. Непосредственный под» счет показывает, что норма функции хт(-; g, т) в пространстве W", 1 ([4ь М) равна |g| и, значит, последовательность хт (•; т) не сходится к нулю сильно. Покажем, что она слабо сходится к нулю. Пусть у (t) е s W", 1 (М). Тогда в силу неравенства Коши — Бу-няковского:
I (xm(-; т) !*/(•)) |=
g, т) \y(t))dt <
tn
<l|xm(-;g, т)||( / (ЯО(*)Ц,/г->0. 'Azn	'
Стремление к нулю происходит в силу абсолютной непрерывности интеграла. Остается получить формулу (2). Вектор-функции xm(/;g, т) равномерно стремятся к нулю при т -* оо и, следовательно, последнее слагаемое в (1) в силу неравенства
\(B(f)xm(t',l,x)\xm(t-,l,x))dt^^- max || В (f) || = О (1/т) S	т 1<= [/„, tJ
atn
стремится к нулю при т -* оо. Далее непосредственно легко увидеть, что скалярное произведение
g, T)|xm(f; g, т))
равномерно ограничено и, значит, среднее слагаемое в (1)
J (C(t)xm(t- g, т) \xm(t-, g, x))dt
Am
также стремится к нулю. Наконец, в силу теоремы о среднем, мы получаем, что
J (Л (t) хт (С g, т) |хт (/; g, т)) dt-> (Л (т) g |g).
Л7П
Доказательство предложения 1 для граничной точки аналогично.
Предложение 2. Если последовательность век-тор-функций xm(t) слабо сходится к вектор-функции
§ 6.3. ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ
283
х(0 в пространстве W2.i ([Аь ), то она сильно сходится к x(t) в пространстве L2([tQ, /1]).
Доказательство. В силу теоремы Банаха — Штейнгауза из слабой сходимости последовательности хт(-) к х(-) следует, что последовательность хт(-) сильно ограничена в №2,1 ([Лз, Л]), т. е. существует такая константа С', что
«I
lxm (t0) | хт (f0)) + j (хт (/) \хт (0) dt < (С')2.
*9
Кроме того*), хЦ^ = (х„(О|/Д-))->(x(-)lj*(-))== = xft(/0).
Рассмотрим вектор-функции
ek(t, т) = (0, О, e(t, т), 0,	0),
где на &-м месте стоит функция
е(/, т) =
t-t, т
при при
Имеем в силу слабой сходимости:
(М •) I М •’*))= J (t) dt = xkm (т) - xkm (Q ->
->(х(-)|еН-,т)) = хЧт)-х6(/о)-
Из последнего соотношения и того, что xkm (Q -> х* (/0), получается, что xm(t) поточечно стремится к x(f). Но, с другой стороны, эта последовательность является равномерно ограниченной в метрике Cn (|7о,/J). Действительно, в силу неравенства Коши — Буняковского:
I хт (t) - хт (t0) | < Vt - /0II хт (•) IlS • w2, 1
*) Через /а(-) обозначен далее элемент ^2,1 ([^0» ^1])» У которого все компоненты, кроме А?-ой, тождественно равны нулю, а k-я тождественно равна единице.
284
ГЛ. 6. СПЕЦИАЛЬНЫЕ ЗАДАЧИ
Следовательно, можно применить теорему Лебега об ограниченной сходимости:
tx
/ (хт (О — X (О | Хт (0 — X (0) dt -> 0,
что и требовалось.
Следующие два утверждения относятся к квадратичным формам в произвольных гильбертовых пространствах.
Предложение 3. Неотрицательная непрерывная квадратичная форма в гильбертовом пространстве слабо полунепрерывна снизу.
Доказательство. Пусть {хп} слабо стремится к х. Тогда
lim 2 (Q(xn) — Q (х)) = lim ((Ахп |хп) — (Лх |х)) —
П-><х>	П->оа
= lim (Л (хп — х) \хп — х) + 2 (Лх | хп) — 2 (Лх | х) п ->оо
2 lim ((Лх |х„) — (Лх |х)) = 0.
гг->оо
Предложение 4. Если хп слабо сходится к х, а уп сильно сходится к у, то
(хп\уп)->(х\у).
Доказательство (в силу теоремы Банаха — Штейн-гауза) следует из элементарной выкладки:
I (хп\Уп)—(х \у) 1 = 1 (хп\уп— у) + (у \хп — х) К
НИ Уп — У\\ + \(У\хп — х)\^
<С\\уп-у\\ + \(у\хп-х)\^0.
6.3.2. Слабая непрерывность, слабая полунепрерывность снизу и лежандровость форм о7С (*(•))•
Теорема I. Для того чтобы квадратичная форма J$f(x(-)) вида (1) была слабо непрерывна в пространстве W” j ([/о, Л])> необходимо и достаточно, чтобы А (t) = 6’
Доказательство. Необходимость. Допустим, что форма Ж(х(-)) слабо непрерывна, но, вмерте с тем, Л(/)Й0. В силу непрерывности A(t) найдется
§ 6.3. ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ
285
внутренняя точка т^(/0, Л), где Л(т) =Н= 0. Это означает, что для некоторого вектора g имеем (Л (т)£|£) =/= 0. Взяв последовательность xm(t;%, т), которая была построена в предложении 1, получаем, что т) слабо сходится к нулю в то время, как
Ж(хт( •; £, т) )-> (А У= 0. Но это противоречит слабой непрерывности формы Ж.
Достаточность. В силу предложения 2, если хт(0—последовательность, слабо сходящаяся к х(/) в пространстве tT", i ([/о, ^]), то xm(f) сильно сходится к х(0 в пространстве L2([tQ, ZJ). Из определения слабой сходимости в пространстве IT", i([ta Л]) сразу же вьп екает, что последовательность хт( • ) слабо сходится к х(-) в пространстве L2([^о, ^11)- В силу сказанного оба слагаемых в (1)
/	\хт (t))dt и J (B(t)xm(t)\xm(t))dt
t,	t,
ti
стремятся к J (C (t) x (t) |x(/)) dt и J (B (f) x (t) | x (/)) dt соответственно (в силу предложения 4) и, следовательно, форма Ж (%(•)) (при условии, что A(t) = Q) является слабо непрерывной.
Теорема 2. Для того чтобы форма Ж(%(•)) была слабо полунепрерывна снизу в пространстве1^^ i([/o, М), необходимо и достаточно, чтобы было выполнено условие Лежандра, т. е, чтобы матрица A(t) была неотрицательно определенной для любого t е [/о, /1].
Доказательство. Необходимость. Если в предположении слабой полунепрерывности снизу формы Ж(х(-)) допустить, что в некоторой точке те[/0Д1] для некоторого £ е Rn выполнено неравенство (Л (т)g|£) < 0, то снова, взяв последовательность xm(t',^, т) из предложения 1, получим, что она слабо стремится к нулю в то время, как
Х’(хт(-а. т))->(Д(тП|Ю<0 = Ж(0), чего не может быть.
286
ГЛ. 6. СПЕЦИАЛЬНЫЕ ЗАДАЧИ
Достаточность. Пусть	для всех
/J. Имеем:
^(х(.)) = ^(х(.)) + ^2(х(.)), где
Л
^ (*(•)) = J (A(t)x(t)\x(t))dt,
Х2(х(.)) = Ж(х(-))~Х1(х(.)).
В силу теоремы 1 форма Жъ слабо непрерывна и тем более слабо полунепрерывна снизу. Форма Ж\ очевидным образом неотрицательна, значит, по предложению 3 она полунепрерывна снизу, а тогда и форма Ж является таковой же.
Теорема 3. Для того чтобы квадратичная форма Ж была лежандровой, необходимо и достаточно, чтобы для всех t е [/о, ^i] матрица A(t) была положительно определенной.
Доказательство. Необходимость условия Л(/)^0 следует из теоремы 2. Допустим, что (Л(т)£|£)=0, £ =# 0. Снова возьмем последовательность xm(/;g, т) из предложения 1. Она слабо сходится к нулю. Далее,
Ж(х7П(.-Л, т))->(Д(т)Ш = 0.
Значит, по определению лежандровости последовательность (•;£»**) должна сходиться к нулю сильно, но это не так. Необходимость доказана.
Достаточность. Пусть Л(/)>0, t^[to,ti], последовательность xm(t) слабо стремится к x(t) в пространстве №2,1 ([/о, Л]) и при этом Ж (хт{ •)) ->Ж (х( •)). Снова, разбив форму Х(х(-)) на две, как мы это сделали при доказательстве теоремы 2, получим сразу, что
^(^(•))->^1(х(-)).	(3)
В силу строгой положительности матрицы A(t) найдется такое число у > 0, что для любого вектора g е Rn и / е [Zo, /1] выполнено неравенство

§ 6.3. ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ
287
Воспользовавшись им, получим:
о
tt
< Y J (Л (0 (хт (0 - X (/)) | хп (0 - х (0) dt =
*0
= У	• )) + ^! (^( •») —
ц
— 2у J (A(t)x(t)\xm(t))dt->0.
^0
Предельное стремление к нулю происходит в силу (3) и слабой сходимости xm(t) к x(t). Кроме того, в силу слабой сходимости хт(-)-+х(-) получаем, что xm(tQ)-+ *>х(/о)« Суммируя, видим, что в норме W2, i ([^о, М) последовательность xm(t) стремится к x(t). Теорема 3 полностью доказана.
6.3.3. Необходимые и достаточные условия неотрицательности и строгой положительности квадратичных функционалов.
Теорема 4. Для того чтобы квадратичный функционал	был неотрицательным в W%, i ([^0, 61),
необходимо, чтобы было выполнено условие Лежандра'.
о
То же утверждение верно и для пространств W*. 1 ([^о, 6]). Доказательство сразу следует из предложения 1.
Отметим кстати, что теорема 4 является следствием из принципа максимума, точнее — из условия Вейерштрасса. (В частном случае, когда п=\, мы установили это в п. 2.2.4.)
Далее предполагается, что матрицы Л(/) и C(t) непрерывно дифференцируемы по t.
Допустим, что на отрезке [/0, Л] выполняется усиленное условие Лежандра
te= [/0,
288
ГЛ. 6: СПЕЦИАЛЬНЫЕ ЗАДАЧИ
Рассмотрим уравнение Эйлера функционала «У. Оно., имеет вид*)
-4^+^=-4^+c’x)+c*+fix=0- и)
Для всяких go Rn и gi е Rn существует единственное решение этого уравнения, удовлетворяющее начальным условиям х(/0)= g0, х(/0) = gb
В самом деле, усиленное условие Лежандра дает возможность уравнению (4) придать вид линейной системы:
i = y, y = P(t)y + Q(t)x,	(4')
где
р (0 = - А~' (0 (я (0 + с' (0 - с (0), Q(t)=—A~l (/) (С* (f) —-В (/)).
Для таких систем выполнена теорема существования и единственности решения задачи Коши (см. теорему 1 § 0.4).
Обозначим через Ф(/, /0) фундаментальное (матричное) решение уравнения (4), т. е. решение, удовлетворяющее начальным данным
Ф(/о,/о) = О, Ф(/0Л0)=Д	(5)
Точку т назовем точкой, сопряженной с точкой tQ, если матрица Ф(т,/0) является вырожденной. (Отметим, что при п = 1 определение сопряженной точки было дано в § 2.2.)
Очевидно, что это определение равносильно тому, что существует нетривиальное решение х0(0 уравнения (4), удовлетворяющее нулевым краевым условиям
Хо (to) = ХО (т) = О, х0 (0 Ф 0.	(6)
Теорема 5. Пусть для квадратичной формы JJf(x(-)) выполнено усиленное условие Лежандра. Тогда для того, чтобы она была неотрицательно определена
*) Уравнение (4) для функционала ^"(х»(-)) (х(•), х(-)) называют уравнением Якоби функционала Z7(x(-)) простейшей задачи вариационного исчисления (см. п. 2.2.5). В силу сказанного уравнение (4) мы называем далее уравнением Эйлера — Якоби.
§ 6.3. ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ
289
xt (0 =
(7)
в пространстве W", i ([Ль М)> необходимо, чтобы в интервале (£о, 6) не было точек, сопряженных с точкой t$.
Доказательство. Допустим, что в интервале (/0, t\) есть точка т, сопряженная с точкой /0, и придем к противоречию с неотрицательностью JSf(x(-)). Возьмем нетривиальное решение x0(i) уравнения Эйлера — Якоби (4), удовлетворяющее краевым условиям (6). Положим
х0(/), если t е [/о, т],
О,	если t е [т,
Интегрируя по частям, получаем т
^(Х,( •)) = //<(/, х0, x0)dt =
т
= J ((Ах01 х0) + 2 (Сх01 х0) + (Вх01 х0)) dt = f()
—ST	“Ь £*хо) 4“ “F Вх0 | х0) dt = 0.
fo
По предположению форма УС неотрицательно определена. Следовательно, х*(/) доставляет минимум в такой задаче оптимального управления:
f»
УС (х (•)) = J К (Л х, и) dt -> inf; х = и, f«
X (/0) = X (ti) = 0.
Применим к задаче (7) принцип максимума Понтрягина (теорема 1 из § 2.4). В соответствии с этой теоремой гамильтониан <?$?(/, х«(0, p(t), 1) является непрерывной функцией на отрезке Цо, Л]. Напомним выражение для Ж
W(t, х.(/), Р(0. 1) = Я(/, х.(0, «ДО, Р(0, 1). где
И (t, х, и, р, 1) = (р | и) — К (t, х, и) =
=(/?!«) — (Аи[и)— 2 (Си \х) — (Вх lx), ut(t) = x,(t), р(0=-= 2Д(0«.(0 + 2С(/)х,(/)
Ю А- д. Иоффе, В. М. Тихомиров
290
ГЛ. 6. СПЕЦИАЛЬНЫЕ ЗАДАЧИ
Из этих формул вытекает, что на отрезке [т, гамильтониан тождественно равен нулю, ибо на этом отрезке %*(/) = u*(t) = 0. В силу того, что х*(т) = %о(т) = 0, получаем:
<^(т— 0, х* (т — 0), р(х— 0), 1) =
= (Л(т)Хо(т) |х0(т)) = у.
Если допустить, что у = 0, то вследствие усиленного условия Лежандра получится равенство нулю производной хо(О в точке т. Тогда нетривиальное (из-за нашего выбора) решение уравнения Эйлера — Якоби (4) х0(/) удовлетворяет начальным данным: х0(т) = Хо(т) = = 0. В силу теоремы единственности решения задачи Коши для линейной системы этого не может быть. Противоречие, к которому мы пришли, означает, что функция х*(/) не удовлетворяет принципу максимума, ибо Ж имеет разрыв в точке т. Следовательно, найдется допустимая функция х(/), у которой х(/) ограничена и измерима (и значит, x(t) е №2> i ([^о, причем Jf(x(-))<0. Противоречие с неотрицательностью Ж получено. Теорема доказана.
Замечание. Теорему 5 можно было бы доказать, сославшись на то, что на ломаной экстремали х#(/) не выполнены условия Вейерштрасса — Эрдмана (см. п. 2.4.3).
Теорема 6. Для того чтобы квадратичная форма J4f(x(-)) была неотрицательно определена в пространстве 1^2, i( [/о, Л]), достаточно, чтобы выполнялись усиленные условия Лежандра и Якоби, т. е. чтобы, во-первых, матрица A(t) была положительно определена для всех t из отрезка [/о, Л] и, во-вторых, чтобы на полуинтервале не было точек, сопряженных с точкой tQ.
Доказательство. Вследствие усиленного условия Якоби фундаментальная матрица Ф(/До) уравнения Эйлера — Якоби (4) невырождена на полуинтервале (/о, ^1]. В силу теоремы о непрерывной зависимости решений дифференциального уравнения от начальных данных, примененной к уравнению (4), можно найти такое 6 > 0, что матрица Ф(Мо~ 6) будет невырожденной на всем отрезке [/о, ^i]- Положим
x(t, Л) = Ф(/, t0 — б)Л, XeR".
§ 6.3. ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ
291
Из определения матрицы Ф вытекает, что для всякого ZeRn вектор-функция t —*x(t, X) является экстремалью функционала ^(х(-)). Далее, для любых т е [/0Д1] и g е Rn существует единственная кривая семейства {x(t, 2v)}, проходящая через точку (т, g). Действительно, для того чтобы было верно равенство х(т, X) = g, необходимо и достаточно, чтобы Z=Z(t, g) = Ф~! (т, /0— d)g. Вектор-функцию х(/, Х(т, g)) обозначим х(/;т, g). Получилось, что семейство экстремалей {х(/Д)} однократно покрывает полосу [/0, X Rn. (Отметим, что все эти экстремали обращаются в нуль в точке /0 — б.) Такое семейство называют центральным полем экстремалей функционала J$f(x(-)) с центром в точке (f0 — 6,0). Обозначим через U (%, g) вектор х(т;т, g). Вектор-функцию U(x, g) называют функцией наклона поля x(t, Z). Отметим явное выражение для U:
и (т, £) = Ф (т, t0 - 6) Ф~‘ (т, t0 - б) t
Согласно основной формуле Вейерштрасса имеет место следующее тождество в пространстве W%,1:
*1
X (х (•)) = J (t, х (0, и (t, х (0), X (/)) dt, (8) /о
где <?(/, х, х, g) есть ^-функция Вейерштрасса функционала а £/(/, х)— введенная выше функция наклона поля.
Основная формула Вейерштрасса составляет фундамент вейерштрассовской теории в вариационном исчислении. Ее доказательство содержится в большинстве учебников по этому предмету. В гл. 7 будет приведен независимый от излагаемой здесь теории квадратичных форм вывод основной формулы Вейерштрасса (см. теорему 3 из § 7.4).
Приведем выражение ^-функции функционала
#(/, х, х, £) = (Д(0(£-хШ-х).
10;
292
ГЛ. 6 СПЕЦИАЛЬНЫЕ ЗАДАЧИ
Если воспользоваться этим выражением, то из (8) получается тождество (его можно проверить и непосред* ственно)
X (%(•)) =
6	о
= / (Л (/) (U (I, x(f))-x(t)) I U(t,	х(.) е W", i,
из которого сразу следует искомая неотрицательная определенность формы Ж. Теорема доказана.
Следствие. В условиях теоремы 6 квадратичная форма Ж(х(-)) является строго положительной в пространстве W",1 ([/о, 6]), т. е. для некоторого а>0 имеет место неравенство
Ж (х (•)) >а||х( •) ||^„	x{-)^Wn2A{[t0, /(]).
Действительно, выберем а столь малым, что, во-первых, Л(/) — а/> 0 (для всех Л]), а во-вторых, чтобы на полуинтервале (/о, Л] не было точек, сопряженных с точкой /о, У функционала J^(x(-)), получающегося из Ж(х(-)) заменой A(t) на A(t)— al. Применив’теорему 6 к функционалу Ж, получаем требуемое.
§ 6.4. Дискретные задачи оптимального управления
6.4.1. Формулировка задачи. Дискретные задачи оптимального управления (или задачи оптимального управления с дискретным временем) возникают при исследовании таких управляемых объектов, в которых изменение управляющего воздействия и изменение текущего состояния может производиться лишь в строго определенные изолированные моменты времени. Такого рода задачи часто возникают в приложениях. Например, многие задачи управления так называемыми импульсными автоматическими системами, многие задачи управления, возникающие в экономике и т. д., естественно формулируются как дискретные задачи оптимального управления»
§ 6.4. ДИСКРЕТНЫЕ ЗАДАЧИ
293.
Задача, которая будет рассматриваться в этом пара-графе, ставится следующим образом*):
N—\
3 (х, и) = s fi щ) -> inf;	(1)
i=0
xZ + l=<Pi(*i, ui)> Z = 0, 1, ..., N — 1,	(2)
^GE^czR', / = 0, 1, N — 1,	(3)
h0 (x0) = 0, hN (xN) = 0,	(4)
&(х()<0, Z=1.........N-l.	(5)
Допустимые элементы в задаче (1) — (5) суть пары конечных последовательностей х = (х0,	...» xN), и =
= (и0,..., uN-\), Xi е Rn, щ e Rr, удовлетворяющие условиям (2)-— (5).
Мы получим в этом параграфе необходимое условие экстремума в задаче (1) — (5), известное под названием дискретного принципа максимума, и опишем метод динамического программирования, дающий удобный вычислительный формализм решения таких задач, с одной стороны, и содержащий возможный подход к получению достаточных условий в теории оптимального управления, с другой.
На протяжении всего параграфа мы предполагаем, что
а)	выполнены следующие требования гладкости: функции fu / = 0, 1, ..N— 1, и git i = 1, ... , N— 1, и отображения ф,: Rn X Ui~>HN, h0: Ra-~>R5°, hx: Ra->Ry’ непрерывны по совокупности переменных и непрерывно дифференцируемы по х;
б)	при всех f = 0, 1, ..., N — 1, xeRn функция и—>^-(х, и) и отображение 1/->фг(х, и) удовлетворяют следующему условию выпуклости: если и е Uv^Ui и O^a^l, то найдется такое w^Ui, что
fi (х, ш) < afi (х, и) + (1 — a) ft (х, у),
ф,- (х, ш) = афг (х,. и) + (I — а) фг- (х, и).
*) Подчеркнём аналогию этой задачи с задачей оптимального управления с фазовыми ограничениями (см. задачу (1) — (5) в § 5.2).
294
ГЛ. 6. СПЕЦИАЛЬНЫЕ ЗАДАЧИ
Если условия гладкости не содержат в себе ничего неестественного, то второе условие — условие выпуклости — по крайней мере с первого взгляда кажется, наоборот, искусственным. Однако в приложениях оно нередко выполняется. Во-первых, оно автоматически выполняется в тех случаях, когда задача (1) — (5) получается в результате «дискретизации» обычной непрерывной задачи (этот факт следует из теоремы Ляпунова, которую мы докажем в гл. 8). С другой стороны, и во многих типично дискретных задачах, например возникающих в экономике, условие выпуклости также оказывается выполненным.
6.4.2. Дискретный принцип максимума. Нетрудно видеть, что благодаря условиям а) и б) задача (1) — (5) удовлетворяет всем требованиям, которые мы предъявляли к гладко-выпуклым задачам в теореме 3 из § 1.1. Последнее из отмеченных в этой теореме требований, связанное с конечной коразмерностью, в нашем случае выполняется автоматически, поскольку все пространства— конечномерные. Поэтому для вывода необходимых условий экстремума в задаче (1) — (5) можно использовать экстремальный принцип в гладко-выпуклых задачах.
Итак, пусть =(%*!, . ..,x*N),	(w*o, •. •,	—
точка локального экстремума в задаче (1) — (5). (В понятие локального экстремума вкладывается тот же смысл, что и в п. 1.1.3.) Напишем функцию Лагранжа задачи (1) —(5):
w-i	w-i
Z = ло 2 A Ut) + 2 (pi+1 l*i+i — Ф/ (Xh Ui)) 4-i=Q	i=0
N-l
+ (lo I Ao (*o)) + Un \^n (xn)) + 2 M'/g’z (*/). i=l
В соответствии с экстремальным принципом в гладковыпуклых задачах (теорема 3 § 1.1) существуют множители Лагранжа ^>0,	i = 1, ..., N, /0^ Rs°,
lx е RSl,	..., Рдг-i^O, не все равные нулю и
такие, что выполняются следующие соотношения:
§ 6.4. ДИСКРЕТНЫЕ ЗАДАЧИ
295
во-первых, условия локального минимума функции Лагранжа по х: дЗ?
дхо Х—Х,
WОх (Х*0’	^Ох (Х*0» и*о) Р\
“Ь ^0 (**) ^0 — О’
g7"| _ = Wix(**i’ u*i) “ Фи (x*i> u*i)p2 +
* 'X—X*
и—и*
+ Р1 + И1£Ж1) = О>
и	л с/	/	\
Д?	= Л0< N— 1, X (А1 ’ U»\)
OXN-l х=х, и—и*
^N-l, х (Х* ЛГ— 1» N-l) Pn “Ь
+ PjV-1	(Х* 2V—1) = О,
== Pyv 4“ hN = 0;
х=х* w=«*
dxN
во-вторых, условия минимума функции Лагранжа по и:
«н)-(РгЫх*Р «*/)) =
= mi« М (х»> и) ~(Pi | <Рг (x*p «)),	(7)
uie
/ = 0, 1, N — 1,
и, в-третьих, условия дополняющей нежесткости
=	.... ^-1.	(8)
Положим
Hi (x, и, p, Ao) = (Pi IФ; (xb u{)) — hofi (xh u{).
Тогда из (6) следует, что векторы pit ..., рм удовлет. воряют следующей рекуррентной системе соотношений:
_______(xti> u*l< Pi + l’ Ао) ____________ дх
Pig'iM
(9)
которая называется сопряженной системой. Положим, далее, p0 = H'Ox(xiQ, uiQ, plt^0). Тогда в силу первого
296
ГЛ. 6. СПЕЦИАЛЬНЫЕ ЗАДАЧИ
равенства в (6)
Po = /zo*(xJZo’	(10)
а согласно последнему равенству в (6)
Pn =	(11)
Наконец, равенство (7) можно переписать следующим образом:
U*i> Pi + v М=	и’ Pi + v Ао)- (12)
Итак, мы доказали следующий результат.
Теорема 1 (дискретный принцип максимума). Пусть пара х* = (х*0, ...» x*n), u* = (u*q,..., u*n-\) является точкой локального минимума в задаче (1) — (5). Тогда существуют числа Ло^О, Hi^O, ..., |xyv_I^0 и векторы pQ е R", ..., е R", Zo Rs°, l{ е Rs*, не равные одновременно нулю и такие, что
а)	последовательность (pN, Pn-ъ •••, Ро) является решением сопряженной системы (9), удовлетворяющим конечным условиям (10), (11);
б)	при всех i = 0, 1, ..., N—I выполнено условие максимума (12);
в)	числа |д.ь ..., p/v-i удовлетворяют условию дополняющей нежесткости (8).
Подчеркнем аналогию приведенной теоремы 1 и теоремы 1 из § 5.2, где был получен принцип максимума для задач с фазовыми ограничениями.
Дискретный принцип максимума вместе с условиями (2), (4), (5) содержит полную систему соотношений для определения искомых переменных Хо, ...» xNt и0, ... ..., tzjv_i и множителей Лагранжа pi, ..., pN_b ро, •••, Pn> lo, In- В самом деле, хг и Pi суть д-мерные векторы, Zo есть So-мерный и lN есть Sjv-мерный векторы, т. е. полный набор искомых величин содержит 2 (N + 1) п + Nr + п + So + sN параметров. С другой стороны, каждое из равенств (2) содержит п соотношений, условия (4)—So + sN соотношений, условия (5) — п соотношений; каждое уравнение сопряженной системы (9) содержит п соотношений, условия (10), (11) и (8) содержат тоже по п соотношений каждое и, наконец, каж
§ 6.4. ДИСКРЕТНЫЕ ЗАДАЧИ
297
дое из равенств (12) определяет, по существу, г соотношений, характеризующих точку, в которой функция Нг достигает максимума по и. б итоге получается 2(N + 1)и + Nr + п -|- So + sN соотношений, столько же, сколько и неизвестных.
6.4.3.	Метод динамического программирования. Для иллюстрации основной идеи этого метода рассмотрим упрощенный вариант задачи (1) — (5):
ЛГ-1
2 fi (xt, Ui)-^ inf;
(13)
*/+i =Ф/ (Xt, Щ], Z = 0, 1,	— 1,	(14)
щ «= Ut <= Rr, Z = 0, 1, .... N — 1,	(15)
Xo — заданная точка из Rn,	(16)
т. e. задачу без фазовых ограничений с закрепленным левым и свободным правым концом.
Наряду с задачей (13) — (16) рассмотрим семейство «возмущенных» задач, каждая из которых определяется номером & = О, 1, ..., N—1 и вектором xeRn:
N-1
2 fi (Xi, Ui) -> inf;	(13')
i=k
Xi+\ = 4>i(Xi, u{),	l = k, &4-1, ...» N — 1,	(14')
u(eI/(cR',	i = k, k+ 1, .... N — 1,	(15')
xk = x.	(16')
Нетрудно видеть, что задача (13) — (16) получается из задачи (13') — (16z), если положить k = 0, х = х0.
Обозначим через F^(x) значение задачи (13') — (16х), Тогда Fo(*o) — значение задачи (13) —(16).
Теорема 2. Функции Fk(x) являются решениями системы функциональных уравнений Веллмана
Fi(x)= inf (Ш«)^(фИм))), / = Af, ...,	(17)
и €= Ui
с конечными условиями
(18)
298
ГЛ. 6. СПЕЦИАЛЬНЫЕ ЗАДАЧИ
Если последовательности х = (х0, .. •, xN) и и = = (и0, ..., uN_i) допустимы в задаче (13) — (16) и
Pi (xi) — fi (Xi, Ui) + Pi + l (*i + l)	(19)
для всех i = 0, 1, ..., N— 1, то пара (x, и) является решением этой задачи.
Доказательство теоремы очень просто. Соотношения (17), (18) следуют прямо из определения функций Fk' p-i	1
Fk (^) ===	। .2 fi (.Xi, Ui) } X/1==ф/ (Xf, Ui)t Ui^Uiy Xk X
I i—k	J
f	f N-l
= inf \fk (x, uk) + inf j 5 fi (xi, иг)\ X/+t = I	I fe+i
= <fi(Xi,Ui), Ui^Ui, xft+1 = qp(x,	=
= inf (x, u) + Fk+t (qpft (x, u))\ut=Uk}. Второе утверждение тоже проверяется непосредственно: То (*о) = fo (хо, «о) + Fi (xt) = fQ (x0, «0) + fi (xb «0 + + F2(x2)== ... =fo(xo, Mo) + ••• + ftf-l (Xjv-1, Ujv-1) + A-l
+ Fn (xn) = 2 ft (xh Ut), i=0
откуда следует, что x= (хо, ..., x^), «=(«o, .... uN-i) — решение задачи (13) — (16). Теорема доказана.
Комментарий к гл. 6. К § 6.1. Более подробно о линейном программировании см. Гасс [1], Рокафеллар [14], Юдин и Гольштейн [1].
К §§ 6.2 и 6.3. В этих параграфах мы во многом следовали работе Хестенса [3]. К этой тематике естественно примыкает известная теорема Морса: индекс квадратичной формы классического вариационного исчисления равен числу сопряженных точек на отрезке [Ль ^11-
к § 6.4. Доказательство теоремы 1, близкое к приведенному, содержится в книге Пшеничного [4]. Подробное изложение теории оптимального управления дискретными объектами можно найти в книгах Болтянского [5] и Пропоя [2]. О методе динамического программирования см. книги Ариса [1], Беллмана [1], Беллмана и Калабы [1].
Глава 7
ДОСТАТОЧНЫЕ УСЛОВИЯ ЭКСТРЕМУМА
Эта глава занимает несколько особое положение в книге и по содержанию, и по стилю изложения. Это связано с причинами, о которых говорилось во введении, а именно с тем, что теория достаточных условий еще далеко не завершена. Поэтому главное внимание уделено здесь не доказательству теорем общего характера, а обсуждению на отдельных примерах основных понятий и способов получения достаточных условий. Эта программа проведена (правда, несколько фрагментарно) для гладких и выпуклых задач и частично для простейшей задачи классического вариационного исчисления. В этом последнем случае известные достаточные условия получаются в основном традиционными методами.
§ 7.1.	Метод возмущений
7.1.1.	Возмущения экстремальных задач. Пусть X и Z— некоторые множества, f0’ X —>R — функция на X, Cq — подмножество X. Рассмотрим экстремальную задачу:
fo(x) —> inf; xeeCq.	(1)
Включим задачу (1) в семейство экстремальных задач z)->inf;	хеС(г),	(2)
где f: XXX—>R, С (г)—многозначное отображение из Z в X. Предполагается, что для некоторого 20 выполнены равенства
f (х, zQ) = fo (х), С (z0) = Со.
При выполнении этих равенств задача (2) называется возмущением задачи (1), а множество Z, фигурирующее в постановке задачи (2), называется классом возмущений.
Нижняя грань в задаче (2) является функцией от г. Она обозначается далее 5(г) и называется S-функцией
300
ГЛ. 7. ДОСТАТОЧНЫЕ УСЛОВИЯ ЭКСТРЕМУМА
возмущения задачи (1). В случае, если X — топологическое пространство, будут рассматриваться также и локальные S-функции, определенные в окрестности решения х* задачи (1):
8и(г) = inf f(x,z).
х с= С (г)П 17
Здесь U— некоторая окрестность точки х* в пространстве X. Такие функции будем называть S-функциями в точке х*.
Функцию ф(х), определенную на пространстве X, назовем К-функцией задачи (1) в точке х*, если она удовлетворяет таким условиям:
а)	В точке х* функции qp и f принимают одинаковые значения:
Дх,)==Ф(х.).
б)	Функция ф достигает своего минимума на множестве Со в точке х*:
ф(х)>ф(х„), хеСв.
в)	Разность f(x) н ф(х) неотрицательна на X:
f (х) — ф (х) >0, х е X,
или, что то же, она достигает на X своего абсолютного минимума в точке х*.
Наряду с глобальными /(-функциями, определенными выше, будут рассматриваться локальные К-функции, когда условие б) выполнено лишь для точек х из пересечения Со с некоторой окрестностью U точки х#, а условие в)—лишь для x<=U.
Предложение 1. Пусть для задачи (1) в точке х* построена некоторая К-функция (локальная К-функ-ция). Тогда точка х* является решением задачи (1.) (доставляет локальный минимум в задаче (!)).
Действительно,, в силу свойств а)—в) получаем, что если х е Со (х е Со A U), то
f (х) — f (xj > ф (х) — ф (xj > 0.
Легко понять, что если ф(х) есть /(-функция задачи (1) в точке х*, то она будет Л-функцией любого другого решения задачи (1). Поэтому ее естественно называть К-функцией задачи (1).
§7.1. МЕТОД ВОЗМУЩЕНИЙ
301.
Замечание. Мы получили, что наличие K-функции является достаточным условием минимума. Проблема состоит в том, чтобы доказать ее существование и указать способ ее построения. Некоторые общие приемы построения К-функций обсуждаются в дальнейших параграфах. В возможности построения К-функции находит свое отражение принцип снятия ограничений, о котором говорилось во введении.
7.1.2.	Стандартные возмущения и стандартные К-функции. Возмущение отдельной экстремальной задачи может быть осуществлено разными способами. Однако для задач, где ограничения задаются функционально, существует стандартная процедура возмущения. Пусть А — некоторое множество (обычно это подмножество линейного пространства X), Y — линейное пространство. Рассмотрим задачу
/0(x)->inf; F(x) — 0, fj(x)^O, 1^/^п, хеЛ. (Г)
Здесь 4->R,	Р- A-+Y.
Стандартным возмущением задачи (!') будем называть такой класс задач:
fo (х) -> inf; F (х) — у = 0,	(х) — щ < 0,
i = 1, ..., п, ХЕ А.	(2')
Стандартное возмущение не затрагивает функционал /о(х); класс возмущений Z есть прямое произведение УХИ”.
Перейдем к конкретным классам экстремальных задач.
Гладкие задачи с ограничениями типа равенств. Так в п. 1.1.1 были названы задачи вида
f(x)->inf; F(x) = 0,	(3)
где X и Y — банаховы пространства, F: X —► У, f и F принадлежат классу в некоторой области U cz X.
Стандартное возмущение задачи (3) имеет вид .
f (х) —> inf;	F(x) — y = 0.	(3')
Значит, S-функция этого возмущения определяется так: S(y) = inf {f (х)| F(x) = у}.
Стандартной К-функцией задачи (3) будем называть /(-функцию, вида
Ф (х) = (ф ° F) (х), ф: Y -> R.	(4)
302
ГЛ. 7. ДОСТАТОЧНЫЕ УСЛОВИЯ ЭКСТРЕМУМА
Из (4) следует, что на ограничении Со = {xeX|F(x) = = 0} функция ф(х) постоянна, и значит, требование б) в определении K-функции выполнено всегда. Следовательно, для того чтобы функция вида (4) была /(-функцией (локальной К-функцией) задачи (3), необходимо и достаточно, чтобы выполнялись соотношения: ф(0) = = f(x) — ф(*)> 0, хеДхе t/).
Выпуклые задачи. Пусть X и Y — локально выпуклые пространства. Задачу (Г) будем называть выпуклой, если все функции 0 i п, и множество ЛсгХ являются выпуклыми, а ограничение типа равенств задается аффинным соотношением F(x) —Хх + у0, Ае2’(Х, У). (В гл. 1 при рассмотрении выпуклых задач соотношения типа равенств отсутствовали.)
Стандартной К-функцией выпуклой задачи назовем К-функцию вида п
Ф (х) = — {у', F (х)> — s Ufi W + fo (х,),	(5)
i=l
где
Az>0, W/(x,) = 0,	(5')
Из соотношений (5) и (5Z) следует, что на ограничении Со = {х е A |F(x) = 0, A(x)^0, функция ф(х)— — /о(х*) является неотрицательной, а вследствие (5') получаем, что ф(х*) = fo(x*). Таким образом, для функции ф(х), определенной соотношениями (5) и (5Z), требования а) и б) в определении К-функций всегда выполнены. Значит, для того чтобы функция ф(х) вида (5), (5Z) была К-функцией выпуклой задачи, необходимо и достаточно, чтобы было выполнено неравенство:
f (х) — ф(х) ^о,	хе Л.
Задачи вариационного исчисления и оптимального управления. Пусть
У (х( • )> и (•)) = J f (/, х, и)
to
X = ф (t, X, и), X (/0) = Xq, X (tl) = Xj,
U^U
(6)
§ 7.1. МЕТОД ВОЗМУЩЕНИЙ
303
— задача оптимального управления с закрепленными граничными условиями. Рассмотрим отрезок [/о, /[], со-держащий отрезок [/0, /1] внутри себя. Включим задачу (6) в семейство таких задач:
3 (х (•), и (•), т) = j f (/, х, и) dt-> inf; х = ф(/, х, и), х(/0) = х0, х(т) = £,
(7)
При этом вектор-функции х(/) и u(t) считаем определенными на [/6, ^1]. Возмущение (7) назовем стандартным возмущением задачи (6). Нижняя грань в последней задаче является функцией (т, £). В вариационном исчислении ее чаще всего называют функцией действия или эйконалом, в оптимальном управлении ее называют функцией Беллмана.
Стандартной К-функцией задачи (6) в точке (х*(-), и*(-)) будем называть Л-функцию следующего вида:
O(x(.),u(-)) = J(x.(.), «.(•)) +
+ g(fo, х0)— g(tu Х1).	(8)
Без ограничения общности можно всегда полагать
*i) = g(to, Хо) = 0. Если (х( •), и( •)) — допустимая пара в задаче (6), то легко видеть, что
т. е. свойства а) и б) в определении /(-функции выполняются. Для того чтобы функция Ф(х( •),«(•)) вида (8) была /(-функцией, достаточно, чтобы неравенство
Г //	\	dg (/, х) ( dg (t, х) I ,, Л
f (/, X, и)----------—Q-x— | ф (/, X, и)) —
(/),«.(/))> О (9)
было верно для всех (/, х) и и е U и чтобы оно обращалось в равенство, если х = х^(/), u = u*(t).
304
ГЛ. 7. ДОСТАТОЧНЫЕ УСЛОВИЯ ЭКСТРЕМУМА
Аналогично можно написать условие для локальной /(-функции. Это условие состоит в том, чтобы неравенство (9) имело место для (/, х) из некоторой окрестности V cz R X Rn, в которой лежат точки (/, х*(/)).
Предложение 1, несмотря на всю свою простоту, открывает возможность для разного рода эвристических способов построения /(-функций и тем самым для получения достаточных условий. Покажем это на примере. Рассмотрим простейший квадратичный функционал вариационного исчисления
ЛГ(х(-)) = j (4 (Z) х2 + В (О X2) dt
*0
и задачу о его минимизации при нулевых граничных условиях. Будем искать /(-функцию в точке х*(/)^ 0 в виде (8), где функция g квадратична по х:
g(t,x) = — D (t) х*.
Тогда для того чтобы было выполнено неравенство (9), надо, чтобы для всех х, х и t е [Zo, ZJ выполнялось соотношение
A (t) х2 + 2D (0 хх + Ф (0 + В (0) х2 0.
При фиксированном t — это квадратичная форма по х и х. Для того чтобы она была неотрицательна, необходимо и достаточно, чтобы были выполнены неравенства
Л(0>0, Л (/) (D (/) + В (/)) -D2(/)>0.	(10)
Предположим, что выполнены усиленные условия Лежандра и Якоби (см. §§ 2.2 и 6.3). Это означает, во-первых, что Л (/) > 0, /е[^о, Ч и, во-вторых, что существует решение u0(t) уравнения Эйлера — Якоби
--^-(4(0й) + В(0« = 0.	(11)
не обращающееся в нуль на всем отрезке [Zo, Л]. Удовлетворим соотношениям (10), обратив второе неравенство в равенство, т. е. решив дифференциальное уравнение Риккатти:
Р + В-В2/Л = 0.	(12)
Уравнению (12) удовлетворяет, как это легко проверить непосредственной подстановкой с использованием (11), функция DQ(t) — —A(t)uo(t)luo(t). Итак, снова доказан результат, полученный в более общей ситуации (в теореме 6 из § 6.3): для неотрицательности квадратичной формы 3?(х(-)) в пространстве W2 j ([ZQ,/J) достаточно, чтобы были выполнены усиленные условия Лежандра и Якоби.
§ 7.2. ГЛАДКИЕ ЗАДАЧИ
305
§ 7.2. Гладкие задачи
Этот параграф тематически примыкает к § 1.2. Гладкие задачи здесь рассматриваются лишь при условии регулярности отображения F. Оказывается, что в этом случае для решения х* можно найти локальную /(-функцию, удовлетворяющую условию Липшица и сколь угодно близкую к дифференцируемой. Если же наложить еще более жесткие требования на отображение Г, то окажется, что сама S-функция в точке х* является дифференцируемой.
7.2.1. Необходимое и достаточное условие минимума.
Теорема 1. Пусть точка х* допустима в задаче
f (х) ->inf;	f(x) = 0,	(1)
и при этом функция f и отображение F: X-+Y принадлежат классу Сх в точке х*. Предположим также, что выполнено условие регулярности отображения F в точке х*. Тогда для того чтобы в точке х* достигался локальный минимум в задаче (1), необходимо и достаточно, чтобы нашелся такой элемент у* е У*, что для всякого у > 0 функция
Ф¥(х) = (Ф¥°Я(х) = -(Г. Р(х)>-УИ(х)|| + Цх.) (2)
была бы локальной К-функцией задачи (1).
Поясним сказанное. В теореме 1 утверждается: для того, чтобы в точке х* достигался локальный минимум, необходимо и достаточно существование такого элемента £/*еУ*, что для любого у>0 можно подобрать 6 = б (у) > 0, при котором функция
Фу W = f W — Фу (х) = f(x)— f (Х,) + (у*, F (х)> +
+ уИ(х)||=<?(х, у\ 1) + YII F (х) || - f (х.)	(3)
достигает в шаре	минимума в точке х,:
Ф7 (х) > Фу (х.) = 0,	|| х— xj|<6.	(4)
Доказательство. Достаточность следует из предложения 1 § 7.1. Докажем необходимость. По условию х* — точка локального минимума в задаче (1). В силу правила множителей Лагранжа (теорема 1 § 1.1)
306
ГЛ. 7. ДОСТАТОЧНЫЕ УСЛОВИЯ ЭКСТРЕМУМА
найдется множитель Лагранжа у* е Y такой, что
Г(х.) + Г*(х.)^ = 0.	(5)
Положим g(x) — f(x)— f(x*)+(y*, F(x)). В силу (5) получаем g(x«) — g'(x*) = 0. Применим к отображению f(x) теорему Люстерника из § 0.2. В соответствии с ней найдется окрестность V точки х», константа & > 0 и отображение х—>£(х) окрестности V в X такие, что
F(x + z(x)) = F(xJ = 0,	|| z (х) || < k || F (х) ||.	(6)
Найдем е > 0 так, чтобы при выполнении неравенства ||х— х*|| < е имели бы место соотношения:
а) х е V, б) f (х) — f (xj > 0, если F (х) = 0,1
в) II g'WII <	(
Соотношению (76) можно удовлетворить потому, что х*— это точка локального минимума, соотношению (7в) — в силу непрерывности g'(х) в точке х*. Наконец, найдем 0 < б < е/2 так, чтобы при ||х— х*|||< б было выполнено неравенство ||F(x) || <	Тогда из-за
(6) при ||х — xj| < б получим:
||г(х)||<^И(х)||<е/2,	1
l|x + z(x)-xj|<||x-xj| + ||z(x)||<8. /	(8)
Используя (76), (8) и (6), получаем неравенство
g (х + z (х)) = f (х + z (х)) — f (х.) 4-	F(x-\-z (х))> > 0.
Из него в силу (6), теоремы о среднем и (7в) будем иметь:
g (х) > g (х) — g (х + z (х))>
> —sup {II g'(£) |||£<=[х, x + z(x)]} II z (х) ||>
^ — yk~l-k\\F(x) || = - у || F (х) ||.
Остается положить Фу(х) = g(x) + yll^W II, и нужные соотношения (3) и (4) будут выполнены. Теорема доказана.
Следствие (необходимое условие минимума в терминах второй производной). Пусть в дополнение к требованиям теоремы 1 функция f и отображение F
§ 7.2. ГЛАДКИЕ ЗАДАЧИ
307
принадлежат классу С2 в точке х*. Тогда для того чтобы точка х* была точкой локального минимума в задаче (1), необходимо, чтобы для любого вектора g из ядра отображения F'(x*) было выполнено неравенство
&хх(х.,у*, l)(U)>0.	(9)
Функция 3? в (9)—это функция Лагранжа задачи (1) = f (х) + {у*, F (х)), а у*— множитель Лагранжа из теоремы 1.
Действительно, пусть je KerF'fxJ, |||||= 1, но при этом 3? хх (л,, у*, !)(£,£) =— а < 0. Выберем у>0 так, чтобы у11^"(х.) Q, Ю 11<а/6, и найдем 6>0 так, чтобы из неравенства ||х||<6 следовали соотношения | F (х. + х) - F (х,) - F' (х.) х - ± F" (х.) (х, х) || <	,
||^К + х, .)-^(х., -)-{3?х{х*, .),х)~
-	.)(Х,Х)|<^-.
Тогда для функции Фу(х), определенной в (3), получим: фУ(х.+®	(х„ •)а.ю+4- +
+ Nt2 IIF" (х.) (g, g) || 4- 4- < ~	= 0,
что противоречит теореме 1.
7.2.2.	Достаточное условие минимума в терминах второй производной.
Предложение I. Пусть выполнены условия следствия из теоремы 1. Предположим далее, что для некоторого множителя Лагранжа у* е У* верны соотношения'.
3?х(х*,у*, 1) = 0,	1
3?хх (*., у, 1) & в) > аП II2, & G= Ker F' (х.) (а > 0)./ (10)
Тогда точка х# доставляет локальный минимум в задаче (1).
Замечание. Условие (10) означает, что подпространство Li = Кег/7'(х*) гомеоморфно гильбертову пространству* Действительно, для 11, ^2 е положим:
(11\Ы=Яхх(х„ у*, 1) (lb h).
308
ГЛ. 7. ДОСТАТОЧНЫЕ УСЛОВИЯ ЭКСТРЕМУМА
Билинейность и симметрия выражения (£i | сразу следуют из определения второй производной. В силу же строгой положительности этой формы получается невырожденность скалярного произве-
дения:
Из неравенств
(& I &)>0,	^0.
Ш12
следует, что подпространство гомеоморфно гильбертову.
Доказательство предложения 1. Снова, как и при доказательстве теоремы 1, применим к отображению F(x) теорему Люстерника из § 0.2. Пусть z (%) — отображение из этой теоремы, удовлетворяющее соотношениям (6). Из этих соотношений ясно, что если В(х) = 0, то г(х) — 0. Для доказательства нашего предложения достаточно проверить, что функция
ф (х) = f (х.) — {y',F (х)> — II z (х) II
является локальной /(-функцией задачи. В силу сказанного выше видно, что ф(х*) = /(х*) и на ограничении задачи функция ср(х) является константой. Значит, требования а) и б) в определении /(-функции выполнены. Осталось показать, что существует 6 > 0 такое, что при ||х— xj|<6 выполнено неравенство f(x) — qp(x):>>0. Положим, как и в теореме 1, g(x) = j?(x,//*, 1) —f(x*). Тогда ясно, что g (хД = 0, g' (хД = 0, g" (хД = = 2MW, О, И*)—=	+ Их)11.
Лемма. Для всякого s > 0 можно указать такое 61 > 0, что если ||£ —xj|<6i, F(£) = 0, то найдется вектор ц е X, по норме не больший е||£— х*|| и такой, что £ — х* — п е Ker F' (хД.
Действительно, по теореме Банаха об открытом отображении найдется константа г > 0 такая, что
F'(xJBx(0, 1)=эВг(0, г),	(И)
где Вх(0,1) и Ву(0, г) — замкнутые шары в X и Y с центром в нуле и радиусами 1 и г соответственно. Возьмем 61 > 0 так, чтобы при ||£ — xj| < 61 выполнялось соотношение:
IIF (С) - F (хД - F' (хД (£ - хД II < er || £ - х* ||.
§ 7.2. ГЛАДКИЕ ЗАДАЧИ
309
Тогда, если F(£) = 0, то
к' (X.) ((С - X.) II с - Х.1Г’ 8"1) | < Г.
В силу (11) найдется вектор f] такой, что	и
F' (х) fi = F' (х.) (g - х.) (|| g - х. || е)"1.	(12)
Положим n = eIIC —xjlfj. Тогда из (12) следует, что F'(x,)i\ = F' (x,)fc — xt), т. е. ? — х, — t]e KerF'(xJ, и с другой стороны, HnlKellg — х,||. Лемма доказана.
Возвратимся к доказательству предложения 1. Выберем е > 0 так, чтобы выполнялось неравенство
а(1 — е)2 —2Се(1 4-е)—Се2 —е>0.	(13)
Здесь а — константа, фигурирующая в формулировке предложения, а С = || g" (х„) ||. По данному в>0 найдем б] > 0 так, чтобы при этом dt было выполнено утверждение леммы, а кроме того, оказались верными неравенства
н/а)и<1,
| g (?)—g ю—<g' w. (? - xj)—
- 4 g" (x.) (I - X,, g - X.) | < 4 H - x, II2
при £eB(xt, Всего этого можно добиться при наших предположениях относительно гладкости f (х) и F (х). Наконец, по 6j найдем 6 > 0 так, чтобы из того, что хеВ(х06), следовало бы неравенство
IIX 4- z (х) II < б,.
Обозначив х 4-z (х) = £ и используя теорему о среднем и соотношения (10) и (13), получим:
f (х) — <р (х) = g (х) 4- II z (х) II = g (х) — g (х 4- z (х)) 4-
+ g (?) + II z (х) II > - sup (II g’ (g) III g e В (x„ 6,)} II z (x) II4-
+ II z (X) II4- g (X.) 4- <g' (X.), ? - X.) 4-
+4 S" (x.) (? - x., $ - x.)	1| $ - x. II2 >
>4 g" W (C -x., ? - x.) -|||? -хжII2.
310
ГЛ. 7. ДОСТАТОЧНЫЕ УСЛОВИЯ ЭКСТРЕМУМА
Возьмем теперь вектор ц из леммы:
IIп 11=0IIЛ с— X, — ne KerF'(xJ.
Тогда
(l-e)||S-xJ|<||C-x.-nll<(l+e)||C-x.||.
Воспользуемся тождеством
В (х, + х2, Xi + х2) = В (хь х^ + 2В (хн х2) + В (х2, х2) для квадратичной формы В (х1; х2) = g" (xj (х,, х2). Мы получим:
у g" (х,) (; - X., С - X.) - | II g - X. II2 =
= yg"W (? — х,— n + n, z— X, — n + il)-ylR-*, IF> >y (a(l - e)2 - 2C (1 + 8) e - Се2 —e)|| g - x. ||2 > 0.
Предложение 1 доказано.
7.2.3.	Построение S-функции для гладких задач. Рас-смотрим гладкую задачу (1) и ее стандартное возмущение
f (х) -> inf; F (х) — у = 0.
Через S(y) обозначим S-функцию этого возмущения в точке х*, т. е. локальную 5-функцию.
Теорема 2. Пусть функция f(х) и отображение F(x) принадлежат классу С2 в некоторой окрестности V точки х* и F(x*) = 0. Пусть далее:
а)	отображение F(x) регулярно в точке х«,
б)	существует множитель Лагранжа y*^Y* такой, что
^(хл’,1) = 0,	(14)
в)	вторая производная функции Лагранжа строго положительна на ядре оператора F'(x*):
3?хх(х,,у*, 1)О><Ж geKerF(x.) (a > 0). (15)
Тогда существует окрестность U начала координат в пространстве У, отображение у-*(х(у),у*(у)) этой
§ 7.2. ГЛАДКИЕ ЗАДАЧИ
311
области в X\Y* класса С\ в U такие, что
X (0) = xt,	у* (0) = у,
3?х(х(у),у'(у), 1) = о, ^у(х(у), у'(у), 1)=у. .
(16)
При этом S(y) = f(x(y)) и функция S(y) принадлежит классу Сх в U.
Доказательство. Обозначим произведение X X через Z, а произведение X* X ¥— через W. Элементы Z суть пары z = (%,#*), элементы W— пары w = (х*,г/). Определим отображение W: ZXW-+W формулой
Т (z, w) — Т ((х, у*), (х‘, у)) =
= (&х (X, у‘, 1) — х‘, З’у. (х, у", 1) — у) =
= (f (*) + Р(х) у* — х', F (х) — у\
В силу требований относительно гладкости, приведенных в теореме, функция Т является непрерывно дифференцируемой в окрестности точки (г, 0), где z = = (х*, у*). Покажем, что отображение Т удовлетворяет требованиям теоремы о неявной функции (см. п. 0.2.3). Действительно, согласно (14) имеем:
Т (z, 0) = (<?х (х., у, 1), F (х.)) = (0, 0).	(17)
Применив теорему Шварца (см. п. 0.2.3), получим:
Wz ((z, и>)) (х, /) = Тх ((г, да)) х +	((г, да)) у'.
Продифференцируем отображение Т по х и у* в точке (г, 0):
Тх ((г, 0)) х = (9?хх (х„ у, 1) х, (х„, у’, 1) х), 1
'Ру- ((г, 0)) у* = (^Ху. (х„ у\ 1) у\ 0).	J (18)
Нам надлежит показать, что отображение
(х, у') Тх ((z, 0)) х + Ту. ((z, 0)) у'
является гомеоморфизмом пространств Z и W. Вследствие теоремы Банаха об обратном операторе (п. 0.1.4)
312
ГЛ. 7. ДОСТАТОЧНЫЕ УСЛОВИЯ ЭКСТРЕМУМА
достаточно проверить, что это отображение регулярно и взаимно однозначно. Сначала проверим взаимную однозначность. Пусть
'Гг((г, 0))г] = ^((2, О))^, zi = (xi,y*^, i=l, 2.
Тогда в силу (18) получится, что
(*., у, 1) (Х| — х2) = F' (х.) (Х| — х2) = О,
т. е. х,—x2eKerF'(x,) и, кроме того,
1)(х,-х2) + ^хг/, (х., у\ 1)(^ —^) = 0.
Выражение в левой части последнего равенства — это линейный функционал на X. Подействуем цм на элемент х{—х2 и воспользуемся условием в) теоремы. Получим:
О = S3хх (х*, у , 1) (Xj х2, х1 х2) -|-хх-х2}=
= 2\Лх*,У*, О (Хц — х2, Xiх2)>а||х1— х2||2.
Из последнего неравенства следует, что х{ =х2 и, кроме того, у\ — у I е Ker F'* (xj. Следовательно, для любого х е X выполнено равенство
<£'• (х.)	- у2), х) =	- у2, F' (х.) х) = 0.
Из регулярности F' (xj (требование а) теоремы) отсюда вытекает, что у*1 = у*г Взаимная однозначность доказана. Покажем теперь, что отображение Ф2((г, 0)) регулярно. Для этого надо решить систему уравнений
ЗТххК, у, 1)х + ^х^(х„ у*, 1)/ = х‘,
у*X (х„ у , 1) X = F' (X.) X = у.
Вследствие регулярности отображения F в точке х*, существует элемент х такой, что F'(x*)x = y. Остается подобрать элементы g^Ker F' (х#) и rj* s Y* так, чтобы
&хх (X., У*. 1) I + S?xy* у', 1) Tf - Г, (19)
где £* = х* — SFxx(xt, у*, 1)х. Выражение х), хе eKerF'(x.) представляет собой линейный функционал
§ 7.2. ГЛАДКИЕ ЗАДАЧИ
313
на подпространстве Ker F' (х*). Подпространство Кег/7'(х*) гомеоморфно гильбертову пространству (см. замечание к предложению 1), где в качестве скалярного произведения (х|у) взято выражение
&хх (*., у, 1) (х, у), X, у g= Ker F' (х,).
По теореме об общем виде линейного функционала в гильбертовом пространстве, найдется элемент £ такой, что
у. па,%)=<г,х).
Но это означает, что линейный функционал S?xx(x*, У*, 1)£ — Г принадлежит (Ker F(x*))-1-. В силу леммы об аннуляторе (п. 0.1.4) существует такой элемент Г)*, что
3?xx(x.,y', l)g-r = F'-(x.)<
Мы получили, что элементы £ и —т]* удовлетворяют нужному соотношению (19). Регулярность отображения доказана.
Итак, доказано, что отображение ^(z, w) удовлетворяет всем требованиям теоремы о неявной функции. Применив эту теорему, получим, что существует отображение w->a(w), а(0) = z такое, что ^(а^),	=0.
В частности, положим (х(у), у* (у)) — а(0, у). Тогда мы приходим к соотношениям (16). При этом в силу теоремы о неявной функции отображения х(у) и у* (у) принадлежат классу С\ в окрестности точки х*. Соотношения (16) означают, что в точке х(у) выполнено правило множителей Лагранжа для задачи
f(x)—>inf; F(x)-# = 0.	(20)
Ввиду того, что в малой окрестности точки х* строгая положительность квадратичной формы ^хх(х(у),у* (у), 1) на ядре оператора F'(x(y)) сохраняется в силу предложения 1, в точке х(у) выполнено достаточное условие минимума для задачи (20). Следовательно, f(x(y)) = S(y). Теорема доказана.
Построенное отображение у->х(у) естественно назвать полем экстремалей. Мы получили, что задача (1)
314
ГЛ. 7. ДОСТАТОЧНЫЕ УСЛОВИЯ ЭКСТРЕМУМА
равносильна безусловной минимизации функции f(x)-f-+ (£*. F(x)) 4-(i|>oF) (х), где у* = —S'(F(x*)), а
(У) = - (S (у) - S (0) - (S' (0) ,уУ).
Именно этот результат обсуждался во введении, когда речь шла о достаточных условиях.
§ 7.3. Выпуклые задачи
Пусть задана экстремальная задача
f(x)->inf; хеС.	(1)
Предположим, что возмущенную задачу
f (х, z) -> inf; х е С (г)	(2)
удалось построить таким образом, что
а)	класс возмущений Z — отделимое локально выпуклое пространство;
б)	f(x, O) = f(x), С(0) = С;
в)	S-функция S(z) выпукла.
Обозначим через С~х(х) многозначное отображение, обратное С, т. е.
С”"1 (х) = {z е Z | х е С (г)}.
Теорема 1. Пусть выполнены условия а) — в). Если dS(O)#=0 и г* е<3S(0), то точка х*еСе том и только том случае является решением задачи (1), когда функция
ф W = f (х) + f(xt) + sup (<z‘, г) — f (x, z)) геС"1 (x)
есть К-функция задачи (1) в точке х*.
Доказательство. Если <р(х) есть /(-функция задачи (1) в точке х#, то х* — ее решение в силу предложения 1 из § 7.1. Пусть теперь х* — решение задачи (1), т. е. f (xj = S(0). Обозначим для краткости
ф (х) = sup «г’, z> — f (x, z)).
zeC-1 W
Тогда
S* (z‘) — sup ((z‘, z) — inf f (x, z)) =
Z	XG=C(z)
— sup sup (<z\ z) — f (x, z)) = sup ф (x).
x z^C~l(x)	x
§ 7.3. ВЫПУКЛЫЕ ЗАДАЧИ
315
Поскольку z* е dS (0),
S (0) = — S‘ (z.) — — sup ф (x). X Поэтому
- 5 (0) = - f (x.) = (z*. 0) - f (x„ 0)< t (x.) < - S (0),
t. e. ф (x*) = — 5 (0) и, значит,
<P(x.) = f(x.) + S(0)-S(0) = f(x.),
Далее, f (x) f (xj для всякого хеС. Поэтому
Ф (*) > f (х,) + f (х) + <z\ 0) — f (х, 0) > f (х.) = ф (х,).
Наконец, для произвольного х
Ф (х) — f (х) = f (х.) + 4? (х) <5 (0) + sup ф (х) = 0. X
Теорема доказана.
Таким образом, при выполнении условий а) — в) проблема построения A-функции сводится, по существу, к отысканию субградиентов S-функции в нуле, т. е. к решению задачи
— S*(z*)-> sup.	(3)
Эта задача называется двойственной с задачей (I) (относительно выбранного класса возмущений), а исходная задача (I) часто называется прямой. В рассмотренном случае значения прямой и двойственной задач совпадают. Последний результат, очевидно, не связан с фактором существования решения в задаче (1) и (при выполнении условий а) — в)) справедлив, когда S-функция S(z) замкнута в нуле.
Все сказанное становится особенно наглядным в том случае, когда задача (1) имеет вид
fo(x)->inf; F(x) = 0, f/(x)^O, i=l, /I, хе Л, (4) и рассматривается вместе со стандартными возмущениями:
f0(x)->inf; F(x) = y, fi(x)^«i> /=1, л, х е А. (5)
При этом, разумеется, предполагается, что F есть отображение в отделимое локально выпуклое пространство У. В этом случае S-функция S(yf а) определена на произведении У X R” (a = («i, .««))•
316
ГЛ. 7. ДОСТАТОЧНЫЕ УСЛОВИЯ ЭКСТРЕМУМА
Предложение 1. Если вектор (у*, Ь) (у" е Y*,-b = (Pi, ..., рп)) принадлежит dom S*, то Р^О, i = 1, ..., п. Если же Pt ^0, i == 1, ..., п, то
(п	\
</, 74*))+	•
1=1	/
Доказательство. По определению имеем
S* (у', b) = sup ((/, у} 4- (ь | а) — S (у, а)) =
(У, а)
= sup((z/‘,y)+(b |a)—inf {f0(x) \xt=A,F(x)=y, ft (x)<aj)= (//. a)
= sup (sup{{y*, y') + (b\a)\y = F(x), az > ft (x)} — f0(x)) = x <= A
= sup [«//•, F (x)> — fo (x)) 4- sup {(b | a) | a,- > ft (x)}]. x <= A
Если (i/‘, b) e dom S*, то для любого x вторая верхняя грань меньше оо. Если же одна из компонент вектора Ь, скажем рь положительна, то, выбрав хеЛ и а так, чтобы aii^fi(x), и положив d = (l, 0........0), получим,
что аг + 7ctf ft (х) для всякого t > 0 и (b, а + ta) -> оо при t->oo. Но это означает, что S(y*, b) = oo, в противоречии с выбором (у*, Ь).
Допустим теперь, что Р,0, 1=1, .... п. Тогда, очевидно, п
sup {(6 | а) | Ui > fi (х)} = Ц Pifi (х), 1=1
откуда и следует нужное равенство.
Предположим теперь, что задача (5) удовлетворяет условиям а) —в). Тогда, если (у*, b) е д£(0,0), то в силу теоремы 1 функция п
Ф (X) = s (0, 0) + {у*, F (х)> + 2 Pifi (X) 1=1
будет /(-функцией задачи (1) в любой точке х*, являющейся ее решением. Это значит, в частности, что функция
п	’
fo (х) — {у\ F (х)) — 2! Pifi (х)
1=1
§ 7.3. ВЫПУКЛЫЕ ЗАДАЧИ
317
достигает минимума по х на множестве А во всякой точке х*, являющейся решением задачи (1). В итоге мы получаем следующий результат.
Теорема 1' (теорема двойственности). Предположим, что S-функция S(y,a) задачи (5) выпукла и замкнута в нуле. Тогда значения прямой и двойственной задач равны, множество решений двойственной задачи совпадает с dS(0, 0) и, если dS(Q, 0) =Н= 0, то значения обеих задач совпадают со значением задачи
fo(x) — S₽ifiW— </, р (х)>—>inf; хе Л, Z=1
где (у*,Ь) — произвольный элемент множества <55(0, 0).
Для выпуклых задач этот результат можно еще более конкретизировать, поскольку там существуют простые критерии для соотношения д£(0, 0) #= 0, именно, — условие Слейтера. Предположим, что в задаче (1) F— аффинный оператор, функции f0, ...» fn выпуклы и А — выпуклое множество.
Предложение 2. Пусть в задаче (1) F— непрерывное аффинное отображение в Rm, функции fQ, ..., непрерывны и выпуклы. Тогда, если значение задачи (1) конечно и выполнено условие Слейтера'. 0 g ri F(A) а fi(x)<ZO, *= 1, а, для некоторого х^А, для которого F (х) = 0, то S (у, а) — выпуклая функция и (55(0,0)=^ 0.
Доказательство. Выпуклость функции S очевидна. Докажем, чта д£(0, 0)^0. Для этого достаточно проверить, что (0, 0) е ri dom S, и воспользовавшись тем, что |S(0, 0) | < оо по условию, применить предложение 4 из § 4.2. В самом деле, пусть (у, а) е dom S. Тогда, поскольку 0eriF(4), найдется ц > 0 такое, что У1 = —[iy е F(A), т. е. yi = F(xi) для некоторого х^Л. Имеем при 0	1
fi + (1 - А) х) <	(х,) + (1 - A) h (х),
и так как Д- (х) < 0, найдется > 0 такое, что
fitful + (1 — Я,э)х)< — A'oP'Gz, Z=l,
Положим
x2=Z0x1 + (1 — Я.0)х, у2 = — Wy, а2 = — Аоца.
318
ГЛ. 7. ДОСТАТОЧНЫЕ УСЛОВИЯ ЭКСТРЕМУМА
Тогда /?(х2) = ^2,	т. е. (у2, a2)edomS. Это
значит, что начало координат есть внутренняя точка отрезка, содержащего точки (y2l а2) и (у, а) и целиком лежащего в domS. Поскольку (у, а)—произвольная точка множества dom S, отсюда следует, что (0,0) е е ri dom S. Предложение доказано.
Комбинируя этот результат с теоремой 1, легко можно получить теорему Куна — Таккера и ее обобщения, которые рассматривались в гл. 1.
§ 7.4. Достаточные условия экстремума в классическом вариационном исчислении
Достаточные условия будут обсуждаться на примере простейшей векторной задачи:
ti
3 (х (•)) = J L (t, х, х) dt inf;
x(t0) = XQi x(tl)=Xl.
7.4.1. Условия слабого экстремума.
Предложение 1. Если интегрант L в (1) есть функция класса С2 в области U cz R X R” X Rn, содержащей точки (/, хДО,	е С? (№), ^i])> то функ-
ционал (х (•)) является дважды дифференцируемым по Фреиле в пространстве Ci ([/о, М) 6 окрестности точки хД •) и его первая и вторая производные имеют вид
3' (х. (• ))х (•) = / ((р (0 |х (0) + (<7 (0 |х (0)) dt,
*9
/1
3"' (х. (•))(*(• ),*(•))= J ((Л (/) х (/) IX (/)) +
^0
+ 2 (С (0 X (0 IX (/)) + (В (0 X (0 | X (0)) dt, где
P (t) — Lx 1^ (Z),	q (t) — Lx
Д (t) == Lxx (/),	В (t) = LXx ix< (f),
2C (t) = (Lxx + LXx) (t) — 2Lxx |Xa (/) = 2LXx 1Лф (ty
(2)
(3)
§ 7.4. ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ
319
При этом для всякого 8 > 0 можно найти б > О так, что если х (•) е £0» т. е. если х (/0) = х (/J = 0, и || х (•) ||j < 6, то остаточный член
г(х(‘)) = ^(хЛ.) + х(.))-^(х#(.))-
- 5"(х. (• ))х( •) -72^'fo (•)) (х( •), х( •))
допускает оценку
|r(x(-))Ke||x(-)||L w2,
Доказательство. Однократная дифференцируемость по Фреше функционала У (х( •)) была установлена нами в п. 0.2.5 (пример 8). Положив
Ф (*) = 3 (х. (•) + Ах (•)),
по теореме о среднем, получим:
Ф (1) = У (хД•) + х(•)) = Ф (0) + ф' (0) + 72ф" (0), О<0< 1, или
(А-Д •) + %(• )) = 5<(хД-)) +5<'к(-))х(.) +
+ у / (Иех I*) + 2 (.С^х |х) 4- (В0х |х)) dt; t,
здесь Ав, Вв и С6 имеют 'вид (3), где вектор-функция xt(t) заменена на х, (0 + 0х(0.
Следовательно, Э"'(х*(-)) имеет вид (2) и
it
r(x(.))=4 j (((Де-Д)х|х) + 2((Се-С)х|х) +
+ ((Be-B)x\x))dt. (4)
В силу непрерывности вторых производных инте-гранта L в области U можно, задавшись 81 > 0, найти такое б > 0, что при l|x(-)lli<6 получаются неравенства:
\\CQ(t)-C(t)W<Rl, v/e[Mi]
320
ГЛ. 7. ДОСТАТОЧНЫЕ УСЛОВИЯ ЭКСТРЕМУМА
и, следовательно,
ti
\r(x(-))\^ |((х|х) + 2|(х|х)| + (х|х))Л.	(5)
to
Воспользуемся теперь тем, что если х(-)е£0, то !
t
х (/) = | х (т) dx
to
и, следовательно, в силу неравенства Коши — Буняков-ского
/	\’/2
|x(0|</0-J J (х(0|х(0)Л) , Vo	/
откуда вытекает, что
11
f (х (0 |х (0) dt < Ci ( max | х (0 |)2 < С|| х (•) ||2 .
*	*2,1
Го
Если к этому прибавить неравенство . |(x|x)K(x|x) + Ul^ ,
то сразу получается оценка (если положить (1 + Q 8t = е)
I г(х( )) |<е, J ((х(0|х(0) + (х(0|х(0))^<
<(1 4-С)е,||х(-)||^ = е||х(-)||2	,
w2, 1	*2, 1
которую и требовалось доказать.
Уравнение Эйлера для второй производной
•))(*(•), х(-)), т- е- Уравнение
- Л- (Ах 4- С*х) + Сх + Вх = 0,	(6)
где Л, В и С имеют вид (3), называется уравнением Якоби задачи (1).
Теорема 1. Для того чтобы допустимая экстремаль %*(•) задачи (1) доставляла слабый локальный минимум в этой задаче, необходимо (в предпо