Текст
                    Э. М. Галеев
-В. Μ. Тихомиров
КРАТКИЙ КУРС
ТЕОРИИ
ЭКСТРЕМАЛЬНЫХ
ЗАДАЧ
ДОПУЩЕНО ГОСУДАРСТВЕННЫМ КОМИТЕТОМ СССР
ПО НАРОДНОМУ ОБРАЗОВАНИЮ В КАЧЕСТВЕ
УЧЕБНОГО ПОСОБИЯ ДЛЯ СТУДЕНТОВ ВУЗОВ,
ОБУЧАЮЩИХСЯ ПО СПЕЦИАЛЬНОСТИ МАТЕМАТИКА»
Издательство
Московского университета
1989


ББК 22.18 Г15 УДК 519.6 Рецензенты: кафедра теоретической кибернетики ЯрГУ, профессор М. С. Никольский Га л ее в Э. М., Тихомиров В. М. Г15 Краткий курс теории экстремальных задач. — М.: Изд-во Моск. ун-та, 1989. — 204 е.: ил. ISBN 5—211—00313—6. В пособии рассмотрены наиболее фундаментальные результаты математического программирования, классического вариационного исчисления и оптимального управления, из которых складывается основной курс методов оптимизации. Излагаются основания выпуклого» анализа, проблематика расширения экстремальных задач и теории существования решений, достаточные условия экстремума, понятия о динамическом программировании и численных методах решения. Приведены решения ряда экстремальных задач,' возникающих в теории- космонавтики, доказаны некоторые классические неравенства методами теории экстремальных задач. В книгу включено более 400 задач, что позволяет использовать пособие на практических занятиях и в практикумах. Для студентов вузов, обучающихся по специальности «математика». 1402060000(4309000000)-108 71__gQ 077(02)—89 ISBN 5—211—00313—6 ББК 22.1$ © Издательство Московского* университета, 1989
СОДЕРЖАНИЕ Предисловие 5 Введение 6 Μ Исторический очерк б 2. Основные понятия, связанные с экстремальными задачами . . 10 3. Принцип Лагранжа исследования задач с ограничениями ... 12 Часть I /; ОСНОВНЫЕ ЭЛЕМЕНТЫ ТЕОРИИ ЭКСТРЕМАЛЬНЫХ ЗАДАЧ . 17 § 1. Элементы функционального анализа, дифференциального исчисления и выпуклого анализа 17 1.1. Нормированные и банаховы пространства 17 1.2. Некоторые теоремы из геометрии и функционального анализа 19 1.3. Определения производных 22 1.4. Основные теоремы дифференциального исчисления в нормированных пространствах . 25 1.5. Элементы выпуклого анализа « .33 § 2. Гладкие задачи с равенствами и неравенствами. Задачи выпуклого программирования 41 2.1. Задачи без. ограничений . · 42 2.2. Гладкая конечномерная задача с ограничениями типа равенств 45 2.3. Задачи выпуклого программирования 47 2.4. Гладкие задачи с ограничениями типа равенств и неравенств 51 2.5. Примеры 54 2.6. О методах решения экстремальных задач. Градиентный метод и метод Ньютона 55 § 3. Задачи линейного программирования 57 3.1. Симплекс-метод 57 3.2. Обоснование симплекс-метода 62 § 4. Классическое вариационное исчисление 68 4.1. Задача Больца 68 4.2. Простейшая задача классического вариационного исчисления 72 4.3. Изопериметрические задачи 77 § 5. Задача Лагранжа 80 5.1. Принцип Лагранжа для задачи Лагранжа 81 5.2. Задача с подвижными концами 86 5.3. Задачи со старшими производными 88 § 6. Задачи оптимального управления , 91 6Л·. Принцип максимума Понтрягина 91 6.2. Примеры 100 Часть II ДОПОЛНИТЕЛЬНЫЕ ВОПРОСЫ ТЕОРИИ ЭКСТРЕМАЛЬНЫХ ЗАДАЧ 105 § 7. Некоторые общие теоремы функционального анализа и их следствия 106 з
7.1. Теорема Хана—Банаха, отделимость, теорема Банаха об открытости 106 7.2. Леммы (о нетривиальности аннулятора, правом обратном, замкнутости образа и аннуляторе ядра сюръективного оператора) 111 7.3. Теоремы Ляпунова и Хелли '. 113 § 8. Выпуклый анализ в линейных пространствах . . . . . . 114 8.1: Двойственные соотношения в выпуклом анализе . . . 114 8.2. Теорема об очистке , 120 § 9. Необходимые условия экстремума 9 122 9.1. Необходимые условия I и II порядка в гладких задачах математического программирования 122 9.2. Условия I и II порядка в классическом вариационном исчислении 127 § 10. Достаточные условия экстремума 135 10.1. Достаточные условия в задачах с равенствами и неравенствами · 135 10.2. Элементы общей теории поля 140 10.3. Теория поля и достаточные условия' в простейшей задаче к. в. и 142 § 11. Дополнения * 146 НА Задачи линейного и выпуклого программирования \ 146 11.2. Ляпуновские задачи 149 11.3. Задачи оптимального управления, линейные по фазовым переменным 151 11.4. Уравнение Эйлера для простейшей задачи классического вариационного исчисления в многомерном случае . . . 153 11.5. О теоремах существования и прямых методах в вариационном исчислении и оптимальном управлении . ... 155 § 12. Разные задачи 157 12. К Задача о мягкой посадке космического аппарата . . . . 157 12.2. Задача Годдарда 160 12.3. Задача Улама 162 12.4. Теорема Чебышева об альтернансе . . ·' 164 12.5. Неравенство Бернштейна 166 Задачи 168 Ответы, указания, решения 185 Краткая хронологическая таблица 199 Литература 200 Краткий путеводитель по литературе 201 Список обозначений 202 Предметный указатель 203
ПРЕДИСЛОВИЕ В наше время проблемы оптимизации приобрели очень большое значение. Это привело к тому, что сейчас математическое, инженерное и экономическое образование немыслимо без эле- ментов теории экстремальных задач. Цель этой книги — содействовать тому, чтобы теория экстремальных задач заняла достойное место в современном математическом образовании. В первой части представлены основные разделы теории экстремальных задач, которые обычно входят в программу курсов математического анализа и различные курсы оптимизации: правило множителей Лагранжа для задач ς равенствами и неравенствами (§ 2), линейное программирование (§ 3), классическое вариационное исчисление (§ 4, 5) и оптимальное управление (§ 6). Эта часть написана в расчете на самую широкую аудиторию. В особенности это относится к первым четырем параграфам. Хотелось бы, чтобы материал этих параграфов использовался в технических и экономических вузах при построении как курсов оптимизации, так и отдельных фрагментов оптимизации, включающихся в общие математические курсы. Овладение материалом первой части дает возможность решать задачи. Необходимо сказать, что материал первой части фактически исчерпывает программу курса «Вариационное исчисление и методы оптимизации» по специальности 2013 — «Математика» для государственных университетов. Вторая часть (§ 7—//) книги адресуется прежде всего студентам университетов и преподавателям* ведущим курсы оптимизации в университетах и вузах. Она может быть использована как при построении основного курса в университете, так и ряда специальных курсов, связанных с оптимизацией. Одна из целей университетского образования — рас- - крытие глубинных причин той или иной теории и места, которое эта теория занимает в структуре всей математики. Во второй части делается попытка осуществить все это по отношению к теории экстремальных задач. Там весь материал первой части просматривается заново с единой точки зрения, в которой соединяются бесконечномерный гладкий и выпуклый анализ. Для проведения практических и лабораторных занятий по методам оптимизации в § 12 приводится решение важных экстремальных задач, кроме того, имеется 260 задач с ответами, некоторые из них снабжены решениями. В книге отражен опыт преподавания курсов оптимизации, читаемых на механика·математическом факультете МГУ, Первая часть, § 12, и задачи написаны Э. Μ. Γ а лее вы м, остальное — В. М. Тихомировым. 5
ВВЕДЕНИЕ 1. Исторический очерк. Задачи на отыскание наибольших и наименьших величин привлекали к себе внимание на протяжении всей истории математики. Особенное значение эти проблемы приобрели в наши дни, когда, как никогда прежде, ощущается потребность в наиболее эффективном использовании природных богатств, людских ресурсов, материальных и технических средств. Все это приводит к необходимости уделять большое внимание проблемам управления. А всякий раз, когда имеется возможность активного участия человека, возникает желание отыскать наилучшее, или, как говорят, оптимальное, управление. При этом неизбежно обращение к математике. Древнейшей из задач на максимум и минимум считается классическая изопериметрическая задача: среди плоских замкнутых кривых заданной длины найти кривую, охватывающую наибольшую площадь. Над этой проблемой размышляли греческие философы еще в V в. до н. э., о ней писал величайший греческий философ Аристотель. Античные геометры поставили и решили еще несколько задач на экстремум. Они встречаются в «Началах» Евклида, в сочинениях Архимеда и Аполлония. В эпоху Возрождения, когда возобновляется научная деятельность, многих ученых вновь привлекают задачи на максимум и минимум. В XVII в. необходимость исследования задач на экстремум связывается с проблемами естествознания. Началось это с попыток объяснить закон преломления света. Еще древние старались найти его. В частности, Птолемей во II в. до н. э. пытался определить его экспериментально, но его попытки закончились неудачей. Закон преломления света был установлен в XVII в. голландским ученым Снеллиусом. Возник вопрос о физических принципах, на которых он основан. Для объяснения закона' преломления света великий французский математик Пьер Ферма выдвинул (около 1660 г.) экстремальный принцип, названный впоследствии его именем. Принцип Ферма гласит: в неоднородной среде свет избирает такую траекторию, вдоль которой время, затрачиваемое им на преодоление пути от одной точки к другой, минимально. Начиная с этого момента идея «вариационных принципов» (т. е. убеждение в том, что законы природы выводимы из некоторых экстремальных соотношений) становится одной из центральных во всем естествознании. До второй половины XVII столетия не существовало никаких общих приемов решения задач на экстремум. Необходи- 6
мость их отыскания в значительной мере стимулировала создание математического анализа. Первый общий рецепт, с помощью которого предлагалось исследовать задачи на максимум и минимум, был описан П. Ферма (около 1630 г.). На современном языке он звучит так: в точке экстремума (некоторой функции одного переменного) производная равна нулю, и потому экстремумы следует искать среди корней производных. Этот результат входит сейчас в школьный курс математики под названием теоремы Ферма. На самом же деле Ферма описал этот прием фактически лишь для многочленов. В общем виде он был впервые получен Ньютоном (в шестидесятые годы XVII столетия), а затем переоткрыт Лейбницем и впервые опубликован им в той самой знаменитой статье, с которой, собственно, начинается история математического анализа. Примечательно начало названия статьи Лейбница: «Новый метод нахождения наибольших и наименьших величин...». В XVIII в. усилиями Эйлера и Лаг- ранжа были созданы приемы решения экстремальных задач с функциями от нескольких переменных без ограничений и с ограничениями типа равенств. Основной прием — метод множителей Лагранжа — сейчас, входит в программу любого математического и технического вуза. Уже в наши дни эти исследования были дополнены исследованием задач, где ограничения задаются равенствами и неравенствами. Весь этот цикл вопросов получил название математического программирования. В июньском номере за 1696 г. в журнале «Акта Эрудито- рум» (первом и единственном в ту пору научном журнале) была помещена заметка известного математика, ученика и последователя Лейбница — Иоганна Бернулли. Она была озаглавлена так: «Новая задача, к решению которой приглашаются математики». Там была поставлена задача о кривой наискорейшего спуска, т. е. задача о брахистохроне. С задачи о брахистохроне началась история классического вариационного исчисления. Общие методы решения задач вариационного исчисления были разработаны в XVIIl· веке Эйлером и Лагранжем. В их же работах была установлена тесная связь вариационного исчисления и естествознания. Теория вариационного исчисления разрабатывалась далее на протяжении более чем двух веков. Помимо необходимых условий первого порядка (уравнений Эйлера — Лагранжа) были Аайдены необходимые и достаточные условия второго порядка для двух типов экстремума — сильного и слабого (Лежандр, Якоби, Вейерштрасс), а также новый метод подхода к вариационным проблемам (теория Гамильтона — Якоби) и построена теория поля (Кнезер, Гильберт) . К середине тридцатых годов нашего столетия многие считали, что проблематика теории задач на экстремум практи- 7
чески исчерпана. Но оказалось, что это не так. В 1939 г. к заведующему отделом Института математики и механики при Ленинградском университете профессору Л. В. Канторовичу пришли на консультацию представители фанерного треста и предложили его вниманию несколько задач, возникших у них на производстве. При математической формализации выяснилось, что они сводятся к нахождению экстремума линейных функций на многогранниках. Перебрать все вершины многогранников не представлялось возможным из-за огромного их числа. Л. В. Канторович нашел иные пути решения и исследования таких задач. Этим он заложил основы нового направления в теории экстремальных задач. Оно получило название линейного программирования. Методы линейного программирования нашли широчайшее применение на практике, в основном в экономике. За разработку математических методов и их внедрение в экономику Л. В. Канторовичу в 1965 г. была присуждена Ленинская, а в 1975 (совместно с американским экономистом Т. Ч. Куп- мансом) — Нобелевская премия. В сороковые годы теория экстремальных задач начала переживать как бы второе рождение. С одной стороны, тогда нашла свое завершение теория линейного программирования. Многие ученые Запада, говоря об этом периоде, подчеркивают выдающуюся идейную роль, которую сыграл Джон фон Нейман. Создание теории линейного программирования стимулировало развитие других разделов теории оптимизации, прежде всего — выпуклого анализа и математического программирования. Выпуклый анализ — специальный раздел математики, где изучают выпуклые объекты: множества, функции и экстремальные задачи. Его начала были заложены Т. Минковским на рубеже прошлого и нынешнего веков, но период наиболее бурного развития выпуклого анализа пришелся на пятидеся- тые-шестидесятые годы. В конце сороковых и начале пятидесятых годов обнаружилось, что многие проблемы оптимального управления, возникающие в технике, не укладываются в рамки разработанных к тому времени теорий. В те годы в Математическом институте АН СССР им. В. А. Стеклова под руководством Л. С. Понтря- гина был организован семинар, посвященный анализу таких проблем. На этом семинаре, в частности, выступал с рассказом о некоторых задачах автоматического регулирования видный специалист в этой области А. А. Фельдбаум. Он рассказывал среди ряда других о задаче наибыстрейшей остановки лифта в шахте. Это была задача, вошедшая впоследствии в огромное число изданий по оптимальному управлению под названием простейшей задачи о быстродействии. Усилиями Л. С. Понтрягина и его учеников была найдена формализация целого класса задач, охватывавшего большин- 8
ство актуальных проблем техники, а затем была построена теория этого класса задач. Она получила название теории оптимального управления. Основной результат этой теории носит название принципа максимума Понтрягина. За разработку теории оптимального управления Л. С. Понтрягину и его сотрудникам В. Г. Болтянскому, Р. В. Гамкрелидзе и Ε. Φ. Мищенко в 1962 г. была присуждена Ленинская премия. Интересно отметить, что первая задача, по сути дела относящаяся к оптимальному управлению, была поставлена Ньютоном в «Математических началах натуральной философии» (1687 г.) еще даже до брахистохроны. Мы рассказывали об основных этапах развития теории задач на максимум и минимум и упомянули о важнейших конкретных проблемах, возникавших в самой математике, а также в естествознании, экономике и технике, которые стимулировали развитие теории *. Обо всем этом читатель более подробно узнает из нашей книги. В первой части книги описывается по сути дела единая, восходящая к Лагранжу, методология исследования экстремальных задач. Эта методология очень проста, в то время как ее строгое обоснование не всегда элементарно. Научиться решать задачи гораздо проще, чем овладеть методами доказательств. Для того чтобы дать возможность освоиться с методологией решения конкретных задач, в книге имеется § 12 и задачи. Кроме того, в первой части имеется большое число подробно разобранных иллюстративных примеров и задач. В частности, в этих задачных разделах книги содержится подробное исследование всех тех конкретных задач (классической изо- периметрической, о брахистохроне, Ньютона, о быстродействии и т. п.), о которых говорилось выше. Выше мы сказали о том, что потребность решать экстре» мальные задачи была среди причин, стимулировавших рождение и развитие классического анализа, т. е. дифференциального и интегрального исчисления функций конечного числа переменных. Но уже задача о брахистохроне не относится к конечномерному анализу. Там должны сравниваться друг с другом все (достаточные гладкие) кривые, проходящие через заданные точки, т. е. бесконечномерный объект. Первые же работы по вариационному исчислению несомненно относятся к бесконечномерному анализу, но само по себе такое направление в математике родилось лишь в конце прошлого и в начале этого века. Бесконечномерный анализ включает в себя, в частности, дифференциальное исчисление в •бесконечномерных пространствах, и оно, в принципе, не является более сложным, чем наше привычное конечномерное дифференциальное исчисление. При этом уравнение Эйлера в вариационном исчислении оказывает- * В конце книги приведена и краткая хронологическая таблица. 9
ся не чем иным, как расшифровкой теоремы Ферма о равенстве нулю производной. И вообще, понять единство всех разделов теории экстремальных задач, в частности тех, которые мы описывали выше (математического программирования, вариационного исчисления, линейного программирования, оптимального управления), легче всего, взобравшись на уровень бесконечномерного анализа. Этот уровень давно достигается в университетском образовании и в математическом техническом образовании с усиленной программой *по математике. Вторая часть нашей книги призвана дать читателю возможность осознать теорию оптимизации как некое единство. Это единство достигается соединением гладкого бесконечномерного анализа и выпуклого анализа. (Кстати сказать, нам представляется, что настало время, когда основные понятия и факты бесконечномерного и выпуклого анализа должны найти свое место в общем математическом образовании любого уровня. Желая способствовать этому, мы уделили им достаточно много внимания как в первой, так и во второй части.) В § 7 приведены сведения из функционального анализа, необходимые для построения того фрагмента теории, который содержится в остальных параграфах. Этот фрагмент достаточно большой, и при реализации конкретного курса надо выбрать какую-то часть его. В начале второй части приведено дерево связей основных теорем об экстремальных задачах с основополагающими фактами из анализа и геометрии § 7, чтобы читатель мог добраться до цели кратчайшим путем. Нам представляется, что усовершенствование образования, его модернизация, в частности модернизация отдельного курса, должна проходить некую промежуточную стадию, когда представлен и традиционный материал, взвешенный многими десятилетиями преподавания, и присутствует попытка найти новые взгляды на весь предмет в целом. Хотелось бы, чтобы эта книга способствовала цели усовершенствования важного раздела математического образования. 2. Основные понятия, связанные с экстремальными задачами. Слово maximum по латыни означает «наибольшее», слово minimum — «наименьшее». Оба эти понятия — максимум и минимум, наибольшее и наименьшее — объединяются единым термином экстремум (от латинского extremum, означающего «крайнее»). Иногда употребляют слово оптимальный, от латинского optimus, что означает «наилучший, совершенный». Теорию задач на отыскание наибольших и наименьших величин называют теорией экстремальных задач, или теорией оптимизации, или иногда теорией оптимального управления. Лри употреблении последнего термина обычно предполагается связь задач с практическими приложениями. Экстремальные задачи, возникающие в естественных науках или на практике, обычно ставятся словесно, в содержательных терминах той области, где данная задача возникла. Чтобы 10
можно было воспользоваться теорией, необходим перевод задач на математический язык. Этот перевод называется формализацией. Одна и та же задача может быть формализована разными способами, и простота решения зачастую сильно завидит от того, насколько удачно она формализована. Любая формализованная задача включает в себя следующие элементы: функционал f : X-+R (X — область определения функционала f) и ограничение, т. е. подмножество CczX. Поясним некоторые встретившиеся здесь обозначения и термины: R — это расширенная действительная (вещественная) прямая, т. е. совокупность всех действительных чисел, дополненная значениями +оо и —оо; запись F:X-+Y означает, что отображение F имеет область определения X, a F(x) для каждого элемента χ из X лежит в множестве У, Таким образом, формализовать экстремальную задачу — значит точно описать ее элементы /, X и С. Для формализованной задачи употребляется запись /(^)->inf(sup); *<=C. (з) Точки х^С называются допустимыми. Если С=Х9 то задача называется задачей без ограничений. Задачу на максимум всегда можно свести к задаче на минимум, заменив задачу /(A:)-^sup; x^C, задачей f(;t)->inf; х^С, где f(x)=—/С*). И наоборот, задачу на минимум можно аналогичным образом свести к задаче на максимум. Для определенности в тех случаях, когда формулировки необходимых условий экстремума в задачах на минимум и максимум разные, выписываем их только для задачи на минимум. Если необходимо исследовать обе задачи, то пишем /(jt)~>extr; x^C. Допустимая точка χ называется абсолютным (или глобалЬ" ным) минимумом {максимумом) в задаче (з), если f(x)>f(x) для любого хеС (соответственно f(x)<f(x) для любого jcgC). При этом пишем ieabsmin3 (absmax3). Абсолютный минимум (максимум) задачи называем решением задачи. Величина f(x), где χ — решение задачи, называется численным значением задачи (иногда для сокращения говорим просто значение задачи). Эту величину обозначаем 53, или Smm (Smax). Кроме глобальных экстремумов также рассмотрим локальные экстремумы. Дадим их строгое определение. Пусть в задаче (з) X — нормированное пространство. Говорят, что точка χ доставляет в (з) локальный минимум (максимум), и пишут £е1осгшпз (1остахз), если х^С и существует δ>0, такое, что для любой допустимой точки х, для которой ||я—х||<6, выполняется неравенство f(x)>-f(x) (f(x)<f(x))· Иными словами, если i^locmin3 (locmaxs), то существует окрестность U точки х, тдкая, что ieabsmin3' (absmax3') в задаче / (*) ->inf (sup); χζξ C[\U. (з') 11
Переформируем понятие локального экстремума в важнейшем конечномерном случае. Пусть в (з) Jf=Rn. Говорят, что х=(хи. · .,in)^locmin3 (1остахз), если х^С и найдется такое δ>0, что для любого х=(х\, ·.. ,х<п)^С, для которого |χ—х\ <δ<=фГ£ (Χι—Χι)Λ <δ, выполнено неравенство /www (f(^r</w)· Теория экстремальных задач дает правила нахождения решений экстремальных задач. В большинстве своем эти правила выделяют некоторое подмножество точек, среди которых должно содержаться решение задачи. Это множество точек, которое называем критическим, возможно, несколько шире, чем множество абсолютных и даже локальных экстремумов. После нахождения всех критических точек надо выделить из них решения. 3. Принцип Лагранжа исследования задач с ограничениями. Сущность принципа Лагранжа состоит в редукции задач с ограничениями к ряду задач более простой структуры (в большинстве случаев — к задачам без ограничений). Покажем, в чем состоит принцип Лагранжа, на примере конечномерных задач с ограничениями типа равенств. Рассмотрим задачу (X=Rn) fo (х) ->extr; f, (χ) -0,..., fm (x) =0, (з) где х=(х\у... 9Хп)- Здесь ограничение задается системой равенств C={x^Rn\fi(x)=Q9 i=l,...,m}. Функционал f0 и функции fu задающие уравнения связи ^(х)=0, предполагаем непрерывно дифференцируемыми (иначе говоря, такими, что все их частные производные первого порядка непрерывны). Посмотрим, как предлагал решать эту задачу сам Лагранж. Он пишет: «Можно высказать следующий общий принцип. Если ищется максимум или минимум некоторой функции многих переменных при условии, что между этими переменными имеется связь, задаваемая одной или несколькими функциями, то нужно прибавить к функции, экстремум которой ищется, функции, задающие уравнения связи, умноженные на неопределенные множители, и искать затем максимум или минимум построенной суммы, как если бы переменные были независимы. Полученные уравнения, присоединенные к уравнениям связи, послужат для определения всех неизвестных». Воспользуемся правилом Лагранжа, несколько уточнив его. Первое, что нужно сделать согласно Лагранжу: «прибавить к функции, экстремум которой ищется, функции, задающие уравнения связи, умноженные на неопределенные множители». Составим функцию т <г=я (χ, λ)=у Xifi (χ), λ=(λ0,λν...,λη), 12
которую называем функцией Лагранжа. Числа λ< называются множителями Лагранжа, Первое уточнение состоит в том, что и функция, экстремум которой ищется, домножена на неопределенный множитель. Если не сделать этого уточнения, то рецепт Лагранжа может оказаться неверным (см. далее пример 1). При этом в задаче на минимум следует брать λο>0, в задаче на максимум брать ,λο<0. Второе, что необходимо сделать согласно Лагранжу: «искать максимум или минимум построенной суммы, как если бы переменные были независимы». По замыслу Лагранжа, следовательно, надо рассмотреть задачу 2?(ху λ)-*6χίΓ (по х) (зэ) (мысленно зафиксировав λ). Задача (зэ) проще, чем исходная, так как здесь ограничений нет. Она относится к классу элементарных. Не будем искать ее максимумы и минимумы (ибо может оказаться, что ее максимумы и минимумы не имеют отношения к максимуму и минимуму исходной задачи — пример 2). Поступим несколько иначе. Будем искать стационарные точки в задаче (зэ), т. е. напишем для элементарной задачи необходимое условие минимума или максимума, выражающееся все в той же теореме Ферма. Согласно этой теореме должны удовлетворяться уравнения &х{х, λ) = 0**2χ.(χν ...,*„, λ0, ... Дт)=0, ί = 1,..;,η (в которых не все множители Лагранжа равны нулю). Полученные η уравнений, дополненные m уравнениями связи, и «послужат для определения всех неизвестных». В самом деле, хотя неизвестных (χ, λ) на одно больше, чем количество уравнений, надо учесть то обстоятельство, что множители Лагранжа можно умножать на любое число, отличное от нуля. И именно в силу этого число уравнений равно числу неизвестных. В подобных случаях будем говорить о полноте набора условий для определения стационарных точек. Надо иметь в виду, что наибольший интерес имеют те случаи, когда λο#0, ибо при λο=0 соотношения принципа Лагранжа указывают лишь на некоторую .вырожденность ограничений (от которой зачастую легко избавиться) и оказываются не связанными с функционалом. Решения полученных уравнений (j?*. = 0, ί== = 1, ... , η, //(*) = 0, /= 1, ... ,m) и образуют совокупность стационарных точек. Таким образом, для решения задачи (з) следует 1. Составить функцию Лагранжа: m i=0 13
2. Выписать необходимые условия экстремума: т Jfx(*,W = 0«2v-^- = 0, /=1 п. 3. Найти стационарные, т. е. допустимые, точки, являющиеся решениями уравнений п. 2, в которых не все λ*, t=0, 1,..., rny равны нулю. При этом бывает полезно рассмотреть отдельно» случаи λο=0 и λο^Ο. Во втором случае можно в задаче на минимум положить λο равным единице или любой другой положительной константе, в задаче на максимум — равным минус единице или любой другой отрицательной константе. 4. Отыскать решения среди всех стационарных точек или доказать, что решений нет. Описанная процедура и называется принципом Лагранжа. Этот принцип применим не только к задаче (з), но и к1 очень широкому кругу экстремальных задач. Большинство задач из нашей книги можно решить с помощью этого принципа. Но* при этом важно иметь в виду следующее. а) Принцип Лагранжа применим, вообще говоря, не всегда. В примере 3, приведенном ниже, решение задачи существует, но принцип Лагранжа к нему не приводит. б) Сфера применимости принципа Лагранжа достаточна широка. Иногда к задаче нельзя применить имеющуюся теорему, однако принцип Лагранжа (примененный без обоснования) тем не менее приводит к точкам, подозрительным на экстремум, из которых можно выделить решение. В общем случае принцип Лагранжа применяется так. 1. Формализовать задачу к виду f(x9 u)-*ini; F(x, ы)=0, «ei/. f :XXU-+Ry F :XXU-+Y, где X и Υ — нормированные пространства. Это задача с ограничениями типа равенств, параметризованных некоторым множеством U. Еще можно сказать,, что эта задача с ограничениями типа равенств и включений. Составить функцию Лагранжа: &{х, и, λ0, y)=bof(x, u)+{y\ F(x, и)), где у* — элемент сопряженного пространства У*. В функцию Лагранжа ограничения типа включений u^U не входят. 2. Для задач 3?{х, й9 λ0, y*)-*inf (по χ), 2*(х, и, λο, i/*)-4nf, u^U выписать необходимые условия. 14
3. Найти критические, т. е. допустимые, точки, являющиеся решениями уравнений п. 2, в которых у* и λο одновременно не равны нулю. При этом удобно бывает рассмотреть отдельно случаи λ0 = 0 и λο^Ο. Во втором случае можно положить λο равным единице или любой другой положительной константе. 4, Отыскать решения среди всех критических точек или доказать, что решения нет. В заключение приведем те три примера, о которых говорилось выше. Пример 1 (показывает, что в правиле множителей Лагранжа не всегда можно полагать λο=1). /о(*ь *2)=*i-*inf; fi(xu x2)=xiz—x22=0 (*=R2). Функции /о и fx непрерывно дифференцируемы. Легко поднять, что решение задачи £=(0, 0). Если прямо следовать Лаг- ранжу, то надо составить сумму 2?=Χχ+λ(χ\ζ—х22) и далее решать уравнения if*=*0f ^2 = 0«1 + 3λ^ = 0, ~2λ*2 = 0. Но эти уравнения несовместны с уравнением связи λγι3—лг22=0. Пример 2 (показывает, что экстремум функции Лагран-, жа как задачи без ограничений может не совпадать с экстремумом исходной задачи с ограничениями). fo(xu *2)=*22—*i-*inf; h(xu *2)=*i+*i3=o (*=R2). Ясно, что решение задачи #=(0, 0). Функция Лагранжа: J?=Xo(*22—*ι) +λ(χι+χ\*). Необходимое условие экстремума: -S?^ = 0, #*, = 0«-λ0 + λ(1+3*2) = 0, 2λ0*2 = 0. Если λο=0, то λ¥=0, и, следовательно, 1+3jci2 = 0 — противоречие. Значит, λο^Ο. Полагаем λο=1. Тогда функция Лагранжа примет вид 2> = Χ22—Χι+λ(Χι+Χϊζ). Однако ни при каких λ эта функция в точке х= (0, 0) не имеет даже локального минимума. Пример 3 (показывает, что принцип Лагранжа при несоблюдении определенных условий может приводить к неверным результатам). Пусть X=Y=l2> f(x) =*i+*2/2+ ... +xjn+ ..., F(x)=*(xuX2/29...9xJn9...) (х= (Хи X2i . . . , ХПу ···))·
Рассмотрим задачу f(x)->ini; F(jc)=0. Здесь х=0 есть единственный допустимый элемент, следовательно, он и является решением задачи. Если предположить, что существуют множители Лагранжа λο^Ή и у^/г, неравные одновременно нулю и такие, что для элементарной задачи S>=Xof(x)+(y*9 F(x))-*inf выполнено необходимое условие минимума j?(x, λο, у*) (теорема Ферма), то «#*(*.**, у*) = (Ь*Я0=— у19 ... ,λ0= — Уп, ···, где у*=(уь ..., уПу... )е/2, поскольку 12* изоморфно /2 [КФ, с. 177]. Но эти условия противоречивы: либо λο^Ο, тогда */*= = (—λ0,..., —λο,...) £Ёк\ либо λο=0, тогда #*=0, т. е. оба множителя Лагранжа равны нулю. Здесь /2 — пространство всех последовательностей х=(х\, ...9Хп$-..)9 для которых оо ||л:|||2= (V |xrt|2j1/2< оо,/2 — пространство, сопряженное к /2 ΙΚΦ, с. 177].
Часть I ОСНОВНЫЕ ЭЛЕМЕНТЫ ТЕОРИИ ЭКСТРЕМАЛЬНЫХ ЗАДАЧ § 1. ЭЛЕМЕНТЫ ФУНКЦИОНАЛЬНОГО АНАЛИЗА, ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ И ВЫПУКЛОГО АНАЛИЗА Построения общей теории экстремальных задач, а также основных разделов вариационного исчисления и оптимального управления требуют рассмотрений в нормированных и банаховых пространствах. Однако важнейшие фрагменты теории могут быть проиллюстрированы в евклидовом пространстве Rn. В первой части этой книги, где возможно, ограничиваемся конечномерным случаем. Сводка всех необходимых сведений из функционального анализа, дифференциального исчисления и выпуклого анализа (с полными доказательствами) содержится во второй части (§ 7 и 8). Здесь же мы используем лишь необходимые элементы бесконечномерного анализа, уделяя преимущественное внимание простейшему, конечномерному случаю. 1.1. Нормированные и банаховы пространства 1.1.1. Пространство Rn. Пространство Rn — пространство- я-мерных векторов Rn={x= {хи ..., хп) |**^R, ί=1,..., η}. Векторы из Rn можно складывать (по правилу: χ=(χ\, · · · ,Хп), х'= (х'и... 9x/n)=^xl+x/l= (xi+x'u ,Хп+х'п)) и умножать на вещественные числа (по правилу: х=(хи ... ,Хп), ft,eR=^X*=» = (λ*!,..., λχη)). Вектор 0= (0,..., 0) называется нулевым вектором. Это превращает Rn в линейное пространство. В пространстве Rn обычно вводят расстояние следующим образом: Это расстояние называют евклидовым. Его можно выразить через евклидову норму: 1*1 :=(£*?)'* по формуле d(x9 x') = \x~x'\. Евклидова' норма, как это нетрудно проверить, удовлетворяет таким соотношениям: а) |л:|^0 для всех #eRn и |х| = 17
*=0<=*л:=0; б) |cu:| = |a| · \х\ для любого χ из R* и любого a из R; в) Ιχ+χΊ-^ΙχΙ + Ι^Ί для любых χ и х' из Rn. Функции, обладающие подобными свойствами, называют нормами, а линейные пространства, оснащенные нормами, называют нормированными пространствами (точные определения © следующем пункте). Нормы в Rn можно определять по-раз-: лому. Например, по формуле | \ ΝΙρ = (Σ Ι*ιίρ)ι/Ρ (Кр<«>) «или по формуле IMIoc= max \xt\. Введение нормы дает возможность найти расстояние по формуле d(xt *') = ||х—х'\\9 определить, что такое открытые и замкнутые множества, сходимость и т. п. 1.1.2. Определение и примеры банаховых пространств. Линейное пространство X называется нормированным, если на X определен функционал ||·|| : Jf-^R, называемый нормой и удовлетворяющий условиям: я) \\х\\>0Ух£=Х и ||χ||=0<=>*=0; <$) |МН|а| W Vae=R, ΥχεξΧ; в) \\xi+X2\\<\\xi\\ + \\x*\\ VXu x*^X. Иногда, чтобы подчеркнуть, что норма задана именно на X9l >пишем \\·\\χ. Две нормы в X || · 1^ и ||· ||2 называются эквива-\ лентнымщ если существуют такие положительные константы С χ и С2, что 1 Ci\\x\\i<\\xh<C2\\x\\iYxeX. Всякое нормированное пространство становится метриче-, £ким, если в нем ввести расстояние d(x\9 #2) = 11*1—^2II· j Последовательность {хп} точек метрического пространства] X называется фундаментальной, если она удовлетворяет критерию Коши, т. е. если для любого ε>0 существует такое чис-, ло Νε, что d{Xn'> Хп»)<.& для всех n'>Ne, n">Nz. Если в пространстве X любая фундаментальная последовательность сходится, то это пространство называется полным. Полное относительно введённого расстояния пространство называется банаховым пространством. Примеры банаховых пространств 1. Конечномерное пространство 1рп9 состоящее из векторов η x=(xu...,xn)t=Rn с нормой ||*||р = (£ |^|р)1/р, 1<Р<оо. 2. Пространство С (К, Rn) непрерывных вектор-функций х(-) : /С->КЯ, заданных на компакте К, с нормой ||*(·)||0 = = тах |*(/)|. 18
3. Пространство CrflY0, t\]> Rn) г раз непрерывно дифференцируемых вектор-функций х() :[tU9 fi]->Rn, заданных на конечном отрезке [/0, *i]c:R, с нормой ||jc(.)IHmax{||jc(.)||0,...,||^)(.)||o}. 4. Пространство k, состоящее из последовательностей #=· оо «=(хь · · ·»*η,. ·>), для которых У х2<сх>, с нормой, зада.- со ваемой формулой IMI = (£ *?V/2. 1.1.3. Произведение пространств. Пусть Хи Уп нормированные пространства. Декартово произведение XX У можно* превратить в нормированное пространство, введя норму \\(х, y)\\zxY-max{\\x\\zf \\у\\у] (легко проверить, что все аксиомы нормы выполняются). Возможны и другие эквивалентные нормировки. Отметим очевидное утверждение: декартово произведение* банаховых пространств банахово. 1.1.4. Сопряженное пространство и сопряженный оператор. Совокупность X* всех линейных непрерывных функционалов, на X образует сопряженное к X пространство. Оно является банаховым пространством относительно нормы k*||^*= sup (х*,х)». где (**, х) означает действие на χ функционала х* [КФ, с. 171]. Пространство, сопряженное к конечномерному пространству Rn, изоморфно Rn. Скалярное произведение двух, векторов у= (у и -.., Уп) е Rn и х=(хи...9 хп) <= Rn представ- п η ляется в виде суммы (у, х) = Х* ytxlu Так же сумма V ytxt бу- £=1 £=1 дет обозначаться нами просто как ух, если yeRn*, jceRn; при этом следует χ считать столбцом, у — строкой (и тогда ух есть не что иное, как произведение матриц). Пусть X и У — нормированные пространства и Λ& ^&(ХУ У) — линейный непрерывный оператор из Х'в У. Тогда можно определить сопряженный оператор А* : Υ*-+Χ*>. такой, что (у*, Λ*)=<Λ* У*> x)Vxt=X [КФ, с. 217]. Для линейного непрерывного функционала на произведении пространств имеет место следующая очевидная Лемма. Всякий функционал Ле (Χχ У) * однозначна представим в виде (Л, {х9 у)) = (х\ х) + (у*, у), где х* е=X* и у* е= Υ\ 1.2. Некоторые теоремы из геометрии и функционального анализа 1.2.1. Теоремы Вейерштрасса о достижении максимума и минимума. Чаще будет использована следующая основная 19
Теорема Вейерштрасса. Непрерывная функция на непустом ограниченном замкнутом подмножестве конечномерного пространства достигает своих абсолютных максимума и минимума [15, т. 1, с. 235]. Выделим простое следствие из этой теоремы, которое часто будем использовать. Следствие. Если функция f непрерывна на Rn и lim /(*)= + °°( Нш /(*) = —оо), то f достигает своего абсс- лютного минимума (максимума) на любом замкнутом подмножестве Rn. Напомним, что множество А в метрическом пространстве называется компактом, если из всякой последовательности элементов из А можно выбрать сходящуюся к элементу из А подпоследовательность или (равносильное определение) если из всякого покрытия А открытыми множествами можно выбрать конечное подпокрытие. Ограниченное и замкнутое подмножество конечномерного пространства является компактом. 1.2.2. Теоремы отделимости. При выводе необходимых условий экстремума (принципа Лагранжа) в выпуклых задачах (п. 2.3.3) и в задачах с равенствами и неравенствами (п. 2.4) пользуемся свойством отделимости непересекающихся выпуклых множеств. Приведем результаты, касающиеся конечномерного случая (о бесконечномерном случае см. в п. 7.1). Множества А к В называются отделимыми, если найдется такое полупространство, которое содержит Л, а точки множества В или не принадлежат ему, или лежат на границе этого полупространства. Аналитически это можно записать так: существует вектор 'leRn(X¥*0)9 для которого inf (λ, x)>sup (λ, χ). χ£Α χζΒ Множества А и В называются строго отделимыми, если найдется такое полупространство, которое содержит множество Л и не содержит точек из В. Аналитически это можно записать так: существует вектор XeRn, для которого inf (λ, *)>sup <λ, λ:>. χ£Α χ£Β Теорема 1 (первая теорема отделимости в конечномер-j ном случае). Пусть А и В — непустые выпуклые множества в\ Rn, A(]B=0. Тогда множества А и В отделимы. Теорема 2 (вторая теорема отделимости в конечномерном случае). Пусть А — непустое выпуклое замкнутое мно-. жество в Rn, ЬфА. Тогда точку Ь можно строго отделить от А\ О А) Доказательство теоремы 2. Рассмотрим за«! дачу о расстоянии от точки Ь до замкнутого множества А: \Ъ—x\-*ini, x^A. (з). 20
Поскольку функция f(x) = \x\ непрерывна и lim /(jc)= + °°, по следствию из теоремы Вейерштрасса (п. 1.2.1) решение задачи (з) существует. Обозначим его х. Ясно, что х¥=Ь (рис. 1). Проведем через точку Ь гиперплоскость Η перпендикулярно вектору Ьх. Покажем, что при этом множество А находится в одном из открытых полупространств. Тем самым теорема 2 будет доказана. Действительно, если бы существовала какая-нибудь точка аеЛ, лежащая на гиперплоскости Я или в открытом полупространстве, не содержащем точку х, то [а, х]^А и из (прямоугольного или тупоугольного!) треугольника Ьха следовало бы, что перпендикуляр из точки Ь на [а, х] имел бы меньшую длину, чем \Ьх\. Противоречие с тем, что χ — решение (з). Б) Доказательство теоремы 1. Утверждение «множества А и В отделимы» равносильно утверждению «точка нуль отделима от множества СЙЙА—В={х=а—b\a^A, Ь^В}», Действительно, inf (α, у) > sup (b, у) <=> inf (α, у) —sup (b, у> > 0 a£A b£B a£A b£B *=> inf (a, y) + inf (—6, y) > 0 *ф inf (a—b9 y) > (0, y). a£A b£B a£A b£B Поэтому для доказательства теоремы достаточно доказать отделимость точки нуль от множества С. Ясно, что С — выпуклое множество и 0§ЁС. Если int C=0; то размерность аффинной оболочки множества С меньше п> т. е. dima// C<n. В этом случае aff С — собственное подпространство в Rn, и поэтому существует содержащая его гиперплоскость. Эта гиперплоскость — искомая. Пусть т\Сф0. Тогда существует открытый конус /С', такой, что K'czK^LconeC= ix = Y ttcb ct e= С, /t>0, ί=1, ...,s, s^N—любое}. Ясно, что —К'(]К=09 иначе следовало бы, что О^С. Возьмем произвольную точку ξ^—/С'. Она не принадлежит конусу К (замыканию /С), являющемуся, как нетрудно убедиться, замкнутым выпуклым множеством. 21
По второй теореме отделимости точку ξ и множество /^ можно разделить, т. е. существует вектор λ^Ο, для которого ίηί_(λ,χ>>(λ,ξ). (1) хек Невозможно допустить, что для некоторой точки хеЯ было бы. выполнено неравенство (λ, х)<0, ибо иначе нижняя грань $ левой части неравенства (I) была бы равна —оо. Значит,, (λ, #)>0 для любого х^К и тем более для любого х^С. Раз< деляющая точку нуль и множество С гиперплоскость построена. Е> 1.3. Определения производных Для вещественных функций одного вещественного переменного два определения — существование конечного предела lim 'g+»-'g> (1> и возможность асимптотического разложения при А->0 F(x+h)=F(x)+F'(x)h+o(h) (2) —'■ приводят к одному и тому же понятию дифференцируемости. Но уже для функций двух и большего числа переменных существует несколько различных подходов к понятию дифференцируемости (гладкости). Определение (1) ведет к понятиями производной по направлению, вариации по Лагранжу и производной Гато. Определение (2) ведет к понятиям производной Фреше и строгой дифференцируемости. 1.3.1. Производная по направлению, вариация по Лагранжу^ производная Гато. Пусть Χ, Υ — нормированные пространствам F: Χ-+Υ — отображение пространства X или некоторой οκ-j рестности точки χ в пространство У. Предел 6f(*,ft) = limf(* + U)-F(*) λ-*ο λ в предположении, что он существует, называется производной^ F в точке χ по направлению h. ] Если отображение F имеет в точке χ производную по всем*] направлениям h^X, то говорят, что F имеет в точке χ вариаА цию по Лагранжу. При этом отображение h-+6F(x, К) называют вариацией по Лагранжу. Если оператор 6F(x, ·) : X-+Y линеен и непрерывен по h^ то говорят, что F дифференцируемо по Гато в точке х, a one-] ратор 6F(x, ·) называется производной Гато отображения Я в точке χ и обозначается F'r(x). Таким образом, если F дифференцируемо по Гато в точке х9 то для любого фиксированного Щ имеет место разложение F{x+%h)=F{x)+XF'T{x)[h] + r(hy λ)^ где \\r(h9 λ)||->0 при λ-^0. 22
1.3.2. Производная Фреше, строгая дифференцируемость. Отображение F п. 1.3.1 называют дифференцируемым по Фреше s точке χ и пишут F^D(x), если существуют линейный непрерывный оператор из X в У, обозначаемый F'(x), и отображение / некоторой окрестности χ в У, такие, что Fi&+h)-Fi&)+F'(&)[h] + r{h), (1) ИА)И-о(ЦЛЦ) при ||А|К0. Оператор F'(£):X-*Y называется производной Фреше. Соотношение (1) мо^кно кратко записать так: F(£ + h)-F(*)+F'{£)[h]+o(h), лонимая о (А) как элемент пространства У, для которого ||о(Л)|[=о(||А||) при ||А||-И). Через F'(x)[h] обозначено значение отображения F'(х) на элементе АеХ. Если в каждой точке χ открытого множества U отображение F^D(x) и отображение x-+F'(x) непрерывны, то пишем F^Cl(U). Ясно, что из дифференцируемое™ по Фреше отображения F в точке χ следует дифференцируемость отображения F в точке χ по Гато. Уже в двумерном случае эти два понятия различаются. Из дифференцируемое™ по Гато по определению вытекает существование вариации по Лагранжу. И снова (уже в двумерном случае) эти понятия различны. На языке ε-δ определение дифференцируемое™ по Фреше отображения F в точке χ формулируется так: существует оператор F'(£)e2?(X9 У), такой, что для любого ε>0 найдется ό>0, при котором для всех A: ||Α||<δ выполняется неравенство \\F(jt+h)^F(£)^F(Jt)[h]\\<s\\h\\. Из (1) следует, что производная Фреше определена однозначно, ибо равенство ΛιΛ—Λ2Α=ο(Α) для линейных непрерывных операторов Λι и Лг возможно лишь при Λι=Λ2. Во многих задачах конечномерного и бесконечномерного анализа дифференцируемое™ по Фреше в точке недостаточно для получения содержательного результата. Это побуждает к следующему усилению дифференцируемости в точке. Пусть отображение F дифференцируемо по Фреше в точке *. Оно называется строго дифференцируемым в точке χ (при этом пишут F^SD(x))9 если для любого е>0 найдется такое £>0, что для всех хх и х2, удовлетворяющих неравенствам ΙΙ*ι—#||<б, 11*2—*||<δ, выполнено неравенство \\F(xx)-F{x2)-F/{x)[xl-x2]\\^\\xl-x2l Если F : Rn->Rm — дифференцируемое в точке χ отображение конечномерного пространства Rn или некоторой окрест- 23
ности точки it в пространство Rm, то производная Фреше в χ — матрица, составленная из частных производных F'(x)=(^-),i=\,...,m,j=l,...tn. Эта матрица называется матрицей Якоби. Если гп=п, то определитель матрицы Якоби называется якобианом отображения \ F в точке jc. 1.3.3. Частные производные, производные высших порядков·. Пусть X, У, Ζ — нормированные пространства, U — окрестность точки (£, у) в XX У, F : U-+Z. Если отображение x-+F(x, у) дифференцируемо в точке £ по Фреше, то его производная называется частной производной по χ отображения F в точке (х9 ff) и обозначается F'x{x> Q)y или —ч * дх Аналогично определяется частная производная по у Fy(x,y) Дадим теперь определение второй производной функции нескольких переменных. Пусть U — окрестность точки х=(хи .'.. ,хп) в Rn„ /:i/->R — функция, определенная и непрерывно дифференцируемая на ί/. Говорят, что функция / дважды дифференцируема в точке ху если существует квадратичная форма Q, такая,, что /(i+*)-/Wi+f(i)W+(l/2)Q(A).+f(fcJf где r(A)=o(|/i|2). Квадратичная форма определяется симметрической матри- цеи, составленной из частных производных { ' 1, «,/=■ \ dxidxj I = 1, ...,л. Переходим к бесконечномерному случаю. Пусть X и У — нормированные пространства, °UciX — открытое подмножество. Если отображение f:°U-*Y дифференцируемо в каждой точке ха°иу то определено отображение x-+f{x) множества <№ в пространстве &{Х> У). Поскольку &{Х, У) также является нормированным пространством, то можно ставить вопрос о существовании второй производной Для' A1c:Xf//(x)[Ai]&2>(*. У)- Возьмем h2*=X\ тогда определено f"(x)[hu h2]*=f (x)[hilhz]. Таким образом, определено линейное по каждому аргументу отображение /"(#) :ХХХ-*У. Анало- гично определяются производные высших порядков. 24
Теорема (о смешанных производных). Если для отображения f:<U-+Y существует вторая производная /"(х), то для всех hu h2^X Г(х)¥1и h2)=f"(x)[h2, Αι] ΙΑΤΦ, с. 156] 1.4. Основные теоремы дифференциального исчисления в нормированных пространствах Приведем несколько теорем, наиболее часто используемых для решения экстремальных задач. 1.4.1. Теорема о суперпозиции. Пусть X, У, Ζ — нормированные пространства, %ί — окрестность точки χ в Χ, ψ — окрестность точки у в У, φ (*)=#, ψ:^-^Ζ, /=ψ°φ: °U->Z — суперпозиция отображений φ и ψ. Тогда, если ψ дифференцируемо по Фреше в точке #, α φ в "точке χ дифференцируемо по Фреше (дифференцируемо по Гато, имеет вариацию по Лагранжу), то f обладает в точке χ тем же свойством, что и φ, и при этом соответственно Г (*)-*'($)**'■{*). М*)-♦'(*) ·φ'γ(*) · 6/(if Λ)=ψ'(#)[δφ(χ, h)]VheX. Если ψ строго дифференцируемо в у, α φ строго дифференцируемо в х, то f строго дифференцируемо в х. Теорема о суперпозиции не имеет, вообще говоря, места, если ψ дифференцируемо лишь по Гато. <\ Рассмотрим подробно два крайних случая — вариацию по Лагранжу и строгую дифференцируемость. А) По определению производной Фреше y(y)=My)+YG)ly—y]+o(y—y). Следовательно, Hm /(* + *Λ)-/(3 ^1|m П>(ф(*+М))-Ч>(й = λ-*0 λ λ-*0 λ = lim Ч>'(Й[ф(* + М)-Й + о(Ф(* + М)-у) = λ-м)': λ Ιλ-»·ο λ J wo λ <Ρ<* + λΛ)—"ί = Ψ' (У) W(x, A)] + Hm ;l»g+ff-j · Hm. λ-ο IIφ (χ + λΛ) — y\\ λ-ο II λ =*'<») [φ'(£ Α)]+ο · ιΐφ'(ϊ, Λ)ΙΙ = *' (y)W (£ А)], что и доказывает формулу для вариации по Лагранжу суперпозиция отображений. 25
Б) Так как <peS£>(£), \|)eSZ>(#), то для любых ει>0,. ε2>0 найдутся такие δι>0, б2>0, что из неравенств \\Xi-х\\< <δι, Ш—*/||<δ2, t=0, 1, следуют неравенства ||φ (хг)~φ (χ2)—φ' (χ) [хг —χ2]\\ < εα ||^—*2||, (1> II* (ί/ι)-ψ(ί/2)-*' (5) [Уг-УМ < ε2 !|У1-у2||. (fe>? Для любого ε>0 подберем ει>0 и ε2>0 так, чтобы выполнялось неравенство Βΐ*2+*2\\4'(*η+*ΐΗ'{ΰ)\\<*. По этим ει, ε2 найдем 6ι>0, δ2>0 так, чтобы имели место соотношения (1) и (2), и, наконец, положим β-πιίη{δι, δ2/(ει + ||φ,(ί)||)}. Если теперь \\χι—ί||<δ, i=0, 1, то в силу (1) 11<р (*ι)-φ (ь)\\ < *г \\χι-χ%\\ + W (χ) [*ι-*2]ΙΙ < <(β4 + Ι|Φ'(^11) ll^i-^ll· (3) Полагая в этом неравенстве поочередно #;=£, /=0, 1, получаем Нф (χι)-ν $11 = ΙΙΦ (*ύ -У\\ < ih+W (2)11) δ < A, так, что для ί/ί=φ(#ί) справедливо (2). Используя теперь (1)ν (2) и (3), получаем II/ (*!)-/ (*) -*' (у) Гф' (χ) [хг-хЛ\\ < II* (φ (*ι))-* (φ (*.)Ь- -*' (у) [φ (χχ)-<ρ Will + II*' (у) [φ (*ι)-φ (*2)-φ' (χ) Ιχχ-χΔ]\\ < <%\\4(x1)-y(x2)\\ + W(y)\\ · НфЮ-ф W-φ'Wk-^2]JI< < ε2 (8l + ||φ' (T)||) Ц^-χ,ΙΙ + II*' (f)\\ г, Ц^-^il - = (βΑ + β, ||Φ' (3)|| + ε, Ι!*' (5)||) ΙΚ-*2|| < ε \\xt-b\\P это и означает, что f^SD(x). Полагая в этих рассуждениях х2=х, Χχ=χ+Η, получим доказательство теоремы для случая дифференцируемое™ φ по Фреше. Доказательство теоремы для случая дифференцируемости φ по Гато получается анализом уже доказанной формулы для вариации по Лагранжу суперпозиции отображений. > 1.4.2. Теорема о среднем. Хорошо известно, что для числовых функций одного переменного справедлива теорема Лаг- ранжа, называемая также теоремойо среднем значении, или формулой конечных приращений: если функция f:[ay b]->R непрерывна на отрезке [а, Ь] и диф- 26
ференцируема в интервале (а, Ь), то существует точка се е(а, Ь), такая, что №-№-Г(с)(Ь-а). (1) Нетрудно убедиться, что формула (1) остается справедливой « для числовых функций f(x), аргумент которых принадлежит произвольному нормированному пространству. В этом случае [a, b]={x\x=a + t(b—а), 0</<1}, аналогично определяется интервал (a, b)y a дифференцируе- мость можно понимать в смысле Гато. Полагая φ(ί)===/(α+ +t(b—α)), сводим доказательство к случаю одного вещественного переменного. Для векторнозначных функций формула (1) не имеет места. Отметим, что в анализе, как правило, используется не сама формула (1), а вытекающая из нее оценка \f(b)—f(a)|<: <cM(b—α), где М= sup |/'(x)|. Покажем сейчас, что в этом х£(аМ более слабом виде утверждение распространяется уже, на случай произвольных нормированных пространств. По традиции оно сохраняет название «теорема о среднем», хотя, конечно, его следовало бы именовать «теоремой об оценке конечного приращения». Теорема (о среднем). Пусть Xf Υ — нормированные пространства и открытое множество UxzX содержит отрезок ί«. Ь]. Если отображение f:U-*Y дифференцируемо по Гато в каждой точке х^[ау 6], то ll/(ft)-/(a)IK'sup ||/;(с)]|· ||fc-a||. <]B силу следствия из теоремы Хана — Банаха (п. 7.1) для любого y^Yy а значит, и для y=f(b)—f(a) найдется элемент /еУ*, такой, что ||ί/*ΙΙ = 1 и <*/*, у) = \\у\\9- т. е. <*/*, f(b)—f{a)) = 4lf(*)-f(a)l|. Обозначим φ(ί)=<ί/*, f(a+t(b—а))). Поскольку у* — линейный непрерывный функционал, а отображение f в каждой точке [a, b] имеет производную Гато, то по теореме о суперпозиции <f'(t) = (y\fr{a + t(b-a))[b-a]) Vie [0t 1J. Из дифференцируемости функции φ следует ее непрерывность на [0, 1], и, следовательно, к ней можно применить формулу Лагранжа (конечных приращений): φ(1)-φ(0)-φ'(θ), θ€=(0, Ι). 27
Поэтому ΙΙ/(&)-/(β)ΙΙ = </./(*)-/(α»=φ(ΐ)-φ(0) = = <У%/ί(α + θ(&-α))[&-α]><||/;(α + θ(6-α))[6-α]||< <!ΙΜα+θ(&-α))|| · ||6-α||< sup ||/;(c)|| · ||6-α||. C> с 6(α,6) Приведем несколько следствий из теоремы о среднем. Следствие 1. Пусть выполнены все условия теоремы о среднем и К<=9?(Х, Ϋ). Тогда ||/(6)-/(α)-Λ(&-α)||< sup ||Мс)-Л|| · ||6-α||. с€(а,Ь) <\ Надо применить теорему о среднем к- отображению g(x)-f(x)-Ax.> Следствие 2. Пусть X и Υ — нормированные пространства, U — окрестность точки χ в X, отображение f: ί/-»- Υ дифференцируемо по Гато в каждой точке x^U. Если отображение x-+f'r(x) непрерывно в точке х9 то отображение f строго дифференцируемо в χ (а следовательно, и дифференцируемо по Фреше в той же точке). < В силу непрерывности отображения x-+f'r(x) для любого ε>0 найдется δ>0, такое, что из неравенства Цл:—х\\<6 следует неравенство ИГг(*)-М*)11<е. о В силу выпуклости шара В=В(х9 δ) из условия хи Х2^В следует, что [х\, дг2]еВ. По следствию 1 теоремы" о среднем с A=f'r(x) получаем \\f{xl)—f{x2)—fr(x)[x1—x2]\\^ sup \\f'r{x) — —К fall X 11*1—*all < 8 ll*i—^ll. что означает строгую дифференцируемость отображения f в точке х. > Следствие 2 показывает нам, что при проверке дифференцируемое™ конкретных функционалов достаточно доказать существование производной Гато и проверить ее непрерывность, это уже гарантирует строгую дифференцируемость (и тем более существование производной Фреше). 1.4.3. Формула Тейлора. Теорема о полном дифференциале. Формула Тейлора. Если /<Л)(х) существует, то f(x + h)^f(x) + r(x)[h] + (ll2)r0c)[hrh]+... ...+(\ln\)f{n)(x)[h9...yh]+r(h)y где ||r(A)||=o(||A||») при h->0 (АТФ, с. 159). 28
Теорема о полном дифференциале. Пусть Х9 Уг Ζ — линейные нормированные пространства, U — окрестность в XX Υ9 F: U-+Z — отображение, имеющее в каждой точке (х9 y)^U частные производные Fx(x9 у) и Fy(x9 у) в смысле Гато. Если отображения (х9 y)-+Fx(x9 у) и (х, y)-+Fy(x9 у) непрерывны в точке (х9 y)^U в равномерной операторной топологии, то F строго дифференцируемо в той же точке и при этом F' & У) И> Л] = Fx (х9 у) [ξ] + Fy (х9 у) [η]. <3 В силу непрерывности отображений Fx(x9 у) и Fy(xf у) в точке (х, у) для любого ε>0 можно выбрать б>0, такое, что «прямоугольная» окрестность V=B(x, δ)χβ(#, δ) точки (ху У) содержится в С/, и в ней выполняются неравенства \\Fxi*. У)-Рх{х, У)\\< ε, ΙΙ^(*. У)-Г9& У)Н<в. (1) Теперь имеем Δ= F(xv yx)—F{x29 y2)—Fx(x9 y)Ui—^\—Fy (*> У)[У1—У%] = = F(xv yx)—F(x2, yt)—Fx(x, $)[*!—χ*] + + F{X2, yJ—FiXz, y2)—Fy{x9 у)\уг—уД. Легко видеть, что если точки (хи ух)9 (х29 у?) лежат в V, то и точка (л:2, yi)eV, и, более того, оба отрезка [(хи ух)9 (х2> у\)] и [(*2» У\)> (*2> У2)] содержатся в VczU. Поэтому отображения x->F(x9 yi) и y-*F(x29 у) дифференцируемы по Гато: первое имеет производную Fx на [χΪ9 х2]9 второе Fy — на [уи у2]. Применяя следствие 1 теоремы о среднем к этим отображениям,, получаем в силу (1) ||Δ||< sup \\FAlyx)-FMfcy)\\-\\Xi-x*\\ + + sup \\F (x2, n)—Fy(xt y)\\ · \\УХ—У2\\ < <г\\х1—χ,ΙΙ + εΙΙ^—у2\\ Для любых (хи й)еУ, (х2, y2)^V9 что и означает строгую- Дифференцируемость отображения А > 1.4.4. Конечномерные теоремы об обратной и неявной функции. Теорема Люстерника. Теорема о касательном пространстве. Теорема (конечномерная теорема об обратной функции). Пусть WgR" — окрестность точки х=(х\9 ♦.♦, хп)9 F:°U-+Rn — отображение класса Cl{fU)9 F(x)=y. Тогда если якобиан отображения F в точке χ отличен от нуля, то существуют та- кие ε>ο, 6>0 и /С>0, что для любого у из шара \у—у|<б су- 29'
ществует единственное χ в шаре \х—х\<е, такое, что F(x)=y и при этом \х—х\<К\у—д\. Замечание. Мы привели теорему об обратной функции в той форме, в которой она будет в дальнейшем у нас использоваться. Обычно доказывают больше, в частности, что гладкость обратного отображения такая же, как и гладкость пряЬ мого, и формулу (F-l{y))'=(F'(F-l(y)))-1. Следствие (конечномерная теорема о неявной функции). Пусть *U = RkxRs—окрестность точки (х, у) — (х19 ... , \, *yv ... , у$)э "*P:%-».RS, Ψ (χ, у) = 0, Ψα(χ] у) — обратимая матрица. Тогда существуют /С>0, б>0 и такое отображение φ :Β(χ, 6)-».R «класса С (В (χ, δ)), что Ψ(χ, <p(x)) = <V<p(*) = y, Mx)—y\<K\x—x\. <|Положим n=k+s9 z=(x} у) (^eRft, i/^Rs), F(z) = = (x, Ψ (ζ)): Тогда функция F в точке ζ=(χ9 у) будет удовлетворять требованиям теоремы об обратной-функции, ибо «есть невырожденная матрица. По теореме об обратной функции существуют такие δ>0, ε>0 и /С>0, что если |ξ—*| + |η|< <δ, то найдется единственная пара (х, у), для которой \х—х\ + + \У-У\<ги F(x9 у) = (Ъ, η)<=>* = £, ψ (χ, ί/) = η, \x-x\ + \y-y\<K(\i-x\ + \y\\), Положив η~0, получим, что если \х—Jt|<6, то имеется единственное У=у{х)9 \у—*/|<ε, для которого F (*, φ (х)) = (*, 0) » Ψ (х, φ (χ)) = 0, \у—у\<К\х—х\. ϊ> Замечание. Из формулы, для производной обратной функции немедленно следует, что φ'(*) = -[^(χ, 4(χ))Γι[Ρχ(χ. φ(*))Ι· Теорема Люстерника. Пусть Χ, Ζ — банаховы про-Ί <странства, <U^O(x, x)F-.Ш-^-Ъ. Если F^SD(x) и F'(x) является эпиморфизмом, то существуют окрестность Ua<M точ- , ки х, число /С>0 и отображение <p:U-*-X, такие, что F(x+(f(x)) = F{x), \\<f(x)\\^K\\F(x)-F(?x)\\. •30
<] Доказательство этой теоремы основано на модифицированном методе Ньютона. А) Не ограничивая общности, считаем, что *=0 и .F(*)=0. о Выберем ε>0 столь малым, что β(0, ε)<=<2/ и ||F(^)-F(^)-F'(0)(^-^)||<^||*'-^|| (l> при ΙΙ^ΊΙ<ει, Илг^Н<ε (это возможно, поскольку F^SD(&)), где константа С>1 взята из леммы о правом обратном операторе (п. 7.2) для оператора Λί, являющегося правым обратным к F(0). Положим для x€bU=B(0, δ): Ь+1 = Ь,-ЛГ(^(Й)). ">0> &> = *> (2> где δ столь мало, что ||л:|| -4- СЦ/7(л:) || <С«/2 при ΙΜΙ<δ. Б) Докажем, по индукции, что ||ξη||<ε Ул>0. Очевидно, что ||ξο|ΗΙ|Λ:||<^ε/2. При я=1 из (2) и леммы о правом обратном операторе получаем оценку |lb-*|| = ||AfFW||<C||FW||f (3> откуда ΙΙξιΙΚε/2. Пусть ΙΙξ/ΙΙ<ε при £=0, lf., . ,&(&>1). Выведем отсюда, что Ι|ξ*+ιΙΙ<ε. Для ί=0, 1,... 9k из (2) имеем r(0)(b+i-b) + F(6i) = 0f (4> откуда НЬ+1-Ы1<С||>(|()11 =C\\F(b)--F(b-i)- (О} -F' {ЩЬ-Ь-ι) И < -j || Ь-Ь-ill -» =ΦΙΙΙί+ι-ξίΙΙ<2-'||ξ1-^|1<2-1-ίε, ι = 1 k. (5'> Отсюда в силу неравенства треугольника получаем || b+i II = II h+i-h+h-^-i + · · · + ξ2-Ιι+li IK < II Еж-БД! + !!i*-I*-i II + · · · + II ξ,-Ь II + II Ει IK : <τ(τ+τ+···+ιτ)+τ<β· Таким образом, мы получили, что ||ξ*+ιΙΙ<ε, откуда по индукции следует, что ΙΙξηΙΚε Vn»0. В) Из неравенств (5), (5') следует, что 11Бн*-и<НЬ*1-Ь,1|(1 + -5-+ ···+ -^г)<2||би.,— ~~ξ"!Κ^-Ιϋι—*ΙΙ-»Ό ПРИ »-*·«>, т. е. {ξ„}„>0—фундаменталь- 3f
пая последовательность и, значит, она сходится в силу банаховости X. Обозначим -ф(л;) = Нт|п; тогда II tn—x II < II In-in-i II + II fe-i-b^-s II +... -t II ξ,-Ь II + + llli-*ll<llli--*ll(-i~r+-5P3-+... + i)<2|||l-*||. Переходя к пределу, получаем (3) \\*W-x\\<2\\%l—x\\<2C\\F(x)\\ = K\\F(x)\\9 причем 11*(^)11<Н^11 + 2|1Ь-*11<в. Отсюда и из (1) вытекает, что F непрерывна в точке Ψ(λ:) и поэтому из (4) П-»-оо п-+оо Пусть X — нормированное пространство, Μ — некоторое •его подмножество. Элемент h^X называется односторонним касательным (полукасательным) вектором к множеству Μ в точке х^М, если существуют ε>0 и отображение г:[0, е]->Х9 такие, что: a)x+th + r(t)e=M V/<~[0, ε]; б) ||г(ОП=о(0 при t-++Q. Вектор h называется касательным к множеству Μ в точке х, если векторы h и —h являются односторонними касательными векторами к Λί в х. Множество всех касательных векторов к Μ в точке χ обозначается 5V^· множество односторонних касательных векторов Т'£М. Очевидно, что TjΜ и Tj'Ai— конусы. Если множество Т^М является подпространством в X, то оно называется касателрным пространством к Μ в точке х. Во многих случаях, в том числе и представляющих значительный интерес для теории экстремальных задач, множество касательных векторов может быть найдено при помощи такого следствия из теоремы Люстерника. Теорема (о касательном пространстве). Пусть Χ, Ζ — банаховы пространства, U^G(x> *)» F:<U-*Z, Ft=SD{x)u F (χ) — .эпиморфизм, Μ = {χ^Χ I F (x) = F (χ)}. Тогда T*M = KerF'(x). 32 .
<] А) Пусть Λ(ΞΤ-Λί, /-(·)—отображение из определения касательного .вектора. Так как F^SD(x)v то при малых а F(x) = F(x+ah + r(a)) = F(x) + aF'(x)[h] + o{a). Отсюда aF'(x)[h] + o(a) = 0 и, значит, F/(x)[h] = 09 т. е/ТхМа с Кег/"<*). Б) Пусть й^Кег/7'^). Положим г (a) =q>(x+ah)y где φ — отображение, построенное в теореме Люстерника. Тогда F(x + ah + r(a)) = F(x)y \\r(a)]\ = \\<pOe + ah)\\^K\\F(x + ah)— F{x)\\=o(a)9 т. е. 1к=Т'хМ. \> 1.5. Элементы выпуклого анализа Выпуклый анализ — раздел математики, в котором изучают выпуклые объекты: множества, функции и экстремальные задачи. 1.5.1. Определения. Пусть X — линейное пространство. Множество АаХ называется выпуклым, если для любых двух точек Х\ и χ<ι из А и любого числа α из отрезка' [0,1] элемент ах\ + (1—а)#2 принадлежит А. Всякий треугольник на плоскости выпуклый, среди четырехугольников встречаются и выйуклые, и невыпуклые. Шары в нормированном пространстве — выпуклые множества. В ча<?т- п ности, выпуклы при р> 1 единичные шары В1пр: = ixelH V W<1 ^ Ц нормированных пространств 1Рп. Выпуклы полупространства (т, е. множества вида {х\{ху ξ)<β}) и их пересечения. Пересечение конечного числа полупространств в R" называется выпуклым полиэдром. Множество К называется конусом, если из условия х^К следует, что ах^К для любого положительного а. Выпуклые конусы — конусы, являющиеся выпуклыми множествами. Примеры выпуклых конусов: угол раствора <π на плоскости, неотрицательный ортант R+" в R", множество неотрицательных функций в пространстве С(Г), ,где Τ — компакт, полупространства, ограниченные гиперплоскостями, проходящими через нуль в R", и их пересечения. Пересечение конечного числа полупространств, ограниченных гиперплоскостями, проходящими через нуль, называется многогранным углом с вершиной в нуле. _ _ Пусть задана функция f:X-+R (R:=RU{±°°}). С каждой такой функцией / связываются два множества: 33
domf: = {x\f(χ)< + οο} — эффективное множество и eptf:={(a, x)i=RxX\a>>f{x)9 x(=domf] — надграфик f. Функция / называется выпуклой, если надграфик / — выпуклое множество. Функция p:Jf->R' (R/: = R£/{ + °o} называет* ся выпуклой однородной, или сублинейной, если надграфик ρ— выпуклый конус. Еще можно сказать так. Функция ρ сублиней^ на, если p(ax)=ap{x)Va>Q, x^X, и p(^i+jc2)<p(jc1)+5; +p(*2)V*i, Х2^Х- Функция / называется собственной, если f(x)>-oo Vx(t=>f:X-+R·) и dom/¥=0. Из определения выпуклого множества сразу следует, что собственная функция выпукла тогда и только тогда, когда выполнено неравенство Иенсена: /(ал:1+(1~а)д:2)<а/(л:1) + (1—a)f(x«) Vxv х2е=Х, «g[0; 1]. Примеры выпуклых функций одного переменного доставляют: экспоненты ехр(ах), aeR, степенные функции \х\р> р>1, а также х* при х>0 и +оо при х<0, если β<0^ Норма в любом нормированном пространстве — пример сублинейной функции. η Любая аффинная функция в Rn, т. е. функция α (χ): ~]ΓαΛ + + α0, разумеется, выпукла, а любая линейная функция сублинейна. Функция, равная максимуму некоторого семейства аффинных (линейных) функций, выпукла (сублинейна). О выпуклых экстремальных задачах будет рассказано в § 3 и 4. Пусть С — некоторое конечное подмножество Х9 т. е. *С: = η η ={*ι,..., Хп}. Элемент х = £ a(xh щ > 0, £ щ = 1, называ- η ется выпуклой комбинацией С, а элемент 6=jr βΛ·, βοο — ill конической комбинацией. С. Совокупность всех выпуклых (конических) комбинаций конечных подмножеств множества А называется выпуклой (конической) оболочкой А и обозначается соЛ(сопеЛ). Можно легко показать, что множество соЛ совпадает с пересечением всех выпуклых множеств, содержащих А . (иногда это свойство берут за определение соЛ), а множество сопеЛ совпадает с пересечением всех выпуклых конусов, содержащих А. Выпуклая оболочка конечного числа точек называется выпуклым многогранником, а выпуклая коническая оболочка конечного числа точек — конечнопарожденным конусом. Среди выпуклых многогранников простейшую (в некотором смысле) структуру имеют симплексы (выпуклые оболочки конечного числа аффинно независимых точек в R"), т. е. треугольники в R2„ треугольные пирамиды в R3. 34
Особую роль в структуре выпуклых множеств играют крайние точки. Точка χ выпуклого множества А называется крайней, «если не существует точек Χ\Φχ* хь х2^Ау и числа λ, 0<λ<1, таких, что χ=λχι+ (Ι— λ)χ2. У многогранников крайние точки— вершины. Имеет место теорема Минковского: компактное множество в Rn является выпуклой оболочкой своих крайних точек. 1.5.2. Операции над выпуклыми объектами. Приведем некоторые алгебраические и теоретико-множественные операции над выпуклыми объектами. Элементарно доказывается, что они выпуклые объекты переводят в выпуклые. Операции над функциями. 1) Сумма: (f\ + f2) (х)- = =fi (х) + h(x); 2) конволюция: (fi®/2) (*): = inf {fi (χι) + +/2(^2) \X\ +X2=x)\ 3) максимум: (frVfe) (x):=max{fi(x), f2(x))\ 4) выпуклая оболочка минимума: (f\CoAh) (*)=min{a/i(*i) + + (1-α)/(*2)|αΘ[0, 1], α*ι-(1—α)χ2=*}. Третья операция может быть естественным образом распространена на произвольное семейство выпуклых функций. Операции над множествами: 1) сумма: А)+Ао: = ={x\x=Xi+x2, x\^AXi л:2еЛ2}; 2) конволюция: 4i|+li42:= *=\)(аА\{\(\—а)А2)9 ae[0; 1]; 3) пересечение: Ax(]A2={x\x^ ■e-Ai, χ2ψΑ2}·9 4) выпуклая оболочка объединения: j4iCo|Jj42= =co{Ai[)A2). Третья операция может быть применена к любому семейству выпуклых множеств. Операции 1), 3) и'4) и над функциями, и над множествами вполне привычные, чего нельзя сказать яро операции 2) — конволюции. Их смысл и значение раскроются, когда речь пойдет о двойственных соотношениях. В соответствии с общим замыслом этой книги в первой части ограничиваемся по преимуществу конечномерным случаем. Во второй части будет рассказано о выпуклом анализе в бесконечномерном пространстве, в первой части X — это R". Одно из важнейших свойств выпуклых объектов состоит в том, что они допускают двойное описание: в основном и «двойственном» пространстве. В конечномерном случае (когда Х= = Rn) двойственное пространство (пространство линейных функционалов) может быть идентифицировано с Rn, и ато облегчает нашу задачу. Перейдем к определению двойственных операторов. Пусть /: Rrt-*R — некоторая функция. Преобразованием Ле- жандра — Юнга — Фенхеля функции f называется функция Г (у): = sup«*f y)-№). X Из определения f* видно, что /* — верхняя грань семейства аффинных функций, т. е. f* выпукла. 35
Функция /** (χ): = sup ((#, у) —/* (у)) называется второй со- У пряженной к /. Из определения сопряженной функции следует неравенство Юнга: <x,y)<f(x)+f*(y). Легко подсчитать, что сопряженной к аффинйой функций* η х->а(х; ξ, α): =γ* %tx£ — α будет «элементарная» функция е(У> 1у °0> равная α в точке ξ и + <*> — в остальных точках, ау наоборот, е*(о; ξ, α)=α(°; ξ, α). Пусть А — непустое подмножество в R". Полярой множества А называется множество A°: = {yt=R*\(xy у)<1 Vxz=A}. Множество Л00={*еКп|<*, у><:1 УуеЛ0} называется би- полярой. Из определения Л° видно, что это пересечение семейства полупространств, содержащих нуль, т. е. выпуклое замкнутое множество, содержащее нуль. Нетрудно понять, что поляра отрезка [0; х] — полуплоскость Пх:={у\(х> у><1} и наоборот, П*°=[0, х]. Отметим еще„ что поляра шара В{0, г):={лг||лгj <г} — шар 5(0, г-1). Пусть К — конус в Rn. Сопряженным конусом, к К называется множество К*:={у<=ЕЪ"\(х9 у>>0 Vx^Kl Конус K**:={x^Rn\(x, y)>0 Vye/C*} называется вторым сопряженным^ конусом к К. Из определения К* видно, что это множество — пересечение полупространств, границами которых являются гиперплоскости, проходящие через нуль. Значит, К* — выпуклый замкнутый конус. Сразу видно, что /С*= =-/С°. Субдифференциалом сублинейной функции ρ называется множество др:={у\(х9 у)<р{х) Vx}. Легко понять, что субдифференциалом евклидовой нормы х->~ \х\ в R" является шар 5(0, 1]|={х||*| <1}. Субдифференциалом (выпуклой собственной) функции f в точке χ называется следующее множество: df(*):={yeR*\(x-*9 y)<f{x)-f{*) Vx). Из определений сразу вытекает, что др и df(x) — выпуклые подмножества в Rn. Легко доказать, что они замкнуты. Пусть А — непустое подмножество R". Функция sA(y): = sup{(xy y)\x*=A) называется опорной функцией Л. 36
Субдифференциал линейной функции *->(*, ξ) совпадает с {£}. Опорная функция элемента ξ есть линейная функция <·. е>. После каждого определения давались примеры. Они могут показаться искусственными. На самом деле в них заложен зародыш тех соотношений двойственности, которые будут обсуждаться в следующих пунктах. Приведем еще два определения. Пусть А непустое подмножество в R". Функция μЛ(л:): = inf{α>0|α-1л:eЛ} (inf0=: + oo) называется функцией Минковского, а функция 6А{Х):={°> *<=*> [ оо, Х$ЁА — индикаторной функцией. Функция Минковского шара В1рп есть норма в 1рп: μ(ΒΓρ)(χ) = (γι\{χί{ρ)1/Ρ, 1<Р<°о, и(ВС(*))-тах|*(|. \ ■**' / κτίστη t=l Из определения μЛ (при выпуклом А) сразу следует эта выпуклая однородная (сублинейная) функция. 1.5.3. Теоремы двойственности и компактности. Придадим точный смысл4 высказыванию о том, что выпуклые объекты имеют двойное описание. Этот смысл раскрывает следующая . Теорема двойственности, а) Функция f:Rn-^R' совпадает со своей второй сопряженной тогда и только тогда, когда она выпукла и замкнута (т. е. когда ее надграфик — выпуклое и замкнутое множество). б) Пусть А — непустое множество в R". Оно совпадает со своей биполярой тогда и только тогда, когда А — выпукло, замкнуто и содержит нуль. в) Конус /CczR" совпадает со своим вторым сопряженным, когда он является выпуклым и замкнутым. г) Пусть prR^-^R — однородная первой степени функция с непустым субдифференциалом. Для того чтобы было выполнено равенство sdp=p, необходимо и достаточно, чтобы ρ была сублинейна и замкнута. д) Пусть А — непустое подмножество в Rn. Для того чтобы было выполнено соотношение dsA=A, необходимо и достаточно, чтобы А было выпукло и замкнуто. Утверждение а) часто называют теоремой Фенхеля—Моро, Утверждение б) — теоремой о биполяре. Выразим некоторые следствия из теоремы в виде алгебраических или теоретико- множественных равенств. а) Пусть / — выпуклая замкнутая собственная функция. Тогда из а) следует, что /, с одной стороны, есть выпуклая обо- 37
лочка объединения «элементарных функций» е(°; х9 f(x))y xe edomf, а с другой — верхняя грань семейства аффинных функций, а именно sup{a(·; у, f*(y)) \y(=domf*}. β) Пусть А — непустое выпуклое и замкнутое подмножество R" и ОееЛ. Тогда А= [) [О, *] = П П„, где Пу={х\х9 у)< γ) Пусть ρ — замкнутая сублинейная функция и дрФ0. Тогда p=sup {(о у)/у£Едр}. δ) Пусть А — непустое выпуклое и замкнутое подмножество» Тогда А= 0 {*}= П Щу, sA(y)), Щу, а): = {х\(х, у)<а}. х£А x£ds A Эти соотношения и раскрывают дуальность описания выпуклых объектов. Переформулируем их словесно. Замкнутая выпуклая собственная функция — верхняя грань аффинных функций, ее не превосходящих (Минковский). Замкнутая сублинейная функция с непустым субдифференциалом есть верхняя грань линейных функций, ее не превосходящих (Хермандер). Замкнутое выпуклое подмножество есть пересечение полупространств, его содержащих (Минковский). Во второй части (п. 8.1) теорема двойственности будет доказана полностью в бесконечномерном варианте. Все утверждения а)—г), по сути дела, равносильны. Во второй части утверждения б)—г) будут выведены из а) — теоремы Фенхеля— Моро. Здесь же докажем лишь утверждение б) — теорему, о биполяре. О Из определения биполяры следует, что У Ζ А* У Я^но, что Tly — выпуклое замкнутое подмножество, содержащее нуль. Таким образом, если А=А00, то А выпукло, замкнуто и содержит нуль. Докажем теорему в другую сторону. Если х^А и У^А°9 то из определения следует, что (х, у)<1, т. е. АаА00. Допустим, что имеется элемент х^А00\А. Тогда (в силу допущения А выпукло и замкнуто) по второй теореме отделимости найдется элемент #^Rn, такой, что sup (χ, ί/)<1, (χ, */)> 1. χ£Α В силу первого неравенства у^А°9 значит, для #еД°° должно выполняться неравенство (х, #)<1, а это противоречит второму из выписанных неравенств. О Отметим следующий результат. Теорема о компактности поляры и субдифференциала, а) Пусть А — открытая окрестность нуля в R". Тогда поляра А компактна, б) Пусть ρ - непрерывная сублинейная функция на Rrt. Тогда субдифференциал 38
ρ — выпуклый компакт. Если ρ — замкнутая сублинейная функция, то др — замкнутое выпуклое множество. Оба эти результата о компактности /допускают бесконечномерные обобщения. Их доказательства приведем в п. 8.1. В конечномерном случае все совсем просто. < а) Мы уже пользовались тем, что поляра — выпуклое, замкнутое множество. Если шар В (О, r)={*|l*|<r} содержится в А, то для поляр имеется обратное вложение. Но (В (0, г))°= =В(0, г-1). Итак, А0 — ограниченное замкнутое множество, в R", т. е. компакт. б) Пусть ρ — непрерывная сублинейная функция. Всегда можно считать, что р>0 (вычитая, если это не так, линейную функцию из субдифференциала). Пусть ЛГ=тах{р(л;) | |л:| = 1}. Тогда в силу однородности р(х)<М\х\ =^:p0(x)Vx и, значит, дрс=:дро(х)=В(0, Λί). Замкнутость др очевидна, откуда (в случае непрерывности р) др — замкнутое ограниченное множество, т. е. компакт. 1.5.4. Выпуклое исчисление. В п. 1.5.2 были введены операции над выпуклыми объектами (суммы, конволюции и т. п.), а затем — операторы двойственности (сопряжение функций и конусов, поляра, д9 s). Выпуклое исчисление составляет набор формул такого рода. Пусть выпуклый объект составлен, скажем, из двух объектов с помощью некоторой операции. Требу· ется выразить двойственный оператор от этого объекта через двойственные операторы от составляющих. В этом отношении выпуклое исчисление сродни дифференциальному. Формулы выпуклого исчисления делятся на два класса. Одни верны всегда, и тогда пишем =, другие — при выполнении определенных условий. Тогда пишем ~. Приведем таблицу основных формул. - I. Исчисление преобразования Лежандра—Юнга—Фенхеля: Ι.1 (/ιθ/2)*=/ι*+/2*. 3. (fiCoAM*=fi*V/i·. 2, (/ι + Μ*^/ι*θ/2*. 4. (fiV/s)**/i*coAf2·. II. Субдифференциальное исчисление: 1. д(рх + р2)^дрх + др2., 2. д{рхУр2)**дрхсо\)др2. III. Исчисление поляр: 1. {АХ+А2)*=АХ*\Т\А2*. 3) (Ах{\А2)*с*Ах*со\)А2\ 2) (AX\T\A2)*€*AX*+A2*. 4. (Л1соиЛ2)°=Л1°ПЛ20. IV. Исчисление опорных функций: 1. s(Ax+A2)=sAx+sA2. 2. s{Ax()A2)^sAx&sA2(g*sAxcoAsA2). 3. s(Axco[}A2)=sAl\/sA2. 39
Из формул I—IV и соотношений #*=— К°9 1Л=Х° вытекают очевидные соотношения для аннуляторов и сопряженных конусов: 1. (L{+L2)±=L^()L2\ 3. (/Ci+/C2)*—/Ci*n/C2*. 2. (L^L^^L^+L^. 4. (К№2)* = Кх* + Къ*. В формулах I.I и 1.2, III. 1 и III.2 раскрывается смысл и значение операций конволюции для функций и множеств. Приведем доказательство двух важнейших формул из приведенной таблицы. Формула Моро —Рокафел л ар а. Пусть р\ и р2 — сублинейные функции, из которых рх непрерывна, а р2 замкнута. Тогда d(Pi+p2)=dpl+dp2. < Если у€Едрх+др2, т. е. y=yi+y2f y^dpi9 i=l, 2, то (х9 yi)<Pi{x)Vx. Тогда (х, у)< \р\+р2) {x)Vx9 т. е. у^д(рх + +р2)=>дрх+др2<^:д(рх+р2). Предположим, что дрх+др2Фд(рх+р2) и $^д{рх+р2)\(дрх+ + др2). В силу теоремы компактности дрх — выпуклый компакт, а др2 — выпуклое замкнутое множество. Тогда, очевидно, др\ + др2 — замкнутое выпуклое множество, и по второй теореме отделимости можно найти элемент х9 такой, что sup (χ, Уг + у2)< (χ, у). Но по определению sup {{χ, У\ + у2)) \ y^dpi9 i=l, 2}¥*sdp\{x) + -fsdp2(£) = (по теореме двойственности г)) =:Ρι(£)+ρ2{£). Получилось, что Р\{х) +Р2(х)<(х,U). Это противоречит допущению о том, что S^d(pi + p2). t> Формула Дубовицкого —Милютина. Пусть Р\ и р2 — непрерывные сублинейные, функции. Тогда d(p1Vp2) = co(dp1\Jdp2). < Если у€Ξсо(дрг(Jдр2)9 т. е. ^=«^+(1—а)у29 yt^dpi9 i= = 1, 2, 0<α<1, то (х,у)=а(х,у1) + (\— а)(х, у2)<^р1{х) + + (l—a)p2(x)^(p1\Jp2){x)> т. е. со{dPl\)dp2)с:d(px\Jp2). Предположим, что со(др^дрг)φd(Pl\/p2) [и^е^р^Р-Дсо^и^)· Из непрерывности pi и теоремы о компактности следует, что dpi — компакты. Но тогда выпуклая оболочка объединения со(дрх[)др2) — компакт, т. е. замкнутое множество. Следовательно, "по второй теореме отделимости можно найти элемент £, такой, что а: = sup (x9 ау1 + (1—а)у2)<(х, у). aGiO.l],y^bpv ί«0.1 40
Из определений сразу следует, что а: = sup (asd^+O—<x)sdp2)(x) *= (по теореме двойственности г))= sup (ap2 (*) + (! — a) p2(#)) = _ ί aGlO.l! =d(Pi VP2X*)· Это противоречит допущению о том, что у^д(рг Ур2). [> Для выпуклых функций имеются аналогичные формулы. Если /ι и /г —" выпуклые замкнутые функции, причем /ι непрерывна в некоторой точке х, где /г конечна, то для любой точки x(=Rn 3(/i+f.)W=3/iW+«/iW. Если /ι и f2 — выпуклые и непрерывные в точке χ функции, причем fl(x)=f2(x), то д(ПУЪ)(х) = соШх)\)дШ). Обе формулы — Моро—Рокафеллара и Дубовицкого—Милютина (для выпуклых функций) — допускают бесконечномерные обобщения. Приведем формулировку обобщения последней формулы. Теорема об очистке (для субдифференциалов) „ Пусть Τ — компакт, /:7xRn->'R — функция, обладающая следующими свойствами: а) f(t> ·) — выпукла и непрерывна на RnVt^T; б) Д-э х) — полунепрерывна сверху V^Rn. Положим f (χ) = max f (/, χ), y^df (х)ГТогда существуют г^л +1, τ; е 7\ такие, что /(τ,, χ) = / (х), yi<=dxf(Ti9 χ) и уе=со{у1У ... , */,}* Доказательство этой теоремы см. в п. 8.2. §2. ГЛАДКИЕ ЗАДАЧИ С РАВЕНСТВАМИ И НЕРАВЕНСТВАМИ. ЗАДАЧИ ВЫПУКЛОГО ПРОГРАММИРОВАНИЯ В этом параграфе выводятся необходимые условия экстремума для гладких и выпуклых задач с ограничениями типа равенств и неравенств. Материал этого параграфа базируется на стандартных средствах алгебры и анализа. Одна из основных теорем (п. 2.4) доказана сразу в общем случае, но понятно, как она может быть изложена в конечномерном варианте· Основные результаты этого параграфа обсуждаются еще раз во второй части (см. п. 9.1 и 11.1). 41
2.1. Задачи без ограничений 2.1.1. Экстремумы функций одной переменной. Пусть /:R->- ->-R» — функция одного действительного переменного. Рассмотрим задачу об отыскании экстремумов этой функции f(A;)-*extr. (з) Теорема 1 (Ферми). Если χ — точка локального экстремума функции f и f дифференцируема в точке х, то ТО=о. Доказательство теоремы Ферма проходится сейчас в школе, и здесь его не повторяем. Теорема Ферма дает необходимое условие I порядка для существования локального экстремума. Сформулируем условия I—II порядка. Теорема 2. Пусть функция f дважды дифференцируема в точке х. Необходимые условия экстремума: если х— точка локального минимума (максимума) функции f, то Ж=0, Г(*)>0 (ТО<0). Достаточные условия экстремума: если га=о, и*»о (п*хо), то χ — точка локального минимума (максимума) функции /. Доказательства теорем 1, 2 будут даны в п. 2.1.2 для более общего случая. В одномерном случае можно дать почти исчерпывающий анализ вопроса о том, является данная точка х локальным экстремумом или нет. Теорема 3. Пусть f — функция одного переменного, определенная в некотором интервале, содержащем точку £ и η раз, дифференцируемая в точке х. Необходимые условия экстремума: если £ есть точка локального минимума (максимума) функции f, то либо /'(*)=· · ·=/"(*) =0, либо Г(х)=...=/(2т-!)^) = 0, /(2m)(*)>0 (/(2m>W<0) (1) при некотором m>l, 2/я<п. Достаточные условия экстремума: если выполняется условие (1), то & — точка локального минимума (максимума) функции /. < По формуле Тейлора для η раз дифференцируемой функции в точке i имеем следующее разложение: f{x+x) = V f Jx) xk + r(x), -lgL->0 при дс^О. *-0 42
Необходимость прия=1 следует из теоремы Ферма. Пусть далее η > 1. Тогда либо f' (χ) = ... =/(η) (χ) = 0, либо /' (χ) = ... ... =/(/""!)(ί) = 0, f(/)(i)^0, 1^.η. Возможно одно из двух: / — нечетно или /—четно. В первом случае положим φ(£)=/(*+>/Г)» |eR. Тогда φ(1)=/ (χ) + £ J-^- V+r (yT) (г (yTJ/S^-O при ξ-*θ)—дифференцируемая в нуле функция. Поскольку д?е е locminf, toOg locminq). По теореме Ферма φ' (0)=f(/) (*)//!=0. Противоречие показывает, что / должно быть четным: 1=2т. Поэтому из формулы Тейлора f{x+x)—/(*)= /(2m)^) **"+/·.(*), ^^.->0 при *->0. ' V Г ; ' V } (2m)! 1V '* х2т v Так как /(2т)(х)^0, το f{2m)(x)>0 при £с= locmin/ и f{2m) (x)<0 при xg locmaxf. Достаточность. Поскольку][/' (*) = ... =/(2m~1) (х)==0, Pm) (#) ^ О, то по формуле Тейлора f{x + x)-f(x)^f^^^n + r%(x)t. -^Г-^0 при *-*0. Следовательно, если f(2w)(*)>0f то f(x +x)— f(x) >0 при достаточно малых л:, т. е. *е locmin/, если /(2ill)(x)<0i то /(#+*)— — /(лГ)<;0 при достаточно малых х, т. е. jTelocmax/. > 2.1.2. Экстремумы функций нескольких переменных и функционалов. Пусть / — отображение нормированного пространства X во множество действительных чисел R, обладающее некоторой гладкостью, т. е. определенными свойствами дифференцируемое™. Гладкой задачей без ограничений называется задача об отыскании экстремумов этой функции /(*)-мйЛ\ (3Ϊ Теорема 1 (аналог теоремы Ферма для нормированных пространств). Пусть X — нормированное пространство, функционал f, определенный в окрестности точки х, дифференцируем по Фреше (имеет вариацию по Лагранжу) в точке х. Тогда, если xelocextr/, то f(£) = 0 <б/(х, й) = 0 Yh&X). < Если ielocextr/, то Vh^X точка нуль — локальный эк- def стремум функции одного переменного: λ-^φ(λ; h)=f(£+Xh). Значит, φ/(0; /ι)=0, и, пользуясь определением вариации по Лагранжу, получим, что δ/(#, /ι)=0. Если функционал f дифференцируем по Фреше в точке ί, то в этой точке он имеет ва- 43
риацию по Лагранжу. Поскольку xelocextr/, из уже доказанного следует, что эта вариация равна нулю. Отсюда /'(£)=0 в силу определения дифференцируемое™ по Фреше (п. 1.3.2).|> Из теоремы 1 следует, что если точка χ доставляет локальный экстремум дифференцируемой в точке χ функции нескольких переменных: /:R"-vR, то все частные производные функ- ции / в этой точке х обращаются в нуль, т. е. . w дхх дхп Теорема 2. JlycTb X — нормированное пространство, U<=0(t, X), f:U-+K, /€Ξί?2(*). Необходимые условия экстремума: если х^ elocmin(max)/, то /'(*)=0, /"(*)<[*, *]>0 {f'(*)[x9 *]<0) VX€=X. Достаточные условия экстремума: если ¥(х) = =0 и Г@)[*>х]>*\\х\\% (П*) [*,*]<-<* II* II2) V^gX (1) при некотором а>0, то ielocmin(max)/. < По формуле Тейлора (п. 1.4.3) Д(2+^)=/(5)+/'(5)М+(1/2)Г(^)[^^+^(^ И г(*) II =о(||* II1). Докажем теорему для случая минимума. Случай максимума аналогичен. Необходимость. Поскольку #elocmin/, то во-первых, по теореме Ферма (п. 2.1.3) f'(x)=Ot во-вторых, f(£+Xx) — —f(^)>0 при достаточно малых λ. Поэтому в силу формулы Тейлора /(ί+λχ)— /(*) = (λ2/2)/"(*)[*, *]+r(U)>0 при малых λ. Отсюда Г(*)[*, *]>0 Vx<=X. Достаточность. Так как //(#)=0, то по формуле Тейлора в силу условия f'(&)[x, л:]>а||д:||2 имеем f(*+*)-/£) = γΠ*)[*, x} + r(x)>^-\\x\\* + r(x)>0 при достаточно малых х. Следовательно, ielocmin/. > Неотрицательная определенность второй производной для функций η переменных означает неотрицательную определен- ность матрицы (-^j· Условие (1) называется условием строгой положительности (отрицательности) второй производйой в смысле Фреше функционала /. 44
Отметим, что в конечномерных пространствах условие по- ложительнои определенности матрицы 1 ; 1, т. е. условие 2-^-М/>0 VA = (AX ftJeR", ίιφΟ, тарантирует строгую положительность второго дифференциала (и, значит, является достаточным условием минимума в стационарной точке). В бесконечномерных пространствах это не так [АТФ, с. 242]. Положительная и отрицательная определенности матрицы устанавливаются с помощью критерия Сильвестра. Теорема (критерий Сильвестра). Матрица А является положительно (отрицательно) определенной тогда и только joa- да, когда все ее главные миноры deMfe, где -Ал=(^/)*/,/вь ^=1,...,п, положительны ((— l)Meb4fe>0, &=1,...,я). Доказательство этого утверждения приведено в [АГТ, -с. 219]. 2.2. Гладкая конечномерная задача с ограничениями типа равенств 2.2.1. Постановка задачи. Пусть /t:R"->R, t==0, l,...,m, — ^функции η переменных, отображающие пространство R" в R. Конечномерной экстремальной задачей с ограничениями типа равенств называется следующая задача в R": /о (х) ->extr; fi (*) = 0. / = 1, ... , /п. (з) Далее считаем, что все функции fi обладают определенной гладкостью. 2.2.2. Правило множителей Лагранжа. Теорема. Пусть х — точка локального экстремума в задаче (з), а функции fi9 i=0, l,...,m, непрерывно дифференцируемы в окрестности точки χ (условие гладкости). Тогда существует ненулевой вектор множителей Лагранжа λ=(λο, λι, ..., λm)^Rm+1, такой, что для функции Лагранжа задачи (з) m выполняется условие стационарности 1 £=-0 <\ Проведем доказательство от противного. Предположим, ***то условие стационарности не ' выполняется, т. е. векторы 45
fi'(x), i=0, l,...,m, линейно независимы. Это означает, что ранг матрицы Л = ( ' ) .= 0 т равен т+1. Тогда πα \ Щ /ί=1 ;;;;;„ теореме о ранге матрицы существует матрица Μ порядка (т + -fl)X(m+l) с определителем, отличным от нуля. Допустим5 для определенности, что этой матрицей является матрица, со- ставленная из первых столбцов матрицы Л: ί det а/о (*) дхх <*/о (х) dfm(x) дхх dfmG) detM=£0. Не ограничивая общности, считаем, что /о(*)=0. Действительно, если fo{x)¥=09 то следует рассмотреть функцию /о(*) = =fo{x)—/о(*). Положим для вектора х= (хи ..., Xm+\):F(x) = = (/7о(л:),.. .., Fm{x)) = (fo{x,f£m+2, ··., */ι), .·· fm(x, Хт+2^..- . ..,*л)); Z7 отображает некоторую окрестность точки х= = (*ь ·. .Jm+i)eRm+1 в Rw+1 и является (в силу условий гладкости теоремы) непрерывно дифференцируемым отображением этой окрестности, F(x)=Q. Кроме того, det(-^ilL) = detA1^0. \ dxj /£=0.1 m /=1,...,т-[Г По теореме об обратной функции в конечномерных пространствах (п. 1.4.4) существует обратное отображение F~l некото- торой окрестности нуля, такое, что \F~l(y)—#|</С|#| с некоторой константой К>0. В частности, для достаточно малого πα модулю ε найдется вектор x(e)=F-l(e9 0, ...,0), такой, что F(x(e)) = (e, 0, .... 0), т. е. /ο(*(β))=β, Ь(х(г))=0, /=1,...,/η, (1> где х (ε) = (Χι (ε),..., xm+i (ε), Xm+2>..., Χη) и при этом \х(в)—Я\<К\в\^>\х(в)—£\<К\в\. (2> Из соотношений (1), (2) следует, что вектор £ не доставляет задаче экстремума, ибо вблизи его существуют допустимые векторы л:(ε), на которых функционал /о принимает значения как большие, так и меньшие f0(x) (напомним, что /о(^)=0). Получили противоречие с тем, что £^*locextr3. Таким образом, наше предположение (противного) неверно и тем самым теорема доказана. t> Замечание 1. Из соотношения (1) следует, что если векторы h'(x),..., fm(£) линейно независимы, то %<*φβ. 46
Замечание 2. В правиле множителей Лагранжа для задач с ограничениями типа равенств можно, вообще говоря, не обращать внимание на тип экстремума и, убедившись, что λο4^0, полагать λ0 любой отличной от нуля константой. Для задач, где присутствуют неравенства и включения, знак λο существен. Сформулируем в этом же пункте необходимые условия экстремума в задачах с равенствами и неравенствами. Пусть /i:R"-*Rf i=0, 1,..., m, — функции п переменных. Конечномерной экстремальной задачей с ограничениями типа равенств и неравенств называется следующая задача в Rrt: /o(*)-Hnf; fi{x)<09 i=l,...,m', ft(x)=0, i=m'+ 1,..., m. (з) Теорема. Пусть χ — точка локального минимума в задаче (з), а функции //, ι=0, l,...,m, непрерывно дифференцируемы в некоторой окрестности точки χ (условие гладкости). Тогда существует ненулевой вектор множителей Лагранжа λ= = (λο, λι,..., Km) eRm+1, такой, что для функции Лагранжа задачи (з) m У {χ, Х) = У XJiix) ί=0 выполняются условия: а) стационарности J£x(x, λ) = 0«2λ(£·(ί) = 0«-^|^-==0, / = 1, ..... η; t=-0 б) дополняющей нежесткости X,/i(je)=0, t=l,...,m'; в) неотрицательности λί>0, i=0, l,...,m'. Доказательство этой теоремы будет приведено в п. 2.4 в более общем случае. 2.3. Задачи выпуклого программирования 2.3.1. Задачи без ограничений.- Выпуклой задачей без ограничений называется следующая задача: , /W^inf. (з) Здесь f :X-+R — выпуклая функция, отображающая некоторое линейное' пространство X в расширенную прямую 47
Теорему (аналог теоремы Ферма). Для того чтобы точка χ доставляла в задаче (з) абсолютный минимум, необходимо и достаточно, чтобы выполнялось соотношение 0<=df(x). <ieabsmin3<*/(x)-f(i)>0=<0, x-x)^0<==df(x) > 2.3.2. Постановка задачи выпуклого программирования. Задачей выпуклого программирования (или выпуклой задачей} называется следующая экстремальная задача: M*)-*inf; М*)<0, ί=1,...,/η, х^А. (з> Здесь fnX-^R, £=0, l,...,m, — выпуклые функции (функционалы), отображающие некоторое линейное (не обязательно нормированное) пространство X в расширенную прямую, А— выпуклое подмножество в X. Поскольку из выпуклости функции f не следует, вообще говоря, выпуклость функции — /, то существенно, что (з) — задача не максимизации, а минимизации. Точка χ называется допустимой в (з), «ели х^А и ft(x)<Oy ί=1, ...fm. Лемма. Пусть X — нормированное пространство. В выпуклой задаче локальный минимум является и глобальным. <\ Пусть ielocmin3. Это означает, что существует окрестность °11 точки х9 такая, что —°°<fo(x)<fo(x) для любой допустимой точки x^PU. Возьмём произвольную допустимую точку х. Тогда при достаточно малом а>0 вектор x={l—a)x-l· + ax^°U и является допустимым. Следовательно, по неравенству Иенсена (п. 1.5.1) /о(*) <Ы*)<(1—а)Ы*) +<*/(*), откуда fo{*)<fo{x). > Поэтому в дальнейшем в выпуклых задачах, говоря «минимум», имеем в виду абсолютный минимум. 2.3.3. Теорема^ Куна—Таккера. Пусть X — линейное пространство, fi:X-+R9 i = 0, l,...,m, — выпуклые функции на X, А — выпуклое подмножество X. 1. Тогда если χ — решение задачи выпуклого программирования, то найдется ненулевой вектор множителей Лагранжа λ=-- = (λο, λι,..., λ/η), такой, что для функции Лагранжа Jc {χ, λ) = m ==Σ ^ifi(x) выполняются: а) принцип минимума для функции Лагранжа minJS?(*f X) = J£(*, λ); х€А б) условие дополняющей нежесткости Xifi{x)—O, *=!,..., m; 48
в) условие неотрицательности λί>0, ί=0, l,...,m. 2. Если λο^Ο, то условия а)—в) достаточны для того, чтобы допустимая точка χ была решением задачи. 3. Для того чтобы КоФО, достаточно выполнения условия Слейтера, т. е. существования точки х^А, для которой fi{x)< <0; i=\9...tm. <\ Пусть х — решение задачи. Не ограничивая общности,, считаем, что /о(^)=0 — иначе введем новую функцию fo(x) = =/о (х) — fо (*). Положим B = {b=(b0t 61,...,6m)eR^+1|Зд:eЛ:ft·(д:)<6г·, ί=0, 1,..,, τη). (1> Α) Β — непустое выпуклое множество. Действительно^ R+m+1cB, т. е. любой вектор с неотрицательными компонентами принадлежит Ву ибо в (1) можно положить х=х. Докажем его выпуклость. Пусть b и Ьг принадлежат В, 0<α<1, χ и х?— такие элементы из Л, что (в соответствии с (1)) \i{x)<.bw fi(x/)<bi\ i=0, l,...,m. Положим #α=α#+(1—α)*'. Тогда χα^Α, поскольку А — выпукло, а ввиду выпуклости функций U, ί=0, Ι,..,/n, &(χ«)=/*(α*+ (1—α)*') <afi(Jf) + (l—a)fi(tf)<abt+ (1—а)й*', т. е. точка ab+ (1—a)b'^B. Обозначим С={с=(с0у О,..., 0)e=R™+1|c0<0}. Б) С — непустое выпуклое множество и Cf)B = 0. Действительно, если существовала точка с= (с0у 0,..., 0), с0<0, принадлежащая В, то ввиду определения (1) отсюда следовало бы, что имеется элемент х^А, для которого выполняются неравен- ства: fo(x)<>Co<Oy fi(x)<Q> t=l, ..., m. Но из этих неравенств следует, что х не решение задачи. Значит С[\В=0. По первой теореме отделимости в конечномерном случае (п. 1.2.2) множества В и С можно отделить, т. е. существует вектор λ= (λ0, λι,..., Km) ¥=0, для которого m m inf 5Х&,>вир]£ЯА. (2> m Поскольку 0g J5, то из (2) 0>sup1£Я^^зирЯ^. Отсюда λ0>0 и, значит supkoco = 0. Тогда неравенство (2) перепишется в СЛедую- Щем виде: £λ,6,>0 VfteB. (3> о 4»
В) Множители λ*, ι=0, ..., m, удовлетворяют условиям не· ютрицательности. Действительно, так как мы уже говорили, что любой вектор с неотрицательными компонентами принадлежит В, то вектор (О,..., О, 1, 0, ...,0)е£, где единица стоит на 4-м месте. Подставив эту точку в (3), получим, что λ»>0. Г) Множители λ/, ί=1, ...,m, удовлетворяют условиям дополняющей нежесткости. Если fi{x)=Oy то равенство λί/ί(^) = =0 тривиально. Пусть fi(£)¥*Q для некоторого ί, тогда fi(x)< <0. Точка (0, ..,0, /,(£), 0, ...,0)е=^ где число fi{x) стоит та ί-м месте (достаточно взять точку х в качестве χ в (1)). Подставив эту точку в (3), получим что Я</«(£)>0 и, значит Jw<0. Но было уже доказано в п. В, что λι>0. Поэтому Я;=0 И λί/£(£)=0. Д) В точке χ выполнен принцип минимума. Возьмем х&А, тогда точка (/о(я), /ι(ή /m(x))EB. Подставив эту точку в ^3), имеем, что т Yxifi(x)^J£(xt λ)>0. Теперь если учесть равенство fo(x)=Q и условия дополня- ' ж)щей нежесткости, то получим для любого х^А т Х{ху λ)>0= J>,M*) = -2(*. λ). Утверждение 1 теоремы доказано. Ε) Докажем утверждение 2. Пусть λο^Ο. Полагаем λο=1. Тогда для любого допустимого χ получаем в) Jl def a) ^ def /θ (λ') > К (*) + Σ Wi (Χ) = i? (*, λ) > Λ (*, λ) = fD (Χ) + + Σ λ·Λ· (*) = £>(*)> £--1 т. е. х — решение задачи. Ж) Докажем утверждение 3. Пусть выполнено условие ЧИлейтера, но при этом в утверждении 1 λο=0. Тогда сразу же получается противоречие: так как не все множители Лагранжа равны нулю, то т 2 (х, λ) = Σ bih <*) < ° = * (Я λ)> (=1 * то время как вследствие а) &(χ, λ)»£*(*, λ). > 50
2.4. Гладкие задачи с ограничениями типа равенств и неравенств Рассмотрим задачу M*)-*inf; fi(x)<09 i=l,...,m9 F(x)=09 (з> где /r.X-^R, i=09 1,..., m9 F.X-+Y, Χ9 Υ — нормированные пространства. Теорема. Пусть в (з) X и Υ — банаховы пространства (условие банаховости), fi^SD(x), i=09 l,...,/n, F^SD(x) (условие гладкости) и ImF'(x) — замкнутое подпространство в* Υ (ослабленное условие регулярности). Тогда если jfefocmin3, то существуют вектор ЯёЯт+1 и функционал у*^У*, не равные» одновременно нулю и такие, что для функции Лагранжа задачи (з) m 2(x,ym, λ) = Σλ1/<(χ) + <ίΤ, F(x)) выполнены следующие условия: а) стационарности: ш ' i~o б) дополняющей нежесткости: λϊΜ·*)=0, ί=1,...,/η; в) неотрицательности: λί>0, ί = 0, 1,...,т. Мы сформулировали теорему в бесконечномерном случае,, ибо она будет использоваться нами в этой части (в § 5). Доказательство опирается на два утверждения, относящиеся к функциональному анализу, которые доказываются у нас во* второй части (п. 7.2). Для тех, кто пожелает продумать данную теорему в конечномерном варианте, нужно проанализировать те две леммы высшей алгебры, на которые следует ссылаться вместо лемм из п. 7.2. Отметим, что в формулировке теоремы п. 2.2.2 нет требования о замкнутости подпространства ImF'(x). Это так потому,„ что подпространство конечномерного пространства всегда замкнуто. Переходим к доказательству теоремы. <3 Можно считать, что /о(#)=0, иначе рассмотрим функцию /о(*)=Ы*)— Ы*)· Если ϊ%(χ)Φΰ при l<t<m, то отбросим это ограничение, поскольку для локального экстремума ограничения f%(x)<0 несущественны. Таким образом, можно* 5L
считать, что условия дополняющей нежесткости уже выполнены. А) Вырожденный случай. Если lmF'(x) есть собственное подпространство У, то по лемме о нетривиальности аннулятора (п. 7.2) существует функционал у*еУ*, у*фО, такой, что (у*, j/}=0 Vye=ImF'{£)<*<y*9 F'(£){x])=0 ΥχζξΧ** (F(*)) *y*=0. Остается положить λ^·=0, / = 0, l,...,m, и приходим к утверждению теоремы. Б) Пусть F'(x) отображает X на все,.У, т. е. lmF'(x)=Y. Положим для О^к^т Ah = {x\<fi'{£)tx)<0, i=kfk+l,...tmfF'(*)[x]=0). Очевидно, что AqCzAic: ... с=Лт. Лемма 1 (основная). Если хекюттз, то А0 — пустое множество. < О Предположим противное, т. е. что АоФ0. Тогда существует вектор £еКегР(;6), для которого <//(*), ξ> = βΐ<0, i= = 0, 1,...,/п. По теореме Люстерника* (п. 1.4.4) существуют отображение г:{—а, а]-+Х (а>0) и число /С, такие, что F(x+Xl+r(X))=0 Υλ(=[—α, α], (1) ||Γ(λ) \\<.K\\F(x+^)-F(x) \\=K\\XF'(x)№+o(X) ||=ο(λ). При малых λ>0 имеем для i=0, l,...,m, неравенства fi{x+a.l+r(%)) =U(x) +K(fi' {£), 1)+ο(λ) =Офг+о(Х)<0. (U) Соотношения (1) и (U)9 /=l,...,m, означают, что при малых λ>0 элемент х+Х£+г(Х) допустимый в задаче (з). Нох Бри этом неравенство (10) противоречит тому, что х^ ^1осгшпз. >> В) Лемма 2. Если Ат есть пустое множество, то для задачи (з) верен принцип Лагранжа. · 0<| Поскольку Am = {x\(fm(x)9 x) <0, F'[χ)[χ] =0}— пустое множество, то (f'm (х)9 х) = 0 для любого л: е Кег i7' (χ), т. е. fm(x)^(К&F'(x))L. Так как по лемме об аннуляторе ядра регулярного оператора (п. 7.2) (Кет F' (x))L = Im(F' (χ))*, то существует у* е У*, для которого ^(2)+(Γ(^))·»·=ο. Получили условие стационарности функции Лагранжа .!?(#, i/*, λ) с λ0= ... =λτη-ι = 0, λη=1. D>> * В конечномерном случае — по теореме о неявной функции. 52
Таким образом, из п. Б) и В) вытекает, что либо принцип Лагранжа уже обоснован (Лш=0), либо 3*, O<k<m:Ak=0, Ак+хФ0. (2) Г) Лемма 3. Если выполнены соотношения (2), то х=0 является решением следующей задачи: (fk'(£),x)-+ini; <//(*), хХО, i = k+lt...,mt F'(x)[x]=0. (з) <] О Предположим, что утверждение леммы неверно. Тогда найдется такой элемент η, что (//(*)» Л)^0» i = &+l,...,m, F'(x)[r\]=Q9 но при этом </V(*)> ηΧΟ. Пусть ξ —элемент, принадлежащий Лк+Ь т. е. (/,·'(*), ξ><0, i=k+l, ..., m, /7/(;ί)[ξ]=0. Тогда при малом ε>0 элемент η+εξ принадлежит Ah в противоречии с (2). [> О Д) Завершение доказательства./Применим к задаче (з) теорему Куна—Таккера (п. 2.3.3), учтя при этом, что условие Слейтера для зтой задачи выполнено (из-за непустоты А^\). По этой теореме найдутся' неотрицательные числа λ&—1, Afc+i,..., λ™, такие, что для функции Лагранжа задачи (з) пг J£(x9 λ) = £ ^ (// (х), х) в точке χ=0 выполнен принцип ми- шимума: min .§?(*, λ) = <£(*, λ) = 0. *GKerF'(*) Из последнего соотношения вытекает, что <&(х, λ) = = ( £ λ^/ι'(*),*) =0 для любого x^Ker/7'^), т. е. m ^//(*)ЕЕ(КегГ(*))\ Поскольку по лемме об аннуляторе ядра регулярного оператора (KerF(jc))-L=Im(JF/(je))*, существует ί/*^Υ*, для которого m Jxtf/(i)+(F(i)ry'=0. t=fe Ήο это и есть условие стационарности функции Лагранжа 2?Х X (*, У*» λ), если положить λ0 = ...' =λ^_ι = 0. t> Замечание. Из доказательства теоремы следует, что -если ImF'(x)=Y (т. е. если F регулярно в х) и ^существует элемент h^KerF'(x), для которого <f/(£), ΑΧΟ, i=l,...,m (назовем это условие аналогом условия Слейтера), то λο^Ο и, следовательно, можем полагать λο= 1- 53
2.5. Примеры 1. f(*)=f(*b *2)=*i2—X1X2+X22—2^i + A:2->extr. Решение. Необходимое условие I порядка экстремума гладкой функции: ' v ' dXl дх2 1—х1 + 2хг+\=0. Решая эту систему уравнений, находим единственную стационарную точку i=(j2b ^2) = (It 0)· Для проверки условий II порядка выписываем матрицу вторых производных: dxidxj )UmkUi V-l 2/' Эта матрица по критерию Сильвестра (п. 2.1.2) положительно определена. По достаточному условию экстремума функции нескольких переменных (п. 2.1.2) (1, 0)elocminf. Нетрудно понять, что на самом деле (1, 0)eabsmin/, a Smax= + oo. 2. 4Ari + 3x2-^extr; Xi2 + x22—l. Решение. Применяем правило множителей Лагранжа для решения гладких задач с ограничениями типа равенств* (п. 2.2.2). Функция Лагранжа: i?=λ0 (4*1 + 3*2)+λ (лг^+лгг2— -1). Необходимое условие: #χ==0<=»4λο+2λχι = 0, 3λο+2λχ2 = 0, Если λο=0, то λφΟ, значит, из предыдущих уравнений Х\ = = л:2=0. Точка (0, 0) не является допустимой. Цолагаем Яо=Ь Тогда х\=—2/λ, х2 =—3/2λ. Подставляя х\ и х2 в ограничение ati2-+-jc22= 1, получаем, что λ = ±5/2, и соответственно имеем две стационарные точки (4/5, 3/5), (—4/5, —3/5). По теореме Вейерштрасса существуют решения задач на максимум и мхинимум. Рассматривая значения функционала & стационарных точках, получаем (4/5, 3/5)^absmax, Sm-ax=5, (—4/5,—3/5)eabsmin, Smln=— 5. 3. *ι2+ΛΤ22+#32-Ηΐιί; 2*ι—лг2+#з<5, хх + х2+хг=3. Решение. Применяем правило решения гладких задач σ ограничениями типа равенств и неравенств (п. 2.4). Функция* Лагранжа: 2>=λο(χχ2+Χ22+Χζ2)+λι(2χι—х2+хз—5)+λ2(*ι + *2+*3—3). Необходимые условия: а) стационарности ^ = 0 <=> 2Я0*! + 2λχ + λ2 = 0, 54
2* =0*»2λο*2+λ2—λχ = 0, Λ.=0«2λ0χ3+λ2 + λ1 = 0; б) дополняющей нежесткости Χι (2λγι—х2+Хг—5) =0; в) неотрицательности λο>0, λ\>0. ·> λ0==0^λ1 = λ2 = 0— все множители Лагранжа — нули. По- б) ложим λο= 1/2. Предположим λιφ0=$2χ1—х2+х3—5 = 0· Выражая хи х2 и лг3 из условия а) через λι и Яг и подставляя s уравнения Х\ + Х2+Хъ = 3, 2х\—х2+Хг—5=0, получим λι = =—9/14<0 — противоречие с условием в). Пусть λι = 0. Тогда Х\=х2=Хъ=\— критическая точка. Функция f(x)=x\2+X22+Xz2->'+<x> при |#|-*оо, значит, по «следствию из теоремы Вейерштрасса (п. 1.2.1) решение задачи существует, а в силу единственности критической точки решением может быть только она. Итак, *=(1, 1, l)eabsmin, 4. {Ах, x>-Miif; Ос, дс>=1 (^eRn, Л = (а*Д/«ι— симметричная матрица). Решение. Существование решения χ очевидно из теоремы Вейерштрасса, ибо сфера Sn ={x<= R*| |л;|2 = (л:, х) = 1} компактна. Функция Лагранжа: 2?=λ0{Αχ, Λ;>+λι(Λ:, χ). Необходимые условия: 3?х(х> λ0, λι) =0<=»λ0Αχ+λιΛ:=0, λ0>0. Если λο=0, то %\Ф0/ и, значит, i=0, что противоречит уравнению связи (ху х)—1. Положим λ0=1. Тогда Ах=—λι*. Таким образом, решение — собственный вектор матрицы А. Домножив соотношение Ах=—λ\χ на х> получим, что 53 = -=—λι; иначе говоря, решение задачи на минимум — собственный вектор матрицы Л, соответствующий наименьшему собственному значению. 2.6. О методах решения экстремальных задач. Градиентный метод и метод Ньютона Ограничимся здесь простейшим случаем безусловной конечномерной минимизации, т. е. минимизации (гладкой) функции / в задаче без ограничений: /(x)^inf; xe=Rv (з) Выше много внимания было уделено необходимым условиям экстремума. 55
Теория экстремальных задач предлагает следующий рецепг решения задачи (з). Надо найти все точки, удовлетворяющие* необходимому условию первого порядка' (т. е. теореме Ферма) Г(х)=09 (1) а затем проверить их на максимум и минимум с помощью критериев второго порядка. Но следует сказать, что при решении конкретных практических задач." с привлечением ЭВМ методы разыскания экстремумов далека* не всегда прямо связаны с теорией экстремальных задач. Эта, теория существенна для понимания постановок задач, всех возможностей, заключенных в нихк и т. п. Покажем, что существуют^ и весьма эффективные, другие методы, отличные (в применении,, например, к задаче о безусловной минимизации) от решения уравнения (1). Но начнем все-таки с давнего* метода, принадлежащего Ньютону, метода решения именно уравнения (1). Пусть F:Rn->-Rn— отображение класса С1. Для решения уравнения F(x)=0 применима следующая процедура. Берется некоторая точка х° и далее строится последовательность точек/ по правилу: Рис. 2 xw = xb—(F'(xb))^F(xb)t £ = 0, 1,... (2> Эту процедуру в случае /z=l см. на рис. 2. Для нахождения точек минимума функции feC2(Rn) в соответствии с (1) следует применить процедуру (2) (при выбранном начальном приближении л:0). Тогда приходим к следующему итеративному^процессу, который называется методом* Ньютона: χ^=χ*-(Γ(χ*))-ψ(χ*), ft=0, 1,.... (3) Можно показать, что если f'y удовлетворяет условию Липшица и условию сильной выпуклости (f'(x)>>al) и норма f'(x°) достаточно мала, то метод (3) сходится к точке χ глобального минимума / с квадратичной скоростью (\\xk—x\\<.Cq2k)*. А следующий метод не связан прямо с решением уравнения (1). Он состоит в следующем. Предположим, что feC^R71).. Тогда следует выбрать снова некоторую начальную точку хР и построить последовательность точек по правилу χ*+ι=**-α*Π**), «*>0, k=0y 1, .... (4), 56
Такого рода процедуры называют градиентными методами. Числа ак называют длиной шага метода. Идея метода проста. Вектор ί'(χ) смотрит в сторону наибольшего возрастания функции / в точке ху вектор —/ — в сторону наибольшего убывания. Каждый раз, совершая итерацию (4), мы «спускаемся» по функционалу. Поэтому можно надеяться, что мы будем приближаться к точке минимума. Простейший вариант градиентного метода возникает, когда в (4) aft = a = const. Можно показать, что если градиент/'удовлетворяет условию Липшица,//1 ограничено снизу и α достаточно мало, то f'(xh)-+0 при &->-оо, а если в дополнение предположить, что / — сильно выпуклая функция, то обнаружится, что хк стремится к точке глобального минимума f со скоростью геометрической прогрессии. Сразнение двух описанных методов обнаруживает их сильные и слабые стороны. У градиентного метода сильные стороны— простота вычислений и налагаемая-малая гладкость на /, но сходится градиентный метод медленнее и требует экспериментов с выбором а. Метод Ньютона сходится очень быстро, но при довольно жестких требованиях гладкости на функцию. При этом он предполагает гораздо большой объем вычислений. Подробнее обо всем этом см. в [5; 16; 21], а также в монографии Ф. П. Васильева «Методы решения экстремальных задач» (М.: Наука, 1981). §3. ЗАДАЧИ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ Линейное программирование—один из наиболее ролно теоретически разработанных разделов методов оптимизации. В этом разделе изучают задачи об экстремуме линейной функции при ограничениях типа равенств и неравенств, задаваемых также линейными функциями. Такого рода задачи играют существенную роль в приложениях, особенно в экономике. В данном параграфе коснемся основных аспектов теории: вопросов, связанных с существованием решений, критериев решения, численных -алгоритмов, теории двойственности. 3.1. Симплекс-метод 3.1.1. Постановка задачи. Общей задачей линейного программирования назовем задачу (с, x)-+inf\ Ax^b. (з) Задачи линейного программирования рассматриваются,^ как правило, приведенными к канонической {с, Ar)-*sup; Ax=b, x>0, (зк) 57
или к нормальной форме (с, jrb^sup; Ax^b, *>0. (зн> Здесь x=(xu...,xn)^kn, c=(cb...,cn)eRn, 6= (Ьи... ..., 6m)eRm, Л = (ар/м:1 т— матрица размеров тХп со столбцами а^'= (а\К..., iW) /=1, , л. Каноническая форма более удобна при описании алгоритмов решения, задачи (з) и (зн) часто используются при рас» смотрении проблем существования решений и двойственности. Задачу в нормальной форме всегда можно свести к задаче в канонической или общей форме введением дополнительных координат и изменением матрицы А. Возможны и обратные сведения. Например, если дана задача: (су хУ-^sup: Ах^Ь, х^> >0, то можно ввести координаты £s(xn+h...9Jtn+m) и получить задачу в канонической форме: (с, jtb^sup; <α*, x) + xn+j = bjy л;>0, х^О. Обозначим С множество допустимых точек в задаче линейного программирования. Множество С — выпуклый многогранник в пространстве Rn. Нетрудно видеть, что экстремум линейной функции (если он существует) достигается в крайней (угловой) точке выпуклого многогранника. Число крайних точек множества С, задаваемого в виде конечного числа линейных равенств и неравенств, является конечным [20, с. 190]. Таким образом, для решения задачи линейного программирования (если оно существует), достаточно перебрать значения функции {с, х) во всех крайних точках множеству С. Но нахождение всех этих крайних точек и перебор значений функции — операция довольно трудоемкая. Описываемый ниже метод (симплекс-метод) решения задачи линейного программировав ния позволяет начиная с некоторой исходной крайней точки переходить к другой по направлению наибольшего возрастания значения функции. Задача (зк) называется невырожденной, если любая крайняя точка множества С содержит ровно m положительных координат. Пусть χ — крайняя точка в невырожденной задаче с m положительными координатами (для определенности первыми) Хи...,Хт* Тогда вектор χ можно представлять в виде х=(хвТ хн), где хв=*(хи--чХт)—базисный вектор, *н = (0,... ,0)е Rn~m — небазисный вектор. Аналогично матрицу А можно представить в Brifte Л=(Лб, Лн). Будет доказано (п. 3.2.3), что матрица АБ невырожденная. 3.1.2. Правило решения. Для решения невырожденной задачи линейного программирования следует: ^ 1. Привести задачу к задаче в канонической форме (зк). 2. Отыскать крайнюю точку хо—(*ь---.э*тэ 0,...,0)eRnr Хг>0, ί=1,...,т9 множества допустимых элементов С. Методы нахождения начальной крайней точки будут описаны ниже. 58
5 ] ι J 1 · 1 ° • 1 1 ! ί Ί 1 ^ 1 i φ % + £ Q "q «o 7 / *> i-t 5 4 о - н • • • • • • • ° φ 5 • >Г • + ! ш © Η* о • о . о 1 е • • i • • • J 1 • 7 - о ■1 ε° i • + J о* Μ I «ρ i ■ J 1 «·—ч i К i «p о о <
3. Построить симплексную таблицу для начальной крайней" точки лго. Пояснения к таблице. В таблице п+4 столбца и т+4 строки. В первом столбце начиная с третьего по m + 2-e место находятся базисные векторы ai,...,am, соответствующие рассматриваемой начальной крайней точке х0 = (Х\,.. ·, Хт, 0,..., 0). Во втором столбце на аналогичных местах стоят значения1 Cj вектора с с теми же номерами, что и столбцы ак Первая строка начиная с четвертого столбца — элементы С\9 . . . , Сп. Вторая строка начиная с третьего столбца — векторы Ь,. α1,...,α71. Под ними — разложения этих векторов по базису т т а1,...,**™. Ясно, 4Toi = JJa/Jfif а< = а*, i=l,...,m иа! = £а1хц> j = m+l9...9nt=>ai=ABxi<n>xi=AB-laK В предпоследней строке в столбце под вектором b запишем? 2о = (сБ, *о>, под векторами с*, ί=1,...,η, запишем 2г- = (сБ, х{). Ясно, что ζ0 — значение функционала в начальной крайней точке Хо, Zi = cu ί=1,. ..,m. В последней строке записывается разность между элементами предпоследней строки и элементами первой строки: Δ* — = Ζ{—Си ί=1,... ,/ζ. 4. Исследовать симплекснук) таблицу. а) Если Δ>0, то крайняя точка х0 — решение задачи. б) Если при некотором / Aj<0 и л?'<Д то значение задач» «Smax = + 00. в) Пусть в строке Δ имеются отрицательные числа, а соответствующие столбцы χί содержат положительные числа. Предположим, что ιηίηΔ/ = Δ/§<0. Ясно, что /п-М^/о^я-. Столбец, соответствующий индексу /о, называется разрешающим столбцом. Если πιίηΔ?- достигается при нескольких значениях /, то в качестве разрешающего столбца выбираем столбец с любым таким индексом. Обозначим %=Xtlxiu для Xi/o;>0, ί = = 1, ..., m, θ0 = min {θ,/χί/# > 0, Η = 1, ..., m} = θίο > 0, Строк» вектора αίβ называется разрешающей. Если min9i достигается при нескольких значениях ί, то в качестве разрешающей строки выбираем строку с любым таким индексом. Элемент Xioit» стоящий в разрешающем столбце и разрешающей строке,, называется разрешающим элементом таблицы. Далее необходимо из числа базисных векторов исключить вектор а1'0, вместо него взять вектор α/β. Значение функционала на новой крайней точке дгНов с новыми базисными номерами 1,..., ίο—1, /о, *о+ 1,..., m возрастает на —θ0Δ/ο. 5. Построить новую симплексную таблицу для нового базиса а1, ..., а1*0""1, а'°, а*·**1, .. .\ ат,т., е. фактически разложить векторы bf a1, ..., ап по новому базису. Укажем без обоснования (которое будет произведено в п. 3.2.3) способ построения 60
новой симплексной таблицы по предыдущей. Элементы таблицы xih лежащие под векторами Ь9 а\...9ап и не лежащие в* разрешающем столбце или разрешающей строке старой симплексной таблицы, вычисляются по правилу прямоугольника:: х> χ hJ Х[ j ίο Jo 'Φ из числа хц вычесть произведение xio,· на Хць% деленное на Xij^ Элементы разрешающей строки вычисляются по формуле (*Ыноа~*1о//**о/о> /~1> ···» я*. Ясно, что в разрешающем столбце !/д:1о/о)нов= 1 остальные элементы равны нулю. Далее необходимо вновь исследовать симплексную таблицу, т. е. вернуться к п. 4 и т. д., пока не придем к решению- адачи. 3.1.3. Пример. Решить невырожденную задачу линейного· программирования в канонической форме 2χχ+χ2+Χζ—*4->sup; χλ—аг2+л:з=1, Хг>0, £=1,2,3,4, 2χι + χ2 + χΑ = 3 , с ^аданной начальной крайней точкой л:0=(0, 0, 1,3). (Решение. Базисные векторы а3=(1, 0) и а4=(0, 1). Составим первую симплексную таблицу: базис >ч \* а4 ζ ζ—с с 1 —1 ъ 1 3 " —2 2 а1 1 2 — 1 —3 1 а2 —1 1 —2 —3 J 1 а3 .1 0 1 0 —1 а* 0 1 —1 0 θ 3-* Из таблицы видно, что в качестве разрешающего столбца можно,взять столбцы а1 и а2. Возьмем для определенности?; 61
столбец α2. Тогда θ = 3, разрешающая строка α4. Заменяем в^ «базисе вектор а4 на вектор а2 и для нового базиса строим вторую симплексную таблицу: базис \ν α3 α2 ζ ζ—с с 1 1 b 4 3 7 2 α1 3 2 5 3 1 Ι α2 0 1 1 0 1 α3 1 0 1 0 — 1 α4 1 1 ' 2 3 θ Вектор г—с>0, поэтому точка *=(0, 3, 4, 0)—решение задачи И Smax = 7. e j Если бы в качестве разрешающего столбца в первой симплексной таблице взяли столбец а\ то пришли бы к той яке точке (0, 3, 4, Q), но за большее число шагов. 3.2. Обоснование симплекс-метода 3.2.1. Теорема существования. Теорема. Если множество допустимых значений задачи линейного программирования (з) п. 3.1.1 непусто и ее hi деленное значение конечно, то ее решение существует. / <| Рассмотрим множество /CdR™*1, образованное ^такими лекторами (а, z), aeR, 2eRm, для каждого из которых рай- дется хотя бы один вектор ху такой, что (су л:)<а, Αχψ,ζ. Ясно, что К — конус. Лемма 1. Конус К — конечнопорожденный. <\ <\ Покажем, что К=сопе {ξι,..., ξη+^π-ι}, де ξι = {си «ai\...,aml)y ...,ξΛ=(^, aj", ...9amn), ξ*-π=(1, 0,./.. ,0), ξΛ+2= = (0, l,...,0),...,gn+m+i = (0,...,0, 1). Нетрудно видеть, что асе Ь^К, поэтому cone {ξι,..., |n+m+1}c=/C. Действительно, если ί=1, ..., я, то надо взять в качестве х стандартный базисный вектор е\\ для остальных i надо взять д: = 0. Пусть теперь вектор ξ=(α, z) = (a, Zi,...,Zm)sK. Тогда для некоторого х= = (хи ..., Jcn)eR" и некоторых β0>0, ..., β™>0, выполняются соотношения η η Σ*/*/ + βο = «. ^αμ/+βί=ζί, ί=1, ..., m. €2
Но это как раз и означает, что η т ξ = (α, z) = J*£/+Pobi+i+ ЕР&н-'+ь т. е. ξ = cone {ξι,..., U+m+ι}. > > Лемма 2. (о замкнутости конечнопорожденного конуса)- Если N xlf ..., xN<=Rn9 K = cone{xv ..., xiV} = {Jx,xi>. λ4>θ}. го К — замкнутый конус. Ν << Положим ^λ= £λ,χ, для вектора λ= (λι,... Д^)е eR^, тогда Αε5Ί^, R«). Образ ARN (обозначим его L) -конечномерное подпространство в R7*. По лемме о правом обратном (п. 7.2) существует обратный ограниченный оператор M:L-+RN, такой, что А°Мх=хУхееЬ, \Мх\^С\х\. (1) Пусть хФО принадлежит замыканию К (£=0е/( по определению), т. е. существует последовательность {λ*}&€Ν, λ* = = (λΛ ..., ЯуИ), такая, что Akk=:xk-+x. Тогда найдется kQ>0r такое, что при /C>&|A;ft|^2|£|, и из (1) получаем def / Λ |λ*|= \A~lxk\<^C\xk\^2C\x\. Вследствие ограниченности последовательности {λ*^ν из нее можно выбрать сходящуюся подпоследовательность λ ->λ. Тогда — def „def^ Αλ= limAKn* = lim χη* = χ ^jcgL. Ясно, что ie/C, т. е. /С — замкнутое множество. [>[> По условию существует допустимый элемент ху т. е. точка ((с, х)у 6)е/С. Кроме того, численное значение задачи а>—оо (в частности, {с, х)^а). Все это означает, что множество Л== = {aeR|(at Ъ)^К) непусто \ <?= inf {a |ЧхеЛ}. Отсюда (а, Ь) принадлежит замыканию /С, а по лемме 2 и /С. Но это и означает, что существует х> для которого {с, х)^.а9 Ах^Ь, т. е. χ — решение задачи. > Совершенно аналогично доказываются теоремы существования для задач линейного программирования, заданных в других формах: |S3|<oo=*>Arg зф0. Таким же образом доказывается, что минимум существует у полиэдральной функции max Uch лг) + Я^)на аффинном много- образии (bj9 *> = 0, 1</<т<л <*e=Rn). 63-
3.2.2. Теория двойственности и критерий решения. Рассмотрим задачу линейного программирования п. 3.1.1: (с, *>-Mnf; Лх<6. . (з) „Двойственной к ней называется задача (Ьу у)-+$ир; А*у = с, у<0. (з*) Вывод двойственной задачи дан в п. 11.1.1. Если задачу (з*) представить в виде задачи (з) и искать к ней · двойственную, то двойственной к (з*) будет задача (з). Таким образом, получили пару двойственных задач. Легко вывести, что двойственной к задаче в канонической форме является задача (by */>->-inf; A*y^c. Наиболее симметричными оказываются прямая и двойственная .задачи для задач в Нормальной форме: (с, jt>-*sup; Ax^b, #>0, (by y)-^inf; А*у^с, y>0. Здесь векторы b и с меняются местами, inf заменяется на sup, я, наоборот, матрица А заменяется на транспонированную, матричные неравенства меняются на неравенства в обратную сторону. Теорема 1 (двойственности). Для пары двойственных задач линейного программирования имеет место следующая альтернатива: или значение какой-либо из задач конечно (тогда значение второй конечно, и оба значения совпадают), или значение одной из задач бесконечно, а другая несовместна. Доказательство дано в п. 11.1.1. Теорема 2 (критерий решения). Для того чтобы элемент .х являлся решением задачи (з) (£eArg3), необходимо и достаточно, чтобы нашелся элемент §, допустимый в двойственной задаче (з*) (#е£3*), такой, что (с, х) = (Ьу ф. <Необходимость. Если χ есть решение задачи (з), то, разумеется, задача (з) совместна и ее значение конечно. По теореме двойственности значение задачи (з*) конечно (равно значению задачи (з)), и, следовательно, по теореме существования решение (з*) существует. Обозначим его #. Доказано, что ^*> = <Ь, у). Достаточность. Пусть χ и у — допустимые элементы в задачах (з) и (з*) соответственно. Имеем (учитывая, что А*у=су #<0, Ах^Ь) (с, jc)=(A*yy *> = <*/, Ак»<*/, b). Таким образом, если (с, £) = <&, #>, то χ — решение (з), у — решение (з*). [> 64
Нетрудно понять, что теорема 2 справедлива не только для задач (з) и (з*), но и для всех двойственных задач линейного программирования. Используем ее в п. 3.2.3 при обосновании симплекс-метода для задач линейного программирования в канонической форме. 3.2.3. Доказательство симплекс-метода. Предложение 1. Допустимая в задаче (з&) точка χ является крайней точкой множества допустимых элементов тогда и только тогда, когда столбцы матрицы А, соответствующие положительным координатам вектора х, линейно независимы. <\ Доказательство необходимости и достаточности проведем от противного. А) Пусть χ — крайняя точка множества С. Предположим, что столбцы матрицы Л, соответствующие положительным координатам вектора х, линейно зависимы. Для определенности считаем, что это столбцы а1,..., ак. Из линейной зависимости следует·, что найдется ненулевой набор чисел k λι,...,λ&, для которого y^ta'' = 0, т. е. \4λ=0 для вектора λ= (λι,...,λ&, Ο,...,0)eRn. Тогда вектор *(θ)=#+θλ допустимый при θ близких к нулю, что противоречит тому, что χ — крайняя точка множества допустимых элементов. Б) Пусть χ — допустимая точка и столбцы матрицы Л, соот* ветствующие положительным координатам вектора х, линейно лезависимы. Опять для определенности считаем, что это столбцы a1,...,flft. Предположим, что л: не является крайней точкой множества С. Тогда найдутся отличные от χ допустимые точки у и г, уфг, такие что при некотором а, 0<а<1, х=а*/+(1— — а)г. Из последнего равенства следует, что у точек у и ζ нет нулевыми будут те же самые координаты, что и у х, т. е. пер- k k k вые k координат. Поскольку Y^iyiai = b, ^2^ = 6, то ]Г(^ — i~\ i=A ι=1 —Ζι)α£=0. Отсюда следует, что векторы al,...aft линейно зависимы, что противоречит условию. Таким образом, наше предположение неверно и точка χ крайняя. |> Предложение 2. В невырожденной задаче любая допустимая точка имеет не менее m положительных координат. <\ Доказательство проведем от противного. Предположим, что существует допустимая точка, у которой менее m положительных координат. Для определенности считаем, что это первые k координат (k<m). Рассмотрим множество С решений системы Ау=Ь9 г/>0, где i/=(j/b...,j/ft)eRft, Л-{a1,... 9ak} — матрица порядка kXh. Пусть #— крайняя точка множества С (нетрудно понять, что она существует). Тогда точка х=(#, 0)^R" — крайняя точка множества С, у которой менее m положительных координат. Это противоречит невырожденности задачи. > 65
Предложение 3. В невырожденной задаче допустима* точка содержит ровно m положительных координат тогда и только тогда, когда она — крайняя точка множества допусти- мых точек. О Необходимость докажем от противного. Пусть в невы-, рожденной задаче допустимая точка содержит m положительных координат, для определенности первых. Предположим, что эта точка не является крайней, тогда по предложению Г столбцы матрицы А а1,...,ат линейно_зависимы. Значит, средф решений системы Ау=Ь9 у^О, где Л = {а1,...,ат}, у=(уи... ...,ym)eRm, найдется решение у, у которого менее т положительных координат. Следовательно, вектор *=(#, 0)eRn является допустимой точкой (т. е. jcgC), у которой менее т по* ложительйых координат, что противоречит предложению 2. Достаточность следует из определения невырожденности задачи. О Теорема. Пусть х = {хи. ..,хт, О, ...,0)eRn, Xi>09 /= = l,...,m,— крайняя точка в невырожденной задаче (зк) линейного программирования в канонической форме. Тогда: а) если Δ^Ο, то х —решение задачи; б) если для некоторого ] Aj<0 и дс^О, то значение задачш 5тах= + °°; в) если не выполнены условия п. а) и б)нто ХнОВ— крайняя точка множества допустимых элементов, значение функционала при этом возрастет на величину —%Vl°> & разложение векторов Хнов, а1, ..., ап производится согласно симплекс-методуУ <\ а) Обозначим у=Ав*~1Св (напомним, что άβίΑΒΦ0). Поскольку при /=т+1,.. . ,/г Д3=(сБ, xj)—с5 = {АБ*у, хз)—с5 = (у, АБхз)—Сз=(у9 а*)—с^09 это означает, что Лн*у>Сн и, следовательно, Л*у!>с, т. е. у—-' допустимый элемент в задаче (з), п. 3.2.2, двойственной к исходной задаче (зк) п. 3.1.1 в канонической форме. С другой стороны, так как у вектора А*у—с первые m координат — ну~: ли, значит, {А*у—с, х) = 0<=*(с, х) = (Ь9 у). Таким образом, по критерию решения χ — решение задачи. б) Положим x(t) —χ—tx' + tej. Тогда x(t)^0 и Ax(t)=Ax—tAbXi+tAe5=Ax—tai+tai = by, т. е. x(t) —допустимый элемент Vf>0, при этом {с, x(t))—(c9 x)=—t(c,xi) + t(ct 6ί)=—ί(ζό—^)=—ίΑ5-++οο' при ί->+°ο. в) Предположим, что не выполнены условия я. а) и б) теоремы* тогда для некоторого m + 1< /0 <; л, Δ/β < 0 и θ0 = min {xrfxiu I *α*>* > 0} = XiJXiQu > 0. Возьмем / == (/Б, /h)v Ы = (0, , 1, ..., 0)г 66
=:—Лб^н/н, *(θ0)=* + θ0/. Тогда Λ*(Θ0)=Ακ + Θ0Λ/ = 4*==λ*, ш(9о) = во^н>0, ХБ(90) = д:Б + е0Б = л:Б—90Лб1Лн/н = ^б—Θ0^Ι!^ = = хь—Qoxio^0 в силу выбора Θ0, т.е. λ(Θ0)—допустимая точка. Поскольку по предложению 2 в невырожденной задаче допустимая точка содержит не менее т положительных координат, лишь одна координата Xt0 у вектора Хъ—%xio обращается в нуль. Таким образом, допустимая точка ^(θο) имеет ровно т положительных координат на местах l,...,i0—1, i0+l,...,m, /о и, следовательно, по предложению 3 точка *hob=*(9o) крайняя. Значение функционала при этом возрастет на величину —90A/d (см. доказательство п. б)). Формулы .{χΆΟα)ί = xt—%xiU = χζ—xujcijxij., ί = 1, ..., m, *ί^ΗθΒ,)/·==β0 = Χί§/Χ£§/# означают, что в новой симплексной таблице столбец Янов выписывается согласно указанному методу πθ- строения новой симплексной таблицы. Покажем, что и остальные столбцы (Янов)5' строятся по этому же способу. Для этого ^вычислим координаты (х^)нов разложения векторов а\ /=1,... ..., п, по базису а1, ..., а1'*-1, а', a**+if ..., ат. В старом базисе т т α'= Υ·α%ι= Y.^Xif + a^Xij, /=1, ..., λ, ιφίο «отсюда при / = 7о т Поскольку xij%.> Q, то m . id xUo xioio тогда m i=l Таким образом, (*нов)(./ = ~- / = 1, . · ., П «4 (««о J«. = 1. (XmJu—xti—Xii^ij/Xij,, ίφί<» t=l, . ·., m, j« 1, ..., л =» (*£/,)«» = 0, i Φ V > 67
§4. КЛАССИЧЕСКОЕ ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ В этом параграфе выводятся необходимые условия первого» порядка для некоторых классов задач, традиционно рассматриваемых в классическом вариационном исчислении (к. в. и.): задачи Больца, простейшей задачи классического вариационного исчисления, изометрической задачи и т. п. При выводе необходимых условий экстремума мы пытались использовать только элементарные средства классического анализа, поэтому материалы этого параграфа можно изучать независимо or предыдущего. 4.1. Задача Больца 4.1.1. Постановка задачи. Задачей Больца называется сле^ дующая экстремальная задача без ограничений в пространстве непрерывно дифференцируемых функций C!([i0, t{\)\ h ' Λ (*(·)) = J £(*.*('). x(t))dt + l(x(tQ), *(ίχ))->- extr. (з> Здесь L = L(t, χ, χ)—функция трех, а / == /(лг0, х\)—функция двух переменных. Отрезок [i0, t\] предполагается фиксированным и конечным, — oo<t0<ti< + oo. Задача Больца — элементарная задача классического вариационного исчисления. Функцию L называют интёгрантом, функцию I — терминан- том, а функционал $ — функционалом Больца. Скажем, что функция Jt(*)^Cl{[tof t\]) доставляет (слабый) локальный минимум (максимум) задаче (з), или, что та же самое, функционалу 38 в пространстве С1 ([ίο, ίι]) и пишем* £(-)^1осттз(1остахз), если найдется δ>0, такое, что для любой функции x(-)^Cl([t0, t\])9 для которой ||х(·)—х(-)\\\< <б (*»||*(·)—^(•)11с(1/#.М)<в. 1И0~*(01к«*.А!)<8)» выполнено неравенство Наряду со слабым экстремумом в классическом вариационном исчислении традиционно изучается также сильный экстремум. При этом несколько расширяется класс функций, на которых рассматривается функционал 3S. Экстремум в задаче ищется среди функций х(-), принадлежащих KCl([t0, ί\])γ т. е. кусочно-непрерывно дифференцируемых функций. К понятию сильного экстремума вернемся в п. 9.2.1. При решении задач вариационного исчисления употребляем далее термины «абсолютный экстремум» или «глобальный экстремум». В эти термины можно вкладывать стандартный 68
смысл, согласно которому найденная функция имеет экстремальное значение функционала среди всех допустимых функций (а у нас допустимые функции принадлежат С1 или КС1). Однако, как правило, функции, доставляющие абсолютный экстремум в С1 или КС1, доставляют абсолютный экстремум и среди более широкого класса функций — всех абсолютно непрерывных функций, на которых функционал определен. 4.1.2. Необходимые условия экстремума. Теорема. Пусть функция χ(·)еС1 ([t0, ίχ]) доставляет слабый локальный экстремум в задаче Больца (з). Предположим, что интегрант L непрерывен вместе со своими частными производными по χ и χ в некоторой окрестности множества {(t, x(t)9 £(t))\te[t09 t{]}9 а терминант l непрерывно диффе* ренцируем^ в окрестности точки (x(to)9 x(t\)). Тогда L· (·) е &([ί0, /J) {L^t) =L· (/, x(t)9 x(t))) и выполнены а) уравнение Эйлера ~^(НЦ)=0; б) условия трансверсальности lXk = lXk(x(t0)9 x(tj) £;(ω=(-ΐ)*4, fc=o,L <\ Доказательство теоремы разобьем на несколько этапов. А) Определение вариации по Лагранжу. Возьмем произвольную, но фиксированную функцию x(-)^Cl([to, ti]). Поскольку £(-)elocextr3, то функция одного переменного <p(X):=a(x() + Xx(-)) = \Ltt9x(t) + Xx(t),x(t)+ и + te(t))dt + l(x(t0) + lx(t0)9 Я(^) + Кх{^)) имеет экстремум · при λ=0. Положим F(t9 X)=L(t9 *(/)+, +Kx(t)9 k(t)+Xx(t)). Из условий гладкости, наложенных на L, х(-)9 х(-)9 следует, что функция φ (λ) дифференцируема в нуле. Действительно, функции F и Fx непрерывны в некотором прямоугольнике [t09 t\]X[—λο, λ0], и, значит, по известной теореме из анализа можно дифференцировать под знаком интеграла [15, т. 2, с. 107]. Но тогда по теореме Ферма φ'(0)=0. Дифференцируя функцию φ и полагая λ = 0, получаем y40)°llm*g(0 + U(,))~*g(,))g *■(?(·), *(·))- <t = f (Lx (0 χ (t) + L. (0 χ (0) dt + JXt x(t0) + 7Xt χ (tj = 0 (1) V*(.)e=C»([fe,/J). 49
Таким образом, мы вычислили вариацию по Лагранжу функционала Больца 3& и выяснили, что необходимое условие слабого локального экстремума этого функционала в J£(·) — равенство нулю его вариации по Лагранжу. Б) Лемма Дюбуа — Рей мон а. Пусть на отрезке [t0f ti] функции αο(·) и а\(*) непрерывны, и пусть для любой непрерывно дифференцируемой функции х(-)9 x(t0) = χ(t\) =0, выполнено равенство и J К (0*(0 + Яо (t)x(t))dt = 0. и Тогда функция а\(-) непрерывно дифференцируема и '<3<1 Возьмем функцию p(>)eCl{[t09 ti]), такую, что p(t)'=» =α0(ί) и Vp(/)df= С ax {t) dt.Тогда для любой функции *(«)е и и eCl{[to, t\])9 x(t0) =x(t\) =0, по условию леммы должно выполняться равенство 0=Ua1{t)i{t) + ao{t)x(t))dt = $ax(t)i(t)dt + и и +]x(t)dp(t)^Ua1{t)-p(t))x{t)dt (2>< t0 и Выберем функцию x(-)eCl([to9 t\))9 такую, что x{t)=ax(t)— —Р(0» *('о) =0. Тогда в силу выбора функции р(·) χ{ίχ)^( x(t)dt =\(a1(t)-p(t))dt = 0. Значит, для функции #(·)=*(·) должно выполняться равен- ство (2), т. е. \(ax(t)—p(t))2dt = 0. Из последнего соотноше- U ния следует, что ax{t) =p(t)9 т. е. o^.Jg С1 ([/0, fj), — аа^ + +во(0 = 0. >> В) Завершение доказательства. Равенство (1) выполняется для любой функции x(-)^Cl([t0t t\])9 а значит, для всех функций x(-)eC0l([t09 fi])={*(-)^Cl([f0, t\]) \x{U)^ =x(t\)=0}. Следовательно, из (1) вытекает, что \tx (t)i(t)+Lx(t)x(t))dt = Q V*(.)e=CS(pe, fj). ϊ 70
*1 J' По лемме Дюбуа—Реймона L. (-)^Сгф0, tt]) и —£-£;<<)+М0=*0. (3) Интегрируя по частям в равенстве (1) (оно стало возможным в силу доказанного включения L. (··) ^ С1 (f/0» ^iD) и учитывая (3), получим и ](Lx{t)x{n + Lx {t)x{t))dt+lxMU)+^iti)- и tx + Γ**(<χ)=(Γί (U+U*('i)+(-£; (t0)+lXo)x(to)=o V*(.)€=C*(l<o.'J). (4) Подставляя в (4) последовательно x(t)=t—10 и x(t)=t—tu придем к условиям трансверсальности Lx (^) = —Ιχχ и Lx (t0) = = C t> Замечание. Отметим, что эти три этапа доказательства теоремы будут в той или иной форме встречаться при доказательстве других теорем классического вариационного исчисления и оптимального управления. Набор условий для нахождения слабого локального экстремума— полный. Действительно, уравнение Эйлера — дифференциальное уравнение второго порядка. Его общее решение содержит две неизвестные константы. Для определения этих констант имеются два уравнения — условия трансверсальности. Мы сформулировали теорему для одномерной задачи Боль- ца. Укажем на необходимые изменения, которые следует внести для векторного случая. Пусть в задаче (з) *(·) = (М*Ь .-.>*η(·))> L = L(t9 xu... ••.,*η, Χι,·.·9*п)—функция 2/г+1 переменного, /=/(*оь..· ••.,*on, xu,...tXin)—функция 2я переменных. Необходимые условия в векторной задаче Больца состоят из системы уравнений Эйлера dL-(t)+Lx<t) = 0, i=l,...,n, at xl и условий трансверсальности, задающихся системой уравнений
Доказательство теоремы в векторном случае тривиально редуцируется к одномерному. 4.1.3. Пример. ι <®(x(.))=^(x*—x)dt + x2(l)-+extr. о Необходимые условия: а) уравнение Эйлера — L. + Lx = 0.<=*2x + 1 =0; at χ б) условия трансверсальности ■ Lk (0) = /*(о), ^(1)=-/,(1)^х(0)-0, i(l)=—x(lj. t2 Общее решение уравнения Эйлера: x(t) = ЬСХ/ + С2. Из условий трансверсальности находим, что Ci = 0, C2 = 3/4. Таким образом, имеется единственная допустимая экстремаль *(0 = (3-*2)/4. Покажем, что она доставляет абсолютный минимум в задаче. Действительно, если h(-)^Cl([to, t\])9 то :W-) + 4·))— &(x(-)) = ^2xhdt+^h*dt ι — jftdi + 2^(l)ft(l) + ft2(l)· Интегрируя по частям и учитывая, что x(t) = (3—ί2)/4, получим ^(^(.) + й(.))—^ (*(.))== 2*/iP — §(2x+l)hdt + 1 1 + \h4t + 2x(l)h(l) + h2(l) = ^/Afi+ft2(l)>0. о о Ответ. x(t)=(3—f2)/4eabsmin, Smax= + °o. 4.2. Простейшая задача классического вариационного исчисления 4.2.1. Постановка задачи. Простейшей задачей классического вариационного исчисления называется следующая экстремальная задача в С1 ([ίο, U]): #(x(-))=[L(tfx(t)f x(t))dt-+extr; iu x{Q = Xq, x{tl)=Xv *S' №
Здесь L = L(tt χ, χ)—функция трех переменных, называемая интегрантом. Экстремум в задаче рассматривается среди функций x(*)eCl([tof ί\])9 удовлетворяющих условиям на концах, или краевым условиям x(to)=Xot x{t\)=Xu такие функции называются допустимыми. Говорим, что допустимая функция х(-) доставляет слабый локальный минимум (максимум) в задаче (з), и пише«м Jf(*)e е1осттз(1остахз), если существует б>0, такое, что для любой допустимрй функции *(·)> для которой \\х(·)—*(·)ΙΙι<δ, выполняется неравенство #(*(·))>#(*(·)) (#(*(0) <#£(·)))· 4.2.2. Необходимое условие экстремума. Теорема. Пусть χ(·) gC1 ([ίο, t\]) доставляет слабый локальный экстремум в простейшей задаче классического вариационного исчисления, а интегрант L непрерывен вместе со своими частными производными по χ и χ в некоторой окрестности множества {(t, x(t), x(t))\t^[t0i ti]}. Тогда L. (-)^Сгф0> ί±)] и выполнено уравнение Эйлера — *-L.(t)+LAt)=0. О Рассуждаем аналогично тому, как рассуждали при выводе необходимых условий в задаче Больца. Возьмем произвольную, но фиксированную функцию x(')eCol([to9 t{\). Тогда χ(-)+%χ(·)—допустимая функция VXeR. Положим φ(λ) = =3f(x(-)+Xx(-)). Из условия к(·)elocextrз следует, что Ое elocextr<p. Пользуясь дифференцируемостью функции φ в нуле и выражением для вариации функционала из п. 4.1.2, получаем φ'(0) = δ #(*(.), x(-)) = ^(L-(t)x{t) + Lx(t)x(t))dt = 0 ίο V*(.)eCj([/e,*J). Из леммы Дюбуа—Реймона следует, что L*x (-)е Cx([i0, /J) и выполнено уравнение Эйлера. t> Набор условий для нахождения допустимой экстремали является полным. Уравнение Эйлера — дифференциальное уравнение второго порядка. Его общее решение содержит две неизвестные константы. Для определения этих констант имеются два уравнения — условия на концах. Таким образом, чаще всего допустимая экстремаль единственна. Мы сформулировали теорему для одномерной простейшей задачи классического вариационного исчисления. Укажем нэ необходимые изменения для векторного случая. 73
Пусть в задаче (з) п. 4.2.1 *(.) = (*,(.), ..., *„(.)), L= «L(A *ι,..., Xn, xu ..., Хп) —функция 2п+1 переменных. Необходимые условия в простейшей векторной задаче состоят из системы уравнений Эйлера —1^(0+^(0=0, i=\,...,n. Доказательство теоремы в векторном случае тривиально редуцируется к одномерному. 4.2.3. Интегралы уравнения Эйлера. Если интегрант L= =L(i, х9 χ) не зависит явно от одной из переменных, то уравнение Эйлера сводится к более простым уравнениям. 1. Если интегрант L=L(t, x) не зависит явно от х9 то уравнение Эйлера сводится к уравнению £«(0=о. 2. Если интегрант L=L(t, x) не зависит явно от х, т© имеет место интеграл импульса Lm (0 = const. 3. Если интегрант L = L(x, x) не зависит явн@ от /, то имеет место интеграл энергии (оба названия интегралов взяты из классической механики) х£-х (0—А/) = const (для доказательства достаточно продифференцировать написанное соотношение по t и воспользоваться уравнением Эйлера). 4.2.4. Примеры. В этом пункте на примерах рассмотрим различные соотношения между решениями простейшей задачи классического вариационного исчисления и экстремалями. Пример 1 (допустимая экстремаль существует, единственна и доставляет глобальный экстремум). #(*(.))^jjfo#-*inf; *(0) = 0, *(1) = 1. о Уравнение Эйлера: х=0. Общее решение: x = C\t+C2» Единственная допустимая экстремаль: χ = t. Экстремаль доставляет глобальный минимум в задаче. Действительно, пусть h{-)^CQl([09 1])· Тогда x{-)+h(.)—допустимая в задаче функция и 74
о о 1 1 1 = 2 \ hdt + J h*dt = С h4t > 0. 0 0 0 В этом примере все обстоят самым благополучным образом. В дальнейших примерах встречаются различные осложнения. Пример 2 (экстремаль существует, единственна, доставляет глобальный экстремум, но не является непрерывно дифференцируемой функцией). ι &{x{.)) = ^t2/zx4t-+mi\ *(0) = 0, *(1) = 1 о (пример Гильберта). Уравнение Эйлера: — (2t2/3x) = 0**tu/3x = C#*x= СГ2/3. Общее решение: x=C\tl/z+C2. Единственная ^экстремаль,' удовлетворяющая условиям на концах: я = £1/3. Ясно, что экстремаль не является функцией класса С!([0, 1]), так как х(-)^С([09 1]). Покажем тем не менее, что она доставляет глобальный минимум в задаче среди всех абсолютно непрерывных функций я(·), удовлетворяющих краевым условиям, для которых интеграл & конечен. Действительно, для любого такого /ι(·) ^(х(.)+А())—<Sr(x(.)) = Ji2/3 (-^ + й)2*- о _y* [l^dt= \\Ы£+\ f-'%*dt>0. 0 0 0 Пример 3 (решения задачи и допустимой экстремали не существует даже среди абсолютно непрерывных функций). ι v #(х(0) = j*W-*inf; *(0)=0, *(1) = 1 о (пример Вейерштрасса). Уравнение Эйлера: (2t2x) = 0 *=* t2x = С « χ = C/t2. Общее решение: х= {CJt) + С2. Экстремали, удовлетворяющей краевому условию х(0)=0, не существует. Очевидно, что ^(#(·))>(), и для любой абсолютно непрерывной функции х(-)ф0 ^(λ;(·))>0. Покажем, что нижняя Ш
грань в задаче равна нулю. Рассмотрим последовательность допустимых функций xn(t) = arctg/z//arctgп. Имеем ι #(*„(.))=(> *! — Л< J (1+, η2*2) arctg2 n ^ О \/п , 1 J arctg2 n j пЧ2 arctg2 η u i/n Пример 4 (допустимая экстремаль существует, единственна, но не доставляет экстремума). 3π/2 #(*(·)) = f (*»—x*)dt-+inf; x(Q) = x(—N)=0. с Уравнение Эйлера: #+л;=0. Общее решение: х= С\ sin /+C2 cos ί. Единственная допустимая экстремаль: #=0. Рассмотрим последовательность функций xn(t) = = (1/я)sin(2//3). Очевидно, что χη(·) — допустимые функции и *«(·)-**(·)= 0 в С1 (10, 3π/2]), но при этом *(*„(.)) = — — (— - О = -—< 0 = 3 £(.)). Из примера 4, в частности, видно, что уравнение Эйлера — необходимое, но не достаточное условие экстремума. Π ρ и м е ρ 5. ι #(*(·)) = $((l—x*Y + x*)dt->inU х(0) = 0, *(1) = 0. о Нижняя грань функционала равна здесь нулю. Чтобы убедиться в этом, достаточно рассмотреть минимизирующую последовательность функций из КС1([0у 1]): xn(t) = J sign sin 2ππτίίτ, /i=lf 2, о Функции Хп{-) равномерно стремятся к нулю, a \xn(t)\=l, за исключением конечного числа точек, т. е. У(хп(-))-+0. С другой стороны, если хь(0=0, т0 &(χο(')) ==1» а если л;(0^0, то d7 (л;(·))]> \ A:2di>0. Таким образом, нижняя грань функцио- о нала не достигается ни на одной допустимой функции. 76
Последовательности функций, подобные хп(-), называются ^скользящими режимами», ибо управление в них (в данном примере — производная) как бы скользит между некоторыми значениями (в данном случае между +1 и —1). 4.3. Изопериметрические задачи 4.3.1. Постановка задачи. Изопериметрической задачей (с закрепленными концами) в классическом вариационном исчислении называется следующая задача в пространстве Cl([t0, iij): *·(*(·)) = \ Μ*. *(*). *(<))Я-*«1г; (з) *<(*(·))-$Μ*. *(t). x(t))dt = *i, ί=1, ..., m, (1) η *(*ϋ) = *ο» *(*ι) = *ι. (2) ?где αϊ,..., аш — заданные фиксированные числа. Ограничения вида (1) называются изопериметрическими. ♦Функции fu i = 0, l,...,m, называются интегрантами. Функции χ(·)ε^(ι[ίο, ί\])9 удовлетворяющие изопериметрическим усло- шиям (1) и условиям на концах (2), называются допустимыми. Скажем, что допустимая функция х(-) доставляет в задаче (з) слабый локальный минимум (максимум), и пишем х(-)^ б1остшз Постахз), если существует δ>0, такое, что для лк>- *бой^допустимой функции jc(·), для которой \\х(·)— — х(')\\сну0,^)<СЬ9 выполняется неравенство *ο(*(·))>*ο(*(·)) №Μ·))αο(ί(·))). 4.3.2. Необходимое условие экстремума. Теорема. Пусть функция х(-) доставляет слабый локальный экстремум в изопериметрической задаче (з). При этом 'функции fit t=0, l,...,m, и их частные производные по χ и χ -непрерывны в некоторой окрестности множества {(f, x(t)9 -x(t))\t^[t0, ίι]} (условие гладкости). Тогда найдутся множители Лагранжа λο, λι,..., λ™, не все ^равные нулю и такие, что для лагранжиана m οι выполнено уравнение Эйлера -±D-(t) + Lx(t) = 0. 77
<\ А) Вариации по Л^гранжу 'функционалов 2/χ. Выпишем вариации по Лагранжу функционалов 3fi (см.. п. 4.1.3): и 8ffi0c(^ xi')) = \{Ja(t)x(t)+Jix(t)xit))dt9 i = 0, l,...,m, ;f(-)eCi(Po. Μ>· Б) Построение конечномерного отображения и выделение вырожденного и невырожденного случаев. Рассмотрим следующее линейное отображение пространства C0l{[to9 к))={*(·)eC^.ffo, fi])|*(fo)=' = λ;(£ι)=0} в пространство R™+]: Λ*(.) = («5Ό(*(·). *(·)). e^i(i(0, *H)......«*»(*(·) *(·)))·■ Возможны два случая: , а) Л — отображение на часть Rm+1 (вырожденный случай);: б) А— отображение на все R™*1, т. е. Im/l = Rrn+1 (невырожденный случай). В) Доказательство теоремы в вырожденном случае. Образ*, линейного пространства при линейном отображении является, как. известно, подпространством. Значит, в вырожденном случае Im А €сть собственное подпространство в Rm+1. Но тогда, найдутся числа λο, λι,,.-,λ™, не все равные нулю и такие, что* т 2***, = 0 V2 = (z0, г19 ..., zm)e=ImA ί=ο Если вспомнить определение оператора А и выражение длж 6&i(&(·), *(*))» то получим tt m Я1м?й(0*(*)+Ы0*(0>)я==0 V*(-.)eCj([*„ /J).. U *=о Но тогда из леммы Дюбуа — Реймона (п. 4.1.3) следует, что т mm £νώ(·)ί=<?(ρβ, /j) и -±^{1ат)+^Ъх^)=о. ί«0 ί=0 t=0 Г) Невырожденный случай. Покажем, что если? jc(-)elocextrз, то невырожденный случай невозможен. Тем самым теорема будет доказана. Выберем функции Xj(-)^Col([t0y fj) так, чтобы Л*/(-)=£/»- т. е. «#<(*(·). χ,·(·))-β«, где г0=(1, 0,... ,0),.. .,ет = (0,... ...,0, 1)—канонический базис в Rm+1. Рассмотрим отображен ние Φ: Rm+1-a^Rm+1, действующее по формуле 78
'φ(β)4<Μ*(·>+Σβ/*Μ·>)> #ιΡ(·)+Σβ/Μ·>).... m ·■·. <Μ*(·)+Σρλ(·))). Нетрудно проверить, что функция Ф непрерывно диффвренци- def руема в некоторой окрестности нуля и Ф(0)= (а0, alt ... , ат) = = а (а0 = <^0(л: (·))).Поскольку матрица Якоби отображения Φ в нуле не вырождена (Φ'(0) = (δ<>Μ*(·)> .^у (- »)7!/=о = ^ — единичная матрица), то применима теорема об обратной функции (п. 1.4.4), согласно которой существует обратное отображение Ф~1 некоторой окрестности точки а, такое, что [Ф^Ы К s^ijC|a—a| с некоторой константой К>0. В частности, для до- еСта)точно малого по модулю ε найдется такой вектор β(ε) = = φ-1(α0+ε, αϊ,...,am), для которого Φ(β(ε)) = (ε+α0, сн,...^ .., am) у т. е. т т ^#(*(0+ΣΜβ)*/(·))-«·+*. #*(*Η+Σβ/(β)*/(·))==«ι. ί= 1, ..., m, ш при этом |Р(8)| = |Ф-1(аа+в,'аь...>ат)|</С|е|. Получилось, что в любой окрестности функции х(-) (в пространстве С1 ([ί0, t\])) существует допустимая функция (а т именно *(·)+ Σβ/(ε)^/(") ПРИ достаточно малом ε), для ко- торой значение функционала как больше, так и меньше, чем для *(·). Пришли к противоречию с условием х{·)^ *elocextr3. > 4/3.3. Пример. 1 1 lx2dt-+extr; Jxd/ = 0, х(0) = 0, jc(1)= 1. е о Решение. Лагранжиан L=XoX2+Kx. Необходимое условие — уравнение Эйлера . -Lx + L^ = 0^—2λοχ + λ = 0. Если λο = 0, то λ=0 — все множители Лагранжа — нули. Ь этом случае допустимых экстремалей нет. Положим λο=1/2. "Тогда χ=λ. Общее решение: A;=Ci/2+C2i+C3. Неизвестные 79
константы Си С2 и С3 находим из условий на концах и изопе- риметрических условий: д:(0) = 0-^С, = а> χ(ΐ)=ι=4^+α = ι, (xdt^O^tiC^ + C^dt^O^-^ + ^^O с2-з, В задаче имеется единственная допустимая экстремаль #= = 3ί2—2ί. Покажем с помрщью непосредственной проверки, что функция χ доставляет абсолютный минимум в задаче. Возьмем функцию h{-)^Cl([0, 1]), такую, что ί(·)+^(·ν) допустимая. Для этого надо взять функцию А(·), Для которой А(0) = А(1)=0 и S^hdt = Q. Тогда для функционала &(х(-}) = §x2dt имеем ff(x(-) + h(.))—£{x{'))=l(5+h)4t—$x*dt = $2xhdt-t- 0 0 0 1 1 δ ο Интегрируя по частям с учетом условий на А(·), получим 1 * 1 #(*(·)+*(·))—#(*(·))> 2 f*dA==2£A^ — 2 J *Ad/ = О 0 0 1 Нетрудно посчитать, что Sm{n = j x2 dt = ^ (6ί—2)2<# = 4. Ответ. Функция # = 3/2—2t доставляет в задаче абсолютный минимум; значение задачи Smin=4; очевидно, что Smax= §5. ЗАДАЧА ЛАГРАНЖА Этот параграф посвящен выводу необходимых условий слабого экстремума для одного общего класса задач классического вариационного исчисления — задачи.Лагранжа. К этому классу относятся все задачи, исследованные в предыдущем парагра- 80
фе. Вывод необходимых условий опирается на результаты бесконечномерного анализа, точнее — на принцип Лагранжа для? гладких задач с ограничениями типа равенств и неравенств. 5.1. Принцип Лагранжа для задачи Лагранжа 5.1.1. Постановка задачи. Пусть Х = С1(А, Rn)XR2, Δ —заданный конечный отрезок. Условие £=(#(·), to, <i)el означает, что x(-)^Cl(A9 Rn), ίο, ίι^Δ. На некоторые координаты вектор-функции χ (·) = (хг (·),..., хп (·)) (для определенности* возьмем первые k координат) у нас далее наложена дифференциальная связь Xi = q>i(t, x(t)), £=1,...,&. Обозначим далее- *(")%(*α(·). *β(0). ГДе ^α(·)β(*ΐ(·).···.**(·)). ■**(·) = = (*λ4ι(·)»···»*τι(·))· Если дифференциальная связь отсутствует, то 6 = 0 и λ:(·)=χρ(·). Задачей Лагранжа называется, следующая экстремальная задача в пространстве X: Λ0(ξ)->ίηί; Λ,(ξ)<0, i = l, ..., m', *ί(δ) = 0, i = m' + l, ..., m, (1> (з) Φ(ξ) = 4(0-Φ(Λ *(')) = 0 VfeA, (2> где Λ, (ξ) = {/,<*, *(<). ^(0)]Λ+*ί(ίο» *(*ο). *ι· *(*ι)). '=0, U···· ..., m, /0, ^eintA, ί0<*ι· Частными случаями (з) являются задачи, в которых один- из концов to или t\ — подвижный, а другой закреплен или оба» конца отрезка [U, t\] фиксированы. Элемент ξ, для которого выполнены предыдущие условия и»: ограничения (1) — (2) типа равенств и неравенств, называется допустимым. Множество других допустимых элементов — подмножество в пространстве X. Скажем, что допустимый элемент £==(.£(·), ?о, ίι) доставляет слабый локальный минимум в задаче Лагранжа (з), и пишем £^1осгтпз, если существует б>0, такое, что для любого* допустимого элемента | =(#(·)> *<ь U), удовлетворяющего условию \\l—i\\x<b(^\\x(')—^)\\CHARn)<89 |ίσ-ί0|<δ, |ίι— ?ι|<δ), выполнено неравенство .$ο(ξ)>^Μξ). Поскольку вместо ха в функции fi(t9 χ, χ) можно подставите равное ему из (2) выражение <p(i, jc), то в дальнейшем считаем, ЧТО fi = fi(t, Χ, #β). Постановка задачи Лагранжа в данном виде и последующая формулировка необходимых условий позволяют в ряде задач упростить по сравнению с задачей Лагранжа в АТФ и АГТ выписывание необходимых условий (количество дифференциальных уравнений может быть уменьшено на 1). 8Ь
5.1.2. Необходимые условия экстремума. Теорема Эйлера — Лагранжа. Пусть элемент "ξ = = {х(-)> ?о> U) доставляет слабый локальный минимум в задаче Лагранжа (з). При этом функции fj, t = 0, l,...,m, и их частные производные по χ и χ непрерывны в некоторой окрестности множества {(t, x(t), £ρ(/))'|ίεΔ}, φ и ее частная производная по χ непрерывны в некоторой окрестности множества {(ty x{t))\t(=A}, функции ψ*, t = 0, lr..,m, непрерывно дифференцируемы в окрестности точки (?<>, *(?о)> t\9 x(U)) (условие гладкости). Тогда найдутся множители Лагранжа λ= (λο, λι,..., km) e €Rm+1 и вектор-функция ρ(·)ε^(Δ, Rfe), не равные одновременно нулю и такие, что для функции Лагранжа J£ = \[f(t, χ, x)+(p(t), *«-φ(ί, x(t)))]dt+l{te, jc(t9), tv xyj). где f{i, x, x)= £λ,/<(ί, χ, *'($), / = Yh+tV» x(t9), tv хЦг)), выполнены условия: а) стационарности по. х—уравнение Эйлера для лагранжиана L(t9 х, x) = f(t, х, xt)+(p(t), χΛ—ψ(ί, Jc(i))> — -ρ(ο-Ρ(οί;α(ο+Γ,βω=6. ~|-Γί|ί'(0+7χί(ί)-Ρ(θί.ρ(0-β;. б) трансверсальности по χ: ~ ~ , ~ ίρ(ω=(-ΐ)'Γ^>, в) стационарности по t0y t\ (выписывается только для подвижных концов отрезка интегрирования): Ви = 0 ^-J (to) + U. + Uu) х (ζ) = 0, ^ = 0»^i)+^+ir(i.i(?i) = 0; г) дополняющей нежесткости: λ^(1)==0, /=l,...,m'; д) неотрицательности: λί>0, t = 0, l,...,m'. «2
< Рассмотрим задачу (з) как экстремальную задачу с ограничениями типа равенств и неравенств (п. 2.4). В нашем случае пространство X=Cl(A, Rn)XR2, функционалы 3Su i— = l,...,m', задают ограничения типа неравенств, а ограничение типа равенства задается отображением /,(ξ) = (Φ(|), Шт'+\ (ξ), ·*** ...» &т(1))> действующим в пространство Y = C(A, R*)xRm~m' При этом ξ доставляет локальный минимум в пространстве X. Покажем, что в нашей задаче (з) выполняются все условия теоремы п. 2.4 (банаховость, гладкость, ослабленная регулярность), а затем согласно принципу Лагранжа для задач с равенствами и неравенствами выпишем необходимые условия минимума и выведем из них условия а)—д) нашей теоремы. Банаховость пространств X и У вытекает из того, что пространства Cl(A> Rn) и С(А, Rft)—банаховы (п. 1.1.2), з произведение банаховых пространств — банахово (п. 1.1.3). Гладкость отображений ^ и f выполняется, поскольку из; непрерывной дифференцируемое™ в окрестности точки ξ следует строгая дифференцируемость в точке (п. 1.4.2). Ослабленная регулярность, т. е. замкнутость множества* F'fyX, вытекает из леммы о замкнутости образа (п. 7.2), где* Д=ф'(|) (A:X-»Y)t В =(«;-+! (f)f .... ^;(i))(B:X->Rm-m'). Множество ВКегЛ замкнуто как подпространство конечномерного пространства. Замкнутость образа отображения А имеет место в силу того, что образ Ф/(|)С1(А> Rn) просто совпадает с С(Д» Rft). Действительно, взяв произвольное у(-)еС(А, Rft) (и произвольный вектор y^R^), всегда найдем функцию А(-)& еС^Д, Rft) и тем самым функцию (Л(')» 0) (/ιβ(.)=0) пространства С1 (Δ, Rn),-для которой Ф'№(·)..0)] = fi(t)-4Xa(t)h(t) = y{t), h{f0)=y. (1> Решение последней системы k линейных дифференциальных Уравнений с непрерывными коэффициентами существует, единственно и определено на всем отрезке Δ в силу теоремы существования и единственности решения задачи Коши для линейной неоднородной системы [АТФ, с. 191]. Таким образом, все условия теоремы п. 2.4 выполняются. Согласно этой теореме найдутся множители Лагранжа λ= (λο* ^i,...,Xm)eRm+1, у*^У*, не все равные нулю и такие, что для:. Функции Лагранжа задачи (з) и 5(Ь у\ λ) = 5(*(.), t09 tl9 у\ λ)=^/(ί, х9 ii)dt + 8£
^выполняются условия стационарности J,(f)=o«Sx=o(«Д,а-о, £β=0), i,0=o, J/l==o, дополняющей нежесткости и неотрицательности. Покажем, что из равенства J£X(X = 0 вытекает существовав л#е функции p(-)^Cl(&9 RA), для которой выполняются уело· ®ия теоремы а), б) и при этом & = &. Тогда теорема будет до- жазана. Расшифруем условие стационарности 3? по ха: и VAeCMA, R*). Отсюда в силу (1) U V7eR*. (2) Определим функцию ρ из условий Ρ(0 + Ρ(0Φχβ(0 = Γ*β(ί). Ρ(?ι) =-£«</.>. (3) Έ силу теоремы существования и единственности решения задачи Коши для линейной неоднородной системы [АТФ, с. 191] «функция p(-)eCl(A, Rh) определяется нашими условиями однозначно. Тогда в силу (1) и (3) имеем ^iph)dt^p(71)h(71)-p(70)h(70)^^(ph + ph) ^[(fxJ1—№xJl + №xJi + Py)dt = ^(fxJi + py)dt. ?ΐΛ Иаходя из последнего соотношения \ fxJidt ri подставляя по- и -лученное выражение в тождество (2), получим ?! (У', y)=lpydt-{tx^t)-p(t0))4 Y у εξ С (A, R*), VYe=R*, •84
и откуда следует, что (у\ y) = \p{t)y(t)dty p(?0)=\(/.)· Таким и «образом, &~3? и доказаны уравнения Эйлера и условия трансверсальности для переменных ха. Уравнение Эйлера и условие трансверсальности по переменным Xfi следует из стационарности функции Лагрэнжа & πα jcp. Соответствующий вывод был проведен нами при выводе необходимых условий в задаче Больца п. 4.1.2. [> ι 5.1.3. Пример. j*2d/-*extr; χ(0) = χ(0) = 0, лг(1)= 1. ' о Решение. Приведем задачу к виду задачи Лагранжа ;п. 5.1.1., сделав замену переменных х\=х, #2=х: x22dt-+extr; х± = х2, x1(0) = x2(0)==0> ^(Πβΐ. Функция Лагранжа: ι ^«Ιΐ^ + ΡΛ-^Λ + Μι^ + λΛ^ + λ,Ιχ^Ι)-!). о Необходимые условия: а) система уравнений Эйлера для лагранжиана £-=ЯоЛ22+ -bp(*i—x2): ~^Ц + Ц=0, ί=1· 2«-Р==0> -2λ0^2-ρ-0; б) трансверсальность по χ для терминанта /*=λιΛ;ι(0) + +λ2χ2(0)+λ3(*ι(1) — Ι): Ц<0) = '*,<*>· ί==1>2> Р(°) = *1> ^(!)=->^ Ц(1) = -/¥1), f=l, 2, 2λ0^(0) = λ2, 2λΛ(1) = 0. Поскольку концы отрезка интегрирования фиксированы, то условие стационарности по ίο, U не выписываем. Условия дополняющей нежесткости и неотрицательности также отсутствуют ввиду отсутствия ограничений типа неравенств. Если λο = 0, то из б) и а) следует, что λ2=0, р==0; тогда из *б) λι=λ3 = 0 — все множители Лагранжа — нули. Итак, при λο=0 допустимых экстремалей нет. Пусть λο^Ο. Из системы Уравнений Эйлера вытекает, что Х2 = 0, что равносильно уравнению х=0. Откуда x(t)=Cit*+C2t2+Czt+C4. Неизвестные константы С\—С4 определяются из условий на концах и условия трансверсальности х(1)=0. Единственная допустимая экстремаль: *(*) = (1/2) {3t2—P). 85
Покажем с помощью непосредственной проверки, что £е eabsmiii3. Возьмем функцию Л(-)еС2([0, 1]), такую, что £(·)+&(·)—допустимая в задаче. Для этого надо взять функцию &(·) со следующими условиями на концах: п(0)=й(0) = =Л(1)=0. Имеем для функционала о8(*(·)) = |x2dt о ι ι *(*(·) + *(·))—^Η·))==5έ+Α)2ίίί—f ?df = о о I 1 1 = 2 J £ftdf + \ h*dt> 2 \ xhdt. 0 0 О Далее дважды интегрируя по частям с учетом условий на* концах функций χ и h и уравнения #=0, получим &(*(-) + Ь(.·))—£(*(.))>2 ^xdh^2xh\ — 2 \xtidt = 0 0 0 1 ... ... 1 1 ф... = — 2 J*dft= — 2*ft| + 2 J *ndf==0. о θο Таким образом, Jf(i(·)+й(-))>^(^(·)) и> следовательно^ i(-)eabsmin3, Smin=^(^(·)) =3. Ясно, что Smax= + oo. Действительно, возьмем последовательность хп (t) =i (t) + «ft (ί),. где Α(·)—некоторая функция из С02([0, 1]), такая, что ΆΦ0>. например h(t)=t2(t—I)2. Тогда ^(л;п(-))->+оо при п-+оо. 5.2. Задача с подвижными концами 5.2.1. Постановка задачи. Задачей с подвижными концами- . называется следующая задача в пространстве Cl(A)XR2: и #(*(·). ί0. ii) = J^(i. *<0. x(t))dt + %{t0, x(ί0), tv xVi))-* -*extr; (з)< Ψί(Ό» *(*ο). *и *(*ι)) = °» ί = 1, ..., /η, (1>· где Δ — заданный конечный отрезок, /0> ίι^Δ, to<t\. Частный случай (з)—задача, в которой один из концов, U или t\ подвижный, а другой закреплен. Тройка (х(-)у fo».fi) называется допустимой в (з), если: х{-)^С1(А), ίο, ίι^ιηίΔ, ίο<ίι, и выполняются условия (1) на концах. *б
Говорим, что допустимая тройка (*(·)» *о» U) доставляет слабый локальный минимум (максимум) в задаче (з) (в пространстве Cl(A)XR2), если существует б>0, такое, что для любой другой допустимой тройки (*(·), ίο, ίι), Для которой |<о—Μ<δ, Κι—ίι|<δ, \\х{·)—^(-)I1c»(a)<S, выполняется неравенство *(*<·). Ό, <ι) >*(*(· Mo, ίι) ($Ч*(-). ^ο, *ι)<*(*(·Μο,ίι)). При этом пишем (£(·)» ίο, ii)elocmin3 (1остахз). 5.2.2. Необходимые условия экстремума. Теорема. Пусть тройка (*(·)» ίο» ίι) доставляет слабый локальный экстремум в задаче с подвижными концами (з). При этом интегрант L и его частные производные по χ и χ непрерывны в некоторой окрестности множества {'(i, x{t), χ(ί))|ί^Δ}, а функции -фг-, i= = 0, 1, , m, непрерывно дифференцируемы в окрестности точки (ί0, ί(ί0), ίι, *(ίι))· Гогда найдется ненулевой множитель Лагранжа λ= (λβ, λι,...', Ят) eRm+1, такой, что для функции Лагранжа и $=\k0L(t, *, x)dt + l(tQy x(t.)9 tv *(/>)), U m где / = ^λίψ^ο, x{t0)y tv *(ίχ)), выполняются условия: а) стационарности по χ — уравнение Эйлера для интегрантш loL(t, χ, х) — . б) трансверсальности по χ K^i (^o) = '*<*·). λο^ (ίι) = —l*(hh в) стационарности по ίο, ίι (выписывается только для подвижных концов) ^/β = 0«-λο£(ίο)+ία + ζ(Μί(ίο) = 0, j^ = 0 «* λ0Δ (ζ) + ζ, +Τ»(/|)ί(ζ) = 0. <] Данная теорема непосредственно вытекает из принципа -Лагранжа для задачи Лагранжа, в которой отсутствуют дифференциальная связь и ограничения типа неравенств. [> τ 5.2.3. Пример. ff(x(.)yT)=[{x2—x+l)dt-+extr; х(0)=0. о 8!
Решение. Функция Лагранжа: τ % = \h (x2—x+ 1)dt + Xx{0). <Г Необходимые условия: а) уравнение Эйлера для интегранта L=K0(x2—x+l): —^rL: + Lx = 0<^k0(2x+\)^0; б) условия трансверсальности по χ для терминанта 1=λχ{0): L;(0) = /x(0), ^(Γ) = -/Λ(Γ)«*2λ0^(0) = λ, 2λ0*(Γ) = 0; в) условие стационарности по Τ (выписываем только для* подвижного конца): <£т(Т) = 0**Хо(хЦТ)—*(f)+l) = 0. Если λ0=0, то из б) следует, что λ=0 — все множители Лагранжа оказались нулями. Положим λο==1. Тогда из а) вытекает, что х=—1/2. Общее решение этого дифференциального уравнения: *=(—t2IA)+Cxt+C2. Поскольку л;(0)=0, то С2=0; Для определения неизвестных Сх и Τ имеем два уравнения:. х(Т)=0 и х2(Т)— х(Т)+1=0. Решая эту систему уравнений, на-: ходим, что f=2, Сι=1. V В задаче имеется единственная допустимая экстремаль £*= =—t2/4+ty рассматриваемая на отрезке [0, 2]. Покажем, что (*(·)> f)^£locextr. Действительно, для функ- ции x(t)=-t2/4+t τ τ & $(■), г)=|(£2-*-И)<я=|((~^ + ι)2- о о 0 При Г, близких к f, значения функционала &(х(-)9 T) могут быть как меньше У(х(-)у Т)у так и больше &(χ(·), Τ). ; Возьмем последовательность пар Xn(t)=t9 Tn=n; тогда У(хп(-)9 Тп)-*~оо при /z->oo. Значит, 5тш=—сю. Очевидно,. 5.3. Задачи со старшими производными 5.3.1. Постановка задачи. Задачей со старшими производными (с закрепленными концами) в классическом вариационном исчислении называется следующая задача в пространен веС»([ίο, ίι]): «8
# (χ (.)) = J L (f, * (/), * (О, · · · , *(п) (0) Л ~* extr; (з) *«(*/) = *f, 6 = 0, 1, ...,д-1, / = 0,1. (1) Здесь L: R"+2->R — функция /г+2 переменных. Функция L называется интегрантом. Функции я(-)еСя(р<ь *ι])> удовлетворяющие условиям (1) на концах отрезка [t0j ίχ]9 называются допустимыми. Говорим, что допустимая функция х(-) доставляет в задаче (з) локальный минимум (максимум) в пространстве Cn([to, ίι]), если существует δ>0, такое, что для любой допустимой функций *(·), для которой ||*(·)—^(')ΙΙ0^ο/ι1)<δ' выполняется неравенство и пишем при этом i(.)elocmin3 (1остахз). 5.3.2. Уравнение Эйлера—Пуассона. Теорема. Пусть функция х(-) доставляет локальный экстремум в задаче со старшими производными (з). При этом мнтегрант L таков, что L(fc}(')eC^([i0,y, ft=0, 1, .'.., η (условие гладкости). Тогда на экстремали х(-) выполняется уравнение Эйлера—Пуассона. Σ(-"'(:γ)4«>('>=0· <| Приведем задачу со старшими производными к задаче Лагранжа, сделав замену переменных Xk=xik~~l\ 6=1, ..., я, jL(i, xv *2, ... txn9 xn)dt-+extr; xk--=xkj-u k= 1,... ,n— 1, и Xk(ti) = rf-l> / = 0,1, *«1,...,л. (3') Здесь фазовая переменная — вектор-функция (х\{-)> ... • · ·, Χη (· jI). Поскольку функция х (·) доставляет локальный экстремум в задаче со старшими производными (з), то вектор- 'функция (*ι(·)> ···> *«(·)) доставляет слабый локальный экстремум в задаче Лагранжа (з'). Выпишем согласно теореме Эйлера—Лагранжа необходимые условия стационарности п—\ Для лагранжиана L=X0L(tf х19 ... 9хп9 Xn) + Y^ Pk(xk—**-н)· Терминальную часть функции Лагранжа, а также остальные .необходимые условия экстремума, не играющие существенной роли в задаче с закрепленными концами и фиксированным 89
отрезком интегрирования, не выписываем. Система уравнений Эйлера: -—Lik(t) + LXk(i)==0^-pk + Ko^-pk^==09 k=l,... я, 6 = 2, ...,/ζ— 1, 7Γ λο —Γ- + λ0-Γ pn-i = 0. Μ дхп дхп Если λο=0, то из системы уравнений Эйлера следует, чт<> рЛ_1=.. . = р1=0. Все множители Лагранжа — нули. Пусть λ(ρ**, =^0. Положим λ0=1. Выразим рп-\ из последнего уравнения и подставим в предпоследнее; проводя эту процедуру для Р/х-2, ..., Р\, придем в итоге к уравнению Эйлера—Пуассона. >' 5.3.3. Пример. ι \x?dt-»extT; *(0)=*(0)==л;(1) = 0, jc(1)=1. ό \ Решение. Интегрант: L=x2. Необходимое условие — уравнение Эйлера—Пуассона irk—|-ii+i,-o~*<«><o-o. Общее решение уравнения Эйлера^-Пуассона: x(t)=Cit3-*r +C2t2+C3t+CA. Неизвестные константы Си С2, Сз, С4 определяются из краевых условий *(0) = 0=^С4=0, х(0) = 0=$С3=0, хЩ^О-Ь^ + С^О, l.C^l, x(l)=l=^3C1 + 2Ca=lJ~^C2 = —1. Значит, в задаче имеется единственная допустимая экстремаль χ- = ί3_ί2 Покажем, что она доставляет абсолютный минимум в задаче. Действительно, если h(-)^C02([0, 1]), то 1 ' ! ' #(Γ(·)+ή(·))—&(x(-))=l(x+h)4t—lxdt = 2Jxfidt+\h2di. 90
С помощью двукратного интегрирования по частям, учитывая, что Л (0) =/г (1) =/г (0) =/г (1) =0, получаем 1.. 1 .. 1 1 ... 1 ... ... l l ]xtidt = $xdh==xh\ — \xhdt = —$xdh = —xh\ + J*(4>ftd/ = 0. Q 0 0 0 0j 0 0 Следовательно, ι &(χ(·)+4-))-& &·))=ί ii*dt>o, 0 1 1 Smin = ί x2 dt = J (6f—2)2 ctf = 4. о о Ответ: Функция x=fi~-t2 доставляет в задаче абсолют- ШЫЙ МИНИМУМ, 5min = 4, Smax=+00. §6. ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ 6.1. Принцип максимума Понтрягина 6.1.1. Постановка задачи. Задачей оптимального управления (в ионтрягинской форме) называем следующую задачу: Λο(ξ)-πηί; Λ(ξ).<0, W < Λ (ξ)-Ο, ι—m'+l, ..., m, (з) def . Φ(ξ) = *(0-Φ('. *(<). «(0)=0 Vie Γ, (I) ίΐ(*)€ΞΪ/ Vf€=A, (2) тле g-(*(·). "('Mo, *i). *(-)е*СЧА, R«), ii(.)eKC(A, R'), i0, iiSintA, to<iu A — заданный конечный отрезок, U — произвольное множество из Rr, Гс=А — множество точек непрерывности управления и(-), k ' ^i(l) = \fi(t, *(t), ti(t))di+^(t09 x(t0)f t19 x(t±))9 i = 0, 1,...., m. Отметим, что уравнение (1), называемое дифференциальной связью, должно выполняться во всех точках непрерывности вектор-функции и(-) = (wi(·)» ..., Μ*))· В отличие от задачи Лагранжа имеется ограничение (2) типа включения, а фазовая переменная χ(-) = (χι(-)9 ..., *«(·)) может иметь меньшую гладкость. Частный случай (з) — задача, в которой один из концов отрезка интегрирования или даже оба закреплены. 91
Элемент ξ, для которого выполнены все указанные условия и ограничения задачи, называется допустимым управляемый процессом. Допустимый управляемый процесс ξ =(*(·)> #(·), U> t\\ называется (локально) оптимальным (или оптимальным ^ сильном смысле процессом), если существует б>0, такое, чта для всякого допустимого управляемого процесса ξ=* = (*(·), и(-), f0, ti), для которого !!(*(·)> Ό. Ί)—(*(·). С £>NC(AiR»)XR.<e, выполняется неравенство ^ο(ξ)>^ο(Ε). 6.1.2. Формулировка теоремы в общем случае. Теорема (принцип максимума Понтрягина). Пусть ξ=* = (i(·), й(·), ίο, h) — оптимальный (в сильном смысле) процесс в задаче оптимального управления (з), функции fi> i= =0, 1, ..., m, φ и их частные производные по χ непрерывны в некоторой окрестности множества {(t, i(/))|teA}, декартово умноженного на U, а функции ψί, i=0, l, ..., m, непрерывно дифференцируемы в окрестности точки (t0, x(t0), tl9 x(tx)} (условие гладкости). Тогда найдутся множители Лагранжа λ=(λο, λι, ..., λ*ι)€ eRm+1, p{-)^KCl(&9 R*), не все равные нулю и такие, что для функции Лагранжа tt -2 = 1 [/(*, *> u) + P(t){x—<P(t, *, u))]dt + l(t0, x(t0), ti9 x(tx))* U где m m i=0 i=0 — терминант, выполнены условия: а) стационарности по х — уравнение Эйлера ~Σ;(0 + Ϊ^Ο = 0«ρ\0=?^)-Ρ(0Φχ(0. для лагранжиана L=f(t, χ, u)+p(t) (χ—<ρ(ί, jc, и)); б) трансверсальности по χ ' £i(*o)==k('ob ρ (ζ)=**<*.). «=> £; (*ι) = — ^<») Ρ (*ι) = — Wib в) оптимальности по и min L(t, ί(ί), ДО. u) = L(ty x(t)9 x(t), u(t))<* ueu 92
minff(f, x(t), u)-p(t)<t(t, x{t), u)} = f(tt x(t), u(t))- -P(t)4(t, x(t)9 u(t)) ViGT; г) стационарности no ίο, U {выписывается только для подвижных концов отрезка интегрирования) .&.=о, -7(Γ0)+ί0+ί(^(Γ0)=ο, ^=о /(7ι)+/;1+/;(Μί(Γ1)=ο; д) дополняющей нежесткости λίΑ·(ί)=0, i=l, ...,m'; е) неотрицательности λ;>0, i=0, 1, ..., m'. 6.1.3. Формулировка и доказательство принципа максимума Понтрягина в частном случае. Приведем формулировку и доказательство принципа максимума Понтрягина для следующего частного случая задачи оптимального управления — задачи* со свободным концом и закрепленным временем: *(*(·). «(·))=$/(*. *(*)> "(0)^ + ψ(*('ι))-*ίηί; (з> x(t) = <p(t9 x(t), u(t)), «(/)εί/, x(tQ) = x0. Теорема. Пусть (*(·)> й(·)) — оптимальный (в сильном смысле) процесс в задаче оптимального управления (з); функции /, φ и их частные производные по χ непрерывны в некоторой окрестности множества {(t, x(t))\t^[t0y tx]}y декартово умноженного на U, «ф непрерывно дифференцируема в окрестности тощки x(t\) (условие гладкости), U — произвольное множество из Rr. Тогда выполняется условие оптимальности по и: f(t, *(*), «0-р(0ф('. *(0, ")>/(0-р(*)ф(0 Vrfer, VhsI/, (1> где ρ(·) — единственное решение дифференциального уравнения р(0+р(0ф*(0=Ы0 Vter (2> с краевым условием р(*,)—ψ'(*(ί,)). (3) Отметим, что принцип оптимальности (1) с условиями (2) — (3) может быть легко выведен из необходимых условий опти- 93?
дальности в общей задаче оптимального управления. Множитель Лагранжа λο при функционале $ оказывается равным единице, а условие трансверсальности по x(t0) не существенно. <J Единственность решения уравнения (2) с краевым условием (3) следует из теоремы существования и единственности решения задачи Коши для линейных систем [АТФ, с. 191]. А) Игольчатые вариации. Зафиксируем точку те «еГ, элемент ие£/ и число а>0, настолько малое, что [τ— —α, τ]αΤ. Управление и /А_К(0, t<£[%—α, τ); "aW~\ ό, · ίε[ΐ-α, τ) юазовем элементарной [игольчатой) вариацией управления й. Пусть Χχχ,(-) — решение уравнения x(t)=q>(t, x(t), ua(t)) с начальным условием x(tQ)=x0. По локальной теореме существования [АТФ, с. 186—189] функция ха{-) определена при <х<ао в некоторой окрестности точки ίο, но из леммы 1, формулируемой ниже, следует, что на самом деле вектор-функция ~χα(·) определяется единственным образом на всем отрезке ,[t0f ti]. Вектор-функция Ха(-) называется элементарной (игольчатой) вариацией функции х(·), а пара (ха(*)> tia(-)) — элементарной вариацией процесса (*(·)> ^(#))· Пару (τ, ν), юпределяющую эту вариацию, назовем элементарной иголкой. Б) Лемма 1 (о свойствах элементарной вариации). Пусть {χ, υ) — фиксированная элементарная иголка. Тогда существует число ссо>0, такое, что [τ—αο, т]с=Г и для любого as ^[0, αο] функция Ха(-) определена на всем отрезке [tQy ti]\ лри этом Ха(-)-*~${-) в метрике пространства C([t0y tx]y R*), x«(t)-Ht)=ay(t)+ra(t) Vie[T, f,], причем sup 'Γ(χ( » ->0 при a-И-О, где функция у(-) ку- сочно-непрерывно дифференцируема на [τ, t{\ и удовлетворяет дифференциальному уравнению y(t)=yx{t)y(t) Vie [τ, tiW (4) ус начальным условием ί/(τ)=φ(τ, £(τ), υ)-φ(τ)=Δφ(τ, υ). Доказательство леммы следует из двух основополагающих фактов теории обыкновенных дифференциальных уравнений: локальной теоремы существования и теоремы о непрерывной зависимости и дифференцируемое™ решения по начальным данным. Мы не приводим его здесь, отсылая к книге [АТФ, с. 89-91]. «4
В) Л ем м а 2 (о приращении функционала). Пусть (τ, ν) — фиксированная элементарная иголка, x(a)=Jf(A;a(·), ыа(-))~ Тогда функция χ(·) дифференцируема справа в нуле и у! (+0) =/ (т), х(х, v) -f (т) -ρ (τ) у (τ). < < Используя теорему о среднем для числовых функций, правило дифференцирования под знаком интеграла ю лемму 1, получим Х'(+0)= lim Χ(α)~Χ(0)= lim —((f(t, xa(t), ua(t))dt- -f/(*. m u(t))dt) + lim *(*<*>>-♦('<*>> β τ U = lim J-( С </(ί, *β(/), »)-/(<))*+il/C *β(ί). "(0)- a-*-|-o a \ J J τ—a ■ τ <. + $M0y(*)#+*'(*('i))*(*i). τ Выражая /^ из уравнения (2) и учитывая уравнение (4), имеем $TAt)y(t)dt=$(t(t) + p(t)%(t))y(t)dt = -^(pV)y(t) + P(i)y(t))dt = ^(p(t)y(t))dt^ τ τ = Ρ(Ί)0(Ί)—Ρ(*)0(τ)." Подставляя найденное значение \fxydt в выражение для; χ'(+0)> с учетом условия 3) получим искомое представление. » Г) Завершение доказательства. Из леммы 1 следует, что если α^[θ, α0], то (*α(·)> иа(·)) — допустимый управляемый процесс и #<*(·) равномерно стремится к #(·)· Поскольку i (χ(·), й(·)) — оптимальный процесс, то при малых а>0 «(*«<·). Μ·))>*^(·), "(·))«Χ(α)>Χ(0). 95
Отсюда по лемме 2 χ'(+0)>0> и из выражения для χ'(+0) и j/(t) вытекает, что /(τ, х(х)у ν) — /?(τ)φ(τ, £(τ), у) ></(τ)— ρ (τ) φ (τ) Vtc=7\ Vuei/, 'т. е. выполняется соотношение (1). |> 6.1.4. Доказательство принципа максимума Понтрягина в общем случае. Приведем в п. А)—Г) ряд вспомогательных утверждений и построений. А) Лемма о центрированной системе. Пусть К — компакт, {/Са}ае$1 — система замкнутых подмножеств Ку .любая конечная подсистема которой имеет непустое пересечение (центрированная система). Тогда пересечение всех множеств системы {Ка}а ^51 непусто. <<3 Обозначим Оа дополнение к Ка в K(Ga = K\Ka). Тогда Оа открыто в /С. Если П Ка=0, το [} Θα = Κ, т. е. {Оа)ат аеЯ [а €St «есть открытое покрытие компакта /С. По определению компакта m m можно найти а19 ..., ат, такие, что (J Оа. = /С. Но тогда П ^а,— = 0 в противоречие с определением центрированной системы. Значит, П К«Ф0. О О Б) Игольчатые вариации, пакет иголок. Про- варьируем процесс ξ, включив его в конечно-параметрическое семейство, определяемое пакетом иголок (набором игольчатых шариаций управления й(·)). Для этого фиксируем натуральное число Ν, наборы: точек τ= (ть ..., xn), х\<Х2<. · ·<τν, управлений v=(vu ..., υΝ), длин а=(аь ..., α^) (τ^Γ, t^e ^ί/, ш>0, i=l, ..., Ν. Через |а|, как обычно, обозначаем Ν '{Σ α?)1/2· упРавление t=l Ν ««(0 = и(/), fesAxLU,; 1 ι/,, /εΑ(, оде Δί=[χ— (Ν—i) Jcc| — α,·, τ,— (ΛΛ-ί) |α|), назовем игольчатой .вариацией управления й(·), определяемой пакетом иголок (τ, у, а). Некоторые точки η могут совпадать. Однако полуинтервалы Δί (имеющие длины ш) выбраны так, что они не пересекаются и при малом |а| лежат во множестве Т. Пусть χη(·) (η=(*0, *о> α)) — решение уравнения * = φ(ί, X, «„(')) (l) *с начальным условием ^(ίο)^^, где точка (t0y x0) находится в def ^-окрестности точки (f0, Хо) (*о=*(^о))· Ниже мы покажем, что 96
Χι(·) — решение дифференциального уравнения — действительно существует и определено на всем отрезке Δ. Вектор-функция #η(·) называется игольчатой вариацией функции х(-), определяемой точкой (t0, x0) и пакетом иголок (τ, ϋ, α). В) О системах дифференциальных уравнений. Предположим, что задача Коши на конечном отрезке А x=F(t, χ), x(t0)=x0 (/0€=intA), имеет решение χ(-)^КС1 (Δ, Rn), при этом F непрерывная и непрерывно дифференцируемая по χ в некоторой окрестности О траектории Γγ={(ί, x(t)) |ieA}. Тогда найдется G'czG — окрестность траектории Гх, такая, что для любой точки (t0, Xo)^G' существует единственное решение х(-, to, Хо) задачи Коши, определенное на Δ, при этом функция x(t, t0i x0) непрерывно дифференцируема во множестве Δ Χ G' и dx(t, t0, x0) дх0 dx(t, tQ, xQ) dt0_ x0=x(t0) Λ =-β(ί, t0)F(t0, x (t0)), где Ω(ί, t0) — фундаментальная система решений уравнения в вариациях: ^-Ω(/, t0) = Fx(t, x(t))Q(t9 ί0), Q(fe. <·) = Λ at J — единичная матрица. Это классическая теорема о существовании и непрерывно дифференцируемой зависимости решения дифференциального уравнения от начальных данных [АТФ, с. 195—204]. Г) Лемма об игольчатой вариации. Пусть наборы χ и υ в пакете иголок (τ, ν, а) фиксированы. Тогда существует ε>0, такое, что если 0<|α|<ε, \хо—Хо\<г, Ко—?о|< <ε, то Δ/(=7 и, кроме того 1. Функция #η(·) — решение уравнения (1) — определена на отрезке Δ, ||*η(·)— *(-)llc<A,Rn) """* ° пРи η-^Ι^ο, *ο, 0). 2. Отображение (ty η)-^*η(0 продолжается до непрерывно дифференцируемого отображения в некоторой окрестности точки (?ь η). 3. Выполняются условия: дхц(П дх0 д*„(0 dt0 97
где Ω(ί, t0) -r фундаментальная система решений уравнения & вариациях: Ω {t, t0) =φ* (/) Ω (/, t0), Ω (/ο, ίο) =-/. Наметим путь доказательства леммы. Если управление й(·) — непрерывная функция, то утверждения леммы сразу вытекают из теоремы пункта В) о существовании и непрерывно дифференцируемой зависимости решения дифференциального уравнения от начальных данных. Если же й(-) кусочно непрерывна, то нужно применить теорему В) несколько раз на каждом участке непрерывности. Д) Редукция к конечномерной задаче. Снова фиксируем Jvf τ и и. Проведем редукцию к конечномерной задаче. Обозначим1 z=(tu η) = (/ι, t0y x0f au ..., ал')^R2+"+^, положим Л (*)=«£ (*η(·). Μ"). Ό. *l)f= η -i Μ*. *η(/), "α(0)Λ + *ί(ίο. *0· Ί> *η(Ί)) и рассмотрим задачу F0(z)^inf; Fi(2)<0, Η < Fi(z)=09 В силу леммы об игольчатой вариации Fi непрерыбно дифференцируемы в некоторой окрестности точки 2=J$u *<ь *о, 0) и (*η(·)> Ό, Ί)-*-(*(·)» *о, ίι) при 2-кг, а-так как ξ доставляет локальный минимум в задаче (з), то точка 2elocmin3T,t;. Значит, к задаче (зт,г>) применим принцип Лагранжа для конеч- номерных задач с равенствами и неравенствами (п._2.42· Согласно ему найдутся множители _Лагранжа λ^ ..., λ/η, μι, ··· ..., μΝ, не все равные нулю (λ;=λ*(τ, υ), μ/=μ/(τ, υ)) и такие, что для функции Лагранжа m N з= Σ!λΛ(2)-Σϊ*/«/ выполнены условия стационарности (j?z=0), неотрицательности (λ/>0, /=0, 1, ..., т', μ/>0, /=1, ..._, Ν) и дополняющей нежесткости (λ;/7,· (2) =0, £=1, ..., /и', μ/α/=0, /=1, ..., Ю- Ε) Преобразование необходимых условий конечномерной задачи. Положим 98
m Ρ(·) ~~ решение дифференциального уравнения p(t) + P{t)Vx(t)4x(t) с краевым условием РЙ) = -/*. (2) (3) Из этих определений и определения для Q(t, ί0) следует, что JL(p(t)Q(t, Г„)) =/,(*) Ω (ί, ί0) at И *1 ** Распишем условия стационарности функции Лагранжа SB в точке 2, учитывая лемму о приращении функционала п. 6Л.З и формулы из леммы об игольчатой вариации: -^ξ^ = ΔΓ(τ» t^-^ Λ=1, ..., ΛΤ, (4) dak дх0 ]t.m дхп I м \? \T θ*η(?ι) ^dt + lXo + lXt— |η=η = ρ(ζ)0(?ι. ζ)—Ρ(ζ) + /χ.+ ^0(ζ· ζ) = -Ρ(ζ)+£ = 0, (5) τ, ot0 J- <*<» 1ч—ч Τ- . Τ *ΜΊ) а/„ η=η ~ Λ Χ _. -(5) - Λ -1 ~ Д Λ ' = -/(ίβ) + Ρ('·)*(ν + ^=-/(<β) + ^ + ^(ίβ) = 0, (6) ·=/(ζ)+/«,+'*.£(Ί)=°· (7) 99
Очевидно, что λ=^0, ибо ина^че из определений f, p и соотношений (4) следовало бы, что μ=0, что невозможно. Умножением на положительную константу нормируем вектор λ так т * чтобы Υχ?=1. Итак, доказано, что существует единичный вектор λ, такой,, что выполнены соотношения (2) —(7) и, кроме того, λ^,(ζ) = 0«λίΛί(|) = 0> / = 1, ...,m', (8> λ;>0, ί = 0, 1, ... ,m'. (9) Ж) Окончание доказательства. Рассмотрим & пространстве Rm+I подмножества К (τ, v)y v^U, теГ, компакт- т ной сферы 5 = {λ^λ? = 1|, состоящие из тех векторов λ, для о которых выполняются утверждения а)— е) теоремы о принципе максимума Понтрягина, причем в п. в) взято ί=τ, ιι=υ. Иа определения множества К (τ, ν) нетрудно вывести, что они замкнуты. В силу условий (2) — (9) любое конечное пересечение множеств K{rk, vk), й=1, ..., Ν, непусто. По лемме α центрированной системе все множества К (τ, ν) имеют непустое пересечение. Значит, существуют ненулевой вектор λ— = (λο, ..., λ/η) и функция ρ(-)εξΚΟ(Χ R"), такие, что выполняются утверждения теоремы а)— е) с условием оптимальности, выполняющимся для любых теГ, v^U. Замечание. Принцип максимума доказан в пространстве КС*{Ь, КЛ)Х/СС(Д, R')XR2. Незначительные изменения доказательства позволяют обосновать его в пространстве Ψ*» (Δ, R") X Loo (Δ, ROXR2· Помимо классической книги Л. С. Понтрягина можно рекомендовать также монографию Р. В. Гамкрелидзе «Основы оптимального управления» (Тбилиси: Изд-во Тбилисск. ун-та,. 1977). 6.2. Примеры. Пример!. &(х(.)) = ^ (x* + x)dt-+inU |jc|<1, лчО)=0. о 100
Решение. Приведем задачу к виду задач оптимального управления, введя управление и(-): 4 f (u2 + x)dt-+inU х = и, ηεξ[—1, 1], *(0)=0. 6 Функция Лагранжа: 4 <2 = $(К(и* + *) + Р(х—u))dt + Xx(0). о Необходимые условия: а) уравнение Эйлера для лагранжиана Ζ,=λο(Η2+*) + +р{х—и): -ΓΙ; + ^ = 0^ρ = λο; dt х б) трансверсальность по х: Lx(tk) = (-l)klxitkh £ = 0, 1**ρ(0) = λ, ?ρ(4) = 0; в) оптимальность по и: min (Х0и2—ри) = Х0и2— ри. Если λο=0, то из а) р=0 и из б) ρ=λ=0 — все множителя Лагранжа оказались нулями. Полагаем λο=1. Тогда из а) р=* = 1 и из б) ρ = ί—4. Из условия в) следует, что ~ isignp, |р/2|>1; ^ (— 1, 0<ί<2; U Ь/2, |р/2|<1,~* 1(ί-4)/2, 2<ί<4. Из начального условия находим непрерывную функцию *(/)==(<»/4—2i+lf 0</<2; 2<*<4. Докажем с помощью непосредственной проверки, что х(-)^ eabsmin. Возьмем функцию /i(-)e/CCl([0, 4]), такую, чтобы λ:(·)+/ι(·) была допустимой в задаче. Для этого надо взять функцию h(-), для которой \х+Я\<19 /ι(0)=0. Интегрируя по частям с использованием того, что x(t) = [t—4)/2 при 2<:ί<4, получим 4 4 о б 101
4 4 4 4 4 = \2xhdt+\hdt+\h*dt^2 [xdh+[hdt = 0 0 0 6 0 4 4 2 ^2x(t)h(t)\ + §(—2x+\)hdt=l\hdt>0i об 5 ибо /ι(0>0 при te[0, 2], так как ft(0)=0, и Л(/)>0 при /^ е[0, 2]. Итак, *eabsmin. Пример 2 (простейшая задача о быстродействии). Пусть имеется тележка, движущаяся прямолинейно без трения по горизонтальным рельсам. Тележка управляется внешней силой, которую можно изменять в.заданных пределах. Требуется остановить тележку в определенном месте за кратчайшее время. Обозначим текущую координату тележки x(t), ее, начальная координата Λ:(0)=ξι> а начальная скорость *(0)=ξ2> Пусть для простоты массы тележки т=1. Тогда по закону Ньютона х=и. Ограничение на тягу зададим в виде ие[-1, 1]. Необходимо остановить тележку (i(7)=0) в начале координат (х(Г)=0). Получаем следующую формализацию задачи: Γ-Mnf; |£|<1, χ(0)=ξι, *(0)=ξ2, χ(Τ)=χ(Τ)=0. Решение. Приведем задачу к виду задач оптимального управления п. 6.1.1, сделав замену переменных Х\=х, х2=х и вводя управление и=х: Γ-πηί; χι=χ2, х2=", «e[-lf 1], *ι(0)=ξι, *2(0)=ξ2, Χι(Τ)-χ*(Τ)=0. Функция Л^гранжа: τ ^ = ί(Ρΐ(^1-^) + Ρ2(^-"))^ + λ0^ + λ1(Χ1(0)-|1) + + λ2Κ(0)-ξ2) + λ3χ1(Τ) + λΛ(Γ). Необходимые условия. а) Уравнения Эйлера для лагранжиана L=pi(ii— x2) + +р2(х2-и): _4^. + Ц = °> ' = 1· 2~Pi = °> A = -ft=>Pi(0 = « + Cr at ι * б) Трансверсальность по χ для терминанта 1=λοΤ+ +Kl(xi(0)-h)+^{x2(0)-h)+^i(T)+KAx2(T): Ρι(0)=λι, Ρ2(0)=λ2( Ρι(Γ)=-λ3, pt(T)--U №
в) Оптимальность по и (не зависящие от и слагаемые не выписываем) min {—рв(/)и}=— М*) и (ί) ■* и (0 = sign ft (0 тфпф2(ЦфО. г) Стационарность по Т: 27Γ=0«λ0+λ8*ι(7,)+λ4*2(7,)β0. Учитывая, что ίι(Γ)-0, λ4—р2(7,).Л(Пй(7,)-|р2(Г)|| . получаем 2ν=0<=>λοΗΡ2(Ό |. Если λ0=0, то из г) следует, что р2(Т)=0. При этом р2 не может быть тождественным нулем, ибо иначе все множители Лагранжа были бы нулями. Значит, из a) p2(t)=C(t—T)f a т°гда из в) следует, что й(/)===1 или й(/)= — 1. Множество начальных условий, соответствующих таким управлениям, описывается уравнением (й(0 = 1=^х2(0=<-^ *ι(0 = ('-Ό2/2=»|22/2=|,; случай 0-г = — 1 аналогичен). Если же Ь^чЧЫ, то λ0=^0, и полагаем λο=1. Тогда из г) вытекает, что |р2(^)|=1, т. е. имеются две возможности: pt(t) = C{t-T)+\, pj{t) = C(t-T)-l. Этим возможностям в силу в) соответствуют такие управления: И+(И 1, т<«7, "~(И-1, т<«Г. Рассмотрим траектории, соответствующие оптимальным управлениям и+ и и- на плоскости (хи *2), называемой фазовой плоскостью (рис.3). Для тех значений /, для которых й(/)=1, имеем x2=l^xi=X2=t+C'^xl=t2/2+C't+C"=x22l2+C. Таким образом, фазовая траектория, соответствующая этим значениям t9 является куском параболы Х\=Х22/2+С. Направление движения по такой параболе определяется из условия возрастания х2у так как в этом случае #2=1. Аналогично получаем, что для тех значений /, для которых ώ(<)=■—1, фазовая траектория — кусок параболы Х\=—х22/2+С, а направление движения определяется из условия убывания Хг, так как Укажем теперь то место на фазовой плоскости (хи х2)> 103
где должно совершаться переключение управления. В искомую точку (0, 0) (х\(Т)=Х2(Т)=0) мы должны попасть не более чем с одним переключением, двигаясь по фазовой траектории по разрешенному направлению. Совокупность начальных условий, соответствующих управлениям и+(-) и гг*(·), описывается неравенствами |2>φ(1ι) для "+(·)) и |2«Р(Ы (Для «-(.)) (рис. 3). Переключения совершаются на кривой ξ2=φ(ξι)· При этом, как нетрудно видеть, для каждого начального условия имеется единственная фазовая кривая, приводящая в точку (0, 0). на оптимальной траектории, то Рис, 3 Поскольку всегда |*21=1 x2=\t\+C и, значит, время движения У==Уаглг2. Покажем, что оптимальная траектория, начинающаяся в точке (ξι, ξ2)> доставляет решение задаче. Пусть этой траектории соответствуют управление й(-) (для определенности «-(·)), функция £(·) и время Т. Предположим, что 'имеется некоторый другой управляемый процесс (*(·)> и(')> Ό у 7<ί. Доопределим функцию *(··) нулем на отрезке [Г, Т]. В силу условий на левом конце функции х(-) и х(·) в точке τ можно представить в виде т. о Поскольку i(s) = l>*(s) Vse[0, τ), то τ χ(τ)— χ(τ)=[(τ—s)(l— *(s))ds>0, δ причем равенство здесь возможно только, если во всех точках непрерывности x(is)ssl, а тогда x(t)=x(t) V/e[0, τ]. Аналогично с учетом условий на правом конце можно представить функцию £(·) »и #(·) в точке τ в виде τ д;(т) = ] (s—x)x(s)ds. χ Так как x(s)^-l=£{s) V<s<=(x, f), то Ϋ х{%)—χ(τ) = 5 (s—τ)( — 1— i(s))ds<0, τ причем и здесь равенство возможно лишь при x(is)= — 1 и x(f)—*(f) V/s[t, Г]. Таким образом, имеем, что х(т)=л;(т) и, следовательно, x(t)=x(t) Vfe=[0, Г]. Отсюда Т=Т. 104
Часть II ДОПОЛНИТЕЛЬНЫЕ ВОПРОСЫ ТЕОРИИ ЭКСТРЕМАЛЬНЫХ ЗАДАЧ Введение. В первой части много внимания было уделено обоо нованию идеи Лагранжа о снятии ограничений (т. е. о необходимых условиях экстремума в достаточно общей форме) для разных классов задач на максимум и минимум. Мы старались построить свое изложение так, чтобы содержание первой части было доступно возможно более широкой читательской аудитории. Именно поэтому там использовались в основном средства классического анализа и конечномерной геометрии. Но надо иметь в виду, что принцип Лагранжа имеет много большую сферу применимости. Для того чтобы вскрыть причины этой универсальности, а также понять основания других разделов теории (достаточных условий, теорем существования и т. п.), естественно воспользоваться языком бесконечномерного анализа. Коротко можно сказать так: аппарат теории экстремальных задач — дифференциальное исчисление и выпуклый анализ в бесконечномерных пространствах. Эти разделы базируются на нескольких фундаментальных фактах функционального анализа. Нам хотелось бы в этой части книги ввести читателя в проблематику теории экстремальных задач. Она рассчитана на более подготовленную аудиторию — студентов университетов, аспирантов вузов с хорошей математической подготовкой, математиков-прикладников, соприкасающихся с теорией оптимального управления и, конечно, на наших коллег, преподавателей курсов оптимизации в вузах и университетах. Для того чтобы читатель имел возможность отобрать необходимый ему материал, не прорабатывая книгу целиком, мы обычно доказательства основных результатов второй части предваряем указанием тех основополагающих фактов, на которых базируется данная теорема. Для облегчения работы с книгой предлагаем схему взаимодействия теорем при построении материала второй части. Сокращенные обозначения: ДИ — дифференциальное исчисление, ФА — функциональный анализ, ДУ — дифференциальные уравнения, ТК — теоремы о компактности, ТХ — теорема Хелли, ТЛ — теорема Ляпунова, НФ — теорема о неявной функции, СИ — субдифференциальное исчисление, ТД — теоремы двойственности, ТО — теорема об очистке, ГЗ — гладкие задачи, ВЗ — выпуклые задачи, ЛП — линейное программирование, ЛЗ — ляпуновские задачи, ЛЗОУ — лийейные задачи оптимального управления, ВИ — вариационное исчисление, ОУ — оптимальное управление, 105
ДУ — достаточные условия, ТС — теоремы существования. В скобках указано место в книге, где изложен соответствующий материал. Рви 1 i 1 гз \2,9 1 \ \ 1 нф \8 ; I д« ! 1 Чб | 09 I ЛП 1 1 ъ·111 1 ли ι 1 \1 I 1 ду I Ή I tl \ \ вз t>"l 1 си 1 I I1-81 ^ t, 1 ФА 1 1 m I I тл Ι Ά8 У I тс I ы t i I лзоу 1Л" 1 - ι 1 "3 h« ι I TK I тл I : 47 I 1 T° 1 1 ^8 1 i Ι τχ J 1 \i 1 §7. НЕКОТОРЫЕ ОБЩИЕ ТЕОРЕМЫ ФУНКЦИОНАЛЬНОГО АНАЛИЗА И ИХ СЛЕДСТВИЯ 7.1. Теорема Хана—Банаха, отделимость, теорема Банаха об открытости Теорема Хана — Банаха. Пусть X — линейное пространство, Х0 — линейное подпространство Χ, ρ(·) — сублинейная функция на X (т. е. p(-)^SL(X))y x0' — линейный функционал на Х0у мажорируемый функцией /?(·) (т. е. <*(/, хУ<ср{х) Va:^AO). Тогда существует линейный функционал на X (т. е. х'^Х')у такой, что <*', х)^р(х) Yx^X и (х'> *>=<*<Л х) УлгеХ0. <\ 0. Доказательство опирается на лемму Цорна. Напомним, как формулируется эта лемма. Пусть (Λί, <) частично упорядоченное множество. Всякое его подмножество Л, в котором любые два элемента сравнимы между собою (в смысле упорядоченности, введенной в Λί), называем цепью. Элемент а^М назовем верхней гранбю подмножества М'аМ, если а'<.а Va'eAi'. Элемент deAf назовем максимальным* если из ό<α, α^Μ следует, что а=й. 106
Лемма Цорна. Если всякая цепь в частично упорядоченном множестве имеет верхнюю грань, то в этом множестве имеется максимальный элемент [КФ, с. 40]. <\ 1. Если Хо=Х, то все доказано. Пусть Хо¥=Х и ξ^Ζ\ \Х0. Обозначим Xi=Vm{X0y ξ}={χ|я=л;отК|, ШЩ. Если хи х2е ^Хо, то имеем (а) по условию, б) по определению р(-)е <=SL{X)): а) б) В силу (1) получаем a: = sup «*;, x1)^p(x1-^y^t inf (ρ(χ2 + 1)-(χ'0, *2» = :β. (2) В силу неравенств (2) найдем γ между α и β: α<:γ<β. (3) Положим для х^Х\, х= :χ0+ίζ(χ0&Χο9 t^R): w (хи х) = (хи х0 + Ъ) = :(хо9 x0) + ty. (4) Ясно, что x/el/. Если ί>0, то » (4) , О) (*Ь *о+ '£>='«*<>, Xo/t) + y)<H(xo9 x0/t) + + p(Xo/t + l)-(xl Xo/t))=P[Xo + ®. (5) Аналогично при f<0 доказываем, что (хх\ Xo+tl}<p(Xo+t%).. Таким образом, функционал Xq продолжен «на одно измерение» до функционала Х\. 3. Пусть А — совокупность всех пар (#\ £')> гДе & — линейное подпространство, содержащее Хо, а ξ' — линейный функционал на #\ продолжающий д:о/(ф=><^> *>=<*ο', *> V*e ^Хо) и мажорируемый р(х) (^(ξ', χ)^.ρ(χ) Ух^З?). Положим (ξ', #>=oo, если х& &. Введем в А естественное упорядочение (Хи 1х')>(ХъУ)9 если #2cz*i и'Ьк, = Й. Если {(#а> ^}ае5г— цепь в Л, то \J3ta = i£t (f, x):=min(^, *). Легко проверяется, что (^, \') — верхняя грань цепи. Значит, по лемме Цорна имеется максимальный элемент в Л— (еЯ?, х'). Из построения п. 2 следует, что &=Χ (иначе пришли бы в противоречие с максимальностью (&9 х)). Противоречие доказывает теорему. [> Приведем два важнейших следствия из доказанной теоремы. Напомним, что если во множестве Τ задана система подмножеств τ, такая, что 0<Ξτ, Γ^τ, объединение любого числа и пересечение конечного числа множеств из τ принадлежит τ, то пара (7\ τ) называется топологическим пространством. 107
Множества из τ называют открытыми; говорят, что система τ задает в Τ ^топологию. Топология декартова произведения топологических пространств задается естественным образом. Совокупность подмножеств β<=τ называется базой окрестностей, если для любого U^x найдется множество ν^β, -такое, что ν<=ίλ Если (Ти χχ) и (Г2, тг) — топологические пространства и F:T{-+-T2 — отображение, то последнее называется непрерывным, если прообраз открытого множества в Т2 открыт в Тх. Линейное пространство X, в котором задана топология, называется линейным топологическим пространством, если обе основные операции в X, а именно — сложение и умножение на число — непрерывны (как отображения из XXX в X и RxX в X соответственно). Линейное топологическое пространство называется локально-выпуклым, если в нем имеется база окрестностей, состоящая из выпуклых множеств. Первая теорема отделимости. Пусть X — линейное топологическое (не обязательно локально выпуклое) пространство, А и В — выпуклые непустые подмножества в X, причем внутренность одного из них, скажем А, непуста (<^>intA¥=0)y и оба множества не пересекаются (<^А{\В=0). Тогда найдется элемент jc*gP, такой, что sup (л:*, *)'<:inf (xm, x). (5') Геометрически соотношение (5) означает, что А находится в одном полупространстве, порождаемом #*, а В — в другом, т. е. Л и β отделяются некоторой гиперплоскостью, порожденной х*. <] 0. Доказательство опирается на следующие факты: 1) теорему Хана — Банаха, 2) простейшие свойства линейных топологических пространств, 3) определение и простейшие свойства функционала Минковского. 1. По условию существует ao^intA и Ь0^В. Обозначим С:=(А—оо) — {В—b0), c0=b0—aQ. Из 0.2 следует, что С<=С0(Х), OeintC, c0e£C. (6) В силу 0.3 функция Минковского множества С (т. е. μΟ(·)) определена на всем Х> сублинейна, и, кроме того, в силу определений и (6) получаем μΟ(Χ)^1 YX(=C, μ(;(£ο)>1. (7) 2. Обозначим Ao=lin{co} и положим для х0^Х0, xQ&ac0 {хо'У ΧοΥ.^αμϋ(Со). Ясно, что <*<ь *><цС(х) Yx<=X0y <*o> с0У^С(с0). (8) 108
По теореме Хана — Банаха существует линейный функционал х'^Х', такой, что *Ίχ.=*;, <*'> *)<VC{X). (9) 4 Б силу того что OeintC и цС(л:)<:1 V*eC (см. (7)), из (9) получаем, что <*', *><:1 V*eC, т. е. функционал х' ограничен, я значит, непрерывен. Итак, jc'=^*eI*. 3. Пусть теперь аеЛ, fteB. Тогда Id (8),(9) <**, а—Ь) = (х\ a—aQ + b0—b) — (x\ cQ) < μΟ (α—α0 + bQ—b)— -|iC(c0;< 1-1=0, т. е. <**, α><:<**, fc> Уае=Л, beB. > Вторая теорема отделимости. Пусть X — ло- кально-выпуклое * линейное топологическое пространство, А — яыпуклое и замкнутое подмножество X, х^А. Тогда найдется -линейный функционал х*^Х*у такой, что sup{<**, *)|*еЛ}<< ■<(**, *>. <] По определению локально-выпуклой топологии и в силу замкнутости А можно найти выпуклую окрестность U точки *, не пересекающуюся с Л. По первой теореме отделимости найдется линейный функционал **, такой, что sup{<**, #>|*s ^A}^ini{{x*9 x)\x^U}<{x*> χ), ибо образ U при отображении *-К**, *> — интервал, содержащий число <**, *>. > Отметим еще Следствие из теоремы Хана — Банаха (лемма Банаха). Пусть X — нормированное пространство и Xq^X. Тогда найдется линейный фущкционал х*^Х*у такой, что .41**11=1 и <**, *о>Н1*о11. < Если *о=0, то можно взять любой функционал **, 11**11 = 1. Если Хо^О, то рассмотрим одномерное подпространство L=lin{*o} и зададим на нем линейный функционал <**, a*o>=all*0ll· Ясно, что (**, *)<||*|| Vx^L. Значит, по теореме Хана — -Банаха найдется линейный функционал *', продолжающий х* и такой, что <*', *>< 11*11 V*. Но отсюда сразу следует ограниченность, а следовательно, непрерывность *', т. е. λιΈΧ*. Обозначим его **. Из неравенства <**, *>« 11*11 и равенства <**> *о>=<**, *о> = 11*11 вытекает, что 11**11=1. > Теорема Банаха об открытости. Пусть X и Υ — -банаховы пространства, Л — линейный непрерывный оператор мз Χ β Υ(<=>Α^3?(Χ> У)), являющийся сюръективныч * Линейное топологическое пространство называется локально-выпуклым "«если в каждую окрестность можно вписать окрестность, являющуюся выпуклым множеством. 109
(<$=*AX=*Y). Тогда образ каждого открытого множества в X открыт в У. <\ 0. Доказательство опирается на теорему Бэра: полное метрическое пространство не может быть представлено как объединение счетного числа нигде не плотных множеств [КФ]- 1. Обозначим: Вг={х\ \\х\\<г} шар радиуса г в X (rGN), Сг замыкание его образа в У: Сг=сШг. Из-за сюръективно- сти А=$ (J Cr = Y. Вследствие банаховости (полноты) У из rfcN 0.1 получаем, что найдутся такие r0^N, ц^У и р>0, что f Cr.=B/(l. Р):={у|||у-л||<р}. (10> Из определений и из (10) следует, что для любого ε>0 и любого у из шара в У радиуса ρ с центром в нуле найдется элемент ξ е ВГо9 такой, что . ||ί/+η-Λξ||<€^ΙΙί/-Λ(ξ-Λ-ΐη)||<ε. (11) При этом ||ξ—Λ-^ηΙΙ^/Ί, где тх — некоторое фиксированное» число. Пусть теперь у ш открытого шара в У с центром в нуле с радиусом р. В силу (11) найдется хи \\х\\\<ги такое, что ||у-ЛА||<р/2. Аналогично найдем лг2, ||λ:2||<:/ί/2, такое, что \\у—Λ(*ι+λ;2) ||<:p/4.. Продолжая наше построение, придем к последовательности;· η {хп}пы<, такой, что \\Xn\\<rr2r<n-1) и \у—Л У^||<ρ·2~".. η Вследствие полноты X суммы l^xk сходятся при п-*>оо к не- которому х. Тогда ясно, что 11*11 < Σ U^IK^i F ^~ik~l) = 2r1<3r1, Ax = lim Λ £** = *· Итак, открытый шар в У с центром в нуле радиуса ρ содержится в образе открытого шара в X с центром в нуле радиуса Згь Отсюда сразу следует, что образ любого открытого- шара в!с центром в нуле содержит некоторый открытый шар в У с центром в нуле и вообще образ любого открытого множества содержит открытое множество. О Из доказанной теоремы очевидным образом вытекает Следствие (теорема Банаха об обратном операторе). Пусть X и У — банаховы пространства, X^SiX, У), AX=Y и КегЛ={0}. Тогда обратный оператор А~1 является непрерывным линейным отображением изуУ в X (<=»Л-"1^^(У, X)). 110
Для того чтобы доказать, что .Л"**1 непрерывен, нужно показать, что прообраз любого открытого множества при этом отображений открыт. Но прообраз множества U при отображении Л""1 — это по определению не что иное, как Λί/, и, значит, если U^O(X), то AU^O(Y), и это доказывает непрерывность Л""1. 7.2. Леммы (о нетривиальности аннулятора, правом обратном, замкнутости образа и аннуляторе ядра сюръективного оператора). Здесь мы докажем четыре леммы, являющиеся простыми следствиями теорем п. 7.1. Они найдут свое применение практически во всех дальнейших параграфах. Лемма 1 (о нетривиальности аннулятора). Пусть X — локально-выпуклое пространство, Х0 — замкнутое подпространство X, не совпадающее с X. Тогда аннулятор Xq1- пространства Х0 содержит ненулевой элемент. <3 По условию существует х^Х\Х0. В соответствии со второй теоремой отделимости найдется элемент х*^Х*, такой, что sup {х\ *)<(**, х). (1) / *ехв Если для некоторого х0 е Х0 {**> *о) Φ 0, то sup {(λ'*, χ) \х е Х0} ^ ^sup{(A:*, tx0) \t gR}= + °°, что противоречит (1). Значит, х* е gXo", а из (1) следует, что х*фО. О Лемма 2 (о правом обратном). Пусть X и Υ — банаховы пространства, Α:Χ-*Υ — линейный непрерывный оператор, являющийся сюръективным. Тогда существуют оператор Μ:Υ-*~ -*Х и число С>0, такие, что ' 1 ΛοΛί=/γ(<=>Л°My=yVу) и \\Му\\<.С\\у\1 о < Обозначим ВХ открытый шар в X радиуса единица о о >(ВХ:={х\\\х\\<1}). Ясно, что ВХ — открытое множество в X. о о По теореме Банаха об открытости АВХ содержит шар 6ВУ: = -{y*=Y\\\y\\<6}t т. е. Yy^6BY, найдется х(у):\\х(у) ||<1 и -Лх(у) = у. Обозначим Му:= χ(—— ) "с . Тогда из опреде- \2||у||/ δ ления Μ получаем ЛоЛ!у = ^.!Ш=у, \\Му\\<±\\у\]. > 2 Π г/Η δ , δ Замечание. Построенное отображение М, вообще говоря, разрывно. Можно, однако, добиться того, чтобы это отображение было непрерывным. Эта конструкция базируется на следующем* результате. Ш
Теорема Майкла о непрерывной селекции. Пусть Τ — метрическое пространство, X — банахово пространство, F — непрерывное многозначное отображение, сопоставляющее элементу t^T непустое выпуклое замкнутое множество F(t)czX. Тогда существует непрерывное отображение f(.):T-+X, такое, что f(t)e=F{t)Vt<==T', (Holmes R. В. Geometric funciona! analisis and applications. N. Y. Springer, 1975). Теперь для того, чтобы правое обратное отображение оказалось непрерывным, надо, выбрав λ>1, применить теорему Майкла к многозначному отображению F(У) -Л-'уПВ (0, λ·inf {||х|| | Ах=у}), где А~1у — прообраз у. (Из теоремы Банаха сразу следует,, что F непрерывно.) Подробности см. там же (s. 184, 185). Данный факт называем далее леммой о непрерывном правом обратном. Лемма 3 (о замкнутости образа). Пусть Χ, Υ и Ζ — банаховы пространства, А и В — линейные непрерывные операторы из X соответственно в Υ и Ζ, причем АХ — замкнутое подпространство в Υ, а В Кег А — замкнутое подпространство & Ζ. Тогда образ X при отображении х-*(Ах, Вх) замкнут ег ΥΧΖ. <\ Обозначим АХ через Υ\. Это замкнутое (по условию) подпространство банахова пространства У и, следовательно,само банахово пространство. По определению ΑΧ=Υ\. Значит,, по лемме о правом обратном (лемма 2) существует оператор Μ:Υ\->Χ9 такой, что АоМу=у, ||Л1у||<С1Ш1 YyeYx. (2) Пусть (у, ζ) принадлежат замыканию (АХ, ВХ), т. е. существует последовательность {Xn},neN, такая, что у= lim Ахпг z= VimBXn- Обозначим М(Ахп—у) через |я. Тогда Id (2) (2) А(хп-1п) = А{хп-М(Ахп-у)) = у, Ш\<>С\\Ахп-у\\-+0. (3> Значит, βξ^Ο, (4) откуда в силу (3) UmB{xn—ln) = \imBxn = z<=*z&clE9 Е = {1 = Вх\Ах = у). Но Ξ — сдвиг образа ядра А при отображении В {х\Ах=у}= =ВКег А+ц, η^Ξ, следовательно, Ξ замкнуто, т. е. (из определений) для гес1Б==Н существует х^Х:Ах=у, Bx=z. t> 112
Лемма 4 (об аннуляторе ядра сюръективного оператора)^ Пусть X и У — банаховы пространства, А — линейный непрерывный сюръективный оператор, отображающий X на У. Тогда аннулятор ядра — образ Л*: (Кег Л)± = 1тЛ*. def < 1. Пусть **<=Im A*=$x* = A*y*. Тогда Ух<=КегЛ {х\ х) = (А*у\ х) = {у\ Ах) =0^lmA* с: (Кет A)L. ,2. Пусть лг*е(КегЛ)±»Лл:=0=^<л:*, #>=0. Применим лемму о замкнутости образа (лемма 3) к X, У, Z=R, Л и Вх= =<**, х). По лемме 3 (ЛХ, <**, X»G=Cl(yxR) (ибо 1тЛ=У, β КегЛ=={0}еС1(К)).^ Замкнутое подпространство ' (ЛХ,. <х*, Χ}) не содержит точку (0, 1) (ибо Аг=0 =*-<**, л:>=0^1). Тогда по лемме о нетривиальности аннулятора имеется нетривиальный элемент аннулятора пространства (АХ, <#*, Х})^ т. е. найдется (у*, λο), у*еУ*, λ0^Κ, такая, что К(*\ *) + (у\ Лх)=0У^ |λ0| + ||ί/*!1^0« «(Я0х* + Л*у*, x)=0Vx. (5> Но λ0^0 (ибо иначе <*/*, Лх>=0 Υχε=Χ^ (ЛХ=У)у* = 0 - противоречие). Тогда из (5) #*=Л*(—у*/Х0). \> 7.3. Теоремы Ляпунова и Хелли. Важные факты из теория экстремальных задач — наличие выпуклой структуры в задачах оптимального управления, линейных по фазовым перемен· ным, и теорема об очистке — базируются на двух фундаментальных теоремах, к формулировке которых мы переходим. Для формулировки теоремы Ляпунова необходимо напомнить несколько фактов, относящихся к теории меры. Пусть Τ — множество, Σ — σ-алгебра его подмножеств. Пара (Г, Σ) называется измеримым пространством, σ-аддитив- ная вещественная функция на Σ — мерой, а тройка (Τ, Σ, μ) — пространством с мерой. Если (Τ, Σ, μ) — пространство с мерой, то Τ допускает разложение T=T+\JT~, Г+, Γ_<=Σ, причем μ+(Α):=μ(Α(]Τ+)>09 ΥΑ(=ξΣ, μ-(Α) :=μ(Α[\Τ-)^0, ΥΑζξΣ. Функции μ+ и μ_ — меры, мерой является и функция | μ |: = =μ+—μ-. Она называется полной вариацией μ. Мера μ называется непрерывной, если "νΤί^Σ, для которого | μ | (Л) >0Г найдется Α'^Σ, такое, что 0< |μ| (Л')< |μ| (Л). Набор μ== = (μι, ..., μη) из η мер на измеримом пространстве (Τ, Σ) называется векторной мерой, а подмножество Rn={x^Rn\x= ==^(Л), Л^Σ} — образом векторной меры μ. Векторная мера μ называется конечной, если |μ| (Γ)<οο, i<t<n. Теорема Ляпунова. Образ непрерывной конечной векторной меры, определенной на измеримом пространстве» есть выпуклый компакт. Доказательство этой теоремы требует серьезной подготовки в теории меры и функциональном анализе: теоремы Банаха — 11»
.Алаоглу, разложения Жордана, теоремы Радона — Никодима, -теоремы Крейна — Мильмана и описания пространства, сопряженного к Lu Здесь его не приводим [АТФ, с. 351; 11, <:. 350]. Теорема Хелли. Пусть Л = {Д^аеи— семейство замкнутых, выпуклых множеств в R", из которых одно компактно. При этом пусть любое подсемейство, состоящее из <.п+\ мяо- жесте, имеет- непустое пересечение. Тогда пересечение всех множеств семейства s& непусто. Доказательство этой теоремы вполне элементарно и просто (см., например: Данцер Л., Грюнбаум Б., Кли В. Теорема Хелли и ее применения. М.: Мир, 1968, 159 с). §8. ВЫПУКЛЫЙ АНАЛИЗ В ЛИНЕЙНЫХ ПРОСТРАНСТВАХ ЪЛ. Двойственные соотношения в выпуклом анализе. Мы уже подчеркивали в п. 1.5, что, один из важнейших тезисов выпуклого анализа состоит в том, что любой · выпуклый объект (множество, функция или экстремальная задача) допускает двоякое описание — в основном и двойственном пространстве. Для того чтобы этот тезис получил свое точное выражение, необходимо разъяснить сначала вопрос о том, что такое двойственное пространство. 8.1.1. Пространства в двойственности. Пусть X и Υ — линейные пространства и B:XxY-+R — билинейная форма, определенная на их декартовом произведении. Говорят, что форма В приводит X и У в двойственность, если для любого х¥*0, х^Х, найдется элемент z/eF, такой, что В(х, у)=^0, и, наоборот, для любого η^Ο, t\^Y, существует элемент ξ^Ζ, такой, что В (ξ, η) ¥=0. Приведем два важнейших примера. η 1. Пусть J=Y=R*, B(x, y) = (x, y) = Y*XiHi— стандарт- лая билинейная форма на R"XRrt. Эта стандартная форма переводит X: = Rn в двойственность с Y: = Rn. 2. Пусть X — нормированное пространство, У:=Х* — сопряженное к X, В(х, я*) :=<.*:*, х} — действие линейного функционала ^*eZ* на элемент хеХ Эта билинейная форма (ее иногда называют канонической) приводит X и X* в двойственность. Действительно, то, что для х*Ф0, Jt*eX*, найдется х^Х> для которого <jc*, #>¥=0, следует просто из определения ненулевого линейного функционала. А то, что для каждого х^Ог х^Х, найдется х*^Х*, для которого <#*, х}Ф0, вытекает из леммы Банаха (см. п. 7.1). 114
В дальнейшем билинейную форму, приводящую X в двойственность с У, также обозначаем <·, ·>, а тот факт, что X находится в двойственности с У обозначаем так: X*-d-+Y. Двойственность порождает топологии в каждом из пространств X и У. Топология в X, обозначаемая о(Х, У), определяется базой окрестности нуля, состоящей из полупространств- П+({/, V) = {xeeX\(x, 0><β), β>0. Это слабейшая из топологий, при которой функции х-+{х, уУ непрерывны. Аналогично определяется топология о(У, X). Ее база окрестностей порождается полупространствами П+(х, t) = {yeY\(x, ί,χρ), β>0. Топологии с{Х, Y){o{Yf X)) превращают Χ(Υ) в локально- выпуклые пространства. В первом из рассмотренных нами примеров (R^-i-d-^R") o(R", R") — привычная топология в R" (когда открытое множество характеризуется тем, что для любой его точки существует открытый евклидов шар с центром в этой точке, целиком лежащий в множестве). Во втором примере, когда X^d-+X* (X — нормированное пространство, X* — сопряженное к нему и двойственность осуществляется при помощи каноническое формы), топологию с(Х, Χ*) называют слабой, а σ(Χ*, Χ) -— слабой * топологией. Топология τ на X называется согласованной с двойственностью, если пространство, сопряженное с {Χ, τ), совпадает с У. Топология о(Х, У) — слабейшая из согласованных с двойственностью. Сильная топология нормированного пространства также, очевидно, согласована с двойственностью, описанной в- примере 2. • 8.1.2. Операторы выпуклого анализа. Опишем двойственные операторы (в п. 1.5 мы уже проделали это в конечномерном случае). Пусть Х<-ч/-*У. Преобразованием Лежандра — Юнга — Фенхеля функции: f: X->R (или функцией, сопряженной с f) называется функция на У, определяемая равенством /·(»): =sup«*f у)—f{*))· X Для сопряженной функции используем и другое (операторное) обозначение: //. Если g:Y-*R, то lg(x):= sup((x9 y)—g(y)). у Функция /■/(*):■= /<//)(*):=* sup «*, У)-{If)(У)) V 115
называется второй сопряженной к f. Из определения сопряженной функции следует неравенство Юнга '<x,y)<f(x) + W)(y). Полярой множества АаХ, А=£09 называется следующее ^множество в У: Л° = {у<=У|<х, у><:1 YxzeA). Аналогично определяется поляра множества, расположенного в У. Для поляры А используем другое (операторное) обозначение пА. Множество п{пА) называется биполярой А. Сопряженным к конусу KczX называется конус /С*={уе=У|<х, у>>0 ΥχεξΚ}. Аналогично определяется конус, сопряженный к конусу Lcz <zYy и второй сопряженный конус к К. Легко понять, что /С*— Субдифференциалом сублинейной (<=> выпуклой, однородной первой степени) функции ρ на X (<&p^SL(X)) называется множество в У: др:={у<=У\(х, у><:р(х) Yx€=X}. Субдифференциалом выпуклой функции f:X-+R в точке χ называется следующее множество в У: df(£):={y€=Y\(x-*fy)<f(x)-f{*)Vx). Пусть А — подмножество в X. Важную роль в выпуклом анализе играют следующие три функции: — опорная функция sA(y)=sup«x, y}\xE=A}t — функция Минковского μΑ(χ) :=ini{a\arlx^A} (inf0:=oo), — индикаторная функция [ О, х<=А; δΑ(χ) = \ ' I оо, х£А. Все эти определения в конечномерном случае были приведены в п. 1.5. Там же были приведены разнообразные примеры. 8.1.3. Теоремы двойственности и компактности. В п. 1.5.3 мы в конечномерном случае сформулировали теоремы двойственности и компактности и сказали, что во второй части эти теоремы будут сформулированы и доказаны в бесконечномерном случае. В этом параграфе приведем формулировки теорем, в следующем — доказательства. 116
Формулировки теорем фактически остаются без изменений з(см. п. 1.5.3). Общая бесконечномерная ситуация, при которой верны теоремы двойственности и компактности, такова: X и У — пространства в двойственности и в X имеется топология τ, согласованная с двойственностью. Но мы несколько упростим себе задачу, рассмотрев равносильный случай, когда X — локально-выпуклое пространство, находящееся в двойственности со .своим сопряженным. Итак, Теорема двойственности. Пусть X — локально-выпуклое пространство. а) Функция f:X-+R' совпадает со своей второй сопряженной тогда и только тогда, когда она выпукла и замкнута. б) Непустое множество АаХ совпадает со своей биполя- рой тогда и только тогда, когда оно выпукло, замкнуто и содержит нуль. в) Конус КаХ совпадает со своим вторым сопряженным тогда и только тогда, когда он является выпуклым и замкнутым. г) Сублинейная функция с непустым субдифференциалом обладает тем свойством, что sdp=p тогда и только тогда, когда ρ замкнута. д) Непустое подмножество АаХ совпадает со множеством >dsA тогда и только тогда, когда А выпукло и замкнуто. Напомним, что а) называют теоремой Фенхеля—Моро, б) теоремой о биполяре. Теорема о компактности. Пусть X — локально-выпуклое пространство. а) Поляра открытой окрестности нуля в X компактна (в слабой* топологии X*). б) Субдифференциал непрерывной сублинейщй функции X компактен (в слабой* топологии X*). Видим, что формулировки в п. 1.5 и здесь почти тождественны, только R" заменилось на любое локально-выпуклое лилейное топологическое пространство. ' 8.1.4. Доказательства теорем двойственности и компакт- юности. Сначала докажем теорему Фенхеля — Моро. <] 0. Центральное место доказательства — вторая теоре* ша отделимости (п. 7.1). 1. Необходимость. Пусть /2/=f. Тогда def /(*) = sup((**, *>-//(*·)) = :supa(*; x\ If (χ·)), χ* χ* тде аффинная функция α(·; χ*, β) определяется равенством <l{x, χ*, β)=<#*, jc>—β. Функция α(·; χ*, If (χ*)) замкнута, а ^адграфик верхней грани семейства выпуклых замкнутых фун- 117
кций есть надграфик, являющийся замкнутым выпуклым множеством. Итак, / — выпуклая и замкнутая функция. 2. Достаточность. Пусть f — выпуклая и замкнутая функция. Если f=oo, то по определению l2f=f. Если /^оо, то domf¥=0 и epi/ есть непустое выпуклое замкнутое множества· в ZXR, не совпадающее с XXR. Вследствие неравенства Юн- ' def га ((л:*, x)<f(x)+lf(x*)) получаем, что sup((A:*, x)—lf (x*)) = = l2f<f (*), т. е. epi l2f zd epi /. Допустим, что существует точка x0edom/2/, где /2/(#о)< <f{Xo). Пусть, кроме того, ϊ-edom/. Точка (ξ, /(ξ) — 1) не принадлежит epi/, и, следовательно, по второй теореме отделимости ее можно строго отделить от epi/ ненулевым линейным функционалом. Это значит, что найдутся х*^Х* и yeR, такие, что Υ(/(ξ)-1)+<*\ 6>>sup{Tpa+.<*\ x)\(x, a)<=epi/}. (1> Ясно, что неравенство γ>0 невозможно, иначе справа получилась бы +оо, что противоречит (1). Допущение γ=0 также невозможно, ибо иначе вышло бы, что < х*9 ξ>><#*, |>. Значит, γ<0, и тогда, поделив обе части неравенства (1) на |γ| и положив г\*=х*/\у\9 получим, что If(ц*)<оо<=*аотtfΦ Отделим теперь точку (хо, 12ϊ(χο)) от epi/ — снова по второй теореме отделимости. Это значит, что найдутся число β и х0*^Х*9 такие, что β/2/(^ο)+<^ *o>>sup{pa+<*;, x)\xe=domf, a>/(*)}. (2> Снова β не может быть положительным числом, ибо иначе верхняя грань справа равнялась бы +оо. Случай β=0 также? невозможен, ибо иначе lfW + txl):= sup{(n* + ^0, *)-/(x)|xe=dom/}< ^supU*)*, χ)—f(x)\x^dom f} + t sup {(x*0, x) \x^ dom/} = = If Ю + tsup{{x*Q, x)\x<=domf}. Значит, l2f(*o)>W + txl Xo)-lfW + tx*0)>(r\\ x0)-lfW + + '((^o» *o)~suP{(*o> ^>|^edom/})->oo при t-+oo в силу (2) (при β=0). Таким образом, x0^doml2f вопреки до- лущению. Итак, β<0. Поделив обе части неравенства (2) на |β| и положив **=|βΙ"1**, получим ~ def (х*> x0)—lf(Xo)>sup{(x*> x0)—a\XE=domf9 a>/(χ)} = //(*), 118
т. е: <**, Xo>>lf(x)+l2f(*o) в противоречии с неравенством Юнга. > Докажем все остальные формулы в теореме двойственности. <! Доказательство теоремы о биполяре основано на следующих формулах, вытекающих из определений: (i) 16A = sA, (и) /μ = δπΛ, (Hi) 0&Α=$μηΑ = 8Α. Необходимость в б) очевидна. Достаточность. Пусть А выпукло, замкнуто и содержит нуль. Тогда δπΜ Ш ΐμηΑ Ш tsA Ж1ЧА lM^«M = A Формула в) сразу следует из теоремы о биполяре, ибо Необходимость в формулах г) и д) следует из определений. Пусть ρ — выпуклая и замкнутая сублинейная функция. Тогда, учитывая очевидное соотношение (IV) 1р=бдр и соотношение а), получим Докажем достаточность в г). Пусть А — выпуклое и замкнутое множество. Тогда δΑ^ РЬАШ (1ЬА)®*1*АШшА^ A = dsA. Теорема двойственности полностью доказана. > Переходим ко второй теореме — о компактности. Докажем вторую часть (теорему о компактности субдифференциала). Первая доказывается аналогично. < 0. Доказательство опирается на теоремы Тихонова* и Фенхеля — Моро. 1. Пусть ρ — непрерывная сублинейная функция. Воспользовавшись соотношением (IV) (1р=6др), которое участвовало в доказательстве предыдущей теоремы, убеждаемся в том, что др — непустое выпуклое множество. Обозначим 8ί = f] [—р(—х)9 р(х)] (прямое произведение отрезков хех ί—Р(—х), Р(х)] по всем Ьс^Х) с тихоновской топологией. По теореме Тихонова 91—компакт; Пусть х*<=др. Положим φ**:Χ->3ί, *fx*{x): = (х*9 х). Из определения субдифференциала ((**, х) <! ^р(х) Ух) следует, что <рх* (·) е 31. Обозначим 4{φλ* (· )}х* € &_ через 95. Если х\фх2, то по определению существует я: {х\>х)ф Φ(χΙ,χ)9τ. е. φ *(-)¥=ф *()· Следовательно, отображение др в 35, осуществляемое с помощью {ф**(-)}**едр (очевидным образом непрерывное), взаимно однозначно. * См., например: Данфорд Н., Шварц Дж. Т. Линейные операторы. М.; Л., 1962. С. 45. 119
2. Докажем замкнутость 35 в 9ί. Пусть /(·) принадлежит замыканию 93 в Si. По определению это означает, что для любой окрестности V точки f{·) в Ж существует x* — x*(V), такое, что Ф,*(-)бУ. Пусть У:=^ЛЛ+х,(в) = {^(-)е*| |/(*,)-f(*,)| <ε, /=1,2, l/(*i + *»)-f(*i + *2)l<e}· (1> Тогда в силу сказанного выше существует x*(V), такое, что \(x*(V),Xi)-HXi)\<ey i = l" 2, I (x*(V)9 xl + x2)—T{Xx + xz)\<z> откуда в силу произвольности ε получаем, что Τ(Χχ + χ2)=ί(Χί) + + f(x2Wxvx2 е ^· Аналогично покажем, что J (ах) = af(x) Υ χ е Χ, aeR. В силу того что Р(х)^[—р(—х), р(х)]У получаем, что ^—непрерывный функционал. Значит, f(x) = (x*y χ). Таким образом, SS — компакт (как замкнутое подмножество компакта %). Он является образом др при непрерывном взаимно однозначном отображении. Значит и др — компакт. > 8.2. Теорема об очистке В п. 1.5.4 рассказывалось о выпуклом исчислении. Две основные формулы — Моро—Рокафеллара и- Дубовицкого—Милютина — были доказаны в конечномерном случае. Из доказательств легко усмотреть, что они полностью сохраняются ю в бесконечномерном случае. В этом пункте докажем теорему об очистке, обобщающую» результат Дубовицкого — Милютина. В п. 1.5.4 мы сформулировали теорему об очистке для субдифференциалов. Этот факт сразу следует из следующего результата, которому, собственно, и следует придать название Теорема об очистке. Пусть Τ — компакт, f:TxRn->- -*R — функция, обладающая следующими свойствами- а) f(t, ·) выпукла и непрерывна на R« для любого t^Tr б) f(-9 χ) полунепрерывна сверху для любого χ из R", в) inf max/(i, x) = :M> — оо. Тогда существуют reN, r^n+lr xeRn tST и набор точек {τι, ..., tr}, тге7\ таких, что Λ1 = inf max f(xh x). Таким образом, компакт Τ можно «очистить» до г точек,. г<я+1, минимакс по всему семейству {f(t, -)W окажется равным минимаксу лишь семейства {/(τ*, ·)}ί=,ρ состоящего и» конечного числа функций. <1 0. Доказательство основывается на теореме Хелли (см* п. 7.3). 120
1. Обозначим τ=(τι, ..., τ*+ι) элемент произведения Tn+lf ,#η(τ): = ίηί max f(xi9x) и, наконец, m:=sup{m(x) |te Из определений сразу следует, что m<M. Пусть б>0. Для /еГ положим i46(/)={A'^Rn|f(i, x)<:m+6). В силу того, что inf f(t>x) = m(t1tt ... ,ί)^m + δ, существует χ=χ(t), такое, что f(ty x)<£tn+6, т. е. Α6(ί)Φ0. В силу того что f(t, ·) выпукла и непрерывна, Ab(t) — выпуклое, замкнутое множество в 2. Пусть ξ=(ξ,, ..., ^)<ξξΓλ и *{ξ) таково, что f(|t·, x(g))< <т+б (из определения т вытекает, что такое χ (ξ) существует). Обозначим V(|) подмножество в Г", состоящее из точек ξ'=(ξι', ...» ξ«')€=7\ для которых /(ξ/, χ(ξ))</η+δ. Из условия о полунепрерывности сверху получаем, что У (ξ) — окрестность точки | в 74 Из определения компактности найдутся {I1» ··> £*}i такие, что {V(i')}li==l— открытое покрытие Тп. Положим А: =со{х(?),...,х\1% U: = {A6(t)}t£T[}A. Проверим, что семейство 91 обладает свойством Хелли (см.\ п. 7.3). а) Пусть задано п+\ множество A6(t\)9 ..., A6(tn+\) (без Л). Тогда из определений пг{1) и m (где t=(tu ..., irt+1)) получаем, что существует x(t), такое, что f(ti, χ(ϊ))<ηι(ϊ)+δ<£ ^m+6, т. е. *(7)<s р'лб(^). б) Пусть заданы η множеств A6(r\t), ... , Аб(г\п) и Л. Тогда (как -и в случае а)) имеется х(г\) (η = (ηχ,... ,η„), такое, что f(r\h лг(т)))<; <Ι/η + δ. Из построения системы {ξ-} {β1 'найдется ξ'α, такое, что ЧеУ(Б'§), т. е. /(тп,*(Г°))<"1+б, т. е. х(Г) е Лб(Ъ), т. е. χ (Г) е Π А* Ш П ^ иб° * ^°)е со Iх (?)· * * · ■ * (?» = : Х Итак' £=1 любое семейство из п+\ множества имеет непустое пересечение и А ограничено. По теореме Хелли существует*(б)е Г№в(0» т. е. Λί^/η + δ ив силу произвольности б получаем т^ <Ai<m, т. е. т=М. Из компактности Г, полунепрерывности /(·, х) вытекает, что существуют {%и ..., τΓ}, такие, что т = inf max /(τ,, x)9 что и требовалось. *GX 1<£<г Теперь для получения теоремы об очистке для субдифференциалов остается применить формулу Дубовицкого—Милютина к семейству {f(xt, х)}^· Все доказано. О 121
§9. НЕОБХОДИМЫЕ УСЛОВИЯ ЭКСТРЕМУМА Во введении и первой части книги было рассказано, что для многих задач оптимизации необходимые условия экстремума подчинены единому общему принципу, названному принципом Лагранжа. В этом параграфе будет показано, что источник универсальности — согласованное соединение во всех рассмотренных задачах гладкой и выпуклой структуры. 9.1. Необходимые условия I и II порядка в гладких задачах математического программирования 9.1.1. Постановка задачи и необходимые условия I порядка. Пусть X и У — нормированные пространства, ft:Z-^R, i= =0, 1, ..., т — функционалы, F:X-+Y — отображение из X в У. Гладкой задачей математического программирования с ограничениями типа равенств и неравенств называется задача 'M*)->inf; /iW<0, ι = 1, ...д F(x) = 0. (з) Функция m 2(χ, К </*)=£ ЪШ+ЬГ, F{x)) £=0 называется функцией Лагранжа задачи (з), пара (λ, у*)^ еКт+1ХУ* — набором множителей Лагранжа. Теорема (необходимое условие I порядка). Пусть в (з) X, У — банаховы пространства (условие банаховости), //е ^SD(x), i=0, 1, ..., /η, F^SD(x) (условие гладкости), ImF'(x) — замкнутое подпространство в У (ослабленное условие регулярности). Тогда если #elocmin3, то существует ненулевой набор множителей Лагранжа (λ, у*) такой, что для функции Лагранжа выполнены условия: а) стационарности: m 2х(хЛ,!Г) = 0<*у Xif'i (х) + (F'(х)У у* = 0; б) дополняющей нежесткости: λφ(*)=0, i=l, ..., m; в) неотрицательности: λ/>0, i=0, 1, ..., m. Данная теорема была доказана в п. 2.4. Здесь мы приведем еще одно доказательство основного случая теоремы 122
LlmF'(x)=Y) с использованием формул Моро — Рокафелла- ра и Дубовицкогр — Милютина (п. 1.5.4). Как и при доказательстве в п. 2.4, считаем, что //(£)= О, ί=0, Ι, ..., m, а условия дополняющей нежесткости уже выполнены. <] Обозначим A==F'(£), *;*=//(#), £=0, 1, ..., т. Рассмотрим вспомогательную задачу: max (χ*у *) + 6KerA(x)-*inf, (з') ί=0,1 m где б — индикаторная функция множества КегЛ. Лемма. Oeabsmin з'. ■ 0 0 Предположим^ что 0^absmin3'. Тогда 5тщ<0 и, значит, существует элемент АеКегЛ, для которого <*Л ft>< <0, ί=0, Ι, ..., /п. По теореме о касательном пространстве (п. 1.4.4) найдутся число ε>0 и отображение г: [—ε, ε]->Χ, такие, что F{x+ih+r(t))=0 Vt€=[-ey 8] и \\r(t) \\=o(t) при Z^- ->-0. Но тогда, используя определение дифференцируемое™ по Фреше и то обстоятельство, что fi(x) — 0,> получаем /^?+ίΛ + Γ(0)-Λ(^+<^Λ + Γ(/)> + ο(||ίΑ + Γ(ί)ΙΙ) = = /<**,ft)-fo(i)<0 при малых f>0, i = 0, 1,... ,m. Таким образом, при малых ί точка *+*Л+г(/) будет допустима и f0(x + th + r(t)) <0, т. е. л;^· ^" locmin з. Противоречие. > (> Положим φ (*) = max (χ*, χ) + δ Кег Л (χ). Поскольку φ—вы- t—0,1 m l пуклая функция и по лемме 0ea6smin<p, то по аналогу теоремы Ферма для выпуклых функций (п. 2.3.1) Оед<р(0). В силу формулы Моро—Рокафеллара 0€=dq> = <5( max <*;, .)+бКегЛ(.)) = t=0,l,...,m = а max {x\, -) + дбКегЛ(·)· i=0,l m Теперь остается воспользоваться формулой Дубовицкого—Милютина, очевидным соотношением дЬ КегЛ=(КегЛ)х и леммой об аннуляторе ядра регулярного оператора (п. 7.2). Получаем m 0€=со{*;, ... ,*;}-ИтЛ*«ЗЯ,>0, £λ,= 1, *=Р . т т i/* е У*: γ %iX] + AY = 0 <=» £ λ,/; (*) + (/=" (ί))* ί/* = 0. > 9.1.2. Необходимые условия Η порядка. Обозначим Л совокупность всех наборов (λ, г/*), для которых выполнены ус- 123
m ловия а)—в) теоремы п. 9.1.1 и Т*Х^=1. Теорема о необ- ходимых условиях I порядка утверждает, что Л=?&0. Теорема (необходимое условие II порядка). Пусть в задаче (з) п. 9.1.1 X и Υ — банаховы пространства (условие ба- наховости), функционалы /t·, ί=0, 1, ..., m, и отображение F дважды дифференцируемы в некоторой окрестности точки £ (условие гладкости), lmF'(£)=Y (условие регулярности). Тогда если Jcelocmin3, то max $хх (χ, λ, у*) {/г, Щ > О (КУ*)€Л для любого h, принадлежащего конусу допустимых вариаций Kd^{fieX\ (f'i(x),h)^0, F'(x№] = 0). О Доказательство базируется на лемме о минимаксе и· теореме Люстерника (п. 1.4.4). Лемма 1 (о минимаксе). Пусть Χ, Υ—банаховы пространства^ Ле^(Х,У), ЛХ = Г, х*<==Х\ ί=1, ... ,s, ι/еУ, ae=R*, max (χ· jc)>0 V*€=KerA. (1> i=l,...,s Положим. S(a,y)= inf max (ai + {x]i x)). (2) A*-f0=O i=>l,...,s Тогда: а) величина S(ay у) допускает двойственное представление s S(a,y)= sup (ΤλΛ+({/*, y)) = :sJl(a,y)y (3> (a, y) = sup (V^at. + (y*, у))==:5Л(а, у), где л = {(λ, у*) <r* х у* ι λ<> ο, £ λ, -1, J λ^; + лу=о), $Л(а, у) — опорная функция множества Л β точке (а, у). б) inf в (2) a sup β (3) достигаются. О < А) Существование -минимума полиэдральной функции, ограниченной снизу на аффинном многообразии. Нетрудно видеть, что следующие три задачи эквивалентны: φ (л:): = max (αζ + (χ*9 x)) + 6My(x)-+inf. (зх> Л1,: = {х|Лх + у = 0>; max (а, + Ь) -* inf; ξ e= Μ (у); (з2> 124
c-xinf; α, + ξ,Οι ι=ί, ...,s, ?еЛ1(л). (з3> В задачах (зх)—(з3) Мц и М(у)—аффинные [многообразия, соответственно в X и в Rs. Возьмем элемент х, для которого lix+ + # = 0. Тогда Му = х+КегА и, следовательно, Μ (#) = {ξ|ξ* = = (л:*, х) + (л:*, А), АеКегЛ}. По условию леммы найдется i0f, l<i0<s, такое, что (л:*о, А}>0 и, значит αί§+&,>αί§ + (*^ *),. т. е. max (α, + ξ£) > min (at + (jc* *)) Υξ e Μ (у). Таким образом,. значение задач (зх)—(з3) S(a,y)>— оо. Задача (з3)—задача линейного программирования, поэтому по теореме существование (п. 3.2.1) решение в ней, а следовательно, и во всех остальных существует. Обозначим через χ решение в (3ι). Б) Применение аналога теоремы Ферма. Поскольку jceabsmin<p, где φ — выпуклая функция, то по аналогу теоремы Ферма (п. 2.3.1) 0е<3<р(£). Используя формулу Моро—Рокафеллара и Дубовицкого—Милютина (п. 1.5.4), соотношение бМу(х) = (Кет А)1· и лемму об ангуляторе ядра регулярного оператора (п. 7.2), получим, что существует λ=- = (λι, · .· ·» λ«) и f g7*, для которых При этом, если %>0, то at + (**, х) = S(α, у), откуда i=l ί=-1 t=l С другой стороны, если (λ, j/*)eJl, то для любого х, такого, что Ах + у = 0, £ λ,α, + (у\ y)f=Y^ ("i + (xh *»< t=I i=l s < max (di + (x% χ))Υ λ;= max (а,+ (** jf»<S(a, y), l<t<s £' l<t<s s т. e. S(a,y)= sup (Τ* λ<α, + (У*,у)). ϊ>\> 125-
Как и при доказательстве необходимых условий I порядка, ве ограничивая себя в общности, можно считать, что //(#)=0* i>0. Рассмотрим задачу f(x): = max {/0 (*),... , fm (χ)} -> inf; F (χ) = 0. (з4) Лемма 2. лГе1осттз4. < <3 Если χ е£ locmin з4, то Ve > 0 Зл:6: \\хг—х\\ < ε, F {χε) = 0, /ί(*β)<0» «>0, =^^Й1ост|пз4. [>'[> Введем обозначения лг* = /|(л:), Л = ?'(£), а{ = (1/2) /" (х) [A, ft], j/ = (1/2) F" (х) [А, А], где А е /С—фиксированный вектор. По лемме п. 9.1.1 условие (1) леммы о минимаксе выполняется. По лемме о минимаксе существует элемент ξ=ξ(Α), Λξ+ι/=0, для которого т тах(а; + (х*,1))= sup (VЯ£-а, + {у\ у)) = = ± sup ^x(i)[A.AJ = :-f Ψ (Α)· (4) По формуле Тейлора в силу соотношений ΛΑ=0, Λξ+#=0 по- .лучаем при ί>0 F(x+th +t%) = F&) + F' (χ) [th +t%] + + (1/2)F"{x)[th +1% th + П) +0(t*) = t*(Al + y) + o(t*) = o(П По теореме Люстерника существует отображение q>:U-+X •окрестности точки #, такое, Что F(x + <p(x)) = 0, \\<f(x)\\<K\\F{x)\\. Полагая r(t) = (f (x+th + t2Q, получим F(Z+th + t% + r(t)) = 09 \\г(т^К\\РСх + М + П)\\ = о(Р). Тогда, применив формулу Тейлора к ft и используя (4), получаем ^вспомнив, что (**, А)<10, />0) f{x+th + n + r(t))^^xit(x;fh) + t^(x%l)+ai)) + + o(t^^t*max((x%l) + ai) + o{t*) = ^W(h) + o(n Если допустить, что Ψ(Α)<0, то получим противоречие с леммой 2. > 126
9.2. Условия первого и второго порядка в классическом вариационном исчислении Цель этого пункта — показать, что классические необходимые условия (уравнение Эйлера, а также условия Лежандра,. Вейерштрасса и Якоби) являются простыми следствиями принципа максимума. 9.2.1. Простейшая задача к, в. и. Рассмотрим вновь (ранее см. п. 4.2) простейшую задачу классического вариационного исчисления, для определенности задачу на минимум & {χ (·)) = ί* L [t, χ, χ) at ->. inf; χ {t0) = x09 χ (ίχ) = χν (з)· Здесь χ (·) = (χχ (·), ..., χη (·)) — вектор-функция. Напомним, что функция х(>) е Сгф0, /Jf Rn), x(t0) = x0, ^(ίχ) = — xlf доставляет слабый локальный минимум в задаче (з), если OHai доставляет локальный минимум в пространстве С1^» ^i]> Rn)> τ· е· если существует δ>0, такое, что для любой функции х(-)е ^ С1 ([t0, ij, Rn), χ(t0) = x0, χ (tj) = x19 для которой \\x (j) — —^(-)HcWt.M.Rn)<e выполняется неравенство of (х(-))^&(х(-))* Напомним, что 11*(-)11сЧ[*.А1.*я> =таХ^(')Иад0Л!^)' Hx"(')llc«/#Ai.R»)}· Наряду со слабым экстремумом в простейшей задаче к. в. и. рассматривается понятие сильного экстремума. Говорят, что* функция x(-)^KGl([t0, t{], Rn), (или принадлежащая более широкому классу, например, Woo1 ([to, t\]f Rrt)), x(to)=xo» x(tx)=xu доставляет сильный локальный минимум, если она доставляет локальный минимум в пространстве С ([ίο, *ι], R"), т. е. если существует б>0, такое, что для любой функции χ{·^<=ΚΟ([ίθ9 *i],R"), χ(ί0)=*χθ9 x(ti)=xu для которой \\χ(·)— —* ί")Wcat /μΐ)<δ выполняется неравенство 2f (x(·))> >^(i(.))V" Поскольку множество функций, среди которых доставляется сильный экстремум, шире, чем для слабого экстремума, то если функция x()^Cl([tQ, tx]9 Rn) доставляет сильный, то она доставляет и слабый экстремум. Поэтому для таких функций необходимое условие слабого экстремума является необходимым условием сильного, а достаточное условие сильного экстремума является достаточным условием слабого. Приведем пример задачи, в которой допустимая экстремаль доставляет слабый локальный минимум, но не доставляет сильного. 127
Пример. <£/(*(·.))= С#3di->·inf; #(0) = 0, л:(1) = 1. Уравнение о Эйлера: — З*2 = О «=* Зх2 = С « χ = const. at Общее решение: x(t)=C{t+C2. Единственная допустимая экстремаль: x(t)—t. Покажем, что экстремаль доставляет слабый локальный минимум. Действительно, пусть h(-)^CQl([Q, 1]). Тогда ι ι ι #(Г(.) + А(·))—#(£(·))= (О+А)3^—j dt = $h*{3 + h)dt. 6 0 0 Отсюда видно, что если ||Λ(·)ΙΙι<3, то 3+#'(ί)>0 и, значит, ^(i(.)+A(-))>^(^(0),T. e. i(.)elocmin. Покажем, что £(·) не доставляет сильного экстремума. Рассмотрим последовательность функций I ~Vny fe[0f Ι/*). gn(t)=\ 0, *е[1/л, 1/2], hn(t) = $gn(x)d%, л>2. l2/Vn, /s (1/2,1]; Легко понять, что hn(-)^KC0l([0, 1]) и ||Ая(-)11о-М) при п-* -►оо. Положим *я(·) =£(.)+/tn(.). Получим последовательность допустимых (в задаче йа сильный экстремум) функций ίΧη{-)},Χη{-)-+*{·) вС([0, 1]) и 11 11 О, 0 0 0 1/п 1 -= 1+ Г (Зп—п*'*)<и+ f (-^-+-77^")Λ = — V^+o(i)->— °° 0 1/2 лри /ζ-^οο, т. е. Smin=—oo и функция х(-) не доставляет сильного локального минимума. В дальнейшем нам придется использовать следующий результат. Лемма о скруглении углов. Если функция L(t, χ, χ) .непрерывна по совокупности аргументов, то inf #(*(·)) = inf #(*(·)). χΠ^κσφο^Δ) *(-)€зСЧРо,У). 0) x(t0) = x09 x{t1)^xl x(t0) = xQ, *(*ι) = *ι [АТФ, с 69]. Еще некоторые определения. J 28
Пусть в простейшей задаче (з) классического вариационно- то исчисления ί(·)£θ'([/0, t{\, Rn) — некоторая фиксированная экстремаль, т. е. на х(-) удовлетворяется уравнение Эйлера. Далее предполагаем, что интегрант L по меньшей мере дважды непрерывно дифференцируем в некоторой окрестности траектории £(·). Говорим, что на х(-) выполнено условие Лежандра, если Lxx (t) ^ 0 V/ е [t09 ίχ] и усиленное условие Лежандра, если ί··(ί)>0 V/e[/et/j. При наших допущениях относительно гладкости интегран- та L функционал Σ( имеет вторую производную в точке х(-) следующего вида *) XX to + 2(LnM) + {Un))d/, где / ^*ι*ι · · · LXl X \ Пусть далее £..(·),£. (·), Lxx (·) е С1 ([/0, ij, Rn) и выполнено усиленное условие Лежандра. . Уравнение Эйлера для функционала Ж, т. е. уравнение -^{LVx{t)hit) + L^ называется уравнением Якоби для исходной задачи на экстремали х(-). Пусть на х(-) выполнено усиленное условие Лежандра. Точка τ называется сопряженной к точке t0, если существует нетривиальное решение /*(·) уравнения Якоби, для котгорого А(/0)=А(т)=0. Говорят, что на х(-) выполнено условие Якоби, если в интервале (t09 U) нет точек, сопряженных с ίθ9 и усиленное условие Якоби, если в полуинтервале (t0t tx] нет точек, сопряженных с ίο- Уравнение Якоби — линейное уравнение второго порядка, которое (из-за усиленного условия Лежандра) можно разрешить относительно второй производной. Пусть H(t, t0) — матричное решение уравнения Якоби с условиями H(t0i t0)=09 fi(t0, t0) невырождена (обычно полагают ft(tQ, t0)=I). Очевидно, что точка τ — сопряженная к t0 тогда и только тогда, когда матрица Я (τ, ίο) является вырожденной. Это дает аналитическое средство находить сопряженные точки. 129
Пусть f:Rn-^R — дифференцируемая функция л переменных. Функцию i(x,x') = f(x')~f(x)~{r(x),x'-X) (1) назовем функцией Вейерштрасса, соответствующей f. Геометрический смысл ё таков: 6 (х9 х') — разность в точке х' между значением / и значением аффинной функции, касательной к графику f в ?очке х. Отсюда ясно, что если / выпукла, то g{x,x')^0 Yx,'x'-&Rn. Можно показать, что верно и обратное. Если функция x-*~L(t9 χ, χ) выпукла в некоторой окрестности множества V={(t, x(t))\t^.[t0, /,]}, то говорят, что инте- грант L квазирегулярен на экстремали £(·)> если строго выпукла, то регулярен на χ (·). Пусть L — интегрант функционала 2f простейшей задач» классического вариационного исчисления. Функция S(t, χ, χ, u)=L(t, x, u)—L(t9 x, x)—L±(t9 χ, χ) (и—χ) (Γ> называется функцией Вейерштрасса функционала 3f. Из сопоставления (1) и (Г) видно, что 6 (t, χ, ·, ·) — функция Вейерштрасса функции x-+L(t, χ, χ), где t, x играют роль параметров. Из сказанного следует, что квазирегулярность (регулярность) интегранта L в области V равносильна тому, что t]{t, х, х, и) > 0 (£ (/, х, i9 и) > 0, χ φ и) V (/, х) е= V, (и, х) е= R2n. Теорема (необходимые условия минимума в простейшей! задаче к. в/и.). А) Пусть функция x(-)^Cl([tQ, tx], R«) доставляет сильный локальный минимум в задаче (з) и интегрант L^Cl(U), где U — некоторая окрестность графика {(/, x(t)9 x(t))\t^[t0, t{]}9 тогда на х(-) выполняется уравнение Эйлера и удовлетворяется условие Вейерштрасса $ (t, X(t),1c (t) ,«)>OVttGRn,/E [tQ9 /J, где $ (t, x, xf u) = L{t9 x, u)—L(t9 x, x)—L^(t, x, x) {u—x) — функция Вейерштрасса. Если при этом Существует £··(/), t^[t0, fj* то выполняется также условие Лежандра: L—(ί)!>0: Б) Пусть функция x(-)^C2([t0, t{], R«) доставляет слабый локальный минимум в (з) и LeC3 (,£/). Тогда выполняются 130
уравнение Эйлера, условие Лежандра, и если выполнено усиг ленное условие Лежандра (Lx -χ (/) > 0 Vt e [ioi <J), то выполняется и условие Якоби, г. е. на интервале (t0t tx) нет сопряженных точек. <3 А) Формализуем задачу (з) как задачу оптимального управления ^ L(t9 χ, u)dt-+ inf; x = u9 x(tQ) = x0, x(t1) = x1. (з') Условие «£(·) доставляет сильный минимум в (з)» равносильно, тому что пара (*(·)> ώ(·)), где и(t) = x(t), является оптимальным процессом в задаче оптимального управления (з'). Согласно принципу максимума Понтрягина найдутся множители Лагранжа λ0, λι, %2 и p(-)^KCl([t09 tt]9 R*), не все равные нулю и такие, что для функции Лагранжа задачи (з') <£ = |(λ0Ζ,(ί, ху u) + p(t) (k~u))dt+l1x(Q + 'K2x(t1) и выполняются условия: а) стационарности по χ — уравнение Эйлера ρ® = λ£χ{*) Vf€=[fDifJ; б) трансверсальности по χ ρ{ίο)=λ{, ρ(*ι)=-λ2; в) оптимальности по и min {X0L(t, lc(*), и)-ρ(t)и} = V#, χ {ί)9 *(t))- uSRn -P(t)x{t) Vie[i0fiJ. Если λ0=0, то рз в) вытекает, что p(f)=0, а из б) — что все множители Лагранжа нули. Значит, λο^Ο. Полагаем λο—Ι. Тогда из в) следует, что £'х (t)=p(t) (необходимое условие I порядка минимума функции η переменных L(t, x(t)9 и) — —p(t)u) и Lxx(t)^Q (необходимое условие II порядка). Подставляя ρ=£χ в условие стационарности по х9 получаем уравнение Эйлера. Условие оптимальности по и при λο=1 и p=£i есть не что иное, как условие Вейерштрасса. Б) Уравнение Эйлера и условие Лежандра. Поскольку £(-)е1осгшп(з') (слабый), то для любой функции h(')eC0l([t0t tx]9 Rn) функция φ(λ)==^(^(·)+λ/ι(·)) имеет локальный минимум в нуле. Тогда по необходимому условию минимума функции одного переменного (п. 2.1.1) φ'(0)=0 и 131
φ"(0)>0. Β п. 4.2.2 было показано, что первое условие равносильно выполнению уравнения Эйлера на функции £(·), а второе условие эквивалентно неотрицательности функционала и + (Lxxh, A»dt=]l(/, A, A)at>0 VA (·) c= Cl([/0, У, R"). и Из неотрицательности и вида функционала К следует, что Я(/)=0 доставляет абсолютный минимум (слабый) в задаче tf(A(.))-wnf; A(.)e=C0([i0, fj, R"). (β*) По лемме о скруглении углов функция 7ϊ(ί)=0 доставляет в (з") и сильный минимум. Тогда в силу уже доказанного пункта А в задаче (з") на Я выполняется условие Лежандра, т. е. ^uO^Of что эквивалентно условию Лежандра в (з) для £: £;;(/)> О Vie [ίο, /ι]. Условие Якоб и. Предположим противное, что условие Якоби не выполнено и существует те (ίο, ίι) и нетривиальное (Αξ^Ο) решение А(·) уравнения Якоби, для которого Л(/о)~ —Α(τ)=0. Отметим, что из нетривиальности решения Λ(·) однородного линейного дифференциального уравнения второго порядка с условием Α(τ)=0 вытекает, что ft (τ) ФО. Положим ϊ(ί)βί*(0.ί.«<τ. I 0, x<i<ir Так как Α(·) удовлетворяет условию Якоби, то после интегрирования по частям получим ^(A(0)=(((^M) + 2(L,.M) + (UA))di = i Таким образом, Ж(Я(-))=0, а это означает, что Я(·) доставляет (наряду с функцией fi(-)=0) сильный минимум в (з")· Проводя рассуждения, аналогичные проведенным в п. А, для функции Я(·), получим, что найдется функция ρ(·)& GKCl([t0t t\], R"), для которой выполняется уравнение p{t) = lh (f, А(0, t(t))» ρ(/) = 2 (Li; (<) £(f)+L;* </) A(f)). 132
Поскольку при ί >τ h(t) = 0, то ρ(τ+0) = 0 и в силу непрерывности р( ·) 0 = р(х—0) = 2Li ; (τ) h (τ—0) = 2LX x (τ) h (τ) = 0, откуда ή (τ) = 0 (ибо Ζχ χ (τ) обратима из-за усиленного условия Лежанд- ра). Пришли к противоречию с условием Н(х)Ф0. Таким образом, условие Якобй выполнено. > 9.2.2. Задача Больца. Теорема (необходимые условия слабого минимума в задаче Больца). Пусть в задаче Больца <Ш (х (·)) = [L (/, ху k) dt +1 (χ (У, χ (У) -> inf (з) функция x(-)^C2([tQ, tY], Кг-) доставляет слабый локальный минимум и интегрант LeC3(f/), U — окрестность графика {(t, x{t), i(f))|*e[f0, ίι]}, терминант /e=C2(V), V - окрестность точки (x(tQ), x(ti)). Тогда выполняются: а) уравнения Эйлера L- (t) + Lx (t) = 0 и условие dt x трансверсальности Lx (У = Txitoh Ζχ (У = —TX(tth б) условие Лещандра Lxx> (t)^0 VYe [tQy fj; в) если имеет место усиленное условие Лежандра (Lxx (t)> >0 V/e [tQ9 ij), го удовлетворяется условие Якоби (в интервале нет сопряженных точек); г) если удовлетворяются усиленные условия Лежандра {Lxx(t)>0 Vie [у tt]) и усиленное условие Якоби (на полуинтервале (/0, U] нет сопряженных точек), то квадратичная форма P+Q (заданная на R2") должна быть не отрицательна, где Q(K, K)=t'$(U)y х(Ш(К, К\ {К *ι)], Р(А0, *,) = (Lx · (У (#0(УK + H^t,)/у, h,)- - (ίχ χ (t0) (Я0 (У h0+Hx (i0) A,), h0) + (Lxx (У hl9 h,) - — (Lxx(t0)h0,h0), a Hi(-) — решения уравнения Якоби с краевыми условиями Hi(tj)=8ijl (δί/ — символ Кронекера, I — единичная матрица), U /=0, 1. ,<] Необходимость а) была установлена нами ранее в п. 4.1. Далее очевидно, что если х(-) доставляет слабый минимум задаче (з), то функция х(-) доставляет слабый минимум в простейшей задаче к. в. и. |L(/, χ, χ) dt-+ini; x(Q = x(tQ), *(У = *(У, 133
и, значит, в соответствии с теоремой из предыдущего пункта выполнены условия б) и в). Докажем условие г). Уравнение Якоби + (-tii~Lix +LX£) h + (~L· +Lxx)h==0 представляет собой систему из η дифференциальных уравнений второго порядка, которую можно переписать в виде системы из 2п уравнений первого порядка, разрешенной относительно производных. Для этого, положив h—g и воспользовавшись тем, что из-за усиленного условия Лежандра L— обратима, получим й=£, По теореме существования и единственности для линейных систем [АТФ, с. 191] существует фундаментальная матрица решений последней системы, которая (после простых переименований) превращается в фундаментальную матрицу Ф(·, t0) решений уравнения Якоби. Эта матрица удовлетворяет уравнению Якоби и краевым условиям: Ф(/0, *о)=0, Ф(/0, t0)=I. Аналогично построим фундаментальную матрицу Ψ(·, t\) из условий ψ(ίΪ9 /0-0, Ψ(/ϊ, *,)=/. Напомним, что точка τ является сопряженной к t0 тогда и только тогда, когда матрица Φ (τ, t0) вырождена. Но у нас выполнено усиленное условие Якоби, поэтому матрица Φ(ίι, to) невырождена. Положим Я1(/)==Ф(/, ί0)Φ~1(^ι» *о) и #0(ί) = -Ψ(/, fi)4M(*o, ίι). Ясно, что ^(ί0)=0, Н{(и)=19 Я0('о)~/. #ι(*ι)=0. Тогда функция h(t; ft0, hi)=H0(t)h0+Hi(t)hi — решение уравнения Якоби с краевыми условиями h(t0, ft0, /ii) — = А0, h(ti\ h0, h\)=hx. Вычислим значение Ж(к(-\ h0, .fti))» где Ж — квадратичный функционал ^(Α(·))=ί«ζί A. h) + 2{LxXKh) + {LxxKh))dt. и Имеем и и Χ (Λ(·; Κ Λι)) = j (1цк+1ь К dh)+ j" (Lxx h + Lxxh9 h) dt = tx 134
Поскольку я (-)elocmin ,$?(·), то по необходимому условию II порядка для локального минимума (п. 2.1.2) для всякого A(-)eCl([tQf tY]9 Rn) должно быть верно неравенство ~*(*+АА(о)|*-о)=»(Л(-))+о;(АЛ).*(У)= = (P + Q)(h(tQ)9h(t1))^0. Подставляя вместо /*(·) построенную нами функцию Л(·; й0, Jii), приходим кг). О §10. ДОСТАТОЧНЫЕ УСЛОВИЯ ЭКСТРЕМУМА В этом параграфе мы, во-первых, показываем, что необходимые условия, о κοτορώχ говорилось в п. 9.1 и 9.2, фактически смыкаются с достаточными, а во-вторых, прослеживаем за некоторыми общими идеями, связанными с достаточными условиями. 10.1. Достаточные условия в задачах с равенствами и неравенствами 10.1.1. Постановка задачи и формулировка теоремы. Здесь исследуется та же задача, что была поставлена в п. 9.1.1. Напомним ее. Пусть X и Υ — нормированные пространства, U — окрестность в X, ft: i/-*R, ί=0, 1, ..., /л, — функции, определенные на {/, F: U-+Y — отображение, определенное на U со .значениями в У. Рассматривается гладкая задача с ограничениями типа равенств и неравенств: /o(*)-Mnf; ft(*)<0, 1</<т, F(x)=0. (з) Функция Лагранжа задачи (з) имеет вид т 2(х. К У*) = £Ы1(Х) + (У\ Fix)), λεΙΤ", ϊ'εΓ. Теорема (достаточные условия ψ задаче с равенствами и неравенствами). Пусть X и Υ — банаховы пространства (уело- <вие банаховости), ft : i/-^R, ft(£)=0, i^O, x^U, — функции, дважды дифференцируемые по Фреше в окрестности U, F — отображение также дважды дифференцируемое по Фреше в U {условия гладкости), lmF'(x) = Y (условие полной регулярное- ти), множество m m 135
(условие первого порядка) и существует а>0, такое, что max Зхх{х, λ, у*) [Α, A]>a||ft|i2 а,у*)ел для любого h, принадлежащего конусу допустимых вариаций K:={x\(fi'(x)> *)<Q> 0<(<m, F'(x)x=0}. Тогда χ доставляет локальный минимум задаче (з). 10.1.2. Леммы. Доказательство теоремы опирается (помимо* доказанной в п. 9.1.2 леммы о мицимаксе) на один результат, относящийся к выпуклому анализу, — лемму Хоффмана, которая базируется на трех геометрических фактах, имеющих независимый интерес. Лемма 1 (о сопряженном конусе). Пусть X и Υ — банаховы пространства, А\— линейный непрерывный оператор из X в У, являющийся эпиморфизмом (φ=>ΛΧ=Υ), {%ι*, ..., xs*} — набор линейных функционалов на X, Κ: = {χζξΧ\(χ*> *)<0, 1<i<s, Λχ = 0}. Тогда /С={** е=Х*|х*+£Я,*; + лу = 0, λι>°> </*^у*}. <! 0. Доказательство леммы опирается на: 1) формулу Моро—Рокафеллара (п. 1.5 и 8.2); 2) формулу Дубовицкого— Милютина (п. 1.5 и 8.2); 3) теорему Ферма для выпуклых функций (п. 2.3.1) и 4) лемму об аннуляторе ядра (п. 7.2). 1. Пусть Хо*е/С*. Тогда из определений следует, что р(х): = max (x*y x)^0 Vx^ KerA=40^absmin(p + 6KerA). (1} ί ,(0·4> Тогда, используя очевидную формулу дбКегЛ = (КегЛ) = = 1тЛ*, получим (0.3) (0.1) ι (0.р 0 е д(/?+бКегЛ)= др+д8№А = со{*0, ..., *5} + 1тЛ\ (2> Без ограничения общности можно считать, что из j£ λ^* + V i=l + K*y* = 0 следует λ*=0, у* = 0 (выкидывая последовательно те Xk*y которые представимы в виде —( ]Г Я^х* + Л*у*)]. Тогда S из (2) получим, что —xl=^^fXiX*+A*y*. > t==l Лемма 2 (о замкнутости). Пусть X — банахово пространство, L\ — замкнутое подпространство и L2 — подпространства конечной размерности в X. Тогда Li+L2 — замкнутое подпрост* ранство X. 136
<\ Пусть L2 = lin{xi, ..., Xs). Если X\^LU то подпространство Li^flinljci}, очевидно, замкнуто. Если же X\&LU то по второе теореме отделимости (п. 1.2.2) существует элемент X\*^L\\ такой, что (х\*у Χι>=1. Пусть ζ принадлежит замыканию L\ + -\-\т{х\}. Это значит, что существуют ληεΚ и ln^Lu такие, что» кпХ1 + 1п=*'.2р-+г. Но тогда, подействовав на гп элементом #ι*ν уполучим Id A»=<a:w гя)-+(хи ζ) = :λ^Ιη = ζη—ληχ1-+ζ—λχ1 = :'ξε=11 в силу замкнутости Lx и того, что ξπ^Ζ,ι=»·λτιΧι + ξη-*λΧι + ξ. Итак, Li + lin{xi} — замкнуто. Аналогично показывается, что Li+lin{*b л:2}, ..., Li+lin{jfb · ·> xs}=Li+L2 замкнуто. > Лемма 3 (двойственности для задачи о кратчайшем расстоянии). Пусть X — нормированное пространство, А — непустое выпуклое множество в X. Тогда d(xy A, X)=sup{<j*;*, χ)— —s4(x*)|||**||<l}, где d(x, Л, X): = ini{\\x—y\\\yz=A} — расстояние от точки χ до А. , <\ Легко понять, что функция x-+d(x, A, X) непрерывна к (вследствие выпуклости А) выпукла. Значит, она замкнута. По» определению эта функция есть конволюция нормы {\\x\\=N(x)) и индикаторной функции множества А: ^ d(xyA, X) = {N№A){x). Используя формулу сопряженной функции к конволюцик (п. 1.5.4) и формулу Ν*(χ*)=*δΒΧ*(χ*)9 получим Ш{-, Л, XJ{x*)=6BX*{x*)+sA(x*). Применив далее теорему Фенхеля—Моро (п. 8.1.3), имеем del d(x, A, X)=l(l(d(.f A, X)))=sup{(x\ χ)—&Α{χ*)\\\χ·\\^1). \> Лемма 4 (Хоффмана). Пусть Χ, Υ — банаховы пространства, Ае=&(Х, Υ), ΛΧ=Υ, ***<=**, ί=1, ..., 8,Κ={χ\{χι*χ)ΚΡ, i=l, ..., s, Λχ=0}. Тогда существует константа С>0, такая,. что / s . d(x9 К, Χ)<α(Σ <*Д χ)++\\Αχ\\) (a+:=max(a, 0)). < Положим L = lin{xi*, ..., #<?*}+Im Λ*. По лемме об анну- ляторе ядра регулярного оператора 1тЛ*= (КегЛ)-1-, а анну- лятор всегда замкнут, поэтому в силу леммы 2 (о замкнутости) L замкнуто в jf*, а значит, банахово пространство. Обозначим S Λι(λ, Я = £М; + ЛУ, A,eif(R*xy, I). i—I 137
Поскольку Λι — сюръективный оператор, то по лемме о правом обратном (п. 7.2) найдется оператор Λί,: L-»-R5xy*, такой, ■что A,°M,=/L, IWi**IKC||x*||, т. е. если ||д:*||<1 н Λί,** = = (λ, у*), то S Поэтому по лемме 3, учитывая, что sK(x*)—6(—К*) (х*) (по .определению) и лемму 1, получаем d(x, К, X) = sup{(x*, x)— аЯ(х*)|||*Ч|<1} = =suP{<**, *>-δ(-/0(**)ΙΙΙ*ΊΚΐ} = S -=sup{<**, *>|*'=5>,*; + Лу, λ,>0, ГеГ, ||jc'||<l}< s <sup{(J>,xJ+Ay, х)|о<Я,<С, ||»*|1<С}< t=sl s ^c(£(x-,x)+ + \\Ax\\). t> Лемма 5 (о компактности Л). Пусть выполняются условия .теоремы. Тогда множество множителей Лагранжа Л —{(λ, у*)^ N m m <=Rm+1xF*|X>0, £λ£ = 1, Y,Xix* + A*y' = 0\—компакт {χ·: = <=о i~o .=/,'(£), t=0, ..., /η, Λ = /"(*))· m <| Рассмотрим симплекс Σ = |λ <= Rm+1 |λ^ 0, J]λ; = l} и отоб- т ражение φ: Σ->Χ*, задаваемое формулой φ(λ)= ^λζχ*. По опрело делению (λ, */*)е Л <=»φ(λ) + Λ*ί/* = 0. В силу замкнутости 1тЛ* (по лемме об аннуляторе ядра регулярного оператора 1тЛ* = = (КегЛ)-ь, а аннулятор всегда замкнут)4и равенства КегЛ*== ={0} (А*еКегЛ*=><Л*А*, *> = 0 V*=*(ft*f Л*> = 0 Vx=>h*=Q) применима теорема Банаха об обратном операторе^ (п. 7.1). Поэтому отображение Л* : У*-*1тЛ* имеет обратное, следовательно, подмножество Λ*-1φ(Σ) компактно, а значит, компактно и множество {(λ, #*)&71} = {(λ, —Λ*-1φ(λ) |λ^Σ}. > 138
10.1.3. Доказательство теоремы. Покажем, что существует £>0, такое, что условия М*+Л)<0, *>0, F(je+/i)=0 (I) противоречивы при ||А||<6, кфО. Из этого сразу будет следовать, что *elocmin3. Действительно, пусть вектор А удовлетворяет условиям (1) и ||Α||<δι. Тогда по формуле Тейлора Λ(ί+*) = (/ίΦ. *> +(1/2) £(*)[*, h] + rt(h)9 i>Q, F^+h)^Ff^)[h]+{\l2)FtrQc)[K h] + r(h)9 «, полагая χ] = f\ (χ), at = (1/2) f£ (x) [A, A], i > 0, A=f'W, y-4rW^ АЬ K*) = max M*). получим <д£ Л> + а,=/,(* + А)<0, />0, ЛА + у = 0; (2) при этом <**, A>+<|at|<C1||A||if ||ΑΑ|| = ||»||<^ ||А||2. ' (3) т т Из равенства ]£ λ< (л:*, л:) + (Л V» л:) = 0, λ* > 0, J] λ, = 1 выте- m 'Кает, что V λ* (χ* х)=0 VxeKerA. Отсюда max (χ* χ) > 0 /=0 " 0<t<m ' Vj^g KerЛ, и, значит, можно применить лемму о минимаксе <(п. 9.1.2). В итоге получим (2) max fi(x+h)= max ({x*9 h)+ai)^ min max ((#*, χ)+αΛ = <0<i<m Os^i^m * Ax+y=0 0<i<m m = max l^Xxx&Kyllh.hj + VXMV + iy*, r(A))l (4) Расстояние от А до конуса /С оценим по лемме Хоффмана и затем по (3): т цк к, *)^с, {£<*;, Λ)++.||Μ||}<03.Ρ!|2. ί=0 Таким образом, А^А^Аг, где h\^K, а ||А21КСз1|А||2. Пусть *δ2 выбрано так, что из ||Α||<δ2 следует С3||А||^1/2. Тогда ll*ill>l|A||-H*,ll>l|A||(l-C,||fc||)>||/i||/2 л, значит, llfc2ll<4C8Bfcill2. .(5) 139
Наконец, отметим, что из леммы 5 (о компактности Л) вытекает, что если (λ, {/*)еЛ, то \\у*\\^С4. Пусть бз настолько» мало, что из ||А||^бз следует неравенство т \^trt(h)+(y\ rW^-J-UM1· (6> Теперь соединим воедино условия теоремы (1), (4), (5) и (6), обозначив С5= max \\έ£χχ{χ, λ, у*)\\: 0>f(x + h)^ max (-^^«(ϊ, λ, y*)[h9 A] + Y]V£(*) + t=0 + (y*,r{h)))^± max 2„(x, λ, y*)[K + h2, K + h2\- f-||Ai fl2> ~ IIΛ, ll2-4C3CJ || A, ||"-8C2C, || A2 ||4—J- HAJI»> 0, если только из ||A||<6<min(6i, 62, 63) следует неравенство 4C8CSII йх ||«+8С32С51| Аг ||« < -f || А» ||2. 4 Получили противоречие: Q^f(x+h)>0. > 10.2. Элементы общей теории поля 10.2.1. Построение поля для конечномерных задач с равенствами. Пусть U — окрестность в Rn, f : i/-*R, F: i/-^Rm. Рассмотрим конечномерную задачу с равенствами f(*)-Hnf; F(x)=0. (з) Стандартным возмущением задачи (з) называется серия задач* с параметром z^Rm f(*)-*inf; F(*)=* (з,) Теорема (о поле в конечномерных задачах с равенствами). Пусть /, F^C2(U) (условие гладкости), x^U, F(x)=Qr ImF/(i)=Rm (условие регулярности), существует множитель* Лагранжа #^Rm, такой, что для функции Лагранжа задачи (з) с единичным множителем Лагранжа при функционале &ix9y)-Hx) + {y,FLx)) выполняются: необходимое условие минимума I порядка 0=2,=/'(i)+&F'®> (2г = ЯхСх,У)Ъ ί(ι> 140
^достаточное условие минимума II порядка £Xx[h, h] > О Vh <ξξ KerF' (£), ΗφΟ {J£xx: = $xx(xy y)). (2) Тогда существуют окрестность V точки OeRm, окрестность U'aU точки »х и функция <р: V->£/XRm, (peC^V), <р(г) = = (* (ζ), У (ζ)), φ (0) = (£, у), гшше, что &х(х> У)=0> F{x)=zy xGEi/', геУ, тогда а только тогда, когда x=x(z)y y=y(z). При этом x(z)^ elocmin32. <\ Введем отображение Ψ : UXHm-+RnXl{my действующее .по формуле Ψ (л:, у) = (f'(x) + {у> F'(#)>, -F(x)). Покажем, что Ψ удовлетворяет требованиям теоремы об обратной функции ^ ^ (1) (п. 1.4.4). Ясно, что Ψ(χ, */) = 0 и 4rG=CI(£/XRm) (в силу условия гладкости). Докажем, что якобиан отображения Ψ aetWf(xy у)ф0. Имеем ψ'.(£ yll(x, у)] = чл£ у)[х] + Чу(£ у)Ш = = {2хх[х] + {у, F'{x))y F'(x)[x]). Если (χ, у) ge Кег Ψ' (лГ, у)у то Г(ф = 0и £хх[х] + (У,Р'(Я))=0^ (3) Умножим обе части равенства (3) скалярно на х. Тогда по- (2) -скольку F'(x)x=0, то Лхх[х, х] = 0**?х = 0. Следовательно, из (3) Ker4"(je, #)=0, т. е. άείΨ'ί*, $)ФЪ. По теореме об обрат-, ной функции существуют окрестность V точки 0eRm и отображение φ(ζ) = (χ(ζ)9 у (ζ)), такие, что Ψ(*(ζ), У(*)) = (0, «)«#*(*(*). У(^ = 0, F(x(«))=z. Осталось доказать, что x(2)elocmin32. В силу конечномерности задачи и условия теоремы (2) существует β>0, для которого {ЗГххК /i>>p||/i||2V/ieKer/7,(i). Выберем окрестность VidV настолько малой, чтобы для любого z^V\ выполнялось \\Xxx(x(z). У (*))-£, || <β/4, (4) 1тГ(х(г))=Им9 (5) (Xji, h) > (β/2) || h ||a V Α εξ Ker F' (χ (ζ)). (6) Действительно, поскольку отображения φ (ζ) и (χ, у)->- ~>i?**(.*:, у) непрерывны в окрестностях нуля и (£, #), соответственно можно удовлетворить условию (4). Условие (5) удовлетворяется в силу того, что ранг непрерывной матрицы F'(x) локально постоянен. Условию (6) можно удовлетворить из-за непрерывности отображения z-+Fr (χ (ζ)) и (4). 141
Итак, для АеКег^'(х(г)) <&хх{х{г)9 y(z))h, h)=(&xxh9 h)+((&xx(x(z), y(z))— -Sxx)K Λ»(β/2)ΙΙ/ι!Ι2-(β/4)||/ι||2=(β/4)||/ι||2. Поэтому в точке х{г), z^Vi выполняются достаточные условия экстремума. > Можно было бы привести и бесконечномерный вариант этой теоремы. Он доказывается фактически аналогично конечномерному. Поле, которое строится в следующем пункте, устроено аналогично тому, что было построено, только в классическом вариационном исчислении в качестве «возмущающего параметрам берутся краевые условия на правом конце. 10.3. Теория поля и достаточные условия в простейшей задаче к. в. и. В этом параграфе дается фрагмент теории поля и теория достаточных условий экстремума в вариационном исчислений на примере простейшей задачи. 10.3.1. Поле экстремалей, построение центрального поля. Пусть в простейшей задаче классического вариационного исчисления (з) п. 9.2.1 х(·) — некоторая экстремаль (т. е. на х(-) выполняется уравнение Эйлера) из семейства экстремалей {*(·, λ)}, *(·, K)e=Cl([t0f *i], Rrt), с параметром ХеЛе#(Кя). Говорим, что х(-) окружена полем экстремалей x(t, λ), если существует окрестность G графика Γ~ = {(ί, x(t))^Rn+l |/e[f0, /J}, такая, что для любой точки (τ, ξ) из этой окрестности имеется единственная экстремаль семейства, проходящая череа эту точку. Точнее, существует функция K:G-+Rn, λ—λ (τ, ξ), класса Cl{G), такая, что х(х9 λ) =ξ-4=^λ=λ(τ, ξ). Функция i*:G->-Rnt и (τ, ξ) = -£-*(*, λ (τ, ξ))|^τ называется функцией dt наклона поля. Если существует такая точка (ί*, χ*), что x(t*9 λ)=χ* для всех λ^Λ, то говорят, что Jc(-) окружена центральным полем экстремалей. Точка (t*9 лс*) называется центром поля, семейство χ(t9 λ) — центральным полем экстремалей. Теорема. Пусть i(-)GC2([/o, t\]) — экстремаль в простейшей задаче к. в. и., интегрант LeC3(i/), где U — некоторая окрестность расширенного графика {(t, x(t)9 x(t))\t^[to9 t\]}f на х(-) выполнены усиленные условия Лежандра и Якоби. Тогда х(-) можно окружить центральным полем экстремалей. <\ Распишем уравнение Эйлера ——Lx(t9 χ, x) + Lx(t, x9 x) = Q<=*Lxi(tf x9 x)x + +Lxx(t9 x, х)х + 1кЦ9 х9 x)—Lx(t9 x, x) = 0. 142
Так как выполнено усиленное условие Лежандра, т. е. неравенство £^(*)>0 Vt^[t0t t\], то в силу непрерывности функции L— (напомним, что LeC3(£/)) найдется такое Ui<=a{R*«+l), UxczU9 (*,*(*),*(/))€=!/! Vfepo, *i], что L— (t, xy x)>0 V(i, x, x)^U{. Значит, в области U\ уравнение Эйлера равносильно системе, разрешенной относительна производных х=У, y=®(t, х, У), где φ(ί, χ, y) = Lj} (/, χ, y){Lx{t, x, y)—Lk(ty x, y)—Lkx(t, x9 y)y), В силу предположенной гладкости ин-цегранта функция Φ (дважды) непрерывно дифференцируема. Знгачит, по локальной теореме существования [АТФ, £. 186] и глобальной теореме существования и непрерывной зависимости решения от начальных данных [АТФ, с. 195] найдутся такие ε>0 и б>0, что: а) решение х(-) продолжимо на отрезок [to—ε, ίι + ε]; б) для любого X^Rn (|λ|<δ) на отрезке [ίο—ε, t\ + s] определено решение χ(·, λ) уравнения Эйлера с начальными Данными χ(ί*)=χ(ί*), χ(ί*)=χ(ί*)+λ, где U — некоторая точка из интервала (ίο—ε, ίο). По теореме о дифференцируемой зависимости от начальных. данных [АТФ, с. 204] функция (ί, λ)-κ*;(ί, λ) = (x\(t, λι, ...9 λη), ..., xn(tf λι, ..., λη)) непрерывно дифференцируема. Покажем, что экстремаль #(·)* окружена центральным полем экстремалей χ(·, λ). Дифференцируя функцию x(t, λ) по λ, полагая λ=0 и обозначая x%iU λ)|λ=ο==Η(ί, fj. (*„„.o-*^L, «./-ι,,....). получаем (поскольку x(tf λ) — экстремаль для любого λ^ |λ|<δ) Оэ^ (-4-Li^ *И* λ)· *('» *))+*»(*. x{t, λ), i(t, λ)))| =f 5λ \ at /|λ=ο "*--|-(ζ ;(*)#(*. /,) + 4(')Я(<, K)) + L^{t)H{tt t.) + +lxx(t)H(t, o=o. 14$
Получилось, что матрица #(·, /*) удовлетворяет уравнению ;Якоби. При этом выполнены следующие начальные условия: #(*., K) = ~^-x{tv λ) λ=ο ολ Пусть H(t, to) — матричное решение уравнения Якоби с условиями Η(t0, ίο) =0, H(t0, t0)=I. Поскольку выполнено усиленное условие Якоби, то не существует нетривиального решения h уравнения Якоби, удовлетворяющего условиям h(t0) = =/ι(τ)=0, /ο<τ<^ι (π. 9.2.1). Таким образом, усиленное условие Якоби равносильно невырожденности матрицы H(t, to) при любом fe [/о, t\]. Но тогда снова в силу глобальной теоремы существования и непрерывной зависимости решения от начальных данных [АТФ^ с. 195] (для уравнения Якоби, которое тоже, очевидно, сводится к разрешенной системе первого порядка) при достаточной близости t* к to матрица H(tfJ*) будет невырожденной для любого t^ [t0y t\]. Рассмотрим отображение Ψ(ί, λ) = (/, x(ty λ)) в некоторой точке (?, 0), fe [ίο, U]. Имеем «Ψ'(?. о) = ы(м{ 0) Jt 0))-«ж?, иФО. Значит, по теореме об обратной функции найдется такое δ = = б(?)>0, что если только \ϊ—τ|<δ, |ξ—χ(ϊ)\<δ, то существует единственное λ=λ(τ, ξ), такое, что Ψ (τ, λ (τ, ξ)) = (τ, ξ)»* (τ, λ (τ, ξ))-ξ. В силу компактности графика Γ~ —{(/, x(t)) \t ен [/0> ij} .можно найти одно δο, такое, что для любой точки (т, ξ), |ξ— —х{х)\<Ьо существует (и как нетрудно понять — единственное) λ=λ(τ, ξ), при котором х(ху λ(τ, |))=ξ. При этом гладкость функции λ такая же, как гладкость ху т. е. С2. Построение центрального поля, окружающего экстремаль, закончено. > 10.3.2. S-функция и ее дифференциал. Пусть *(·, λ) — центральное поле с центром /*, окружающее экстремаль £(·)· Функция τ 5 (τ, 1) = \ L(t, x(t, λ (τ, ξ)), x(t, λ (τ, \)))dt и -называется S-функцией центрального поля χ{·, λ). Имеем по определению поля и функции наклона поля *(τ, λ (τ, ξ)) = ξ, (1) *(τ, λ (τ, ξ))-«(τ, ξ). (2) 144
Предположим, что интегрант L — непрерывно дифференцируем в некоторой окрестности графика {(/, x(t)y x(t))\t^ ^[toy t\]}> тогда имеет место следующая формула для дифференциала функции 5: dS<T, l)={L{xy ξ, и (τ, |))-(L.(t, ξ, и (τ, ξ)), и (τ, ξ)»ώτ+ + <L.(t, ξ, α (τ, ξ)), φ. Действительно, дифференцируя интеграл с переменным верхним пределом, используя непрерывность *λ, вытекающую из того, что л;еС2, получим τ ■~=Μτ, ξ. "Κ ξ)) + £«Μ'. *('. λ (τ, ξ)), i(f, λ (τ, ξ))), и 4(t, λ{τ, Θ) Я, (τ, g» + (L;(f, x,(t, λ(τ, ξ)), i(/, λ (τ, ξ))), ix(i, λ (τ, ξ))λτ(τ, ξ)» Λ. Интегрируя второе слагаемое в интеграле по частям с учетом {2) и используя то, что χ{·, λ) есть экстремаль, имеем далее -^- = L<t, ξ, и (τ, ξ))+(Ι;(ί, х(*. λ (τ, ξ)), *(*, λ (τ, 1))), *λ(/, λ (τ, ξ)) λ, (τ, ξ)>|\ (3) Поскольку χλ(ί*, λ(τ, ξ))=0 (так как /* — центр поля), а продифференцировав по т обе части уравнения (1), имеем • Χ(τ, λ (τ, ξ)) + *λ(τ, λ (τ, ξ))λτ(τ, ξ) = 0, то, произведя подстановку в (3), получим нужное соотношение ~ = L(t, ξ, и(ху ξ))-(ί.;(τ, х(ху λ(τ, ξ)), «(τ, λ(τ, ξ))), α(τ,ξ)). Формула для dS/dg выводится аналогично с помощью интегрирования по частям и использования равенства χλ(τ, λ (τ, 6))Xg(Tf ξ) = / {получается дифференцированием обеих частей равенства (1) по ξ). 10.3.3. Формулировка теоремы и вывод достаточных условий в простейшей задаче к. в. и. Основная формула Вейерштрасса. Теорема. Пусть x(-)^C2([t0y t{]y R") — допустимая экстремаль β простейшей задаче (з) п. 9.2Л. Интегрант Le ^Cz(VxRn)y где VczRn+l — некоторая окрестность'расширенного графика {(ty x(t))\t^[t0y t{\}y на Jt(-) выполнены усиленные ус- 145
ловия Лежандра и Якоби, интегрант L квазирегулярен на V^ Тогда х(-) доставляет сильный минимум в задаче (з). < Условия теоремы позволяют (см. п. 10.3.1) окружить #(·) центральным полем экстремалей х(-у λ), покрывающим некоторую односвязную окрестность UaV графика {(/, x(t))\t^: ^Pot *i]}· Пусть x(-)^KCl([to, /J, Rn) — произвольная допустимая функция, график которой расположен в этой окрестности^ 4 Тогда S(tv xx)-S(t0, *e)=fdS(/, x(t)) = \dS(t9 x(t)) = U ίο = \L(t)dt = & (χ (■)),. Отсюда #(*(·))—&&(')) = \L(t% x(t), x(t))dt-$dS(t, x(t)) = = \(L(t, x(i), x(t))-L(t, x(t), u{t, x(t)))~ -{L.x{t, x\t), u(t, x{t)j), x(t)-u(t, x{t))))dt = = ]g{t, x(t),u(t, x(t)), x(t))dt. Эту формулу называют основной формулой Вейерштрасса. Из квазирегулярности интегранта следует (см. п. 9.2.1), что еслш (t, x)^Uy то 6 (ty ху и, *)>0 V(u, x)^knXRn. Таким образом,. l$(t, x(t), u(t, x{t)), x(t))dt>0 и, значит, J{x(-))> Ξ3^ (*(·)), т. e. x(-) доставляет сильный минимум. > §п. ДОПОЛНЕНИЯ 11.1. Задачи линейного и выпуклого программирования Этой теме (выпуклым задачам) было уделено достаточна много места в первой части. Но там мы подходили к проблемам с элементарных позиций. Здесь возвращаемся к тому же кругу вонросов с тем, чтобы посмотреть на него как бы сверху* вооружившись4 арсеналом функционального и выпуклого анализа. 146
11.1.1. Теория двойственности в линейном программировании. Рассмотрим задачу линейного программирования п. 3.1.1 (су jc)«>inf; Ax^b, /3) где xf ceRrt, 6eRm, A — матрица размеров тХп. Включим эту задачу в семейство задач с параметром aeRm {с, χ)-*\ηϊ; Αχ^α. (за) Численное значение задачи (за) S(a)=inf{(c, *>|Лх^а} называется S-функцией задачи (з), 5(6) — значение исходной задачи (з). Нетрудно доказать, что 5 — выпуклая функция. \Найдем {см. в п. 1.5.2 преобразование Лежандра—Юнга—Фенхеля) сопряженную к функции S функцию S*(a,*). Имеем def <S*(a*)=sup{(a*, a)—S (a)} = sup {(a*, a)—inf{(c, x)\Axi^a}} = a a (sup{(a*, Ax) — (c,x)}f a*<0> =sup{(a*, a) — (cf x)\Ax^a} = \ x a,* { + oo, в остальных случаях Jsup{(i4*a·—cf χ», a*<0, jo, А*ат = с, а* < 0, "" I + oo, иначе ~" i + oo, иначе. Найдем вторую сопряженную к функции S функцию S**(a): S"(a) = sup{(a, a*>—S*(a*)} = sup{(a, аГ)\А*аГ = с9 аГ^О). a* При этом S** (6) = sup {(a*, b)\Ama* = c, a*<0}. Задача a* (6, #>-*sup; Л*у=с, у<0, (з*) называется двойственной к (з). Теорема (двойственности). Для пары двойственных задач линейного программирования (з) и (з*) имеет место следующая альтернатива: или значение какой-либо из задач конечно (и тогда конечно значение второй и оба значения совпадают), или значение одной из задач бесконечно, а другая несовместна. <\ Пусть S(a)>—oo V'a^Rm, тогда по теореме Фенхеля — JVLopo (п. 1.5.3) (здесь мы пользуемся замкнутостью функции ^S, поскольку надграфик функции 5 является по лемме о замкнутости конечнопорожденного конуса п. 3.2.1 замкнутым множеством) S**=S, и, значит, если bedomS, то S(i>)=S**(fc) = sup{(i>, y)\A*y = cy #<0}, «а это не что иное, как значение задачи (з*). Если же Ь^Ё ^£domS, то это значит, что задача (з) несовместна. 147
Пусть существует αο, такое, что S(ao)=—<*>. В этом случает 5**==—оо, в частности, def S**(fc)-sup{(b, y)\A*y = ct у<0}=-оо, т. е. задача (з*) несовместна. > 11.1.2. Теорема Куна—Таккера. Мы уже затрагивали эту* тему в первой части (п. 2.3.2), где дали элементарное доказательство этой теоремы. Здесь выведем ее из основных теорем выпуклого анализа. Теорема. Пусть X — локально-выпуклое пространство» fi: X-+R — выпуклые собственные функции, непрерывные в точке £у А — выпуклое множество, χ доставляет абсолютный минимум в задаче /o(x)-^inf; М*)<0, х*=А. (з> Тогда для (з) выполнен принцип Лагранжа. Расшифровку принципа Лагранжа здесь не приводим — он£ выяснится в итоге доказательства. Обратим внимание на то, что здесь наложены требования (локальная выпуклость X и непрерывность Д), которых не было раньше. < 0. Доказательство базируется на: 1) теореме Ферма для выпуклых функций (п. 2.3.1); 2) формуле Моро—Рокафеллара и 3) формуле Дубовицкого—Милютина (п. 1.5.4 и 8.2). 1. Как это не раз делалось без ограничения общности считаем, что fi{x)=0y /=0, 1, ..., /п. Положим f(x) =maxfi(x). Ясно, что если £eabsmin3, то x^absmin(f+6A). Тогда, используя теорему Ферма для выпуклых функций и формулы Моро—Рокафеллара и Дубовицкого—Милютина, получаем 0 е= д (/ + δΑ) (*) = <?/ (χ) + дбА (*) = = co{df0(£) U ... U dfm(x)} + d6A(£). (1) Остается расшифровать (1). Там записано следующее: существуют m m ^E(3fi(4 at>0, £ 06;= 1 и 1*<=ддА(х)у такие, что £ αμ'.-τ + ξ* = 0. По определению субдифференциала, учитывая, что fi(x)~ = 0, получаем ft(χ)>(л**, х—*х), 0;>(|*, *—#), xgA Умножал на щ и суммируя, приходим к принципу минимума: m а неотрицательность <xi и условие дополняющей нежесткостй уже выполнены. |> 148
11.2. Ляпувдвские задачи К этому классу задач редуцируются многие проблемы оптимизации, в частности линейные задачи оптимального управления. Одна из их примечательных особенностей — наличие скрытой выпуклости, т. е. выпуклой структуры, которая на первый взгляд не видна в них. Однако именно выпуклость предопределяет то обстоятельство, что в ляпуновских задачах необходимые условия смыкаются с достаточными и они реализуются в виде принципа минимума. Теорема (принцип Лагранжа для ляпуновских задач). Пусть (Г, Jf, v) метрическое пространство с борелевской мерой ν (3$ — совокупность борелевских множеств), U — топологическое пространство, fcrTXiZ-^R — непрерывные функции, ;=0, 1, ..., т9 Χ — линейное пространство, gi — выпуклые конечные функции на X при ί=1, ,.., mf и аффинные при i=m'+ -Η, ..., m9 A — выпуклое подмножество X, пара (ώ(·), χ) доставляет абсолютный минимум в следующей задаче*: ^oH-)) + £o(*)-*inf; ΛΗ·)) + £ί(*)<0, ί=1, ..., m', Fi(ti{')) + gi(x) = 09 i = m' + l, ..., m, *е=Л, Fi(ti())=^fi(t, u(t))dv. Тогда для задачи (з) имеет место принцип Лагранжа, т. е. существуют множители Лагранжа λ=<(λο, ..·., Кт)^Ит+1 и КФО, такие, что выполнены: а) принцип минимума по и и по χ m m min 5]Я4/|(/, u)= £λ£/,(ί, κ(0) π· в., m m min У!я^(х)== Yhgi(xy, б) условие неотрицательности λ*;>0, i = 0, ..., m; в) условие дополняющей нежесткости h(Fi(u(.))+gi(x))=0, t=l, ...,m'. Нетрудно понять, что если λο>0, то условия а), б) достаточны для того, чтобы (й(·), х) было решением задачи (з). <\ 0. Доказательство теоремы опирается на следующие факты: 1) теорему Ляпунова (п. 7.3), 2) теорему Куна —Таккера * Которую, собственно, и называют ляпуновской. 149
п. 2.3.3, 3) условия экстремума для простейшей задачи оптимального управления [АТФ, с. 360]. 1. Обозначим: V совокупность измеримых отображений из Τ в I/, обладающих тем свойством, что fi(t9 ti{t))e eli(Г, 3&> ν), и через F:V-^Rm+1 отображение F(*/(·)) = -iF0(n(·)). ....М«(·)). Лемма. Образ F(V) — выпуклое множество в Rm+l. <<J Пусть 0<α<1, &(==F(V)9 /=1, 2(«=>Эи/(.)€= eV:F(ii,.(.))-^/-1.2). ■ Положим Pi(t) = fi(t, М0)-М*. МО), И(Л)=($М0*>, ..., 5pm(0dv). Ясно, что μ — непрерывная векторная мера на (Г, Jf). При этом μ(0)=Ο, μ(3Γ)=ξ1—^ξ2. Вследствие теоремы Ляпунова (0.1) существует множество Ла, такое, что μ(Α^ = α(1*-ΐη = (Ιρ0(ί)άν, ..., $pm(f)dv). Тогда def Id «(Й—ё)—ί/ί(<· Ui(t))d»+ J fi(t,u2(t))dv- - J Λ(*. «ι(')>*> = J Μ*. М0)*-Й. Αχ Γ\4α Из этого равенства видно, что если положить то получится F(Ua(·))— |2=α(|1—|2)=^(«α(·))=α£4(1— -а)Г- >D> 2. Обозначим z= (г0, ..., zm)eRm+1, ξ=(χ, г), <p,(i) = =£«(*)+ζ* и рассмотрим задачу φο(|)-κηί; φί(|Χ0, 1=1, .... m', (з) «рг(£) = 0, i=m'+l, .... m, £e=i4X!Fj(V). В силу леммы это задача выпуклого программирования. Если (й(·)» *) — решение задачи (з), то C=(j£, F(u{-))) — решение (з). Остается применить к (з) теорему об условиях экстремума t(0.3) и получить требуемые соотношения а)—в). > 150
11.3. Задачи оптимального управления, линейные по фазовым переменным / Пусть Δ= [to, t\] — конечный отрезок числовой прямой, ar.A->Rn, t=0, 1, ..., m, и А(·) :A->S,(R/l, Rn) - векторные и матричная функции, U — топологическое пространство, ft: ΔX f/->R, ί=0, 1, ..., m, и F: ΔX U-*Rn — непрерывные функции, γοί, γπ, ί=0, 1, ..., m, — элементы R". Экстремальная задача #о(*(), «(·))-* ini; 4Г((х(), «(·Κ0, ί-1, .... т\ #*(*(·). «()) = 0, ί=Λΐ'+1, ..., m, x(9 = i4(0*(Q + F(/f w(0), u(t)<=V п. в., #ι<*<·). ИОН «J «МО. *<0>+М*. *(<)))*+<Vtl. *(«> + (?!!. *(*,)>. Δ в которую величины, связанные с фазовой траекторией, входят линейно, называется задачей оптимального управления, линей-? ной по фазовым переменным. Обозначим Ш множество измеримых отображений ί/:Δ~->ί/, таких, что функции t-*U(t, u(t))f t-*F(t, u(t)) интегрируемы. Пара (χ(·), «(·)) называется допустимым процессом, если х(-) :A-*Rn — абсолютно-непрерывная вектор-функция, и(«)е е<2/, x(t)=A(4)x(t)+F(t9 u(t)) п. в. и выполняются соотношения &i(x(-), u(-)X09 l<i<m. Теорема (принцип максимума для задач оптимального управления линейных по фазовым переменным). Пусть в, задаче (з) Δ= [to, t\] — конечный отрезок числовой прямой, at(-)e «ξξΖ,^Δ, Rrt), A(-)t=Li(ti, ^(Rn, R")), i/ — топологическое про- странство, fi и F — непрерывные функции и отображение в R", определенные на ΔΧίΛ 1) Если допустимый процесс (Я(·), й(·)) доставляет абсолютный минимум задаче (з), необходимо, чтобы был выполнен принцип Лагранжа, т. е. нашлись бы λ= (λο, ..., λm)eRm+1 и абсолютно непрерывная функция /7(-)A->Rrt, (λ, р(-))^09 такие, что выполняются: m а) уравнение Эйлера — ρ(/) = ρ(/)-Λ(<)+Σλίαί(ί); £=0 т б) условия трансверсальности p(tk) = (—1)* J^vw; & = 0, 1; в) принцип максимума т max(p(t)F(t, и)-2>,М'. ")) = 151
m = (ρ (0 F (t, u(t))-T, Xtft (t, u(t))) п. в.; 1=0 г) условие неотрицательности λ^Ο, O^t'^m'; д) условие дополняющей нежесткости λιΣίί {χ (·), й (·)) = О, 2) £слы для допустимого процесса (*(·), ώ(·)) существуют такие λο>0, ЯеЯт и р(-)^ЛС(Д, Rn), <*τό выполняются условия а)—д), го (*(·)> #(·)) доставляет абсолютный минимум задаче (з). < 0. Доказательство этой теоремы основывается на: 1) принципе Лагранжа для ляпуновских задач (см. предыдущий пункт) и 2) редукционной лемме из теории дифференциальных уравнений, которую мы докажем в п. 1. 1. Редукционная л емм а. Пусть Δ= [ίο, t\] —конечный отрезок, U — топологическое пространство, a(-)eLi(A, Rrt), A(-)<=LX(A,2(K\ R")). F<=C(AXi/, R"), /eC(A, i/), Δ где #(·), u(·)) связаны дифференциальным уравнением x(t)=A(t)x(t)+F(t, u(t)) п. в. Тогда имеет место равенство #<*(·). «(ОН J«P(0. ^ «(0)> + /(ί. tt(t))dt + Δ + <Υο-Ρ('ο). *(«>. (1) где ρ(·) — единственное решение линейной системы -p{t) =p{t)A(t)+a(t), p{tx) =-Vl. <]<] Действительно, по теореме существования и единственности (АТФ, с. 191] функция р(·) определяется единственным образом. Тогда J (a(t), x(t)) dt = (из выражения для /?(·))= — \ (р(0 + Λ Δ + ρ(ί)Λ(ί), λ; (ί)) dt = (интегрируя по частям) = = -</>(.). *(0>| +i<i(0-^W^(0, Ρ(0>Λ = U Δ = <Vi> *<*1»-<Р('о). *(Ό» + ί <Ρ<0. F(t, u{t)))dU\ Δ откуда немедленно следует (1). t>D> 152
2. Из леммы следует, что если (£(·), U(«))^absmin3, то #(-)^absmin3', где S«Pe(0. F(*. «(<))> +Μ*. u(t))dt+(y00-p0(t0), x(t0))-+ini, (з') Δ J «ft(o, F(i, «w)>+m*. и(<))л+(т^-л(д, *(*«»^с„ Δ —p{ = ptA + ai9 Ρί(<!)=—νι4. Теперь остается применить к ляпуновской задаче (з') принцип максимума. Согласно ему найдутся числа λο, λι, ..., λ™, удовлетворяющие принципу минимума, условиям дополняющей нежесткости и неотрицательности (для (з')). Если теперь по- т ложить р(0= £λ«Ρί(0ί то> как легк0 понять> УДОвлетворяют- ся условия а)—в). Достаточность следует из достаточности принципа максимума в ляпуновской задаче. [> 11.4. Уравнение Эйлера для простейшей задачи классического вариационного исчисления в многомерном случае 11.4.1. Постановка задачи. Пусть Ta:Rm — ограниченная область'в Rm с гладкой границей дТ. Простейшей задачей классического вариационного исчисления называется следующая экстремальная задача в С1(Т): ff(x(-))=lHt, x(t), x(t))dt^extry х\дт=1. (з) Здесь L:RmXRxRm->R — функция 2m+ 1 переменного. Экстремум в задаче рассматривается среди функций л;(-)е ^С1(Т)У удовлетворяющих краевому условию: ограничение х(-) на границе дТ должно совпадать с непрерывной функци- \ δίχ dtm J Говорим, что допустимая функция х(-) доставляет слабый локальный минимум (максимум) в задаче (з), и пишем, как обычно, х(-)^1оатппз(1остахз), если существует б>0, такое, что для люхбой допустимой функции х(-), для которой ||λ:(·) — ~* (·) IIι<δ, выполняется неравенство 9 (χ (.·)) ->3f (χ (·)) №(χ(·))<*{*(·))). 153
При этом напомним, что С1 (Г) — пространство непрерывно дифференцируемых в Τ функций, где ||*(.)||0:==тах|*(0|. /67 11.4.2. Необходимое условие экстремума. Теорема. Пусть £(-)&С1(Т) доставляет слабый локальный минимум в (з), а интегрант L непрерывен вместе со своими частными производными по χ, χ в некоторой окрестное* ти множества {(*, *(f), x(t))\t^T] и при этом Ζι(ί)^&(Τ). Тогда выполнено уравнение Эйлера —divLx(t)+Lx(t) = 0. <\ Рассуждаем аналогично тому, как рассуждали при выводе необходимых условий в задаче Больца или в простейшей одномерной задаче. Берем произвольную, но фиксированную функцию х0{-)(==Со1{Т):={х(-)€аС1(Т)\х\дт=0}. Тогда *(*) + + λ*(·) — допустимая функция VXeR. Положим φ(λ): = —&{χ(-)+λχ{-)). Из условия i(-)elocextr3 следует, что Oelocextr<p. Пользуясь дифференцируемостью φ в нуле (вытекающей из теоремы анализа о дифференцируемости под знаком интеграла), приходим к выражению для первой вариации φ'(0)=«#(*<·). *(.))«= S«L;(f), *(/)) + Τ + tx{t)x(t))dt = 0 Vx(-)e=Cl0(T). (1) А теперь остается воспользоваться классической формулой Остроградского [10, т. 2, с. 272; 15, т. 2, с. 97], согласно которой l(L-(t), x{t))dt=-ldivL.(t)x(t)dt. (2) Из (1) и (2) получаем, что (—div Lx(t) + Lx(t))x(t)dt = 0 Ух(.)е=СЪ(Т). (3) Если теперь допустить, что в некоторой точке из Τ функция f-> a(t): = ~divLx(t) + Lx{t) не равна нулю {для определенности положительна), то в силу непрерывности α(·) существует маленький шар В{1, р)сГ, обладающий тем свойством, что a(t)>0 Vt^Btf, ρ). Теперь можно положить 154
x(t) = { и, убедившись, что х(*)&Со1(Т) прийти к противоречию, ибо 0=la(1)x(t)dt= J a(t)x(t)dt> min a(t) f х(0<#>0. > 2' , в(7,р) teB&p) B(7>p) 11.5. О теоремах существования и прямых методах в вариационном исчислении и оптимальном управлении Проблематика существования решений играет весьма важную роль в теории экстремальных задач. Обсудим эту проблематику на примере простейшей задачи к. в. и.: #(*(·))= $L(i, х, *)df-»inf; x(t0) = x0, *(*!> = *!, L:R3->R, и (з) быть может, с условием, ограничивающим производную: ie e=f/c:R. Попробуем раскрыть причины, вследствие которых задача может не иметь решения, обсудив примеры 3—5 п. 4.2.4. 1) Невыпуклость интегранта по х. В примере 5 интегрант имел вид L(x9 x) = ((l—х2)2-Ьх2). Функция я-> ->L{x, x) здесь не выпукла. Именно это обстоятельство позволило устроить в п. 4.2.4 «скользящий режим» и обосновать невозможность существования решения. Как показывает пример с задачей Ньютона (L(i, x)=t/(l+x2), i/=R+), невыпуклость интегранта не всегда влечет несуществование решения. 2) Недостаточный рост интегранта. В примере 3 (Вейерштрасса) интегрант L имел вид L(i, x)=t2x2. Функция x-+L(ty x) имеет вполне достаточный (квадратичный) рост при всех ty кроме ί=0. Функция L(0, x) тождественно равна нулю. И именно это обстоятельство — отсутствие роста интегранта по i — здесь является причиной того, что решения нет. Как известно, решение не всегда существует и в задаче о мини- мальной поверхности вращения, когда L(xt x) = xV 1 + х2· Здесь рост интегранта такой же, как у линейной функции, а этого также недостаточно. Следует отметить, что в обоих случаях чуть измененные интегранты (L(t> x)=t2/H2 — пример Гильберта и L(x, x) = Vl + x2/x— «плоскость Лобачевского») обладают свойством существования. Таким образом, недостаточный рост интегранта также не всегда приводит к несуществованию решения. 155
3) Неограниченность функционала снизу. В примере 4 интегрант L имеет вид L(xy х)=х2—х2. В этом случае наличие сопряженной точки влечет за собой неограниченность функционала снизу, и это обстоятельство, разумеется, приводит к несуществованию решения. Если устранить все три отмеченных обстоятельства, то можно добиться существования решения. Приведем, скажем, такой результат. Теорема Тонелли. Пусть в задаче (з) интегрант L допускает оценку L(t9 χ, х)^а\х\"+$9 где α>0, ρ>1, {ty χ) принадлежит некоторой связной замкнутой области GczR2, содержащей точки (/0, *о), (*ι, *ι), и при этом функция x-+L(t, χ, χ) выпукла для любой пары (ty x)^G. Тогда среди всех абсолютно непрерывных кривых, график которых расположен в G, существует кривая, доставляющая минимум в задаче (з). . Как видим, условия Тонелли позволяют избежать всех трех причин несуществования решений, о которых говорилось выше ,(L предполагается квазирегулярным (<=>x-+L(tyx, χ) — выпукла), рост по χ больше линейного и интегрант ограничен снизу). Мы не приводим доказательства теоремы Тонелли, отсылая читателя к книге [1]. Отметим здесь же, что квазирегулярность интегранта с теоретической точки зрения можно всегда считать выполненной. Приведем соответствующий результат. Теорема Боголюбова. Пусть G — замкнутая связная область в R2, содержащая точки (ίο, *о), (*ь χι)> L — непрерывная функция б GxR, £ — овыпукление функции х-*~ *->L(f, ху х)у (ΐ, x)eG (■<=>£(t, ху ·) — это вторая сопряженная в смысле выпуклого анализа функции L(ty ху ·)), и &(x(-)): = lZ(ty xf *')df-*inf; *(f0) = *0, x(t^ = xv (з) — простейшая задача с интегрантом L. Тогда численное значение в задаче (з) {при условии, что графики функций х(-) лежат в G) совпадает с численным значением задачи (з) и, более того, для всякой функции x(-)^Cl([t0y t\])9 χ(ί0)=χ0, x(ti)=X\, ((t> x)^G Vt^[to, U\) существует последовательность {Xn(-)}n^\ с теми же свойствами, такая, что Хп(-)-+х(-) в пространстве C([t0y U\) и lim # (*„(·))== ^ (*(·))· Оптимальное управление предоставляет новые возможности для подхода к проблемам существования. Например, имеет место Теорема. Пусть в задаче (з) с дополнительным условием \х\^А интегрант L определен, непрерывен в R3 и квазирегуля- 156
рен. Тогда если существует допустимая функция, то существует \и решение задачи.. < Доказательство этой теоремы очень просто. Проведем его лри дополнительном предположении о гладкости L по х. Пусть {Хп(-)}п^\ — минимизирующая последовательность. Из условий Xn(to)=xoy \in{t)\<.A вытекает по теореме Арцела (10, ч. II, *с. 392) компактность {#η(·)}«>ι Β пространстве С ([to, t{]). Значит, можно считать, что Хп(-) равномерно сходится к ί(·) и Хп(') сходится κί(·) слабо (<=> μχη(ή—x(t))a(t)dt->0 Va()e to ^C([*o> Ί1))· Но тогда в силу компактности, {хп()} непрерывности и квазирегулярности L, оценок \&η{ί)\<Ά9 \χ(ί)\<.Α и слабой сходимости {#«(·)} κί(·) получаем def h . Λ ^ id &{хп(-))-4Г{х{-)) = \(Щ, xn(t), xa(t))-L(t9 x(t), x(t))dt = = ](L(t, xn(t), xn(t))-L{t, xn(t), x(t)) + L(t, xn(t), x(t))~ и h -L(t, x(t), 7{t)))dt>l{xn{t)~x(t))L-x(t, xn(t), x(t))dt + rn = (. ■ U . χ ■ .χ = Н*«(0~*(0)(^(/. xn(t), xit))~h(t, x(t), x(t))+ и + Li(tt x(t), x(t)))dt = pn + pfn + rny |pn|-*0, !p;h0, |гя|-*0. Итак, ит&{хп()) = о/(х(·)), т.е. х(·)—решение задачи. \> /1-Х* В течение длительного времени в вариационном исчислении противопоставлялись классические методы, основанные на выводе и исследовании уравнений Эйлера, и построение решений с помощью предельных переходов (здесь центральную роль играют теоремы существования). Доказанная только что теорема позволяет в принципе исследовать простейшую задачу к. в. и. классическими методами, минуя теорию достаточных условий [АГТ, с. 199]. Что касается численных реализаций прямых методов, то в вариационном -исчислении издавна применялись методы Ритца и Галеркина [4]. § 12. РАЗНЫЕ ЗАДАЧИ 12.1. Задача о мягкой посадке космического аппарата Рассмотрим задачу о мягкой посадке космического аппарата хна плоский участок небесного тела, лишенного атмосферы. Призером такого небесного тела может служить Луна. 15Z
Пусть космический аппарат движется по прямолинейной траектории, перпендикулярной поверхности небесного тела, m(t) — масса аппарата в момент /, x(t) — расстояние его от поверхности тела. На космический аппарат действуют сила тяжести — ут и сила тяги ku. Коэффициенты γ>0 (ускорения силы тяжести) и k (ускорения силы тяги) предполагаем постоянными; на управление и накладывается ограничение O^u^U. Тогда по второму закону Ньютона динамика полета опишется уравнениями: mx=ku—γ/η, m = —и, O^w^i/. (*) Поставим цель мягко посадить аппарат, затратив минимум топлива (не фиксируя времени посадки). Это приводит к следующей формализации (обозначаем x(t) через Х\у т(0) череа Хи т(0) через т0, время посадки через Г): т0—m{T)-+ini\ хг = х29 x2 = (ku/m)~y, т=~и, ^1(0)=ξ1>0, *i(0) = b, w(0) = /Hof Xl{T) = x2(T) = 0, 0<w<i/. Действительно, разность между начальной и конечной массой равна затраченному топливу, числа *ι(0), д:2(0) и т0 характеризуют начальные положения и начальную массу аппарата, соотношения Χι(Τ)=χ2(Τ)=0 означают, что посадка произведена мягко — в нужную точку аппарат опустился с нулевой скоростью. Мы пришли к задаче оптимального управления. Функция Лагранжа τ ^ = λ0(/η0-/η(Γ))+^ (μ*ι-*2)+Ρ2 (^--~+ν) + О + Р8 («+")) #+ИЛ(Т)+ИЛ(Т). Неинформативные закрепленные на левом конце краевые уело· вия в функцию Лагранжа не включены. Необходимые условия: а) уравнения Эйлера —Ρι = °. — Рг~ Pi = 0, —Ps + Pa—Τ = °ί б) трансверсальности по х Ρι(Γ)=— μι, Ρ2(Τ)=— μ2, рг(Т)=10; в) оптимальности по и min (р3(0и~р2(0 -^-) = р3 (0u(t)~p2{t) -^Ь o<u<u \ m(t) } m(0 158
τ) стационарности по Г -Я>(Т) + ил(Т)+щха(Т) = 0«Л0ы(Т)-р2(Г)(-^~¥)=0. Из а) следует, что P\(t)=*p = const9 P2(t)=:—pt+q9 <7 = const. (1) Обозначим ψ(ί)=—Pz(t)+kp2(t)/m(i). Тогда из а) получим $(t)=-kp/m{t). (2) Из условия стационарности по Τ приходим к равенству Ъ(Т)й(Т)=р2(Т)у, (3) .а из оптимальности по и находим ~ ίΟ при ψ(0<0, U{t)-\U при ψ(ί)>0. Если р=0, то из (2) следует, что tf == ψο=const. При этом ψο^Ο, иначе из (1) и (3) получится, что р2=0> и все множители Лагранжа окажутся нулями. Поэтому либо U(i)ss0, либо a(t)s=U. Если же рфО, то функция ψ строго монотонна и, значит, имеется единственное переключение с й(£)г={7 на й(£)=0 или, наоборот, с й(£)=0 на u(f)s=i/. Однако легко лонять, что первый случай невозможен, ибо нельзя мягко посадить ракету с выключенным двигателем. Значит* остаются лишь две возможности: либо двигаться без переключений с u{t)s=U, либо сделать одно переключение с нуля на U. Пусть τ — момент переключения. Движение аппарата при t^x задается формулами свободного падения: *ι = ξι+ξ*ί—γ'2/2, *2=!2—γ*, m{t)=m0. В фазовой плоскости (х\, Хъ) эти соотношения определяют .параболу *ι = ξι+|2(<|2—*2)/γ—(h—*2)2/2γ. Движение аппарата ла участке [т, Г]_ определяется уравнениями (*), где u(t)ssU, ^ι(τ)=ξι, ^2(т)=|2, m(x)=m0. Решение соответствующей задачи Коши имеет вид (т+а= -о.- χι (τ + α) = &—Υα—* 1η (1—Ualmo)> m = mo—^α· Множество точек (ξι, |г), из которых можно прийти в начало координат, включив двигатель на полную мощность, задается в параметрической форме уравнениями Х\(а)=Х2(а)=0, Исключив из этих двух уравнений параметр а, получаем кри- 15£
вую Ψ (ξι, Ы· Так приходим к окончательному ответу: следует в течение времени τ, определяемого первым положительным корнем уравнения Ψ(ξι+ξ2τ-γτ2/2, ^-Vt)=0, (4) предоставить аппарату возможность двигаться свободно, а затем включить тягу на полную мощность. Если при данных (1ь Ы уравнение (4) не имеет решения, мягкая посадка невозможна. (Об этой задаче см. А. М. Летов. Динамика полета и управление. М.: Наука, 1969). Много интересных вопросов теории оптимального управления содержится также в книге Ли Э. Б„ Маркус Л. «Основы теории оптимального управления» (М.: Наука, 1972). 12.2. Задача Годдарда Исследуемые здесь вопросы навеяны одной проблемой раке- тодинамики. Движение управляемой ракеты в однородном поле описывается системой уравнений x = vy v=P(u/m+g, rh=—P/k. Здесь χ, ueR3 — векторы положения и скорости ракеты, ω — единичный вектор в R3, Ρ — величина тяги ракеты, m — ее масса, g — векторная величина, характеризующая поле тяготения (в нашем случае — в случае однородного поля — постоянная величина), k — константа, отражающая зависимость расхода топлива от тяги. Положим и=Ро)/т, из уравнения т=—P/k получаем (й(т/т)=—u/k. Умножив теперь обе части последнего равенства на ω и учитывая, что ω и и пропорциональны, получим То ^=--^=*m(T0) = m(0)e4)(~-i-J|a|diJ. о Пусть в начальный момент /=0 положение, скорость и начальная масса ракеты известны. Спрашивается, как следует управлять, ракетой, чтобы в фиксированный момент времени Т0 она достигла заданной точки с заданной скоростью, израсходовав минимум топлива. Легко понять, что эта задача приводит к следующей формализации: т, - ^ |tt|df-*inf; x = u + g9 х(0) = х09 x(Q) = v0, ϋ <з> x(T0) = xlt x(T0) = Vl. При решении несущественно, что χ принадлежит R3. Далее считаем, что все векторы х, g, x лежат в пространстве Rn. 160
Решим задачу методом двойственности, сведя ее к Ляпунов- ской. Имеем в силу того, что x=u+g: x(t) = v0+^(u+g)dT*$v1 = v0 + § udt + gT0, * . gT2 T{ x(t) = x0+[xdx=$x1 = x0 + u1T0 γ Γ 2 Г. tudt» α ο Таким образом, мы пришли к ляпуновской задаче ■'о То То f \u\dt-+ini; С udt = t), f tudt = \, о о о где gT2 I^Xo—Xx + oJO —, η = ι*!—ι>ο—£Γ0· Значение задачи обозначим 5(ξ, η). Ясно, что 5 определена и конечна (а следовательно, непрерывна) на всем R"X Неприменим метод двойственности. Имеем S'{p, д)Ш sup «ξ, ρ) + <η, q)-S(t, η)) 22 (i.H) = sup ((ξ, ρ> + (η, 9> —inf{J" |«| dt\\udt = r\, $ <иЛ = |})=· (*'η' ооо τ = sup(Ut(u(t),P) + (u(t),q)-\u(t)\)dt) = Ы(.) W / Го = f sup((a, tp+j)— \u\)dt = "Г = f 0, |ф + ?|<1 Vt(=[0,TJ, + oo, 3τ e [0, T0], такое, что |t/j + ^|>1. Опишем множество А пар (р, ?), для которых \tp+q\*£.l We[0, То]. Имеем tp+q = -~{T0p+q)+(\ ^)ч^ А=М <7)||7> + <71<1, 1<7!<1}· 161
Теперь по теореме Фенхеля—Моро можно сразу найти численное значение задачи (в выкладке вводится обозначение г= = ToP+qop=(r-q)/T0): def S(l, T)) = S'*& *l)=siiP(a ρ> + (η, q)-S*(p, q))- : sup «ξ, p) + (η, 9»7= sup ((ξ, -JL\+ (</, η--|-)) = ^IJ-I+L—Lul **-**\ Ό +JEi.\ + It· ι! τι 1 τ ■ *■ о I ι 'ο I I *o I I -«ο Δ I T„ ° 2 + Импульсное управление ^(0=(£^~uo~^)6(i)~(r"^~ul + "fL)6(i~7'o)· где δ(·) — δ-функция Дирака является, очевидно, допустимым и оптимальным: То Т0 То )to(t)dt=l $ о о JS(f)tf = f|, $£(ί)Λ = ξ, J |i(OI*=S(b η). Оно и доставляет решение задаче. Нетрудно показать, что в общем случае, когда векторы ξ и η—ζ/Το имеют разные направления, решение задачи (з) единственно. В вырожденном случае, когда векторы ξ и η—|/Г0 оба отличны от нуля и имеют одно направление, имеются и импульсные (и даже с единственным импульсом) и непрерывные управления. Об этой задаче см. также «Основы теории оптимального управления» под ред. Н. X. Розова (М.: Знание, 1973). 12.3. Задача Улама В книге С. Улама «Нерешенные математические задачи» ί(Μ.: Наука, 1964) поставлен вопрос: как минимизировать сумму длин путей, проходимых концами единичного отрезка, перемещаемого в плоскости из одного заданного положения в другое? Решим частный случай задачи, когда требуется перевести отрезок [Л0, В0] у Л0=к(а, 0) в отрезок [Аи Вх], Αχ = 1—α§ 0) (см. рис. 4). 162
Рис. 4 Решим эту задачу, Формализация: применив к ней принцип Лагранжа. lw. *?+*! + -sin tf+(*2 + cos t)2) dt -* inf; *ι(0)=*2(0)=0, *ι(π)=ξι, Λ2(π)=ξ2. (з) Функционал в (з), как нетрудно понять, выражает сумму длин путей начальной точки отрезка A(t) = (x\(t), x2(t)) и конечной точки B(t) = (xi(t)+cost9 x2(t)+sint). При этом угол t> образуемый отрезком АВ с осью Охи монотонно изменяется от нуля до π. С. В. Бурцев показал, что для любой траектории Ж перемещения отрезка А (0)5(0) в отрезок А(п)В(л) и для любого ε>0 найдется траектория описанного типа, у которой функционал может быть больше лишь на ε суммы длин путей концов отрезка траектории К. Значит, полное решение задачи (з) даст и решение задачи Улама. Задача (з) редуцируется к ля- пуновской: я π l(\u\+\u-O(t)\)dt-*ird; Jud* = g, о о где ξ=ίξι, Ь), и=х, v(t) = (sint, —cost). Положим L(ty и) — = | и | + J и—υ (t) I + Хи (случай λο = 0 невозможен). Принцип минимума дает minl(/, «) = £(*, Z{t))^-K^du(\u\+\u-v(t)\)(u(t)). (l)> u6R' Из (1) и формулы для субдифференциала суммы получаем: если u(t) не есть нуль или v(t), то «(/) «(0-р(0 ι»ωι |и (0-о(01 -λ. (2) Расшифруем соотношение (2). Возможны два случая: |λ|<2 или |λ| =2. В первом случае из соотношения (2) видно, что два единичных вектора в сумме дают —λ. Этим оба вектора определяются однозначно с точностью до перемены их местами. 163;
Итак, пусть —λ=/ΐι + /ζ2. Тогда u(t)f\u(t)\ равно или пи или /г2, т. е. направление скорости первого конца (при условии, что |λ|<2 и оба конца движутся) — либо пи либо /г2, а направление скорости второго конца — либо п2 (если скорость А равна η'ι), либо Λι (если скорость Л равна п2). Если же |λ|=2, то скорости А и В имеют одно направление, что может быть лишь в вырожденных случаях, который в нашем частном случае не реализуется. Таким образом, направление скорости конца либо совпадает с пи либо с п2, либо скорость равна нулю, либо равна ν{ί). Теперь можно разрешить задачу Улама в нашем случае. Движение изображено на рис. 4. Левый конец двигается ло ломаной АоСАи правый конец — по отрезку BqB\ затем по дуге В'В" единичного радиуса, левый конец в это время фиксирован в точке С, а затем — по отрезку В"В\. Их скорости при движении по отрезкам направлены вдоль векторов пх и я2, образующих с осью Ох\ угол а, равный arcsin (чита- 2а + 1 тель без труда решит соответствующую геометрическую задачу). Данная траектория удовлетворяет принципу минимума и, значит, доставляет минимум в задаче, ибо при λο^Ο необходимое условие является достаточным. 12.4. Теорема Чебышева об альтернансе В этом и следующем пунктах покажем, как применяется теорема об очистке. Докажем следующий результат. Для того чтобы полином р(-) степени ^п—1 наименее уклонялся от непрерывной функции х(-) в метрике пространства С ([ίο, t\\) необходимо и достаточно, чтобы нашлись s^n+1 точек, в которых х(-)—р(·) принимает, чередуясь, свои максимальное и минимальное значения. Напомним, что полином наименьшего уклонения в пространстве С ([ίο, ti]) определяется соотношением (&n=[P('-)\PV) = t.Xkf-1}) \\*{-)—р{-)\\т.м)= min ΙΙ*(·)—Ρ(·)ΙΙα[*οΛϊ)· <\ Необходимость. Естественно предположить, что jt(-)G£^„. Рассмотрим выпуклую задачу без ограничений в R": f(x)= max f(t, x): = \\x(-)—p(-)\\c(itM): = . *6Ι*.ΛΙ = max \x(t) + y x/ *-1J inf. 164
'Функция / — непрерывна и, как легко понять, растет на бесконечности. Значит, по следствию из теоремы Вейерштрасса решение χ задачи существует и тогда Оед/ (£). Применяем теорему об очистке. Согласно этой теореме, если Q^df(x), то найдутся s<n+l точек ίο<τι<τ2< ...<τ5<ίι, s чисел аь ..., as и s векторов yi^dxf(%i9 x)9 таких, что f(xi9 х)=||^(-)-Р(-)!!с(е/0л)Ь J «, = 1, £ еад, = 0. (1) ί=1 t=l Вследствие того что /(τ/, ί)=5^Ό, субдифференциал д*/(тг, .v) совпадает с производной. Дифференцируя x-+fixi, х) по χ в точке х9 получаем yi=sign(x{xi)-p(xi)) (1, xif ..., τ,·*-1)· (2) Из (1) и (2) вытекает, что система S £ ajSign^iTO—р(т,))т?=:0, ft = 0f 1, ... ,/z-l, (3) лмеет нетривиальное решение и, значит, s=#+l. Умножая Лг-тое уравнение на Xk и складывая, получаем £ aisign(*(Tl)-p(Tl))p(ti) = 0 Ур(-)еУя. (4) Пусть р, (·) e^n, 1^Ξί<νζ, такой полином, что Pi(t/)=6t7, Из (4) получаем a* sign (* fa)—ρ (χι)) + ая+1 sign (χ (τη+1)—ρ (τη+1)) ρ, (τΛ+1) = 0, т. е. sign (xt (τ,)—ρ (χι)) = —sign {χ (τη+ι)—ρ (τπ.Η)) sign pt· (τη+ι), (5) ло, как легко понять (из определения pi{xnjr\)), signpi(Tn+i) = = (— 1)*"Л т. e.^sign(x(T„+i)— ρ(τ„+ι))= — sign(*(rj —ρ(τ„)) == M=sign(A:(Tn_i)—p(a:(t„-.i))= ..., иначЁ говоря, в точках {т^}"!} функция х(·)—fi(-), чередуясь, принимает свои максимальное и минимальное значения. Достаточность. Пусть в точках ίο^Χ\<. ..<xs^tu s^n+1, функция χ(·) —ρ(·) принимает, чередуясь, максимальное и минимальное значения. Если допустить, что для некоторого ρ (г)еЕ&>п ΙΙ·^(·)—р(-)11с«/.А1><; Н-ж (·)— -то окажется, что числа Ρ{χϊ)—p(xi) являются попеременно то -отрицательными, то положительными. Но тогда функция /){·}— 165
—ρ(·) должна иметь ^я нулей. Это невозможно, так как. Pl·)—Ρ ('У — полином степени ^л—1. Получили противоречие* из которого следует требуемое. {> 12.5. Неравенство Бернштейна Для любого тригонометрического полинома *(·) степени rt имеет место неравенство -π,π]). Это неравенство является точным, и оно достигается на функции t-+A sin(nt+γ). <] Рассмотрим следующую экстремальную задачу в R2n+1: Ы*>- - *(0)--£^fe^inf;M*)= max К+ η "+JJ (**sin Arf + x*.f„cos&) I < 1 (*=(x0, л:1э ... , x2n), η x(t) = x0 + V (^sin^ + Ar^nCOS^i)). (з> Это задача выпуклого программирования, так как функции fu /=1, 2, выпуклы. Из теоремы Вейерштрасса и того обстоятельства, что множество {x^R2n+l\fi(x)^l} компактно вытекает, что решение задачи (з) существует. Обозначим его x+-+x(t). Применяя теорему Куна—Таккера (п. 2.3) (и учитывая, что выполнено условие Слейтера), получим, что существует число λ>0, при котором функция x-^S(xy K):=fo(x)+K(fi(x)—l) имеет минимум в х, т. е. 0sdxj7(£y λ). Ясно, что λ^Ο. Из теоремы об очистке (п. 8.2) следует, чта существует s<2/i+2 точек Τι<τ2<...<τ5, где |*(τι)| = 1> и s чисел αϊ, ..., α5, at>0, Σα,= 1, таких, что (более подробно подобное объяснялось в предыдущем пункте): s λ V* a{Sign£(Tf)(l, sinx*,... fcosnXi)~ -(0, 1,2, ...,/г,0, ...,0) = (0, ...,0), откуда, умножая соответственно на л*0, ..., χ2/ι, приходим к равенству s λ Σ at si§n x (τ»)x (τί) = — * (0) V x (t) = 166
= *o + Σ (**sin kt + **+" cos *<)· (*) Ясно, что 5^2/г, ибо в точках τ* х[ъ) достигает максимума и, значит i(tt)=0, а полином j6(·) степени п не может иметь больше 2/ζ нулей. Если допустить, что s<2/z, то мы присоединим к {ъ}*=1 точку нуль (а ее, очевидно, нет среди {τ*}, ибо иначе значение задачи (з) было бы равно #(0)=0, что абсурдно) и еще быть может, несколько других точек, чтобы получи^ лась система {^t}fl\ из 2п разных точек. Существует полином х(-) степени п, имеющий точки {ъ}%\ своими нулями. Тогда х (0)^=0, ибо нуль полинома степени η с 2/ι нулями не может «быть кратным. Получилось противоречие: с одной стороны х (0)^=0, а с другой (из (1)) я(0)=0. Итак, s=2/z и, значит, в каждой точке Χι полином 1—х2(·) степени 2п имеет двукратный корень. Полином х2(·) степени 2/г в этих же точках также имеет двукратные корни. Значит, эти полиномы пропорциональны. Приравнивая старшие коэффициенты, приходим к уравнению jc2(-)=/z2(1—#2(·))· Интегрируя его, получаем x(t)=sinnt Доказано, что \х(0) |</г||*(-)||с([-Я|пЗ). Положим (Txx)(t) = =дс(Н-т), τε(-π, π]. Тогда
ЗАДАЧИ В задачах 1—10 исследовать отображения на дифференци- руемость по Фреше и найти производные в случае дифференцируемое™. ' 1. f:X-+Yy f(x) = Ax, Xf Y—нормированные пространства,. i4ei?(X, Y). 2. f :R*-+R\ f(xlf *2) = (*Λ, x\ + xl)y * = (1, 2). В задачах 3—5 Η—гильбертово пространство. з. / 4. f 5.'f H^R,f(x)=(x, χ). Я-^R, /(*)=|WI = V<*. χ). Н\{0}-»Н, f{x) = xl\\x\). 6· f-ЯЖ 1])^R, f (*(·))= J *»(9#· 0 1 7. /:i?,([0, 1])-R, f{x(-)) = (\x4t)dt)3. 8. f:C([0, 1])-*R, f(x(-)) = x(0). 9. /:C([0, 1])-*R, f(x(.)) = x*(\). 10. /:C([0, 1])-*R, /(*(.)) = sin*(l). В задачах 11—12 указать точки, где функции /: R"-»-R не дифференцируемы по Фреше. π 11. /(*)= max \χξ\. 12. /(*)=£>> |· В задачах 13—19 найти норму линейного непрерывного? функционала х* на пространстве X. 13. Х = С([0, 1]), (**, *(·))= C*(0sinjtf<#—* f-M. о 1 14. Х = С([0, 1]), {х\ *(0> = -*(0)+J*(0*. 1/2 1 15. Х = С([0, 1]), <**, *(0) = *(0) + 3$ *(/)#—4х(1). υ 16. Х = /2, "<дс·, *> = лу2 + %/4+...+*п/2п4-.... 17. Х = /2, <х\ л;) = {хх — лс,)/2 + (лс,—*4)/2а + · · · + (**-!— -*2п)/2»+ .... 168
18. X = J£2([0, 1]), (χ*, x(-)) = $x(t)sinntdt. о 1/2 1 19. X = i?2([0, 1J), (x\ *(·)> = §x(t)dt—2 J x(t)dt. 0 1/2 20. Λ: /2-*/2, Ax=(xs, xs, ..., xn, ...), *=(■% *2, ·■ ■), Λ*=? В задачах 21—28 найти касательные множества Т?М или "Т~М к множеству Λί в точке х. 21. М = {(х1г x2)eR2\R+|^'+^22<l}, ^=(0,1), ΓΓΛί, Т±Л1 = ? 22. Λί = {(^, *2) e= R2 \ R*. | jc? + *! < 1}, *~= (0, 0), 7>Λί, Τ*Λί = ? 23. Λί = {(*!, x2)^R2\xi<xl}, ϊ=(0, 0), 7>Af = ? ι 24. M=k)eC([0, l])|fsin*(0<«=—|, x(t)=nt, T?M=? о 25. Λί = {*(·) <= С([0, 1|) |sin *(0) = cos χ (1) = 0}, χ = π*/2, ΤΓΛί = ? 26. Λί—множество рациональных чисел, Τ-Λί = ? 27. Af= JO, 1,-i-, ...,Λ ...}c=Rf ϊ=0, Γ±Μ = ? 28. Λί=|θ, 1, -i-f ..., J-, <..JoR, i=0, 7>Af = ? 29. *# + 50/x + 20/*/ -* extr. 30. x2—i/2—4* + 6i/->· extr. 31. 3x2 + 4xy + y2 —8x— \2y-+extr. .32. x\ + x\ + x\—xlx2 + x1—2xs-+ extr. *όο· ο Χ·* x% —-~ л ι #2—'^i^n "~^* extr. 34. β*"'-* extr; лг+г/= 1. :35. xy2z3-+ extr; * + i/ + z=l. 36. j«/z->-extr; x+i/-fz = 0, χ2 + ί/2 + ζ2= 1. 37. J^-^extr; 2*|<1. i=l i = l 38. 2*2 +2*! +4x2—3*3-*· extr; 8xi~3*2 + 3*s < 40, 2*x—x2 + -f*3 = 3, *2>0. 39. e^-*>—xx—*2->extr; λ^+λ^^Ι, *х>0, *2^0. 40. Ъх\ — \\xx— 3*г — *8->extr; xt—7x2 + 3*3 + 7 < 0, 5xl+2x2—x3^2, *3>0". 169
41. х2 + ху + У2 + 3\х + у—2К inf. 42. *2 + у2 + 2тах(л;, i/)->inf. 43. *2 + у2 + 2 У(д:—а)2 + (у—б)2 ->■ inf. 44. л:2 + У2 + 2а|л: + у—1 |~>-inf (а>0). 45. Найти расстояние от точки (ξι, |г, £з) До конуса 46. Вписать в единичный круг треугольник с максимальной взвешенной с положительными весами суммой квадратов сторон. 47. На каждой из сторон заданного треугольника найти по такой точке, чтобы образованный треугольник имел минимальный периметр (задача Шварца). 48. Найти в плоскости такую точку, чтобы сумма расстояний от нее до трех заданных точек была минимальной (задача* Штейнера). 49. Найти минимум линейного функционала в пространстве /2 на границе эллипсоида с длинами осей, монотонно стремящимися к нулю. Всякая ли точка границы эллипсоида имеет нормаль, т. е. может служить точкой экстремума линейного функционала? 50. Разделить число 8 на две части так, чтобы произведение их произведения на разность было максимально (задача Тар- тальи). 51. Найти прямоугольный треугольник наибольшей площади, если сумма длин его катетов равна заданному числу (задача Ферма). (Этой задачей Ферма иллюстрировал свой метод нахождения минимумов — теорему Ферма — в 1638 г.) 52. На стороне ВС треугольника ABC найти точку Ε так,, чтобы параллелограмм ADEF, у которого точки D и F лежат соответственно на сторонах АВ и АС, имел наибольшую площадь (задача Евклида). (Это единственная задача на экстремум в «Началах» Евклида.) 53. Задача о полиноме Лежандра второй степени: ι $(Р + х^ + х2)2сИ-»т1 —ι 54. Среди всех дискретных случайных величин, принимающих η значений, найти случайную величину с наибольшей энтропией. (Энтропией совокупности положительных чисел рь ... ..., рп в сумме равных единице, называется число л Н=— Yipilnpt) t=l 55. Среди цилиндров, вписанных в шар единичного радиуса, найти цилиндр с максимальным объемом (задача Кеплера)^ 170
{Эта задача была поставлена и решена Кеплером геометрически в «Стереометрии винных бочек», 1615 г.) 56. Вписать в единичный шар пространства R" цилиндр наибольшего объема* (обобщенная задача Кеплера). 57. Вписать в единичный шар пространства Rn конус наибольшего объема*. 58. Среди всех л-угольников, имеющих заданный периметр, найти /г-угольник наибольшей площади (задача Зенодора). 59. Вписать в круг треугольник с максимальной суммой квадратов сторон. 60. Даны угол и точка внутри него. Через эту точку провести отрезок, имеющий концы на сторонах угла, так, чтобы полученный треугольник имел наименьшую площадь. 61. В задаче 60 минимизировать периметр треугольника. 62. Найти наибольшую площадь четырехугольника с заданными сторонами. 63. Среди сегментов шаров, имеющих заданную площадь боковой поверхности, найти сегмент наибольшего объема (задача Архимеда). 64. На данной прямой найти такую точку С, чтобы сумма расстояний от С до точек А и В была минимальной (задача Герона). 65. Среди всех тетраэдров с данными основанием и высотой найти тетраэдр с наименьшей боковой поверхностью. 66. Среди всех тетраэдров, имеющих заданную площадь поверхности, найти тетраэдр наибольшего объема. 67. На плоскости даны три точки: хи #2 и *з. Найти такую точку Хо» чтобы сумма квадратов расстояний от х0 до Х\\ *2, *з -была минимальной. 68. В пространстве Rn задано N точек**!, ..., Хы и N положительных чисел ntu ..., ты. Найти такую точку х0, чтобы взвешенная сумма с весами т,- квадратов расстояний от Хо до лсь · · · f *n была наименьшей. 69. Решить задачу 68 при условии, что искомая точка Хо принадлежит единичному шару. 70. Решить задачу 68 при условии, что искомая точка х0 лежит на единичной сфере. 71. (Р) Найти расстояние от точки до эллипса. Сколько .нормалей можно провести из точки к эллипсу (задача Аполло- дия)? 72. Решить задачу Аполлония для параболы. 73. Найти расстояние от точки до гиперплоскости в гильбертовом пространстве. 74. Найти расстояние от точки в пространстве Rn до прямой. * В задачах 56 и 57 возможны различные формализации* связанные с разным пониманием терминов «цилиндр» и «конус». У нас далее цилиндр в Rn — произведение (п—1)-мерного шара на ортогональный отрезок, конус в R" — выпуклая оболочка (п—Г)-мерного шара и ортогонального ему отрезка. 171
75. Найти минимум линейного функционала на единичном шаре. 76. В эллипс x2/a?+y2/b2=l вписать прямоугольник наибольшей площади со сторонами, параллельными осям координат. В задачах 77—79 проверить, конечно ли численное значение задачи, и исследовать заданные точки на оптимальность- 77. x1 + x2 + x3->sup; — 2х1 + *2 + *з= 4» ^>0, i=l, 2, 3, *0 = (0, l, 3). 78. хх + Ах2—7x3->-sup; 2хх—2х2+ 14лг3 = 2, хг—2х2 + \0х3 = О, *,>0, /=1, 2, 3, х0 = (2, 1, 0). 79. x1 + 3x2^-x3~x^~xb->snip\ х1~х2 + х3 + 3х4:—Зл:5 = 1 „ Х1~Г Х2 #3 + ^4 + ХЪ === *> ^т^т^8Т 5#4 -^5 === ^>- ^>0, *=1, ..., 5, *0 = (1> 1, 1, 0, 0). 80. 2xi + x2 + 3x3 + bx^-^snp; 2хх + Зх2 + х3 + 2*4 < 30, 4хх + 2х2 + х3 + 2л:4 < 40„ х1-\-2х2 + Зх3 + х± ^ 25,. х{>0, i=l ..., 4. Решить задачи линейного программирования 81—85 chmit- лекс-методом, используя в качестве начальной крайней точки заданную точку х0. 81. хг—2x2 + A:3-^sup; хг + 4х2 + х3 = 5, «^1 ^-^2 *^3== ^» *,>0, ί=1, 2, 3, *0 = (1, l, 0). 82. 2x1 + x2+3x3 + X4-*suip; хг + 2х2 + 5х3~х^= 49 Χχ Χ2 Χ3 -j- ΔΧ^ = 1, xt>0, i=l, ..., 4, χ0 = (0, 0, 1, 1). 83. Xx + Xi + Xs + Xi + Xb^*· sup; 2л:х + Зд:2 + 5jc3 + 7л:4 + 9д:5 = 19„ *ι— *2 ~Ь -*4 "Ь 2яБ = 2,. *,·>(), i = l, ..., 5, *в = (0, 0, 1, 2, 0). 84. —2хх + х2 + х8—x4 + 4*5 + xe->sup; 3a;x + х2 + 2х3 + 6дг4 + 9хъ + Зх6 = 15, хг + 2х2—х3 + 2л4-+ Зх5 + хе = 5, *£>0, 1=1, .... 6, x0 = (l, 0, 0, 0, 0, 4). 172
85. х± + Хъ + хв + 5#4 + хь—2х6 + 2х7 -*sup; хг + 2х2 + 6х5 + 3*в + х7 = 7, хг + Зх2 + 2xs -f 7х5 + 2х6 + Зх7 = 12, х2 + Зх3 + 2#4 + 4х5—Зх6 4- Зх7 = 8, *3 + Зх4 -4- х5—2х6 + х7 = 4, Xt>0, ί=1, .... 7, *0 = (1, О, О, 1, О, 1, 3). π 86. § xsintdt-+extr; jx|< 1, х(± π) = 0. —π 87. J |*|df->"inf; *>Д *(0) = 0, *(Γ0) = ξ (Α<0). ι 88. J*2di->-extr; χ(0)=\. ϋ 1 89. J^di + a*2(l)-*extr; х(0) = 0. ο 7* 90. j*2d/->extr; χ(0) = 0, Τ + χ(Τ)+1 = 0. ο г 91. f ^di-^extr; χ(0) = 0, (Γ—Ι)*2 (Γ)+ 2 = 0. о 1 92. 5x2d/-^extr; |*|<1, *(0) = 0, *(1) = ξ. 6 2 93. *(2)-^extr; |*|<2, fx2<#=2, x(0) = 0. о 94. J jc3di->extr; *(0) = 0, *(Τ0) = ξ. о. 3/2 95. f (*3 + 2.*;)d/-^extr; x(0)=0, x(—) = 1. о ?· . . ■ 96. J (*3— x2)df->.extr; x(0) = 0, *(T0)=g. о 1 97. Jcosi<#-*extr; r(0)=0, χ(\) = π. о 98. Jsin*df-*extr; *(0) = 0, x(T0) = t
τ· 99. J cos *<//-* extr; л;(0)=:0, л;(Г0) = £. о 100. I xe*dt-+extr; *(0) = 0, χ(Γ0) = ξ. ό τ* 101. J (x* + 5x)dt-+extr, #(0) = 0, *(Γ0) = ξ. о 1 102. J(l— *2)2d/-*extr; *(0) = 0, *(1) = ξ. о ? ■ ■ 103. J (x*~xxz)dt-*extr, #(0) = 0, лг(Го) = 0 (исследовать на о экстремум допустимую экстремаль #(/)=0). 1 104. J(*2—4*3*+2i^)d/-^extr; *(0) = 0, а;(1) = 0 (исследовать о ^ на экстремум допустимую экстремаль χ(ί)^0). г 105. J*3di-*extr; Г+*(Г)=1, jc(0) = 0. о г 106. §(x2 + x)dt-*extr; х(0)=1. о г 107- ${j? + x)dt-*enr9 x(T) = T. о 7 108. §(i2 + Jt)d*-»extr; *(0) = 0, *(7Ήξ. о τ 109. J(i2+*)di->extr; *(0)=0, х(Г) = 7\ о т. НО. j (*2—x)di->.extr; jc(0) = 0. о 111. J (x2— x)dt-+extr; x(0)= x(T0)p=0. τ, 112. J(i2—x)dt~*.enr, |*|<1, x(0)=0. о г. ИЗ. j (л:2— *)<#-*extr; |i|<l, *(0) = л;(Г0) = 0. о 174
τ 114. {(я2— *)<tf->.extr; |х|<1, л;(0) = 0. о τ 115. j(*2—x)dt->extr; |*|<1, л;(0) = 0, л:(Г) = 0. о 1 116. jV—x2)e2*dt-+extr9 *(0) = 0, х(1) = е. о 1 1 117. Jj^df-^extr; \xdt = \, х(0) = 0. б о 1 1 118. J*2d/-*extr; J*di=l, jc(O) = л:(1) = 0. 1 1 119. $*2df->-extr; §txdt = 0, *(0)=1. 1 1 1 120. J*2di->extr; $ χάί = § txdt = 0, *(0)=1. 0 0 0 τ τ 121. Jx2di^extr; §xdt=l, *(0)=3. о о τ τ 122. <\x*dt-+extr; fx<#= —, *(Γ) = 1. о о η π 123. jjc2d/-»extr; [xsintdt=\9 лг(0) = 0. o-o π π 124. §x2dt-+extr, J xsintdt= 1, лг(0) = л:(л;)=:0. о ' о π π π 125. С*2tf/->.extr; %xcostdt = —, Cxsinidi= —2, л:(0) = 0. 0 0 Ο 1 1 126. fjt2d*->.extr; Jxe<di = l, x(0) = 0. 6 о 2 2 127. (>i2<#->.extr; Г/*# = .!-, x(l) = 1, x(2) = 2. ι i e-l 128. § (t+\)x2dt + 2x(0)[x(e—l)+\]-+extr. о 2 129. U2x2dt —2*(l) + *2(2)->extr. 175
e 130. $(tx2 + 2x)dt-+extr9 *(1) = 0, ι e 131. §(tx2 + 2x)dt-+extr; x(l) = x(e) = 0. ι 1 132. f(l + 0^di-»extr; *(0) = 0, лг(1) = l. ό 2 133. j* t2x2dt-+extr; *(1) = 3, x(2) = 1. i: • 3 134. {(**_1)**<#-+.extr; *(2) = 0, *(3)=1. 2 135. f(i2j^+12*2)<#->extr; л;(0)=0, *(1)=1 (пример Гильберта) 6 ι 136. [{x2 + 3x2)e2tdt^-extr\ x(0)=l, x{\) = e. о 1 137. §(x2 + x2)dt—2*(l)shl->.extr. о T. 138. § (x2 + x2)dt + ax2(T0)-+extr. о 139. 52x(^+a:)^ + 3jc2(1)—x2(e)—4*(e)->extr. i В задачах Больца 140—142 найти допустимые экстремали. з 140. \4x2x2dt + x*(0)—8x(3)-»extr. о 1 141. jj e*x2 dt + 4е*<°> + Зге-*1) ->. exfr. о 1 142. leM(x2 + 2x2)dt + 2x(l)(x(0)+l)-+extr. ι 143. jj x2x2dt^extv; *(0)=1, *(1) = У2. 4/3 144. j^di + extr; *(0)=1, *(-*-) =-L. 0 176
145. 146. 147, 148. 149. 150. 151. le*x*dt-*-extr; х(0) ό 1 0 1 6 0 \(х> 0 0 τ ί(*2 0 В задачах 152. 153. 154. 155. 156. 157. 158. 159. τ Ι (χ* 0 τ )(χ* π/2 0 0 τ ϋ + xx+\2tx)dt- — 2xx + 2x2)dt- + x2 + Axsht)dt + x2 + Axsht)dt + x2)dt—x2{\)- + x2)dt-+extr; 152—153 найти + x2)dt ->extr; -f x2) dt-+extr; = 0, χι >extr; . -*extr; ->-extr; ~>-extr; ->-extr; jc(0) = ( допуст χ(Τ)+- x(0) = (. 2—x2—2x)dt—2x2{Q)- l + x2)dt-+zxix\ 5 + ^)^->ΘχίΓ; l + x2)dt ->extr; Γ 0 7*β I (x2+x2)dt-+extr\ 0 x(T0) = x(T) = |*|<1 I*I<1 *(0) = (l) = ln4.. χ(0) = χ(\) = 0. л(1)=1. ж(0) = 0. *(0) = — 1, x(l) = x (0) = 1. ), *(T)=1. имыг экстремали. Г—1 = 0. ), T+x(T)+ 1=0. .WJLj_extr. =s. 1· , *(Γ0)=ξ. , x{T) = t ο, x(r,)=g.
160. 161. 162. 163. 164. 165. 166. 167. 168. 169. 170. 171. 172. 173. 174. τ *\ (χ* + χ2) dt^ extr; *(0) = 0, *(Γ) = ξ. ό τ. J (x* + x2)dt^extr, |i«l, x(0) = 0, χ(Τ0) = ξ. ο τ 5J (λ:2 + a2) at -+ extr; |χ |< 1, χ (0) = 0, χ (Τ) = ξ. 6 1 1 С (*■ + **)#-> extr; j,Jfg*di = !l±l, л:(0) = 0, лг(1) = ^. ) о г/4 J (χ2—χ2) Λ-* extr; *(0)=1. о η l(x2—x2)dt-+extv; |i|< 1, х(0) = 0. о гс/2 f (*2—x2)dt-*extr; *(0) = 0, xf — ) = 1. э я/2 о J (*2—*2)<#->extr; |*|< 1, *(0) = 0. о То \(x2—x*)dt-+extr; |х|<1, *(0) = *(Т0) = 0. о π/4 О π/2 О 3π/2 О π/2 С (*2—*2 + 4xsin0<tf->extr; х(-5-)=0. π/4 π/2 С (>—л2+ 4* cos ;)<#-* extr; jc(0) = 0, *(-f-)==-y- о J (jc2—*2 — 4* sin/)#->· extr; *(0) = 0, *(Γ0) = ξ. 6 π π l(xt—x2)dt-+extr, <\xcosidt = l, x(0) = Jt(n) = 0. ό о 1 1 \x2 Л-». extr; ]jx2itf=l. 178
I 1 I 175. *\x*dt-+extr; \x2dt=\, [xdt = 0. 0 0 0 1 1 176. jj*2df->extr; fx2d*=l, x(0) = 0. G 0 1 1 177. \i2dt-*extr; jjt2d/ = l, *(0) = jk(1) = 0. Vl + 178. Γ vl + x dt-^extv; *(0)=1. 179. Г Vl+X' dt ->extr; *(0) = *(1) = 1 (*>0). 180. , о 7* fili±ilrf/^extr; x(0)=l, 2Г + х(Г) = 2 (jc>0). 181. Г Vl+X* dt-+extr; *(0)=1, T—x(T)=l. о 7* 182. \ Vl+i2dt-»extr; х(0) = 0, Γ2χ(Γ)=1. о 1 1 . -J 183. C*di->-extr; С К l + ^2di = -|-, *(1) = 0. υ ο Γβ 7Ό 184. (Ρ) \ *ctt-*extr; $ V l+x2dt = l, x( — To) = x(To) = 0 -T0 -To {задача Дидоны). г0 r0 185. ) xV l+x2dt-+extr\ \ Vl+x2dt = l, x(—T0)=- -To -To = *(T0) = 0. To 186. J xV l+x2dt-+extr; x(T0) = t о 187. J *lA + A;2di->extr; χ(Γ0) = *( — Γ0) = ξ (задача о ми- -г. нимальной поверхности вращения). U у Г- 188. Г У1*** d;~*extr; *(f0) = *o. *(Ί) = *ι (*ο>°>*ι>°) J V χ (задача о брахистохроне). 179
189. I \Sx + hVl + x2dt-+inU χ(0) = 0, *(Γ0) = ξ. о * / * 2 * 2 \ 190. Π *'+*2 ^Π^-^χίι·; jca (0) = дс, (0) = 1. о π/2 191. Г (Pl+xl + 2x1x2)dt-+extr; хх(0) = х%(0) = 0, χ, f—Wt„ 1 1 1 192. \ x^di-^extr; ^x1dt=\x2dt = 0,xl(0) = x2(0) = 0t xx(\) = О 0 0 = 1, х2(\) = 2. ι ι ι 193. ^x^dt-^-Ыг; ^x1dt=l, x1(0) = x1(l) = 0; ^x2dt = 0„ 0.0 0 194. \ (^2 + ^2)^ + ^ (О^зМ + МО-М0) ->^xtr. 0 1 1 195. \(хг + х2)dt-+extr; ^x^dt^Q, x1(Q) = x2(0) = 09 ^(1)=^ о о = 1, x2(l)^-3. ι 196. $(x2 + y2)dt-+extr;xy—yx=l, x(0) = 0, *(l) = sinl, y(0)=- o = 1, y(l) = cosl. 1 197. ^Ji±iL+|i|)di-inf, *(1) = ξ. 0 τ. №.hxy—yk)dt-+sWf x(0) = x(T0)9 y(0)=y(T0), x2 + y2^L· 0 To 199. (/>)C-^-Mnf; *>0, *(0) = 0, *(Γ0) = ξ (аэродинами- о ческая задача Ньютона). ι 200. j?df-*extr; jc(1) = л:(0) = 0, *(i)=l. о 1 201. V jeMf^extr;*(0) = i(l) = Of *(0)=1. о 180
1 202. Л x4t -> extr; χ (0) = χ (0) = 0, χ (1) = 1. 6 ι 203. \хлЛ-*-&Лг; о x(0) = x(l) = 0, *(0)= —1, jc(1)=1. ι 204. J(?—48x)dt^extr; *(0) = jc(1) = 0. 205. \{x*~48x)di-»extr; х(0) = х(0) = л:(1) = 0. 206. f(i2—48x)df-»-extr; о * (0) = *(0) = л:(1) = x'( 1) = 0. ι 207. \β~'&άί-+·&Λτ, ρ *(0) = 0, х(0)=1, x(l) = e, x(l) = 2e. e 208. Ji?di->extr;A:(l) = 0, *(1)=1, *(e) = 2. ι 209. fi?di-*-extr; ι jc(1)=0, *(1)=1, *(e)=e, x(e)=2. e 210. C(*+l)f*adi->extr; *(1)=0, x(l)«-l, х{е)=е, х(е)=2. 211. f"$e»d*-*«tr; *(1)=0, лг(1)=1, x(e) = J-, J rt 212. fi2x2d*-*extr; *(1)=0, *(<?)=*(!)= 1, *(e)=-. 213. U3x2dt- ■ extr; β1*
I 214. f(i— xfdt^extr; *(0)=1. i ι 215. Ux~ xfdt-+extr, *(0)=1, *(G) = 0. ι 216. {{x—xfdt-+extr, *(0) = 0, *(l) = chl, *(l) = ch 1 + sh L о 1 217. f(Jt— x)2dt->extr, * (0) = * (0) = 0, jc(l) = sh(l), b *(l) = chl+shl. π/2 218. V (x + xfdt + x2(0)-+extr. о π/2 219. f (i'+;c)2di + jt2(0)^extr; */iL\ = i. о π/2 220. Г (χ + *)2Λ + *2(0)->· extr; * (—\ = 1, * (—) e0. о π/2 221. J(i4*)2^ + *2(0)->extr; *^=*(0) = 0, χ (i) о ι 222. С(лг2 + (^+1^2 i)2) dt -> extr; χ (0) - 1. о 223. \/Vdi->extr; в 6 π 224. Ux2 + 4x2)dt-+extr\ х(0) = л;(0) = 0, *(jt) = sh?t. π 225. Ux2 + 4x*)dt-+extr, о x(Q)=x(0) = x(n) = Q, x(n) = shn. π 226. \ (χ*—x2)dt-+extr; x(0)=l. 1.
227. §(x2—x2)dt-+extT; *(0) = 1. о π/2 228. ϊ (χ2—x2)dt-+extr\ *(0) = 0, x(—) = 1. о π/2 229. f (x2—x2)dt-*extr; *(0) = 0, χ (—) = !· о v π 230. l(x2~x2)dt-+extr; jc(0)= χ(π) = 0, *(π)=1. о π/2 231. Γ (*2—x2)ctf->extr; ό ,(i) = l.*(0)-i(f)-0. π/2 232. С (i2 ~x2)dt-+extv; о *(-§-)-!. *(0) = *(0) = *(-il)=0. π 233. Ux2~ x2)dt-+extr; (Г *(0) = л:(я) = 0, *(0)=1, χ(π)=~ 1. ι 234. f(*2+x2)itf^extr; *(0) = 0, x(l) = shl, *(l) = chl. ι 235. Ux2+x*)dt-+extr; о x(0)»l, *(0) = 0, *(l) = chl, x(l) = shl. π/2 236. \ {x*—x*)dt-4-extr; о *(()) = * (0) = 0, *(-f-) = l· π/2 237. f (i2—A:2)di-^extr; о *(θ)=*(θ)=*(|-)=*ο, *(τ) = ΐ·
238. jj*d/-*extr; |*ϊ<2, л:(0)+*(2) = 0, х(0) = 0. 6 ι 239. Vxdf->extr; о \x\ <2, *(0) + *(l)=0; x(0) + i(l) = 0. 2 240. J^di-^inf; |i|<2, x(0) = *(0) = *(2)==0. о 4 241. ^xdi -^extr; о \x\ <2, *(0) + Jt(4) = 0, *(0) = i(4) = 0. 242. T->inf; \x\ <2, jc(—1)=1, x(T)= — 1, x(—1)=*(Г) = 0. 243. Γ->.ίηί; —l^x^3, *(0)=1, я(0)в*(Г) = 0, х(Г)=—1. 4 244. \xdt -*extr; |*| <2, x(0) = x(4) = 0. о 4 245. Cxdi-+.extr; |x|<2, *(0)==x(4) = x(4)==0. 6 4 246. ^#di-*extr; о |i|<2, лг(0)==*(0) = *(4) = х(4Н0. 2 247. \ \x\ d/-*inf; x>—2, *(0)=r0, jc(2)= — 1, x(2)=—2. 2 248. ix2di-*inf; *>6, jc (0) = χ (0) = 0, χ (2) =17. ι 249. yx*dt-»ini; \i\ <1, *(0) = *(0) = 0, *(1)=-^. ι ι 250. \*2df-*extr; Jxdi=l, x(0) = 0.
251. Jjfo#-*extr; J*c«=l, *(1) = лг(0) = 0. о о 1 1 252. J?d/-*extr; j*d*=l, о о *(0) = *(0) = *(1) = 0. ι ι 253. <\?dt-+extr; ^xdt=l9 о о л;(0) = ^(0) = л;(1) = ^(1) = 0. τ 254. Γ-^extr; fjfttf-l, л;(0) = χ(0) = 0, i(7,)=l. δ τ 255. Γ-^extr; J?di=l. о *(0)-*(0) = л;(Г) = 0, jc(T)=1. ι 256. x(l)^extr; J*2d/=-4, *(0)==*(0)==x(l)==0. о 1 257. rAtf->.extr; x(0)==*(0) = *(0), *(1)=1. 1 258. ?jK*<tf-».extr; о x(0) = *(0) = *(0) = 0, лг(1)=1. 259. \JAK->extr; о x(0)=*(0) = *(0)=jT(1)=0, *(1)=1. ι 260. f JAtf-»-extr; о х(0) = х(0) = *(0)==ж(1)==х(1) = 0, *(1)=L ОТВЕТЫ, УКАЗАНИЯ, РЕШЕНИЯ ι. f$)[h]=Ah. 2. п*)[й]=лл, Е>4 = (| J)· з· /'(*)["!= -2<х,Л). 4. f Й [*] = <*. *>/ЙГ (решение см. в [АГТ, № 1.7]). 5. /'£)[А]-Л/Й|-*(*,А>/|Й|». 6. Π*())[Μ·)] = 3|Α(0*2(0<#. о 185
7. r(i(-))[*(-)]-6(J?(/)*)fJA(/)x(0itt. 8. /'(*(·)) [*(·)] = = Λ(0). 9. Γ(^(·))Ρ(·)] = 2ί(1)Α(1). 10. Γ(ί(·));[Α(·)] = = A(l)cos*(l). 11. {χ| ]jCf| = l*/l для некоторых t^/}· 12. {х= = {хг х„) \хг ... *„ = 0}, 13. 1 -f-2/π. 14^ 3/2. 15. 8 (решение см. в [АГТ, W»1.30]). 16. 1/V3. 17. V2/K3. 18. 1/^2 (решение см. в [АГТ, №1.36]). 19. V5/2. 20. A*:/2-W2, A*t/ = (0, Μ2,...), У=(У1,У2,-)· 21. 7*ΓΛί = {0}, rx^ = Rl. 22. 7>Λί = R+x R_, о„ " TiM = R2\R% 23. {0}. 24. 7>Л1 = {*(.)еС([0,;1])|5[х (f) cos χ X ntdt = 0} (решение см. в [АГТ, № 1.49]). 25. {Л(°)бС([0, I]) |А'(0) = А(1) = 0}. 26. R. 27. R+ (решение см. в [АГТ, № 1.52]). 28. {0}. 29. (5, 2) е= locmin, Smin= — оо, Smax=-foo. 30. Smin = = —оо, 5max= +oo, (2, 3) qr locextr. 31. Sraln= —oo, Smax = -foo, (8, — 10) e£locextr. 32. (—2/3, —1/3, 1) e= absmin, 5min=—4/3, Smax= + oo. 33. (1, l)slocmax, 5max= + oo, Smin= — oo, (0,0), (0, 3), (3, OJgHocextr. 34. (1/2, 1/2) «3 absmax, 5max = e1/4, Smin = 0 не достигается. 35. (1/6, 1/3, 1/2) e locmax, (t, 0, 1—i)elocmax Yt>l и t<0, (t, 0, 1— f)€=Jocmin V0<i< 1, Smax_=+ oo, Sm,„«= - oo. 36. _{(l//6, 1/Кб, -2/У6), (1/V6, -2/V6, 1/1/6), (-2/K6,1/Vj, 1//6)} e= absmin, {(- 1/У6,-1/Кб, 2/Уб), (- l/T/6, 2/^6, -J/K6), (2 V6, - 1/K6, — 1/У6)} eabsmax, Smax = -Smin= - 1/(3V6). 37. (0,... ,0)<= absmin, Smln=0, (± n~1/4 ± rigg) e= «= absmax, Smax = y^i. 38. (—2,0, 7) e absmin, Smax = + oo (xn = = (—й,0, 2n+3)). 39. (0,1) Θ absmin, (1, 0)e absmax. 40. (0,1,0) e .6 absmin, Smax=-foo. 41. (1, l)e= absmin. |;42. (—1/2, —1/2) e= .<= absmin. 43. аг+b2 < 1 =£«£·) <= absmin; aa-f-6a > 1 <4(σ/Va2+b2, b/VcP + b2) «= absmin. *44. 0 ;< а < 1/2 =4'(а, а) <= absmin; а> 1/2 => «4(1/2, 1/2) & absmin. 45. β = ξ8 + νΓξι + ξ2< 0=4(0, 0, 0) e= absmin; β > 0 =4 (Kx/K2 (ξι + il), ^/"^З (ξ? + ξ|), β//2) e= absmin. 46. Если возможно построение треугольника с длинами сторон /ηι/η2, momi, m0m2 и си, аг — углы между сторонами с длинами т\гпч, motni и mim2, mom2 соответственно, то угол между векторами χι и е=(1, 0) (вершины треугольника χΊ, х2, е) равен π—си, а угол между Χ2 и е равен я—<х2. Если построение невозможно, то *ι=ί2=— е или ίι=—е, х2—е. 47. В остроугольном треугольнике искомые точки — основания высот. В прямоугольном и тупоугольном треугольниках треугольник минимального периметра вырождается в высоту, проведенную к большей стороне. 48. Если все углы треугольника меньше 120°, то решением задачи является точка, из которой все стороны треугольника видны под углом 120° (точка Торричелли); если один из углов треугольника больше или равен 120°, то решение задачи совпадает с вершиной этого угла (решение см. в [АГТ № 4.12]). 186
b доставляет 49. Точка х с координатами xk ——а>Фк\Л/ V a\t>\ * fe=i абсолютный минимум функционалу, Smin=—l/ ν а|б|> а нормали возмажны лишь в подпространстве Л-1/2, где А : {х*}^** -Mxk/bk2} (решение см. в [АГТ, № 4.7]). 50. 4±4/уз* (решение см. в [АГТ № 2.21]). 51. Равнобедренный треугольник. 52. Точка £ — середина [ВС] (решение см. в [АТФ, с. 31]). 53. /2— —l/3eabsmin. 54. fi — ifiu ..., pn)eabsmax, p\ = ... =рп=*1/п. 55. Λ=2/]/3~~. 56. Радиус основания равен {(п— 1)//ι)1/2. 57. Высота конуса равна 1 + 1 /п. 58. Правильный многоугольник. 59. Правильный треугольник. 60. Искомая прямая обладает тем свойством, что ее отрезок, заключенный между сторонами угла, делится заданной точкой пополам (решение см. в [АГТ, № 2· 45]). 61. Надо провести окружность через точку (большего радиуса из двух возможных), касающуюся сторон угла, и затем провести отрезок, касающийся этой окружности (решение см. в [АГТ, № 2.46]). 62. Площадь четырехугольника, вписанного в круг. 63. Искомый шаровой сегмент — полушар (решение см. в [АГТ, № 2.48]). 64. Если точки лежат по разные стороны от прямой, то искомая точка есть пересечение прямой АВ с данной. Пусть точки лежат по одну сторону от прямой. Отразим одну из них, например точку Л, симметрично относительно заданной прямой. Получим точку А'. Пересечение прямой АВ с заданной и есть искомая точка С. 65. Вершина тетраэдра должна проектироваться в центр круга, вписанного в основание. 66. Правильный тетраэдр. 67. х0 = (хг + х2 + х3)/3 — центр тяжести треугольника хг х2 хэ. Ν Ν 68. лг0 = /^У2 mixi]/y\ mi—центр масс. 69. Обозначим # = > Ν = (Σ!miXi) 1У\ т1- Если 1*1^*'то *о=*; если \х\ > ι, то v. N N ^ х0 = х/\х\. 70. Обозначим * = (Y^[mixi) /Υ. mi- Если * = 0, то xQ любое; если ^сфО, то х0 =1с/ \ χ |. 71. Решение. Формализация /о (χι> *2) = (*ι—ξι)2+ (^2—y2-*inf; /ι (*ι> хг) = (xJaif + (χ2ΐα2)2— 1 = °· Функция Лагранжа 2 = λ0 ((^-У2 + (x2-hf) + λ (Wai)2 + (xj^n 187
Необходимое условие ^ = 0»Я0(^— ξ,)+λ*,/α*=0, ί=1, 2. Если λο=0, то λ^Ο, так как не все множители Лагранжа нули. Тогда Х1=ЛС2=0, но эта точка не лежит на эллипсе. Полагаем λο=1«4*ί = ξία£/(α|+λ), *=1,2. Подставляя в уравнение эллипса, получаем t2 2 t2 2 ™/Ί\ &1 α1 ι δ2α2 ι /ν Φ(λ) = —г 1 ; =1- (*) Число стационарных точек задачи (т. е. точек, соответствующих тем λ, которые удовлетворяют уравнению (*)) не более четырех (рис. 5), неравенство 9(0) = £J/aJ + g|/a*> 1 показывает, что φ (λ) изображена для точки (ξι, ξ2), лежащей вне эллипса. Рис. 5 . Рис. 6 Эллипс — ограниченное и замкнутое множество. По теореме Вейерштрасса решение существует. Для полного решения задачи надо решить уравнение (*), получить λ/, найти соответствующие точки *(λί), подставить эти точки в /0 и найти наименьшее из полученных значений функционала. Соотношения χι—Ь + Я**М2=0, ί=1, 2, имеют очевидный геометрический смысл: вектор ξ—χ пропорционален вектору- градиенту функции fi в точке ху т. е. вектор ξ—χ лежит на нормали к эллипсу. Этот факт был установлен впервые Аполлонием. Выведем из полученных нами соотношений уравнение кривой, «разделяющей» те точки ξ, к которым можно провести две нормали, от точек, к которым можно провести четыре нормали. Очевидно, что это разделение происходит для λ, удовлетворяющих соотношению (*), для которых 188
φ (λ)= = 0, λε-α, —α?) =^α! + λ=Λ(ξΛ)2/3, α| + λ= -Л&а2)2/3. тдеЛ = (а2-а1)/((|1а1)2/3+(|аа2)2/3). Подставляя в (*), получаем уравнение разделяющей кривой ΚΙιαι)2/Ζ + (ΐΆΫ/Ζ^(α^~α2)2/3' Это уравнение астроиды. Вне астроиды каждая точка имеет две нормали, внутри нее — четыре, на самой астроиде — три (за исключением вершин, где имеются две нормали (рис. 6)). 72. Из точки с координатами (ξι, &) к параболе у = ах2 (а>0) можно провести три нормали, если точка расположена 'Выше кривой ξ2 = 3·2-4/3α-1/3ξ12/3+2-1α-1; две нормали из точек ма этой кривой, кроме точки (0, 2-1 сгх)\ одну нормаль из точек ниже этой кривой и точки (0, 2г1аг1). 73. Расстояние от точки хо до гиперплоскости (а, х) = Ь равно |(а, х0)—&|/|а| (ре- мление см. в [АГТ, № 2.61]). 74. Расстояние от точки Хо до прямой at+b, α, b^Rnf равняется (\£—b\2—((x—by α>/|α|)2)1/2- 75. £=—a/|a|eabsmin, 1(х) = \а\. 76. Стороны прямоугольника: "|/2а, у2Ь. 77. Задача не разрешима. 78. Точка х0 не дает максимум в задаче. 79. Jt0eabsmax. 80. (0, 0, 4, 13)eabsmax, Smax=77. 81. (2, 0, 3)G=absmax, 5max = 5. 82. (2, 1, 0, 0)e= eabsmax, Smax=5. 83. (5, 3, 0, 0, 0)eabsmax, Smax = 8. .84. (a 5, 5, 0, 0, 0)i=absmax, Smax=10. 85. (1, 0, 0, 1, 0, 1, 3)<= «eabsmax, 5max=10. 86. fn-f-i, — Jt</;<— π/2, x= I —ty |/|<π/2, χ e absmin, —ieabsmax. [t~π, π/2<^< π, $7. ξ < AT0 => допустимых функций нет; ξ = ATQ =4 *== At e absmin; ^4ΤΌ<ξ<0«^любая монотонно убывающая допустимая функциям eaSsmin; £=0=^лГ=0 ^absmin; ξ >0=^ любая монотонно возрастающая функция з absmin (решэние см. в [АГТ, № 10.Щ). 88. лГ= l]~;absmin, jSltiax=a+оо. 89. α>—1 =}х*= 0 ^absmin, α==—l]=^i^=C/^^absmin VCeR, 5min = 0; oc<—1 =£Smin = ■яГ1— oo, Smax=+oo. 99. Γ^=1, лП=—2i <~ absmin, Smax=-f oo. ^91. f=: 1/2, x = ±4t = absmin, 5max= + oo. 92. |ξ|> 1 ^допустимых функций нет. [ξ|^ 1 ^5max==+оо достигается на любой .ломаной (|*"(ί)|=± 1 вне точек излома), соединяющей точки (0, 0) и (1, ξ); \Sm\n = l29 It e absmin. 93. t s absmax, —t ^ absmin. 94. χ (ί) = it/TQi ξ> 0 4x = locmin, ξ <0 =^£е= locmax, ξ = 0 =4 ^^^•locextr; Υξ x^не сильный lo^extr, S47iin =— oo, Smax= + oo. ^95. хя(2;/3)3Д jTs locmin,. #-—нз сильный locextr, 5ιΊ1·ιη = ■—.oo, -Sm»=-+<». 93. x=**jtlTQ9 g>7y3^X6=locmin, ξ<Γβ/3 4ίε 189
e locmax, ξ=Τ0/3=$χ£ locextr, V* χ—несильный locextr, Smin=* = — ос, Smax=+oo. 97. Smin= — 1, Smax= + 1, x = nt e absmin. 98. 5min=—70, 5max-+r0; 2fai<ξ/Γ0<π + 2fei, ieZ4i= = lt/T0 e locmax; 2fat — π <ξ/Τ0<2&π, β e; Ζ =^ χ εξ locmin; не выполнено необходимое условие Вейерштрасса =^ в обоих случаях х—не сильный locextr; ξ/Τ0 = £π, & е Ζ *4 требуется дополнительное исследование.^ 99. Smin= — T0, 5max = T0; π/2 + 2kn < ξ/Γ0 < <3π/2, feeZ^^e locmin; — π/2 + 2£π<ξ/Γ0<π/2, ^gZ^ ==4^ e locmax; не выполнено необходимое условие Вейерштрасса =^> в обоих случаях χ—несильный"1 locextr; ξ/Τ0 = π/2 + &π, &^Ζ«^ «4 требуется дополнительное исследование. 100. Smin =— оо,. 5тах = + оо; Т0 >—ξ/2 *$ * = lt/T0 6= locmin; T0 <—ξ/2 =4 * е е locmax; не выполнено необходимое условие Вейерштрасса ==^ fc^B обоих случаях χ—несильный locextr; Т0=—ξ/2 =^ требуется дополнительное исследование. 101. Smm=—оо, Smax=+oo; ξ^ > 4Г^/4/5^л:7=4((/ + С)5/4—С5/4)/5 εξ locmin, ξ<—47U/4/5^*2= ==4(C5/4—(i'4-Q5/4)/5e locmax, где С определяется из уравнения* 4((7,0 + С)5/4—С5/4)/5 = |ξ|. Необходимое условие Вейерштрасса не выполнено, так что в обоих случаях χ—несильный. locextr. Прге* |ξ|<4Το/4/5 допустимых экстремалей нет. 102. |||<[1/УЗ-^?= = ξί^ locmax; |ξ|> 1/}^3=4хе locmin, причем при |ξ|<1 эта- экстремаль не доставляет сильного минимума, ибо условие Вейерштрасса не выполнено. 103. Краевым условиям удовлетворяет экс. тремаль х = 0. Но она не является решением задачи: по теореме Боголюбова Sm\n = — оо, Smax =.+ оо. 104. Краевым условиям* удовлетворяет экстремаль л; = 0. На этой экстремали выполнены* достаточные условия слабого минимума, ибо поле x(t, Я)э=Я окружает экстремаль и условие Лежандра [выполнено:!L— (t) ss 2 > 0. Необходимое условие Вейерштрасса также выполнено, ибо функция* x2 + 2tx* выпукла. Сильного минимума, однако, нет. Достаточна взять ломаную x{t\ k, h) = ktlh при 0^г<А и k(l— t)/(l—h) при? h^t^l и для^любого [k > 0 подобрать h > 0 так, что & (х (· ι k9 h))<0. 105. Smin= —оо, 5^χ=+οο, * = 0£locextr. 106. Smin = — ОО (Xn (ί) = 1 — t, Τη = П), Smax = + ОО. Допустимая* экстремаль: х = i2/4—t + 1 (f =2) §έ locextr|107. Smin= — оо (xn(t)= = (t2—/г2)/4 + /ι,. Τη = /г), 5max = + °°. Допустимая 1 экстремаль:. x = t2!4~8 (f= 8) £ locextr. 108. 5min=—oo [xn(t)=\-L il<tv;<in-i, тя=я . . V 1(ξ+ΐ)(ί-Λ+ΐ)-ι, Λ-ι;<ί<η, у Допустимая экстремаль: х = /2/4 (Т = 2У|, ξ >θ)^ locextr, Smax— = +оо. 109. 5min= — оо (xn(t) = (t*—nt)/4 + t, Tn = n), Smax = 190
= +оо. Допустимая экстремаль: x=t*l4—(1+У5)^ (f-= 8 + + 4У5) £ locextr. НО. ^Γ,,—/2)/4 ί= absmin, Smin=—Го/12, ■5max= + «>. 111. (*Г0—*2)/4е= absmin, Smin=—To/48, Smax=+oo. 112. T0<2=*Mmin = (2fT0—f2)/4e= absmin, Smi„= — 71/12; T0> - ίί, 0<i<T0—2, Л >2=4xmin = {To_l_(ί_Γο)2/4> Го_2<ί <T0, Xmine absmin' Дпах=— <«=absmax, 5π,3χ = 7Ό + Το/2. 113. Т0<4^хга1п = (/Гв— -ή/4εabsmin, Smin=—T03/48; f/. 0<ί<Γβ/2—2, T0 > 4 =» *mi„ = Г0/2-1 -{t~ T0/2)2/4, Г0/2-2 < f < T0/2 + 2, [τ0-/, T0/2 + 2</<T0, Jimin e absm in, л:тах = {^ __ j. τ /2<t<T *max e a^smax'· ^max= = T0-j-To/4. 114. Допустимых экстремалей нет. 5min=—оо (.*(*)= = /j4<j/4*(·), Т) = Т—Т*12-+~оо при Τ-*·'+οο или л:(0 = = *min(0—допустимая экстремаль из ответа к задаче 112). Smax = -=+оо (*(/)=—f =4d/(*(·), Γ) = 7, + 7,2/2^· + οο при Т->-+оо). 115. Допустимых экстремалей нет. Smjn = —°° (Л;(0=:: (/, 0<*<Т/2, -[т-КЗГ№<т.*"Ы-)-т>-т-'П14 или *(')= ==^01^(г)—допустимая экстремаль из ответа к задаче 113=^#(*(·)> \ / (— t, 0<ί<Τ/2,, Τ) — эо при Τ -* + оо J. Smax= + оо |χ (/) = |^_^ Tl2<t^Tt -» =>&(χ{·), Т)=Т+Г2/4->-|-ооприГ->.+оо I. 116. te2~' sabsmax, -Smin = —oo. 117. 3f—3i2/2e absmin, Smin = 3, Smax=+oo (xn{t) = — (2n+l)sinn(2n+l)t\. ;U8. 6/—6/2 e= absmin, Smin = = 12, Snux^+oo (Ar„(/) = (n/2)(2n+l)sin«(2rt+l)i). H9. 5i3/8— -—15</8 + lje'absmin, , Smln = 15/8, Smax = + oo. 120. — 20*3/3 + + 14i2^8i+le>bsmin, Smin = 8, Smax=+oo. 121. x(t)=33 (T= = 1/3) <=|absmin, £Smax= +oo; имеется еще одна допустимая экстремаль^—Ι)2 (Г=1). 122. *(0=1 (7^= 1/3) <= absmin, S«ax = = +оо; |имеется еще одна допустимая экстремаль t2 (f=l). 123. 2(i+sini)/(3n)e absmin, Smax=-(-oo. 124. (2/я) sin ie absmin, -5тах=+-°о· 125. cosi—1 <= absmin, Smax=+oo. 126. Smax= + oo, 2(e<—e/ —l)/(e2—4e+ 1) e absmin. 127. t e absmin, Smax = + oo (решение см. в [АГТ, № 6.15]). 128. In (t + 1) —1 <= absmin, Smax= = +oo. 129. 1/i-f1/2e=absmin, Smax=-foo. 130. /—eln/—1 e= <= absmin, Smax=+°°· 131. S,nax= -f<x>, f + (l—e)lnf—Is absm in. 132. (In(*+l))/ln2 = absmin, !Sm«=» + oo. 133. Alt —I e= absmin, -Smax= + oo. 134. (ln(3(f-.l)/(f+l)))/ln(3/2)e absmin, Smax= + oo. 191
135- tB €Ξ absmin, Smax = + oo. 136. e* c= absmin, 137. chieabsmin, Smax=+oo. 138. α>—thT0«^^s5 Oeabsmin,. Smin^O; a=—thT0*4 С chfe= absmin VCeR, Smi„ = 0; a< <—thT0=7^=0^locmin» Smin= — oo (xn=nchO; Smax=-foo* Va (решение см. в [АГТ, № 5.5]). 139. 1ηί+ 1 е absmin, Smax = = +oo. Ш.х^УЩЗ, χ^-уТ+Т. 141.21η(ί + 1). 142. —e*l(e*+ + 1). 143. x==yt+l eabsmin. Smax=+cx). Указание. Пр№ доказательстве минимальности можно воспользоваться тем, что* (ix)*=(-Lj£L\2u 144. £ = (/— l)2^locextr, ?2=(i-2)2/4e locmto \ di 2 / (сильный); Smin=—oo, Smax=+<x>· 145. 2 ln(t+ l)j= absmin,- Smax=+oo. 146. i3-ieabsmin, Smax=+oo. 147. (V2chV2~i + + sh VS"i)/(V2 ch V2 + sh V 2) <= absmin, Smax = + oo. 148. f ch t-~ —sh ί (sh 1 + ch l)/ch 1 e= absmin, Smax = + oo. 149. {t— 1) ch t <= e absmin, Smax=+oo. 150. e'e absmin, Smax=-f-oo (решение см. в [АГТ, № 5.106]). 151. Допустимых экстремалей нет. Smin = = l(xft=sh*/shT,:, Tn = n), Smax=+<x>. 152. jc = 2sh ГсЬif, f— единственное решение уравнения sh 2Т -f Τ = 1. 153. х= — 2 ch Г sh ^ f—единственное решение уравнения sh2T, = 7+l. 154. 5max = = -foo, Smin=—oo(xa(t)^n), χ = cost—1 §έ locextr. 155. Smax= = + oo, (I ch f/ch T0) e absmin|Smln = ξ2 th T0. 156. ξ = 0 -£ x(i) = О (Г>0—любое) e absmin; ξ =£θ=£ допустимых экстремалей нет. Smin = 0 (x(t) = tchtl<iiT^ff(x(·), T) = l*thT^0 при Γ-^OV (S«e=+0O (χ(ί) = ξ-»#(*(·). ТНРГ-И-ОО при Г + оо). 157. |||<cthT0^* = |chT/chT0e absmin; ||l >cth7,0=4 ί = isignl-^-, 0<*<τ, „ .. — \ * τ д: ен absmin, где τ отыскивается- \l+(t-T0)signl, τ<ί<Τ0, из уравнения ||| = стт— τ + Τ0. x~l~(t—T0)sign|<= absmax. 158 |=0=^ί(ί) = 0 (Γ>0—любое) s= absmin; ξ φ 0 =4 допустимых экстремалей нет. Smin = 0, Smax= -f oo, (χ(ί) ==|=£<£f (χ(·), Τ) = = |2Τ_^.ο при Г-^0 и еГ(дс(.), Г)-»-+оо при Т->+оо). 159. (ξsh0/sh^eabsmin,jSmin = i2cthT0, Smax = + oo. 160. ξ = = 0=^χ(ί) = 0 (Τ ^> 0—любое) <= absmin; ξ φ 0 =4 допустимых экстремалей нет. Smin=|», 5max= + oo (χ(ί)=(ξshf)/shΤ-}&(χ(-),Τ)= = l2dhT-+l2 при Т-+-+00 и #<*(·), Τ)-"+«> пРи Т-*-+0). 161. Ι ξ Ι ^> 7Ό =^ допустимых функций нет. |||<thT0=^- *4£shi/shT0e absmin, Smin = |2cthT0, thT0<i|^K70«^xmi„ = f(shi/chT)signi, 0</<τ ^ eU+(i-7-e)sign6, τ<ί<Γ0 (т-к°Рень Уравнения TJ-tht- — τ = I i I), Xmin e absmin Smin = jξ | + 1ξ13/3—th3 τ/3,'3 w = = i|+(r0-0signi, (Г,+©/2«<Г§, ^-eabsmax., 162. ξ_ 192
= 0^2(0=^0 (f>0—любое) e absmin; ξ=£θ:=> допустимых экстремалей нет. |ξ|<1 =4Smin = £2, x = lshtlshT=$3 (*(·), Γ) = = £2сШГ-^2 при Г-^+оо; \l\>l^Smin= |ξ|3/3+|ξ|-1/3, л:(^) = ^т1п(0 из ответа к задаче 161 =^ (£(*(·), T)-*Smm при Т->- -*+оо. 5max-+oo(x(0 = |//r=4d7(x(.), Γ)-ξ2/Γ + ξ2773-++οο при Т-*+оо). 163. te-'eabsmin, Smax=+oo. - 164. cosi + sini^ e absmin, Smax=+oo. 165. x=± \ ,, . ^.^ (τ— I — cos^/sint, τ<ί<π, ν решение уравнения xtgx = — 1), xmin e absmin, Smin = — τ3/3, Smax = = π. 166· sin/eabsrnin, Smin = 0, 5max==+oo. 167. x = itt {0<*<τ, = ±| -^cos(/— 3π/4)/ειη(τ—3π/4), 0<*<3π/2—τ, (τ—ко- 1 3π/2—t, 3π/2—τ < / < 3π/2, рень уравнения^ 3π/2 = 2τ + 2arctg т~ι) e absmin, Smin = — 2τ3/3,. 5^;χ = 3π/2. [168. Т0<я/24^0б absmin, 5min = 0; T0 = = π/2 =4 С sin fe absmin V|C|<1, 5min = 0; Τ0>π/2«»Γ== ==±{l/Tq^?cos(i-ra)i τ<ί<Γ0ι ^^absmin(x-KopeHb уравнения Tctg(To—;τ)- 1, tg(T0-ji/2, Γ0)); Smin= —τ*/3, 5тах=Г0. 169. Г0<я^^5= 0 е absmin, Smin = 0; Γ0 = π =4 С sin /e absmin V|C|<1, Sml„=0; Г0 > π *4 л: = ± 1/1+τ2 cos (t—T0/2)y τ < f < Γ0—τ, * e= absmin.. Ι^β-ί, Γ0-τ<ί<Γ0, (τ—корень уравнения Ttg(ro/2—τ)=1, лежащий на отрезке [Т0/2—: — π/2, Г0/2]); 5min= |-τ3, 5тах = Г0 (*я(0 = f sign sin 2ялтЛ\.. о 170. (/—π/4+l)cosi eabsmax, 5min^—oo. 171. t sin t e absmin,. 5max=+oo. 172. Γ0<π=4(ξ—Τ0 cos T0) sin //sin Γ0 + ^ cos/ e absmin; 70 = я^ при ξ= —π /cos ί + С sin re absmin VC^R; Γ0>π^ допустимые экстремали §Ё locextr И 5min °° j *Smax — -f- OO. i7S\(—4ln)tsint + Csirtf VCeR. 174. χ ξξξ ± Ι εξ absmin, 5min== = 0, Smax = + oo. Допустимыми экстремалями являются также функции lc{t) = ±Y2cosnkti JeN. 175. ± 1/2 cos nt e absmin, 5min = = π2, 5max= + oo. f Допустимыми экстремалями являются также функции ±^l/2cos]nkt\k=^ 2, 3, 176. Допустимые экстремали: ί^ = +"ΐ/2$ίη(1/2 + &)π/, &]^ Ζ, i^^srain· 177· Допустимые экстремали: xl= ±Y2sin'tknty & = ±|1, ±2, ..., ^ е absmin, 5т1п = π2, Зтах = + <*> [(решение см. в [АГТ, № 6.17]). 178. лГ= =1/2—(t— I)2. 179. 5max= + ootyrl—^ + fgabsmin. 180. Smax== = -f-oo, 1/2—(^—l}2^ absmin (Т=1—j/2/5). 181. je=T/1—t2 + 2U f = 2. 182. x = tlV2, f = 2l/l. 183. 1/1 — /2 eabsmax, —1/1 — /2e~ 193
<e absmin. 184. Решение. Лагранжиан: L= K0x + xV\+x*b d λ'χ Уравнение Эйлера: 2 +λ0=0. Яс = 0»^ χ = const. Тогда из условий на концах и изопериметрического условия следует, «что х = 0,. 1=2Т0. λ0=1 *$-—b£= = t+C1^x= -/ + Cl . Общее решение: (i+Ci)2+ (лг+С2)2=^2. Из условий на концах следует, что С\=0. При 2Г0<^<яГо имеется единственная (с точностью до знака) экстремаль, являющаяся дугой длины / окружности, проходящей через точки (±Го> 0), с центром на оси х. При 1<2Т0 и 1>πΤ0 экстремалей нет. 185. 1<2Т0 — экстремалей нет, /= = 2Т0=>х=09 l>2T0=>x=±C(ch(t/C)—ch(T0/C))9 где коэффициент С>0 определяется единственным образом из уравнения 2С sh (Т0/С) =1. 186. Экстремали в задаче — цепные линии вида Cch(t/C). Пусть α определяется из уравнений a==shT, т=сШт. Тогда если |||<аГ0, то экстремали нет, |ξ|=αΓ0=>- экстремаль юдна, |ξ|>α7ο=>- имеются две экстремали. 187· Экстремали в задаче — цепные линии x=Cch(t+D)/C. Константа D в задаче равна нулю, а константа С должна быть определена из уравнения СсЬ7УС=£. Если теперь α определить из системы уравнений r=ctht, a=shr то при Ц/Т0\>а имеются две допустимые экстремали; при |£/Г0|=а имеется одна допустимая экстремаль; при |ξ/Γ0|<α допустимых экстремалей нет. Подробное исследование задачи содержится в [И, с. 427]. 188. Экстремаль записывается в параметрической форме следующим образом: а2 а2 х = —(1—cost), t = — (τ—sint)-fc- Константы α и с однозначно отыскиваются из начальных условий. Допустимая экстремаль может быть включена в поле экстремалей, покрывающее полосу U^iKi\y х>0; интегрант квази- регулярен. Основная формула Вейерштрасса приводит к тому, что допустимая экстремаль доставляет absmin, Smax=+oo. 189. Экстремали, удовлетворяющие начальному условию х(0) = = 0, имеют вид x(t, α) =αί+ (1 + α2)ί2/4/ι. Уравнение огибающей этого семейства имеет вид х=—/ι+ί2/(4/ι) (в баллистике эта кривая носит наименование кривой безопасности). Если точка (Го, ξ) лежит вне кривой безопасности, допустимой экстремали нет; если эта точка лежит на кривой безопасности, допустимая экстремаль единственна; под кривой безопасности имеются две допустимые экстремали. При этом верхняя (навесная) экстремаль имеет пересечение с огибающей, т. е. сопряженную точку внутри (0, Го), и, значит, не дает сильного экстремума. Нижняя дает сильный минимум. Вопрос об absmin требует до- лолнительного исследования. 194
190. Smax= + oo, x^(xixx2)=(ch(t— l)/chl, ch(t— l)/chl)c=absmiiu 191. Smax= + οο,\Γ=(*7, £>) = (sin/, — sin0^absmin. 192. Smax= = -foo, 5rian= —oo. Допустимая экстремаль: *=(3/2—2t9 6t2—4t)~ 193. *χ =—6t2 + 6t, x2 = 3t2— 2/—допустимая экстремаль, Smm = =—oo, 5max= + cx). 194. ^ = x2 = 0^ locextr, 5min=—oo, Smax= = 4- oo. Указание. Воспользоваться теоремой Боголюбова. 195. x1 = (ilu xl2) = (3t2—2t, 3t2~6t),xl = 0cl9 xf) = (—3t*+4tT —3t2)—допустимые экстремали; Smin==—oo, Smax=+oo. 196. Единственная допустимая экстремаль: x = sin/, у —cost (решение см. в [АГТ, № 8.23]). 197. |ξ|< W^g, |ξ|>1-» С, 0<i<l/|C|f Cch(t-U\C\)9 1/|C|</<1, где С определяется из уравнения Cch(l—1/|С|)=£. В силу выпуклости задачи *^absmin. 198. Оптимальная траектория — окружность радиуса Γ0/(2π) (решение см. в [АТФ, с. 110]). 199. Решение. Формализация: 7*о tdt . ( · ^п ► mi; x = u9 и^О, J l + u о x(0)=0, х(То)=%. Функция Лагранжа То %=\Ldt + V(0) + λ2χ(TD)f L = ^j + ρ(χ-ύ). о Необходимые условия: а) система уравнений Эйлера: —р = 0; б) трансверсальность по χ: ρ(0)=λι, р(Т0) =—Яг; в) принцип минимума: mm (— ри =—^ ри. б) Если λο=0, то ρ=constat) (р = 0 ^К1 = к2 = 0— все множители Лагранжа — нули)=^й = 0=^л:=0. Из условий на концах вытекает, что при | = 0 х = 0. а) в) Положим λ0 = 1 =4 ρ = const < 0 (р>0 =^ функция t/ (1 + и2)— ри монотонно убывает с возрастанием α и не достигает мини- ^ в) ^ мума). Если u(t)>09 то Z,tt = 0 =$u(t) находится из уравнения 2ut /1 v р= „ (1> Н (1 + а2)2 195
Шо При малых значениях tminL(t9 u) — L{t9 0). Таким образом, - ( 0, 0</<τ di = { J . Момент излома управления τ характеризует- U(0, τ<ί<Γ0 *ся уравнениями Р= ;г , τ = ζ Puix) (2) (1 + α»(τ))* 1 + "2(τ) (второе уравнение в (2) L(%—0)—L(x) — условие совпадения минимумов L в точке τ). Из второго уравнения получаем —й2(х)х/(1 + йЦх))=рй(х), откуда р=— тй (т)/(1 + й2(т)). Подставив это соотношение в первое уравнение соотношения (2), находим, что ώ2(τ) = 1=*>ώ(τ) = 1 (ибо й>0), и тогда снова из первого уравнения (2) получаем равенство т=—2р. После излома оптимальное решение удовлетворяет соотношению (1), из которого следует, что ,,_Р<1+««У —JL/_L + 2m + „3\ 2и 2 \ и / dt ^ du dt du du 2 \ и J Интегрируя это соотношение с учетом равенства i(t)=0, .ώ(τ) = 1, получаем параметрические уравнения искомой оптимальной кривой: ч х = —±- (\п -L+^2 + — иЛ + — р, 2 \ и 4/8 i=~(^-b2a + tt»Jf р<0. Зту кривую называют кривой Ньютона. Покажем, что χ доставляет абсолютный минимум в задаче. В силу принципа минимума для любой допустимой функции х(-)<вК&([09То])9 *(0) = 0, х(Г0) = 6. Ц(1 +х2 (t))~pi(t)^t/(l+?(t))-p£(t). Интегрируя это соотношение и учитывая, что То 7*0 . ^x(t)dt=^x(t)dt = l, о о ^получаем То 7*о Г tdt r tdt о 196
Значит, j?(.)e absmin. 200. Smax = + °°, (t2 — l)/2 e absmin. 20b Smax= +00; i-/2/2eabsmin. 202. 5max= +cx>; <2/2gabsmin, ■Smin=l. 203. Smax=+oo; ί2-ί£absmin, Smin = 4. 204. Smax = = +00; i*—2*3 + ie= absmin, Smin=—24/5. 205. Smax=+oo, i4—5i3/2 + 3i2/2eabsmin, Smin = —9/5. 206. Smax = + 00, t*~ ~2ts + t2& absmin, Smln= — 4/5. 207. fe'e absmin, Smax= + oo. 208. Smax=+oo, tIniGabsmin. 209. Smax=+oo, *In/gabsmin. 210. /In t^ absmin, 5max= + oo. 211. Smax=+°o, In iG absmin. 212. Smax=+oo, lnfeabsmin. 213. Smax= + oo, 1/ieabsmin. 214. * = ch ί + Csh ts absmin VCgR, Smax=+oo. 215. χ = = chi eabsmin, 5max=+oo. 216."x = /ch/e absmin, Smax= + oo\ 217. H = tsht<~ absmin, 5max= -f оо.[218Г#= СsinteaibsminVCe ^TR, Smax=:+oo. 219. lc = sin/gabsmin, SnSt ="+«>. 22θΓ*== ='—2(/ + 2)cosi/(4 + rt)e absmin, SmJix=+oo. 221. ?= (gfa + 4«)cos/ + (4<-2B)«to< e absm.n) Smax= ^ 4 — 4π — π2 222. *e absmin, где ^=(C1i + C2)chi+(C3i + C4)shi, [неизвестные константы (λ C2, C3, C4 определяются из условий л(0)=1, ы(0) = = ίΓ(1)=* ίΓ(1) = 0, u = x+V2k, Smax=+oo. 223. Smax=+oo, 1/ie absmin. 224. Smax=+oOi diisini — sh<(thnsini + cosi)e ^ absmin. 225. 5max= +00, ch tsin i—sh t cos / e absmin. 226. Smax= « + 00, Smln= —00; fcos / + ch t—l + * π (sh f+sin θ) / 2 g locextr. 227. 5max-+oo, Smln=-oo; (sini+cth| cosi-ch* +$^Я~°)/2gg ^locextr.. 228. 5max= +00, (sinf)/2 + (shf)/(2sh—) <= absmin. 229. Smax-+oo, 5mln=-oo; —^L--^L^ locextr. 230. Smax= 2sh(Jt/2) 2 я + °°t *= —cos / ^ locextr; 5min = — «> ( *n (i) = χ (ί)+η (ch (π— — f))+cosf ^£—(sh(rt—i)+sin/)). 231. 5max=: + 00; sin/ e= ch я + 1 / ^absmin, Smin = 0. 232. 5max= +00; fl+sh -|-) (sini—shi)/2 + -f ch — (ch t—cosi)/2.e absmin. 233. Smax=: + 00, sin t e absmin. '234. 5max=+oo, shie absmin. 235. 5max=+oo, chie absmin. 236. Smax= + 00, 1—cos ί e absmin. 237. Smax = + 00, 2 (sin f— —cos t—t+\)l(i—π) <= absmin. 238. /2—2 e absmin, 2—/2eabsmax. 239. f2—t e absmin, ί—t2 e absmax. Λ ί—ί2, 0</<l, 240. *=((,_2)2_2> i<i<2,eabsmin" —t2, 0<ί<1, 241. лГ=Ш—2)2—2, 1<ί^3, e absmin, —jc^ absmax. l_(f_4J\ 3<i<4, 197
(~ ί —ia—2/, —l</<0, л \ 242· [Х = { t*-2t, 0<*<I,r=Veabsmin· ~ f—*2/2+l, 0</<K3, л . , 243. χ = , _ .. ^Γ Λ r = 4/V3eabsmin. l(V3f—4)2/2— 1, У3<*<7, 244. Smax=—5min = 32/3; x(/) = i2—4ie absmin, — xe absmax- 245. Smax=-Srain = 32(2-K2)/^3; Λ ί·ί»+(8-8Κ2)<, 0<ί<2/2, ~ ~ л: = i ^_ χ e absmin, —χ e absmax. I— (<—4)2, 2K2<i<4, [— *2, 0<<<1, ^ 246. it = | (/—2)2—2, 1 < t < 3, Jc e absmin, —xe absmax, <Smln= —«bmax= —4. Λ (Ο, 0<ί<1, *7·*-| _(,_!>., i<i<2eabsmin· л ί— ί3+6ί2, 0<ί<1, 248. *={OJ, , 0. , , -.^0 eabsmin. Μ 3*" + 3ί—1, 1<ί<2 J ί—*a/2, 0<ί< 1/2, Μβ·*-{ί»/3-ί· + ί/4-1/24, 1/2<ί<1 eabsmin; 250. Smax=4-oo; 2fe absmin, 5rain=0. 251. 5max= + oo; 5(i4— —6*2 + 5)/16<ξξ absmin, Smi„=15/2. 252. Smax=-f oo; 15ί2(ί—2f/8e e absmin, 5min=45. 253. Smax= + oo; 30i2(i—l)2e absmin, Smin= ==720. 254. Smax=+oo; -c«=/2/2 (f == 1)e absmin. 255. Smax= = +oo; x=t3ll6—fl4(T = 4) e absmin. 256. ί3—f2 s absmax, f2— — f8<= absmin. 257. S№= + oo; (i2 + 2t + 2)/5 <= absmin, 5mln=0. 258. Sraax= + «>; (*»—5f«+KW»)/6e absmin, Sraln=20. 259. Smax= = + oo; (8/5—25/4 + 20*3)/3eE absmin, Smin=320. 260. 5max= + oo; 6t6— 15<«+ I0ts <= absmin, 5rain = 720.
КРАТКАЯ ХРОНОЛОГИЧЕСКАЯ ТАБЛИЦА классическая изопериметрическая задача обсуждалась, по-видимому, в V в. до н. э., упоминается у Аристотеля (384—322 до н. э.). Задачи античной геометрии встречаются в трудах Евклида (III в. до н. э.), Архимеда (ок. 287—212 до н. э.), Аполлония (ок. 260— ок. 170 до н. э.). Необходимое условие — теорема Ферма: Ферма, 1629; Ньютон, 1671, -Лейбниц, 1684. Вариационный принцип — Ферма, 1662. Задача Ньютона — Ньютон, 1687. Задача о брахистохроне — И. Бернулли, 1696. Работы Эйлера (1707—1783) по вариационному исчислению — с 1726. Вывод уравнения Эйлера прямым методом — Эйлер, 1744. Правило решения изопериметрической задачи — Эйлер, 1744 (строгое .доказательство — Вейерштрасс, ок. 1880). Задача со старшими производными (уравнение Эйлера — Пуассона) — Эйлер, 1744; Пуассон, 1833. Работы Лагранжа (1736—1813) по вариационному исчислению — с 11755. Метод вариаций Лагранжа — Лагранж, 1759. Уравнение Эйлера для многомерной задачи — Эйлер, 1770; Гаусс, 1813; Остроградский, 1826; Пуассон, 1831. Задача Лагранжа: постановка и формулировка правила множителей — .Лагранж, 1788; доказательство правила множителей — Майер, 1886. Условие Лежандра — Лежандр, 1786. Правило множителей Лагранжа для конечномерных задач — Лагранж, 1797. Теория Гамильтона — Якоби — Гамильтон, 1834; Якоби, 1Й37. Условия слабого экстремума — Якоби, 1837. Условия сильного экстремума — Вейерштрасс, ок. 1880. Теория поля — Кнезер, Гильберт, 1900. Начала бесконечномерного анализа — Вольтерра, 1887; Гильберт, 1906; Банах, 1932. Начала выпуклого анализа множеств — Минковский, 1891; функций — *Фенхель, 1949. Линейное и выпуклое программирование — Л. В. Канторович, Ш39; Данциг, 1947; Кун—Таккер, 1951. Теория оптимального управления — Л. С. Понтрягин и его школа, 1953—1961.
ЛИТЕРАТУРА АГТ Алексеев В. М., Галеев Э. М., Тихомиров В. М. Сборник задач по оптимизации. М.: Наука, 1984. АТФ Алексеев В. М., Тихомиров В. М., Фомин С. В. Оптимальное управление. М.: Наука, 1979. КФ Колмогоров А. Н., Фомин С. В. Элементы теории функций к. функционального анализа. М: Наука, 1981. 1. Ахиезер Н. И. Вариационное исчисление. Харьков: Изд-во Харьк. унта, 1981. 2. Б лисе Г. А. Лекции по вариационному исчислению. М.: ИЛ, 1950. 3. Болтянский В. Г. Математические методы оптимального управления. М.: Наука, 1969. 4. Буслаев В. С. Вариационное исчисление. Л.: Изд-во ЛГУ, 1980. 5. Васильев Ф. П. Численные методы решения экстремальных задач. М.: Наука, 1980. 6. Габасов Р., Кириллова Ф. М. Методы оптимизации. Минск: Изд-ва БГУ, 1981. 7. Гавурин М. К., Малоземов В. Н. Экстремальные задачи с линейными ограничениями. Л.: Изд-во ЛГУ, 1984. 8. Г е л ь φ а н д И. М., Фомин С. В. Вариационное исчисление. М.: Физ- матгиз, 1961. 9. Заславский Ю. Л. Сборник задач по линейному программированию. М.: Наука, 1969. 10. Зорич В. А. Математический анализ, часть I, II. М.: Наука, 1981,, 1984. П.Иоффе А. Д., Тихомиров В. М. Теория экстремальных задач. М.: Наука, 1974. 12: Краснов М. Л., Макаренко Г. И., Киселев А. И. Вариационное исчисление. М.: Наука, 1973. 18. Карманов В. Г. Математическое программирование. М.: Наука, 1980. 14. Манту ров О. В., Матвеев Н. М. Курс высшей математики. М.; Высшая школа, 1986. 15. Ни ко л ьск ий С. М. Курс математического анализа. Т. 1 и 2. М.: Наука, 1975. 16. Поляк Б. Т. Введение в оптимизацию. М.: Наука, 1985. 17. Понтрягин Л. С. и др. Математическая теория оптимальных процессов. М.: Наука, 1976. 18. Пшеничный Б. Н. Необходимые условия экстремума. М.: Наука, 1982. 19. Пшеничный Б. Н. Выпуклый анализ и экстремальные задачи. М.; Наука, 1980. 20. Рокафеллар Р. Выпуклый анализ. М.: Мир, 1973. 21. Сухарев А. Г., Τ им охов А. В., Федоров В. В. Курс методов оптимизации. М.: Наука, 1986. 22. Я н г Л. Лекции по вариационному исчислению и теории оптимального* управления. М.: Мир, 1974.
краткий путеводитель по литературе В нашей книге отражен опыт преподавания различных курсов оптимизации на механико-математическом факультете МГУ. Во многом ее материал перекликается с книгами [АТФ; АГТ], но здесь мы постарались сконцентрировать то основное, из чего можно формировать различные курсы оптимизации. В книгах [АГТ; АТФ] читатель сможет почерпнуть много дополнительных сведений. О том, как строятся различные курсы оптимизации в других университетах и на факультете ВМК МГУ, можно получить впечатление по книгам [1; 4; 5; 6; 7; 21]. В первых четырех параграфах книги мы в основном опираемся на любой стандартный курс математического анализа. В нашем списке это курсы [14; 15] для вузов или университетский учебник [10]. Многие факты § 2 отражены в этих курсах, и мы надеемся, что материал этого параграфа может быть полезен тем, кто читает лекции и ведет занятия по математическому анализу. Материал § 3 (линейное программирование) изложен в большом числе монографий и учебных пособий. Мы указываем учебные пособия (где имеется подробная библиография) [13] и задачник [9]. Вариационное исчисление (§ 4 и 5) также изложено в огромном числе книг. Мы выделили учебные пособия [\% 4; 8], задачник [12] и монографии [2] (где подведены итоги развития этой дисциплины вплоть до предвоенного времени) и [22]. Отметим также книги [АТФ, 11], где имеется много дополнительного материала по вариационному исчислению. Теории оптимального управления (§ 6) посвящены монография [17] и учебные пособия [3; 5; 6; 21]. О выпуклом анализе см. [5; 11; 19] и в особенности [20]. Для понимания второй части (§ 7—11) требуются некоторые сведения из функционального анализа. Все необходимое содержится в [КФ]. Общие подходы к экстремальным задачам обсуждаются в [11; 18]. Материал этой части в основном содержится в [АТФ, М]. Задачник в этой книге имеет много пересечений с [АГТ]. О методах решения экстремальных задач см. [5; 6; 16; 21].
СПИСОК ОБОЗНАЧЕНИИ {х\Р(х)\ — множество элементов х, обладающих свойством Р(х) х(-) — обозначение, которым подчеркивается, что х() элемент функционального пространства FoG — суперпозиция отображений G и F: (FoG) (x)=F(G(x)) R=RU{—°°, +оо} — расширенная числовая прямая R' = RU{+°o} R+" — неотрицательный ортант в Rn, R+n={*=(#i, , xn)^Rn\Xi>0Y i=lt...tn] B(xt r) = {y\\\y—x[|<r} — — замкнутый шар с центром х радиуса г В (χ, г) = {у\\\у—- х\\<г] — открытый шар с центром χ радиуса г ΤχΜ(Τχ+Μ) — множество касательных (односторонних касательных) векторов к множеству Μ в точке х X* — пространство, сопряженное с X (х*у х) — значение линейного функционала х* на элементе χ A •L={x*^X*\(x*y χ)—0γχ^Α} — аннулятор множества А domf={x^X\f(x)< + oo} — эффективное множество функции / epif={(a, x)^RXX\a>-f(x), x&domf) — надграфик функции f : X-*R linA — линейная оболочка множества А со А — выпуклая оболочка мнржества А cone Л — коническая оболочка множества А ех1хЛ — совокупность крайних точек множества А 5В(Х, Y) — пространство линейных непрерывных отображений прост·* ранства X в пространство У; отображения из 3?(Rnt Rm) могут отождествляться с матрицами этих отображений / — единичный оператор (матрица) Λ* — оператор, сопряженный с оператором Λ, <Л*#*, *>=<*/*, Ах) U^O(X) — множество U открыто в пространстве X U^O(xt X) — множество ί/, содержащее элемент х, открыто в X с\Х — совокупность Замкнутых множеств в пространстве X SL(X) — совокупность сублинейных функций на пространстве X С ([to, t\]) — пространство непрерывных функций на отрезке [ίο, *ι] cr нормой ||*(·)ΙΙο= max \x(t)\ Cr([tot ti]) — пространство г раз непрерывно дифференцируемых функций на отрезке [tQ, *ι] с нормой ||x(«)llr=max{||x(-)llo, ||#(.)||0, ..., ..., ΙΙ*<'>(·)ΙΙο> . КС ([to, ti]) — пространство кусочно-непрерывных на отрезке [ί0> *ι] функций, т. е. имеющих не более конечного числа разрывов первого рода (в точках разрывов существуют конечные пределы слева и справа) 6F(x, ·) — вариация по Лагранжу отображения F в точке χ F^Dk(x) — отображение F дифференцируемо по Фреще k раз (k>\) в точке χ F^SD(x) — отображение F строго дифференцируемо по Фреше а точке χ dF(x) — субдифференциал функции F в точке χ xeabsmin (absmax, absextr) — χ доставляет абсолютный минимум (максимум, экстремум) в задаче *elocmin (locmax, locextr) — χ доставляет локальный минимум (максимум, экстремум) в задаче 5Э — численное значение задачи (з) (Р) — задача, приведенная с решением 202
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Аннулятор 52, 202 ^биполяра 36, 116 вариация по Лагранжу 22 •вектор касательный 32 — односторонний (полукасательный) 32 дифференцируемость' по Гато 22 — по Фреше 23 — строгая 23 задача Аполлония 171 — Архимеда 171 — Больца 68 — выпуклого программирования 48 — Герона 171 — Годдарда 160 — двойственная 64, 147 — Дидоны 179 — Евклида 170 — Зенодора 1*71 — изопериметрическая 77 — Кеплера 170 — Лагранжа 81 — линейного программирования 57 в канонической форме 57 в нормальной форме 58 — ляпуновская 149 — Ньютона аэродинамическая 199 — о быстродействии 102 — о мягкой посадке космического аппарата 157 — оптимального управления 91 линейные по фазовым переменным 151 — простейшая классического вариационного исчисления 72 — со старшими производными 88 — с подвижными концами 86 — Тартальи 170 — Улама 161 — Ферма 170 — Шварца 170 — Штейнера 170 иголка элементарная 94 игольчатая вариация управления 94 функции 94 интеграл импульса 74 — энергии 74 - «нтегрант квазирегулярный 130 — регулярный 130 конволюция 35 конус сопряженный 36, 116 критерий Сильвестра 45 лагранжиан 77 лемма Банаха 109 — Дюбуа — Реймона 70 — об аннуляторе ядра регулярного оператора 113 — об игольчатой вариации 97 — о двойственности для задачи о кратчайшем расстоянии 137 — о замкнутости образа 112 — о минимаксе 124 — о нетривиальности аннулятора 111 — о правом обратном операторе — о приращении функционала 95 — о свойствах элементарной вариации 94 — о скруглении углов 128 — о сопряженном конусе 136 — о центрированной системе 96 — Хоффмана 137 максимум (минимум) 10 — абсолютный 11 — локальный 11 — сильный 127 — слабый 68, 127 метод Ньютона 56 — градиентный 57 множество выпуклое 33 — эффективное 34 множители Лагранжа 13 надграфик 34 неравенство Бернштейна 166 — Иенсена 34 — Юнга 36 оболочка выпуклая, коническая 34 отделимость 20 — строгая 20 оператор регулярный (сюръектив- ный) 109 — сопряженный 19 пакет иголок 96 поле экстремалей 142 центральное 142 поляра 36, 116 преобразование Лежандра—Юнга— Фенхеля 35, 115 принцип Лагранжа 14 — максимум Понтрягина 92 производная по направлению 22 симплекс-метод 58 субдифференциал 36, 116 теорема Банаха об обратном операторе НО 203
об открытости 109 — Боголюбова 156 — Вейерштрасса 20 — двойственности β4, 117, 147 — Дубовицкого — Милютина 40, 120 — Куна — Таккера 48, 148 — Люстерника 30 — Ляпунова 113 — Майкла о непрерывной селекции 112 — Минковского 35 — Моро — Рокафеллара 40 — об очистке 41, 120 — отделимости вторая 20, 109 первая 20, 108 — о биполяре 37, 117 — о касательном пространстве 32 — о компактности поляры и субдифференциала 117 — о полном дифференциале 29 — о среднем 27 — о суперпозиции 25 — существования 62 — Тонелли 15i6 — Фенхеля — Моро 37, 117 — Ферма 42 — Хана — Банаха 106 — Хелли 114 — Эйлера — Лагранжа 82 терминант 68 точки допустимые 11 — крайние 35 — критические 15 — сопряженные 129 — стационарные 13 уравнение Якоби 129 — Эйлера 69 — Эйлера — Пуассона 89 условие Вейерштрасса 130 — дополняющей нежесткости 47 — Лежандра 129 — неотрицательности 47 — Слейтера 49 — стационарности 45 — трансверсальности 69 — Якоби 129 формула Вейерштрасса основная 146 — Тейлора 28 функция Вейерштрасса 130 — выпуклая 34 однородная 34 — замкнутая 37 — индикаторная 37, 116 — Лагранжа 13 — Минковского 37, 116 — наклона поля 142 — опорная 36, 116 — собственная 34 — сопряженная 35, 115 — вторая сопряженная 36, 11<6 «S-функция 144, 147 якобиан 24
Учебное издание Галеев Эльфат Михайлович, Тихомиров Владимир Михайлович КРАТКИЙ КУРС ТЕОРИИ ЭКСТРЕМАЛЬНЫХ ЗАДАЧ Зав. редакцией Н. М. Глазкова Редактор Л. А. Николова Художественный редактор A. JI. Прокошев Технический редактор B. В. Макарова Корректоры Л. А. Айдарбекова, Л. А. Костылева
ИБ № 3256 Сдано в набор 03.01.89. Подписано в печать 26.06.89. Л-15314. Формат 60X90/16. Бумага офс. № 2. Гарнитура литературная. Высокая печать. Усл. печ. л. 13.0. Уч.-изд. л. 13,50. Тираж 11000 экз. Заказ 7. Изд. № 656. Цена 45 коп. Ордена «Знак Почета издательство Московского университета. 103009, Москва, ул. Герцена, 5/7. ПП «Чертановская типография» Мосгорпечать 113545, Москва, Варшавское шоссе, 129а.
^?^>X^\^>XS4>^^ > \ \ ν ν ν ν Э.М.Галеев В. М.Тихомиров КРАТКИЙ КУРС ТЕОРИИ ЭКСТРЕМАЛЬНЫ ЗАДАЧ