Автор: Тихомиров В.М.   Галеев Э.М.  

Теги: математика   оптимизация  

ISBN: 5-8360-0041-7

Год: 2000

Текст
                    

Э.М. Галеев В.М. Тихомиров ОПТИМИЗАЦИЯ ► Теория ► Примеры ► Задачи Эдиториал У PC С • Москва * 2000
ББК 22 . 18я73 И Настоящее uuiauue осуществлено про финансовой поддержке Российского фонда фундаментальных исследований (проект № 98-01-14126) Галеев Эльфат Михайлович, Тихомиров Владимир Михайлович Оптимизация: теория, примеры, задачи. — М.: Эдиториал УРСС, 2000. — 320 с. ISBN 5-8360-0041-7 Книга посвящена важнейшим проблемам оптимизации. Она построе- на на базе преподавания теории оптимизации па механико-математическом факультете МГУ. В основе ее лежат курсы, прочитанные в 1998/99 толах Э. М. Галеевым (Главы 1-5) и В. М .Тихомировым (['лава 6). Рассматривают- ся фрагменты следующих разделов теории экстремальных задач: линейного и выпуклого программирования, математического программирования, класси- ческого вариационного исчисления и оптимального управления. Приводятся как необходимые так и достаточные условия экстремума. Для изучения этих разделов в необходимом объеме даются элементы функционального и вы- пуклого анализа. В каждом параграфе после теоретической части приводятся примеры решения задач, предлагаются задачи для решения па семинарах, контрольных и для домашних задании. Дается обзор общих методов теории экстремума. Для студентов вузов по специальностям «Математика», «Прикладная математика», а также для аспирантов, преподавателей и научных работников. 9785836 000417 > ISBN 5-8360-0041-7 © Э. М. Галеев, В. М. Тихомиров, 2000 © Эдиториал УРСС, 2000
Предисловие Задачи на отыскание наибольших и наименьших величин являют- ся актуальными на протяжении всей истории развития человечества. Особенное значение они приобретают в настоящее время, когда воз- растает важность в наиболее эффективном использовании природных богатств, людских ресурсов, материальных и финансовых средств. Все это приводит к необходимости отыскивать наилучшее, или как говорят, оптимальное решение того или иного вопроса. Первые задачи на максимум и минимум были поставлены и решены в глубокой древности, когда математика только зарождалась как наука. Теория экстремальных задач начала создаваться в начале 17 века, и за- тем она активно развивалась вплоть до наших дней, включая в свою орбиту крупнейших математиков таких как Ферма, Ньютон, Лейбниц, Бернулли, Лагранж, Эйлер, Пуанкаре, фон Нейман, Канторович, Пон- трягин и других. В наше время невозможно мыслить себе полноценное математическое образование без элементов теории экстремума . Книга состоит из 6 глав. Первые пять глав, составляющих пер- вую часть, написаны Э .М .Галеевым. Они содержат материал курсов оптимизации, читаемых на курсах лекций по методам оптимизации, линейному программированию, оптимальному управлению и вариаци- онному исчислению на механико-математическом факультете Москов- ского государственного университета, а также в некоторых институтах естественно научного профиля. Данный курс лекций был разработан целым рядом профессоров и преподавателей механико-математического факультета МГУ. На начальном этапе курс формировался усилиями В. М. Алексеева, В М. Тихомирова, С В Фомина. Методическая разра- ботка доказательств, а так же подбор и составление задачного материала во многом были проведены Э. М. Галеевым. При написании этих глав использовался материал, содержащийся в ранее опубликованных книгах: (АТФ) Алексеев В. М., Тихомиров В. М., Фомин С. В. «Оптимальное управление», М.: Наука, 1979; (АГТ) Алексеев В. М., Галеев Э. М., Тихомиров В. М. «Сборник задач по оптимизации», М.: Наука, 1984; (ГТ) Галеев Э. М., Тихомиров В. М. «Краткий курс теории экстремальных задач», М.: Изд-во МГУ, 1989. Эта часть книги является расширением вариантом пособия Галеева Э. М. «Курс лекций по вариационному исчи- слению и оптимальному управлению», М.: Изд-во мехмата МГУ, 1996. Она предназначена для курсов, включающих элементы теории экстрему- ма любого уровня и приспособлена к действующим ныне программам. Все чертежи в LATEX'e 1е выполнены Альфирой Галеевой. В этой части рассматриваются следующие разделы теории экстре- мальных задач: задачи без ограничений, гладкие задачи с ограничениями
4 Предисловие типа равенств и неравенств, линейное программирование, классичес- кое вариационное исчисление, оптимальное управление, необходимые и достаточные условия экстремума в классическом вариационном исчис- лении. При изучении данных разделов требуется знание основ математиче- ского анализа и линейной алгебры, изучаемых на первых двух курсах технических и педагогических вузов, университетов. Предполагается, что читатели знакомы с элементарными приемами дифференцирования и интегрирования функций, умеют решать простейшие дифференци- альные уравнения, знакомы с элементарными навыками работы с ма- трицами (умножением, транспонированием, нахождением обратной). Все остальные используемые в курсе математические понятия подробно определяются. В первой главе рассматриваются задачи без ограничений, задачи с ограничениями типа равенств, с ограничениями типа равенств и не- равенств для числовых функций п переменных и в нормированных пространствах. Для каждого типа задач приводятся решения соответ- ствующих примеров. Одним из примеров является старинная задача Аполлония о нормалях к эллипсу. Методами теории экстремальных за- дач решается задача из курса алгебры о приведении квадратичной формы к главным осям. Большое внимание уделяется выпуклым задачам. Дают- ся элементы выпуклого анализа, причем выпуклый анализ в зависимости от уровня математической подготовки читателя может рассматриваться как в конечномерных пространствах, так и в линейных нормирован- ных пространствах, вводится понятие субдифференциала и доказывается теорема Куна—Таккера. В этой же главе даются некоторые элементы функционального анализа и дифференциального исчисления в норми- рованных пространствах. Вторая глава посвящена линейному программированию. В ней вна- чале даются постановки задач линейного программирования, правило решения задач в канонической форме по симплекс-методу, приводят- ся с решениями примеры. Вводится понятие двойственности, затем проводится строгое обоснование симплекс-метода, дается ряд методов нахождения первоначальной крайней точки. Полученные навыки при- меняются к некоторым наиболее известным типам задач линейного программирования — транспортным задачам и задачам о назначении. Основная цель при этом — ознакомление студентов с имеющимися методами решения задач линейного программирования и проведение обоснования этих методов. Обоснование проводится таким образом, чтобы для решения подобных задач в дальнейшем возможно было бы самостоятельно создать метод решения и провести его обоснование. В пособии приведены доказательства теоремы существования решений и теоремы двойственности, позволяющие более глубоко понять данный курс.
Предисловие 5 В третьей главе приводятся следующие элементарные задачи класси- ческого вариационного исчисления: простейшая задача, задача Больца, изопериметрическая задача. Все эти задачи являются частным случаем более общей задачи Лагранжа. Как частный случай задачи Лагранжа рассматриваются задача с подвижными концами и задача со старшими производными. В четвертой главе рассматриваются задачи оптимального управле- ния. Приводится формулировка и доказательство принципа максимума Понтрягина в общем случае, а также принципа максимума для задачи со свободным концом. Решаются простейшая задача о быстродействии, задача Ньютона и ряд других задач оптимального управления. В пятой главе даны необходимые и достаточные условия экстремума в простейшей задаче классического вариационного исчисления. Глава 6, составляющая вторую часть, написана В.М.Тихомировым и посвящена обзору всей теории экстремальных задач с единых совре- менных позиций. Она основана на записях курса лекций, читавшегося Тихомировым В. М. на механико-математическом факультете МГУ осе- нью 1998 года. В ней в сжатой форме выражено воззрение на теорию экстремальных задач, составившее стержень книг Иоффе А.Д., Тихо- миров В. М. «Теория экстремальных задач», Мл Наука, 1974 и Алексе- ев В. М., Тихомиров В. М., Фомин С. В. «Оптимальное управление», М:. Наука, 1979. Эта часть рассчитана на преподавателей вузов и университетов (в особенности, на ведущих занятия по курсам оптимизации) ^студентов старших курсов университетов и научных работников, интересующихся проблемами теории экстремума и местом, которое занимает этот раздел анализа в современной математике. Глава 6 написана в надежде на то, что она п оспособствует модернизации курсов оптимизации в будущем. Глава 6 состоит из пяти параграфов, посвященных принципу Лагран- жа для необходимых условий экстремума, возмущениям экстремальных задач, существованию решений, алгоритмам оптимизации. Отдельный пятый параграф посвящен решению конкретных задач. Э. М. Галеев, В. М. Тихомиров
Часть I Введение Теорию задач на отыскание наибольших и наименьших величин называют теорией экстремальных задач. Слово maximum по латыни означает «наибольшее», слово minimum — «наименьшее». Оба этих понятия объединяются словом «экстремум» (от латинского extremum, означающего «крайнее»). Слово «экстремум», как термин, объединяющий понятия «максимум» и «минимум», ввел в употребление Дюбуа-Реймон. Ныне раздел анализа, в котором изучают разнообразные задачи на максимум и минимум, называют теорией экстремальных задач. Запись задачи в виде f(x) —> extr означает, что мы должны решить и задачу на минимум, и задачу на максимум. Задачу на максимум всегда можно свести к задаче на минимум, заменив задачу f(x) —> max задачей f(x) —> min, где f(x) = -f(x), и наоборот. Поэтому в тех случаях, когда формулировки теорем для задач на минимум и максимум различны, мы иногда будем ограничиваться рассмотрением задачи на минимум. Задачи на максимум и минимум изначально формулируются, как правило, на языке той области, в которой они возникают. А исследуют их средствами математического анализа. Для того, чтобы можно было воспользоваться этими средствами, необходимо перевести формулировку задачи на язык математического анализа. Такой перевод называется формализацией. В общем виде формализованная задача выглядит следующим обра- зом: найти экстремум (максимум или минимум) функции f:X —> R, определенной на некотором пространстве X при ограничении х Е D (DC X). Кратко записываем так: f(x) —* extr; х € D. Для функции одной переменной X — R, для функции нескольких переменных X = Rn. В более общих случаях X может быть линей- ным, нормированным или топологическим пространством. Ограничение х € D может быть записано в виде включения, а также в виде уравнений или неравенств. (Р) — нумерация (обозначение) задачи (от английского слова problem — задача). Множество допустимых элементов в задаче (Р) обозначаем D = D(P) или Dp. Если множество допустимых элементов
Введение совпадает со всем пространством (D = X), то задачу (Р) называем задачей без ограничений. Решением задачи (Р) на минимум является точка f такая, что /(а?) > /(#) лля всех точек х € D(P). В этом случае мы пишем f € absminP. Такой минимум называется еще абсолютным, или гло- бальным. Аналогично определяется абсолютный максимум в задаче (absmaxP). Величина /(f), где х — решение задачи, называется чи- сленным значением задачи и обозначается Smin или 5тах (иногда, чтобы подчеркнуть глобальность экстремума, ^>absmin ИЛИ Sabsmax)- Множество решений задачи (Р) обозначается ArgP. Если экстремум не достигается, то мы должны указать последовательность точек хп, на которой значение функции f(xn) стремится к величинам Smjn и Smax. При решении задачи следует отыскать не только абсолютные (гло- бальные) экстремумы задачи, но и локальные экстремумы. Точка х является точкой локального минимума в задаче (Р) (пишем А € locminP), если существует окрестность U точки £ такая, что f(x) /(f) для любой допустимой точки х из этой окрестности (V ж € D П U). Аналогично точка х является точкой локального максимума в задаче (Р) (пишем х G locmaxP), если существует окрестность U точки f такая, что f(x) < /(f) V х € D П U. Если речь идет о максимуме или минимуме, то пишем locextrP. В связи с каждой экстремальной задачей возникают вопросы: ка- ковы необходимые условия экстремума, каковы достаточные условия , существует ли решение задачи, как найти решение явно или численно. В теории экстремальных задач наиболее разработаны необходимые условия, которым должно удовлетворять решение задачи. Выписывая эти необходимые условия экстремума, мы находим некоторое множество то- чек, удовлетворяющее этим условиям. Это множество точек (мы называем их стационарными, или критическими, или экстремальными), возможно, шире, чем множество абсолютных и даже локальных экстремумов. По- этому далее надо с каждой такой точкой разобраться, доставляет она экс- тремум (и какой) или нет. Это делается с помощью достаточных условий. Одним из важнейших принципов решения задач с ограничениями является принцип Лагранжа снятия ограничений. Ниже он будет сфор- мулирован и доказан для некоторых конкретных типов задач. Сфера применимости принципа Лагранжа достаточно широка. Иногда нельзя к задаче применить имеющуюся теорему, однако этот принцип, приме- ненный без обоснования, тем не менее может привести к точкам, среди которых можно выделить решение.
Глава 1 Экстремальные задачи § 1. Конечномерные задачи без ограничений В этом параграфе даются необходимые и достаточные условия экстремума функций одной и нескольких переменных. 1.1. Постановка задачи Пусть /: Rn —f R — функция п действительных переменных, облада- ющая некоторой гладкостью. Под гладкостью мы понимаем определен- ную дифференцируемость функции. Если функция f дифференцируема к раз в точке х, мы пишем f G Dk(£). Гладкой конечномерной экстре- мальной задачей без ограничений называется следующая задача: f(x) —> extr. При решении задачи надо найти отыскать не только абсолютные (гло- бальные) экстремумы (минимумы и максимумы) функции, но и локаль- ные экстремумы. Точка х является точкой локального минимума (максимума) функ- ции /, если существует окрестность Uc = {ж | |ж — ж| < с} точки х такая, что f(x) f(x) (f(x) /(ж)) для любой точки ж из этой окрестности. При этом мы пишем ж € locmin/ (ж е locmax/), а если речь идет о минимуме или максимуме, то пишем ж € locextr f. 1.2. Необходимые и достаточные условия экстремума 1.2.1. Функции одной переменной Теорема 1 (Ферма). Пусть f: R —♦ R — функция одного действи- тельного переменного. Если х € locextr f — точка локального экстремума функции / и f € D(x) дифференцируема в точке х, то fix) = 0.
§ 1. Конечномерные задачи без ограничений 9 Доказательство. По определению дифференцируемости f(x + Л) = f(x) + f'(x)h -I- r(h), r(h) — o(h) = o(\)h при малых h. Значит, f{x + Л) - f(x) = (f'(x) + o(l))h. Если бы f'(x) 0, то при h достаточно близких к нулю, величина /'(ж)4-о(1) имела бы знак f'(x), поскольку о(1) —* 0 при h —» 0. Само же h может принимать как положительные, так и отрицательные значения. Следовательно, разность f(x + h) - f(x) может быть как меньше, так и больше нуля. Это противоречит тому, что f(x + h) — f(x) 0 при х € locmin f и f(x + h) - f(x) 0 при x € locmax f. Геометрически теорема Ферма утверждает, что в точке экстремума дифференцируемой функции касательная к ее графику горизонтальна. Теорема 2. Пусть функция f С D2(x) дважды дифференцируема в точке х. Необходимые условия экстремума: если х € locmin f — точка локаль- ного минимума функции f, то f'(x) = 0, f"(x) > 0. Достаточные условия экстремума: если f'(£) = 0, f"(x) > 0, то х & locmin f — точка локального минимума функции f. Доказательство. По формуле Тейлора f(£ + h) = f(x) + f'(x)h 4- -f"(£)h2 4- r(h), r(h) = o(h2). Необходимость. Пусть £ € locmin/. Тогда, во-первых, по необходи- мому условию экстремума I порядка для функций одной переменной — теореме Ферма — f'(x) = 0, во-вторых, f(x + h) — f(£) 0 при достаточно малых h. Поэтому в силу формулы Тейлора /(ж 4- h) - /(ж) = |/"(ж)Л2 4- r(h) > 0 (г(Л) = о(Л2)) при малых h. Разделим обе части последнего неравенства на Л2 и устре- мим h к нулю . Поскольку —5----> 0 ,то получим ,что f"(£) О.- п1 Достаточность. Пусть /'(f) — 0, f"(x) > 0. Тогда по формуле Тейлора в силу условия т(Л) = o(h2) <=> |т-(Л)| < eh2 => r(h) -eh2 для любого е > 0 при достаточно малых h имеем: f(x 4- Л) - f(x) = X-f"{x)h2 4- r(h) > - е)л2 0 ----. Следовательно, х £ locmin f. 2
10 Глава 1. Экстремальные задачи Для локального максимума неравенства имеют противоположный вид: /"(£) С 0 и /"(£) < 0 соответственно. В одномерном случае можно дать почти исчерпывающий ответ на вопрос о том, является ли данная точка £ локальным экстремумом или нет. Теорема 3. Пусть функция f б Dn(£) п раз дифференцируема в точке х. Необходимые условия экстремума: если х б locmin (max) f — точка локального минимума (максимума) функции f, то либо f'(x) = ... = f(n>(£) = 0, либо f'(x) = ... = f(2m~,)(£) = 0, /2т)(£)>0 (/(2m>(±)<0) (1) при некотором т : 2 < 2m п. Достаточные условия экстремума: если выполняется условие (1), то £ € locmin (max) / — точка локального минимума (максимума) функции f. Доказательство. Пусть для определенности х б locmin f. По фор- муле Тейлора f(x + h) = ^—^-hk + r(h), r(h.) = o(hn) 0 при h — о). К. ' fl J t=0 Необходимость при n = 1 следует из теоремы Ферма. Пусть далее п> 1. Тогда либо f'(x) — ... = f^(£) = 0, либо f'(x) — ... = f^~'\x) — 0, f^(x) / 0, I <п. Значит, n fVd(x} f^(£} f(x + h) - f(x) = 5? —fe| + r(h) = —+ r}(h), r\(h) = o(h‘). /^(x) , Поскольку £ 6 locmin/, to f(£ + h) — f(£) = —ji ™ + г'(^) ® ПРИ достаточно малых по модулю h. Так как f^(£) # 0, то отсюда следует, что I — четно и f^(£) > 0. Достаточность. Пусть f'(£) = ... = f^2m~^(£) — 0, f2m(x) 0. Тогда по формуле Тейлора f^2mUx\ r,(h) f(x + h)-f(£)=^^-h2m+r2(h), при Л —> 0. Поскольку /(2m)(f) > 0, то f(£ + h) - f(£) 0 при достаточно малых h, т. е. £ б locmin /.
§ 1. Конечномерные задачи без ограничений II 1.2.2. Функции нескольких переменных Сформулируем необходимое условие экстремума I порядка в конеч- номерной задаче без ограничений, являющееся аналогом теоремы Ферма. Теорема 1. Если х = (i|,...,in) € locextr/ — точка локального экстремума функции п переменных f(x\,...,xn) и функция f 6 D(x) дифференцируема в точке х, то f'(x) = 0 df(£) _ = df(£) dxt дхп Доказательство. Рассмотрим функцию одной переменной <p(xi) = f(x),... ,2,-1, Xi, £i+t,... ,£п). Поскольку х — (£h... ,хп) € locextr/, то £i € locextr 9?. Кроме того <р 6 D(£i). По необходимому условию экстремума для функций одной переменной — теореме Ферма = 0 <=> df&) р dxi Сформулируем необходимые и достаточные условие экстремума II порядка в конечномерной задаче без ограничений. Предварительно напомним, что второй производной функции нескольких переменных является симметричная матрица вторых производных А = /"{£) = dx{dxj । а также приведем определения знакоопределенностей симметричных матриц. Матрица А называется неотрицательно определенной (Л 0), если (Ah,h) ^0Vft€Rn 4=> ^aijhihj^O V h = (Ль..., hn) Е Rn. »J=i Матрица А называется положительно определенной (Л > 0), если {Ah, h) > 0 V h <= Rn, Л / 0. Матрица А называется строго положительно определенной, если существует а > 0 такое, что (Ah,h) > а||Л||2 V Л € Rn. Аналогично определяются неположительная и отрицательная матрицы. Отметим, что в конечномерном пространстве условие положительной определенности симметричной матрицы А эквивалентно условию стро- гой положительности матрицы А. В бесконечномерных пространствах это не так (см. [АТФ, с. 242]).
12 Глава 1. Экстремальные задачи Теорема 2. Пусть функция f € D2(£) дважды дифференцируема в точке £ = (£,,..., хп). Необходимые условия экстремума: если х € locmin (max) f — точка локального минимума (максимума) функции f, то f'(x)—0, (f”(x)h,h) 5г О ((/"(2)Л,Л) 0) V Л € R”. Достаточные условия экстремума: если f'(x) = 0, (f"(x)h, Л) > 0 ({f"(x)h, Л) > 0) V Л е R”, Л # 0, то х £ locmin (max) f — точка локального минимума (максимума) функ- ции f. Доказательство. По формуле Тейлора /(* + Л) = f(x) + (f(£), h) + |(J"(£)h, h) + r(h), r(h) = о(|Л|2). Докажем теорему для случая минимума. Случай максимума аналогичен. Необходимость. Поскольку х £ locmin/, то, во-первых, по не- обходимому условию экстремума I порядка в конечномерной задаче без ограничений — аналогу теоремы Ферма /'(£) = 0, во-вторых, f(x + АЛ) - f(£) 0 при достаточно малых А. Поэтому в силу формулы Тейлора д2 f(x + АЛ) - f(x) = ~(f"(£)h, Л) + г(АЛ) 0 ( г(АЛ) = о(|А|2) ) при малых А и фиксированном Л. Разделим обе части последнего неравенства на А2 и устремим А к нулю. Поскольку г(АЛ)/А2 -+ 0, то получим, что (f"(x)h,h)^0 V Л g R". Достаточность. Так как f'(£) = 0, то по формуле Тейлора в силу выполненного условия (f"(x)h, Л) а|Л|2 имеем: f(x + h) - f(x) = ^{f"(£)h,h) +r(h) ||Л|2 + r(h) 0 при достаточно малых Л, так как г(Л) = о(|Л|2). Следовательно, х £ locmin /. п Замечание. Для квадратичных функционалов Q(x) = ^2 &ijxixj •j=i условие положительной (отрицательной) определенности матрицы А — f"(x) = (ay)” =) является достаточным условием абсолютного ми- нимума (максимума) функционала.
§ 1. Конечномерные задачи без ограничений 13 1.2.3. Критерий Сильвестра Знакоопределенность матрицы устанавливается с помощью критерия Сильвестра. Напомним, что последовательными главными минорами матрицы А (<*11 • ait \ ..........J. «я • • akk / Главным минором -4»,... матрицы А называется определитель ма- трицы размера к х к, составленной из строк и столбцов с номерами / <*Ilt-, ... a1|lt \ Aiy...it- = det I...........I. \auii aiiu. / Теорема. [9, c. 260]. Пусть A — симметричная матрица. Тогда 1. Матрица А положительно определена (Л > 0) тогда и только тогда, когда все ее последовательные главные миноры положительны, т. е. Л|...4 >0, к — 1,... ,п. 2. Матрица А отрицательно определена (Л < 0) тогда и только тогда, когда все ее последовательные главные миноры чередуют знак, начиная с отрицательного, т. е. (- 1 )fcdet Л|.„* >0, k = 1,..., п. 3. Матрица А неотрицательно определена (Л > 0) тогда и только тогда, когда все ее главные миноры неотрицательны, т.е. Л;,.. ^ 0, 1 ii ^ ... < г* п, k = 1,... ,п. 4. Матрица А неположительно определена (Л 0) тогда и только тогда, когда все ее главные миноры чередуют знак, начиная с неположи- тельного, т. е. (— 1)%...^ 0, 1 С й й n, fc = 1,..., п. Замечание 1. Как будет показано ниже, положительность (неотрица- тельность) матрицы равносильна положительности (неотрицательности) всех собственных значений матрицы. Замечание 2. Отметим, что условие положительности последователь- ных главных миноров матрицы равносильно условию положительности всех главных миноров (см. [9, с. 260]). Для условия неотрицательности это не так, т. е. из условия неотрицательности последовательных главных миноров не следует неотрицательность всех главных миноров матрицы и, следовательно, не следует неотрицательность матрицы. „ „ . /О 0 \ Действительно, у матрицы А — 1 q - ] ) последовательные главные миноры равны нулю (А, = А12 = 0), но она не является неотрицательной: (АЛ,Л) - ((0, -Л2), (Л(, h2)) = -h2 < 0 при Л2 #0.
14 Глава 1. Экстремальные задачи 1. 2.4. Метод Ньютона (метод касательных) Для того, чтобы решить задачу без ограничений нужно найти стационарные точки — решения уравнения f'(x) = 0. Для решения таких уравнений численным способом можно воспользоваться замечательным приемом, восходящим к Ньютону. Итак, пусть нам требуется решить уравнение = 0. (1) Здесь F — дважды непрерывно дифференцируемая функция одной пере- менной. Будем искать решение уравнения (1) методом последовательных приближений. Если хк — приближенное значение корня, то точное значение корня x = xk + hk, (2) где hk мало, и в силу дифференцируемости функции F 0 = F(x) = F(xk + hk) = F(xk) + F'(:c*)ft* + o(hk). Пренебрегая слагаемым o{hk), находим, что hk = -F{xk)/F'(xk). Внеся эту поправку в формулу (2), получим новое уточненное приближенное значение корня: 3-4+1 “ хк + hk. Таким образом, мы имеем следующее рекуррентное соотношение для нахождения последовательных приближений к нулю уравнения (1): &Л+1 — хк F(xk) F'(xk) (3) Геометрически метод Ньютона эквивалентен замене дуги кри- вой у = F(x) касательной, проведенной в некоторой точке кривой (см. рис. 1). Пусть для определенности нам надо найти корень уравнения (1), находящийся на отрезке [а, Ь] и F(b)F"(b) > 0. Положим х0 = Ь. Проведем касательную к кривой у — F(x) в точке (b, F(b) ) = (ж0, F(x0)) • В качестве первого приближения х} берется абсцисса точки пере- сечения этой касательной с осью Ох. Через точку (®i,F(a:i)) снова проводим касательную, абсцисса точки пересечения которой дает второе приближение х? корня х и т.д. (рис.1). Очевидно, что уравнение касательной в точке (xk,F(xk)) есть У - F(xk) + F^x^x - хк). Полагая в этом уравнении у = 0, х = хк+1, имеем формулу (3) 0 - F(xk) + F'(xk)(xk+l - хк) <=> хк+1 -хк- F(a:k)/F'(sfc).
§ 1. Конечномерные задачи без ограничений 15 Заметим, что если в нашем случае положить ха—а и, следовательно, F(xq)F"(x0) < 0, то, проведя касательную к кривой у = F(x') в точке (a,F(a)) , мы получили бы точку а^, лежащую вне отрезка [а, Ь], т.е. при этом выбор начального значения в методе Ньютона оказался бы неудачным. Таким образом, в данном случае правильным начальным приближением х является условие F(x0)F"(xa) > 0. И меет место следующая Теорема. Пусть F € С2([а, Ь], R), значения функции F(a) и F(b) при- нимают разные знаки (F(a)F(b) < 0), функция F монотонна на отрезке (а, Ь], ^(xjF^x) 0 V х € [а, &]. Тогда, исходя из начального приближе- ния х0 G [а, Ь], удовлетворяющего неравенству F(xq)F"(xq) > 0, можно вычислить по методу Ньютона единственный корень уравнения F(x) — 0 с любой степенью точности. Если производная F'(x) мало меняется на отрезке [а, &] или вычи- сление F'(xk) слишком трудоемко, то в формуле (3) можно положить F'(xk) — F'(xg) для всех значений к = 0,1,2,... : х к+1 - я к - F(x k)/F' (х о) . Такой метод нахождения корня уравнения называется модифицированным методом Ньютона. Геометрически этот способ означает, что мы заме- няем касательные в точках (xk,F(xk)} прямыми параллельными первой касательной, построенной в точке (x0,F(x0)). Подробнее о методе Ньютона можно прочитать в книге «Основы вычислительной математики» Б. П. Демидович и И. А. Марон [10].
16 Глава 1. Экстремальные задачи 1.3. Правило решения Для решения конечномерной задачи без ограничений следует: 1) Выписать необходимое условие экстремума I порядка — аналог теоремы Ферма: /'(*) = О dxi дхп ^0. Найти точки х, удовлетворяющие необходимому условию I порядка (эти точки называются стационарными). 2) Проверить выполнение условий экстремума II порядка в каждой стационарной точке. Выписать матрицу вторых производных А = f"(x) = d2f(&) \ ( у. dxidxj ) \a,i)t,j=r 3 / »j=i а) Проверить выполнение достаточных условий экстремума — иссле- довать ее знакоопределенность, т. е. посчитать последовательные главные миноры матрицы А: А,...* - det ((a0)-j=l), к = 1,... ,п. Если все ее они положительны, т. е. A|...jt >0, к = 1, то точка & доставляет локальный минимум в задаче, х G locmin/. Если все ее последовательные главные миноры чередуют знак, начиная с отрицательного, т.е. (—l)*det А|...» > 0, к = 1,...,п, то точка доставляет локальный максимум, х € locmax/. b) Если не выполняются достаточные услови я экстремума, то надо проверить выполнение необходимых условий — исследовать ее слабую знакоопределенность, т. е. посчитать главные миноры матрицы А — определители матриц размера к х к, составленных из строк и столбцов • • • O»|lt \ ...........I . ан>, • • • aitii / Если матрица А не является неотрицательно определенной (Л 0), т. е. не выполняется условие, когда все ее главные миноры неотрица - тельны, т.е. А;,...^ 0, 1 *i $ • •. ik л, к — 1,... ,п, то точка & не доставляет локальный минимум, $ £ locmin/. Если матрица А не является неположительно определенной (А 0), г. е. не выполняется условие, когда все ее главные миноры чередуют знак, начиная с неположительного, т.е. (-1)*А,,...^ > 0, 1 i] ^ ... г* < п, к = 1,... ,п, то точка £ не доставляет локальный максимум, х £ locmax/.
§ 1. Конечномерные задачи без ограничений 17 1.4. Призеры Пример 1. f(x) = /(ж,,ж2) = х2 — ж,ж2 + х% — 2ж| + ж2 —» extr. Необходимое условие экстремума I порядка: df(x) _ df(x) _ о _ _ Г 2ж| - ж2 - 2 = 0; дх[ 0x2 I —Ж| + 2ж2 + 1 = 0. Решая эту систему, находим единственную стационарную точку ж = (1,0). (\ 2 d2f(x)\ /2 -А -—-— I = ( , _ ) по кри- Oxidxj I \~ 1 7 7 терию Сильвестра положительно определена. По достаточному усло- вию локального экстремума функции нескольких переменных точка (1,0) € locmin/. Поскольку функционал является квадратичным, то (1,0) g absmin/, a Smax = +оо. Пример 2. f(x) — /(Ж1,ж2) -- х4 + ж3 — ж, - 2ж,ж2 - ж3 —» extr. Необходимое условие экстремума I порядка: /'(я)-0 Of(x) ~Of(x) ( 4Ж| - 2ж] — 2ж2 = 0; 0xt 0x2 ( 4ж2 — 2ж] — 2ж2 — 0. Решая эту систему уравнений, находим стационарные точки ж1 = (Л[,ж2) = (1,1), х2 = (-1,-1), ж3 = (0,0). Для проверки условий II порядка выписываем матрицу вторых производных: д2Л£)У _/12ж3—2 — 2 \ 0х{0хл I \ —2 12ж2 — 2 / л| Ч = ( 7о) 1(1,1) 1,—1) \-2 10у а| -Г’2 А|(о,о) — \—2 -2J- .. ( 10 - 2\ Матрица 1 ю I по кРитеРию Сильвестра положительно опре- делена. По достаточному условию локального экстремума функции нескольких переменных точки (1,1) и (—1,-1) доставляют локальный минимум функции /. ( -2 -2\ Матрица! по критерию Сильвестра не является ни поло- жительно, ни отрицательно определенной. Она является неположительно определенной матрицей (Д 0) и не является неотрицательно опреде- ленной матрицей (Л 0). Следовательно, не выполняется необходимое условие локального минимума. Поэтому — (0,0) locmin/. Посколь- ку ^2h4 > 0 — /(А3) при малых h # 0, то i3 locmax/. Очевидно, что Smax — +оо.
18 Глава I. Экстремальные задачи Пример 3. Найти экстремумы неявно заданной функции двух пере- менных х3 = f(xt,x2), если F(xt, х2,х3) = х, + х2 + х] — 2я? 1 4- 2х2 - 4х3 - 10 = 0. Решение. Частные производные из уравнений: df _ Oz, дх, дхс и находим ОХ} ОХ} , _ 8F дх3 х' dxi + дх3 dxt dF 9F дх3 ? — ----_i______ —- Х2 дх2 дх3 дх2 дхт. 2х, - 2 + (2х3 -4)— =0, иХ | дхл 2х2 + 2 + (2а:з - 4)-— = 0. дх2 (*) Необходимое условие экстремума I порядка: дх3(х) = Эа?з(ж) = . («) Г 2*। — 2 = 0, ( £, = 1, дх । дх2 I 2х2 + 2 = 0, 1^2 = —1. Подставляя найденную точку (£,,£2) = (1,-1) в заданное уравнение Г(а:|,а:2,а:з) = 0, находим две стационарные точки г1 = (£|;£2,£з) = (1, — 1, — 2) и £2 = (£ ।, £2, £3) = (1, — 1,6) Для проверки условий II порядка надо выписать матрицу вторых производных в каждой стационарной точке. Дифференцируя первое уравнение правой части системы уравнений (*) по a:i и х2 с учетом дх3 дх3 условия —— = -------= 0, имеем оа:1 дх2 , vд2х3 д2х3 I 1 2 + (2хз — 4) ==— = 0 =-, O2X| 52X| If 4 д2х3 д2х3 I (2х3 - 4)----= 0 =>----------— = 'дх\дх2 дх]дх2\£' д2х3 I 1 d2xt If2 4* -^1 =0. дх[дх2 If2 Аналогично, дифференцируя второе уравнение правой части системы (♦) ПО Х[ и х2, получим „ , д2х3 д2х31 1 2 + (2х3 — 4)—т— = 0 - =-, ' д2х2 d2x2\i‘ 4 д2х3 | 1 t^a^lz2 4 д2х3 д2х3 Очевидно, что -—-— = ——-—. Таким образом, dX2VX[ 0Х\0Х2
§ 1. Конечномерные задачи без ограничений 19 Матрица по критерию Сильвестра является положительно определенной, а матрица отрицательно определенной. Поэтому по достаточному условию второго порядка -^locmin ~ _2, Гостах = 6- Можно показать, что это будут не только локальные экстремумы, но и глобальные. Приведем несколько примеров различных свойств экстремумов в за- даче без ограничений. Пример 4. Абсолютные минимумы и максимумы достигаются в беско- нечном числе точек: /: R —> R, /(а:) = sin а:. Пример 5. Функция ограничена, абсолютный максимум достигается, минимум — нет: /:R-R, = Пример 6. Функция ограничена, но абсолютные максимум и минимум не достигаются: f: R —♦ R, f(x) — arctga:. Пример 7. Функция ограничена, имеет стационарные точки, но абсо- лютные максимум и минимум не достигаются: f: R —♦ R, f(x) = (arctga:)3. Пример 8. Функция ограничена, имеет локальные максимумы и мини- мумы, но абсолютные максимум и минимум не достигаются: /: R-R, f(x) = arctga: sin а:. Пример 9. Ограничение функции, заданной на плоскости, на любую прямую, проходящую через начало координат, имеет в нуле локальный минимум, но вместе с тем начало координат не является точкой локального минимума: f : R2 -» R, f(xt, х2) - (a:, - x2)(xt - За:2). ' Действительно, на любой прямой xt — ах2, а € R, функция вида f(ax2,x2) = (ах2 - х2)(ах2 — За:2) — х2(а - x2)(ot - Зх2) = а:2(а2— 4аа:2 + Зх%) 0 = /(0) при малых а:2. Значит, на любой прямой вида а:, = ах2 функции / имеет локальн ый минимум в нуле. Аналогично на прямой х2 = 0 функция f(x\ ,0) — х\ имеет минимум в нуле. С другой стороны, на параболе х, = 2а:2 функция f(2x2,x2) = —х2 < 0 в любой окрестности нуля. То есть точка £ = 0 не является точкой локального минимума функции f.
20 Глава 1. Экстремальные задачи Пример 10. Имеется единственный локальный экстремум, не яв- ляющийся абсолютным: f : R2 -> R, f(xt,х2) = х, - xj + 2e~z'. Необходимое условие экстремума I порядка в конечномерной задаче без ограничений: Ла:) = 0 Г 2xj — 4х|е-1'= 0; дХ] дх2 I -2х2 — О, Г х, = 0, 2e~Z| — 1 -х2 = In | = - In 2 <=> Х| = ±\Лп2; \ х2 = 0. Получаем в задаче три стационарные точки х1 = (0,0), х2 = (v'ln 2,0), х3 = (-Ип2,0). Для проверки условий 1Г порядка надо выписать матрицу вторых производных в каждой стационарной точке: А = ( = f 2 - 4е~х> + 8х2е-х' 0 А \ дх{дх; / \ 0 — 2 ) д| If =(0,0) ("2 °эЫ Н у 0 — 2) ' If! If 0 -2 ) 41n2 0 Матрица вторых производных I по критерию Сильвестра является отрицательно определенной: А| = — 2 < 0, А2 = 4 > 0. Поэтому по достаточному условию второго порядка стационарная точка х1 € locmax. Очевидно, что Sabcmax — +00 (/(х|,0) —> 4-00 при х, —» +оо). /41п2 0 \ Матрица вторых производных ( g I по критерию Силь- вестра не является ни положительно, ни отрицательно определенной и более того не является ни неположительно определенной матри- цей (А 0) и ни неотрицательно определенной матрицей (Д 0). Следовательно, не выполняется необходимое условие ни локального максимума, ни локального минимума. Поэтому стационарные точки х2, х3 £ locextr/. Очевидно, что Sabsmax ~ +°°- Действительно, функция /(х|,0) = X, + 2е-1' —> +оо при Х| —> 4-00. Значит, у функции f имеется единственный локальный экстремум в точке х = (0,0), не являющийся абсолютным.
§ 1. Конечномерные задачи без ограничений 21 Пример 11. Можно ли утверждать, что если функция одной переменной имеет в какой либо точке локальный минимум, то в некоторой достаточно малой окрестности этой точки слева от точки функция убывает, а справа возрастает ? Нет. Контрпример: f(x) = / х х (0, х — 0. Ясно, что х = 0 € absmin/. С другой стороны, в любой окрестности нуля и справа, и слева производная f'(x) = 2х(2 + sin - cos г/0, принимает как положительные, так и отрицательные значения, т. е. функция f и возрастает, и убывает. Пример 12. Имеется бесконечное число локальных максимумов, но нет ни одного локального минимума: f : R2 —» R, /(а;,, х2) = sin х2 — х]. Необходимое условие экстремума I порядка: ^/(Д) = d/(s) = 0 ( -2х, =0; Г Д| = 0; dxi дх2 lcosa:2=0, | х2 — + ктг, к € Z. Стационарные точки хк = (0, j + ктг), к& Z. Для проверки условий II порядка надо выписать матрицу вторых производных в каждой стационарной точке: Матрица ( q _ । j по критерию Сильвестра является отрицатель- но определенной: А| — —2 <0, А2 = 2 > 0. Поэтому по достаточному условию второго порядка (0, + 2птг) € locmax/ V п € Z. .. /-2 о\ „ Матрица I q j I по критерию Сильвестра не является неот- рицательно определенной матрицей (A 0). Следовательно, не вы- полняется необходимое условие локального минимума. Поэтому точки (0, ~ + (2п + 1)тг) не доставляют локального минимума. Точки локаль- ного минимума могли быть только среди стационарных точек, но там их не оказалось. Следовательно, нет ни одного локального минимума.
22 Глава 1. Экстремальные задачи 1.5. Задачи, упражнения В задачах 1.1—1.17 без ограничений найти стационарные точки, проверить их на экстремальность, а также найти все локальные и глобальные минимумы и максимумы. / ч 50 20 1.1. f(xt,x2) — xtx2 4-----1----> extr. Xj x2 1.2. f(xi,x2) = x2 — x2 — 4xl+6x2—>extr. 1.3. f(xt,x2) — 5x2 4- 4xtx2 4- x2 — 16®| — 12sc2 —» extr. 1.4. f(xt,x2,x2) = x2 4- x2 4- x2 - Ж|Ж2 4- xi ~ 2«з —» extr. 1.5. f(x\,x2,x2) = x2 4- a:2 4- 2a:2 4- »i«2 4- 2043:3 4- Зж2®з — xt —> extr. 1.6. f(xi,x2) — x3 4- x2 — 3040:2 -* extr. 1.7. /(04,04) = 3xiX2 - x2x2 — X}X^ —» extr. 1.8. f(xt,x2) = 04 4-0:* - (®i 4-«г)4 -» extr. 1.9. f(x\,x2) = 2x* + x2 — x2 — 2xl ~* extr. 1.10. f(xt,x2) = o:i«2 ln(a?2 4- 0:2) —» extr. 1.11. /(34,04) = x2x2(6 — 04 - 0:2) —> extr. 1.12. f(x\,x2) = e2x'+3xi(8x2 — 6xtx2 4- 30:2) —♦ extr. 1.13. f(x\,x2) = ex'~X2(5 - 204 4-0:2) —» extr. 1.14. /(04,04,04) = 040:20:3(7 — 0:1 — 2x2 — За:з) —► extr. 1 1.15. f(xt,x2) = J(t2 4- x2t 4- 04)2 dt —> min -1 (задача о полиномах Лежандра второй степени). 1 1.16. f(x],x2,x2) = f (t3 4- x2t2 4- x2t 4- 04)2 dt —> min. -1 (задача о полиномах Лежандра третьей степени). 1.17. Найти экстремумы неявно заданной функции двух переменных ж3 = /(ж|, жг), если Р(ж|, жг, ж3) = о:2 4- ж2 4- х2 - ж(жз - х2х2 4- 2Ж1 4- 2ж2 4- 2о:3 — 2 = 0.
§ 2. Конечномерные гладкие задачи с равенствами 23 § 2. Конечномерные гладкие задачи с равенствами В этом параграфе даются необходимые и достаточные условия экстремума в гладкой конечномерной задаче с ограничениями типа равенств. 2.1. Постановка задачи Пусть R” —» R, i = 0,1,..., т, — функции п переменных. Считаем, что все функции f, обладают определенной гладкостью. Гладкой конечномерной экстремальной задачей с ограничениями типа равенств называется следующая задача: fo(x) —+ extr; f -£x) — 0, i — 1,... ,т. (Р) 2.2. Необходимые и достаточные условия экстремума 2.2.1. Принцип Лагранжа Сформулируем необходимое условие экстремума I порядка в гладкой конечномерной задаче с ограничениями типа равенств — принцип Лагранжа. Теорема. Пусть х 6 locextr Р — точка локального экстремума в за- даче (Р), а функции fi, г = 0,1,...,т, непрерывно дифференцируемы в окрестности точки х (условие гладкости). Тогда существует ненулевой вектор множителей Лагранжа А = (Ао, А|,..., Am) g Rm+I, А 0, такой, т что для функции Лагранжа задачи (Р) А(а:,А) — ^,Xifi(x) выполняется >=о условие стационарности АДж, А) = 0 <==> =0, j = 1,... ,п <=> = 0. dxi Это соотношение называется условием стационарности. Точки, удо- влетворяющие условию стационарности, называются стационарными. Доказательство проведем от противного. Предположим, что условие стационарности не выполняется. Это означает, что векторы /,-(ж) = / dfi(x) dfi(x)\ I —------------- ), г = 0,1,... ,m, линейно независимы. Поэтому \ ох। охп / / Э/о(Д) dfQ(x) \ дх\ дхп dfm(x) ( dfi(x)\ ранг матрицы А — I —----- I о равен dfm(x) dfm(x) \ 5aii дхп /
24 Глава 1. Экстремальные задачи т+ 1. Тогда по теореме о ранге матрицы (см. [13, с. 71]) существует матрица М порядка (т + 1) х (т + 1) с определителем, отличным от нуля. Допустим для определенности, что этой матрицей является матрица, составленная из первых столбцов матрицы Л: / dfa(x) W) \ дх\ det = detM # 0 dfm(x) X dxt дхт+1 / Не ограничивая общности, считаем, что fo(x) = 0. Действительно, если fo(x) 0, то следует рассмотреть функцию /о(^) — /о(^) — /о(®) и для нее будет /о(£) = 0. Положим F(x) = (F0(i),..., Fm(i)) = (/о(®,®т+2, --,Жп), --,/т(ж,Жт+2,- ,*п)) Для вектора х = жт+|). Функция F отображает некоторую окрестность точки х = (4i,... ,4m+i) € Rm+1 в Rm+I, и является (в силу условий гладкости теоремы) непрерывно дифференцируемым отображением в этой окрест- ности, F(x) = 0. Кроме того, якобиан отображения F в точке х отличен от нуля, т. е. /'dFi(x)\ det —= detM/0. \ dXj J По теореме об обратной функции в конечномерных пространствах (см. следующий пункт) существует обратное отображение F-1 некоторой ок- рестности точки у = 0 в окрестность точки х такое, что F~'(y = 0) = х и \F~[(y) - |F~'(i/)l К\У ~ J/I <=> К’Ы с некоторой константой К > 0. В частности, для достаточно малого по модулю е определен вектор х(е) F-1 (е, 0,..., 0), для которого |х(е) — ±| С" Л’|е|. Это означает, что F(x(e)) = (е,0,...,0), что равносильно равенствам /0(5(е),жт+2,...,£„) = е, /{(х(е),хт+2,...,жп) = 0, г = 1,...,т. Таким образом, для вектора х(е) = (i|(e),... ,xm+i(e),xm+2,... ,хп) выполня- ются условия /о(ж(е)) = Е, fi(x(e)) = 0, i - 1,... ,т, (1) и при этом Me) - 4| К|е|. (2) Из соотношений (1)-(2) следует, что вектор х не доставляет в задаче экстремума, ибо вблизи его существуют допустимые векторы х(е), на которых функционал /о принимает значения как большие так и меньшие чем fo(x) (напомним, что fo(x) = 0). Получили противоречие с тем, что х € locextr Р. Таким образом, наше предположение (противного) неверно и тем самым теорема доказана.
§ 2. Конечномерные гладкие задачи с равенствами 25 2.2.2. Конечномерная теорема об обратной функции. Теорема Венерштрасса Теорема (конечномерная теорема об обратной функции). Пусть F: U R" — непрерывно дифференцируемое отображение некоторой окрестности U С Rn точки х в Rn, F(x) = у и якобиан отображения F / , /dFi(x)\n \ в точке х отличен от нуля ^det F (х) = det (^ ф 0J. Тогда существует обратное отображение F~' некоторой окрестности V точки у в окрестность точки х такое, что F~'(y) — хи \F~'(y)-F^(y)\^K\y-y\ Чу eV с некоторой константой К > 0. Пусть f: R" —» R — функция п переменных. При исследовании вопроса о достижении функцией п переменных экстремума часто ис- пользуется следующая теорема. Теорема Вейерштрасса. [16, т. 1, с. 235] Непрерывная функция на непу- стом ограниченном замкнутом подмножестве конечномерного пространства (компакте) достигает своих абсолютных максимума и минимума. Выделим простое следствие из этой теоремы, которое часто будем использовать. Следствие. Если функция f непрерывна на R" и lim f(x) — 4-оо |х|—00 ( lim f(x) = —оо), то она достигает своего абсолютного минимума |х|-»оо (максимума) на любом замкнутом подмножестве из Rn. Напомним, что множество А в метрическом пространстве назы- вается компактом, если из всякой последовательности- элементов А можно выбрать сходящуюся к элементу из А подпоследовательность или (равносильное определение) если из всякого покрытия А открытыми множествами можно выбрать конечное подпокрытие. Ограниченное и замкнутое множество конечномерного пространства является компактом. 2.2.3. Необходимое условие экстремума II порядка Сформулируем необходимое условие минимума П порядка в гладкой конечномерной задаче с ограничениями типа равенств.
26 Глава 1. Экстремальные задачи Теорема. Пусть х € locmin Р — точка локального минимума в зада- че (Р), функции fi, i = 0, l,...,m, дважды непрерывно дифференцируемы в окрестности точки х (условие гладкости), dimlin*{/J(i))...1/m(i)} =п (условие регулярности). Тогда существует множитель Лагранжа А = (1, А|,..., Ага) € R'n+I такой, что для функции Лагранжа задачи (Р) m Л(я, А) = fo(x) + выполняются условия стационарности: :=1 т А) = 0 <=> /о(г) + У A,/t'(z) = О »=| и неотрицательности: (Axx(x,X)h,h.)>0 V h: {f'i(x),h) =0, Мы сформулировали необходимое условие минимума. Необходимое условие максимума формулируется аналогично, за исключением того, что множитель Лагранжа А = (-1, А,,..., Am) € Rm+I и соответственно т функция Лагранжа А(х, А) = -fo(x) + 52 i=i 2.2.4. Достаточное условие экстремума II порядка Сформулируем достаточное условие минимума II порядка в гладкой конечномерной задаче с ограничениями типа равенств. Теорема. Пусть функции /t, i = 0, 1,... ,пг, дважды непрерывно диф- ференцируемы в окрестности точки х (условие гладкости), diml in {/,(£), ..., fm(x)} = n (условие регулярности). Существует множитель Лагран- жа А = (1, А|,..., Am) € Rm+I такой, что для функции Лагранжа задачи т (Р) Л(зт, А) = fo(x) 4- выполняются условия стационарности: т Ах(х, А) = 0 <=> Л(4) + 52 А</'(£) = 0 »=1 и положительности: (Ахх(х, X)h,h) > 0 Xfh^O: (f'(x),h)=0, Тогда £ G locmin P — точка локального минимума в задаче (Р). Мы сформулировали достаточное условие минимума. Достаточное условие максимума формулируется аналогично, за исключением того, что множитель Лагранжа А = (-1, А(,..., Ага) € Rm+I и соответственно m функция Лагранжа Л(х, А) = -/о(®) + УЗ ^ifi(x)- i=i * lin означает «линейная оболочка».
§ 2. Конечномерные гладкие задачи с равенствами 27 2.3. Правило решения Для решения гладкой конечномерной задачи с ограничениями типа равенств следует: 1) Составить функцию Лагранжа т Л(х,А) = i=0 2) Выписать необходимое условие экстремума I порядка — условие стационарности функции Лагранжа: AZ(£,A) = O <=> ^А,/'(А) = 0. 1=0 3) Найти точки х, удовлетворяющие условию стационарности (эти точки называются стационарными). При этом следует отдельно рассмот- реть случаи: a) Aq — 0, b) Xq = 1 (или любой положительной константе), с) Ао = — 1 (или любой отрицательной константе). В случае а) стационар- ные точки могут доставлять и минимум, и максимум в задаче. В случае Ь) стационарные точки могут доставлять минимум в задаче. В случае с) стационарные точки могут доставлять максимум в задаче. 4) Найти решение среди стационарных точек или доказать, что его нет. При этом можно пытаться воспользоваться непосредственной проверкой или перейти к исследованию условий экстремума II порядка в каждой стационарной точке. Выписать матрицу вторых производных Ххх(£,Х) и пространство L = {/г 6 Rn | {f'i(x), Л) = 0, i = 1,... ,т}. Проверить выполнение достаточных условий экстремума — положи- тельную определенность матрицы вторых производных: (Л.хх(х, А)А,Л> > 0 V h € L, h # 0. Если это условие положительности выполняется, то точка £ доставляет в случае Ь) локальный минимум в задаче (х € locmin Р) в случае с) локальный максимум в задаче (х € locmaxP). 5) Если не выполняются достаточные условия экстремума, то надо проверить выполнение необходимого условия экстремума — неотрица- тельную определенность матрицы вторых производных: (А„(4,А)Л,Л) 0 VhEL. Если это условие неотрицательности не выполняется, то точка £ не до- ставляет в случае Ь) локальный минимум в задаче (£ £ locmin Р); в случае с) локальный максимум в задаче (х & locmaxP).
26 Глава 1. Экстремальные задачи Теорема. Пусть х € locmin Р — точка локального минимума в зада- че (Р), функции fi, i = 0, l,...,m, дважды непрерывно дифференцируемы в окрестности точки х (условие гладкости), dimlin*{/J(i))...1/m(i)} =п (условие регулярности). Тогда существует множитель Лагранжа А = (1, А|,..., Ага) € R'n+I такой, что для функции Лагранжа задачи (Р) m Л(я, А) = fo(x) + выполняются условия стационарности: :=1 т А) = 0 <=> /о(г) + У A,/t'(z) = О »=| и неотрицательности: (Axx(x,X)h,h.)>0 V h: {f'i(x),h) =0, Мы сформулировали необходимое условие минимума. Необходимое условие максимума формулируется аналогично, за исключением того, что множитель Лагранжа А = (-1, А,,..., Am) € Rm+I и соответственно т функция Лагранжа А(х, А) = -fo(x) + 52 i=i 2.2.4. Достаточное условие экстремума II порядка Сформулируем достаточное условие минимума II порядка в гладкой конечномерной задаче с ограничениями типа равенств. Теорема. Пусть функции /t, i = 0, 1,... ,пг, дважды непрерывно диф- ференцируемы в окрестности точки х (условие гладкости), diml in {/,(£), ..., fm(x)} = n (условие регулярности). Существует множитель Лагран- жа А = (1, А|,..., Am) € Rm+I такой, что для функции Лагранжа задачи т (Р) Л(зт, А) = fo(x) 4- выполняются условия стационарности: т Ах(х, А) = 0 <=> Л(4) + 52 А</'(£) = 0 »=1 и положительности: (Ахх(х, X)h,h) > 0 Xfh^O: (f'(x),h)=0, Тогда £ G locmin P — точка локального минимума в задаче (Р). Мы сформулировали достаточное условие минимума. Достаточное условие максимума формулируется аналогично, за исключением того, что множитель Лагранжа А = (-1, А(,..., Ага) € Rm+I и соответственно m функция Лагранжа Л(х, А) = -/о(®) + УЗ ^ifi(x)- i=i * lin означает «линейная оболочка».
§ 2. Конечномерные гладкие задачи с равенствами 27 2.3. Правило решения Для решения гладкой конечномерной задачи с ограничениями типа равенств следует: 1) Составить функцию Лагранжа т Л(х,А) = i=0 2) Выписать необходимое условие экстремума I порядка — условие стационарности функции Лагранжа: AZ(£,A) = O <=> ^А,/'(А) = 0. 1=0 3) Найти точки х, удовлетворяющие условию стационарности (эти точки называются стационарными). При этом следует отдельно рассмот- реть случаи: a) Aq — 0, b) Xq = 1 (или любой положительной константе), с) Ао = — 1 (или любой отрицательной константе). В случае а) стационар- ные точки могут доставлять и минимум, и максимум в задаче. В случае Ь) стационарные точки могут доставлять минимум в задаче. В случае с) стационарные точки могут доставлять максимум в задаче. 4) Найти решение среди стационарных точек или доказать, что его нет. При этом можно пытаться воспользоваться непосредственной проверкой или перейти к исследованию условий экстремума II порядка в каждой стационарной точке. Выписать матрицу вторых производных Ххх(£,Х) и пространство L = {/г 6 Rn | {f'i(x), Л) = 0, i = 1,... ,т}. Проверить выполнение достаточных условий экстремума — положи- тельную определенность матрицы вторых производных: (Л.хх(х, А)А,Л> > 0 V h € L, h # 0. Если это условие положительности выполняется, то точка £ доставляет в случае Ь) локальный минимум в задаче (х € locmin Р) в случае с) локальный максимум в задаче (х € locmaxP). 5) Если не выполняются достаточные условия экстремума, то надо проверить выполнение необходимого условия экстремума — неотрица- тельную определенность матрицы вторых производных: (А„(4,А)Л,Л) 0 VhEL. Если это условие неотрицательности не выполняется, то точка £ не до- ставляет в случае Ь) локальный минимум в задаче (£ £ locmin Р); в случае с) локальный максимум в задаче (х & locmaxP).
30 Глава 1. Экстремальные задачи Х( X, Соотношения ж, — £, + А^г = 0 О £,• - ж, = А—у, i = 1,2, имеют ai ai очевидный геометрический смысл: вектор (,—х пропорционален вектору- градиенту функции /| в точке х, т. е. лежит на нормали к эллипсу. Этот факт был впервые установлен Аполлонием. Выведем из полученных нами соотношений уравнение кривой, «разделяющей» те точки £ ,из которых можно провести две нормали, от точек, из которых можно провести четыре нормали. Очевидно, что это разделение происходит для А, удовлетворяющих соотношению (1), для которых ”'<Л) = -(?Й?-(Й^=0' Ае <-«!• -“=>• <2> -f- Л) (02 + Л) Обозначим а2 + А — A(£iai)2^3, тогда из (2) а22 + А — -Д(^д)2/3 . ы - ai - а2 Из последних двух соотношении найдем, что А = ,------------------—гг-. (£1«1 )2/3 + (6«2)2/3 Подставляя а2 + А, а2 + А и А в (1), получаем уравнение разделяющей кривой: А2&а^2 + А2(6а2)4/з = ’ (6 «1)2/3 + (6«2)2/3 = <=> (6ai)2/3 + (£2а2)2/3 = Л2 (а2 -а2;)2 ((€1«1)2/3 + (&а2)2/3)2 (^^MW73^-^)2'3. Это уравнение астроиды. Вне астроиды каждая точка имеет две нор- мали к эллипсу, внутри нее — четыре, на самой астроиде — три (за исключением вершин, где имеются две нормали (рис. 4)). Докажем, что касательная к астроиде перпендикулярна к эллипсу в точке ее пересечения с эллипсом (рис. 5). Обозначим точку на астроиде через £, а точку пересечения касательной с эллипсом через х. Для доказательства утверждения достаточно показать, что нормаль к астроиде в точке £ перпендикулярна вектору х — £ перпендикулярному к эллипсу. Нормалью к астроиде (Ciai)273 + (6°2)273 = (а? - а2)2|/3 в точ- ке £ является вектор пропорциональный градиенту функции <?(£i,£2) = (€iai)273 + (Сгаз)2/3, т.е. вектор п = (£7'/3а2/3 , За2/3) . Выше мы до- казали, что перпендикуляром к эллипсу является вектор х — где х &а2 = ----, г - 1,2. Отсюда Ж; - £. = а2 + А находится из уравнений: ж, &а? А& -5 — f, = —=------, г = 1,2. Поэтому а? + А а2 4- А
§ 2. Конечномерные гладкие задачи с равенствами 31 |п| • |ж - £| COS<p = (п, х - £) = о2 + A Oj + А о2 + А л2 4" А Я>дставляя значение а] 4- А рыраженное через А и (£ q ),2у'3 получим |п| • |ж — £|cosy, — М6<ч)2/3 А(£ р )2/3 -А({ Р )2/3 А А - 4- - = О- А А Следовательно, cos^> = 0, т. е. вектора п и х — £ перпендикулярны. Рис. 5. Рис. 4.
32 (лава 1. Экстремальные задачи 2.6. Задачи 2.1. я? 4- х2 —> extr; Зя, + 4я2 — 1 • 2.2. eI|X2 extr; xt + я2 = 1. 2.3. х। 4- х2 —> extr; 5х2 + 4я|я:2 + я2 = 1. 2.4. я| 4- 12Я|Я2 4- 2я2 —» extr; 4я2 4- я2 = 25. 2.5. я2 4- я2 + я2 —> extr; я, 4- я2 + я3 = 1. 2.6. Xi + 2ж2 + Зя3 —> extr; х2 + х2 + х2 = I. 2.7. я, 4- я2 4- я2 —> extr; я, + я2 4- х3 = 1, xt + х2 - х3 — 1/2. 2.8. 2я2 - 6я| — 6я2 — Зя3 —» extr; я,— х24-я3 = 0, 5я, + я2 - 2я3 = 1. 2.9. Ж| + х2 + я3 —> extr; Я| 4- я2 - я3 = 1, я2 + я2 4- х2 = 1. 2.10. я(я2 + я2я2 —» extr; х2 4- я2 = 2, х2 4- я3 = 2. 2.11. Я|Я2л3 —> extr; я2 4-я2 + я* = 1, Я| 4-я2 4-я3 —0. 2.12. х2 4- х2 4- х2 —> extr; х2 4- (я2 — З)2 + (я3 - 4)2 — 1. 2.13. Я|Ж2Жз —> extr; я, 4-я2 4-я3 = 1. 2.14. Я|Я2Яз —> extr; х2 + х2 + х2 = 1. 2.15. Найти минимум линейной функции /(я) = (а,я), а,я € Rn, на единичном шаре (я,я) = 1. 2.16. Найти расстояние от точки я € Rn до гиперплоскости (а, я) = Ь, ct G R", b € R. 2.17. Найти расстояние от точки я € R” до прямой х — at+ b, a,b € R”. 2.18. Найти максимальную площадь прямоугольника со сторонами, па- Я| Х22 раллельными осям координат, вписанного в эллипс —7 + ^ = 1. af й2 2.19, Найти максимальный объем прямоугольного параллелепипеда со сторонами, параллельными осям координат, вписанного в эллип- 2 2 2 Xf Жэ х3 сайд -у + = 1. Д| Й2 aj 2.20. Решить задачу Аполлония для параболы. 2.21. Решить задачу Аполлония для гиперболы.
§ 3. Конечномерные гладкие задачи с равенствами и неравенствами 33 § 3. Конечномерные гладкие задачи с равенствами и неравенствами В этом параграфе даются необходимые и достаточные условия экстремума в гладкой конечномерной задаче с ограничениями типа равенств и неравенств. 3.1. Постановка задачи Пусть fc Rn —> R, г = 0,1,... ,m, — функции п переменных, ото- бражающие пространство R" в R. Считаем, что все функции f, обладают определенной гладкостью. Гладкой конечномерной экстремальной задачей с ограничениями типа равенств и неравенств называется следующая задача в R": fo(x) —> min; fi(x) 0, fi(x) = 0, г = rn! + 1,..., т. (Р) В задачах, где имеются ограничения типа неравенств, важно, рас- сматриваемая задача на минимум или максимум. Для определенности мы будем рассматривать задачи на минимум. 3.2. Необходимые и достаточные условия экстремума 3.2.1. Принцип Лагранжа Сформулируем необходимое условие экстремума I порядка в гладкой конечномерной задаче с ограничениями типа равенств и неравенств — принцип Лагранжа. Теорема. Пусть х G locextr Р — точка локального экстремума в за- даче (Р), а функции ft, i = 0,1,...,тга, непрерывно дифференцируемы в окрестности точки х (условие гладкости). Тогда существует ненулевой вектор множителей Лагранжа А = (Ао, А।,... ,Am) G Rm+I, A # 0, такой, m что для функции Лагранжа задачи (Р) А(х, А) — 52 А,/Дж) выполняются «=о условия: а) стационарности: , ч дК(х, А) „ Л1(£,А) = 0 <=> —A_L_'=o, / = 1,...,п <=> ^А,/'(£) = 0; OXi t—3 3 0 Ь) дополняющей нежесткости: Aifi(£)= 0, с) неотрицательности: А; 0, г = 0,1,... ,т'. Доказательство этой теоремы в более общем случае см. [АГТ, с. 51]. Точки, удовлетворяющие несб ходимым условиям локального экстре- мума, называются критическими. В задаче на максимум Aq sj 0. 2 Зак.60
34 Глава 1. Экстремальные задачи 3.2.2. Необходимое условие экстремума II порядка Сформулируем необходимое условие минимума II порядка в гладкой конечномерной задаче с ограничениями типа равенств и неравенств. Теорема. Пусть х € locmin Р — точка локального минимума в за- даче (Р), функции fi, i = 0,...,т, дважды непрерывно дифференциру- емы в некоторой окрестности точки х (условие гладкости), векторы — линейно независимы (условие регулярности). Тогда существует множитель Лагранжа А = (Ао, А|,..., Am) € Rm+I с Ао = 1 такой, что для функции Лагранжа задачи (Р) Л(Ж, А) = >=0 выполняются условия экстремума I порядка: а) стационарности: дА(х, А) , Лж(ж,А) --0 <=> ——--------- 0, j = 1,... ,п <=> ^2 А;/,(х) - 0; J i=0 Ь) дополняющей нежесткости: = 0, i = 1,..., т'; с) неотрицательности: А,- 0, г = 0,1,... ,т; и (Axx(£,X)h,h)^O iheK, У Хе Л, где К: = {й € R" | < 0, i = 0,1,...,т', /-(£)[Л] = 0, г = т! + 1,..., т} — конус допустимых вариаций, а Л — совокупность множителей Лагранжа А, для которых выполнены условия а)-с) с Ао = 1. Доказательство этой теоремы см. [ГТ, с. 124]. Мы сформулировали необходимое условие минимума. Необходимое условие максимума формулируется аналогично, за исключением того, что множитель Лагранжа А = (-1, At,..., Am) и соответственно в конусе допустимых вариаций (/q(£),/i) 0.
§ 3. Конечномерные гладкие задачи с равенствами и неравенствами 35 3.2.3. Достаточное условие экстремума II порядка Сформулируем достаточное условие минимума II порядка в гладкой конечномерной задаче с ограничениями типа равенств и неравенств. Теорема. Пусть функции ft, i = 0,...,т, дважды непрерывно диф- ференцируемы в некоторой окрестности точки х (условие гладкости), векторы Д+1(ж),— линейно независимы (условие регулярно- сти), существует множитель Лагранжа А = (Ао,..., Ат) € Rm+1 с Ао = 1 такой, что для функции Лагранжа задачи (Р) т Л(«, А) = 52 i=0 выполняются условия экстремума I порядка'. а) стационарности'. Ax(f,A) = 0 ЭЛ(Ж,Л) = 0, j=l,...,n = dxi ы b) дополняющей нежесткости'. Xifi(x) = 0, i=l,...,m/; с) неотрицательности: Aj 0, г = 0,1,... ,т'; и max {Л.хх(х, А)Л,Л) > о||Л||2 V Л € К с некоторой положительной константой а, где К: = {h € Rn | {/-(х), h) 0, * = 0,1,... ,т', /{(£)[Л] = 0, г - т1 + 1,..., т} — конус допустимых вариаций, а Л — совокупность множителей Лагранжа А, для которых выполнены условия а)—с) с Aq = 1. Тогда х € locmin Р — точка локального минимума в задаче (Р). Доказательство этой теоремы см. [ГТ, с. 124]. Достаточное условие максимума формулируется аналогично, за ис- ключением того, что множитель Лагранжа А = (— 1, А|,..., Ат), соответ- ственно в конусе допустимых вариаций (/o(®)i 0 и max (Л„(®, А)Л,Л) <-a||/i||2 V h е К.
36 Глава 1. Экстремальные задачи 3.3. Правило решения Для решения гладкой конечномерной задачи с ограничениями типа равенств и неравенств следует: т 1) Составить функцию Лагранжа А(ж,А) = 52 1=0 2) Выписать необходимое условие экстремума I порядка: а) стационарности: . / а М(«,А) Л.х(х, А) = 0 <=> —-----= 0, ] - 1,..., п; OXj b) дополняющей нежесткости: Xifi(x) = 0, i = 1,..., т\ с) неотрицательности: А,- > 0, i = 0,1,... ,т; 3) Найти точки ж, удовлетворяющие условиям а)-с) (эти точки называются критическими). При этом следует отдельно рассмотреть случаи а) Ао = 0; b) Ao = 1 (или любой положительной константе); с) Ао = — 1 (или любой отрицательной константе). В случае а) критические точки могут доставлять и минимум, и макси- мум в задаче. В случае Ь) критические точки могут доставлять минимум в задаче. В случае с) критические точки могут доставлять максимум в задаче. При нахождении критических точек в условиях дополняющей не- жесткости Xifi(x) = 0 для каждого г надо рассматривать два случая: А; = 0 и А; 0. 4) Исследовать на локальный и абсолютный экстремум найденные критические точки или, если их нет, найти Smin и Smax и указать последовательности допустимых точек, на которых эти абсолютные экстремумы достигаются. При этом можно пытаться воспользоваться непосредственной про- веркой или перейти к исследованию условий экстремума II порядка в каждой критической точке. Отметим, что проверка выполнения необхо- димых или достаточных условий экстремума в задаче с ограничениями типа равенств и неравенств — задача непростая. Поэтому, как правило, мы будем при исследовании экстремума использовать непосредственную проверку, сравнивая значение исследуемой функции в критической точке с ее значениями в близких допустимых точках.
§ 3. Конечномерные гладкие задачи с равенствами и неравенствами 37 3.4. Примеры Пример 1. xj + х\ + х2 —» min; 2ж| - х2 + < 5, ®| + + асз = 3. Решение. Функция Лагранжа Л = Ао(ж? +®2 + х2) + A!(2rci - х2 + Хз - 5) + А2(ж, + х2 + х3 - 3). Необходимые условия локального минимума: а) стационарности: Лг| = О 4— >• 2Л()Ж ] 4- 2А । А2 = О, = 0 <=> 2А0ж2 — А, + А2 - О, АХ] = 0 <=> 2Aq®3 + А] + А2 = 0; Ь) дополняющей нежесткости: А] (2х । — х2 + Хз — 5) = 0; с) неотрицательности: Ао 0, А| 0. Если Ао = 0, то из уравнений пункта а) выводим, что Ai = А2 = 0 — все множители Лагранжа — нули, а этого быть не может. Поэтому Ао 7^ 0, полагаем Ао = |. Предположим Aj # 0, тогда в силу условия Ь) 2ж| — х2 + хз — 5 = 0. Выражая х\,х2,хз из условия а) через А(,А2 и подставляя в уравнения Xi + х2 + Хз = 3, 2х| — х2 + хз — 5 = 0, получим, что ( -2А! - ЗА2 = 3, | —6А1 - 2А2 = 5, откуда А| = — ^ < 0 — противоречие с условием неотрицательности с). Значит, в случае А( / 0 критических точек нет. Пусть Aj — 0. Тогда ж, = х2 = х2 = 1 — единственная критическая точка. Функция f(x) = Xi + х2 + х% —> оо при |ж| -+ оо, значит по след- ствию из теоремы Вейерштрасса решение задачи существует, а в силу единственности критической точки решением может быть только она. Итак, х — (1,1,1) € absmin, Smjn — 3.
38 Глава 1. Экстремальные задачи Пример 2. Приведение квадратичной формы к главным осям. Пусть А — — симметричная матрица (aij — aji) и Q(x) — n OijXiXj — {Ax, x) — соответствующая ей квадратичная форма. •J=i Теорема. В пространстве Rn существует ортонормированием базис /1,... ,fn, в котором квадратичная форма Q имеет представление п Q(x) = '^Xi(xJi)2. i=l В базисе ft,..., /п матрица формы Q диагональна. Направления векторов называются главными осями формы Q, а переход к базису jj,..., fn называется приведением формы к главным осям. Доказательство. Если Q — 0, то А| = ... = Ап — 0, fh..., fn — любая ортонормированная система. Пусть Q 0, тогда Q принимает положительные или отрицательные значения. Для определенности считаем, что Q принимает отрицательные значения. Рассмотрим первую экстремальную задачу {Ах,х} —> min; {х, х) 1. (Pi) Если Q принимает только неотрицательные значения, то надо рассма- тривать задачу на максимум. Решение £ — f\ задачи (Р\) по теореме Вейерштрасса существует, так как шар S — {® е R" | (х,х) С 1} является компактом в Rn, а функция (Да:, а:) непрерывна. Функция Лагранжа задачи (Pi) А — Xq(Ax,x) + Х({х,х) - 1). Необходимые условия локального минимума: а) стационарности: Ах = 0 <=> Ао Af\ + А/, — 0; Ь) дополняющей нежесткости: А((/|,/1) - 1) —0; с) неотрицательности: Ао > 0, А 0. Если Ао = 0, то А 0 0 и из пункта а) выводим, что f\ = 0, но это противоречит условию Ь). Поэтому Ао # 0, полагаем Ao = 1. Тогда из a) Af\ = -Xf\. Умножая последнее равенство скалярно на получим, что = -А(/|,/|) — ^min < 0- Отсюда А > 0 и по условию b) = 1. Таким образом, /| — собственный вектор матрицы A, Afi — Xtfi (At - —А), |/i | - 1, Smin — Ai, А, — минимальное собственное значение матрицы А. Обозначим Li = {х € Rn | (х, fi) — 0} — подпространство в Rn. Если Q(x) = О V i £ 1|, то Aj = ... - Хп = 0, f2, . ., fn — любая ортонормированная система из L\.
§ 3. Конечномерные гладкие задачи с равенствами и неравенствами 39 Пусть Q £ 0 на Lt. Тогда Q на Lt принимает положительные или отрицательные значения. Для определенности теперь считаем, что Q принимает на Lt положительные значения. Рассмотрим вторую задачу {Ах,х) —» max; {х,х) < 1, <з:,/1) = 0. (Рг) Решение х = /2 задачи (Р2) по теореме Вейерштрасса существует, так как сечение сферы S плоскостью Z, является по-прежнему компактом. Функция Лагранжа Л = Ао(Ах, х) + А ((х,х) — 1) + 2р(х, /|). Необходимые условия локального максимума: а) стационарности: Лх = 0 <=> А0А/2 + А/2 + (*ft = 0; b) дополняющей нежесткости: А(</2> /2) - 1) = 0; с) неотрицательности: Aq ^0 (задача на максимум!), А 0. Если Ао = 0, то из пункта а) выводим, что А/2 + ^ft = 0. В силу линейной независимости векторов /| и fi следует, что А — ц — 0 — все множители Лагранжа — нули, а этого быть не может. Поэтому Ао # 0, полагаем Ао = —1. Тогда из a) Afi = А/2 + Д/ь Умножая последнее равенство скалярно на /| и учитывая ортогональ- ность векторов /| и /2, получим, что (А/2,/1) = А(/2, /|) + Д</ь/|) = M</i,/i) = М (/2,Л/|) = ц О (/2,А|/,) = ц о 0 = ц. Умно- жая полученное равенство А/2 = А/2 скалярно на /2, получим, что {Afi, /2) = А(/з,/2) = Smax > 0. Отсюда А > 0 и по условию Ь) {fi, fi) — 1. Таким образом, /2 — собственный вектор матрицы А, Afi = Xifi (А2 — А), векторы f\ и fi ортогональны. Далее поступаем подобным образом. Вводим подпространство Li = {г 6 R" | {x,f}) = 0, {x,fi) = О}. Если Q(x) = О V г Е L2, то A3 = ... = Ап = 0, /з,...,/п — любая ортонормированная система из Li. Пусть Q £ 0 на Li. Тогда Q на L2 принимает положительные или отрицательные значения. Вновь рассматриваем задачу на минимум или максимум: (Аж,х) — extr; {х,х) < 1, (х, fa) = <ж, /2) = 0. (Р3) Решая эту задачу, получаем единичный вектор /3 такой, что Afa — Alfa, fi ортогонально /1 и /2. Поступая аналогично, в итоге придем к ортонормированному базису ft,. ,fn из собственных векторов матрицы А с собственными числами п п Аь- • • >ЛП. При этом для вектора х = имеем Ах = и ’= Q{x) = {Ах,х) = (^(з./Л/ь^ж.Л)/,) - ^А,(х,/,-)2. i=l 3=1 . = 1
40 Глава 1. Экстремальные задачи 3.5. Задачи 3.1. xlx2J:i —» extr; х2 4- х2 + х2 < 1. 3.2. 52 Жу extr; 52 xj 1 • ;=l 2=1 п п 3.3. 22 ж^ —> extr; £х2^1. 2=1 j=l 3.4. 3.5. 3.6. ех'~Х2 - Xi - X2 —* extr; ж, + ж2 < 1, ж; > 0, ж2 0. ж^ + ж2 —> extr; ж^ 4- ж2 1, Ж| 0, ж2 0. ж? + ж2 + ж| —> extr; Ж| 4-ж2 4-Ж3 $ 12, ж, 0, ж2 0, жз 0. 3.7. ж^+ 4ж2 + жз —> extr; ж, 4-ж24-ж3 12, ж( 0, ж2 0, xj 0. 3.8. ж, + ж2 4- ж2 -* extr; ж, 4-ж2 4-жз 1, ж, 0, Xi+Xi-Xj — -. 3.9. 2х2 + 2ж| + 4ж2 — Зж3 —> extr; 8ж] - Зж2 + Зж3 40, —2ж] + ж2 — Жз - — 3, ж2^0. 3.10. 2ж? 4- 2ж| + 4ж2 - Зж3 —> extr; 8ж] — Зж2 + Зжз — 40, —2ж| + ж2 — Жз < —3, ж2 0. 3.11. ЗЖ| - 11ж, — Зж2 - ж3 —> extr; ж, - 7ж2 + Зж3 4-7^0, 5ж| 4- 2ж2 - Жз < 2, ж3<? 0. 3.12. Зж2 - 11Ж] — Зж2 — ж3 —» extr; Ж| — 7ж2 4- Зжз 4-7^0, 5ж( 4-2ж2 — Жз 2, жз 0. 3.13. Ж[Жз — 2ж2 —> extr; 2Ж|—ж2 —Зжз 10, ж2 > 0, Зж|4-2ж24-ж3 — 6. 3.14. Ж[Ж2Жз —> extr; ж3 > 1, Ж| 1, ж2 > 1, х2 4- ж2 4- ж2 = 8. 3.15. Доказать неравенство для средних степенных /521ж21рч i/р /El^l’x |/« ( | ) > 0 < р q оо, \ т / \ т / путем решения экстремальной задачи п п 22|Жз|?-> max; 1®>1’ = аЧ (’< Р < а > °)- 2=1 2=1 3.15. Доказать неравенство между средним арифметическим и средним геометрическим: п
§ 4. Выпуклые задачи 41 § 4. Выпуклые задачи Пусть в этом пункте X — линейное нормированное пространство (определение линейного нормированного пространства см. в §5), для простоты понимания можно считать, что X = R" — конечномерное пространство. 4.1. Элементы выпуклого анализа. Субдифференциал Напомним определение выпуклого множества. Множество А С X называется выпуклым, если для любых двух точек at и а2 из А и любого числа t € (0, 1) элемент tai + (1 - <)а2 е -А. Пусть задана функция (функционал) f : X R: — R U {-оо} U {+оо}. Множество epi/ = {(а,х) £ R х X | а /(ж)} в пространстве R х X называется надграфиком функции /. Функция f называется выпуклой, если надграфик / — выпуклое множество. Функ- ция / называется собственной, если /(г) > -оо V г и / +оо. Мы будем изучать выпуклые собственные функции. Для краткости будем называть их просто «выпуклые» функции. Из определения выпуклого множества сразу следует, что фикция выпукла тогда и только тогда , когда выполнено неравенство Йенсена'. f(txt + (1 -t)x2) tf(^i) + (i -t)f(x2) Vxi,x2ex, v < £ (о, i). Выпуклость многих классических функций одной переменной сразу вытекает из следующей теоремы. Теорема 1. [Р, с. 42] Пусть функция /: R —> R дважды непрерывно дифференцируема (/ £ Z>2(R)). Тогда она выпукла тогда и только тогда, когда ее вторая производная неотрицательна (f"(x) О V х £ R) . Приведем несколько примеров выпуклых функций, выпуклость ко- торых сразу следует из теоремы 1 и определения выпуклой функции. 1. /(®) = еах, а £ R. 2. f(x) = ]®jp, р 1. В многомерном случае (/•. Rn —» R) выпуклой является аффинная функция /(®) = {а, х) + Ь, а Е Rn, b £ R (выпуклость тривиально следует из неравенства Йенсена). Квадратичная функция Q(x) = {Ах,х}, где А — симметричная матрица, является выпуклой тогда и только тогда, когда матрица А неотрицательно определена. Это сразу вытекает из следующего многомерного обобщения тео- ремы 1.
42 Глава 1. Экстремальные задачи Теорема 2. [Р, с. 44] Пусть функция f: Rn —> R дважды непрерывно дифференцируема (f 6 Z)2(Rn)). Тогда она выпукла тогда и только тогда, когда ее матрица вторых производных (гессиан) неотрицательно определена д21(х)\П дх{дх; I > О V x € Rn Выпуклыми функциями многих переменных (функционалами) явля- ются следующие функции: 1. Функция нормы /п \ f(x) =: |jse||p = ( £ , 1 р < оо. \j=i / 2. Индикаторная функция выпуклого множества А С X М<’Н%0, ‘,$1 3. Функция Минковского выпуклого множества А С X ( 0, ах € Л V а > 0; р.А(х) = < +оо, аа: £ А V а > 0; I min{a! 0 | а~'х g А}, иначе. 4. Опорная функция непустого множества А С X sA(y) — max(y,x). xGA Дадим определение важного понятия выпуклого анализа — поня- тия субдифференциала функции, обобщающего для выпуклых функций понятие производной в гладком анализе. Субдифференциалом выпуклой функции f в точке & называется следу- ющее множество в сопряженном пространстве X*: &/(&) ~ {У € X* | (х - х,у) sj f(x) - f(x) VigX}. Напомним, что сопряженным пространством X* называется прост- ранство линейных непрерывных функционалов на X. В случае X — Rn сопряженное пространство (R")* — Rn. Из определения сразу вытекает, что субдифференциал — выпуклое множество в X*. Легко доказать, что оно замкнуто. Субдифференциал дифференцируемой функции совпадает с ее производной. Для функций одного переменного субдифференциал <?/(£) — это совокупность угловых коэффициентов к, при которых прямые у = кх+Ь, проходящие через точку (4, /(£)), лежат под графиком функции у = f(x). Пример. f(x) = |sc|. (см. рис. 6). Для субдифференциала суммы функций имеет место теорема анало- гичная теореме о производной суммы функций.
§ 4. Выпуклые задачи 43 Рис. 6. Теорема Моро—Рокафеллара. [Глава 6, Введение] Пусть Д и Д — выпуклые функции на X. Существует точка хо, в которой функция f\ конечна ()Д («о)] < оо), а функция J2 непрерывна. Тогда d(f\ + Д)(ж) = df{ (х) + df2(x) V х. Теорема Моро—Рокафеллара иногда формулируется для сублиней- ных функций. Функция р называется сублинейной, если а) р(Хх) = Xf (x) для любого А > 0, для любого х € X; b) p(xi + х2) p(xt) +р(х2) для любых Xi,х2 С X. Очевидно, что сублинейная функция является выпуклой. Выпуклая функция не обязана быть сублинейной. Нетрудно видеть, что надграфик сублинейной функции — выпуклый конус. Теорема. Пусть Р\,р2 — сублинейные функции, функция р( непрерывна, функция р2 замкнута. Тогда в точке £ — О д(Р\ + Рг) = 9Pi + дР2- При доказательстве необходимых условий экстремума в гладкой задаче с равенствами и неравенствами нам понадобится следующая теорема о субдифференциале максимума. Теорема Дубовицкого—Милютина. [Глава 6, Введение] Пусть Д и f2 — непрерывные выпуклые функции на X, f\(x) = Д(А). Тогда д тах{Д, f2}(£) = сопу(ЭД (ж) U ЭД (ж)). Сформулируем также теорему Дубовицкого—Милютина для субли- нейных функций. Теорема. Пусть р\,р2 — непрерывные сублинейные функции. Тогда <?tnax{pi,p2}(0) = conv(5pi(0) U Эрз(О)).
44 Глава 1. Экстремальные задачи 4.2. Теоремы отделимости При выводе необходимых условий экстремума (принципа Лагранжа) в выпуклых задачах и в задачах с равенствами и неравенствами мы будем использовать свойство отделимости непересекающихся выпуклых множеств. Определение 1. Множества А и В из пространства X называют- ся отделимыми, если существует линейный непрерывный функционал А € X*, А 0 0, для которого min(A.a) > max (А, b). Из определения следует, что множества являются отделимыми, если можно провести гиперплоскость Н = {ж € X | (А,ж) = с}, с € R, так что одно из множеств лежит в одном замкнутом полупространстве Н+ — {ж € X | (А,х) с}, а другое — в другом замкнутом полупро- странстве = {ж € X | (А, ж) < с). Определение 2. Множества А и В называются строго отделимыми, если существует линейный непрерывный функционал А е X*, для которого min(A.a) > max (А, Ь}. аел ьев Приведем результаты об отделимости в конечномерном случае- Теорема 1 (первая теорема отделимости в конечномерном случае). Пусть А и В — непустые выпуклые множества в R", А (1 В = 0. Тогда множества А и В отделимы. Теорема 2 (вторая теорема отделимости в конечномерном случае). Пусть А — непустое выпуклое замкнутое множество в R”, Ъ £ 4. Тогда точку b можно строго отделить от множества А- Доказательство теорем 1, 2 см. [ГТ, с. 20]. Сформулируем результаты об отделимости в случае нормированных пространств. Теорема 1' (первая теорема отделимости в нормированных простран- ствах). Пусть А и В — непустые выпуклые множества в X, int А # 0, int А Г) В = 0. Тогда множества А и В отделимы. Теорема 2' (вторая теорема отделимости в нормированных простран- ствах). Пусть А — непустое выпуклое замкнутое множество в X, Ъ £ А. Тогда точку Ь можно строго отделить от множества А. Доказательство теорем 1', 2' см. [АТФ, с. 124].
§ 4. Выпуклые задачи 45 4.3. Задачи без ограничений Пусть /: X —» R — выпуклая функция, отображающая нормиро- ванное пространство X в расширенную прямую. Выпуклой задачей без ограничений называется следующая экстремальная задача: /(ж)—>min. (Р) Теорема (аналог теоремы Ферма). Для того чтобы точка х доставляла в выпуклой задаче без ограничений (Р) абсолютный минимум (х Е absmin Р), необходимо и достаточно, чтобы выполнялось соотношение Qedf(£). Доказательство. х € absmin Р О f(x) — f(x) 0 = (0, ж — х) V х € X Поскольку из выпуклости функции f не следует, вообще говоря, выпуклость функции —то существенно, что рассматривается задача минимизации, а не максимизации. 44- Задачи отграничением Пусть f:X —> R —выпуклая функция, отображающая нормиро- ванное пространство X в расширенную прямую, D С X — выпуклое множество. Выпуклой задачей с ограничением (или просто выпуклой зада- чей) называется следующая экстремальная задача: /(ж) —» min; х £ D. (Р) Теорема. Пусть х £ locmin Р — доставляет локальный минимум в выпуклой задаче (Р). Тогда х € absmin Р — доставляет абсолютный минимум в этой задаче. Доказательство. Пусть х € locmin Р. Это означает, что существует окрестность U точки х, такая, что —оо < <. f(x) У х € U Cl D. Возьмем произвольную точку х £ D. Тогда х = (1 - а)£ + ах £ U A D при достаточно малом а > 0. Следовательно, по неравенству Йенсена /(ж) /(«) < 0 - «)/(£) + откуда af(x) s' а/(х) О f(x) sj f(x) V х Е D. Значит, х доставляет абсолютный минимум в задаче (Р) . Из теоремы следует, что в выпуклой задаче локальный минимум является и абсолютным (глобальным). Поэтому в дальнейшем в выпуклых задачах, говоря «минимум», имеем в виду абсолютный Минимум.
46 Глава 1. Экстремальные задачи 4.5. Задача выпуклого программирования Пусть X —* R, » = 0,1,..., т, — выпуклые функции, отображаю- щие нормированное пространство X в расширенную прямую, А С X — выпуклое множество. Задачей выпуклого программирования называется следующая экстремальная задача: /о(®) ~> min; fi(x) 0, t = х е А. (Р) Точка х называется допустимой в задаче (Р), если х G А и выпол- няются все заданные ограничения типа неравенств. Упражнение. Докажите, что задача выпуклого программирования является выпуклой задачей, т. е., что множество допустимых элементов в этой задаче является выпуклым множеством. При проверке достаточных условий минимума в задаче выпуклого программирования будет использоваться некоторое условие регулярности множества допустимых элементов — условие Слейтера Множество допустимых элементов в задаче (Р) удовлетворяет условию Слейтера, если существует точка х Е А, для которой fi(x) < 0, i = 1,..., т. Теорема Куна—Таккера. 1. Если х € absmin Р — решение задачи выпуклого программирования, то найдется ненулевой вектор множителей Лагранжа Л = (Ао, А|,..., Ат) € т Rm+1, такой, что для функции Лагранжа А(х) = выполняются 1=0 условия-. а) принцип минимума для функции Лагранжа minA(®) = Л(ж); х€А Ь) дополняющей нежесткости: = 0, i = 1,..., т; с) неотрицательности: А,- 0, i = 0,1,..., т. 2. Если для допустимой точки х выполнены условия а)—с) и Хо 0, то £ Е absmin Р. 3. Если для допустимой точки £ выполнены условия а) —с) и множество допустимых элементов удовлетворяет условию Слейтера, то £ Е absmin Р.
§4. Выпуклые задачи 47 Доказательство. Пусть £ € absmin Р. Не ограничивая общности, считаем, что fo(£) —0 — иначе введем новую функцию falx) = /о(ж) — fo(x). Положим В = {6= (d0, бн. ..,bm) е Rm+1 | 3 х е А : i = Q,l,...,m}. Покажем, что В — непустое выпуклое множество. Действительно, неотрицательный октант R™+l С В, т. е. любой вектор с неотрица- тельными компонентами принадлежит В, ибо в определении множе- ства В можно положить х = х. Докажем выпуклость множества В. Пусть точки b и Ь' принадлежат множеству В. Надо доказать, что ab + (1 — a)b' G В V а 6 (0, 1). Поскольку точки 6,d' G В, то по опре- делению множества В существуют х,х' G А такие, что fi(x) bi, fi(x') С , »’ = 0,1,... ,т. Положим ха = ах + (1 - а)х'. Тогда ха £ А, поскольку А — выпукло, а ввиду выпуклости функций fi, г = 0,1,..., т, по неравенству Йенсена + (1 - а)х') afi(x) + (1 - а)/,(а/) ad, + (1 - a)dj, т. е. точка ad + (1 — а)д' G В. Обозначим С — {с = (со ,0,.. .,0) € Rm+I | со < 0} — открытый луч в пространстве Rm+I. Ясно, что С — непустое выпуклое множество. Покажем, что С П В = 0. Действительно, если бы существовала точка с G С П В, то ввиду определения множества В отсюда следовало бы, что имеется элемент х 6 А, для которого выполняются неравенства: /0(ж) < со < 0, /,(£) <0, г — 1,...,тп. Но из этих неравенств следует, что для допустимой точки х fo(x) < /о(£) == 0, т. е. х & absmin Р. Получили противоречие с условием теоремы х € absmin Р. Значит С П В = 0. По первой теореме отделимости в конечномерном случае множест- ва В и С можно отделить, т. е. существует вектор А = (Ао, А],..., Ат) 0, для которого т т min V A,d, > max А, с,- = max Aqco 0 . бе в А><0 Таким образом, 52 М. > 0 V д G В . (*) »=о Из неравенства (*) будут выведены условия неотрицательности, дополняющей нежесткости и принцип минимума.
48 Глава 1. Экстремальные задачи 1. Условие неотрицательности. Поскольку, как мы уже говорили, любой вектор с неотрицательными компонентами принадлежит В, то вектор (0,..., 0,1,0,..., 0) € В, где единица стоит на »-ом месте (счет начинаем с нуля). Подставив эту точку в неравенство (*), получим, что А, 0. Условие дополняющей нежесткости. Нетрудно видеть, что точка (0,..., 0, 0,... ,0) € В. Действительно, в определении множества В возьмем х = х, тогда х £ В и нужные неравенства выполняются. Подставив эту точку в неравенство (*), имеем \fi(x) > 0. Если Xifi{x) > 0, то (так как по уже доказанному условию неотрицательности А, > 0) fi(£) > 0 — это противоречит допустимости точки £. Значит, AJi(ic) =0. Принцип минимума. Возьмем точку х £ А, тогда точка (fo(x), f\(x),..., fm(x)') Е В. Отсюда по неравенству (*) т т М®) = 52 0 = 52 Х^‘(£У »=0 i=0 так как, не ограничивая общности, положили fo(£) =0и по уже дока- занному условию дополняющей нежесткости Xifi(x) = 0, i — Таким образом, принцип минимума для функции Лагранжа доказан. 2. Пусть для допустимой точки £ выполнены условия а)—с) и Ао / 0. Положим Ао = 1. Тогда для любой допустимой точки х будет выполняться неравенство m fo(£} = fo(£) + 52 = A(f) *=l “> def Л-ч <0 A(z) = f0(x) + A,/,(a;) < f0(x). i=\ Это означает, что £ € absminP. 3. Пусть для допустимой точки £ выполнены условия а)-с) и мно- жество допустимых элементов удовлетворяет условию Слейтера. Пред - положим, что при этом Ао = 0. Так как вектор А # 0, то в силу условия неотрицательности существует А7 > 0, j € {1,... ,т}. Следовательно, m с) т А(£) = 52 A»7.(i) < 0 = ^2 = А(£У 1=1 1=1 Но это неравенство противоречит с условием а). Значит, наше предпо- ложение, что Ао = 0 неверно. Поэтому Ао 0 и по доказанному п.2 £ G absmin Р. Теорема Куна—Таккера полностью доказана.
§ 4. Выпуклые задачи 49 Пример. /(х|,х2) = х] + xtx2 + х2 + 3|я:। + х2 - 2| —► min . Решение. Функция f(xt,x2) является выпуклой функцией как сумма двух выпуклых функций. Функция g(xi, х2) = х? + х:х2 + xj выпукла, так как по критерию Сильвестра матрица вторых производных ( д2д(х) \ = /2 1 \ I dxidxj I \ 1 2 у не зависит от х и положительно определена. Очевидно, что функция h(x\,х2) = |xi + х2 - 2|, являющаяся модулем линейной функции также является выпуклой функцией. Необходимое и достаточное условие экстремума в выпуклой задаче без ограничений: О g df(x) = дд(х) + 3dh(x). Для дифференцируемой функции ее субдифференциал совпадает с про- изводной: дд(х) — (2£| + х2,Х| + 2А2). Найдем dh(x). По определению субдифференциала а — (а \ ,а2) € dh(x) <=> (х - х, а) < h(x) — h(i) V х € R2 <=> «ill + а2х2 — в|А। - а2х2 $ |х, + х2 — 2| — |х1 + х2 — 2| <=> ai(xi + х2) + (а2 — ajx2 |Х| + х2 — 2| - + £2 — 2| + aiXi + а2х2. Отсюда вытекает, что |at | 1 и в| = а2, т. е. а = (а, а), |а| 1. Поэтому [(1,1), = < (a, ar), |а| 1, а?! 1,—1), + х2 - 2 > 0, + х2 - 2 = 0, + х2 — 2 < 0 => 0 € df(x) <=> ( 2х| + х2 + 3 = 0, 1x1+24+3=0 ПрИ Х| + х2 - 2 > 0; (0 f 2х| + х2 + За = 0 , 1 х, + 2х2 + За = 0 ПрИ 2!| + х2 - 2 = 0, (|а| $ 1); (п) ( 2х| + х2 - 3 = 0, i х, + 1х2 ~ 3 = 0 ПрИ Х( + х2 — 2 < 0. С») В случае (i) нет критических точек, так как из уравнений системы следует, что х, + х2 — —2 — противоречие с условием xt + х2 - 2 > 0. В случае (iii) также нет критических точек ,так как из уравнений системы следует, что xt + х2 — 2 — противоречие с условием х( + х2 — 2 < 0. В случае (ii) система из трех уравнений с тремя неизвестными имеет единственное решение Х| = х2 = 1, а = -1. Таким образом, Sm,n — 3, при Х( = х2 - 1.
50 Глава 1. Экстремальные задачи 4.6. Задачи, упражнения В задачах 4.1—4.4 выяснить, при каких значениях параметра функ- ции являются выпуклыми: 4.1. f(x) = ах2 + Ьх + с. 4.2. f(x) = ae2z + be* + с. 4.3. /(х,,х2) = Н- |®2lp)'/P (р>0). 4.4. f(x\,x2) = апх2 + 2<i|2X|х2 + а22х2. В задачах 4.5-4.6 выяснить, являются ли выпуклыми функции: 4.5. f(x) — х In х + (1 - х) ln( 1 — х). 4.6. f(x) = min {х, + Xi | Х| + х2 — г}. 4.7. f(x) = 2|sc - 1| + |х|; =? В задачах 4.8-4.15 вычислить субдифференциалы выпуклых функ- ций в точке х = 0: 4.8. f(x) = max {я, 0}. 4.9. f(x) = max{е1, 1 - х}. / п х 1/2 4.10. /(х,,...,хп) = |х|: = 4.11. /(х|,...,х„)= £ |х7|. >=| 4.12. /(Х|,... ,х„) = max |х,|. >=1,...,п 4.13. /(х|,... ,xn) = max х,-. j=l,...,п 4.14. /(xi,..., х„) = max {0, (а, х)} (а е R"). 4.15. /: X —> R, /(х) = ||х|| (X — нормированное пространство). 4.16. Доказать, что любая выпуклая функция, конечная на всей прямой, непрерывна. 4.17. Доказать, что не существует выпуклой ограниченной функции, определенной на всей прямой и отличной от константы. Решить выпуклые задачи 4.18—4.21: 4.18. /(xi,x2) = х2 - Х|Х2 + х2 + 3|х| - х2 - 2| —► min. 4.19. /(xi,x2) — х2 + х2 +4max{xi, х2} —> min. 4.20. /(Х|,х2) = х2 + х2 + 2у/(х, - at)2 + (х2 - а2)2 min. 4.21. /(xi,x2) = Х| + х2 + 2a|xt + х2— 1| -♦ min (a > 0).
§ 5. Элементы функционального анализа 51 § 5. Элементы функционального анализа 5.1. Нормированные и банаховы пространства 5.1.1. Определение пространств Линейное пространство X называется нормированным, если на X определен функционал || • ||: X —> R, называемый нормой и удовлетворя- ющий условиям: а) ||®||^0 УхеХ и ||ж|| = 0 <=> ат = 0; Ь) ||ах|| = |а| • ||х|| V а е R, V х € Х\ с) ||а?1 + х2|| < ||ат1|| 4- ||®2|| Vii.ijCl. Линейное нормированное пространство иногда будем называть для краткости нормированным пространством. Иногда, чтобы подчеркнуть, что норма задана именно на X, мы пишем |1ж11т- Две нормы на X ||х||| и ||х||2 называются эквивалентными, если существуют положительные константы Ci и С2 такие, что C’dlzlli ||ж||2 С2||а:|||. Всякое нормированное пространство становится метрическим, если в нем ввести расстояние d(xi,xz) = ||х| — ж2||. В метрическом простран- стве естественным образом вводятся понятия открытых и замкнутых множеств, сходимость. Последовательность точек {х„}^=| метрического пространства на- зывается фундаментальной, если она удовлетворяет критерию Коши, т. е. если для любого е > 0 существует Nc такое, что d(xni,xni) < е для всех П!,П2 > Nc. Метрическое пространство называется полным, если любая фунда- ментальная последовательность сходится. Полное относительно введенного расстояния метрическое простран- ство называется банаховым пространством. Отметим, что всякое конечномерное нормированное пространство является банаховым. Бесконечномерное нормированное пространство не обязано быть банаховым. 5.1.2. Произведение пространств Пусть X и У — линейные нормированные пространства. Декартово произведение X х Y можно превратить в линейное нормированное пространство, введя норму |1(®,1/)Нххг = max {|И1х, ||»||у } Легко проверить, что все аксиомы нормы выполняются. Отметим очевидное утверждение: декартово произведение банаховых пространств банахово.
52 Глава 1. Экстремальные задачи 5.1.3. Примеры банаховых пространств 1. Конечномерное пространство R", состоящее из векторов х = ( п i\ 1/2 (х|,..., х„) с нормой ||а:|| ~ |а:| = ( У? arj ) . Эту норму иногда называют S=i 7 евклидовой нормой, а расстояние, вводимое с помощью этой нормы, называют евклидовым расстоянием. 2. Пространство С*((<0, t,]): = C([to, ii],R) непрерывных на отрезке Ro, t|] функций х() с нормой 1|ж(-)||с(По,*1|) =: IMOIIo = max |xr(i)|. <€[toi ] Обобщением этого пространства является пространство С(К, R") непрерывных вектор-функций ж(-): К —► R", заданных на компакте К с нормой ||а:(-)||о = max |x(t)|. 3. Пространство Cl([£0, tj): = С'фо, ti], R) непрерывно дифферен- цируемых на отрезке [to, t(] функций х() с нормой =’ = max {|к(-)||сф0,<,|), ||*(-)11сф0,«,])}• 4. Пространство 1?, состоящее из последовательностей х = {а:п}“=1 00 (иногда пишем, х = (х|,... ,х„,...)), для которых хп < °°> с нормой, П—1 / «; ,\1/2 задаваемой формулой ||г[|1г: = zS х») 5.1.4. Сопряженное пространство, оператор Совокупность X* всех линейных непрерывных функционалов на нормированном пространстве X образует сопряженное к X пространство. Оно является банаховым пространством относительно нормы IR’Ilx-: = max {х,х}, 1И1х<1 где {х*,х} означает действие функционала х' на элемент х. Пусть X и Y — нормированные пространства. Через L(X,Y) обозначим пространство линейных непрерывных операторов из X в У. Пусть Л £ L(X, У). Тогда можно определить сопряженный оператор Л*: У* —> X' такой, что (А*у*,х) = (у*,Л.х) V х € X. Для линейного непрерывного функционала на произведении про- странств имеет место следующая очевидная
§ 5. Элементы функционального анализа 53 Лемма. Всякий функционал Л € (АГ х У)* однозначно представляется в виде (Л, (х,у)) = {х*,х} + {у*,у}, где х* € X*, у* € Y*. 5.2. Определения производных Для вещественных функций одного вещественного переменного два определения — существование конечного предела |im Л1 + ЛЬД±) ь-о h и возможность асимптотического разложения при h —» О f(x + h) - f(£) + f'(£)h + о(Л) (2) — приводят к одному и тому же понятию дифференцируемости. Но уже для функций двух и большего числа переменных существует несколько различных подходов к понятию дифференцируемости (гладкости). Опре- деление (1) ведет к понятиям производной по направлению, вариации по Лагранжу и производной Гато. Определение (2) ведет к понятиям производной Фреше и строгой дифференцируемости. Пусть далее в этом пункте X, Y, Z — линейные нормированные пространства. Как правило (если это не оговорено иначе), /: X —> Y — отображение пространства X или некоторой окрестности точки х G X в пространство У*. 5.2.1. Производная по направлению Будем говорить, что отображение f имеет в точке х производную по направлению h, если существует f(x + АЛ) - /(ж) bm -----------------=: 6+f(x,h). А—>+0 А • 5.2.2. Вариация по Лагранжу Если отображение f имеет в точке х производную по всем напра- влениям и 6+f(x, Л) = — 6+f(x, -h.) =: 6f(x, h.) V Л 6 X, то говорят, что отображение f имеет в точке х вариацию по Лагранжу. При этом ото- бражение Л —> Sf(x, Л) называют вариацией по Лагранжу. Таким образом, вариация по Лагранжу .. Дх + АЛ)-/(4) Sflx.h) = lim---------------. л—.о А ----------------- Но вполне содержателен пример, когда X = R”, У = R™. Элемент из L(X,Y) определяется в этом случае матрицей размера п х т.
54 Глава 1. Экстремальные задачи 5.2.3. Производная Гато Если оператор вариации по Лагранжу 6 f (&,): X —» Y линеен и не- прерывен по Л (д/(х, ) £ L(X, У)), то говорят, что f дифференцируемо по Гато в точке х, а оператор 6f(x,-) называется производной Гато отображения f в точке х и обозначается Таким образом, если f дифференцируемо по Гато в точке х, то для любого фиксированного h имеет место разложение /(£ + Xh) = f(x) + А/^(4)[Л] + r(h, А), где ||г(Л, А)!|г = о(|А|) при А -♦ 0. 5.2.4. Производная Фреше Отображение f называют дифференцируемым по Фреше в точке £ и пишут / € D(x), если существуют линейный непрерывный оператор X —> У и отображение т: X —» У такие, что f(£ + h) = f(x) + /'(£)[Л] + r(h). (О где ||г(Л)||у = о(||Л||х) при ||Л||х —» 0. Оператор /'(£) называется производной Фреше. Это разложение можно кратко записать так: f(£ + Л) = f(x) + /'(х)[Л] + о(Л), понимая о(Л) как элемент пространства У, для которого ||o(h)|| = о(||Л||) при ||Л|| —> 0. Через /'($)[/i] обозначено значение отображения /'(f) на элементе h. Если в каждой точке х открытого множества U отображение / € D(x) и отображение х —» /'(г) непрерывны, то пишем / € C[(U). Ясно, что из дифференцируемости по Фреше отображения / в точке х следует дифференцируемость различаются . На языке е-6 определение дифференцируемости по Фреше ото- бражения / в точке £ формулируется так: существует оператор /'(£) € ЦХ, У) такой, что для любого е > 0 найдется 6 > 0, при котором для любого ||h|| < 6 выполняется неравенство ||/(£ + Л) -/(£)- /'(£)[Л]||у Се||Л|к. Из (1) следует, что производная Фреше определена однозначно, ибо равенство Л|А — Л2Л — o(h) для линейных непрерывных операторов Л, и Л2 возможно лишь при Л| = Л2.
§ 5. Элементы функционального анализа 55 5.2.5. Строгая дифференцируемость Во многих задачах конечномерного и бесконечномерного анализа дифференцируемости по Фреше в точке недостаточно для получения содержательного результата. Это побуждает к следующему усилению дифференцируемости в точке. Пусть отображение f дифференцируемо по Фреше в точке £. Оно называется строго дифференцируемым в точке £ (при этом пишут f g SD(£)), если для любого £ > 0 найдется такое б > 0, что для всех Xi и х2, удовлетворяющих неравенствам Па:, — г|| < б, Цгз — #|| < выполнено неравенство ||/(®|) - /(®2) - /'(ж)[Ж| - ®2]||r $ elkl - Х2.||х- 5.2.6. Частные производные Пусть X, Y, Z — нормированные пространства. Рассмотрим отображение F: X х Y —» Z, (£,у) g X х Y. Если отображение х —> F(x,y) дифференцируемо в точке £ по Фреше, то его производная называется частной производной по х отображения F в точке (£,у) С. Г'/- * и обозначается Fx\xyy) или —. Аналогично определяется частная .4 ^„(Ж, Й) производная по у Fy(x,y) = —. 5.2.7. Производные высших порядков Дадим теперь определение второй производной Фреше. Если отобра- жение f: X —> Y дифференцируемо в каждой точке х g X, то определено отображение х —» f'(x) пространства X в пространство L(X,Y). По- скольку L(X,Y) также является нормированным пространством, то можно ставить вопрос о существовании второй производной f"(x) =(/')'(£) Е L(X,L(X,Y)). Для Л, g X оператор /"(£)[/!,] g L(X,Y). Возьмем h2 € X,. тогда определено /"(х)[Л ЬЛ j =/"(J[fo J g Y .Таким сбразом, опреде- лено линейное по каждому аргументу отображение f"(£): X х X —► Y. Аналогично определяются производные высших порядков. Теорема (о смешанных производных). [АТФ, с. 156.] Если отображе- ние f g _D2(£) дважды дифференцируемо в точке £, то f"(£)[/»,,Л2] = V Л,,Л2 g X. Замечание. Можно считать, что отображения определены не на всем пространстве, а в окрестности рассматриваемых точек.
56 Глава I. Экстремальные задачи 5.2.8. Контрпримеры на дифференцируемость Приведем несколько контрпримеров, показывающих, что введенные понятия дифференцируемости действительно различны. Пример 1. Непрерывная функция не имеет в фиксированной точке производной ни по какому направлению'. , , 1 /: R —> R, /(х) = г sin —, х = 0. х Пример 2. Непрерывная функция имеет в фиксированной точке про- изводную по всем направлениям, но не имеет в этой точке вариации по Лагранжу. /: R —> R, /(х) = |х|, х = 0. Пример 3. Отображение имеет в фиксированной точке вариацию по Лагранжу, непрерывно в этой точке, но не имеет в этой точке производной Гато. Определим отображение в полярных координатах х = (х^х?) — (г cos уз, г sin уз) по формуле: f: R2 —> R, f(x) = г cos3y>, х = 0. (Нетрудно проверить, что вариация по Лагранжу 6f(£,h) не является линейным оператором по h.) Пример 4. Отображение f имеет в фиксированной точке производную Гато, но не имеет в этой точке производной Фреше'. /: R2 —> R, f(x) = ( * ’ > °, 4 = (0,0). 0, в остальных случаях, ' ' (6f(x,h) = 0 => производная Гато /q(x) = 0, отображение / раз- рывно в точке х = (0,0). Функция, дифференцируемая по Фреше, непрерывна в точке дифференцируемости (легко следует из определе- ния).) Пример 5. Функция имеет в фиксированной точке производную Фреше, но не строго дифференцируема в этой точке'. /: R —> R, /(г) = р2’ х рационально, .=0 (О, иррационально, (Эта функция имеет разрывы в любой окрестности нуля, а строго дифференцируемая функция непрерывна в’ некоторой окрестности х.)
§ 5. Элементы функционального анализа 57 5.3. Некоторые теоремы дифференциального исчисления в нормированных пространствах Приведем несколько теорем, наиболее часто используемых для решения экстремальных задач. 5.3.1. Теорема о суперпозиции Теорема. Пусть X ,Y, Z — линейные нормированные пространства, х —> У, ip'.Y^>Z, <р(х) = у, f = V ° V- X —> Z — суперпозиция отображений <р и -ф. Тогда, если ф дифференцируемо по Фреше в точке у, а <р в точке х дифференцируемо по Фреше (дифференцируемо по Гато, имеет вариацию по Лагранжу), то f обладает в точке х тем же свойством, что и <р, и при этом соответственно f’(x) = ф’(у) о ip'(x), fa(x) = ф'(у)о<р'с(х), 6f(x, h) = ф'(у) [<5</?(ж, h.)] V h€X. Если ф е SD(y) строго дифференцируемо в у, а <р € SD(x) строго дифференцируемо в х, то f € SD(x) строго дифференцируемо в А. (Теорема о суперпозиции не имеет, вообще говоря, места, если -ф дифференцируемо лишь по Гато.) Доказательство. Рассмотрим подробно два крайних случая — вариацию по Лагранжу и строгую дифференцируемость. А) Вариация по Лагранжу. По определению производной Фреше в точке у Ф(у) = Ф(у) + tl>'(y)[y ~ #] + о(у - у). Следовательно, КГ/А1Л f(x + Xh) — f(x) _ф(<р(£ + ХЬ))-ф(у) о fix fi): =1 im------------=1 im--------------------= a-о А л—о A ^>’(y)[<p(£+Xh)-y]+o(<p(x + Xh)-y) = li m-----------------------------------~ A—»0 А г <?(£ + Xh)-y = ф(у) lim--- А—А o(<p(x + Xh)-y) + lim-------------= a-о A /’/лк /- Ml l г + .. НУ’(® + АЛ)-»|| = Ф (#) fc)J + lim —————— hm----------------= L J а—о ||y>(x +A/i) - yll а—о A =V>'(y)[M®.fe)] +°- IIMM)II = Ф'(у)
58 Глава 1. Экстремальные задачи что и доказывает формулу для вариации по Лагранжу суперпозиции отображений. В) Строгая дифференцируемость. Так как <р € SD(x), ф 6 SD(y), то для любых Е| >0, £2 > 0, найдутся такие 5] >0, б2 > 0, что из неравенств ||гс, — х|| < б|, ||j/, — у|| < б2, i = 0,1, следуют неравенства ||^(ж1)-^(ж2)-У’'(*)[®1 - ®2]||у < eillar, - ж2||х. (1) \\Ф(У1) ~ Ф(У1) ~ Ф\у)1У1 “ЫНг < е2||у1 -у211г- (2) г б 1, б2 1 Положим 6 = min{--------- „ , к Если теперь ||ж; — ж|| < 6, i = 0,1, Ь, +1М*)1Р то в силу (1) |МЖ|) - ¥>(ж2)|| < £|||®1 - ®2|| + ||^'(ж)[ж1 - х2] || 5? < (£1 + ||^'(ж)||)||ж1 -®2||- (3) Полагая в этом неравенстве поочередно = £, i = 0,1, получаем ||у>(ж,) - р(а)|| = ||^(ж,) - $|| < (е, + ||у/(*)||)г? < б2. Значит, для у, = <р(х{) справедливо неравенство (2). По неравенству треугольника для норм ||/(Ж1)-/(®2)-У(0)[/(£)[®1 - Х2]] || «S ||tfr(p(®l)) -ф(<р(Х2))~ (2) - ф'(у)[<р(^) - ^(®2)] || + ||^'(#)[НЖ|) - <Р(.Х2) - <£>'(®)[Ж1 - Ж2]] || < £2 II НЖ1) - <р(х2) || + ||^'(0)|| |ИЖ1) - р(х2) - <р(х) [Ж| - Х2] II < ( < )£2(ei + ||</(ж)||)Нж1 - х2|| + 11^'0/)||<ч11ж1 — а?2ц = = (£1£2 + е2||¥’'(^)|| +e1||^'(y)||)||a:i - Ж2Н e|l®i ~ «2II, это и означает, что f € SD(£). Действительно, для любого £ > 0 подберем £| > 0, е2 > 0 так, чтобы выполнялось неравенство <й£г + £21|^'(£)|| + ||^'(з7)|| < е- По этим £|,£2 найдем 6t >0, б2 > 0, так, чтобы имели место соотношения (1) и (2). Полагая в этих рассуждениях х2 ~ х, х/ = х + Л, мы получим доказательство теоремы для случая дифференцируемости <р по Фреше. Доказательство теоремы для случая дифференцируемости /р по Гато получается анализом уже доказанной теоремы для вариации по Лагранжу суперпозиции отображений.
§ 5. Элементы функционального анализа 59 5.3.2. Формула Тейлора Теорема. [АТФ, с. 159] Пусть отображение f € Dn(£) п раз диффе- ренцируемо по Фреше в точке £. Тогда имеет место разложение в ряд Тейлора /(£ + h) = + /'(i)[ft] + A f"(£)[h, h] + ...+ -f™(£)[h,..., ft] + r(h), 2 n\ где ||’"(A)|| = <’(ll^||”) при h^> 0. 5.3.3. Теорема о среднем Хорошо известно, что для числовых функций одного переменного справедлива теорема Лагранжа, называемая иногда также теоремой о среднем значении или формулой конечных приращений: Теорема Лагранжа. Если функция f: [а, 6] —► R непрерывна на отрезке [а, Ь] и дифференцируема в интервале (а, Ъ), то существует точка с € (а, Ь) такая, что f(b) — f(a) = f'(c)(b — a). (*) Замечание 1. Нетрудно убедиться, что формула (*) остается спра- ведливой и для числовых функций /(ж), аргумент которых принадлежит произвольному линейному нормированному пространству. Дифференцируе- мость понимается в смысле Гато. Доказательство. Полагая <p(t)'. = f(a+ t(b - a)), мы сводим доказа- тельство к случаю функции одной переменной. В этом случае [а, 6] = {ж | х = a + t(b — a), 0 t 1}. Аналогично определяется интервал (а, о). Замечание 2. Для векторнозначных функций теорема Лагранжа не верна. Пример. Пусть f: R —» R2, /(ж) = (sins,-cos ж). Тогда /'(ж)(Л] = (cosж, sin ж)[Л] — (ft cos ж, Л sin ж), ft G R. В то же время для любого с /(2л) - /(0) = 0 # /'(с)[2л - 0] = (2л cos с, 2л sin с). Значит, формула (*) для функции f не имеет места. Отметим, что в анализе, как правило, используется не сама форму- ла (*), а вытекающая из нее оценка |/(Ь) - /(а)| sS max |/'(с)| • |Ь - а|. се(а,г>) Покажем, что в этом более слабом виде утверждение распространяется уже на случай произвольных нормированных пространств. По традиции оно сохраняет название «теорема о среднем», хотя, конечно, его следовало бы назвать «теоремой об оценке конечного приращения».
60 Глава 1. Экстремальные задачи Теорема о среднем. Пусть X,Y — линейные нормированные простран- ства, отображение f : X —> Y дифференцируемо по Гато в каждой точке отрезка [а, 6]. Тогда -/(а)|| max ||/g(c)|| ||Ь — а||. с€{а,6) Доказательство. По лемме Банаха (см. п. 5.4) для любого у € Y, а значит, и для у = f(b) - f(a) найдется элемент у* € Y* такой, что llj/’ll = 1 и {у',у} = ЦУН, т.е. (y‘,f(b) - f(a)} = ||/(6) - /(а)||. Обозначим <p(t) = (у*, f(a + t(b - а))). Поскольку у* — линейный непрерывный функционал, а отображение f в каждой точке отрезка [а, 6] имеет производную Гато, то по теореме о суперпозиции = (у‘, fc(.a + - а)) [6 - а|) Vie [0, 1]. Из дифференцируемости функции ^следует ее непрерывность на от- резке [0, 1 ], и, следовательно, к ней можно применить формулу Лагранжа: р(1) — ¥>(0) = ’{’'(б), 0 € (0, 1). Поэтому ||/(0 - /(а)|| = <!/’,/(&) - /(а)) = у>(1) - ^(0) = <р\в) = = (/,/с(а + 0(г’~а)Мд-а]) ||/с(а + 0(ь-а))[&-«]|| «S ||/с(а + 0(Ь-а))|| - II* — «II < max ||/а(с)|| • ||д — а||. с€(а,») Следствие 1. Пусть выполнены все условия теоремы о среднем и А € L(X,Y). Тогда ||/(Ь) - /(а) - А(& - а)|| С max ||/g(«0 - А|| ||Ь — а||. се (а, Ь) Доказательство. Надо применить теорему о среднем к отображению ^(а:) = /(ж) - Л. Следствие 2. Пусть X, Y — линейные нормированные пространства, отображение F: X —> Y дифференцируемо по Гато в некоторой окрест- ности точки х, отображение х —» Jq(x) непрерывно в точке х. Тогда отображение f строго дифференцируемо в х. Доказательство. В силу непрерывности отображения х —> /с, (я) для любого е > 0 найдется такое 6 > 0, что Ц/с^) _ fa (®)|| < £ ПРИ ||z-S||<5. В силу выпуклости шара В: = В(х,6) = {ж | ||ж - ж|| < й} из условия Ж|,жг € В следует, что [ж,, ж2] € В. По следствию 1 теоремы о среднем с Л = /g(x) Ц/(Ж1) - /(ж2) - /g(z)[zi - ж2]|| С С max ||/с(®> —/с(*)|| - II®! — ®2lle||a?i — яг2||, ,»2> что означает строгую дифференцируемость отображения f в точке ж.
§ 5. Элементы функционального анализа 61 Следствие 2 показывает, что при проверке дифференцируемости конкретного функционала достаточно доказать существование произ- водной Гато и проверить ее непрерывность. Это гарантирует строгую дифференцируемость и тем более существование производной Фреше. 5.3.4. Теорема о полном дифференциале Теорема. Пусть X,Y,Z — линейные нормированные пространства, отображение F: X х Y —> Z имеет в каждой точке (х,у) из некоторой окрестности точки (х,у) Е X xY частные производные Fz(x, у) и Fy(x, у) в смысле Гато, являющиеся непрерывными в точке (х, у). Тогда F ё SD(x, у) строго дифференцируемо в той же точке и при этом = Fx(x,y)[^] + Fy(£,y)[q]. Доказательство. В силу непрерывности отображений Fz(x,у) и Fy(x,y) в точке (х,у) для любого е > 0 можно найти 6 > 0 та- кое, что для любой точки (х, у) из «прямоугольной» окрестности V: = В(х, 6) х В(у, 6) точки (х,^) выполняются неравенства < е, ||Гу(ж,г/) < е. (*) Легко видеть, что если точки (xi,yi), (012,2/2) лежат в V, то и точка (®2,3/1) е V и, более того, оба отрезка [(ж,, у{), (х2, у\)], [(x2,yi),(x2,y2)] содержатся в V. Поэтому отображения х —» F(x,y\) и у —* F(x2,y) дифференцируемы по Гато: первое отображение имеет производную Fx(x,y}) на отрезке [а?|, x2], второе Fy(x2,y) на [</1,2/2]- Применяя следствие 1 теоремы о среднем к этим отображениям, получаем в силу (*) ||F(x|,2/i) - F(x2,y2) - f’I(x,2/)[iE| -х2] -Fy(x,y)[yi — 3/2][| = = ||F(xi, 3/1) - F(x2, y}) - Fz(x, y)[x, - x2] + + F(x2,y{)- F(x2,y2) - Fy(x,y)[yt - 2/2]|| =% < max 11^(1, j/|) - FI(x,2/)|| ||a:| - x2|| + + Tax, --^(*.0)11 • Из/I —3/211 y€(yi ,Уз) e||aci - x2|| + £||!/i - 2/2II для любых (xl,yi),(x2,y2) ё V, что и означает строгую дифференцируе- мость отображения F в точке (х,у).
62 Глава I. Экстремальные задачи 5.4. Дополнительные сведения из алгебры и функционального анализа В этом пункте приводятся дополнительные сведения из алгебры и функционального анализа, которые понадобятся для доказательства теорем об условиях экстремума в гладких экстремальных задачах в нор- мированных пространствах. Определение. Аннулятором А1 множества Д линейного нормиро- ванного пространства X называется множество линейных непрерывных функционалов х*, для которых {х*,х) = О V х 6 Д: Д1: = {х’ Е Хг | {х’,х) =0 Уг€Д}. Отметим, что Д1 всегда содержит 0 G X*. Лемма о нетривиальности аннулятора. Пусть L — замкнутое соб- ственное (L / X) подпространство линейного нормированного простран- ства X. Тогда аннулятор содержит ненулевой элемент х* Е X*. Доказательство. Возьмем произвольную точку £ & L. По второй теореме отделимости существует линейный непрерывный функционал х* е X*, строго разделяющий х и L (L — подпространство линейного пространства и, следовательно, выпукло) max(x’,x) < {х*,х}. x€L Если бы существовало х0 £ L, для которого {x*,Xq) # 0, то поскольку axo Е L для любого а Е R, было бы max(x*,x) тах(х*,ахо) = +оо. Это не так. Следовательно, (х‘,х) — 0 V х Е L и, поэтому х* Е Lr. Далее нам понадобятся следующие две теоремы из функционального анализа. Теорема Банаха об открытости. [ГТ, с. 109] Пусть X, Y — банаховы пространства, Л — непрерывный линейный оператор из X в Y, являющийся эпиморфизмом (Л: X —» Y). Тогда образ каждого открытого множества в X открыт в Y. Теорема Банаха об обратном операторе. [КФ, с. 213] Пусть X, Y — банаховы пространства, Л — непрерывный линейный оператор из X в Y, являющийся эпиморфизмом и КегЛ = 0. Тогда существуют обратный оператор Л-1: У —» X, так же линейный и непрерывный.
§ 5. Элементы функционального анализа 63 Лемма Банаха. {ГТ, с. 109| X — линейное нормированное про- странство, хо € X. Тогда существует линейный непрерывный функционал х' € X" такой, что ||г’|| - 1, {х*,х0} = ||г0||. Лемма Банаха является следствием из известной теоремы Хана- Банаха о продолжении линейного функционала. Лемма о правом обратном отображении. Пусть X,Y — банаховы пространства, Л — непрерывный линейный оператор из X в Y, являющийся эпиморфизмом. Тогда существуют отображение М: Y —> X (вообще говоря, разрывное и нелинейное) и константа С > 0 такие, что X°M = IY, HMj/ll С|Ы| Vj/GK Доказательство. Обозначим Вх: = {г £ X | ||х|| < 1} — открытый шар в X радиуса 1. По теореме Банаха об открытости образ открытого множества АВХ содержит открытый шар 6BY: = {у € Y | ||у|| < й}, т.е. для любого у G 6BY найдется х(у) такой, что Ах(у) ~ у, ||я:(г/)|| < 1. / бу \ 2||т/|| Обозначим Му: — □:( . Тогда из определения М имеем: V2||j/||/ 6 . ( 6У « 6У 2||у|| 2 Ло4,’=л(Ч2ы)— ) = ЭД|~Г = У' ||М9||<«1М- Лемма о замкнутости образа. Пусть X, Y, Z — банаховы про- странства, Л: X —» Y, В: X —» Z — линейные непрерывные операторы, подпространство Im А замкнуто в Y, подпространство ВКегЛ замкнуто в Z, С: X —» Y х Z, Сх: = (Ах,Вх). Тогда С — линейный непрерывный оператор и подпространство Im С замкнуто в Y х Z. Доказательство. Очевидно, что оператор С линеен и непрерывен. Докажем замкнутость его образа. Замкнутое подпространство Y = Im Л банахового пространства Y — банахово и по определению Л: X —> Y — эпиморфизм. _По лемме о правом обратном отображении существуют оператор М: Y —> X и константа К > 0 такие, что ЛоМ = 1?, ||МУ|| < А'Пг/П VyEY. Пусть (y,z) е Im С принадлежит замыканию образа операто- ра С. Это означает, что найдется последовательность {гп}п^1 та- кая, что у=НтЛа^ G Y, z=limBa:n. Положим h„: = М(Лж„- у), zn'.=B(xn — hn). Тогда по свойству оператора М, получим: НМ = ||М(Лжп - у)|| А7|| Лж„ - г/|| -» О,
64 Глава 1. Экстремальные задачи А(хп - Лп) = Ахп - А(М(Ахп - у)) = Ахп - (Ахп - у) = у. Поэтому, Bhn —♦ 0 и limzn = lim _B(xn - hn) = = z, t.e. z принадлежит замыканию множества £ = {£ = Bx | Ах = у}. Это множество, как легко видеть, является сдвигом подпространства ВКегА, следовательно, замкнуто. Итак, z € Е = 52. Это означает, что существует х G Х-. Ах = у, Bx = z, т. е. (y,z) G Im С. Лемма об аннуляторе ядра регулярного оператора. Пусть X, У — банаховы пространства, А: X —> Y — линейный непрерывный эпиморфизм. Тогда (КегА)1 — 1m А'. Доказательство. А) Докажем, что ImA* С (Кет А)1. Возьмем х* 6 Im А* <=> х* = А*у*. Тогда (х*,х) = {А*у*,х) = {у*, Ах) =0 V х € КегА. Значит, х* G (КегА)1, т.е. ImA* С (КегА)-1-. В) Докажем, что (КегА)1 С 1mA*. Возьмем х* € (КегА)1, т.е. {х’,х) = 0 V х Е КегА. Применим лемму о замкнутости образа для пространств X, Y, Z = R и отображений А, Вх: = {х*,х). Усло- вия леммы выполняются: подпространство ImA — Y замкнуто в У, подпространство ВКегА = (ж*, КегА) = 0 замкнуто в Z — R. По лем- ме о замкнутости образа подпространство Im С = Im (А,ж*) замкнуто вУх7=УхД. Подпространство Im (А, я:*) является собственным, так как точка (0,1) £ Im (А, а:*) (если Ах = 0, то (х*,х) = 0 # 1). По лемме о нетривиальное™ аннулятора замкнутого собственного подпространства существует ненулевой линейный непрерывный функ- ционал (у*,Х) € (in^A,®*))-1 G (У х R)* = У* х R такой, что ((У*) Л), (Ах, (х*,х))} = 0 <=> {у*, Ах) + Х(х*,х) = 0 <=> (А*у*, х) + Х{х*, х) = 0 <=> (А*у* + Хх*, х) = 0 V х Е X. Но А # 0 (ибо иначе {у*, Ах) = 0 V х Е X А^> ¥ у* = 0 — противоречие). Тогда х* = A*(-j-) € ImA*, т.е. (КегА)1 С ImA*. Теорема об обратном отображении. Пусть X,Z — банаховы про- странства, F: X —» Z, F(x) = z. Если F Е SD(x) и F'(x) является эпиморфизмом, то существуют обратное отображение F~x: W С Z —» X некоторой окрестности W точки z и константа К > 0 такие, что F~'(z) = х и F(F~'(z))=z, ||F-i(z) -F-i(z)||. KHz - z|| VzEW.
§ 5. Элементы функционального анализа 65 Теорема Люстерника. Пусть X,Z — банаховы пространства, р- х —» Z, F € SD(x), F'(x) является эпиморфизмом. Тогда сущест- вуют отображение U С X —> X некоторой окрестности U точки £ и число К > 0 такие, что F(x + <p(x)) = F(x), ^(я)|| tf||F(z)-F(£)|| V х € U. Доказательство этой теоремы основано на модифицированном ме- тоде Ньютона. А) Не ограничивая общности, считаем, что £ = 0 и F(£) = 0. По лемме о правом обратном операторе для оператора F'(£): X ™ Z существуют отображение М: Z —» X и константа С > 1 такие, что F'(x) °М = 12, ||Mz|| C||z|| V z е Z. F € S £>(£), поэтому для £ = существует 6 > 0 такое, что ||F(x) - F(x") - F'(x)(x - аг")|| < ||as' - г"|| (1) при Цх'11 < б, ||а:"|| < б. Отображение F G SD(x), поэтому F непрерывно в некоторой окрестности нуля. Выберем 6' столь малым, чтобы ||х|| + C'||F(a:)|| < | при ||х|| < б1. Положим для х € U: =В(0,б') 6>+l: =£.-M(F(6.)), п^О, £0 = х. (2) В) Докажем по индукции, что ||6»П < б V п 0. Очевидно, что llfoll = ||а:|| < При п = 1 из (2) получаем оценку ||6 - z|| = ||MF(a:)j| ^С||Г(Ж)||, (3) откуда ||61| < f. Пусть ||61| < б при » = 0,1,... ,к (к 1). Выведем отсюда, что П6+1Н < б. Для i = 0,1,..., к из (2) имеем -&)+*(&) = о, (4) откуда !И<+| - 611 = ||мг(б)|| < с||г(б)|| = = СНЛ6) - Л6-1) - И*)(6 - 6-1)11 (i* 1116 - 6-111 => (5) 116+1 -611 ^116 -®||?^C||F(a:)|| < 6--^v i^l,...,k. (5') 3 Зак. 6(1
66 Глава 1. Экстремальные задачи Отсюда в силу неравенства треугольника получаем II6+1II = 116+1 ~6 +6 -6-1 +••• +6 ~6 +611 < < 116+1 - 611 + 116 - 6-1II + • + 116 - 611 + 116II < 6/1 I 1\ 6 < — I ТГ + тт г + •.. + ~ I + ~ < 6. 2 \2* 2*-‘ 2/ 2 Таким образом, мы получили, что ||6+ill < 6, откуда по индукции следует, что ||6Н < i Vn^O. С) Из неравенств (5), (5') следует, что 116+m — 611 — 116+т ~ 6+m-l + 6+m-l ~ 6+т-2 + • . • + 6+1 - 611 Пб+т — 6+т- 1II + Цб+т-1 ~ 6+т-2|| + • + Н6+1 ~ 611 116+1 - 611 + • + Q < 2Ц6+1 - 611 2,-”||6 - ®Н-» о при П-+ОО, т. е. {6}п>о — фундаментальная последовательность и, значит, она сходится в силу банаховости X. Обозначим <р(х) = lim £п — х. Поскольку п—»оо 116 - *11 — 116 - 6-1 + 6-1 — 6-2 + • • + 6 — 6 + 6 ~ *11 $ 116 ~ 6-1II + 116-1 ~ 6-211 + • • + 116 ~ 611 + 116 _ *11 (S') , ( 1 1 \ < 116 ~ *11 + 2^2 + ' ‘' + 2116 - ®П, то (3) |И*)|| 2||6 - *11 2C||F(x)|| = K||F(a:)|| II* + V’C*)!! 11*11 + |М*)|| 11*11 + 2С||Г(г)|| < <5. F € SD(£), поэтому F непрерывно в некоторой окрестности £ = 0, и, значит, что F непрерывно в точке х + <р(х) и поэтому из (4) F(x 4- y>(z)) = lim F(£n) = - lim F'^ta+i - 6) = 0 = F(£). n-»oo n-»oo
§ 5. Элементы функционального анализа 67 Пусть X — нормированное пространство, М — некоторое его подмножество. Элемент h € М называется односторонним касательным (полукасательным) вектором к множеству М в точке £ € X, если существуют е > 0 и отображение г: [0, г] —» X, такие, что a) £ + th + r(t) € Af V t € [0, е] ; b) ||г(ОН = °(0 п₽и 4 +°- Вектор h называется касательным к множеству М в точке £, если векторы h и —Л являются односторонними касательными векторами к М в х. Множество всех касательных векторов к М в точке i обо- значается TfM, множество односторонних касательных векторов Т? М. Очевидно, что TtM и Т*М — конусы. Если множество TtM является подпространством в X, то оно называется касательным пространством к множеству М в точке £. Во многих случаях, в том числе и представляющих значительный интерес для теории экстремальных задач, множество касательных век- торов может быть найдено при помощи такого следствия из теоремы Люстерника. Теорема (о касательном пространстве). Пусть X,Z — банаховы про- странства, F: X —► Z, F б SD(£), F'(£) — эпиморфизм, М — {г € X | F(x) — F(£)}. Тогда TtM = KerF'(i). Доказательство. А) Пусть h € TtM, тогда существуют е > 0 и отображение г: [-е, е] —» X, такие, что £ + t/i + r(t) б М V t 6 [-е, е], ||г(£)|| — o(t) при t —» 0. При малых t F(£) = F(£ + th + r(t)) = F(£) + + o(t). Отсюда tF'(x)[/i] + o(t) = 0 и, значит, F'(£)[M = 0, т.е. h € KerF'(z) => T±M C KerF'(f). В) Пусть h £ KerF'(i). Положим r(t) = <p(£ + th), где <p — отображение, построенное в теореме Люстерника. Тогда F(x + th + r(t)) = F<£ +th+ <р(£ + th)) = F(£) <=> £ + th + r(t) б M, H)|| =|М* + <Л)|| ^K\\F(x + th)~F(x)\\ = = ЛГ||«^(*)[Л] + o(t)|| = K||o(0|| - o(t), t. e. he TtM => KerF'(i) C TtM. 3*
68 Глава 1. Экстремальные задачи 5.5. Задачи Найти производные Фреше следующих отображений. В задачах 5.1—5.6: Н — гильбертово пространство. 5.1. /: Я —> R, f(x) = (а,х), аСН. 5.2. ft Н R, /(ж) = (х,х). 5.3. /: Я -+ R, f(x) = ||а;|| = у/(х,х). 5.4. f(x) = (x,x)№. 5.5. fi Н-^Н, f(x) = х||х|| 5.6. /: Я \ {0} —»Я, f(x) = IM 5.7. ft R2 —» R2, f(xj,xi) = (xtx2,xj + ж2)) ® = (b2)- 5.8. ft C([0, 1])—>R, f(x{ )) = Jx3(t)dt. о /1 V 5.9. f l c([o,1I)- R, 7M ))= . \° / /1 v 5.10. ft C([0, 1]) - R, f(x()) = fx2(t)dt . \° / 5.11. ft C([0, 1]) - R, /(x(-)) = x(0). 5.12. ft C([0, 1]) R, f(x(-)) = x(0)x(l). 5.13. f t C([0, 1]) - СЦ0, lj), /(ж(-)) - x(-Ml). 5.14. f t C([0, 1]) -> R, /(ж( )) = sinx(0). 5.15. f t C([0, 1]) —> R, /(»(•))= sin a;(0) cosx(l). 5.16. f t C([0, 1 J) —> R, /(x(.)) = ®(1)^°> (&(t) > О V 0 < t 1). 5.17. f t C([0, 1])^ R, f(x()) =(sinf(0))cosf(1). В задачах 5.18-5.20 указать точки, где функции ft R" —> R не диф- ференцируемы по Фреше. / п \ 1/2 5.18. f(x) = ( xj I \>= i / 5.19. /(«) — max |а;>|. 5.20. f(x) = 22I
§ 6. Гладкая задача без ограничений 69 § 6. Гладкая задача без ограничений В этом параграфе даются необходимые и достаточные условия экстремума фуйкционалов в нормированных пространствах. 6.1. Постановка задачи Пусть /: X —» R — Отображение линейного нормированного про- странства X во множество действительных чисел (в Этом случае обычно говорим функционал на пространстве X), обладающее некоторой глад- костью,. т. е. определенными свойствами дифференцируемости. Гладкой задачей без ограничений называется задача об отыскании экстремумов этого функционала: /(ж) -»extr. 62. Необходимые условия I порядка Теорема 1 (аналог теоремы Ферма в нормированных пространствах). Пусть & € locextr f — точка локального экстремума функционала f и функционал f дифференцируем по Фреше (имеет вариацию по Лагранжу) в точке х. Тогда /'(«) = О (6/(f,ft) = 0 vftex) Доказательство. Возьмем произвольный, но фиксированный эле- мент h G X. Рассмотрим функцию <р(А) - f(x + Aft). Поскольку £ е locextr/, то 0 6 locextr<р — локальный экстремум функции <р. По теореме Ферма для функций одной переменной <^'л(0) = 0. По опре- делению вариации по Лагранжу это эквивалентно тому, что 6f(£,h) = 0. В силу произвольности h 6f(x,h) = 0 V h € X. Если функционал / дифференцируем по Фреше в точке х, то в этой точке он имеет вариацию по Лагранжу и /'(a){ft] =6f(£,h.). П оскольку из уже доказанного следует, что эта вариация б)(£.) =0. то и /'(£) =0 в силу определения дифференцируемости по Фреше. 63. Необходимые и достатсниые условия II порядка Теорема 2. Пусть функционал f € П2(х) дважды дифференцируем в точке х. Необходимые условия экстремума: если £ € locmin (max)/, то f'(£) = 0, f"(£)[h, ft] is 0 (f(£)[h, ft] 0) V ft € X. Достаточные условия экстремума: если /'(£) —0 и f"(x}{h,h\^a\\h\\2 (/"(ж)[А,Л]<-а||Л||2) VfteX (*) при некотором а > 0, то £ € locmin (max) /.
70 Глава 1. Экстремальные задачи Доказательство. По формуле Тейлора f(£ + h) = f(x) + f'(£)[h] 4- |/"(*)[M1 + г(Л), г(Л) = о(||Л||2). Докажем теорему для случая минимума. Случай максимума аналогичен. Необходимость. Поскольку х € locmin/, то во-первых по теореме Ферма f'(i) — 0, во-вторых f(x + АЛ) — /(х) 0 при достаточно малых А. Поэтому в силу формулы Тейлора /(А + АЛ) - /(4) = —/"(4)[Л, Л] +г(АЛ) > 0 (г(АЛ) = о(|А|2)) при малых А. Разделим обе части последнего неравенства на А2 и устре- г(АЛ) —-т----> 0, то отсюда мим А к нулю. Поскольку /”(4)[Л, Л]^0 улет. Достаточность. Так как f'(x) = 0, то по формуле Тейлора в силу заданного условия /"(4)[Л, Л] а||Л||2 имеем: /(£ + Л) - /(4) - 1 /"(4)[Л, Л] + г(Л) > | ||Л||2 + т(Л) 0 при достаточно малых Л, так как т(Л) = о(||Л||2). Следовательно, £ G locmin/. Условие (*) называется условием строгой положительности (отрица- тельности) второй производной Фреше функционала /. Отметим, что в конечномерных пространствах условие положитель- ной определенности симметричной матрицы А гарантирует строгую положительность матрицы А (и, значит, является достаточным условием минимума в стационарной точке). В бесконечномерных пространствах это не так. 0° 2 Пример. Пусть /: 12 —» R, /(х) = 52 _ хп)- Тогда точка 4 = 0 П=1 является стационарной (/'(0) = 0), а второй дифференциал / в нуле — положительно определенным 00 h2 /"(О)[Л,Л] = 2^2^ >0 УЛ#0. п=1 п Но вместе с тем 0 locmin /, поскольку на последовательности векторов xn = ^, п = 1,2,... (е„ — n-й базисный вектор пространства 12), /(хп) = < 0 = /(0) при п > 1, а сама последовательность { } -» 0 в пространстве 12 при п —> +оо.
§ 7. Гладкая задача с равенствами 71 § 7. Сладкая задача с равенствами 7.1. Постановка задачи Пусть X, Y — линейные нормированные пространства. Функционал у: X —» R и отображение F: X —» Y обладают определенной глад- костью. Гладкой экстремальной задачей с ограничениями типа равенств р нормированных пространствах называется следующая задача: f(x) —> extr; F(x) = 0. (Р) Отметим, что отображение типа равенства в бесконечномерных пространствах может содержать в себе как конечное, так и бесконечное доело равенств. 7.2. Необходимые условия I порядка Теорема (правило множителей Лагранжа). Пусть £ е locextrР — точка локального экстремума в задаче (Р), X, Y — банаховы пространства (условие банаховости), функционал f и отображение F е SD(£) — строго дифференцируемы в точке £ (условие гладкости), lmF'(£) — замкнутое подпространство в Y (ослабленное условие регулярности). Тогда существуют множители Лагранжа Ао € R и функционал у* € У* не равные одновременно нулю, (Ао,?/*) / 0, и такие, что для функции Лагранжа задачи (Р) Л(х) = А0/(а:) + (y*,F(x)) выполняется условие стационарности: Л'(£) = 0 (^Ao(/'(x),h) + (/,p'(4)[ft])=OV (Ao/'(f) + (F'(£)) V,Л) = 0 V heX^Xof'(£)+ (Р'(£))*у* = о). Замечание. Если в условиях теоремы выполнено условие регулярности отображения F в точке х, т.е. ImF'(f) = У, то множитель Ао / 0, и, следовательно, можем считать его равным единице: Ао = 1. Действительно, если Ао = 0, то у* 0 в силу того, что множители Ла- <Ьанжа одновременно в ноль не обращаются. Поэтому условие стационар- Ности приобретает вид: (у*, F'(f)[A]) — OVA € X о (y*,Y) = 0 <=> у* = 0. Получили противоречие.
72 Глава 1. Экстремальные задачи Доказательство. Определим отображение Л*): = (/(*) - /(f), F(x)), Р: X - R х Y. Очевидно, что отображение J" G SD(x) и производная Фреше Р'(ж) = (/'(f), F'(x)): X -> R х Y. Возможно одно из двух: образ lm.P'(f) совпадает или не совпадает со всем пространством R х У. А) Вырожденный случай: Im/‘'(я) # КхУ. К отображению F'(x) применим лемму о замкнутости образа. Образ Imf'(f) замкнут по усло- вию, образ f (KerF1 (ж)) есть либо 0, либо R, т.е. замкнутое подмно- жество в R. Значит, по этой лемме образ ImP^f) замкнут в R х У. Так как он не совпадает с R х У, то ImP'(f) — собственное замкнутое подпространство. По лемме о нетривиальности аннулятора существуют число Ао и функционал у* G У*, не равные нулю одновременно и такие, что, (Ао, у*) € (lm77'(f))±. Значит, ((А0,з/*), ImP*(f)) = О <=> ((Ао,y*),F'(*)[ft]> = 0 V h G X <=> ((Ш((/Ш),ЛФ1))=0 VftGX 4=> <A0/'(x), h) + (y*, F'(£ )[Л] > = 0 У hex. А это и есть условие стационарности. В) Невырожденный случай: ImF'(x) = Rxy. По теореме об обратном отображении существуют отображение Р-1: W С R х У —> X некоторой окрестности W точки (d, у) ((d, у) = (0,0)) и константа К > 0 такие, что F~1 (d, у) = х, F(F~'(a,y))=(a,y), || F~'(a,y)-P-I(d,y)|| A'lKa.j/) - (d,y)|| <=> ^||(«,!/)|| V (a,y)eW. Положим х(е) = У-|(б, 0) для достаточно малого по модулю е. Тогда = (е,0) <=> /(«(s')) - f(x) =е, F(x(e)) = 0, 11*00 - *|| = ||Л-'(е, 0) - f || < ЛГ||(е,0)|| = К|е|. Из этих соотношений следует, что вектор х не доставляет в задаче экстремума, ибо вблизи его существуют допустимые векторы х(е), на ко- торых функционал f принимает значения как большие так и меньшие чем /(f). Получили противоречие с тем, что х G locextrP. Таким образом, невырожденный случай невозможен, и тем самым теорема доказана.
§ 7. Гладкая задача с равенствами 73 7.3. Необходимые условия II порядка Теорема. Пусть х € locmin Р — точка локального минимума в зада- че (Р), X, У — банаховы пространства (условие банаховости), функци- онал f и отображение F имеют в точке х вторые производные Фреше (f,F € D2(x)^ (условие гладкости), ImF'(^) — Y (условие регуляр- ности). Тогда существует множитель Лагранжа — функционал у* € У* такой, что для функции Лагранжа с множителем Лагранжа Ао ~ 1 задачи (Р) Л(х) = f(x) + (y,F(x)} выполняются условия стационарности: л'(а) = о (<*/'(*) +(р'(х))У = °) (1) и неотрицательности: Л"(ж)[Л., Л.] 5s 0 V h е KerP'(f). (2) Доказательство. Условие стационарности (1) с множителем Лагран- жа Ао = 1 вытекает из правила множителей Лагранжа для гладкой задачи с равенствами и замечания к нему (см. предыдущий пункт). Возьмем h G KerF'(x). Тогда по теореме о касательном пространстве KerF'(x) = TtM, где М = {ж € X | F(x) = F(x) = О}. Следовательно, h € Tj.M и, значит, существуют е > 0 и отображение г: [-е; е] —> X такие, что Р(ж + th + r(i)) = 0 V t G [—e; e] и ||r(t)|| = o(t) при t —+ 0. Таким образом, x + th + r(t) — допустимый элемент в задаче (Р) при t £ [-е; е] и, так как х € locmin Р, то /(£) < /(£ + th + r(i)). Поэтому по определению функции Л и по формуле Тейлора /(«) /(® + th + r(t)) = Л (ж + th + r(t)) - (y*,F(x -У th + r(£))) = — Л(х) + Л'(х) [th + r(t)] + -Л"(ж) [t/i + r(t), th + r(t)] + o(t2) = = /(«) + yA"(i)[/i,h} + o(t2). Отсюда P yA"(i)[ft,h]+0(t2) >0 при малых t. Разделим обе части последнего неравенства на t2 и устре- мим t к нулю. Получим Л"(4)[Л,Л] 0.
74 Глава 1. Экстремальные задачи 7.4. Достаточные условия II порядка Теорема. Пусть выполняются условия теоремы о необходимых условиях II порядка (банаховость, гладкость, регулярность, стационарность для функции Лагранжа А(г) = /(г) + {y',F(x)} с множителем Ао = 1) и некоторого а > Q выполнятся условие строгой положительности: A"(£)[h, Л] o||h||2 V h € КегГ'(г). Тогда £ € locmin Р — точка локального минимума в задаче (Р). Доказательство. Применяя лемму о правом обратном операторе к отображению F'(£): X —> Y, построим оператор М: Y —> X такой, что F'(x) оМ = 1у, I)Му|| < V у е Y. Возьмем ||h|| < б и £ + h — допустимый элемент в задаче (F(£ + h) = 0). Положим h2 — ЛГ(Р'(г)[Л]) и обозначим hi = h — h2. Тогда F'($)[h.] = F'(£)[h - h2] = F'(£)[h] - F‘{x)M (F'(±)[h]) = F'(f)[h] - F'(®)[h] = 0. Значит, h. £ KerF'(®)- По формуле Тейлора 0 = F(£ + Л) = F(£) + F'($)(h] + |р"(«)[Л, h] + о (||h||2). Отсюда существует б > 0 такое, что ||F/(s)[h]|| < €7|||7г||2 V ||h|| < б. Поэтому )|Л2|| = ||M(F'(f)[h])|| C||F'(^)[h]|| СС^2 < CC,J||A|| = £||Л|| при е = CCt6 и ||h|| - ||Л2|| HAJI = ||h - h2|| ||h|| + ||h2|| <=> (1 - e)||h|| ||h,|| < (1 + e)||h||. Вновь по формуле Тейлора f(£ + h) = Л(£ + h) — Л(х) + Л'(х&)[Л] + -A"(£)[h, h] + o(||h||2) — = f(£)+l-A"(£)[h,h] + o(\\h\\2). Отсюда, обозначая В: = ||Л"(г)||, имеем f(£ + h) - f(£) = A"[h, + h2, hi + h2] + о(||h||2) = = |(A"[h1,h1] + 2A"[hl,h2]+A"[h2,h2]) +o(||h||2) > |(a||h,||2 - 2BHh.ll ||h2|| - B||h2||2) + 0(||h||2) ^||h||2(«(l -e)2-2B(\ +£)£ —Be2) + o(||h||2) ^0 при достаточно малых e > 0 (при e = 0 множитель в круглых скобках равен a > 0). Из последнего соотношения следует, что £ € locminР.
§ 8. Гладкая задача с равенствами и неравенствами 75 § 8. Гладкая задача с равенствами и неравенствами 8.1. Постановка задачи Пусть X,Y — линейные нормированные пространства. Отображение F: X —► Y, функционалы //. X —> R, t - 0,1,..., т, обладают некоторой гладкостью. Гладкой экстремальной задачей с ограничениями типа равенств и неравенств в нормированных пространствах называется следующая задача: /о(ж) —» min; fi(x) < 0, i = F(x) — 0. (Р) 8.2. Необходимые условия I порядка Теорема (правило множителей Лагранжа). Пусть & € locmin Р — точка локального минимума в задаче (Р), Х,У — банаховы пространства (условие банаховости), отображения F,ft G SD(£), i = — строго дифференцируемы в точке £ (условие гладкости), ImF'(A) — замкнутое подпространство в Y (ослабленное условие регулярности). Тогда существуют множители Лагранжа — вектор А — (Ао, А,,..., Ат) € Rm+I и функционал у* € Y* не равные одновременно нулю, (Х,у*) / 0, и такие, что для функции Лагранжа задачи (Р) ГЛ л(®) = 52 »=0 выполняются условия: а) стационарности: Л'(£) = 0 т т (*>52 А> Л'(®)[Л] + У, ^(^)[Л]> - о V h € X ^>52 А,•//(£) + (F'(*)) ’/= о); 1=0 i=0 Ь) дополняющей нежесткости: = 0, t=l,...,m; с) неотрицательности: А, > 0, * = 0,1,... ,т.
76 Глава 1. Экстремальные задачи Доказательство. Можно считать, что fo(£) = 0, иначе рассмотрим функцию fo(x) = fa(x) - f0(x). Если /,(х) # 0 при 1 i < т, то отбросим эти ограничения, поскольку для локального экстремума огра- ничения fi(x) < 0 несущественны и полагаем А, = 0. Таким образом, можно считать, что условия дополняющей нежесткости уже выполнены. А) Вырожденный случай. ImF'(i) / Y. Тогда ImF'(i) есть замкнутое собственное подпространство У. По лемме о нетривиальное™ аннулято- ра существует ненулевой функционал у* € (1тР'(®))Х С У* такой, что (/Л) = 0 V у е ImF'(х) о </, Р'(ш)[А|) = 0 V h ё X О (Р'(х)Уу" = 0. Остается положить А, = 0, i ~ 0,и приходим к утверждению теоремы. В) Невырожденный случай. 1тЕ,/(^) = ¥ > т. е. оператор F'(x) ото- бражает пространство X на все У. Положим для 0 < к < т Ак = {h | (//(4), А) < О, г - к, к + 1,... ,т, F'(x)[А] = 0}. Очевидно, что 40 С С ... С Ат. Лемма 1 (основная). Ао — пустое множество. Доказательство. Предположим противное, т.е. Ао 0. То- гда существует вектор А 6 КегР'(А), для которого (/'(£),А) < 0, i — 0, I,..., т. По теореме о касательном пространстве КегР'(ж) = Tj,M, где М=[х€Х\ F(x) — F(x) = О}. Значит, существует отображение т: [—е, е] —> X (е > 0) такое, что ||т(<)|| = °(0> х + th + r(t) ё М F(x + th + r(t)) — 0 V t ё {-с, е]. (I) При малых t > 0 имеем неравенства fi(x + th + r(ty — fi(x) +t(f'i(x), fi) + o(t) < 0, i = 0,1,..., m. (1,) Соотношения (1) и (1,), i — 1,..., m, означают, что при малых t > 0 элемент x + th +r(t) допустимый в задаче (F). Но при этом неравенство (1о) при малых t > 0 противоречит тому, что х ё locmin Р. С) Лемма 2. Если Ат есть пустое множество, то для задачи (Р) верен принцип Лагранжа. Доказательство. Поскольку Ат = {А | (/^(г),А) < 0, Р'(г)[А] - 0} = 0, то (/„(£), А) = 0 V А ё KerF'(^), т-е- fm(x) ё (КегР'(2))\ Так как по лемме об аннуляторе ядра регулярного опе- ратора (КегР’(^))Г — то € 1т(Р'(ж))’ и, значит, существует у* 6 У’, для которого fm(x) + (F'(x)) у* — 0. Получили условие стационарности функции Лагранжа А(х) с Ао = • • • = А,,, । — 0, Am — 1. .
§8. Етадкая задача с равенствами и неравенствами 77 Таким образом, из пп. В) и С) вытекает, что либо принцип Лагранжа уже обоснован (Ат = 0), либо ЗА:, 0 С к < т: А* = 0, Л*+| 0 (2) D) Лемма 3. Если выполнены соотношения (2), то h - 0 является решением следующей задачи: (f'k(x), h) —» min; 0, t = F'(£)[k] = 0. (P) Доказательство. Предположим, что утверждение леммы неверно. Тогда найдется такой элемент rj, что (/£(£), г?) < 0, у) 0, i = А: + 1,..., тп, F'(x)[т?| = 0. Пусть £ — элемент, принадлежащий Ак+1, т.е- (fi(^)>0 < 0, г = А: + 1,... ,т, Р'(£)И] = 0- Тогда при малом t > 0 элемент т] +принадлежит Л* в противоречии с (2). Е) Завершение доказательства. Применим к задаче (Р) теорему Куна—Таккера, учтя при этом, что условие Слейтера для этой задачи выполнено (из-за непустоты Лк+|). По этой теореме найдутся неотри- цательные числа Хк = 1, A*+i, - • ,Хт, такие, что выполняются условия дополняющей нежесткости Х,/,(£) = 0, г = к + 1,... ,т, и для функции т А Лагранжа задачи (Р) А(Л) = 52'M//(®)i*) в точке h = 0 выполнен i=k - принцип минимума: rninh€^erj?,(f) Л(Л) = Л(Л) = 0 <=> Л(Л) = ]ГА,-{/!(£), Аг) > Л(Л) = Ai(/'(±),0) =0 V h б КегР'(2). t=fc i—fc m Из последнего соотношения вытекает, что Л(Л) = 52 А,(/,'(ж), Аг) = 0 для 1=4 т J- любого h б КегР'(®)>т-е- 52^>Д'(^) е (КегР'(4)) . Поскольку по лемме 1=4 об аннуляторе ядра регулярного оператора (КегР'(г)) = Im (Р'(®)) , то существует у' Е Y*, для которого т J2a</'(i) + (P'(4))V=0. i=4 Это и есть условие стационарности функции Лагранжа А(а:), если положить Ао = ... = А*— 1 =0. Замечание. Из доказательства теоремы следует, что если ImF'(£) = Y и существует элемент h б КегР'(г), для которого (/•(£),h.) < 0, i=l,...,m, Ф>4|#0 (назовем это условие аналогом условия Слейте- ра), то Ао 0 и, следовательно, можем полагать Ао = 1. Приведем еще одно доказательство правила множителей Лагранжа с использованием элементов выпуклого анализа.
78 Глава 1. Экстремальные задачи Доказательство. Как и в предыдущем случае, не ограничивая общности, считаем, что /,(£) = 0, t = 0,1,...,т. Будем рассматривать основной невырожденный случай: ImF'(f) = Y. Рассмотрим задачу без ограничений p(h): = max (/,'(£), ft) + 6KerF/(4)(ft) —> min, i=0,l,...,m где 6A( ) — индикаторная функция выпуклого множества А. Лемма. Вектор h = 0 доставляет абсолютный минимум функции <р (h = 0 Е absmin у?). Доказательство. Доказательство леммы проведем от противного. Предположим, что 0 £ absmin <р. Тогда SabSmin < 0- Следовательно, существует вектор h Е КегР'(г), для которого max (/•(£), ft) <0tt> (/,'(£), ft) <0, i = 0,... ,m. Поскольку ImF'(f) = Y, то по теореме о касательном пространстве h Е KerF'(x) = Т±М, где М = {х | F(x) = F(£) = О}. Тогда по определению касательного вектора существует отображение г: [-е, с] —» X такое, что F(£ + th + r(t)) = 0 V t E [-e, e], ||r(i)|| = o(t). Поэтому fi(& + th + r(t)) = /,(£) + (f[(£),th + r(t)) + o(||ift + r(i)||) = <(//(£), ft) + o(t) < 0 при малых t > 0, i = 0,1,... ,m. Таким образом, вектор £ + th + r(t) является допустимым элементом в задаче (Р), но при этом f0(£ + th + r(t)) < 0 = fo(£). Получаем противоречие с тем, что £ Е locmin Р. Вектор h = 0 доставляет абсолютный минимум выпуклой функции <р, следовательно, по аналогу теоремы Ферма для минимума выпуклой функции 0 Е d<p(h). По теореме Моро—Рокафеллара субдифференциал суммы функций равен сумме субдифференциалов, значит, 0 Е д<р() = д max {/{(£), ) + dSKerF'(£)(). i=0J По теореме Дубовицкого—Милютина субдифференциал максимума фун- кций равен выпуклой оболочке субдифференциалов, следовательно, д max (/'(*), ) = conv {fo(x),..., f'm (£)}. По определению субдиф- ференциала функции d6KerF'(x)(0) = {ft’eX* | (Л’, Л) 6КегF'(£)(h) - <5KerF’(x)(0) V h Е Х} {л« । (Л«>Л) 6KerF'(£)(h) V ft} = (КегР'(£))Л = lm(P(x))* (по лемме об аннуляторе ядра регулярного оператора). Таким образом, 0 € conv {fo(£),..., + Im (F'(x))*. rn Значит, существует вектор А € Rm+1 такой, что ^А, = 1, А» 0, »=о m и функционал у* € К*, для которых А(/Дх) + (F'(^)) 2/* = 0. i=0
§ 8. Гладкая задача с равенствами н неравенствами 79 8.3. Необходимые условия П порядка Теорема. Пусть х е locmin Р — точка локального минимума в зада- че (Р), Х,У — банаховы пространства (условие банаховости), функци- оналы fi, t = 0,1,...,т, и отображение F — дважды дифференциру- емы по Фреше в некоторой окрестности точки х (условие гладкости), ImF'(x) = У (условие регулярности). Тогда max Лхх(£, A,y*)[h, Л] О V Л 6 К, (А,у')€Л где К(х, Х,у*) - 52 + (у‘, Л®)) > 1=0 К. = {he X I (f'($),h) s;o, t = F'(i)(h| = 0} — конус допустимых вариаций, a Л: = { (X,y*) e Rm+I x Y* m £ A,/'(£)+(p'(f))V=0; i-0 Xifi(x) = 0, i ,m; X, 0, i = 0,1,..., m, ^~2 Aj = 1 > 0. i=0 J Множество Л — совокупность наборов (А,у*), для которых выполнены условия а)-с) правила множителей Лагранжа для задач с равенствами тп и неравенствами и 52 А,- = 1. 1=0 Доказательство этой теоремы см. [ГТ, с. 124]. 8.4. Достаточные условия II порядка Теорема. Пусть выполняются условия теоремы о необходимых условиях второго порядка (банаховость, гладкость, регулярность), множество Л 0 и для некоторого а > 0 выполняется условие строгой положительности-. max Л„(х, А, у*)[h, h] a||h||2 (А,К’)€Л для любого Л, принадлежащего конусу допустимых вариаций К. Тогда £ е locmin Р — точка локального минимума в задаче (Р). Доказательство этой теоремы см. [ГТ, с. 136].
80 Глава 1. Экстремальные задачи Ответы к задачам главы 1 1.1. (5,2) € locmin, Smjn - -оо, Smax = +оо. 1.2. (2,3) G locextr, Smm — оо, +оо. 1.3. (-4,14) G absmin, 5mjn - -52, Smax = +oo.- / 2 1 x 4 1.4. Ij G absmin, Smin = --, Smax = +oo. 15. -1, i locextr, Smin = -OO, Smax = +00. 1.6. (1,1) G locmin, (0,0) £ locextr, Smjn = -oo, Smax = +oo. 1.7. (1,1) G locmax, (0,0), (0, 3), (3,0) £ locextr, Smin = -oo, Smax = +oo. 1.8. (0,0) £ locextr, Smin = 700, Smax = +00. 1.9. f ± i ±1^ G absmin, Smin = -1 -, (0,0) G locmax , v 2 / 8 (± -,0^,(0, ±1) i locextr, Smax = +00. ( ±1 ±1 \ / ±1 +1 x 1.10. (—==,—==) G locmin, I—=,—=) G locmax, Vx/2e x/2e' (±l,0),(0, ±1) £ locextr, Smin = -OO, Smax = +OO. 1.11. (2,3) G locmax, (0,2:2) € locmax при 2:2 G (-00; 0) U (6, +00), (0,2:2) G locmin при 0 < 2:2 < 6, (0,0), (0,6), (2:1,0) £ locextr, Smin — —OO, Smax — +OO. 1.12. (0,0) G absmin, Smin = 0, locextr, Smax =+°o. 1.13. (1, -2) £ locextr, Smin — “OO, «Smax = + 0O. 1.14. (1,1,1) G locmax, (2:1,0,2:3), (:C|, 2:2,0) locextr, Smin — OO, Smax “ +OO. , 1 8 1.15. t - - G absmin, Smin = 77- 3 45 1.16. у G absmin, Smin = yy- 1.17. (-3 - x/6, -3 - <Л) G absmin, Smin = -4 - 2х/б, (-3 + ч/б,-3+-У6) G absmax, Smax = _4 + 2\/б. / 3 4 x 1 21 ( 77, 77 ) € absmin , Smin = 77, Smax = +ОО. К ^«3 fc» J ' / 1 1 \ 1 2.2. \ 2 * 2 / absmax, Smax = e 4 />mjn —0-
Ответы к задачам главы 1 81 2.4. (2,-3),(-2,3)Gabsmin, 5min =-50, (j’4)’(-|’-4)eabSniaX’ Sma«=I06^- /1 1 lx 1 2.5. Gabsmin, Smin = -, Smax = +oo. ( 1 2 3 x „ 2.6. ( -7=, —=, —) € absmax, 5max = v 14, \/14 /14 /14' ( 1 2 3 x r- ---7=,--7=,----) €absmin , Smin = -V14. V /14 /14 /14' 2.7. 2.8. 3 3 lx 11 о ’ о » ~л / absmin, 5т,п — ——, Smax 8 8 4/ 32 33 229 x 1071 2 >98J Gabsmin, Smjn— ~ , Smax 2.10. (-1,1,1)6absmin, Smjn = 0, (1,1,1)Gabsmax, Smax = 2. _ / 18 24 x r ( 12 16 x 2.12. (^0,Gabsmax, 5max = 36, ^0,Gabsmin, Smjn = 16. 2.13. (5» з»2) G (t,0,1 — t) G locmin при t G (0,1), (t,O,l — t)Glocmax при ZG(—oo,0)U(1,+oo), (0,0,1),(1,0,0),(t,l -t,0) £locextr V t, Smax = +oo, 5min = -oo. 2.16. b-(a,x) (a|2 ’ dmin - 1<д,^> — l«(
82 Глава 1. Экстремальные задачи / 1 \ 1/2 2.17. Smjn= IS-&I2--—(а,х-Ь)2 \ 1«12 7 2.18. Стороны прямоугольника: в|У2, а2У2, площадь 2а|й2. . 2a| 2a2 2а3 8 2.19. Стороны параллелипипеда: объем ——0,0.20,3. Уз Уз Уз зУз / 1 1 1 \ „ 1 ( 1 1 1 \ I 7=> Р ) € absmin , Smin = 5=, ( —f, ~р, ~р ), \ Уз Уз Уз/ зУз \Уз Уз Уз' G absmax, = —(i, 0,0), (0, i, 0), (0, 0, t) £ locextr V |i| 3v3 44) Уз Уз' s: 1. 3.2. (О,..., 0) 6 absmin, Smin = 0, (±n '^4,..., ±n '^4) G absmax, 5max — Уй, критические точки (0,..., 0, ±m-1^4,..., ±m-1^4) (и их всевозможные перестановки координат), m=l,...,n. 3.3. (0,..., 0) € absmin, Smin = 0, (±n '^2,...,±n '^2) G absmax, Smax = 1> критические точки (0,... ,0, ±m~'/2,..., ±m-1^2) (и их всевозможные перестановки координат), т = 1,..., п. 3.4. (0,1) € absmin, Smin = е-1, (0,1) € absmax, 5max = е - 1, (0,0) g locextr. 3.5. (0,0) € absmin, Smin =0, (0,1) G absmax, Smax = 1- 3.6. (0,0,0) G absmin, Smin = 0, (12,0,0), (0,12,0), (0,0,12) G absmax, Smax = 144, (4,4,4), (0,6,6), (6,0,6), (6,6,0) — критические точки в задаче на максимум. 3.7. (0,0,0) G absmin, Smin = 0, (0,12,0) G absmax, Smax = 576, /16 16 16\ /48 12 \ / 12 48\ , (t- 7-4 (y T'°)' (°' У y>o,6),(12,0,0),(0,0, I» — критические точки в задаче на максимум. 38 е absmin’ Smin = 15’ (°’7’~И’ \6 6 6/ 12 \ 4 4/ /3 3 1\ / 3 1\ ( о> o’i) £ locextr, (0,Glocmax, 5max =+00. \8 8 4/ V 4 4/ 3.9. (-2,0,9) G absmin, Smin = -23, Smax = +00. 3.10. (-5/2,0,20) G absmin, Smin = -52,5, 5max = +00. 3.11. (16,257,592) locextr, 5min = — 00,' 5max = +00.
Ответы к задачам главы 1 83 3.12. (0,1,0) € absmin, Smin = 0, Smax - +оо. /2 174 24\ 3.13. (j, —,£ locmin Smin = —оо, (1,0,3) € locmax, Smax = +°°, (-1,6,-3) £ locextr. 3.14. (уЪ, 1,1) € absmin, Sm,n = >/б, (vT-vT-a/I) еаьвт“’ 4.1. a^O. 4.2. a 0, b^O. 4.3. 4.4. flu 0, a 22 0, аца22 — a^ 0. 4.7. df(£) = -3, 1-3,-i], -1, 1-1,3], 3, x < 0, x = 0, 0 < x < 1, x = 1, 1 < x. p 1. 4.5. да. 4.6. да. 4.8. df(£) = [0, 1]. 4.9. 5/(*) = [-l, 1]. 4.10. {y = (j/1,...,l/n)e Rn I Ij/I^l}- 411. \y = (3/1,.. ,J/n) € R" max sj 1 I I J=1 4.12. (з/|,...,з/п) € Rn | 52l3/jl S? 1}. j=i 4.13. •[» = (j/i,...,3/n) e Rn | 52 1зоI = 1, Vj^ °, 3 = 1,•••,«}• 7=1 4.14. [0, a]. 4.15. В* = {я* € X* | ||a:*||jr- < 1}- 4.18. (1,-1) e absmin, Smin = 3. 4.19. (-1, —1) e absmin, Smin =-2. 4.20. а? + a\ 1 => (ai,a2) € absmin, Smin = aj + al; 2 2 / Д| i /~7 7 ax 4- a2 > 1 => I . —===== ) e absmin, 5min = 2л/af + - 1. ^ + «4 + 4.21. -< a => -j e absmin, Smin = --. 5.1. /'(4)[h] = (a,fc). 5.2. /'(£)[h] = 2(x,ft). 5.3. /'(*)IM = <^,h) 11*11 '
84 Глава 1. Экстремальные задачи 5.4. /'(х)[Л| = 3<£,Л)||Л||. 5.5. /'(х)[Л] = Л||х|| + ,, , Л {x,h)x 56 f = и " “iiiiF- 5.7. /'(ж)[(Л|э h2)| = (2Л, +Л2,2Л| +4Л2). । 5.8. /(*())[Л()] = 3 J x2(t)h(t)dt. О I I 5.9. /'(МОИМ)] = з( J x(t)dty J h(t)dt. О о I I 5.10. /'(х())[Л(-)] = б(У x2(t)dtj • J £(t)h(t)dt. 5.11. /'(МОИМ)] = МО). 5.12. /'(МОИМИ = МОМ«) + ж(0)Л(1)- 5-13. /'(МОИМИ = МОМО + МОМО- 5.14. /'(МОИМИ = cosx(0)/i(0). 5.15. /'(МОИМИ ~ cosi(0)/i(0) cos±(l) - sin х(0) sinх( 1 )Л( 1). 5.16. /'(МОИМИ = МО*(о)(мо)1пМ1) + МО)^у). 5.17. /'(МОИМИ = (sin MO))C°S*(I) ( cos МО cosa:(eM0) - \ sinx(O) sin МОМО In sin MO)}- 5.18. x = 0. 5.19. {x = (xi,... ,xn) | |xj = |je_,| для некоторых i # j}. 5.20. {x = (xi,... ,xn) | X| x2 •... xn = 0}.
Глава 2 Линейное программирование В линейном программировании изучаются задачи об экстремуме линейной функции нескольких переменных при ограничениях типа равенств и неравенств, задаваемых также линейными функциями. Рождение линейного программирования принято отсчитывать от ра- боты Л. В. Канторовича 1939 года об оптимизации раскроя листов фанеры для самолетов и распределения ограниченных ресурсов в более общих проблемах, где впервые было показано, что многие задачи экономики формализуются как задачи об экстремуме линейной функции при линей- ных ограничениях. Канторойгч для рассмотренного им класса задач ввел двойственные переменные, дал им содержательную экономическую ин- терпретацию и описал алгоритм решения двойственной задачи близкий по духу к симплекс-методу. Через несколько лет (около 1947 года) интерес к подобным задачам возник у американских математиков. Этот интерес был вызван пробле- мами, связанными с экономикой и военно-промышленным комплексом. Из числа экономистов, пропагандировавших среди математиков данный класс задач, следует прежде всего назвать Т. Купманса. Он же ввел термин «линейное программирование» (linear programming). Впослед- ствии Канторовичу и Купмансу была присуждена Нобелевская премия по экономике за 1975 год. Слово «программирование» заимствовано из зарубежной литературы и в данном случае означает не что иное, как «планирование». Симплекс-метод был разработан Д. Данцигом. Общая теория была построена коллективом математиков, среди которых следует отметить так же Куна, Таккера, Гурвица и Дж. фон Неймана. В этой главе рассматриваются постановки задач линейного програм- мирования, правило решения задач в канонической форме по симплекс- методу, приводятся с решениями примеры. Вводится понятие двойствен- ности, проводится обоснование симплекс-метода, дается ряд методов нахождения первоначальной крайней точки. Рассматриваются наиболее известные типы задач линейного программирования — транспортные задачи и задачи о назначении.
86 Глава 2. Линейное программирование § 1. Симплекс-метод 1.1. Постановки задач. Геометрическая интерпретация Задачей линейного программирования в канонической форме называется задача нахождения максимума линейной функции от п переменных х = (г,,... ,хп) f(x) - C}Xt + С2Х2 + ... + С„Хп, удовлетворяющей системе тп линейных неравенств ' а[ж| + а]х2 + ... + а"хп = bt, , a2xt 4- а2х2 + ... + а2хп = Ь2, ‘ “Ь 4“ • • • 4" ОтХп Ьт, и ограничениями неотрицательности х2 О, j — Поскольку уравнения системы можно умножать на —1, то считаем, что 6,- > 0, г = 1,..., т. Одним из важнейших экономических прототипов математичес- кой модели данной задачи является производственная задача. Пусть на предприятии имеются производственные ресурсы т типов в объемах bi,..., bm. Предприятие производит продукцию п типов. На производство единицы продукции j -го типа требуется использовать ресурс каждого i-го типа в объеме а3. Прибыль от реализации единицы продукции j-ro типа равна Cj. Следовательно, при изготовлении х2 единиц продукции каждо- п го типа прибыль предприятия составит величину 22 Надо найти 3=1 план производства (®|,... ,хп) такой, чтобы прибыль предприятия была максимальной. Равенства a]ar, 4- ajx2 + ... 4- а"хп = bi будут означать, что весь ресурс каждого t-ro типа израсходован полностью. В дальнейшем мы, как правило, будем использовать векторно- матричную запись: (с, х) —► max; Ах = Ь, х 0. (Р*) Здесь х = (ж,,... ,хп) G R" — неизвестная переменная, задан- ные вектора с = (ci,...,c„) е R" и Ъ — (Ь|,..., bm) € Rm, (с,х): = n . 22 CjXj — скалярное произведение векторов сиг, А = {а^ }i=i,„,m — 3 = 1 3=1.->» / а[ ... а." \ . / а} \ I ... 1 — заданная матрица со столбцами а3 — I .... I , \ ) \ ] j = 1,..., п, размеров т х п.
§ 1. Симплекс-метод 87 Функция / называется целевой функцией, вектор с — вектором стоимости, вектор Ь — вектором ограничений, матрица А — матрицей условий. Обозначим Sp — численное значение задачи (Р), ArgP — множество решений задачи (Р), т. е. множество допустимых точек х € R", для которых (с,х) — Sp. Задачей линейного программирования в общей форме назовем задачу (с, г)—> min; Ах b. (Р) Иногда задачи линейного программирования рассматриваются приве- денными к нормальной форме (с, х) —> max; Ах Ь, х 0. (Рп) Каноническая форма более удобна при описании алгоритмов ре- шения, задачи в обшей и нормальной формах часто используются при рассмотрении проблем существования решений и двойственности. Двой- ственные задачи для задач в нормальной форме приобретают наиболее симметричный вид. Задачи в различных формах легко сводятся друг к другу путем вве- дения дополнительных координат и изменением матрицы 4. Например, если дана задача в нормальной форме, то ее можно свести к зада- че в канонической форме путем введения дополнительных координат ® — (*Еп+1 > • • • j ®n+m) • (с, х) —> max; Ах + 1х — Ь, х 0, х 0. Здесь I — единичная матрица размеров т х т. В качестве упражнений попробуйте самостоятельно свести другие формы задач линейного программирования друг к другу. Геометрическая интерпретация. Рассмотрим более подробно задачу линейного программирования в канонической форме. Через -D(Pt) будем обозначать множество допустимых точек в задаче (Р*) (£)(Р^): = {х G Rn | 4а: = Ь, х 0}). Множество £>(Р*) является выпуклым многогранником в пространстве R”. Нетрудно видеть, что экстремум линейной функции (если он существует) достигается в крайней (угловой) точке выпуклого многогранника. Напомним, что точка d выпуклого множества D называется крайней (угловой), если не существует точек d|,d2 G D, dt / dj, и числа t € (0, 1) таких, что d = id, + (1 - i)d2. У многогранников крайние точки — вершины. Имеет место следующая Теорема Минковского. Выпуклый компакт в Rn является выпуклой оболочкой своих крайних точек*. * Бесконечномерный аналог этой теоремы: выпуклый компакт в нормированном (и даже локально-выпуклом линейном топологическом) пространстве является выпуклой
88 Глава 2. Линейное программирование Число крайних точек множества D, задаваемого в виде конечно- го числа линейных равенств и неравенств, является конечным. Таким образом, для решения задачи линейного программирования (если оно существует), достаточно перебрать значения функции (с, х) во всех крайних точках множества D. Но нахождение всех этих крайних точек и перебор значений функции (с, х} — операция довольно трудоем- кая. Описываемый ниже симплекс-метод решения задачи линейного программирования позволяет, начиная с некоторой исходной крайней точки, переходить к другой по направлению наибольшего возрастания функции (с, х}. Свое название симплекс-метод получил из-за вида мно- жества допустимых элементов, которое в простейших задачах имеет вид симплексов (отрезка, треугольника и т. д.) Задача (Pt) называется невырожденной, если любая крайняя точка множества Р(Р*) содержит ровно т положительных координат. Пусть х — крайняя точка в невырожденной задаче с положительными координатами (для определенности первыми) xt,... ,хт. Тогда вектор х можно представить в виде х = (хъ,хп), где хь — (xi,... ,хт) — базисный вектор, Xi > 0, г = 1,...,тп, хп = (0,..., 0) G Rn-m — небазисный вектор. Аналогично матрицу А можно представить в виде А = (Аъ, Ап). Будет доказано в п. 3.2, что матрица А/, невырожденная, то есть ее определитель отличен от нуля. 1.2. Правило решения задач по симплекс-методу Для решения невырожденной задачи линейного программирования следует: 1. Привести задачу к задаче в канонической форме (Pt) 2. Отыскать крайнюю точку х = (х,,..., хт,0,..., 0), х, > 0, г= множества допустимых элементов D(Pk). Методы нахо- ждения начальной крайней точки будут описаны ниже в §4. 3. Построить симплексную таблицу для начальной крайней точки х. Пояснения к построению таблицы: В таблице т + 4 строки и п + 4 столбца. В первом столбце, начиная с третьего по т + 2-е место, нахо- дятся базисные векторы аат, соответствующие положительным координатам начальной крайней точки х = (xj, ... ,хт,0,... ,0). Во втором столбце на аналогичных местах стоят значения с; вектора с с теми же номерами, что и столбцы а]. Последний столбец заполняется при исследовании симплексной таблицы. оболочкой своих крайних точек был доказан Крейном и Мильманом. Его называют теоремой Крейна—Мнльмана.
§ 1. Симплекс-метод 89 В первой строке, начиная с четвертого столбца, стоят элементы С], • , Сп * Вторая строка, начиная с третьего столбца, — векторы Ь,а',... ,ап. Под ними — разложения этих векторов по базису а|,...,ат. Яс- т но, что Ь — 52 a'xi & -А-х = t>. То есть разложением вектора Ъ 1=1 является вектор хь ненулевых координат крайней точки х. Предпо- ложим, что вектора a3, j = имеют следующее разложение m по базису а',...,ат: а1 — ^а'х^ <=> а3 = Аьх3 О А = АЬХ, где i=i X = {xij}l=i,...,т — матрица разложений векторов а1,...,а" по базису j=l,...,n аат, состоящая из столбцов ххп. Тогда X — Aj^A, то есть неизвестные векторы-столбцы х3 отыскиваются с помощью обратной матрицы: х3 — А^'а3. Очевидно, что при i = разложения век- торов а’ тривиальны: а' = а*, то есть в этом случае х3 — 1 (е3 — вектор-столбец канонического базиса). \ 0 / В предпоследней строке z в столбце под вектором Ь (хь) запишем zo = (сЪ'Хь). Тогда zq — значение функционала в начальной крайней точке х. Под векторами a3, j = запишем Zj = (сь,х3), то есть z = (z,,...,z„) = cbX. Очевидно, что Zj = Cj при j — 1,... ,m. В последней строке Д, начиная с четвертого столбца, записывается разность между элементами предпоследней строки и элементами первой строки: Д = z - с Д, = z, - с,, i — 1,..., п. с С| Ст Ст+1 cjo Сп t базис ъ (хь) а1 ат а”,+ 1 а30 ап а1 С| xi 1 0 lm+1 хЧо ®1п ii а*° С.» Х>0 0 0 £10^1+ 1 х'оЗо ^.о ат 0 1 &тт+1 xmj„ Z (сЬ,ХЬ} С| Стл <Cb,Xm+i) ^х") д 0 0 ^т+ 1 Д,о дп
90 Глава 2. Линейное программирование 4. Исследовать симплексную таблицу. а) Если Д 0, то крайняя точка х — решение задачи (т € Arg Pi). b) Если для некоторого j Д;< 0 и х3 0, то значение задачи SPt - +оо; с) Пусть в строке Д имеются отрицательные числа, а соответствую- щие столбцы х3 содержат положительные числа. Предположим, что min Ду = Дул < 0. Ясно, что т 4- 1 п. 1 Столбец, соответствующий индексу jq называется разрешающим столб- цом. Если min Ду достигается на нескольких значениях j, то в качестве разрешающего столбца выбираем столбец с любым таким индексом. Обо- значим ti'. = —— Xij0 > 0 >• > 0. Эти значения ti ставим соответствен- xijo но в последнем столбце симплексной таблицы. Пусть t,0 = min t, > 0. t Строка вектора а*0 называется разрешающей. Если mintf, достигается i на нескольких значениях », то в качестве разрешающей строки выбираем любую такую строку. Элемент х^ называется разрешающим элементом симплексной таблицы. Далее необходимо из числа базисных векторов исключить вектор а*0, вместо него взять вектор а30. Значение функционала на новой крайней точке х' с новыми базисными векторами а1,... ,а,|)_|,ал, а1о+1, ...,ат, возрастет на величину —<1оДуо. 5. Построить новую симплексную таблицу для нового базиса а',..., а'°~\а30, а*о+1,... ,ат, т.е. фактически разложить векторы Ъ, а1,..., ап, по новому базису. Укажем без обоснования (оно будет приведено в п. 3.3) способ построения новой симплексной таблицы по предыдущей. Элементы таблицы х-у, лежащие под векторами Ь, а1,..., а”, и не лежа- щие в разрешающей строке старой симплексной таблицы, вычисляются по правилу прямоугольника'. < _ xiox>io / _ xiojxije , xi — xi I Q] — Qj 1 * *0> X'ojb X‘oj<> из числа Xtj вычесть произведение Х{0] на х<]а, деленное на xtoja. Яс- но, что в разрешающем столбце новой симплексной таблицы x'ioj — 1, остальные элементы равны нулю (х'^а = 0, i # t0) » = 1,...,тп). Эле- менты разрешающей строки новой таблицы вычисляются путем деления элементов разрешающей строки старой таблицы на величину х,ву0: / Xio I X'oj , *0 = 2— > хы = —’ J-1> Далее необходимо вновь исследовать симплексную таблицу, т. е. вернуться к п. 4 и так далее, пока не придем к решению задачи.
§ 1. Симплекс-метод 91 Отметим, что симплекс-метод позволяет решать точно так же и вы- рожденные задачи линейного программирования. Число положительных координат крайней точки в таких задачах может быть меньше т, но чи- сло базисных векторов всегда равняется рангу матрицы А, величина t,0 может оказаться равной нулю. Теоретически в вырожденных задачах возможно зацикливание, когда через несколько этапов приходим к уже рассмотренной ранее крайней точке и это возвращение может происходить бесконечное число раз. При этом значение целевой функции не меняется и, значит, = 0. Перейти от вырожденной задачи к невырожденной можно путем сколь угодно малого изменения начальных данных задачи. 1.3. Примеры Приведем задачу, не являющуюся задачей линейного программиро- вания, но путем замены переменных сводящуюся к задаче линейного программирования. Задача на минимакс Пусть f(x) = max {/Да:),..., Zfc(a:)} — функция п переменных х = (г|,..., хп) является максимумом линей ных функций. Здесь Цх) — (с? ,х) -d, — линейные функции, х,с“ G Rn, d, € R, s - 1,... , к, A — матрица m x n, b G Rm. Рассмотрим следующую задачу f(x) —> min; Ax = b, x 0. (P) В отличие от задачи линейного программирования функция f(x) не явля- ется линейной. Покажем, что задача (Р) эквивалентна задаче линейного программирования гп+1 —► min; l,(x)^xn+l, s = l,...,k, Ах — b, х 0. (Р') Действительно, если £ G ArgP, то (£, £n+i: = f(£)) G ArgP'. (Если допустить, что вектор ($,/(£)) £ ArgP7, то существует вектор х G D(P) такой, что f(x) < f(£) => х £ ArgP — противоречие.) С другой стороны, если (f,fn+i) € ArgP7, то £ G ArgP. (Если допустить, что £ & ArgP, то существует вектор х G D(P) такой, что /(£) < /(£) Значит, вектор (х, f(x) G Р(Р') и хп+1 < £п+1 => (х,£„+1) & ArgP7 — противоречие.)
92 Глава 2. Линейное программирование Пример 1. Решить невырожденную задачу линейного программиро- вания в канонической форме 2xi + xi + х3 - Х4 —♦ max; x, 0, i = 1,2,3,4, X| — X2 -b X3 — 1, 2i| + x2 + X4 = 3, с заданной начальной крайней точкой х = (0,0,1,3). Решение. Базисные векторы а3 = (1,0) и а4 — (0,1). Составим первую симплексную таблицу С 2 1 1 -1 t базис Хь а’ а2 а3 а4 а3 1 1 1 -1 1 0 а4 -1 3 . 2 1 0 1 3 Z -2 -1 -2 1 -1 А -3 -3 0 0 Из таблицы видно, что в качестве разрешающего столбца можно взять столбцы а1 и а2. Возьмем для определенности столбец а2. Тогда t = 3, разрешающая строка а4. Заменяем в базисе вектор а4 на вектор а2 и для нового базиса строим вторую симплексную таблицу: с 2 1 1 -1 t базис Хъ а1 а2 а3 а4 а3 1 4 3 0 1 1 а2 1 3 2 1 0 1 Z 7 5 1 1 2 А 3 0 0 3 Вектор А 0, поэтому точка х = (0,3,4,0) является решением задачи и Smax = 7. Если бы в качестве разрешающего столбца в первой симплексной таблице взяли столбец а1, то пришли бы к той же точке (0,3,4,0), но за большее число шагов.
§ J. Симплекс-метод 93 Пример 2. Решить задачу линейного программирования х, + х2 + х3 + х4 + х5 + —* max; xt 0, i = 1,..., 6, ж, + х2 + 2х3 + Зг4 +6x6 = 9, Х2 + Х2 + Х4 + Xi — 3, х} + х4 - xs + 2х6 = 1, x4 + х6 = 1, с заданной начальной крайней точкой х = (1,2,0,0,1,1). Решение. Базисные векторы а1 = (1,0,0,0), а2 = (1,1,0,0), (110 6 0 0 -1 2 0 0 0 1 не является единичной, поэтому найдем для нее обратную матрицу. Для этого записываем рядом две матрицы: нашу матрицу и еди- ничную. Далее сводим матрицу Aj к единичной путем элементарных преобразований строк. Полученная в результате преобразований матрица на месте единичной матрицы и является обратной к нашей матрице Аъ- Напомним, что элементарными преобразованиями матрицы являются: а) перестановка двух строк; Ь) умножение строки на число отличное от нуля и с) прибавление к одной строке другой строки, на любое число. умноженной / 1 1 0 6 1 0 0 О' / 1 0 0 5 1 -1 0 0\ 1 0 1 0 1 0 1 0 0 0 1 0 1 0 1 0 0 1 1 0 0 -1 2 0 0 1 0 1 —> 0 0 1 —2 0 0 -1 0 н \о 0 0 1 0 0 0 1, \о 0 0 1 0 0 0 1/ /1 0 0 0 1 -1 0 -5\ /1 0 0 0 1 -1 0 —5\ 0 1 0 1 0 1 0 0 1 0 1 0 0 с 1 с -1 | 0 0 1 —2 0 0 -1 0 1 —► 0 0 1 0 0 0 -1 2 Г \о 0 0 1 0 0 0 1 / \0 0 0 1 0 0 0 1 / На первом этапе мы умножили третью строку на -1, из первой строки вычли вторую. На втором этапе из первой строки вычли четвертую, Умноженную на 5. На третьем этапе из второй строки вычли четвертую, а к третьей строке прибавили удвоенную четвертую. /1-1 0 -5\ т _ ,-11010-11 Таким образом, получили, что = I g g 2 1' \0 0 0 1 / Далее находим разложения векторов а3,а4 по базису а1,а2,а5,а6:
94 Глава 2. Линейное программирование /1 0 0 \о -1 0 0 0 0 -1 0 -5\ -1 1 2 1 1 / /2\ 1 1 1 - 1 1 \о/ / 1 \ 1 ] -1 1 ’ \ 0 / /1 -1 0 -5\ /3\ ^-3\ 4 .-1 4 0 1 0 -1 I 1 1 1 - 1 0 1 х = А/, а = 0 0 -1 2 1 1 1 1 1 1 \о 0 0 1 / \ 1 / к 1 / Разложением вектора b является вектор (1,2,1,1) ненулевых координат крайней точки. Составим первую симплексную таблицу с 1 1 1 1 1 1 t базис Хь а1 а2 а3 а4 а5 а6 а' 1 1 1 0 1 -3 0 0 а2 1 2 0 1 1 0 0 0 а5 1 1 0 0 -1 1 1 0 1 а6 1 1 0 0 0 1 0 1 1 Z 5 1 1 1 -1 1 1 д 0 0 0 —2 0 0 Разрешающий столбец а4. В качестве разрешающей строки можно взять строки а5 и а6. Возьмем для определенности строку а6. Тогда t = 1, разрешающая строка а6. Заменяем в базисе вектор а6 на вектор а4 и для нового базиса строим вторую симплексную таблицу: с 1 1 1 1 1 1 t базис Хь а1 а2 а3 а4 а5 а6 а1 1 4 1 0 1 0 0 3 а2 1 2 0 1 1 0 0 0 а5 1 0 0 0 -1 0 1 -1 а4 1 1 0 0 0 1 0 1 Z 7 1 1 1 1 1 3 д 0 0 0 0 0 2 Вектор Д О, поэтому точка х — (4,2,0,1,0,0) является решением задачи и Smax = 7. Полученная крайняя точка содержит только три положительные координаты. Значит, решенная нами задача является вырожденной.
§ I. Симплекс-метод 95 1.4. Задачи Задачи линейного программирования в канонической форме с за- данной первоначальной крайней точкой. Х\ + х2 + х2 —» max; ц 0, i= 1,2,3, 1.1. -xi + х2+х2 - 2, Зж( - х2 + х2 = 0, Хо = (0, 1,1). 2ж| + х2 + Зх2 + х4 —> max; ж, 0, t = 1,2,3,4, 1.2. aj| + 2х2 + 5ж3 - х4 = 4, Xi - х2 — х2 + 2х4 =1, х0 = (0,0,1,1). 6ж, 4-ж3 4-4ж3 — 5ж4 —» max; ж, 0, г= 1,2,3,4, 1.3. За:| +х2 - ж3 + х4 =4, 5ж| + х2 + х3 - х4 = 4, ж0 = (1,0,0,1). Ж| + ж3 + ж3 + ж4 —> max; ж, 0, i — 1,2,3,4, 1.4. ж( + Зж2 + ж3 + 2ж4 = 5, 2Ж1 - ж3 + ж4 =1, ж0 = (0,1,0,1). Ж| + х2 + ж3 + ж4 + ж5 -+ max; ж,- 0, i = 1,..., 5, 1.5. 2Ж| + Зжг 4- 5ж3 4- 7ж4 4- 9ж3 = 19, Ж| - ж7 4-ж44-2ж5 = 2, жо = (0,0,1,2,0). ж, 4- х2 4- ж3 4- х4 —♦ max; Xj 0, i — 1,2, 3,4, Ж! 4-Ж2 4-ж3 4-Зж4 = 3, Ж| 4- ж2 - ж3 4- Ж4 =1, Ж| - х2 4- ж3 4- х4 = 1, Жо = (0,0,0,1). ж, 4- 2ж3 4- 2ж3 4- Ж4 4- 6х5 -+ max; ж; 0, i = 1,... ,5, j 7 Ж] 4- Зж2 4- Зж3 4- х4 4- 9ж5 = 18, Ж| 4- 5ж3 4- 2ж4 4- 8Ж5 = 13, ж3 4- Ж5 = 3, Жо = (0,1,2,0,1). ж। - х2 4- ж3 4- х4 - х^ — Жб —> max; ж, 0, i = 1,..., 6, 18 2Ж| 4-ж2 4-ж3 4-Зж4 4-Зж5 4-2ж6 = 7, ж, — ж3 4- ж3 — Жо = —2, Ж2 4-ж34- ж4 4- ж3 4- 2жб = 5, х0 = (0,0,2,0, 1,1). ж, 4- Ж2 4- ж3 4- Зж4 — Ж5 — 2жо 4- х2 —» max; Ж| 4- 2ж3 4- Зж6 4- ж7 =8, 1.9. Ж|4-Зж24-2ж3 4-2ж6 4-Зж7 = 15, ж3 4- Зж3 4- 2ж4 4- 2ж3 - Зж6 4- Зж7 =11, ж3 4- Зж4 4- ж5 - 2ж6 4- ж7 =5, ж^0, * = 1,...,7, жо = (1,0,0,1,0,1,4).
96 Глава 2. Линейное программирование §2. Двойственность в линейном программировании 2.1. Элементы выпуклого анализа. Преобразование Лежандра Напомним определение выпуклого множества и выпуклой функции. Множество А С Rn называется выпуклым, если для любых двух точек и аг из А и любого числа t € (О, 1) элемент + (1 - t)ai € А. Пусть задана функция /: Rn —* R: = R U {-оо} U {+<х>}. С каждой такой функцией / связываются два множества: dom/: = {sc|/(x)<+oo} — эффективное множество и epi/: = {(а,х) € R х R” | а /(ж)} — надграфик J. Функция / называется выпуклой, если надграфик / — выпуклое множество. Функция / называется замкнутой, если надграфик / — замк- нутое множество. Функция / называется собственной, если /(х) > -оо V х и dom / / 0. Ясно, что сумма двух выпуклых функций является функцией вы- пуклой. Но суперпозиция двух выпуклых функций не всегда является выпуклой функцией. Попробуйте привести пример.' Пусть /: R" —» R — некоторая функция. Преобразованием Лежандра функции / (или сопряженной функцией к /) называется функция /*(у)‘- = max {(х,у) - f(x)}. Из определения /* видно, что /* — верхняя грань семейства аффинных функций {х, у) - f(x). Ее надграфик является выпуклым множеством (как пересечение выпуклых множеств — полупространств). Следовательно, /* — выпуклая функция. Из определения сопряженной функции следует неравенство Юнга: {х,у) $ /(х) + /’(у) Vx^eR". Функция /”(х): = max {(х,у) - /’(у)}, являющаяся сопряженной к /*, называется второй сопряженной к /. В теории двойственности для задач линейного программирования важной является следующая теорема выпуклого анализа. Теорема Фенхеля—Моро. [Гл. 6, п.0.3.] Собственная функция совпа- дает со своей второй сопряженной (/(х) = /**(х)) тогда и только тогда, когда она выпукла и замкнута (т. е. когда ее надграфик epi / — выпуклое и замкнутое множество).
§ 2. Двойственность в линейном программировании 97 2.2. Примеры Пример 1. Найти первую и вторую сопряженные (в смысле Лежандра) функции к функции f(x) — ах2 + Ьх + с в зависимости от значений параметров а,Ь,с. Решение. По определению сопряженной функции f'(y) = max {(г,у) - /(х)} = max {ху - ах2 - Ьх — с} = Z 2 = max { -ах2 + (у - Ь)х - с}. Если а > 0, то парабола -ах2 + (у — Ь)х — с = -а(х - ^)2 + ~ с достигает своего максимума — с при х = Поэтому Найдем вторую сопряженную к /. По определению /"(z): = max {{х,у} - f(y)} = max-fan/- 4-с) - у у 4а J < (у - Ъ - 2ах)2 2 , = max-!----------------ь ах +Ъх + с v •- 4а Парабола и(у): = — &42аг> + ах2 + Ьх + с достигает своего максимума при у = Ь + 2ах. Следовательно, , г (у — Ъ — 2ах)2 э 1 •> f (х) — тах<----------------1- ах + Ьх + с > = ах + Ьх + с. у I 4а J Если а = 0, то функция (у —Ь)х —с —> +оо ,если у / Ь , при х —♦ +оо или х —< -оо. Поэтому /*(у)= тах {(у ~ f>)x -с) — 1 ।с’ У 3 J XV! х / J 1^+00, у Ф Ъ. Найдем вторую сопряженную к /. Нетрудно видеть, что /”(г): = max { (х, у) - f(y)} = max (ху - ( "Л ~ Ь’ | = Ьх + с. Если а < 0, то парабола —ах2 + (у — Ь)х — с с осями, направленными вверх, стремится к +оо при х —► +оо. Значит, f*(y) = +оо. Найдем вторую сопряженную к f. Нетрудно видеть, что /’’(а:): = max {{х,у} - f'(y)} = max [ху - (+оо)} = -оо. У У 4 Чак. 60
98 Глава 2. Линейное программирование Пример 2. Найти первую и вторую сопряженные (в смысле Лежандра) функции к функции f(x) = ez. Решение. По определению сопряженной функции /*(у) ‘ max {(г,у) - f(x)} = max {а:у - ez} = max g(x), z z z где g(x): = xy — ez. Найдем максимум функции g(x). Имеем g'{x) = у - ez = 0 +> x = In у при у > 0. Поскольку д"(х) = —ех < 0, то по достаточному условию экстремума гладкой функции при у > 0 в этой точке будет достигаться максимум этой функции. Подставляя х = In у в д(х), находим, что max д(х) — у 1пу - у. Z Если у = 0, то очевидно, что max д{х) = тах{ —ех} - 0. Если у < 0, Z Z то д(х) —» +оо при х —► -оо. Таким образом, { у Iny - у, у > 0, /‘(у) = тах{ху - е1} - { 0, У = 0, 1 {+оо, у < 0. Найдем вторую сопряженную к f. По определению f fylny-y, у>0,'j f**(x): = max {{х, у} - f*(y)} = max < xy - < 0, у - 0, > = ” у I I +оо, у < 0 J = max {max {xy - yin у + у}, О}. Нетрудно видеть, что функция м(у): = ху — у In у + у достигает своего максимума при у > 0 в точке обращения в нуль своей производной. Действительно, и'(у) = х — In у - 1 + 1 = х - In у = 0 <=> у - е*, и"(у) = — <0 ПРИ У > О- У Подставляя это значение у в выражение для /”(а:), получаем f**(x) = max {max {xy - ylny + y},0} — max{ex,0} = ez. Равенство f**(x) = f(x) = ez следует также непосредственно из тео- ремы Фенхеля—Моро, поскольку функция ez является выпуклой и замк- нутой.
§2. Двойственность в линейном программировании 99 2.3. Вывод двойственных задач 2.3.1. Вывод задачи двойственной к задаче в общей форме Рассмотрим задачу линейного программирования в общей форме (с, х) —» min; Ах С b. (Р) Обозначим через S(b): = min {(с,х) | Ах 6} — 5-функцию задачи (Р), рассматривая аргумент b как параметр в задаче (Р). Определение. Двойственной задачей к задаче линейного программиро- вания в общей форме называется задача нахождения второй сопряженной (в смысле Лежандра) функции 5*’(6) для 5-функции задачи (Р). Для нахождения второй сопряженной необходимо найти вначале первую сопряженную функцию к функции 5(ft): S’(y) — max{(j/,6) — 5(6)} = max{(j/,6) - min{(c,z) I Ax 6}} = b b z f. I . ,> f max{(t/, Az) — (c, x) }, у $ 0, = max{(y, b)-{c,x) I Az < ft} = -! z = (-boo, иначе _ Г max{(A‘y - c,x) }, у < 0, _ ( 0, A*y = с, у < 0, (,4-oo, иначе I +°°, иначе. Найдем сопряженную в смысле Лежандра функцию к функции 5* (у), т. е. вторую сопряженную к функции S(b): S'*(b) - max{(y,6) - 5*(у)} = max{(y,6) | А*у = с, у 0}. Таким образом, двойственной задачей к задаче линейного програм- мирования в общей форме является следующая задача: (Ь,у) —> max; А*у —с, у 0. (₽”) Для задачи линейного программирования в нормальной форме: (с,а:)-+max; Ах < 6, х 0, - (Рп) выпишем без доказательства двойственную задачу (попробуйте сделать это самостоятельно): (6, у)-> min; А*у с, у 0. (Рп”) Как мы видим, двойственная задача в этом случае обладает определен- ной симметрией по отношению к исходной. Элементы бис меняются Местами, максимум меняется на минимум, матрица А меняется на транс- понированную, и матричное неравенство меняет знак. 4*
100 Глава 2. Линейное программирование 2.3.2. Вывод задачи двойственной к двойственной задаче для задачи линейного программирования в общей форме Покажем, что понятие «двойственности» введено правильно, т.е. двойственная задача к двойственной является исходной задачей. (Ъ, у} —> max; А'у = с, у С 0. (Р*‘) Для того, чтобы вывести двойственную задачу к задаче (Р“) надо вначале свести ее к задаче линейного программирования в общей форме, для которой уже известна двойственная задача. Вначале сведем задачу на минимум. Затем заменим равенство А*у = с на два неравенства с < А*у < с <=> А'у $ с, -А'у -с. Получим эквивалентную задачу линейного программирования в общей форме: / А* \ / с \ (—b,y} —* min; I —А* 1 у j — с I . \ I ) \ 0 7 Двойственная к ней будет следующая задача: ((с, —с,0), (а:1,х2,г3)) —» max; (А - A I) I г2 I = -Ь, х‘ $ 0, ж2 sj 0, ж3 si 0. Перепишем эту задачу в виде (с, ж1 — ж2) —» max; А(ж' — х2) + х3 — — Ь, ж1 0, х2 0, ж3 0. Обозначая ж = ж2 — ж1, и учитывая, что равенство А(ж' — ж2) + ж3 — — Ь эквивалентно неравенству А(ж' — ж2) Js -Ь, поскольку ж3 < 0, а ограни- чений на знак ж уже не будет, получим -(с,ж) —> max; —Ах —Ь. Заменяя max на min и умножая матричное неравенство на -1, придем к задаче, являющейся двойственной к задаче (Р**), которая совпадает с исходной задачей (Р) (с, ж) —> min; Ах 6. <Р) Таким образом, мы убедились, что термин «двойственная задача» используется правильно.
§ 2. Двойственность в линейном программировании 101 2.3.3. Вывод задачи двойственной к задаче в канонической форме Задачу линейного программирования в канонической форме (с, х) —> max; Ах = Ь, х 0, (Р*) сведем ее к задаче на минимум: (—с, х) —> min; Ах — b, х 0, (Р') при этом Spt = —Sp. Обозначим через S(b): = min {(—с, х) | Ах — Ь, х 0} — S-функцию X задачи (Р'), рассматривая аргумент b как параметр в задаче (Р'). Найдем первую сопряженную функцию к функции 5(6): S*(6*) = max{(6*,6)-5(6)} = max{(6*, 6)-min{(—с, х) \Ах = Ь, х^0}} = Ь & х = тах{(6*,6) + (с,х) | Ах — Ь, х 0} — тах{(6‘, Ах) + (с,х) | х 0} = г, Vi nl Г 0, А*Ь* + с 0, = max I A ft + с,х) г > 0} = < .’ х I' ’ ' 1 > (+оо, иначе. Найдем сопряженную в смысле Лежандра функцию к функции 5*(6*), т.е. вторую сопряженную к функции 5(6): S"(b) = max{(6*,6) - S*(b*)} = max{(6*,6) | A'b* +c 0} => SP.. = -S**(6) = min{(-6’,6) | A*6’+c^0}. fc b‘ Полагая у = — b*, получаем Sp-- = min{(j/,6) | — A*y + c 0}, и, следовательно, имеем следующую двойственную задачу (у, b)-> min; А*у > с. (Р”) 2.3.4. Упражнения 1. Вывести двойственную задачу для задачи линейного программи- рования в нормальной форме с помощью преобразования Лежандра. 2. Вывести двойственную задачу для задачи линейного програм- мирования в нормальной форме путем сведения ее к общей задаче линейного программирования. 3. Вывести двойственную задачу для задачи линейного програм- мирования в канонической форме путем сведения ее к общей задаче линейного программирования. 4. Показать, что для задачи (с, х) —» min; Ах = Ь, х 0, двойствен- ной является задача {у, b) —> max; А*у С с.
102 Глава 2. Линейное программирование § 3. Обоснование симплекс-метода 3.1. Теоремы существования, двойственности, критерий решения Приведем три теоремы, играющие важную роль при обосновании симплекс-метода. Рассмотрим задачу линейного программирования в общей форме (с,х) —+ min; Ах < b, (Р) где с,х € R", b € Rm, матрица размеров т х п А = = (а] ... а" \ / а] \ .I со столбцами а}1 = I ... I , j — 1,..., п. / \ / Обозначим Sp — численное значение задачи (Р), AigP — множество решений задачи (Р), т. е. множество допустимых точек х € Rn, для которых (с,х) — Sp. Теорема существования. Если численное значение задачи (Р) конечно (|5р| < +оо), то ее решение существует (AigP # 0). Доказательство. Отметим сразу, что поскольку численное значе- ние задачи конечно, то множество допустимых элементов непусто (.D(P) 0). Рассмотрим множество К'. = {(о, z) € R х Rm | 3 х : (с, х) Со, Ах < z}. Ясно, что К — выпуклый конус. Напомним ряд сведений из выпуклого анализа. Пусть С'. = {с|,... с R" — некоторое конечное подмножество. m тп Элемент v = 52 ti 0» i = I,.. ,m, 52 = 1 > называется выпуклой i=i i=i m комбинацией С, а элемент k = 52 i> 0, * = 1,. • -, m, — конической i=i комбинацией С. Совокупность всех выпуклых (конических) комбинаций конечных подмножеств множества С называется выпуклой (конической) оболочкой С и обозначается со С (cone С). Можно легко показать, что множество со С совпадает с пересечением всех выпуклых множеств, содержащих С (иногда это свойство берут за определение со С), а множество cone С совпадает с пересечением всех выпуклых конусов, содержащих С.
§ 3. Обоснование симплекс-метода 103 Выпуклая оболочка конечного числа точек называется выпуклым мно- гогранником, а выпуклая коническая оболочка конечного числа точек — конечнопорожденным конусом. Лемма 1. Конус К — конечнопорожденный. Доказательство леммы 1. Покажем, что К = cone {±£|,..., ±£n, где = (cJ,a-',...,aA1), j = % = (1,0,...,0), ty, = (0,1,...,0),..., r)m = (0,0,...,1). Вложение cone {±£,,..., ±£п, tjq,..., т)т} С К, следует из того, что все образующие конуса лежат в К. Действительно, полагая х = ±е;- (ei,...,en — канонический базис в R”) в определении конуса К, мы получим, что € К, j = ],... ,п; для векторов ту, надо взять х — 0. Обратно, если вектор (a, z) = (a,Z|,... ,zm) £ К, то существует х — (х\,...,хп) £ R”, для которого {с,х) С a, Ах z. Значит для некоторых До > 0,..., Дт 0 выполняются соотношения (с, ж) + До = a, Ах +/3 — z (j3 = (Дь ..., Дт)) <=> п п ^CjXj+p^a, ^^a^Xj +/3i — Zi, i=l,...,m. 3=1 3=1 Но это как раз и означает, что п т + = («>*)• 3=1 i=0 п п Поскольку = 52 l^jKsignxy • (j), то (a, z) € cone {±£f,...,±£п, 3=1 3=1 ’То,- -Лт}- Лемма 2 (о замкнутости конечнопорожденного конуса). Конечнопо- рожденный конус замкнут. Доказательство. Доказательство проведем индукцией по числу m по- рождающих точек. Если m = 1, то конус К - {х £ R" | х = tk\, t 0} — полупрямая, очевидно, замкнутая. Пусть теорема верна для конусов, по- рожденных m — 1 точкой, m 2, и пусть заданы тп точек fc,,..., кщ. Если конус К = cone {Ari,..., km} содержит векторы —,..., —km, то К — ко- нечномерное подпространство, т. е. замкнутое множество. В противном случае существует вектор (пусть это будет —fcm), который не принадлежит К (~кт £ К). Обозначим К': = cone {fe,,..., km-i}. По предположению индукции конус К1 замкнут и К = {fc | к — к' + th™, к' € К', t 0}. Пусть {к'1-. — кт + tnkm}n€N последовательность векторов из К, сходящаяся к к £ Rn (кп —» к). Из последовательности {/”} выберем
104 Глава 2. Линейное программирование сходящуюся подпоследовательность {<"} —♦ £ 0. Имеются две воз- можности: либо £ конечное число, либо t = +оо. В первом случае получим, что числа к'п‘ = kni - tn’km —» к- £кт € К' (в силу замкнутости конуса К'), т. е. к € К и, следовательно, К замкнуто. Во втором случае, деля кп~ на 1п', имеем: + кт = —♦ 0 при г —* оо ({к’"'} — сходяща- яся последовательность, {tn‘} —* +оо). Откуда сходится к -кт, что невозможно так как — кт К'. Поскольку Sp = min {а | 3 х : (с,ас) — а, Ах ч- 6} =: а, то существуют последовательности {аск} и {а*}, ак —♦ а при к —+ +ос, для которых (с, хк) = ак, Ахк sC b (это означает, что последовательность точек (ак,Ь) g К — замкнутому по лемме 2 множеству. Поэтому предельная точка (а,6) £ К. Тогда по определению множества К существует точка х такая, что (с, ж) а — Sp, Ах < Ь. Это означает, что х € ArgP. Теорема существования доказана. Вернемся к задаче линейного программирования в общей форме. В п. 2.3 мы обозначили через S(b): = min {(с,а:) | Ах sj 6} — 5-функцию X задачи (Р), рассматривая аргумент Ъ как параметр в задаче (Р). Лемма 3. 5 — выпуклая замкнутая функция. Доказательство леммы легко выводится из соотношения epi 5 — К, где К — выпуклый замкнутый конус, рассмотренный при доказательстве теоремы существования. Лемма 4. Пусть /: Rn —» R — выпуклая замкнутая функция и суще- ствует точка Zq такая, что /(zq) = —оо. Тогда f(z) = —оо V z € dom/. Напомним, что двойственной задачей к задаче линейного програм- мирования в общей форме является следующая задача: (6, У) ~♦ птах; А*у = с, у 0. (Р**) Теорема двойственности. Для пары двойственных задач линейного про- граммирования (Р) и (Р*‘) имеет место следующая альтернатива: или значение одной из задач конечно (и тогда конечно значение другой и оба зна- чения совпадают), или множество допустимых элементов в одной из задач пусто (и тогда другая задача либо несовместна, либо имеет бесконечное значение). Доказательство. 1) Пусть |5(6)| < оо, тогда поскольку по лемме 3 5 — выпуклая замкнутая функция, то по лемме 4 5(z) > —оо V z € Rm. По теореме Фенхеля—Моро п. 2.1 5“(6) = 5(6). Это означает, что конечно значение двойственной задачи и оба значения совпадают.
§3. Обоснование симплекс-метода 105 2) Пусть DP = 0 (& S(b) = +оо), тогда либо а) существует точка zo такая, что S(zo) — —оо, тогда S* = +оо, следовательно, S'* = -оо, т. е. Dp- = 0 (это означает, что множество допустимых элементов в двойственной задаче пусто), либо b) S(z) > —оо V z £ Rm, тогда по теореме Фенхеля—Моро S**(&) = S(b) — +оо (это означает, что двойственная задача имеет бесконечное значение). Критерий решения. Пусть х,у — допустимые элементы в задачах (Р) и (Р**) соответственно (х £ D(P), у € £)(Р**)). Тогда точки х,у являются решениями в задачах (Р) и (Р**) соответственно (х £ ArgP, у € ArgP**) тогда и только тогда, когда (с,4) = (у,Ь). Доказательство. Необходимость. Пусть у £ ArgP**, тогда у £ Р(Р**) и (у, 6) — Sp--. Аналогично, х £ ArgP, тогда у £ Р(Р**) и (с,ж) — SP. Значение задачи (Р) при этом конечно (|5р| < +оо). Значит по теореме двойственности значение двойственной задачи также конечно и оба значения совпадают (Sp — Sp-). Следовательно, (с,х) = (у,Ь). Достаточность. Пусть х £ D(P), $ £ £>(Р**) и (с,х) = ({j,b). Возьмем произвольные допустимые элементы х £ D(P), у £ D(P**). Это означает, что Ах Ь, А* у = с, у йС 0. В силу этих условий на х и у имеем (с,х) - (А*у,х) = (у, Ах) (у,Ъ). Из этого соотношения вытекает, что (с, х) (у,Ь) = (с, £) V х £ Р(Р). Это означает, что ж £ ArgP. Аналогично доказывается, что #£ArgP**. 3.2. Свойства множества допустимых точек Рассмотрим задачу линейного программирования в канонической форме (с, х) —» max; Ах — Ь, х 0. (Р*) Предложение 1. Пусть х = (ж,,..., xk, 0,...,0) € R",' ж,- > 0, i=l,...,k, — допустимая точка в задаче (Р*) (ж £ £)(Р*)). Тогда точка х является крайней точкой множества допустимых элементов D(Pk) тогда и только тогда, когда столбцы а1,... ,ак матрицы А линейно независимы. Доказательство. Необходимость. Пусть ж — крайняя точка. До- кажем, что тогда столбцы а1,...,а* — линейно независимы. Доказа- тельство будем вести от противного. Допустим противное, что столбцы а1,... ,ak — линейно зависимы. Тогда существует ненулевой набор мно- k жителей А1э..., А* такой, что 52 А;а* =0. Значит ЛА = 0 для вектора
106 Глава 2. Линейное программирование А = (Аь..., А*,0,... ,0) € Rn. Поэтому точка x(t): = х + tX € DPt при малых t как больше, так и меньше нуля. Это означает, что точка х не является крайней. Получили противоречие. Значит, наше допущение, что столбцы а1,...,а* линейно зависимы — неверно. То есть столбцы а1,...,а* линейно независимы. Достаточность. Пусть столбцы, соответствующие положительным координатам точки х линейно независимы. Для определенности будем считать, что это столбцы аак. Докажем, что тогда х — крайняя точка. Доказательство вновь будем вести от противного. Допустим противное, что х не является крайней точкой. Тогда существуют точки у € D(Pk) и z £ D(Pk), у z, отличные от ж и число t £ (0, 1) такие, что х = ty + (1 - t)z. Из этого равенства и условий х = (х\,..., хк, 0,..., 0), Xi > 0, i = \,...,к, y,z 0 следует, что у = (Ун • • ,0), z = (zi,... ,zt,0,... ,0). А из условий Ay = b <=> 4 , к _ it 531/ia' = b, Az — b <=> 52z,a* — b следует, что 52(1/,- — z,)a’ = 0. i=i >=i i=i Это означает, что столбцы a1,..., а* линейно зависимы. Получили противоречие. Значит, наше допущение, что х не является крайней точкой — неверно. То есть х является крайней точкой. Поскольку количество линейно независимых столбцов не может превышать количества строк матрицы А, то крайняя точка содержит не более т положительных элементов. Предложение 2. Пусть (Рк) — невырожденная задача линейного про- граммирования в канонической форме, х = (xj,... , х&,0,... ,0) € Rn, Xi >0, i = 1,..., k, — допустимая точка в задаче (Pt) (х € D(Pk)). Тогда а) fc т; Ь) точка х является крайней точкой множества допустимых элементов D(Pk) тогда и только тогда, когда к = т. Доказательство. а) Доказательство будем вести от противного. Допустим противное, что существует допустимая точка, у которой менее m положительных координат. Для определенности пусть это первые к координат (k < т). Рассмотрим множество D = {у G R* | Ау = Ь, у 0}, где А: = {а1,..., а*} — матрица, состоящая из первых к столбцов исходной матрицы А. Отметим, что множество D непусто. Пусть у — крайняя точка множества D (докажите самостоятельно ее существование). У нее число положительных координат I (I к < тп) будет меньше m и соответствующие столбцы матрицы А по предложению 1 линейно независимы. Тогда вновь по предложению 1 точка х = (у,0, ...,0) € Rn будет крайней точкой множества D(Pk), причем число положительных координат I у нее меньше т. Это противоречит невырожденности задачи. Значит, наше допущение, что существует допустимая точка, у которой имеется менее m положительных координат, неверно. То есть fc т.
§ 3. Обоснование симплекс-метода 107 Ь) Необходимость непосредственно следует из определения невыро- жденной задачи (в невырожденной задаче любая крайняя точка имеет ровно т положительных координат). Достаточность. Пусть х = (z|,... ,zffl,0,... ,0) 6 Dpk, х, > 0, i — 1,... ,m — допустимая точка в задаче (Pt). Докажем, что тогда х — крайняя точка. Доказательство будем вести от противного. Предположим противное, что точка х не является крайней. Тогда по предложению 1 столбцы а1,..., ат матрицы А линейно зависимы. Эго означает, что су- m ществует ненулевой набор множителей А[,..., Ат такой, что А,а* = 0. t=i Значит ЛА = 0 для вектора А = (Аь..., Ат,0,... ,0) € R". Поэтому Л(ш + tA) = Ах + tAX = Ах = b V t, а вектор х + tX 0 при малых t как больше, так и меньше нуля, т.е. x + tX € DPi. Поскольку x,+tXi > 0 при t — 0, то увеличивая |t|, придем к случаю, когда еще одна координата вектора х + tA обратится а ноль, а все остальные по-прежнему больше или равняются нулю. Таким образом, при некотором t допустимая точка x+tX будет иметь менее т положительных координат. Это противоречит пункту а) данного предложения. Получили противоречие. Значит, наше предположение, что точка х не является крайней — неверно. То есть х является крайней точкой. 3.3. Доказательство симплекс-метода Рассмотрим невырожденную задачу линейного программирования в канонической форме {с, х) —> max; Ах — 6, х 0. (Р*) Напомним, что двойственной к ней является следующая задача: (b,y) -> min; А"у с. (Р") При изложении правила решения задачи в канонической форме мы пользовались фактами, которые были даны там без обоснования. Сейчас мы их докажем, оформив утверждение в виде теоремы. Теорема. Пусть х — (г|,..., хт, 0,..., 0) € R", х,, > 0, i = 1,..., т — крайняя точка множества допустимых элементов D(Pt). Тогда'. а) если Д 0, то вектор х — решение задачи (Р*), а вектор у: = C(,j4j 1 — решение двойственной задачи (Р“); Ь) если для некоторого j Ду< 0 и аР < 0, то значение згдачи SPi = +оо; с) если не выполнены условия пп. а) и Ь), то точка х является новой крайней точкой множества допустимых элементов В( Рц) , значение функционала при этом возрастет на величину а разложение векторов х , а1,... ,ап производится согласно симплекс-методу.
108 Глава 2. Линейное программирование Доказательство. Напомним, что по предложению 1 det Аъ # 0, т.е. матрица Аъ обратима. а) Пусть Д 0. Преобразуем это условие с учетом определения векторов z; = сьХ, у. = c6Aj1 уАь - сь и матрицы X (АЬХ = Л): Д^0<=>2 — съХ с <=> уАъХ > с <=> у А с <=> А’у с. Значит, у является допустимым вектором в задаче (Р”) двойствен- ной к задаче (Pt). Кроме того в силу условия Аъ%ъ — Ъ (с,х) = {сь,хь) = (уАь,хь) - {А*ьу,хь) - {у,Аьхь} = (у, 6). По критерию решения п. 3.1 х — решение в задаче (Pt), а у — решение в двойственной задаче (Р”). Ь) Положим x(t)\ = х — t(x’, 0) + tej (e|,...,en — канонический базис в Rn). Тогда x(t) = (хь - tscJ, 0) 4- te; 0 V t 0 в силу условия 0 и Ax(t) ~ Ах - Mja? + tAej — b — to? 4- to.’ = b. Значит, x(t) — допустимый элемент для любого i 0, при этом {с, x(t)) = (с,х — $(а?, 0) 4- tej) = (с, х) - t{cb, х’) 4- t{c, еу) = = {с, х) - tZj -ь tej = (с, х) - t(zj - Cj) = = (с, х) — tAj —» 4-оо при t —» 4-оо. с) Предположим, что не выполнены условия пп. а) и Ь) теоремы. Тогда для некоторого jo такого, что m 4-1 < jo п, выполнено условие Д7о < 0 и величина tio: = min I xijo > ol = > 0. 1жу0 I J xiaj„ Возьмем х': = х - t,a(x3a, 0) 4- tlr>e](i. Докажем, что вектор х' является новой крайней точкой в задаче (Pt). Покажем вначале, что он является допустимым вектором. Как и в пункте Ь) выводим, что Ах' — Ь. Имеем х, = Xi - t^x^ = Xi------Xija 0 при i = 1,..., m; Xiojo x'i = 0 при i — m 4- 1, • • ,n, i jo; < = i.» = — > 0. -r>ojn Таким образом, х' 0, и значит, вектор x' является допустимым в невырожденной задаче (Р*). По построению у вектора х' по сравнению с вектором х добавилась одна положительная jo-я координата, а какие- то обратились в ноль. Поскольку по предложению 2а) у допустимой точки число положительных координат не менее тп, то в ноль может
§ 3. Обоснование симплекс-метода 109 обратиться только одна координата (это х'^-я координата обратилась в ноль). Значит, у вектора х' имеется ровно т положительных координат на местах 1,...,*о — 1,»о+1,. ,т, jo- Следовательно, по предложению 2Ь) х' — крайняя точка. (Отметим, что в невырожденной задаче число положительных компонент у крайней точки может уменьшаться.) Выписанные формулы означают, что в новой симплексной таблице столбец х' вычисляется согласно указанному методу построения сим- плексной таблицы. Покажем, что и остальные столбцы х'3 в новой симплексной таблице строятся по этому же способу. Для этого вычи- слим координаты x'jj разложения столбцов a3, j = 1,... ,п, матрицы А по базису а1,...,а*0-1, а70,а,о+1,ат. В старом базисе мы имели следующие разложения: т т а? = 'Yha'xii = ^2a'xij + j = (1) 1=1 1=1 «/«О m В частности при j — j0 а3й — 52 a'xijo + a">xiaj0- i=i Поскольку # 0, то выразимое10 из последнего уравнения ГЛ jn а* = - , ®iojo • /•о и подставим в соотношение (1). Получим разложения по базису а1,..., а’0-1, а7°, ..., ат: ( v' • aJ° А 1 = > , “ хч + ( - 2^ а ~ + х'°3 = 1 = 1 ' 1=J *Мо / 1#1’о — V'' Т Xi<jxijo \ , io xi«j „ — У fl I j --------------------- I “Ь & } 7 3 1, • • • ) Л. «#»'о Таким образом, i xij xiajxijo = Xij------------- xiojo i io, i= x',j0 = 0, i 0 »o, xi0i = xi«j xiojo j = 1, . . . ,n.
НО Глава 2. Линейное программирование §4. Методы нахождения начальной крайней точки 4.1. Переход к решению двойственной задачи Рассмотрим метод решения задач линейного программирования пу- тем перехода к двойственной задаче и решения полученной двойственной задачи. При этом строка Д последней симплекс-таблицы даст нам ре- шение исходной задачи. Пусть нам дана следующая задача линейного программирования: (b,y)-+min; А* у с, у^О. (Р) Двойственной для нее является задача в нормальной форме (с, х) —» max; Ах < Ь, х 0. (Р”) Сведем эту задачу к эквивалентной задаче в канонической форме путем добавления неотрицательных (искусственных) переменных х = (хп+ь • • ,хп+т) и единичной матрицы Г. (с, х) —> max; Ах + 1х = Ь, х 0, х 0 <=> (с,х} —♦ max; Ах — b, x^Q (с = (с,0), х — (х,х), A — AI). (Р) Задачу (Р) с вектором Ь 0 можно решить симплекс-методом, взяв в качестве исходной крайней точки точку (0,..., 0, bt,..., Ьт) 6 Rn+m. Эта точка будет крайней по Предложению 1 п. 3.2, поскольку столбцы единичной матрицы I, соответствующие положительным координатам этой точки, линейно независимы. _ Пусть вектор х = (х,х) является решением задачи (Р) (5 g ArgP). Тогда соответственно х является решением задачи (Р**) (х € ArgP“). А по теореме п. 3.3 вектор у. = qAj1 является решением задачи, двойственной к задаче в канонической форме Р: —* / /А*\ /с\ . {Ь, у} -> min; А у с ( <=> ( j ly^l0I^Ay^c, у^О То есть у является решением исходной задачи (Р). При этом Sp — Sp, а из разложения АьХ = А X = Аь' А <=> X — А^'А. X = Aj1/ = Aj1 получим, что вектор у = сьА^1 = с^Х — z = z - с = Д. Таким образом, часть строки Д последней симплекс-таблицы, лежа- щей под разложениями векторов искусственных переменных, дает нам решение исходной задачи (Р).
§ 4. Методы нахождения начальной крайней точки 111 Пример. Решить задачу линейного программирования путем перехода к двойственной задаче. Пусть необходимо решить следующую задачу: 4yi + 2j/2 —> min; О, * = 1,2, 9j/i + у2 15, 3j/i + 4j/2 > 27, У\ + 5у2 20. (Р) Решение. Двойственной для данной задачи линейного программи- рования будет следующая задача в нормальной форме (выведите это самостоятельно): 15ж| + 27х2 + 20х3 —> max; Х{ 0, *=1,2,3, 9xt + 3x2 + хз ^4, Х| + 4x2 + 5хз 2. (Р“) Сведем эту задачу к задаче в канонической форме путем добавления неотрицательных (искусственных) переменных х^, и х$ и заменяя неравенства равенствами". 15х । + 21X2 + 20®з —♦ max; ж, 0, * = 1,..., 5, 9xt + Зх2 + х3 + х4 —4, Х|+4х2 + 5хз +Х5 = 2. (Р) В выписанной задаче линейного программирования в каноничес- кой форме в качестве первоначальной крайней точки возьмем точ- ку х = (0,0,0,4,2). Эта точка будет крайней по Предложению 1 п.3.2, поскольку столбцы единичной матрицы, соответствующие положитель- ным координатам этой точки, линейно независимы. Тогда базисными векторами будут векторы а4 = (1,0), а5 = (0,1). Составим первую симплексную таблицу для задачи в канонической форме (Р): с 15 27 20 0 0 t базис а1 а2 а3 а4 а5 а4 0 4 9 3 1 1 0 4 3 а5 0 2 1 4 5 0 1 2 Z 0 0 0 0 0 0 д -15 -27 -20 0 0
112 Глава 2. Линейное программирование В первой симплексной таблице разрешающий столбец а2, разрешаю- щая строка а5, разрешающий элемент симплексной таблицы 4. Заменяем в базисе вектор искусственных переменных а5 на вектор а2 и для нового базиса строим вторую симплексную таблицу: с 15 27 20 0 0 t базис а1 а2 а1 а4 а5 а4 0 5 2 33 4 0 _ и 4 1 _ 2 4 10 33 а2 27 1 2 х 4 1 5 4 0 £ 4 2 Z 27 2 27 4 27 135 4 0 27 4 д _ 22 4 0 55 4 0 27 4 Во второй симплексной таблице разрешающий столбец а’, разре- шающая строка а4, разрешающий элемент симплексной таблицы Заменяем в базисе вектор искусственных переменных а4 на вектор а1 и для нового базиса строим третью симплексную таблицу. с 15 27 20 0 0 t базис Хь а1 а2 а3 а4 а5 а’ 15 10 33 1 0 _ £ 3 4 33 |_ i 1 а2 27 14 33 0 1 4 3 33 3 и Z 16 15 27 31 1 6 д 0 0 и 1 6 Вектор Д О, поэтому точка х = 0,0,0) является реше- нием двойственной задачи с добавленными искусственными перемен- ными (Р), а вектор х = (|^, ||,0) является решением задачи (Р**) и Sp — Sp- = 16. В последней симплекс-таблице под разложениями векторов искус- ственных переменных стоят числа 1, 6, являющиеся значениями решения исходной задачи (Р), т. е. вектор у — (1,6) является решением задачи (Р) и Sp = 16.
§ 4. Методы нахождения начальной крайней точки 113 4.2. Метод искусственного базиса Метод добавления искусственных переменных используется для отыскания начальной крайней точки в задаче линейного программиро- вания в канонической форме (с, г) —> max; Ах — Ь, х 0. (Pk) Не ограничивая общности, можем считать, что все координаты вектора b неотрицательны. Если это не так, например, bj < 0, то умножим обе части j-ro уравнения на —1. Поэтому далее считаем, что д > 0. Рассмотрим вспомогательную задачу, добавляя искусственные пере- менные х = (хп+\,... ,хп+т) и единичную матрицу I, т - ^2 хп+< —* max; Ах + lx = b, х 0, х 0. (Р) 1=1 Поскольку значение задачи Sp 0 и множество допустимых элемен- тов D(P) 0 (х: = (0,...,0, Ь\,..., bm) е D(P)), то значение задачи конечно (|Sp| < +оо). По теореме существования п. 3.1 решение в за- даче (Р) существует. Причем, если в исходной задаче (Pt) множество допустимых элементов непусто (D(Pk) # 0), то значение задачи Sp = 0, а решением задачи (Р) будет крайняя точка, у которой все искус- ственные переменные равны нулю. Задачу (Р) можно решить симплекс- методом, взяв в качестве исходной крайней точки точку х. Эта точка будет крайней по Предложению 1 п.3.2, поскольку столбцы единичной матрицы I, соответствующие базисным координатам точки х, линейно независимы. _ При решении задачи (Р) симплекс-методом могут возникнуть три исхода: 1) Не все искусственные переменные равны нулю. Это означает, что исходная задача (Р*) не имеет допустимых элементов. Действительно, если не все искусственные переменные равны нулю, то Sp < 0. Предположим, что исходная задача (Р*) имеет допустимые элементы, например, а:0. Но тогда Sp < 0 — ((0, -1), (х°, 0)) — проти- воречие. Значит, наше предположение, что исходная задача (Р*) имеет допустимые элементы, неверно. 2) Все искусственные переменные равны нулю и среди базисных век- торов нет векторов, соответствующих искусственным переменным. Это означает, что решением в задаче (Р) будет х — (х,0) — крайняя точ- ка множества D(P). Точка х будет крайней точкой множества D(P).) по Предложению 1, поскольку столбцы матрицы А, соответствующие базисным координатам, линейно независимы.
114 Глава 2. Линейное программирование Далее, взяв в качестве первоначальной крайней точки точку х, можем приступать ко второму этапу — решению задачи (Pt) по симплекс-методу с найденной крайней точкой. Таким образом, мы имеем двуэтапный метод решения задачи (Рь). 3) Все искусственные переменные равны нулю и среди базисных векторов есть вектора, соответствующие искусственным переменным. В этом случае надо исключить из числа базисных вектора, соответствующие искусственным переменным. Пусть, например, в последней таблице имеется строка с искус- ственной переменной in+io- Будем считать эту строку разрешающей. В качестве разрешающего столбца возьмем столбец а3а, j0 < п, та- кой, что ®n+i„j0 / 0. Столбец Ь новой симплексной таблицы при этом не изменится (по правилу прямоугольника х\ = ж,------------— = ж,, •Bn+i'ujo так как xn+i0 = 0), только вместо переменной жп-н0 будет стоять пе- ременная Xjn. Значение функционала (с,х) также не изменится. Этот процесс закончится удалением всех базисных векторов, соответствующих искусственным переменным, с заменой их на неискусственные, или окажется, что жп+,о; = 0, j = 1,...,п. Так как x-,j — i-я координата разложения вектора а3 по базисному вектору а1, то тогда все векторы а3, j = 1,...,п, включая вектор Ь, можно разложить по базисным без вектора а"+,°. Значит, «о-я строка исходной системы уравнений является линейно зависимой от остальных строк и на втором этапе можем про- сто вычеркнуть из симплексной таблицы «о-ю строку, содержащую эту искусственную переменную, и начать второй этап с меньшим числом базисных векторов. Таким образом, двуэтапный симплекс-метод позволяет для любой задачи линейного программирования в канонической форме: 1) об- наружить, что исходная задача не имеет допустимых элементов, или 2) найти первоначальную крайнюю точку в задаче (Р) и решить задачу по симплекс-методу, или 3) исключить линейно зависимые равенства и решить задачу по симплекс-методу с найденной крайней точкой, имеющей менее т положительных элементов. Замечание. Вместо такого двуэтапного решения задачи (Р*) можно решать следующую задачу (ее принято называть М-задачей) (с, (х, х)} —> max; Ах + 1х — Ь, х 0, ж 0, где с = (с, —М,..., -М) € Rn+m, М — положительное число. Нетрудно показать, что при любом достаточно большом М первые п координат полученного решения определяют решение в (Pt), а искусственные переменные равны нулю.
§ 4. Методы нахождения начальной крайней точки 115 4.3. Примеры Пример 1. Решить методом искусственного базиса задачу: Xi + 2x2 + 3xj - Xj —> max; х, 0, i = 1,2,3,4, Xi + 2x2 + ®з + = Ю, 2ж| + Х2 + 5хз = 20, Xi + 2х2 + Зяз = 15. Рассмотрим вспомогательную задачу, добавляя искусственные пере- менные Х$,Хб- —х5 — х& —» max; г, 0, i — 1,..., 6, Xi + 2х7 + ®з +Х4 = 10, 2г| + Х2 + 5гз +25 = 20, Xi 4- 2x2 + З23 + Хб = 15. Исходная крайняя точка х = (0,0,0,10,20,15). Базисные векторы а4 = (1,0,0), а5 = (0,1,0), а6 = (0,0,1). Составим первую симплексную таблицу для вспомогательной задачи: с 0 0 0 0 -1 -1 t базис а1 а2 а3 а4 а5 а6 а4 0 10 1 2 1 1 0 0 10 а5 -1 20 2 1 5 0 1 0 4 а6 -1 15 1 2 3 0 0 1 5 Z -35 -3 -3 -8 0 -1 -1 д -3 -3 -8 0 0 0 Из таблицы видно, что разрешающим столбцом является столбец а3, разрешающая строка а5. Заменяем в базисе вектор а5 на вектор а3 и для нового базиса строим вторую симплексную таблицу: с 0 0 0 0 -1 -1 t базис хь а1 а2 а3 а4 а5 а6 а4 0 6 3 5 9 5 0 1 __ 2 5 0 (0 3 а3 0 4 2 5 2 5 1 0 2 5 0 20 а6 -1 3 _ j 5 7 5 0 0 _ 3 5 I 15 7 Z -3 1 5 _ 7 5 0 0 3 5 -1 д 2 5 __ 7 5 0 0 8 5 0
116 Глава 2. Линейное программирование Из таблицы видно, что разрешающим столбцом является столбец а2, разрешающая строка а6. Заменяем в базисе вектор а6 на вектор а2 и для нового базиса строим третью симплексную таблицу: с 0 0 0 0 -1 -1 t базис а1 а2 а3 а4 а5 а6 а4 0 15 7 6 7 0 0 1 4 7 _ 9 7 а3 0 25 7 3 7 0 1 0 2 7 _ j 7 а2 0 15 7 _ £ 7 1 0 0 _ 3 7 5 7 Z 0 0 0 0 0 0 0 д 0 0 0 0 1 1 Вектор Д О, поэтому точка £ = (0, у, у, у,0,0) является реше- нием вспомогательной задачи и Smax = 0. Перейдем к решению основной задачи. Составим первую симплекс- ную таблицу для начальной крайней точки х— (0, у, у, у). Разложения векторов х,а' по базису а4,а3,а2 берем из последней симплексной таблицы: с 1 2 3 -1 t базис хь а' а2 а3 а4 а4 -1 15 7 6 7 0 0 1 5 2 а3 3 25 7 3 7 0 1 0 25 3 а2 2 15 7 __ 7 1 0 0 Z. 90 7 ]_ 7 2 3 -1 д _ 6 7 0 0 0 Разрешающим столбцом является столбец а1, разрешающая строка а4. Заменяем в базисе вектор а4 на вектор а1 и для нового базиса строим вторую симплексную таблицу:
§ 4. Методы нахождения начальной крайней точки 117 С 1 2 3 -1 t базис а1 а2 а3 а4 а1 1 5 2 1 0 0 7 6 а3 3 5 2 0 0 1 2 а2 2 5 2 0 1 0 6 2 15 1 2 3 0 А 0 0 0 1 Вектор А О, поэтому точка х — (|,|, |,0) является решением исходной задачи и Smax =15. Пример 2. Решить методом искусственного базиса задачу: - 2x2 + ~* max; х,0, «=1,2,3, X] + Х2 + х3 = 5, 2i| + х2 =3, - 2аС| + 2x2 — 4. Решение. Рассмотрим вспомогательную задачу, добавляя искусствен- ные переменные х^,х3-. —Х4 — х3 —> max; х; 0, « = 1,..., 5, + Х2 +гз =5, 2Ш| +12 + Х4 =3, — 2х1+2а:2 +х5=4. Исходная крайняя точка х = (0,0,5,3,4). Базисные векторы а3 = (1,0,0), а4 = (0,1,0), а5 = (0,0,1). Составим первую симплексную таблицу для вспомогательной задачи: С 0 0 0 -1 -1 t базис г» а1 а2 а3 а4 а5 а3 0 5 1 1 1 0 0 5 а4 -1 3 2 1 0 1 0 3 а5 -1 4 — 2 2 0 0 1 2 Z — 7 0 -3 0 - 1 -1 А 0 -3 0 0 0
118 Глава 2. Линейное программирование Разрешающий столбец а2, разрешающая строка а5. Заменяем в ба- зисе вектор а5 на вектор а2 и для нового базиса строим вторую симплексную таблицу: с 0 0 0 -1 -1 t базис хь а1 а2 а3 а4 а5 а3 0 3 2 0 1 0 __ 1 2 3 2 а4 -1 1 3 0 0 1 __ 1 2 1 3 а2 0 2 -1 1 0 0 1 2 Z -1 -3 0 0 -1 2 д -3 0 0 0 3 2 Во второй симплексной таблице разрешающий столбец а1, разре- шающая строка а4. Заменяем в базисе вектор искусственных перемен- ных а4 на вектор а1 и для нового базиса строим третью симплексную таблицу: с 0 0 0 -1 -1 t базис хь а1 а2 а3 а4 а5 а3 0 1 3 0 0 1 _ 2 3 _ 1 6 а1 0 1 3 1 0 0 3 1 6 а2 0 7 3 0 1 0 3 1 3 Z 0 0 0 0 0 0 д 0 0 0 1 1 Вектор Д О, поэтому точка х — (|, j, j,0,0) является решением вспомогательной задачи с добавленными искусственными переменными, и Зтлл — 0. Перейдем к решению основной задачи. Составим первую симплекс- ную таблицу для начальной крайней точки х = (5,5,5)- Разложения вектора х по базису а3, а1, а2 берем из последней симплексной таблицы:
§ 4. Методы нахождения начальной крайней точки 119 с 1 — 2 1 t базис хь а' а2 а3 а3 1 7 3 0 0 1 а1 1 3 1 0 0 а2 — 2 7 3 0 1 0 Z — 2 1 — 2 1 д 0 0 0 Вектор Д О, поэтому точка х = (|, j, |) является решением исходной задачи и Smax = —2. Заметим, что на самом деле исходная задача тривиально решается, так как мы имеем систему из трех линейных уравнений с тремя неизвестными. И эта система имеет единственное решение х = (5,3,5). Пример 3. Решить, вводя искусственные переменные задачу: 2х, + Х2 + Зх3 + 5х4 —♦ max; х, 0, i= 1,2, 3,4, 2х| + Зх2 + х} + 2х4 < 30, 4х । Н- 2x2 + хз + 2x4 40, X] + 2x2 + Зху + х4 < 25. Добавив неотрицательные переменные в канонической форме: Хь,Хь,Ху, получим задачу 2а: । + Х2 + Зхз + 5х4 —+ max; xt 0, i = 1,..., 7, 2xi + 3x2 + хз + 2х4 + xj = 30, 4х| + 2x2 + хз +2x4 +®б =40, Х| + 2х2 + Зх3 + х4 + ху = 25. Исходная крайняя точка х = (0,0,0,0,30,40,25). Базисные ректоры а5 = (1,0,0), а6 = (0,1,0), а7 = (0,0,1). Составим первую симплексную таблицу.
120 Глава 2. Линейное программирование с 2 1 3 5 0 0 0 t базис Хъ а1 а2 а3 а4 а5 а6 а7 а5 0 30 2 3 1 2 1 0 0 15 а6 0 40 4 2 1 2 0 1 0 20 а7 0 25 1 2 3 1 0 0 1 25 2 0 0 0 0 0 0 0 0 д -2 -1 -3 -5 0 0 0 В первой симплексной таблице разрешающим столбцом является столбец а4, Разрешающая строка а5, I = 15. Заменяем в базисе вектор а5 на вектор а4 и для нового базиса строим вторую симплексную таблицу. с 2 1 3 5 0 0 0 t базис хь а1 а2 а3 а4 а5 а6 а7 а4 5 15 1 3 2 2 2 1 1 2 0 0 30 а6 0 10 2 -1 0 0 -1 1 0 а7 0 10 0 2 5 2 0 _ £ 2 0 1 4 Z 75 5 15 2 5 2 5 5 2 0 0 д 3 13 2 _ £ 2 0 5 2 0 0 Во второй симплексной таблице разрешающий столбец а3, разреша- ющая строка а7, t = 4. Заменяем в базисе вектор а7 на вектор а3 и для нового базиса строим третью симплексную таблицу для базиса а4,а6,а3: с 2 1 3 5 0 0 0 t базис •Е& а1 а2 а3 а4 а5 а6 а7 а4 5 13 1 7 5 0 1 3 5 0 £ 5 а6 0 10 2 -1 0 0 -1 1 0 а3 3 4 0 £ 5 1 0 _ £ 5 0 2 5 Z 77 5 38 5 3 5 12 5 0 1 5 д 3 33 5 0 0 12 5 0 £ 5 Вектор Д 0, поэтому крайняя точка х = (0,0,4,13,0,10,0) является решением расширенной задачи, а решением исходной задачи является точка х = (0,0,4,13), 5так = 77-
§4. Методы нахождения начальной крайней точки 121 4.4. Задачи Задачи линейного программирования в канонической форме с не- заданной первоначальной крайней точкой. Решить методом искус- ственного базиса. Х| 4-412 + Ху —> max; х< > О, i= 1,2,3, 4.1. _ х2 4- «з = 3, 2х, - 5xi — «з=0. ж, - Юхг 4- «з —> max; х, 0, i = 1,2,3, 4.2. х, — 5,5x2 — 7хз — —13, ж, - 14,5^2 4- 7«з = 15. X, 4- 2xi 4- Зхз - 4x4 —* max; х, 0, i = 1,2,3,4, 4.3. X, 4- «2 - «з 4- «4 = 2, Х| 4- 14«2 4- Юхз - 10х4 = 24. х। - 5x2 - «з 4- х4 -»max; х, 0, i = 1,2,3,4, 4.4. Х| 4- 3x2 4- Зхз 4- х4 = 3, 2х| 4- хз — х4 = 4. Х| 4- х2 4- хз 4- х4 —»max; х,0, = 1,2, 3,4, 4 5 4х| 4-2х2 4-5х3 - х4 =5, 5х, 4- Зхз 4- 6x3 - 2«4 — 5, Зх, 4- 2x2 4- 4«з — х4 =4. Xi 4-Ю«2 - хз 4-5х4 —♦ max; х; 0, i— 1,2,3,4, 4^ xi 4- 2х2 - Хз — х4 = 1, —Х| 4- 2x2 4-Зхз 4- Х4 =2, Х| 4- 5x2 4- хз — х4 =5. ж, 4- 2х2 4- Зхз 4- 4х4 4- 5х5 -» max; х, > 0, i = 1,..., 5, 4.7. 6i| X| 4- xy xi 4- «з - 2x4 4- 7x5 = 2, 4- Хз — 2X4 4- 7x5 — 2, X2 - 2«4 4- 7x5 = 2. X| 4- «2 — Хз 4- X4 — 2«5 ~* max; x, 0, i = 1,..., 5, 4 g Зх, 4- x2 4- хз 4- x4 - 2x5 = 10, 6xi 4- Xy 4- 2хз 4- 3x4 — 4«5 — 20, 10x( 4- Xi 4- Зхз 4- 6x4 — 7x5 — 30. X| - 4x2 4- x3 4- «4 4- x5 4- x6 —> max; x, 0, i = 1,. . . 6, 4 g 14xi — 14x2 4-12хз 4-5x4 4-6x5 4-3x6 = 8, x( — x2 4- 2хз 4- «5 =0, 16«i - 16«2 4- 8x3 4- 7x4 4- 4x5 4- 5x6 = 12.
122 Глава 2. Линейное программирование § 5. Транспортная задача Важный частный случай задач линейного программирования — транспортные задачи. Это математические модели разнообразных при- кладных задач по оптимизации перевозок. В этом параграфе мы приведем постановку транспортной задачи, методы отыскания исходной крайней точки, решение задачи методом потенциалов, двойственную к транс- портной задаче, обоснование метода потенциалов, задачу о назначении, примеры. 5.1. Постановка задачи Транспортной задачей по критерию стоимости называется следующая задача о минимизации стоимости перевозок. Пусть в пунктах отправления Л|,..., Ат сосредоточено соответствен- но единиц некоторого однородного груза. Этот груз следует перевезти в п пунктов назначения В},...,Вп, причем в каждый из них надлежит завезти соответственно Ъ\,...,Ьп единиц груза. Стоимость перевозки единицы груза из пункта А; в пункт Bj равна с^ . Обозначая через ж,у количество единиц груза, предназначенного к отправке из пункта А, в пункт Bj, получим задачу нахождения плана перевозок, при котором общая стоимость окажется минимальной: m п (с, ж) : = 22 J2 Wh т’п- >=| j=i xi}, 0, i = 1,..., т, j = ,п, (Р) п 22 — аи «= i,..., (а) j=i т ^Xij^bj, (b) »=i В матричном виде ограничения задачи (а)-(Ь) О О О О 1 О О 1 1 О О имеют вид: / ®п \ х12 х1п Х21 х22 х2п a-ml хт2 bl Ь2 \ 6 6 \ bn J \ /
§ 5. Транспортная задача 123 План перевозок и стоимость перевозок представляются в виде векторов х - («у, i — 1,...,т, j — 1,... ,п), с — (cij, i = I,... ,т, j — 1, ... ,п) соответственно, или матриц X = , С={с,7},=11 ..,т • Уравнения (а) означают, что из пункта отправления А{ весь груз вывезен в пункты назначения (потребления). Уравнения (Ь) означают, что количество груза, завезенного в пункт В, со всех пунктов отправления, соответствует требуемому. Естественно считать, что общий запас груза на всех пунктах отпра- вления равен суммарной потребности всех пунктов назначения, т.е. В этом случае говорят, что имеется замкнутая модель транспортной задачи. Если суммарные запасы отправителей больше суммарной потребно- т п сти пунктов назначения, т.е. а, > 52fy> то равенства (а) заменяются »=i j=i неравенствами п aijj С ai, i — 1,... ,т, j=i а условие (Ь) остается без изменений. В этом случае вводится фиктивный П1 п пункт назначения Bn+i с требуемой величиной завоза bn+1 — •=i j=i и нулевыми стоимостями перевозок в этот пункт. Добавляя новые неотрицательные переменные zin+i , i — 1,... ,т , приходим к замкнутой модели транспортной задачи с ограничениями в виде равенств (а)-(Ь). Если суммарные запасы отправителей меньше суммарных запросов ТП п пунктов назначения, т.е. 52 а> < 52 bj, то равенства (Ь) заменяются >=1 j=i неравенствами m J = 1, •••,«, а условие (а) остается без изменений. В этом случае вводится фиктивный п пункт отправления Am+, с требуемой величиной вывоза ат+| = 52 bj — j=i т 52 а> и нулевыми стоимостями перевозок из этого пункта. Добавляя »=i новые неотрицательные переменные xm+ij, j = 1,...,п, приходим к замкнутой модели транспортной задачи с ограничениями в виде равенств (а)-(Ь).
124 Глава 2. Линейное программирование 5.2. Особенности задачи Транспортная задача является задачей линейного программирова- ния и может быть решена симплекс-методом, который значительно упрощается в виду простого строения системы ограничений (а)-(Ь). Этот упрощенный метод мы и опишем ниже. Предварительно докажем некоторые утверждения, имеющие место для транспортных задач. Лемма 1. Для любой транспортной задачи существует допустимый план перевозок (Dp # 0). Доказательство. Положим x,j = , тогда уравнения (а) будут выполняться: п п , п > хц = > —- = — > b-i = —M = a,. г = 1,..., m. M M ] M ' ’ ’ j=l j=t J=1 Аналогично показывается выполнение уравнений (b). Значит x;j — допустимый план перевозок. Отметим, что поскольку значение задачи ограничено снизу нулем и допустимый план перевозок имеется по лемме 1, то в задаче (Р) по теореме существования решения п. 3.1 (|Sp| < +оо => ArgP 0) оптимальный план существует. Лемма 2. Ранг системы ограничений (а)-(Ь) равен т + п — 1. Доказательство. Если сложить первые m строк матрицы ограниче- ний А и вычесть из них последние п строк, то получим нулевую строку. Следовательно, ранг матрицы А меньше т + п. С другой стороны, располагая тп — 1 строку матрицы А (начиная со второй), под п последними строками, получим треугольную матрицу из m + n- 1 строк, ранг которой равен количеству уравнений (т + п- 1). Таким образом, ранг матрицы А равен т + п — 1. По предложению 1 п. 3.2 (столбцы матрицы ограничений, соот- ветствующие положительным координатам крайней точки, линейно независимы) и лемме 2 (количество линейно-независимых столбцов не превышает т + п — 1) крайняя точка в задаче может иметь не более т + п - 1 положительных координат. Лемма 3. Любые т + п — 1 строк матрицы А линейно независимы.
§ 5. Транспортная задача 125 Доказательство. Любая строка матрицы А (для определенности возьмем строку из системы уравнений (а)) равна сумме всех строк системы уравнений (Ь) минус сумма всех строк уравнений (а) без этой строки, то есть является линейной комбинацией оставшихся m + n- I строк. А так как ранг матрицы А равен m + n - 1, то оставшиеся строки линейно независимы. Отметим, что не любые т + п — 1 столбцов матрицы А являются линейно независимыми (приведите пример!). 5.3. Методы нахождения начальной крайней точки Рассмотрим замкнутую модель транспортной задачи. 1. Метод «северо-западного угла». Назначим максимально возможную перевозку из пункта отправления At в пункт назначения В\. То есть заполняем верхний левый элемент матрицы X первоначальной крайней точки. При этом либо пункт отправления А), либо пункт назначения В|, либо оба эти пункта окажутся полностью обслуженными. Если пункт отправления А| оказался полностью обслуженным, то в дальнейшем при нахождении первоначального плана перевозок вы- водим из рассмотрения первую строку матрицы X и рассматриваем только оставшуюся часть матрицы. Если пункт назначения В, оказал- ся полностью обслуженным, то аналогично выводим первый столбец из дальнейшего рассмотрения. Если же и пункт отправления, и пункт назначения оказались полностью обслуженными (так может случиться только в вырожденной задаче), то вывести из рассмотрения следует или первый столбец, или первую строку матрицы X. Условимся для определенности выводить из рассмотрения первый столбец матрицы. В этом случае в число базисных элементов на следующем этапе введем элемент с нулевым значением перевозки, стоящий в северо-западном углу оставшейся части матрицы X, т. е.' в базис войдет второй элемент в строке, считая вычеркиваемый элемент первым Эту процедуру продолжаем до тех пор, пока все пункты отправления и пункты назначения не будут обслужены. Последней перевозкой будет перевозка из пункта отправления Ат в пункт назначения Вп. На каждом шаге обслуживается один из пунктов отправления или назначения, а на последнем шаге обслуживаются и последний пункт отправления и последний пункт назначения. Поэтому число базисных элементов будет ровно т + п - 1. Найденный план будет допустимым планом перевозок, содержащим не более т + п — 1 положительных координат и являющийся (как будет показано ниже) крайней точкой множества допустимых элементов. Отметим, что данный метод нахождения первоначальной крайней точки не учитывает стоимости перевозок. Поэтому начальный план может оказаться далеко не оптимальным. Приведем другие методы нахождения начальной точки, учитывающие стоимости перевозок.
126 Глава 2. Линейное программирование 2. Минимум по матрице. Выберем в платежной матрице С мини- мальный элемент. Пусть min c,j = с,^. Назначим максимально воз- j можную перевозку из пункта отправления А,о в пункт назначения Если минимальная стоимость перевозки достигается на нескольких эле- ментах, то выбираем любой из них. Тем самым пункт отправления Л1о или пункт назначения Bja (или оба пункта одновременно) будет об- служен. А в платежной матрице соответствующая строка или столбец выводятся из дальнейшего рассмотрения. Если и пункт отправления, и пункт назначения одновременно обслужились, то для определенности как и в п. 1 будем выводить из рассмотрения столбец матрицы X. В оставшейся части платежной матрицы вновь ищется минимальный элемент и процедура повторяется до тех пор, пока первоначальный план перевозок не будет получен. Найденный план будет допустимым планом перевозок, содержащим не более т + п - 1 положительных координат с числом базисных элементов т+п~ 1 и являющийся крайней точкой множества допустимых элементов. 3. Минимум по строке. Выберем в первой строке платежной матри- цы С минимальный по величине элемент. Предположим min с,у = с1]п. j Назначим максимально возможную перевозку из пункта отправления А, в пункт назначения BJo. Если минимум достигается на нескольких эле- ментах, то выбираем любой из них. Тем самым пункт отправления Ai или назначения BJ0 (или оба пункта одновременно) будет обслужен. А в платежной матрице первая строка или соответствующий столбец выводятся из дальнейшего рассмотрения. В первой строке оставшейся части матрицы вновь ищется минималь- ный элемент и процедура повторяется до тех пор пока первоначальный план перевозок не будет получен (первой строкой может оказаться вновь первая строка исходной матрицы без какого-то элемента или вторая строка исходной матрицы без какого-то элемента). В итоге получаем крайнюю точку множества допустимых элементов задачи. 4. Минимум по столбцу. Выберем в первом столбце платежной ма- трицы С минимальный элемент. Предположим min с^| = с,0|. Назначим i максимально возможную перевозку из пункта отправления А,о в пункт назначения В\. Если минимум достигается на нескольких элементах, то выбираем любой из них. Тем самым пункт отправления Л,о или пункт назначения В\ будет обслужен. А в платежной матрице соответствующая строка или первый столбец выводятся из дальнейшего рассмотрения. В первом столбце оставшейся части платежной матрицы вновь ищется минимальный элемент и процедура повторяется до тех пор пока первоначальный план перевозок не будет получен (первым столбцом
§ 5. Транспортная задача 127 может оказаться вновь первый столбец исходной матрицы без какого-то элемента или второй столбец исходной матрицы без какого-то элемента). В итоге получаем первоначальную крайнюю точку. Лемма 4. Описанные выше методы нахождения первоначального плана перевозок, приводят к первоначальной крайней точке множества допусти- мых элементов. Доказательство. По предложению 1 достаточно доказать, что соот- ветствующие базисным элементам столбцы матрицы А линейно незави- симы. Отметим, что описанные методы нахождения первоначального плана перевозок содержат общий элемент действия: на каждом этапе мы выводим из рассмотрения либо столбец, либо строку матрицы X. Доказательство можно провести индукцией по числу m + п — к. Пусть т + п = 2 — минимально возможное число. Матрица А состоит из единственного элемента и утверждение очевидно. Предположим, что для т + п = к получаемые эти м методом столбцы линейно независимы. Докажем соответствующее утверждение для т+п = к+1. Не ограничивая общности, считаем, что на первом этапе выводится из рассмотрения первая строка или первый столбец (в противном случае мы можем строки или столбцы переобозначить и поменять местами). Если мы выводим из рассмотрения первую строку матрицы, то это означает, что первый пункт отправления А, обслужен полностью, Хи — базисный элемент а все элементы Q j-=- ?, п Первое ограничение уравнений (а) выполнено, в матрице ограничений А можно убрать первую строку и первые п столбцов .П случилась меньшая матрица размера (т — 1 + п) х (т— 1)п, а для нее по предположению индукции соответствующие столбцы являются линейно независимыми. Добавление столбца с единицей на первом месте (и еще на одном из последних п мест) к т + п - 2 столбцам, расширенным и начинающимся с нуля образует систему m + n - 1 линейно независимых столбцов . Если мы выводим из рассмотрения первый столбец матрицы, то это означает, что первый пункт назначения обслужен полностью, 1ц — базисный элемент, а все элементы хц = 0, i = 2, Первое ограничение уравнений (Ь) выполнено, в матрице ограничений А можно убрать тп + 1-ю строку и соответствующие тп столбцов. Получилась подобная меньшая матрица размера (тп + п - 1) х (п - 1)т, а для нее по предположению индукции соответствующие столбцы являются линейно независимыми. Добавление столбца с единицей на т + 1-м месте (и еще на одном из первых т мест) к m + n -2 линейно независимым столбцам, расширенным и имеющим на т + 1-м месте нули образует систему из т + п - 1 линейно независимых столбцов. Индукция закончена.
128 Глава 2. Линейное программирование 5.4. Метод потенциалов Сформулируем правило решения транспортной задачи методом по- тенциалов (обоснование этого метода будет дано в п. 5.7). 1. Привести задачу к замкнутой модели (см. п. 5.1). 2. Найти первоначальный план перевозок х, являющийся крайней точкой множества допустимых элементов. 3. Исследование плана перевозок х. Для найденного плана зс построить матрицу С = {cjj}i=i,...,m, с»/ — + Vj, определяя т + п потенциалов >=1,...,п Ui,Vj из системы т + п - 1 уравнений: д, + Vj = Cij для базисных индексов i,j. Эти уравнения линейно независимы (это следует из линейной незави- симости столбцов, соответствующих базисным элементам), поэтому для однозначного определения потенциалов Ui,Vj положим заранее один из потенциалов заданной величине, например, положим ц1 — 0. Замечание. Элементы Cij матрицы С не зависят от первоначального выбора и ।. Действительно. Предположим, что вместо первоначального потен- циала 14| мы бы взяли потенциал й, = М| + t. Тогда й| = V| - t и все Й, =«i+Z, Vj =Vj -t при базисных l,j, ПОСКОЛЬКУ Ui + Vj — Cij при базисных i, j. Таким образом, сумма й, + Vj = а, +1 + v}- -1 — и, 4- Vj = Cij не зависит от выбора первоначального потенциала «1. 4. Провести исследование матрицы Д: = С — С. Если Д 0, то исследуемый план х является решением задачи (Р), а потенциалы Ui,Vj являются решением двойственной задачи. Если среди элементов матрицы Д есть отрицательные, то выберем наименьший элемент. Пусть, например, Д,^а= min Д,-у < 0. 5. Построить новый план перевозок, являющийся крайней точкой множества допустимых элементов. Положим = t, x'ij = х^ ± t для базисных индексов i, j, где t — некоторая положительная величина (не изменяя остальные небазисные компоненты а:1; равные нулю) так, чтобы по-прежнему были нео- трицательны, но одна из базисных компонент обратилась бы в ноль. Вектор матрицы А, соответствующий этой компоненте, выводим из чи- сла базисных, а вектор матрицы А, соответствующий переменной x,ojo, вводим в число базисных векторов. Далее вновь начинаем исследование полученной крайней точки х', т. е. возвращаемся к п.З. В невырожденной задаче в ноль может обратиться только одна из компонент вектора х . В вырожденной задаче в ноль может обратиться несколько компонент. В этом случае из числа базисных векторов ис- ключается любой вектор с нулевым значением, как правило исключается вектор с наибольшей стоимостью перевозок.
§ 5. Транспортная задача 129 5.5. Примеры транспортных задач Пример 1. 2Хц + 2iC| 2 + 4Х|3 + 8Х|4 + 4х2, + 5х22 + 7х23 + 6г24 + + 6г3, + Зх}2 + 4г33 + 9г34 —> min; ®|| + х 12 + х 13 + х 14 — 14, «21 + г22 + г23 + г24 - 18, «31 + «32 + хзз + «34 = 16, «и + «21 + «31 22, «12+ «22 +«32^ 2, «13 + «23 + «33 17, «14 + г24 + г34 И, «0^0, г =1,2,3, j = 1,2,3,4. Решение. Поскольку суммарные запасы груза на всех пунктах отправления меньше суммарных запросов пунктов назначения, т. е. 3 4 52 <ч = 48 < 52 62 =52, то надо привести задачу к замкнутой модели. i=l 2=1 Введем фиктивный пункт отправления Л4 с требуемой величиной выво- 4 3 за а4 = J2 62 — 52 ai = 4 и нулевыми стоимостями перевозок из этого 2=1 1=1 пункта Зададим транспортную задачу в виде платежной матрицы: ft, =22 ft2 = 2 ft3 = 17 ft4 = 11 а, = 14 2 2 4 8 а2 = 18 4 5 7 6 а2 - 16 6 3 4 9 а4 = 4 0 0 0 0 Построим по методу «Северо-западного угла» первоначальное распреде- ление: ft, = 22 Ь2 = 2 Ьз = 17 Ь4 = И а, = 14 14 а2 = 18 8 2 8 а 2 = 16 9 7 а4 = 4 4 Для краткости в матрице плана перевозок не пишем нулевые значения небазисных перевозок. Значение функционала равно 225. Число ненуле- вых элементов в первоначальном плане перевозок m+n— 1 = 4+4—1 = 7. 5 Зак. 60
130 Глава 2. Линейное программирование Это позволяет сразу перейти к исследованию на оптимальность найден- ного плана. Построим матрицу С’: «1=2 «2 = 3 «з = 5 «4 = 10 «1=0 2 3 5 10 «2 = 2 4 5 7 12 «з = -1 1 2 4 9 «4 = -10 -8 -7 -5 0 /0 -1 -1 -2\ D A 1 0 0 0 “б 1 Г В матрице Д = С-С = К । минимальный элемент \8 7 5 0 / Д24 = min Дн = —6 < 0. Добавляя в первоначальный план распределе- ния на место нулевого небазисного элемента величину t, получим второй план возможных перевозок 14 8 2 8-t t 9 + t 7-t 4 14 8 2 1 7 16 4 Величина t = 7. Значение функционала = 183. Построим матрицу С: «1=2 «2 = 3 «з = 5 «4 = 4 «1=0 2 3 5 4 «2=2 4 5 7 6 «з = — 1 1 2 4 3 «4 = —4 —2 -1 1 0 -1 0 1 1 -1 0 0 -1 4\ 0 I & I минимальные элементы 0/ /0 В матрице Д = С — С = I \2 Д|2 = Дн = Д43 = min Д,, = -1 < 0. Во множество базисных элементов •J включим элемент Z43 с наименьшей стоимостью перевозок. Добавляя в первоначальный план распределения на место нулевого небазисного элемента £43 величину t, получим третий план возможных перевозок: * В матрице С базисные элементы будем рыделять полужирным шрифтом.
§ 5. Транспортная задача 131 14 8 2 1 -t 7+t 16 1 4 —t 14 8 2 8 16 1 3 Величина t = 1. Значение функционала = 182. Построим матрицу С: v, = 2 v2 = 3 «3=4 «4=4 «i — 0 2 3 4 4 1*2 = 2 4 5 6 6 «з = 0 2 3 4 4 «4 = —4 —2 -1 0 0 (О -1 0 4\ О 0 1 О I 4 0 0 5 1 минимальный элемент 2 10 0/ Д12 — min Д,, = — 1 < 0. Добавляя в первоначальный план распределения на место нулевого небазисного элемента хц величину t, получим четвертый план возможных перевозок 14 -t t —► 12 2 8 + t 2-t 8 10 8 16 16 1 3 I” 1 3 Величина t — 2. Значение функционала — 180. Построим матрицу С: «1—2 «2 = 2 «3=4 «4 = 4 «i=0 2 2 4 4 «2 = 2 4 4 6 6 «3 = 0 2 2 4 4 «4 = —4 -2 -2 0 0 (0 д 2 о 1 1 2 0 1 0 0 4\ 0 I 0, то найденный четвертый 0/ план перевозок является оптимальным и суммарная стоимость 180. 5*
132 Глава 2. Линейное программирование Пример 2. in + 2х12 + Зги +4®|4 + 4х2| + За:22 + 2х23 + 2г32 + 2г33 + х34 —► min; ®11+®12+®13+а:14 = 3, ®21 + ХП + «23 + «24 = 4, «31 + «32 + «33 + «34 = 5, Xij^O, i= 1,2,3, III +121 + «3i =2, «12 + «22 + «32 = 3, «13 + «23 + «33 = 4, «14 4? «24 + «34 — 3, j = 1,2,3,4. Решение. Поскольку суммарные запасы отправителей равны суммар- 3 4 ным запросам потребителей, т. е. 52 а‘ — 52 Ь; = 12, то данная задача i=i >=1 является замкнутой моделью транспортной задачи. Зададим задачу виде платежной матрицы: Ь. = 2 Ь2 - 3 Ь3 =4 Ьа = 3 а, = 3 1 2 3 4 а2 = 4 4 3 2 0 аз = 5 0 2 2 1 Построим по методу «Северо-западного угла» первоначальное распреде- ление: Ь,=2 Ь2 = 3 Ъ3 = 4 д4 = 3 а, =3 2 1 а2 - 4 2 2 а3 = 5 2 3 Для краткости в матрице плана перевозок не пишем нулевые значения небазисных перевозок. Значение функционала равно 21. Число ненуле- вых элементов в первоначальном плане перевозок m+n —1 — 3+4 — 1 = 6. Это позволяет сразу перейти к исследованию на оптимальность найден- ного плана. Построим матрицу С: «1 - 1 «2 = 2 v3 = 1 «4 = 0 «1=0 1 2 1 0 «2 = 1 2 3 2 1 «3 = 1 2 3 2 1 _ / 0 0 2 4 \ В матрице Д = С — С = I 2 0 0 —1) минимальный элемент \ —2 — 1 0 0 / Д31 = min Ду = —2 < 0. Добавляя в первоначальный план распределения
базисных элементов в базисе Величина t = 2. Из трех обнулившихся оставили два элемента с наименьшими стоимостями перевозок. Значение функционала равно 17. Построим матрицу С: V, = 1 «2 = 2 «з = 3 «4 = 2 «1=0 1 2 3 2 «2 = -1 0 1 2 1 «3 = -1 0 1 2 1 О О О О 2 1 2 \ -1 ] минимальный элемент О / - /° В матрице Д = С — С = 14 \0 Д24 = mi.n Ду = — 1 < 0. Добавляя в первоначальный план распреде- ления на место нулевого небазисного элемента ж 24 величину t, получим третий план возможных перевозок «1 = 1 «2 = 2 «з = 3 «4 = 1 «1=0 1 2 3 1 «2 = - 1 0 1 2 0 «3 = -1 0 1 2 0 О 2 1 план - /° В матрице Д = С - С = I 4 \0 ны. Значит найденный третий и суммарная стоимость всех перевозок равняется 14. 3\ О ] все элементы неотрицатель- 1 J перевозок является оптимальным О О О
134 Глава 2. Линейное программирование Пример 3. 5хц + 4X|J + 1 ЗХ|3 4- 9Х|4 + 2xj| + 7X22 + + 8xj4 + +9x3t+7x32+llx33 + 7x34 + X4i+6x42+X43 + X44 -» min; «II + «12+ «13 + «14 = 19, «и+«21+«3i+«4i = 9, «21 + «22 + X23 + «24 = 7, X\2 + «22 + «32 + «42 = 17, «31 + «32 + X33 + X34 = 1 1, I|3 + X23 + «33 + «43 = 15, ®4I + X42 + X43 4- X44 =15, Z|4 + ®24'+ X34 + «44 =11, «•j 0, *,J = 1,2,3,4. Решение. Представим задачу замкнутого типа в стандартной форме: Ь, =9 bi = 17 Ь3 = 15 Ь4 = 11 а| = 19 5 4 13 9 аг = 7 2 7 6 8 а2 = 11 9 7 11 7 а4 = 15 1. 6 1 1 Построим по методу «Северо-западного угла» первоначальный план: 6, =9 Ь2 = 17 Ь3 = 15 i>4 = 11 а, = 19 9 10 а2 = 7 7 0 а2 = 11 11 а4 = 15 4 11 Для краткости в матрице плана перевозок не пишем нулевые значения небазисных перевозок. Значение функционала равно 270. Число элемен- тов в базисе т + п- 1 = 44-4 - 1 = 7. Один базисный элемент оказался нулевым. Это означает, что задача является вырожденной. Перейдем к ис- следованию на оптимальность найденного плана. Построим матрицу С: «1=5 «2 = 4 «з = 3 «4 = 3 г»| = 0 5 4 3 3 «2 = з 8 7 6 6 «з = 8 13 12 11 11 «4 = -2 3 2 1 1 0 0 —5 4 10 0 0 0 6 \ 2 I . I минимальный элемент —4 1 0 / (0 -4 —2 Д21 = min &ij = —6 < 0. Добавляя в первоначальный план распределе-
§ 5. Транспортная задача 135 ния на место нулевого небазисного элемента £21 величину t, получим Второй план возможных перевозок 9-t 10+t t 7-t 0 11 4 11 2 17 7 0 И 4 11 Величина t = 7. Значение функционала = 228. Построим матрицу С: «1 = 5 «2 = 4 «з = 9 «4 = 9 U| - 0 5 4 9 9 «2 = -3 2 1 6 6 «з = 2 7 6 11 11 U4 = —8 -3 —4 1 1 /0 0 4 0 \ В матрице Д = С — С = | 0 1 2 6 1 0 0 2 1 Л . 1 минимальный элемент —4 1 \4 10 0 0 / Д34 — min Ду = —4 < 0. Третий план перевозок 2 17 7 0 11—t t 4+t 11 —t 2 17 7 0 11 15 0 Величина t = 11. В этом случае обнуляются сразу два базисных эле- мента. Оставим из них в базисе элемент Х44 с наименьшей стоимостью перевозок. Значение функционала равно 184. Построим матрицу С: «1=5 «2 = 4 «з=9 «4 = 9 «1 = 0 5 4 9 9 «2 = -3 2 1 6 6 «3 = —2 3 2 7 7 «4 = —8 -3 —4 1 1 (0 0 4 0\ ? с ? n I 0- Значит третий план О j 4 U I 4 10 0 0/ Перевозок является оптимальным и стоимость всех перевозок равна 184.
136 Глава 2. Линейное программирование 5.6. Задача двойственная к транспортной задаче Рассмотрим транспортную задачу: т п {с,х) : = 5? 52 Ci>a:o min; •=i j=i Xij0, — 1,..., т, j = 1,... ,п, (Р) п 52 ха = <»»> i = !>• ••>«*> (а) т ^Xij = bj, j = (b) >=i / m n \ замкнутого типа ( 52 a< ~ 52 = Af ). Двойственной к ней будет \.=i j=i / (см п. 2.5) задача т п {а, и) + (b, v): = 52 а>и‘ + 52 bjVj —» max; ui+vj^Cij, i =1,..., m, (P”) в которой двойственными переменными являются потенциалы и = («I, --,«т), V = В матричном виде ограничения задачи (Р**) имеют вид: 1 О 1 О О 1 О О 0 1 1 О О 1 О 1 ООО О 1 О О 0 1 6 1 ООО О 6 О О i i 6 1 0 1 \ 6 6 . i 6 6 Матрица ограничений является транспонированной по отношению к ма- трице ограничений исходной транспортной задачи (Р).
§ 5. Транспортная задача 137 5.7. Обоснование метода потенциалов решения транспортной задачи Теорема. Крайняя точка х является решением в невырожденной транс- портной задаче (Р) тогда и только тогда, когда вектор Д 0. Доказательство. Достаточность. Пусть Д 0. Это означает, что для точки х найдены потенциалы u,,Vj такие, что Д<7: = c,j - = c,j — (и, + Vj) 0, i = 1,... ,m, j — 1,... ,7i, причем = Cij для базис- ных i,j (множество базисных индексов обозначим В). Следовательно, «, + Vj С Cij, i — 1,... ,771, j = I,..., 7i. Таким образом, условие Д 0 равносильно тому, что вектор (u,v) является допустимым в двойственной задаче (Р**). С другой стороны, поскольку Xij = 0 при (г, j) £ В, то т п т п (с, х) = У ' 5 CijXij ~ У ' CijXij = ' («j + Vj)Xij = 5 ' 5 + Vj)xij- i=l j=l lj€B ijCB 1 = 1 j=l Разбивая последнюю сумму на две и учитывая условия (а) и (Ь), продолжим последнее равенство т п т п т п пт (с,Х)=52 52 “^+5252 ^52и* 52 = t=i >=1 i=i j=i i=i j=i j=i i=i ч m n — 52 uia> + 52 vj^j = (a>v)- .=1 j=i Отсюда по критерию решения п. 3.1 x — решение в прямой зада- че (Р), а (и, v) — решение в двойственной задаче (Р*‘). Необходимость. Пусть х — оптимальный план. Докажем, что тогда Д 0. Проведем доказательство от противного. Допустим, что это условие не выполняется, т.е. существует Д1о;о < 0. Поскольку Д17 = 0 Для (i, j) € В, то (i0, jo) & В. Возьмем достаточно малое t > 0 так, чтобы х + t 0, где вектор t = выбирается по методу потенциалов, ±t или 0, t, 0, *>У € В, ‘ = «о, 3 = Зо, иначе. Условия (а)-(Ь) допустимости вектора х +1 в задаче (Р) равносильны условиям: 52^ = 0, ; = l,..,7i; 52<о=0. (*) i=i j=i
138 Глава 2. Линейное программирование Поскольку Cij = &ij + Cij = Д,у 4- (о, + Vj), то т п (с, X + I) - (с, х) = (с, Г) = ^2 У?(Л0 + («• + = •=| 7=1 m п т п пт t=l >=l i=l j=l 7=) i=l Последние два слагаемых в этой сумме равняются нулю в силу соот- ношения (*). Слагаемые Aijtij = 0 при (i,j) (io, jo), так как в этом произведении один из сомножителей равен нулю: Д,у = 0 при (i,j) € В, tij = 0 при (i,j) & В, (i,j) (io, jo)- Таким образом, (c,i +1) - (с,х) = Д-ш&м < О, значит, х не является оптимальным планом. Получили противоречие. Следовательно, наше допущение, что существует А,0>0 < 0 неверно и, если х — оптимальный план, то обязательно Д 0. 5.8. Задача о назначении. Пример Пусть некоторая фирма нанимает т служащих на п вакантных мест. Известно, что при назначении »-го служащего на j-e место фирма получит Cij прибыли. На какие должности кого надо назначить, чтобы общая прибыль фирмы после назначений была наибольшей? Таким образом, задача о назначении является частным случаем транспортной задачи о максимуме функционала, когда а, = bj = 1, i = 1,... ,т, j = 1,... ,п: т п (с,х): — шах; xij 0, j = l,...,n, i=l 7=1 тп п = 1. j = l,...,n; У2х0 = 1> « = i=t 7 = 1 Задачи о назначении также решаются методом потенциалов, предва- рительно перейдя от задачи на максимум к задаче на минимум т п -(с,х) = min .=1 7=1 Поэтому, если в платежной матрице задачи о назначении стоимости были Cij, то при решении методом потенциалов берутся стоимости — qj.
§5. Транспортная задача 139 *11 + *12 + *13 ~ 1 *21 + *22 + *23 = 1 *31 + *32 + *33 = 1 Пример. 5гц + 4х|2 + 7х13 + 6х2| + 7х22 + Зх23 + 8х31 + 11х32 + 2х33 -» max; *11 + *21 + *31 = 1> *12 + *22 + *32 = 1> *13 + *23 + *33 = 1> i,j = 1,2,3. Решение. Задачу о назначении можно задать в виде платежной матрицы, не указывая величины a,,bj, поскольку они равны 1: 5 4 7 6 7 3 8 11 2 Перейдем от задачи на максимум к задаче на минимум, при этом в платежной матрице стоимости поменяют свой знак: -5 —4 — 7 -6 -7 -3 -8 -11 —2 Построим по методу «Северо-западного угла» первоначальное рас- пределение. Два нулевых элемента будем считать базисными, чтобы число элементов в базисе было т + п — 1 = 34-3—1 = 5. Выберем их так, чтобы они имели минимальные стоимости. 1 1 0 0 1 Значение функционала равно -14. Построим матрицу С: til = -5 «2 — —8 v3 = 1 = 0 -5 — 8 1 u2 — 1 —4 —7 2 u3 — —3 -8 -11 -2 В матрице Д = С — С — О -2 О 4 О О -8\ —5 I минимальный элемент О / А|3 = min Дн = —8 < 0. Добавляя в начальный план распределения м
140 Глава 2. Линейное программирование § 5. Транспортная задача 141 на место нулевого небазисного элемента величину t, получим второй 5.9. Задачи 1-t t 1 o+t 0 1-t 0 1 1 1. 0 5.1. 2хц + Зх)2 + 4хи + х)4 + Зх2) + 4х22 + 2х2з + 5х24 + ®з> + 7х32 + 5х33 + 7хз4 + 5х4| + 2х42 + 8х4з + 2x44 ► min, Величина t — 1. Из двух обнулившихся базисных элементов в базисе оставили элемент с наименьшей стоимостью. Значение функционала равно —22. Построим матрицу С: X, । + X12 + х 13 + X14 = ®21 + х22 + ^23 + г24 — Х31 + ®32 + ®33 + ®34 = Х4| + ®42 + ®43 + ®44 — У, Х|| + Х2| + Х31 = Н 8, Х)2 + Х22 + «32 = 2. 5, Х|3 + Х23 + ®33 = 6, 6, Х|4 + Х24 + ®34 = 7 = -5 «2 = -8 «3 = -7 «1=0 -5 -8 — 7 «2 = 1 —4 — 7 -6 «з = —3 -8 -11 -10 Ху 0, i, j = 1,2,3,4. 5.2. Х|। + Зх|2 + Юхи + 6х|4 + 7x21 + 2x22 + 5^23 + 8х24 + 5хз| + 2хзг + 2хзз + 9хз4 + 2х4| + х42 + Зх4з + 4x44 —* min; _ / 0 4 0\ В матрице Д = С - С = [ -2 0 3] минимальный элемент \ 0 0 8/ Д21 = min Ду = -2 < 0. Добавляя во второй план распределения на место нулевого небазисного элемента Х21 величину t, получим третий план распределения должностей X| I + Х|2 + Х13 + Х|4 = 6, Х21 + х22 + Х23 + ®24 = 18, ®31 + г32 + ХЗЗ + Хз4 = 14, Х4| + Х42 + Х4з + Хф4 = 10, Xi 1 + х2| + X3I + х4| — 14, Х|2 + Х22 + ®32 + ®42 = И> Х|3 + ж23 + хзз + Х4з = 8, Х14 + Х24 + Х34 + Хф4 = 15, Ху 0, i,j = 1,2,3,4. 5.3. 4Х|, + ЗХ|2 + Зх,з + 6х2| + 4X22 + 5X23 + 5X31 4- 4х32 + 6х33 + 6х41 + 9х42 + 10х4з —» min; 0 1 t 1-t 1-t 0+t 0 1 1 0 1 Хц + Х|2 + Х|3 8, Х21 + Х22 + Х23 17, Х31 + Х32 + Хзз 7, х4| + Х42 + Х43 4, Хп +Х21 +Х3|+Х4| = 5, Х)2 + Х22 + Х32 + Х42 = 15, Х13 + Х23 + Хзз + Х43 — Ю» Величина t = 1. Из двух обнулившихся базисных элементов в базисе оставили элемент с наименьшей стоимостью. Значение функционала равно —24. Построим матрицу С: «1 = -5 «2 ~ -8 «3 = —7 «1=0 -5 -8 — 7 «2 = -1 -6 -9 -8 «з = - 3 -8 -11 -10 Xij 0, г,= 1,2,3,4, j= 1,2,3. 5.4. 2хц + 6xi2 + 2х|3 + Х|4 + 2х|5 + 9х2| + 4х22 + Зх2з + 4х24 + Зх25 + 5хз| + 2х32 + 8x33 + 2х34 + 5хзз —» min; Х|| + Х|2 + Х|з + Х|4 + Х15 = 13, Х21 + Х22 + Х23 + Х24 + Х25 = 11, Х31 + Х32 + Хзз + Х34 + Х35 = 27, Хп +Х21 + х31 = 15, Х|2 + Х22 + ®32 — 7, Х|3 + Х23 + Хзз = 14, Х14 + Х24 + Хз4= 9, Х|5 + Х25 + Х35 - 6, _ /0 4 0\ В матрице Д = С — С = ( 0 2 51 все элементы неотрицательны. \0 0 8/ Значит найденное распределение является оптимальным и значение исходной задачи равняется 24. Ху^О, i= 1,2,3, j = 1,2,3,4,5.
142 Глава 2. Линейное программирование Ответы к задачам главы 2 1.1. (1,3,0) G Arg; Smax = 4. 1.2. (0,3,0,2), (2,1,0,0) G Arg Р; 5так = 5. 1.3. (0,4,0,0) G Arg; Smax =4. 1.4. (2,0,3,0) G Arg; Smax = 5. 1.5. (5,3,0,0) G Arg; Smax = 8. 1.6. (1, 1,1,0) GArg; Smax = 3. 1.7. (5,0,3,4,0) G Arg; Smax = 15. 1.8. (1,2,3,0,0,0) G Arg; 5max = 2. 1.9. (5,0,4,1,0,1,0) G Arg; Smax = 10. 4.1. (5, 2,0) G Extr, (5,2,0) G Arg; 5max = 13. 4.2. (1,0,2) G Extr; Smax =+oo, ^(1,-10,1), (1 + 10t,t,2 += 9 = 3 + — t —» +oo при t —> +oo. 14 4.3. G Extr, (4,0,2,0) G Arg; Smax = 10. /9 2 \ /7 2\ 4.4. (-,0,-,0j G Extr, (-,0,0,-) GArg; 5max = 3. 4.5. (0,1,1,2) G Extr, (1,2,0,3) GArg; Smax =6. 4.6. D = 0 => Smax = -oo. 4-7. (0,0,0,0, -) G Extr; Smax = +oo, ^(1,2,3,4,5), (o, 0,0, t, | = IQ 3&* —» +oo при t —» +oo. 4.8. (0,0,10,0,0), (10,0,0,0,10) GArg; Smax = -10. 4.9. (0,0,0,1,0,1) G Extr, (0,0,0,1, Q, 1) G Arg; = 2. 5.1. «и — 4, гм = 3, x2l = 2, x23 = 6, x3I = 5, x42 = 2, - 4; Smin 46. 5.2. Ж|| =6, x22 = 11, x24 7, x3i = 6, x33 = 8, 14, = 2, £44 = 8; Smin =166. 5.3. x\3 = 8, x22 = 15, x23 = 2, iji = 5; Smin = 114. 5.4. afl( — 10, xi3 = 3, x23 — 11, ar31 = 5, x3I = 7, xM — 9, x3s = 6;
Глава 3 Вариационное исчисление Началу появления вариационного исчисления дала толчок работа И. Бернулли 1696 года «Новая задача, к решению которой приглашаются математики», в которой поставлена задача о брахистохроне. В вертикаль- ной плоскости даны две точки А и В. Определить путь AM В, спускаясь по которому под действием собственной тяжести тело М, начав двигаться из точки А, дойдет до точки В за кратчайшее время. Вводя в плоско- сти систему координат так, чтобы ось t была горизонтальна, а ось х вертикальна, и пользуясь законом Галилея о скорости тела, падающего вниз под действием силы тяжести, нетрудно выписать формализованную постановку задачи: —— _ - dt —» min; a: (to) = Хо> x(ti) = <0 Здесь и далее точка над функцией (i2(t)) означает производную этой функции по t. Эта задача была решена самим И. Бернулли, а также Я. Бернулли, Лейбницем, Лопиталем и Ньютоном. Решение Лейбница было осно- вано на аппроксимации кривых ломаными. Развитая затем в работах Эйлера, эта идея заложила основы прямых методов в вариационном исчислении. Выписанная выше задача об экстремуме интегрального функционала при заданных условиях на концах, является простейшей задачей вариационного исчисления, к рассмотрению которых мы сейчас и перейдем. В третьей главе приводятся также и другие элементарные задачи вариационного исчисления: задача Больца, изопери метрическая задача. Все они являются частными случаями более общей задачи Лагранжа. Как частные случаи задачи Лагранжа рассматриваются задача с подвижными концами и задача со старшими производными.
144 Глава 3. Вариационное исчисление § 1. Простейшая задача классического вариационного исчисления 1.1. Постановка задачи Простейшей задачей классического вариационного исчисления называ- ется следующая экстремальная задача в пространстве C'([to, t|]>R): ti /(□;(•))= J dt —» extr; x(t0) = Xq, a:(t|) = acl. (P) to Здесь L — L(t,x,x) — функция трех переменных, называемая инте- грантом. Отрезок [to, ii] предполагается фиксированным и конечным, to < t|. Экстремум в задаче рассматривается среди непрерывно диф- ференцируемых функций х € C'([t0, t|],R), удовлетворяющих условиям на концах, или краевым условиям: x(tQ) = Xq, a:(t|) = x,. Такие функции называются допустимыми. Введем норму в пространстве С*([to, tj): ll»llc”([to,M): = max{||y||c([t0,(|]), Пз/Нсфо,(,])}, гДе Il3/llc([to,t||): = max{|y(t)| 11 € [to, tj}. Для краткости введем следую- щие обозначения Нз/По: = ||з/||с(1*о,*|]>, ПуНь = Пз/Пс'фо.М), которыми будем пользоваться в дальнейшем. Определение. Говорим, что допустимая функция £ доставляет сла- бый локальный минимум в задаче (Р), и пишем х € wlocmin’P, если существует 6 > 0 такое, что /(□;(•)) /(i( )) для любой допустимой функции х (х € D(P)), для которой ||а:( ) - f( )||i < 6. Наряду со слабым экстремумом в классическом вариационном ис- числении также изучается сильный экстремум. При этом расширяется класс функций, среди которых рассматривается задача. Сильный мини- мум ищется в более широком пространстве, чем С1 ([to, tj), а имен- но, в пространстве кусочно-дифференцируемых функций PC'([to, t(J). Строгое определение сильного экстремума будет дано в главе 5 п. 1. Однако, как правило, функции доставляющие абсолютный (гло- бальный) экстремум в С1 или PC1, доставляют абсолютный экстремум и среди более широкого класса функций — всех абсолютно непрерывных функций, на которых функционал I определен. * weak — слабый.
§ 1. Простейшая задача КВИ ] 45 Вывод уравнения Эйлера с помощью основной леммы вариационного исчисления Пусть функция х доставляет слабый локальный экстремум I j С V, locextr Р), функции L, LZ,LZ — непрерывны как функции иных, Lz € С1 ([to, ill). Тогда выполнено уравнение Эйлера ~^-Lz(t) + Lz(t) = O VtG[to, ti). at ~ d I - d | Здесь Lz(t)-. = ~L(t,x,x)\ , аналогично Lz(t): = —L(t,x,x)\ . i=i<0 «=*(<) Выписанное дифференциальное уравнение второго порядка было впер- вые в 1744 году выведено Эйлером. Он, аппроксимируя кривые ломаны- ми, вывел уравнение, которому были должны удовлетворять экстремали. Впоследствии Лагранж назвал его уравнением Эйлера. Сам Лагранж вы- водил это уравнение (в 1759 году) вариируя кривую, подозреваемую на экстремум. Выделил из приращения функционала главные линей- ные части, которые называл вариациями, и воспользовался тем, что в точке экстремума вариация должна обращаться в нуль. Метод вариа- ции Лагранжа стал общепринятым. Этим методом мы и выведем далее уравнение Эйлера. Функции, удовлетворяющие уравнению Эйлера задачи (Р), назы- ваются экстремалями. Множество экстремалей обозначаем Е(Р). До- пустимые функции (класса С1 с заданными граничными условиями), удовлетворяющие уравнению Эйлера, называются допустимыми экстре- малями. Множество допустимых экстремалей обозначаем DE(P). Доказательство. Возьмем произвольную, но фиксированную функ- цию h G Cq([to, 11]). Здесь мы пользуемся следующим обозначением: C<5([to, М) = {М) е <7*([to, t,]) I h(to) = h(t.) = 0}. Поскольку x 6 wlocextrP, то функция одного переменного <р(Х): = !(£() + АЛ()) = yz(t,i(t) + AA(t),i(i) + A/i(t))dt to имеет экстремум при А = 0. Положим P(t, А) = L(t,x(t) + A/i(t),x(t) + Aft(t)). Из условий гладкости, наложенных на L, х, h, следует, что функция <р дифференцируема в нуле. (Действительно, функции F и Р> непрерывны в некотором прямоугольнике [to, t|J х [—Ао, Ао], и, значит по известной теореме из анализа можно дифференцировать под знаком интеграла.) Но тогда по теореме Ферма <р'(0) = 0. Дифференцируя функцию <р и полагая А = 0, получаем
146 Глава 3. Вариационное исчисление = J4- Lx(t)h(t)) dt = о V h e Cd(|to, ti 1). (1) to Проинтегрируем по частям первое слагаемое в соотношении (1) для Л g <^o(Ro, М) (здесьмы пользуемся условием теоремы, что Lx е С'([<о, <i])): <1 «I <, t, / Lxhdt = I Lxdh = Lx(t)h(t)\ - / h^-Lxdt = - / h^-L±di. J J It» J dt J dt to t<) to to Свободные члены при интегрировании по частям равняются нулю, так как Л(<о) = Л(<|) - 0. Тогда соотношение (1) перепишется в виде ti / + £’<0)л(0<И = 0 V h G C(J(fio, til). (2) to Основная лемма классического вариационного исчисления (лем- ма Лагранжа). Пусть функция а непрерывна на отрезке [<о, М (« € С(Ио, til) и t| У a(t)h(t)dt = 0 V h е Со ([«о, М). to Тогда a(t) = 0. Доказательство леммы. Предположим а(т) 0 в некоторой точке т € ko> (допустим а(т) > 0). Тогда в силу непрерывности функция a(t) > 0 и в некоторой окрестности точки т, например, отрезке [т0, Л] С [t0> «1]. Пусть Л 6 C(J([to, t| ]) — положительная в этой окрестности функция и равная нулю вне ее, типа «шапочки», например, h(t)_ /(t-To)2(t-T|)2, ТЕ fr0, Т|], W [0, т£[т0, т,]. Тогда h € C(J([to, tj) — допустимая в лемме функция, но ti J a(t)h(t) dt > 0, to что противоречит условию леммы. Лемма Лагранжа доказана. По лемме Лагранжа из соотношения (2) вытекает уравнение Эйлера.
§ 1. Простейшая задача КВИ 147 1.3. Вывод уравнения Эйлера с помощью леммы Дюбуа-Реймона В этом пункте мы выведем уравнение Эйлера для меньших условий гладкостей, наложенных на интегрант L. Вместо леммы Лагранжа будем использовать лемму Дюбуа-Реймона. Теорема. Пусть функция £ доставляет слабый локальный экстремум в задаче (Р) (А € wlocextrP), функции L,Lx,Lx — непрерывны в некото- рой окрестности расширенного графика Г^: = {(t,£(t),i(t)) 1t G [to, ti]} (L,Lx,Li G C(<7(Ffi))). Тогда L± — непрерывно дифференцируемая функ- ция (L± € C1 ([to, tj])) и выполнено уравнение Эйлера d- --Zi(t) + Zx(t) = o vte[to, t,l. at Доказательство. Возьмем произвольную, но фиксированную фун- кцию Л € Cg([to, ti]). Поскольку £ G wlocextrP, то функция одного переменного <р(Х): = !($(•) + АЛ()) = У L(t,4(t) + A/i(t),i(t) + Ah(t)) dt io имеет экстремум при А — 0. Положим P(t, А) = L(t,£(t) + AA(i),i(t) + Ah(i)). Из условий гладкости, наложенных на L,£,h, следует, что функция tp дифференцируема в нуле. (Действительно, функции F и Рд непрерывны в некотором прямоугольнике [to, ti] х [-Ао, Ао], и, значит по известной теореме из анализа можно дифференцировать под знаком интеграла.) Но тогда по теореме Ферма <р'(0) = 0. Дифференцируя функцию <р и полагая А — 0, получаем <1 v>'(0) - у(Хг(0л(0 + ^(0Л(0)л = 0 V h g ci([tg, t,l). (I) <0 Здесь мы не можем, как в предыдущем случае, брать второй интеграл по частям, поскольку не задана дифференцируемость функции Уравнение (1) означает, что вариация по Лагранжу функционала J равна нулю: 6i(4(),h()) = о vfteqjato.t!]).
148 Глава 3. Вариационное исчисление Лемма Дюбуа-Реймона. Пусть функции ao,ai € C([t0, t([) и <! У (a,(t)A(t) + во(0А(0) dt = О V h G ([t0, tj). Тогда функция в| (Е С1 ([to, ti ]) и выполняется дифференциальное уравнение -—at(i) + ao(t) = О V t 6 [to, t|] (аналог уравнения Эйлера). at Из леммы Дюбуа-Реймона и соотношения (1) следует утверждение теоремы. Доказательство леммы. Возьмем функцию р G С1 ([to, tj) такую, что <1 <1 p(t) = aQ(t), jp(t)dt = J a^tydt. to h Она существует, так как p(t) = eo(t) — дифференциальное уравнение 1-го порядка, решение которого определено с точностью до константы, а выбором константы можно удовлетворить второе условие. Тогда для любой функции h G Cj ([to, ii ]) по условию леммы должно выполняться равенство ai(i)ft(t) + a0(t)A(t)) dt — i io <0 <0 *0 *0 t Возьмем функцию h(t) = /(ц|(т) — p(r))<tr. Тогда h, = в| — p и *0 h € C(J([to, t| ]). Действительно, равенство A(t0) — 0 следует из определе- ния функции h, равенство h(t\) = 0 вытекает в силу выбора функции р: A(ti) = J(a.(f) -p(t))dt = 0. Значит для функции h должно выпол- мяться равенство (2), то есть J(ai — р)г dt — 0. Отсюда следует, что ai(t) = p(t). Таким образом в) € C'([t0, t,|) и - — в|(0 + ao(t) = 0. dt Лемма Дюбуа-Реймона, а вместе с ней и теорема доказаны.
§ 1. Простейшая задача КВИ 149 1.4. Векторный случай Мы сформулировали теорему для одномерной простейшей задачей классического вариационного исчисления. Аналогично ставится вектор- ная задача и формулируются необходимые условия экстремума. Пусть x(t) = (x^i),... ,xn(t)) — n-мерная вектор-функция, инте- грант L = L(t,X\,... ,хп,Х\,... ,хп) — функция 2n + 1 переменного. Рассмотрим задачу L(t,Xf,...,х„,а!|,... ,xn)dt —> extr; io Xi(tj) — Xij, »=l,...,n, j =0,1. Необходимые условия экстремума в простейшей векторной задаче состоят из системы уравнений Эйлера --^,(0 + ^(0 = 0, *=1,...,п. at Доказательство теоремы в векторном случае тривиально редуцируется к одномерному случаю. 1.5. Интегралы уравнения Эйлера Если интегрант L = L(t, х, х) не зависит явно от одной из перемен- ных, то уравнение Эйлера сводится к более простым уравнениям. 1. Если интегрант L — L(t,x) не зависит явно от х, то имеет место интеграл импульса Lx(t) = const. 2. Если интегрант L = L(x,x) не зависит явно от t, то имеет место интеграл энергии (оба названия интегралов взяты из классической механики) i(i)Zi(t) - L(t) — const. Для доказательства интеграла энергии достаточно продифференцировать последнее равенство по t и воспользоваться уравнением Эйлера: &LX + i—Lx Lxx Lji — 0 < —xi — —~LX + Lx 1=0. at \ at / Замечание. Отметим, что при выводе интеграла энергии мы ис- пользовали дополнительное предположение о существовании второй производной £. Интеграл энергии имеет также лишнюю экстремаль £(t) = const.
150 Глава 3. Вариационное исчисление 1.6. Примеры I Пример 1. /(х( )) = J х2 di —» min; х(0) = 0, z(l) = 1. о Уравнение Эйлера: х = 0. Общее решение: х — C|t + Cj. Из начальных условий находим единственную допустимую экстремаль: £ = t. Докажем, что она доставляет абсолютный минимум в задаче, т.е, 4 = t € absmin. Для этого надо показать, что 1(х( )) 7(4()) для любой допустимой функции х, или 1(£ + Л) > 1(£) для любого h £ Со([0, 1]). Действительно, । til /(4 + Л) -!(£) = J(£ + h)2 dt — J £2dt = 2 У £hdt + J h2 dt > О ООО 1 I 1 /Г |> г £hdt = 2 / £dh = 24Л - 2 £hdt = Q. J Io J 0 0 0 Таким образом разность всегда неотрицательна, то есть имеем абсолют- ный минимум. Пример 2. Зт/2 Г(х( )) = J (х2 - х2) dt —> min; sc(O) = х (у") = 0. о Уравнение Эйлера: х + х = 0. Общее решение: х = С( sin t + Ci cost. Из начальных условий на- ходим единственную допустимую экстремаль: 4 = 0. Покажем, что она не доставляет локального минимума, т.е. £ & wlocmin. Рассмотрим последовательность функций xn(t) = £sin j. Очевидно, что хп — допустимые функции и хп —» £ в метрике пространства С1 ([0, 1]), но при этом Зг/2 AM)) = f C°S2 у - Sin2 2) Л = -L ^ - ^ < ° = о Получили, что значение функционала на хп меньше, чем на £, значит £ не доставляет слабого локального минимума. Из этого примера видно, что уравнение Эйлера — необходимое, но не достаточное условие экстремума.
§ 1. Простейшая задача КВ И 151 1.7. Задачи i 1.1. J х2 dt —> extr; х(0) = 1, х(1) = 0. о । 1.2. J(х2 - xjdt —» extr; х(О) = х(1) = О. о । 1.3. j {х2 4- tx) dt ~♦ extr; х(0) = х(1) = 0. о 1 1.4. J(х2 - t2x)dt extr; х(О) = x(l) = 0. о e 1.5. J tx2 dt —> extr; x(l) = 0, x(e) = 1. i i 1.6. J(1+ t)x2dt — extr; x(0) = 0, x(l) = 1. о 1.7. j(t2 — \)x2 dt —» extr; x(2) — 0, x(3)=l. 2 I 1.8. j x2x2 dt —» extr; x(0) = 1, x(l) = з/2. о 4/3 1.9. j ~ dt —► extr; x(0) = 1, x(-) — о i 1.10. j ezi2 dt —> extr; x(0) = 0, x(l) = ln4. о i 1.11. J(x2 + xx 4- 12Zx) dt —» extr, x(0) = x(l) = 0. о i 1.12. y(f2x24-12x2)<tt-»extr; x(0)=0, x(l) = 1. о
152 Глава 3. Вариационное исчисление 1.13. j (х2 + х2) dt —» extr; -I I 1.14. j\x2 + x2 +4xsht)dt- 0 I 1.15. J (x2 + x2 + 4xcht) dt о »/2 1.16. J\i2 - x2) dt —> extr; о я/2 1.17. J (x2 - x2 + 4xcos t) dt о x/2 1.18. j(i2 - a:2 - 4a: sin t) dt о 1/2 ,------— i.i9. J dt -*extr; О f v/1 4- i2 1.20. / --------dt -» extr; 1/2 To 1.21. J xy/l + x2dt —> extr; -To (задача о минимальной x(-l) = x(l) = 1. - » extr; z(0) = -1, i(l) = 0. - + extr; x(0) = x(l) = 0. x(O) = l, a:(^)=0. — » extr; x(0) = = 0. - » extr; x(0) = — J = 0. ,4 zl\ >/3 х(0)=1, = X(,) = L x(-To) = x(TQ) = поверхности вращения). 1.22. J —~^=— dt —» extr; х(10) = x0, x(tt) = X| (x0 > 0, x( > 0) to (задача о брахистохроне). To 1.23. J yjx + hy/l + x2 dt —> extr; r(0) — 0, x(To) = g (h > 0) о (задача о стрельбе).
§2. Задача Больца 153 § 2. Задача Больца 2.1. Постановка задачи Задачей Больца называется следующая экстремальная задача без ограничений в пространстве С1 ([to, t1[): <i В(х( )) = J L(t,x(t),x(t)) dt + t(a:(to),x(i|)) —► extr. (P) <0 Здесь L — L(t,x,x) — функция трех, a I = t(x(to),a:(t|)) — функция двух переменных. Задача Больца — элементарная задача классического вариационного исчисления. Функционал В называется функционалом Больца, функция I — терминантом. Любые функции класса С1 ([to, t|]) являются допустимыми в задаче. Определение. Говорим, что допустимая функция х доставляет слабый локальный минимум в задаче (Р), и пишем х € wlocminP, если существует 6 > 0 такое, что В(х(-)) В(£(•)) для любой допустимой функции х, для которой ||х( ) - 4( )||1 < 6. 2.2. Необходимое условие экстремума Теорема. Пусть функция А доставляет слабый локальный экстремум в задаче (Р) (х € wlocextrP), функции L,LZ,LX — непрерывны в некото- рой окрестности расширенного графика rti: = {(t,£(t),i(t)) | t G [to, 11]} (L,LX,L± G С(<9(Рг^))), функция I — непрерывно дифференцируема в окрестности точки (ai(to),sc(t|)) (t € С1 (O(x(to),x(t|)))). Тогда Lx непрерывно дифференцируемая функция € С' ([t0, tj)) и выполнены а) уравнение Эйлера d- --Li(t) + Lx(t) = O V t G [t0, t,[; dt b) условия трансверсальности Bi(to) = ix(tn), Lx(ti) — — Доказательство. .Возьмем произвольную, но фиксированную фун- кцию h € С'([to, tj[). Поскольку х G locextrP, то функция одного переменного ¥<А):=В(4()+АЛ()) = = У b(t,x(t) + AA(t),i(t) + Afc(t))dt + l(i(to) + Aft(to),f(ti) + Ah(i|)) *0
154 Глава 3. Вариационное исчисление имеет экстремум при А = 0. Но тогда по теореме Ферма = 0. Дифференцируя функцию ip и полагая А = 0, получаем у>’(0) = + Lx(t)A(t)) dt + U)A(^) + = 0 to vhec'a^ta)- (о Равенство (1) выполняется для любой функции ft € C’(Uo. 11]). а значит и для функций h € €о([/О) М)- Следовательно, из (1) вытекает, что «1 J + Lx(t)h(t)) dt = 0 V h € Co([to>«i])- io Отсюда по лемме Дюбуа-Реймона функция Lx G C*((t0, fj) и выполня- ется дифференциальное уравнение d — --ЬД0 + £х(0 = 0 Vi € [to, M dt — уравнение Эйлера. Для завершения доказательства теоремы осталось вывести условия трансверсальности. Проинтегрируем по частям первый интеграл в со- отношении (1) (оно стало возможным в силу доказанного включения ^(Оес'фо.М)): <i <> <i j Lx(t)h(t)di = J Lx(t)dh(t) =Б4*)Л(*)£- J h(t)^Lx(t)dt. io u Подставляя полученное выражение в соотношение (1) и учитывая уже доказанное уравнение Эйлера, получим и *>’(0) = J (-^Li(t) + Lx(t))h(t)dt + + (Ь»(<|) + + (—Lx(t0) 4- iX(io)}h(t0) = = (£,(«I) + U))A(<i) + (-bi(to)+4W)h(io) = 0 УЛ € С’фо, ij). (2) Подставляя в (2) последовательно h(t) = t-tt и h(t) = t — t0, придем к условиям трансверсальности Li(io) = l*(to) и Ь,(11) = -I»#,,. Тем самым теорема полностью доказана.
§2. Задача Больца 155 2.3. Многомерный случай Мы сформулировали теорему для одномерной задачи Больца клас- сического вариационного исчисления. Совершенно аналогично ставится векторная задача Больца и формулируются необходимые условия экстре- мума. Пусть x(t) = — n-мерная вектор-функция, инте- грант L = £(t,Zi,... ,хП)£|,... ,±а) — функция 2n + 1 переменного, терминант 1 = l(xi(t0),• • • — функция 2п пере- менных. Рассмотрим задачу У L(t,Xi,...,xn,±i,... ,хп) dt + + *(sci(*o)> • • • ,®n(to)>®i(«i), • • • ,®n(«i)) —► extr. Укажем на необходимые изменения при формулировке условий экстремума для векторного случая. Необходимые условия экстремума в векторной задаче Больца состоят из системы п уравнений Эйлера -^-Li.(t) + Lx(t) = 0, х=1,...,п, dt и системы 2п условий трансверсальности = = ~~ * = !,••• ,П- Доказательство теоремы в векторном случае тривиально редуцирует- ся к одномерному случаю. Действительно, фиксируем у вектор-функции х(-) = ((zi( ),...,□:„(•)) компоненты кроме ж,(•). Тогда функционал Боль- ца будет зависеть только от одной функции жД): В(жД-)) = B((f|(), ... ,£,+|( ),жД ),;^_|( ),... ,£„( ))• А для одномерного случая необходи- мые условия экстремума — уравнение Эйлера и условия трансверсаль- ности по ж,() уже доказаны. Каждое уравнение Эйлера — дифференциальное уравнение второго порядка — содержит при интегрировании две константы. Всего — 2п констант интегрирования. Для их нахождения у нас есть 2п уравнений — условий трансверсальности. В таком случае, когда количество неизвест- ных совпадает с количеством уравнений для их нахождения, мы говорим о полноте набора условий для нахождения экстремали. Как правило, во всех наших задачах мы имеем полный набор условий для определения неизвестных.
156 Глава 3. Вариационное исчисление 2.4. Пример । В(х()) = f(x2 - x)dt + х2(1) —» extr. о Необходимые условия: а) уравнение Эйлера d ~ Lx + Lx — 0 < г 2х + 1 — 0; dt b) условия трансверсальности ^(О) = 0о), Ьх(1) =-/«(i) <=> х(0) = 0, х(1) = -х(1). Общее решение уравнения Эйлера: х = — j + C\t + Ci- Из условий трансверсальности находим, что С| = 0, Сг = |. Таким образом, имеется единственная допустимая экстремаль £ = Покажем, что она доставляет абсолютный минимум в задаче. Действительно, если h G Cl([0, 1]), то h2dt-J hdt +2А(1)Л(1) + Л2(1). 0 0 0 Интегрируя по частям и учитывая, что f удовлетворяет уравнению Эйлера 2х + 1 — 0 и условиям трансверсальности i(0) — 0,i(l) = 1 а также отбрасывая неотрицательные члены f h2 dt и Л2(1), получим о 1 В<£() + Л(-)) - В(х()) = 2£(0Л(*)|о - У*(2£(t) + \)h{t)dt + о 1 + J h\t) dt + 2х(1)А(1) + Л2( 1) 2 (i( 1) + £( 1))Л(1) - 2£(0)Л(0) = 0. о Таким образом, £ = € absmin. ^min 0 2-9 + 3 12 1 3 Очевидно, что Smax = +оо. Действительно, возьмем последователь- ность функций x„(t) = п, тогда В(жп(-)) = —п + п2 —» +оо при п —» оо.
157 § 2. Задача Больца 2.5. Задачи Больца f > ж2(1) 2.1. (х -x)dt-------------► extr. О 1 2.2. J(й2 + x2)dt — 2ar(l)sh 1 —* extr. о г 2.3. J(ж2 + ж2 - 4гsin t) dt + 2ж2(О) + 2x(ir) - х2(т) —> extr. о »/2 2.4. У(i2 - ж2) dt + а:2(0) - ж2(0 4-4ж(^) -» extr. о х/2 2.5. У (ж2 - ж2 - 2ж) dt - 2ж2(0) - ж2 (у) -> extr. о । 2.6. У(Ж|Жз + ж(Ж2) dt 4- Ж1(0)ж2(1) + Ж|(1)ж2(0) —» extr. о I О 2 2.8. У 12ж2 dt - 2ж(1) + ж2(2) -> extr. I 2.9. У 2(ti2 + жж) dt 4- Зж2(1) - ж2(е) - 4ж(е) -> extr. 1 3 2.10. У 4ж2ж2 dt 4- ж4(0) - 8ж(3) — extr. О 1 2.11. у ехх2 dt 4- 4е1(0) 4- 32e~l(l) -> extr. О 1 2.12. У е<+1(ж2 4-2ж2) dt 4-2ж(1)(ж(0) 4-1) -> extr. О
158 Глава 3. Вариационное исчисление § 3. Задача с подвижными концами 3.1. Постановка задачи Задачей с подвижными концами называется следующая экстремальная задача в пространстве С1 (A) х R2: Л 1(0 = J f(t,x,x)dt + fa(tQ,x(t0),ti,x(t})) -> extr; (Р) ^0 = °. (1) где £ = (i( ),t0,t|), A — заданный конечный отрезок, t0,t| € A, t0 < ti. Частным случаем является задача, в которой один из концов или даже оба закреплены. Элемент £ = (a:(),to,t|) называется допустимым, если х € С’(Д), to.^i € A, t0 < i|, и выполняются условия (1) на концах. Определение. Говорим, что допустимый элемент £ = (£(•), f0|ti) доставляет слабый локальный минимум в задаче (Р), и пишем 4 6 wlocminP, если существует 6 > 0 такое, что 1(0 1(0 для любого допустимого элемента £ = (x(),t0,t\), для которого ||х(-)-Л(-)||С1(Д) <<5, |to-£ol < «, |ti - til < 6. 3.2. Необходимые условия экстремума Теорема. Пусть элемент 4 = (&(')ЛоЛ\) доставляет слабый локальный экстремум в задаче (Р) (£ € wlocextrP), функции L,LX,LX — непрерывны в некоторой окрестности расширенного графика Г^: = {(t,4(t),i(t)) | t G A} (L,LX,LX 6 C(O(Pfj))), функции fa — непрерывно дифференциру- емы в окрестности точки (to,S;(io),i\,A(i\)} (fa G С' (to,£(£o),ti,2(ti))), i — 0,1,..., т. Тогда существует ненулевой вектор множителей Лагранжа А = (Ао,..., Ат) 6 Rm+I, А # 0, такой, что для функции Лагранжа 'f h = J Ao/(t,2!,£)<tt + Aj^to.a^toMi.a^ti)) Z <=<> выполнены условия: а) стационарности no x — уравнение Эйлера для интегранта L = Ao/(t,a:,i) d - d --Lx(t) + Lx(t) = o Vie A -^АоЛ(0 + АоЛ(О = О;
§ 3. Задача с подвижными концами 159 m •^сальности по х для терминанта I = J2 А^Д^о^^о). «=о > ^х(^о) = ^х(<о) АоЛ(«о) = ^x(to)> •t'x(^l) — ~^x(t,) —* Ao/j(tl) = — с) стационарности по подвижным концам (выписывается только для подвижных концов отрезка интегрирования): At0(<o) = 0 <=> ~Ао/(£о) + + /х(<(1)4(£0) = О, Mi(ti) — 0 ^of(ii) + ki+lx(t,)^(i]) = Q. Необходимые условия экстремума в задаче с подвижными концами непосредственно будут вытекать из необходимых условий экстремума в задаче Лагранжа п. 6.2. 3.3. Пример т I(x(),T) = f(x2 - х 4- 1)<И —» extr; ж(0) = 0. о Решение. Функция Лагранжа: т Л = j Ao(i3 - х + 1) dt + A(x(0). о Необходимые условия: а) уравнение Эйлера для интегранта L = Xq(x2 - х + 1) d —+ JDj — 0 < —2Aq£ Ao — 0; dt b) трансверсальность по x для терминанта I = Aix(0) Ьх(0) = /1(0), Li(T)=-lx(T} <=> 2Aoi(O) = Al; 2Aoi(T) = 0; с) стационарности по T (выписываем только для подвижного конца отрезка интегрирования) Лт(Т) = 0 <=» А0(±2(Т) - х(Т) + 1) = 0. Если Ао = 0, то из Ь) следует, что А| = 0 — все множители Лагранжа оказались нулями. Если Ао / 0, то положим Aq = 1. Тогда условия а)-с) преобразуются к виду —2i —1=0, i(T)=0, z(T) = l.
160 Глава 3. Вариационное исчисление Из первого уравнения следует, что х — -^ + C)t + С]. Поскольку г(0) = 0, то C-i = 0. Неизвестные С\,Т определяются из условий Г х(Т) = 0, I х(Т) = 1 Т --+С, =0, т1 - — + с,т= 1. 4 Отсюда находим, что Т = 2, С| = 1. Таким образом, в задаче имеется единственный допустимый экстре- мальный элемент £ = (ж(), Т) = ( - j + t, 2). Покажем, что £ не доставляет локального экстремума, т. е. что в любой его окрестности существует другой допустимый элемент, на ко- тором значение функционала I в точке £ как больше, так и меньше значения функционала I в точке £. Действительно, возьмем элемент С = (х( ), Т) = ( - j + t, Т). Тогда вд = /((-5 + 1)1-(4 + ‘) + 1)л = о Т 2 = 2 1(0 = 2 J о о при Т > Т и 1(0 < 1(0 при Т < Т, поскольку под знаком интеграла стоит неотрицательная величина. Найдем абсолютный минимум в задаче. Возьмем последовательность п элементов („ = (гп()>Т„) = (t,n); тогда 1(0) = J(2 - t)dt —» -оо о при п —» +х, т. е. Smin = —оо. Если вместо исходной задачи с подвижным правым концом Т рассмотреть задачу с фиксированным Т = То, то нетрудно вывести, что функция, доставляющая абсолютный минимум в новой задаче, существует (ее легко найти, решая задачу с фиксированным То) и абсолютный минимум в задаче будет конечным для каждого фиксированного То- При этом значение абсолютного минимума будет стремиться к —оо при То —» +оо. Найдем абсолютный максимум в задаче. Возьмем последовательность элементов О = (хп(),Тп) = (nt, 1); тогда 1 l(xn( ),T') = J(n2 - nt + l)ttt -» +00 При П -» +OO, Т.е. Smax = +00. о
§ 3. Задача с подвижными концами 161 3.4. Задачи с подвижными концами 1 3.1, j х2 dt — 2г2(1) —» extr; х(0) = 0. о 3.2. У (х2 + x)dt —» extr; г(1) = 0. о т 3.3. J х2 dt —» extr; z(0) = О, Т + х(Т) + 1=0. о т 3.4. j x2dt-> extr; sc(O) = 0, (T - V)x2(T) + 2 = 0. о т 3.5. У х3 dt extr; х(0) = О, Т + х(Т) = 1. О т 3.6. У (х2 +x)dt —» extr; z(0) = 1. о »/4 3.7. У (х2 — x2)dt —» extr; ж(0) = 1. о х/4 3.8. У^2 — х2 + 4а:cos/) dt —» extr; х(0) — 0. о । 3.9. у (i2 + a:2) dt - х2(1) —» extr; z(0) = 1. о г 3.10. у(i2 + x2)dt — extr; г(Т)+Т-1=0. о 3.11. / --------dt —» extr; z(O)=l. J х о Т -------- 3.12. f^-dt —> extr; г(0) = 1, х(Т) = Т - 1. о То ЛЗ. у xxjI +x2dt —» extr; х(То) = £. о
162 Глава 3. Вариационное исчисление § 4. Изопериметрическая задача 4.1. Постановка задачи Изопериметрической задачей в вариационном исчислении называется следующая экстремальная задача в пространстве С1 ([to, tj): Л>(®( )) = J —> extr; (Р) t, /,(х(-)) = J dt = сц, (1) to x(t0) = x0, x(tt)~xlt (2) где at,..., am — заданные числа (а,- € R). Отрезок [to, til является фиксированным и конечным, to < t|. Огра- ничения вида (1) называются изопериметрическими. Экстремум в задаче рассматривается среди функций х € C‘([to, tj), удовлетворяющих изо- периметрическим условиям (1) и условиям (2) на концах; такие функции называются допустимыми. Определение. Говорим, что допустимая функция А доставляет слабый локальный минимум в задаче (Р), и пишем & G wlocminP, если существует 5 > 0 такое, что 1о{х{ )) Г0(Л()) для любой допустимой функции х, для которой ||а:( ) - 4(-)||1 < б. 4.2. Необходимое условие экстремума Теорема. Пусть функция А доставляет слабый локальный экстремум в задаче (Р) (i € wlocext г Р), функции fi, fjx, fa, i = 0, i,... ,т, — не- прерывны в некоторой окрестности расширенного графика Г^: = { (t, £(t), i(0) I * e [to, tj} (Л,/«,/.* e c(e>(rfi))). Тогда существует вектор множителей Лагранжа А = (Ао,..., Ат) € т Rm+I, А # 0, такой, что для лагранжиана £ = х> ®) выполняется _ 1=0 условие гладкости Lx € С1 ([to, tj) и выполнено уравнение Эйлера -^£х(0 + £Д0 = 0 V t € [to, t,[. at
§4. Изопериметрическая задача 163 Доказательство. Выпишем вариацию по Лагранжу функционала 1(х) = //(<,se,i)<tt, найденную нами при выводе необходимых условий to, в простейшей задаче классического вариационного исчисления «I = j+ h e сЖ, tj). to Рассмотрим следующее линейное отображение A: C<J(Ro, ti]) —» Rm+I функционального пространства CjQto, ij) в конечномерное простран- ство Rm+I: Ah = (6Io(£,h),6It(£,h),... ,6Im(£,h)). Возможны два случая: 1) ImA Rm+1, т.е. А — отображение на часть пространства Rm+I (вырожденный случай); 2) Im Л — Rm+I, т.е. А — отображение на все пространство Rm+1 (невырожденный случай). 1) Вырожденный случай. Пусть Im А Rm+I. Образ линейного про- странства при линейном отображении является подпространством. Зна- чит 1mA есть подпространство в Rm+I размерности тп. Погрузим его в любое подпространство размерности тп (гиперплоскость). Следо- вательно, найдутся числа Ао,..., Ат, не все равные нулю и такие, что 52a,z,=O Vze 1m А«» А,«4 (4(), Л()) = О V h € Co(Ro, *i]>- «=0 i=0 Откуда из явного вида для 61;(4, 6) имеем [ (12 ^/»(0МО + £ dt = о v h е c'0([t0, td). 4 4=o i=o 7 Тогда из леммы Дюбуа-Реймона следует, что для лагранжиана L = m 52^ifi(t,x,x) выполняется условие гладкости L± 6 С1 (Ro, М) и выпол- 1=0 нено уравнение Эйлера d~ --Lx(t)+Lx(t) = O Vt G Ro, ill- 6’
164 Глава 3. Вариационное исчисление 2) Невырожденный случай. Пусть ImA = Rm+I. Покажем, что не- вырожденный случай невозможен. Тем самым теорема будет полностью доказана. Возьмем е0 — (1,0,... ,0), ..., ет — (0,... ,0,1) — канонический базис в Rm+I. Поскольку образ отображения A 1mA = Rm+I, то существуют функции hj € Cq (Ro, ti ]) такие, что Ah} = ej, j = 0, 1,..., m, ( Г 1 t ~~ j \ то есть = 6,у I 6ij = 1 q’ i j ~~ символ Кронекера I. Рассмотрим функцию F : Rm+I —♦ Rm+I, действующую по формуле . m m x F(0) = Uo (* + 52 . • • (* + 52 Pihi) ) ’ V j=o j=o 7 Нетрудно проверить, что построенная функция F непрерывно диф- ференцируема в некоторой окрестности точки /3 = 0 и F(0) = . . - ,/m(2)) = («0, »m) = « («О-' = !<№)) ПОСКОЛЬКУ ЯКО- биан отображения F неравен нулю как определитель единичной матри- цы (F'(0) — (£/,(£, Ay))ij=0 = I — единичная матрица), то по теореме об обратной функции существует обратное отображение F'1 некоторой окрестности точки а в окрестность точки /3 — F~'(a) = 0 такое, что |Г-,(а) -F“'(A)| ~«1 <=> |^“'(а)| <K|a-d| с некоторой константой К > 0. Возьмем а = а(е) = (ао 4-£,а1(...,ат) при достаточно малом е и обозначим р{е) — F~' (а(е)). Тогда F(/3(e)) = а(е), т.е. Zo (*<) + 52^(e)*j())= «о + j=0 т j* (*(•)+52 ^оом-))=“•• * = >> • - •»т’ j=0 при этом |Г-‘(а)| СК|а-6| ^=> |/3(е)|сКН. Получилось, что в любой окрестности экстремальной функции £ в пространстве C'Qto, М) существует допустимая функция (а именно т £() + )), на которой значение функционала может быть i=o и больше (при е > 0), и меньше (при е < 0) чем на £. Пришли к противоречию, что £ не доставляет локального экстремума. Таким образом, случай 2) невозможен.
§4. Изопериметрическая задача 165 4.3. Пример । । 1 («(•)) = J х2 dt —» extr; f х dt = 0, х(0) — 0, г(1) = 1. о о Решение. Лагранжиан L — Agi2 4- А| ж. Необходимое условие — уравнение Эйлера d —+ Lx - 0 4- — 2Agi 4- А । — 0. dt Если Ад = 0, то А| = 0 — все множители Лагранжа — нули. Этого не может быть. Положим Ао = 1/2. Тогда х — А|. Общее решение: х = C\t2+C-it+C-i. Неизвестные константы С1}С2,С3 находим из условий на концах и изопериметрических условий: z(0) = 0 => Сз = 0; ®(1) = 1 => С, 4-С2 = 1; 1 । f х dt = 0 => /(Gt2 4- C2t) dt = 0 =4- 4- £t = о. о о Отсюда G =3, G — —2. Таким образом, в задаче имеется един- ственная допустимая экстремаль £ = 3t2 — 2t. Покажем с помощью непосредственной проверки, что найденная функция £ доставляет абсолютный минимум в задаче. Возьмем функцию Л € С1 ([0, 1|) такую, что £ + h допустимая. Для этого надо взять i функцию h, для которой Л(0) - Л(1) -- 0 и J hdt = 0. Тогда о । Illi I(£ + ti) — I(£) = J(£ + h)2dt-У £2dt = 2 J£hdt + Jh2dt^2 J£hdt. 0 0 0 0 0 Интегрируя по частям с учетом условий на h, получим i i i I{£ 4- Л) - I(£) 2 j £dh = 2£h^-2 j £hdt = -12 J hdt =0. 0 0 0 Таким образом, разность всегда неотрицательна, то есть имеем абсолют- ный минимум. Г .2 Д ч2 36t3 24t2 11 Smia= £ dt = /(6t —2)2dt= —----------—+4t = 12-12 4-4 = 4. J J 3 2 10 0 0 Очевидно, что = 4-OO. Действительно, возьмем последователь- Воеть допустимых функций xn(t) = £(t)4-nsin2irt, тогда l(xn(-)) -► 4-оо Цри п —+ 00.
166 Глава 3. Вариационное исчисление 4.4. Задача Дидоны Одними из первых задач на отыскание наибольших и наименьших величин являлись изопериметрические задачи о нахождении замкну- той кривой, имеющей заданную длину и охватывающую наибольшую площадь, и о нахождении пространственной замкнутой поверхности, имеющей заданную площадь и охватывающей наибольший объем. Еще до Аристотеля (IV век до н. э.) было известно, что среди изопериметри- ческих (имеющих равную длину) кривых наиболее вместимой является окружность, а среди изопифанных (имеющих равную площадь) поверх- ностей — сфера. Изопериметрическая задача содержится также в легенде о царице Дидоне. Описываемые события легенда относит к 825 году до н. э. Финикийская царица Дидона и с ней небольшая часть жителей горо- да Тира, спасаясь от преследований, покинули родной город и в поисках счастья отправились на кораблях на запад вдоль берегов Средиземного моря. Выбрав на африканском побережье удобное место (нынешний Ту- нисский залив), Дидона и ее спутники решили основать здесь город. Эта идея не понравилась местным жителям, но все же финикийской царице удалось уговорить их предводителя Ярба, и он простодушно и неосторож- но согласился уступить Дидоне клочок земли, «который можно окружить бычьей шкурой». Хитрая финикиянка, разрезав шкуру на тонкие ремни, связала их в один длинный ремень и, окружив им значительную тер- риторию, заложила на ней город Карфаген. В память об этой истории карфагенская цитадель получила название Бирса (шкура). Из истории город Карфаген помнится нам еще войнами с Римом за обладание господством на Средиземном море (Пунические войны 1П-И век до н. э.), которые завершились взятием римлянами Карфагена и его разрушением. Мы видим, что Дидона «решала» классическую изопериметрическую задачу о наибольшей вместимости. Естественно считать, что Дидона хотела сохранить выход к морю. Тогда мы получаем первую задачу Дидоны. Среди всех кривых длины I с концами на фиксированной прямой (прямолинейный берег), найти ту, которая ограничивает фигуру наибольшей площади. Формализованная задача имеет вид: т т J xdt—* max; j у/1. + х1 dt = I, х(-Т) = х(Т) = Q -т -т (здесь Т — подвижный конец). Эта задача относится к типу задач Лагранжа (см. §6). Давайте решим вторую задачу Дидоны, в которой оба конца кривой закреплены на прямой. Формализованная вторая задача Дидоны имеет вид:
§4. Изопериметрическая задача 167 То То J xdt —» max; J \/1 + x2di = I, x{-T0) = х(Г0) = О -То -То (здесь То — фиксировано). Это — задача, укладывающаяся в схему изопериметрических задач п. 4.1. Приведем ее решение с помощью вариационного исчисления. ______ Лагранжиан L = Аох + А\/1 + х2. Необходимое условие — уравнение Эйлера d — ~L± + Lx = О at d Xx dt 1 + i2 + Ao — 0. Если Ao = 0, то A 0 (не все множители Лагранжа — нули) и значит х = const. Тогда из условий на концах и изопериметрического условия следует, что 4 = 0,1 = 2Т0. Если Ао / 0, то положим Ао = 1. Тогда из уравнения Эйле- d Хх ра ——у— -- - = 1. Проинтегрировав по t это уравнение, получим « VI + з2 Хх —, = t + С). Выразим из последнего уравнения х: \/1+х2 A2*2 = (t + С,)2( 1 + 42) * х2 = , ' ±v'X2-(t + Cl)2 t + Cj ±yA2-(i + Ct)2 (t + C^dt о ax =------. .= .. ±y/X2-(t + Ct)2 = T«^/a2 (t + c,)2. Проинтегрировав no t полученное уравнение, найдем функцию x(t): ® + С2 = Т\А2 ~ G + Ci)2 <=>(< + Ci)2 + (х+ С$2 = А2 . Это уравнение окружности. Из условий на концах х(-Т0) = ®(Т0) следует, что С} = 0, т.е. t2 + (х + с2)2 = А2. Неизвестные константы С2, А определяются единственным образом из условия х(То) — 0 и изопериметрического условия. При 2Tq < I < тТ0 имеется единственная (с точностью до знака) экстремаль, являющаяся дугой длины I окружности, проходящей через точки (±Т0) 0), с центром на оси х. Поскольку у нас задача на максимум, то мы выбираем экстремаль, лежащую в верхней полуплоскости. При 1 < 2Т0 в задаче нет допустимых функций, при I > itTq нет допустимых экстремалей. Можно показать, что в этом случае решением будет полуокружность радиуса То, «поднятая» на высоту (1 - тгТ0)/2 вместе с двумя вертикальными отрезками этой длины.
168 Глава 3. Вариационное исчисление 4.5. Изопериметрические задачи 4.1. J х2 dt —> extr; J xdt = O, x(0) = 1, sc(l) = 0. 0 0 4.2. i2 dt —> extr; ^txdt = Q, x(0) — 0, sb(1)= 1. 4.3. 1 У x2 dt —> extr; 1 1 Jxdt— 1, Jtxdt = Q, x(0) — x(l) — 0. 4.4. У x2 dt —> extr; Jxcostdt— —, x(0) = 1, ат(тг) = — 1. 4.5. 1Г У x2 dt —» extr; У sc sin t dt = 0, se(O) = 0, sc(rr) = 1. 0 1 0 1 4.6. У x2 dt —♦ extr; 4.7. 1 У (x2 + a:2) dt -> i ? /* 1 1 0 0 2 2 4.8. / t2x2 dt —» extr; jtxdt — -, sc(l)—1, sc(2)=2. 4.9. у sc2 dt extr; у x2 dt = 1, sc(O) = sc(l) = 0. t/2 4.10. J (x1 - sc2) dt- t/2 > extr; У xsin tdt = 1, ar(O) = = 0. 0 0 То J Х \/1 +x2dt —» extr; -То То У \/1 + i2 dt = I, -То 4.11. ж(-То) = ®(2о) = 0. । д 12 У («1 + ®г) dt -> extr; о ш,(0) = х2(0) = 0, □:,(!) = 1, т2(1) = -3.
§5. Задача со старшими производными 169 § 5. Задача со старшими производными 5.1. Постановка задачи Задачей со старшими производными в классическом вариационном исчислении называется следующая экстремальная задача в пространстве t, 1(а;(-)) = i(t),x(t),... ,a/n\t)) dt-+extr; (P) a/*\tj) = Xkj, к = 0,1,... ,n — 1, j=0,1. (1) Здесь L = L(t,x,x,...,x^) — функция n + 2 переменных, назы- ваемая интегрантом. Отрезок [t0, tj является фиксированным и ко- нечным, to < t|. Экстремум в задаче рассматривается среди функций х G C"([to, ti]), удовлетворяющих условиям на концах (1); такие функции называются допустимыми. Введем норму в пространстве Cn([to, til): 1Ы|П: = 1Ы1с”([«о,М): = max{||y||c([(Oi(ll), Нз/Нс^мь • • • Определение. Говорим, что допустимая функция х доставляет сла- бый локальный минимум в задаче (Р), и пишем х) 6 wlocminP, если Существует б > 0 такое, что Г(а:()) 1{х{)) для любой допустимой функции х, для которой ||а:( ) — ж( )||п < 6- 5.2. Необходимое условие экстремума Теорема. Пусть функция £ доставляет слабый локальный экстре- мум в задаче (Р) (х € wlocextrP), функции L,LX,LX,... ,LX(.) — не- прерывны в некоторой окрестности расширенного графика : = {(t^(t),4£t),...,xW(t)) Itefto.tJ} (ДЬх,...,Ьх(.)еС'(О(Г4£ 4w))). Тогда Lxw € С* ([to, t||), k = 1,..., п, и выполнено уравнение Эйлера- Пуассона ^(-i/^£l(t)(t) = o vte[to,t.]. k=0 0,1 При n = 1 уравнение Эйлера—Пуассона совпадает с уравнением Эйлера. При п — 2 уравнение Эйлера—Пуассона выглядит следующим образом: d2 - d - - —Lx(t)--Lx{t) + Lx(t) = Q. dt* dt
170 Глава 3. Вариационное исчисление Доказательство. Вывод уравнения Эйлера—Пуассона методом ва- риаций. Вычислим вариацию по Лагранжу функционала I. Возьмем произвольную, но фиксированную функцию Л € С<?([<о> М)- Здесь мы пользуемся обозначением: Со"([to,h 1) = {Л е cn([Mi 1) I л^Оо) = bw(ti) = о, fc = о, 1,... ,П - 1}. Поскольку 4 6 wlocextrP, то функция одного переменного <р(Х)' = ti I(£ + Ah) = f L(t,£ + Ah,4 + Ah,... , 4<n) + Ah(n^) dt имеет экстремум при to A = 0. Но тогда по теореме Ферма у>'(0) = 0. Дифференцируя функцию /р и полагая А = 0, получаем V'(0) = 6I(£, h)= j(^2 dt = 0 V h € С?(Но,«1 ])- (О Обобщенная лемма Дюбуа-Реймона. Пусть ак() € C((t0, tj) и /(£ a*(0fc(t)(0) dt = 0 V h е C?([t0, М). to Л=0 n t Тогда ak e C*([t0, til) « E(~0*= 0 V 4 6 I*», M- Jt=o Из леммы Дюбуа-Реймона и соотношения (1) следует утверждение теоремы. Как и в простейшей задаче вариационного исчисления уравнение Эйлера—Пуассона можно было бы вывести с помощью леммы Лагранжа. В соотношении (1) проинтегрируем по частям слагаемые к раз, внося каждый раз функцию h под знак дифференциала: г г *' /Lxmhwdi= [L,m dh(k~l) = Lxmh^'} - J J iQ to to Свободные члены интегрирования по частям равны нулю, поскольку h € Со ((to, t| ]) и, значит, h(fc)(t0) = hw(t|) — 0, к = 0,1,... ,n - 1. Тогда соотношение (1) перепишется в виде vhecftlto,*.]). (2) По лемме Лагранжа п. 1.2 из (2) вытекает уравнение Эйлера—Пуассона.
§ 5. Задача со старшими производными 171 5.3. Пример 1 1(х( )) = fx2dt —> extr; г(0) = £(0) = х(1) = 0, x(l) = 1. о Решение. Интегрант; L — х2. Необходимое условие — уравнение Эйлера—Пуассона d2 d м —.Li--Li + L, = 0 <=> xw = 0. at* at Общее решение уравнения Эйлера—Пуассона: х = C|tJ + C2t2 + Сз1 + С4. Неизвестные константы С|,С2,Сз,С4 находим из условий на концах т(0) = 0 => С4 = 0; £(0) = 0 => С3 = 0; Гх(1) = 0, fC1+C2 = 0, ГС, = 1, }£(1) = 1, 13С1+2С2=1, t С2 = — 1. Таким образом, единственная допустимая экстремаль £ = t3 - t2. Покажем с помощью непосредственной проверки, что функция £ доставляет абсолютный минимум в задаче. Возьмем функцию Л 6 С2([0, 1|) такую, чтобы функция £ + h была допустимой. Для этого надо взять функцию Л, для которой Л(0) = Л(1) = Л(0) = Л(1) = 0. Тогда 1 Jiii 2(£ + h) —/(£) = J(i + h)2dt-У if di = 2 J ihdt + J h2dt^2 J ihdt. 0 0 0 0 0 Интегрируя по частям с учетом условий на Л, получим । 1 2(£ + h) - /(£) 2£h|o - 2 J £(3)hdt = 0 0 I 1 = -2 J &3)dh = -2£(3>ft|o + 2 J i(i)hdt = 0. о о Таким образом, разность всегда неотрицательна, то есть имеем абсолют- ный минимум । 1 । Smin = у*2 dt = J(6t-2}2 dt = J(36t2 -24*+ 4) dt = 12? - 12? +4* |° = 4. 0 0 0 Очевидно, что 5^ — +oo. Действительно, возьмем последователь- ность допустимых функций xn(t) - i(t)+ni2(t— I)2, тогда l(®n( )) —» +оо при п —» оо.
J 72 Глава 3. Вариационное исчисление 5.4. Задачи со старшими производными 5.1. 5.2. 5.3. 5.4. 5.5. 5.6. 5.7. 5.8. 5.9. 5.10. 5.11. J х2 dt —> extr; г(0) - i(0) = г(1) = 0, ж(1) = 1. о I — 4&r) dt —> extr; зс(О) = 1, ж(0) = —4, ж(1) = ж(1) = 0. о j • 1 (ж2 - 24£ж)dt —► extr; ж(0) = ж(0) — 0, ж(1) = -, х(1)=1. о г У (г2 — х2) dt —> extr; г(0) = 0, г(0) = 1, о г(тг) = sh ir, i(ir) = chir. У (г2 + 4г2) dt —» extr; ш(0) = -1, г(0) = 0, о г(тг) = сЬтг, i(ir)=sh7T. »/2 У (г2 - г2) dt -> extr; г(0) = г(0)=1, = р *(у)=0' О 1 y\i2 4- ж2) dt —> extr; ж(0) = 1, ж(0) = О, о ж(1) = ch 1, ж(1) = sh 1. i j е"*ж2 dt -* extr; ж(0) = 0, ж(0) = 1, ж(1) = e, ж(1) = 2е. о е J(t 4- l)tx2 dt —> extr; ж(1) = 0, i(l) = 1, x(e) = e, x(e) = 2. i i J(x^)2 dt —> extr; x(0) = i(0) = x(0) = 0, о ж(1) = 1, i(l) = 3, z(l) = 6. i J ((®^)2 4- x2) dt —> exit; x(0) = i(0) = 0, i(0) = 1. о z(l) = ch 1, ж(1) = i(l) = sh 1.
§6. Задача Лагранжа 173 § 6. Задача Лагранжа Все задачи, изученные нами в предыдущих пунктах, являются частными случаями или могут быть сведены к задаче (мы сформулируем ее чуть позже), поставленной Лагранжем в сочинении «Аналитическая механика» в 1788 году. Для ее решения Лагранж использовал метод неопределенных множителей, который впоследствии стали называть методом множителей Лагранжа. Впрочем этот метод не был им аккуратно обоснован, и понадобилось более ста лет для того, чтобы придать рассуждениям Лагранжа вид строго доказанной теоремы. 6.1. Постановка задачи Задачей Лагранжа называется следующая экстремальная задача Во (4) ~* min; В,(£) О, В,($) = 0, i = т'+ (Р) ia(t) - = 0 V t e A, (1) где < — (x( ),to)t|), x(-) € C'(A,Rn), to,<i € A, to < д — заданный конечный отрезок, В,(О = J dt + i = 0,l,...,m. *0 Условие (1), называемое дифференциальной связью, может быть на- ложено не на все координаты вектор-функции ш(-) = (zjхп(-)), а только на некоторые, для определенности на первые к координат: i,(t) — x(t)) = 0, i= 1,...,к. Обозначим далее х = (ха,хр), где ха = (xt,. ..,хк), хр — (хы.|,... ,хп). Если дифференциальная связь отсутствует, то к = 0 и х - хр. Поскольку вместо ха в функции fi(t,x,x) можно подставить из (1) равное ему выражение <p(t,x), то в дальнейшем считаем, что ft = fi(t,x,ip). Частным случаем задачи (Р) является задача, в которой один из концов to или <i — подвижный, а другой закреплен или оба конца отрезка интегрирования [to, tj фиксированы. Элемент £, для которого выполнены все указанные условия и огра- ничения задачи, называется допустимым. Определение. Говорим, что допустимый элемент 4 = (#(•), to, t,) доставляет слабый локальный минимум в задаче Лагранжа (Р), и пишем ? € wlocminP, если существует 6 > 0 такое, что Во (4) Bo(f) для любого допустимого элемента £ = (a:(),io,ti), для которого ||£-£||с'(д)хк2 < 6 <=> ll*G) - *(-)Пс'(Д) < «, Но - *ol < 6, |t) - t)| < 6.
174 Глава 3. Вариационное исчисление 6.2. Необходимые условия экстремума Теорема Эйлера—Лагранжа. Пусть элемент £ = (£(), io,t|) доставля- ет слабый локальный минимум в задаче Лагранжа (Р) (£ € wlocminP), функции fi, fiX, fa непрерывны в некоторой окрестности расширенно- го графика Г±±: = {(t, 4(t), £(t)) ft € Д} (fi,f,z, fa € i = 0,1,...,tn, функции <p,<Px непрерывны в некоторой окрестности графика Г^. = {(t,4(t)) 11 е Д} (<р,<рх € С(О(Г4))), функции ф, непре- рывно дифференцируемы в некоторой окрестности точки (to,£(to),i},£(i\)) (ф{ € С (to,£(to),0>£(O))), * = 0,1,... ,т (условие гладкости). Тогда найдутся множители Лагранжа (А,р) € Rm+I х С’(Д, R*), (^, Р()) 0, такие, что для функции Лагранжа А = У (f(t,x,ip) +p(t)(ia - <p(t,x))) dt + l(t0,x(te),t\,x(ti)), m m где f(t,x,±p) = ^,>ч/^^,хр), I = 52 л<30(О,я(Г0), 0,«(0)) - терми- i=0 »=0 нант, выполнены условия: а) стационарности no x(-) — уравнение Эйлера для лагранжиана L(t,x,x) = f(t,x,xp) + p(xa - <p(t,x)) d~ --Lx(t) + Lx(t) = 0 f -p(t) - p(t)pzjt) + A.(0 = o. I - а? АД0 - р(О&ДО + АДО = о; b) трансверсальности no x 2<x(to) — p(£0) = Ц(|о), f p(0) = 1 A^(0) = —0д(*,)’, с) стационарности no подвижным концам (выписывается только для подвижных концов отрезка интегрирования) AJ*o) = O -/(4)+А+W(Zo)=°> Л,,(0) = 0 <=* /(£,) + Г(, + fl(tl)i(0) = 0; d) дополняющей нежесткости = 0, » = 1,..., tn'; е) неотрицательности А, > 0, t = 0,1,... ,т .
§ 6. Задача Лагранжа 175 Доказательство теоремы основано на правиле множителей Лагранжа для гладких задач с ограничениями типа равенств и неравенств в нор- мированных пространствах (глава 1, п. 8.2). Покажем, что все условия теоремы о правиле множителей Лагранжа выполняются. Поскольку равенство В, = 0 можно заменить двумя неравенствами Bi О, -В, С 0, то в дальнейшем для простоты записи считаем, что у нас имеются только ограничения типа неравенств и тп' = тп. Пусть X = C’(A,Rn) х R2, Y = C(A,Rk). Это банаховы пространства — условие банаховости выполняется. Из непрерывной дифференцируемости функций в теореме Эйлера- Лагранжа следует, что функционалы Вс. X —» R, t = 0,1,... ,т, и ото- бражение F: X —» У, F(sc( ),f0,i|) = ia(t) - <p(t,x(t)), строго дифференцируемы в точке £ — условие гладкости выполняется. Ослабленное условие регулярности — условие замкнутости образа оператора F'(C) выполняется, так как Im.F'(£) = У = С(Д, R*) — замкнутое пространство. Действительно, M(f)(A(),T0,T|] = h(t) - <pXa(t)h(t), а система линейных дифференциальных уравнений с непрерывными коэффициентами *(0 - &.(*)*(*) = y(t) (О имеет решение для любого у() € C(A,R*), определенное на всем отрезке Д, с любым граничным условием в форме Коши hftg) — у. Все условия теоремы главы 1 п. 8.2 выполняются. Согласно этой те- ореме существуют вектор А = (Ао, А|,..., Ато) Е Rm+I и функционал у* Е У* не равные одновременно нулю и такие, что для функции Лагранжа m мо = ZL а«в.(о + у,мо)=AHhio.tO = 1=0 «| = J dt + {у*,xa(t) — - — выполняются условия: а') стационарности = 0 <=> Лх = 0 (*> М. = 0, X, = 0), Л<0 = 0, Л<( = 0; Ь') дополняющей нежесткости: А^В;(£) = 0, t = 1,... ,тп; с') неотрицательности: А, > 0, t = 0,1,... ,тп. Покажем, что из уравнения Л1<ж = 0 следует существование функции «I Р Е С'(Д,R*) такой, что {у*,у( )) = Jp(t)y(t)dt V у € C(A,R*) и для к £» которой выполняются условия а)—Ь) теоремы Эйлера—Лагранжа. Тогда
176 Глава 3. Вариационное исчисление Л = Л и теорема будет доказана. Уравнения Эйлера и условия транс- версальности по Х/j будут вытекать из условия стационарности функции Лагранжа Л по Хр. Они выводятся как и для задачи Больца. Распишем условие стационарности Л по ха: ЛХа = 0 Л1а[Л] = 0 V h 6 C'(A,r‘) <=> J dt + iXaMh(iQ) + + {y , h(t) - <pXa(t)h(t)) = 0. *0 Отсюда в силу соотношения (1) fi </>»(•)) = -/hhdt - iXaWy - Vyt С(Д), V7 6 R‘. (2) <0 Определим функцию p из условий: -p(f)-p(t)^a(t) + Aa(t) = O, p(ti) =-1^(4,). (3) По теореме существования и единственности решения задачи Коши для линейной неоднородной системы [АТФ, с. 191] функция р € C*(A,R*) определяется нашими условиями однозначно. Тогда в силу (1) и (3): J ^(ph) dt - - p(t0)/i(t0) = J (ph + ph) dt - to *0 = J(jXah - plpXah + py + p<pXah) dt = to Находя отсюда f fXahdt и подставляя в (2), получим io = /pydt-p(t{)h(ii)+p(t0)h(f0) - tXaMy - tXatt,)h(ii) = k f, =у pydt +7(p(to) - v У e V 7 e r*. io it Откуда f p(t)y(t)dt, p(t0) - 1х„(1а>- Таким образом, Л = Л.
§ 6. Задача Лагранжа 177 6.3. Примеры । 1 Пример 1. Т(х()) = J" х2 dt —> extr; J xdt — 0, x(l) — 1. о о i Решение. Функция Лагранжа: Л = /(Agi2 + X\x)dt + Д2(я?(1) — 1). о Необходимые условия: а) уравнение Эйлера для лагранжиана L = Agi2 + А|® d —+ Lx = 0 < > 2Agi Ч- А । - 0; dt b) трансверсальность по х для терминанта I = А2(я:( 1) — 1) b±(O) = Zl(O), Li(l) =-1г(1) 2Аоа;(О) = О, 2А0±(1) = -А2; Если Ад — 0, то из а) А, = 0, а из Ь) А2 — 0 — все множители Лагранжа — нули. Этого не может быть. Положим Ад = j. Тогда х = А,. Общее решение: х = С it2 + C2t + С2. Неизвестные константы С|,С2,Сз находим из условия трансверсальности х(0) — 0, из условия на конце в единице и из изопериметрического условия-. i(0) = 0 => С2 = 0, {®(1) = 1, ГС1+С3 = 1, 1 г > J Ci f xdt = 0 | — 4- Cj = 0. о 3 Отсюда С\ = Су = Таким образом, в задаче имеется един- А 342 -1 ственная допустимая экстремаль х — ' Покажем с помощью непосредственной проверки, что функция х доставляет абсолютный минимум в задаче. Возьмем функцию h € С’([0, 1]) такую, чтобы х + h была допустимой функцией. Для этого । надо взять функцию Л, для которой Л(1) = 0 и j hdt = 0. Тогда о I iiii I(x + h)-I(i) = j\i + h)2dt-J xdt = 2 J £hdt + J h2dt^2 J Ahdt. g • о oo о Интегрируя по частям с учетом условий на Л и условия трансверсальности i(0) - 0, получим 1 1 1 I(x + h) — 1(х) 2 У idh = 2£ft| — 2 f xh dt = —6 f hdt = 0. о о
178 Глава 3. Вариационное исчисление Таким образом, разность всегда неотрицательна, то есть имеем абсолютный минимум. Очевидно, что Smax = +оо. Действительно, возьмем последователь- ность допустимых функций хп(0 = £(0 + nsin2irt, тогда j(xn()) -* +°° при п —► оо. Пример 2. 1 J хг dt —* extr; х(0) = х(0) = 0, ж(1) = 1. о Решение. Эту задачу можно свести к задаче Лагранжа, вводя вместо функции х вектор-функцию (£|,х2), и обозначения: Х\ = х, х^ = х. Тогда исходная задача сведется к задаче Лагранжа: । J ±1 dt —> extr; = х2, ®i(0) = 0, x2(0) = 0, a:i(l) = 1. о Функция Лагранжа: J (A0a:2 +₽(«)(£ 1 - x2)) dt + Aix^O) + A2z2(0) 4- A3(1) - 1). о Необходимые условия: а) система уравнений Эйлера для лагранжиана L = AqX2 +p(ii — х2) d ~ + LXl — 0 4=> —р — О, dt d --г.ЬХ1 +LX1=Q <=> —2Аох2 - р = 0; dt b) трансверсальность по х для терминанта I = А|Х|(0) + А2х2(0) + Аз(®,(1)-1) Ь«,(0) = 1Х1(0), М) = -/„(,) <=> р(0) = А,, р(1) = -Аз, bi2(0) = 1Х2(0), Ь»Д1) =-ГЖз(1) 2Аох2(О) = А2, 2Аох2(1) = О; с) неотрицательность Ао > 0. Если Ао = 0, то из а) следует, что р = 0, а из Ь) А, = А2 = Аз = 0 — все множители Лагранжа — нули. Этого не может быть. Положим Ао = j. Тогда из а) х23) = 0 «• = 0. Общее решение:
§ 6. Задача Лагранжа 179 х = Cft3 + C2i2 + Cjt + Сд. Неизвестные константы С\, С2, Сз, Сд находим из условия трансверсальности i2(l) = 0 <=> 4(1) = 0 и из условий на концах: г(0) = 0 => = О, £(0) = 0 => С3 = О, ®(1) = 1, (С, + С2 = 1, f Ci = £(1) = 0 I 6Ct + 2С2 = 0 I С2 = Таким образом, в задаче имеется единственная допустимая экстре- маль £ — - у + 3 у. Покажем с помощью непосредственной проверки, что функция £ доставляет абсолютный минимум в задаче. Возьмем функцию h € С2([0, 1]) такую, чтобы £ + h была допустимой функцией. Для этого надо взять функцию h, для которой Л(0) = Л(1) = Л(0) = 0. Тогда для 1 функционала I (®(-)) = / х2 dt имеем о 1 lilt I(£ + h.)-I(£) £2dt = 2 / £hdt+ / h2 dt 0 0 0 0 0 Интегрируя дважды по частям с учетом условий на функцию Л и условия трансверсальности 4(1) = 0, получим I(£+h.)-I(£) > 1J£dh = 2£h^~2f £(3}hdi = -24<3)ft|^+2f £whdt = 0. 0 0 о Таким образом разность всегда неотрицательна, то есть имеем абсолютный минимум. 1 । । Smin = J £2dt = j(-3t + 3)2dt = 9 j\t2-2t+l)dt = 3t3~9t2 + 9t\'Q = 3. оо о Найдем абсолютный максимум в задаче. Возьмем последовательность допустимых функций xn(t) = £(t) + nt2(t - 1); тогда 1Ы» = f (*(*) + »(« - 2))2 dt - о +00 при n —> +oo, t. e. — 4~oo.
180 Глава 3. Вариационное исчисление 6.4. Вывод уравнения Эйлера—Пуассона из теоремы Эйлера—Лагранжа Вернемся к задаче со старшими производными: Т(х()) — J Z(Z,a:(Z),a:(t),i(i),... ,a/”)(t)) di —> extr; (Р) <0 xW(tj) = xtj, k = 0,i,...,n — 1, j = 0,1. (1) Теорема. Пусть £ € wlocextrP, функции L,LX, Lx,... ,LX^ — не- прерывны в некоторой окрестности расширенного графика Г±1 ±(.). Тогда Lx{v> € C*([to, t|J), fc = 1,... ,n, u выполнено уравнение Эйлера—Пуассона " dk 52(-1)‘^£^(О = о vie{<o, М. Доказательство. Приведем задачу со старшими производными к задаче Лагранжа, сделав замену переменных х* = k = 1,... ,п, ti L(t, xitX2,. . ,xn,xn)dt —» extr; х* = х*+1, fc=l,...,n- 1, to xk(tj) = Xt-u, fc=l,...,n, j = 0,1. (P') Здесь переменной является вектор-функция (х|,...,хп)- Поскольку функция £ доставляет локальный экстремум в задаче со старшими производными (Р), то вектор-функция доставляет локаль- ный экстремум в задаче Лагранжа (Р'). Выпишем согласно теореме Эйлера—Лагранжа необходимые условия стационарности для лагранжи- ана L = A0L(t,X|,X2i- • • ,xni®n) + 22 — ®*+i)- Терминальную часть *=i функции Лагранжа, а также остальные необходимые условия экстремума, не играющие существенной роли в задаче с закрепленными концами и фиксированным отрезком интегрирования, не выписываем. Система ~Pi + AoAc, — 0, ~Р* + X0LXt - рк-! =0, к = 2,... ,п - 1, d - — + Ао^х. — Рп-1 — 0- dt Если Ао = 0, то из системы уравнений Эйлера следует, что pn_t — ... = Pi = 0. Все множители Лагранжа — нули. Пусть Ао # 0. Положим Aq = 1. Выразим рп_| из последнего уравнения и подставим в предпоследнее; проводя эту процедуру для pn-2> --,Pi, придем в итоге к уравнению Эйлера—Пуассона. уравнений Эйлера: d - ~ dt к = 1,... ,п
§ 6. Задача Лагранжа 181 6.5. Задачи Лагранжа । । 6.1. J х2 dt —> extr; J txdt = 0, x(0) - 1. 0 0 т T 6.2. J х2 dt —> extr; J xdt = 1, x(0) — 3. 0 0 т T 6.3. J х2 dt -+ extr; Jxdt = ~, x(T)=\. 0 0 T к 6.4. J x2 dt —» extr; Jxsintdt=l, x(0) = 0. 0 1 0 1 6.5. J xdt —> extr; I \/l+x2dt=^, a:(l) = 0. 0 1 0 6.6. J x dt —> extr; 0 e x(0) = i(l) =0, i(O) = l. 6.7. J t2x2 dt —► extr; i , as(l) = — 1, x(e) = i(l) = e 6.8. r J (x2 - x2) dt —» 0 i extr; i(0) = i(ir) = 0, x(ir) 6.9. J(x2 + x2) dt -+ 0 Ж/2 extr-, as(O) = 0, ac(l) = shl, 6.10. J(i2 - £)dt —> extr, х(0) =i(0) =0, — 1 о т 6.11. Т -> extr; jx2dt=l, х(0) = i(0) = 0, i(T) = l. О 6.12. ж(1) —> extr; / x2dt =4, а:(0) — i(0) — ®(1) — О, о
182 Глава 3. Вариационное исчисление Ответы к задачам главы 3 1.1. 1 - t е absmin; Smin = 1; Sm„ = 4-оо. t2 t 1.1. - — + - 6 absmin; Smaj( - +oo. 4 4 t3 -1 1 1.3. -77- e absmin; Smtn = ; Sm„ = +00. lx 1 oU t-t4 1.4. — 6 absmin; Smta = +00. 24 1.5. int € absmin; Smin = 1; Smax = +00. ln(t + 1) 1.6. ———— 6 absmin; Smin = I; Smax = +<x>- In 2 InM ш (<+l) 1.7. ----x— € absmin; Smax = +00. In j 1.8. + 1 € absmin; Smax = +°°- (t - 2)2 1.9. —-— 6 strlocmin; Smin — -00; Smax = +00, (t- I)2 £ locextr. 1.10. 2ln(t 4- 1) € absmin; Smax = +00. 1.11. t3 - t 6 absmin; Smax = +00. 1.12. t3 € absmin; Smin = 3; Smax = +00. „ chi 1.13. —— 6 absmin; Smax = +00. ch 1 1.14. (t - l)ch t e absmin; Smax = +00. , , 3-sh2 1.15. (t - l)shi e absmin; Smm = —-—; Smax = +<»• 1.16. cost € absmin; Smin = 0; Smax - +00. 1.17. (t - sint € absmin; Smjn = Smax = +<»• 1.18. tcosi € absmin; Smax = +00. 1.19. Vl ~ t2 € absmin; Smax = +00. 1.20. y/2t — t2 6 absmin ; Smax = 4-00. 1.21. Допустимые экстремали — цепные линии вида С ch где кон- станта С отыскивается из условия на конце Cch^ = £. Причем при 4- > а имеются две допустимые экстремали, при 4- = а имеется одна 1Q 40 допустимая экстремаль, при < а допустимых экстремалей нет, где а определяется из системы уравнений а = shr, т = cthr, — +00. Подробное исследование задачи содержится в книге [ИТ, с. 427]. 1.22. Экстремаль записывается в параметрической форме следующим
Ответы к задачам главы 3 183 образом: х = у(1 - cost), t = у(т - sinr) 4- с. Константы а и с од- нозначно отыскиваются из начальных условий. Допустимая экстремаль доставляет absmin , Smax = 4-со. Исследование задачи содержится в книге [АТФ, с. ИЗ]. 1.23. Экстремали, удовлетворяющие начальному условию х(0) = О, имеют вид x(t,C) = Ct 4- ^-t2. Константа С отыскивается из гранич- ного условия х(То) — 4- Уравнение огибающей этого семейства имеет вид х = - Л (в баллистике эта кривая носит наименование кривой безо- пасности). Причем при £ > -ft - h имеются две допустимые экстремали, при £ = - h имеется одна допустимая экстремаль, при £ < - h допустимых экстремалей нет. В случае двух экстремалей верхняя (в осях t, — х), носящая название навесной, не дает локального экстремума, нижняя (настильная) дает сильный минимум. Smax = 4-00. 2.1. - £ locextr; Smin = -оо (xn(t) = n); Smax = 4-oo. 2.2. ch t 6 absmin; Smax = +00. 2.3. e( + sin t € absmin; Sma/= +00. 2.4. sint + cost £ locextr; Smin = -00 (x„(i) = n); Smax = +00. 2.5. cost - 1 £ locextr; Smin = -00 (in(t) = n); Smta = +00. 2.6. (0,0) £ locextr; 5min = -00 (xn(t) = (n,-n)); Smax = +00 (xn(t) = (n,n)). 2.7. ln(t 4-1) - 1 € absmin; 5max = +00. 2.8. 7 + I € absmin; Smax = +°°- 2.9. In t 4-1 € absmin; Smax = +00. 2.10. Допустимые экстремали: \/t 4-1, Smax — 4-00. 2.11. 21n(t 4-1) g absmin; Smax = 4-oo. 2.12. - e absmin; Smax = 4-oo. 3.1. 0 £ locextr; Smin = -00 (xn(t) = nt); Smax = 4-00. 3.2. g absmin; 5max = 4-oo. 3.3. (£ - —2t, T = 1) g absmin; Smin = 4; Smax = 4-00. 3.4. -= ±4t, T = g absmin; Smin = 8; 5т = 4-oo. 3.5. (£ = 0, T — 1) £ locextr; Smin = -00; Smax = 4-oo. 3.6. = £ -t+ 1, T = 2^ & locextr, Smin = -00 (xn(t) = 1 -f, T„ =n), ^max = 4-00. 3.7. sint 4- cost g absmin; S„ux = 4-oo.
184 Глава 3. Вариационное исчисление 3.8. (t - | - 1) sin £ € absmin; Smax = +oo. 3.9. e‘ € absmin; Smax - +oo. 3.10. x — 2shTchi, где T единственное решение уравнения sh2T + T = 1. 3.11. + 2t - t2 6 absmin ; Smax = 4-oo. 3.12. A = у/l + 2£ — £2, f = 2; Smax = +oo. 3.13. Допустимые экстремали — цепные линии вида Cch£, где кон- станта С отыскивается из условия на конце Cch^ = £. Причем при > а имеются две допустимые экстремали, при = а имеется одна допустимая экстремаль, при < а допустимых экстремалей нет, где а определяется из системы уравнений а = shr, т = cthr; Smax = +оо. 4.1. 3t2 — 4t 4- 1 € absmin; Smjn = 4; Smax = +00. 4.2. G absmin ; Smin = 6; Smax = +00. 4.3. 60t3 - 96t2 4- 36t G absmin; S’min = 192; 5max = +00. 4.4. cost G absmin ; 5mjn = Smax = +00. 4.5. c absmin; Smax = 4-00. 4.6. 2el-< - t + 1 G absmin; Smin = 2e2 4- 2e — 3; 5max = +00. 4.7. te* G absmin; Smax — +00. 4.8. t G absmin; 5min = |; Smax = +00. 4.9. iv^sinkirt, к G N; ±V2sinirt G absmin; Smjn = %2; Smax — +00. 4.10. ^tcost; Smax = +00. 4.11. Допустимые экстремали — цепные линии вида ±c(ch ± — ch , где константа С > 0 отыскивается из условия 2Csh = I. Причем при I > 2То имеются две допустимые экстремали, при I = 2Т0 имеется одна допустимая экстремаль х = 0, при I < 2То допустимых экстремалей нет, ^тах — 4-00. 4.12. (3t2-2t, 3t2-6t), (-3t24-4t,— 3t2) i locextr, Smin = -00, Smax = 4-oo. 5.1. - 2t3 4- 3t2 G absmin; Smin = 132; Smax — 4-00. 5.2. t4 - 4i3 4- 6t2 - 4t 4- 1 G absmin; Smax = 4-00. 5.3. * +3*0~2t € absmin; Smax = 4-co. 5.4. sht G absmin; 5max = 4-oo. 5.5. -chicost G absmin; Smax = 4-00. 5.6. t 4- cost G absmin ; Smax = 4-oo. 5.7. ch t G absmin; 5max = 4-oo.
Ответы к задачам главы 3 185 5.8. ie' € absmin; Smax = +оо. 5.9. £ In £ G absmin; Smin = e; Sm„ - +oo. 5.10. t3 G absmin; Smin = 36; Smax = +oo. 5.11. sht 6 absmin; 5min = Smax = +oo. 6.1. G absmin; Smax = +oo. 6.2. = 3, T = 1) G absmin; Smjn = 0, (£ = 3t2 - 6i + 3, f = 1) 0 lOCCXtr , ^max — 4"OO. 6.3. = 1, T = 0 G absmin; Smin =0, (£ - t2, T = 1) 4 locextr; Smax ~ +OO- 6.4. ^(t + sint) G absmin ; Smax = +oo. 6.5. - v^l -12 G absmin; Smin = - f, Vl -12 G absmax; Smax = |. 6.6. - у + t e absmin; 5min = 1; 5max = +oo. 6.7. (t + e) In t - t G absmin; Smax = +oo. 6.8. & — -cost £ locextr; Smin = -oo (xn(t) = x(t) + n(ch(?r - t) + cost - ^77 (sh (тг - t) + sint)); Sraax = +oo. 6.9. sht G absmin; Smin = Smax = +°o- 6.10. 1 - cost G absmin; 5max = +oo. 6.11. (£ = y, T = 1) G absmin; 5min - 1; Smax — +°°- 6.12. - t3 + i2 G absmin; 5min = -1, t3 - t2 G absmax; Smax = 1.
Глава 4 Задачи оптимального управления В этой главе рассматриваются задачи оптимального управления. Приводятся формулировка и доказательство принципа максимума Пон- трягина в общем случае, доказательство принципа максимума в частном случае для задачи со свободным концом. Решаются простейшая задача о быстродействии, аэродинамическая задача Ньютона и ряд других задач оптимального управления. В пятидесятых годах потребности прикладных дисциплин (техники, экономики и др.) стимулировали постановку и рассмотрение нового класса экстремальных задач, получивших название задач оптимального управления. Необходимое условие экстремума для задач этого клас- са — «Принцип максимума», — сформулированное Л. С. Понтрягиным в 1956 году, было доказано и развито впоследствии им, его учени- ками и сотрудниками. Важно отметить, что это условие имеет су- щественно иную форму в сравнении с классическими уравнениями Эйлера и Лагранжа: в качестве обязательного условия в решении зада- чи оптимального управления входит решение вспомогательной задачи на максимум (отсюда и название — «принцип максимума»). За разра- ботку теории оптимального управления Понтрягину и его сотрудникам В. Г. Болтянскому, Р. В. Гамкрелидзе и Е.Ф. Мищенко в 1962 году была присуждена Ленинская премия. Понтрягин рассматривал задачу на максимум, мы же для единообра- зия с прошлым материалом будем рассматривать задачу на минимум, называя соответствующее условие условием оптимальности, и формули- ровать необходимые условия в лагранжевой форме. В отличие от задачи Лагранжа в задаче оптимального управления вводится управление и появляется дополнительное ограничение типа включения на управление: u € U. Множество U определяет возможности человека влиять на происходящий процесс.
§ I. Принцип максимума Понтрягина в общем случае 187 § 1. Принцип максимума Понтрягина в общем случае 1.1. Постановка задачи Задачей оптимального управления (в понтрягинской форме) будем называть следующую задачу: Во(£) min; В,(£) <0, m', В,(£) = О, » = m' + l,...,m, (Р) x(t) - <p(t, x(t), u(t)) = 0 V t £ T, (1) u(t) € U V t £ A, (2) где 4 = H),«().Mi). x e PC'(A,Rn), и £ PC(A,Rr), t0,ti e A, t0 < ti, A — заданный конечный отрезок, U C Rr — произвольное множество, Т С А — множество точек непрерывности управления и, Bi(C) = f /,(t, x(t),u(t)) dt + ipi(t0,x(t0),t\,x(ti)), i = 0,1, • • ,m. *0 Здесь PC(A, Rn) — пространство кусочно-непрерывных на отрезке A вектор-функций, соответственно РС’(Д, Rn) — пространство непрерыв- ных вектор-функций, имеющих кусочно-непрерывную производную. Напомним, что кусочно-непрерывной функцией называется функция, имеющая не более конечного числа разрывов первого рода (в точках разрывов существуют конечные пределы слева и справа). Вектор-функция х = (i|,..., хп) называется фазовой переменной, век- тор-функция u = (ui,...,ur) называется управлением. Ограничение (1), являющееся дифференциальным уравнением, называется дифференциаль- ным ограничением. Оно должно выполняться во всех точках непрерывно- сти управления и. В отличии от задачи Лагранжа имеется ограничение (2) типа включения, которое должно выполняться во всех точках t € А, а фазовая переменная х — (х\,...,х^ может иметь меньшую гладкость. Частным случаем задачи оптимального управления (Р) является задача, в которой один из концов или даже оба закреплены. Элемент 4, Для которого выполнены все указанные условия и огра- ничения задачи, называется допустимым или еще говорят допустимым управляемым процессом. Допустимый управляемый процесс £ = (£(), й(-), Iq,£|) называется (локально) оптимальным (или еще говорят оптимальным в сильном смысле процессам), если существует 6 > 0 такое, что Во(С) > Во(£) для любого допустимого управляемого процесса £ = (x( ),u( ),tQ,t\), для которого ||х( ) - £( )|1с(Д) < 6, |«о - 4»| < 6, |tt - £|| < 6.
188 Глава 4. Задачи оптимального управления 1.2. Формулировка теоремы Теорема. Пусть £ = (ж(),й(),$о7|) — оптимальный (в сильном смысле) процесс в задаче оптимального управления (Р); функции fa, t = 0,1,... ,m, ip и их частные производные по х непрерывны в некоторой окрестности множества {(i, £(t)) 11 € Д }, декартово умноженного на U, а функции i = 0,1,..., т, непрерывно дифференцируемы в окрестности точки (to,a;(to),t|,ic(t|)) (условие гладкости). Тогда найдутся множители Лагранжа (Х,р) G Rm+I х PC'(A,R"), (А>Р()) * О, такие, что для функции Лагранжа <1 Л = j(f(t,x,u) + p(t)(i - <p(t,x,u))) dt + l[to,x(to),t\,x(t\)'), to где f(fax,u) = 12 I = 53 (^o> a?Go), i, i)) — терминант, i=0 i=0 выполнены условия'. а) стационарность no x — уравнение Эйлера для лагранжиана L(t, х, х, и) — f(t, х, и) + p(i — <p(t, х, и)) d -^(t) + Lz(t) = 0 V i e T <=> -p(t) + fx(t) - p(t)ipz(t) = 0; b) трансверсальность no x ^i(^o) = CrOo) ' P(^o) ~ > Lz(t\) — —s—> P(^l) ~ — с) оптимальность no и minL^t,£(t),i(t),u) = L(t, £(t), £(t), «(t)) <=> ™ -P(0^0,*(0>«)} = fit) ~ P(t)<p(t) VtET; d) стационарность no подвижным концам (выписывается только для подвижных концов отрезка интегрирования) Лео(<о) = О <=> -/(io) + ko + L(fo)®(to) = 0, A«i(ti)=O <=> /(Л) + + 4((|)®(ti) = 0; e) дополняющая нежесткость i О неотрицательность A, 0, i = 0,1,, m .
§ 1. Принцип максимума Понтрягина в общем случае 189 1.3. Доказательство А) Игольчатые вариации, пакет иголок. Проварьируем процесс (, включив его в конечно-параметрическое семейство, определяемое па- кетом иголок (набором игольчатых вариаций управления й). Для это- го фиксируем натуральное число N, наборы: точек т = (r\,...,rN), Л Т2 < ... < rN, управлений v = (г>|,..., длин а = (Л|,... ,ajy) (т< € Т, Vj G U, а, 0, » — 1,..., X). Управление й(0, teA\LMb £=1 t е Л. , «а (0 = ’ . vh где Д, = [т< - (N - *)|а| - т, - (N - г)|а|), |а|: = + ... + , назовем игольчатой вариацией управления й, определяемой пакетом иголок (т, v, а). Некоторые точки т,-, могут совпадать. Однако полуинтервалы Д,, имеющие длины а,, устроены так, что они не пересекаются и при малом |а| лежат во множестве Т. Функция x(t;to,xo,a), являющаяся решением уравнения х = <p(t, х, иа), x(t0) = ж0, (1) называется игольчатой вариацией функции £, определяемой точкой (to, х0) и фиксированным пакетом иголок (т, v). Ниже мы покажем, что если точка (to,xo) находится в окрестности точки (to, Aq) (Ao- = A(t0)), то при малом |а| решение дифференциального уравнения действительно существует и определено на всем отрезке Д. В) Теорема существования. Лемма об игольчатой вариации. Теорема. Предположим, что задача Коши. x = F(t,x), x(tQ) — х0 (to € intA), имеет решение £ € РС'(Д,КП) на конечном отрезке при этом F — функция непрерывная и непрерывно дифференцируемая по х в некоторой окрестности G траектории = {(t,4(t)) 11 € Д}. Тогда найдется G' С G — окрестность траектории Г± такая, что для любой точки (to,Xo) € G' существует единственное решение x(-;t<hxo) задачи Коши, определенное на Д, при этом функция x(t; to, xq) непрерывно дифференцируема во множестве Д х G' и = П(Мо), <о, го) |l0=i(t0) = — ^(0 to)F(to> *(^о)), где n(t,t0) — фундаментальная система решений уравнения: tt(t,t0) = Fz(t,x(t))£l(t,to), ft(to,to) = I (единичная матрица).
190 Глава 4. Задачи оптимального управления Это классическая теорема о существовании и непрерывно дифференциру- емой зависимости решения дифференциального уравнения от начальных данных (АТФ, с. 195-204]. Лемма об игольчатой вариации. Пусть наборы типе пакете иголок (r,v,a) фиксированы. Тогда существует е > 0, такое, что если 0 < |а| < е, |хо ~ £о| < Е, 1<о - tg| < £, то Д< С Т и, кроме того, функция x(t; to, Хо, о) — решение уравнения (1) — определена на отрезке Д, непрерывно дифференцируема в некоторой окрестности точки (t|, tg, £о> 0), при этом ||as(-;t0,ш0,а) - 4( )|Ic(a,r-) “* 0 пРи (to,xo,a) -> (to,£o,O) и xz.(t-,fo,£o,O) = Q(t), (2) ®i0(i;fo,^o,0) = -Q(i)£(tg), (3) где Q(t): = Q(t,fo) — фундаментальная система решений уравнения: n(t) = ^(t)n(t), Q(t0) = I. Наметим путь доказательства леммы. Если управление й — непре- рывная функция, то утверждения леммы сразу вытекают из теоремы о существовании и непрерывно дифференцируемой зависимости реше- ния дифференциального уравнения от начальных данных. Если же й кусочно непрерывна, то нужно применить теорему несколько раз на ка- ждом участке непрерывности. С) Редукция к конечномерной задаче. Снова фиксируем N, наборы т и V. Обозначим z: = (t|,to,a:o,ai,... ,ац) € R2+n+JV, Bi(z): - Bi(x(-;to,xo,a),ua,to,ti) = = J fi (t, x(t; tQ, x0, a), ue(t)) dt + tfe (t0, xe0 , i i, ; to, x0, a)) и рассмотрим конечномерную задачу с ограничениями типа равенств и неравенств Bo(z) —» min; B,(z) 0, i = 1,..., m', Bi(z) = 0, i = m + 1,..., m, a, >0, j = (P,.,) В силу леммы об игольчатой вариации функции В, непрерывно диф- ференцируемы в некоторой окрестности точки i = (t|,£o,£o,O) и элемент (z(-;to>zo>a)>to>ti) —» (£(•),4,£|) в метрике пространства С(Д, R") х R2 при z —» £. А так как элемент £ доставляет локальный минимум в зада- че (Р), то точка £ € locmin Рг,«. Значит, к задаче (Рт,«) применим принцип
§ 1. Принцип максимума Понтрягина в общем случае 191 Лагранжа для конечномерных задач с равенствами и неравенствами. Со- гласно ему найдутся множители Лагранжа Ао,- • ,Am, . ,/xjv, не все равные нулю (Aj — A,(t,v), и такие, что для функции Лагранжа задачи (Ртл) т N л = 52 - 52 ~ 1=0 >1 f я t >=' т т где f(t,x,u) = ^2Xifi(t,x,u), 1(£о,£оЛ,а:1) = 5ZА»^(^о,<i»a=i)» вы- i=0 i=0 полнены условия стационарности: Аг = 0; дополняющей нежесткости: А<В<(2) = 0 (О А,В,(£) = 0, * = 1,... ,т' о е)), Hjaj = 0, j = неотрицательности: А; 0, i = 0,(& /)), Ду > 0, j = D) Преобразование необходимых условий конечномерной задачи. Обо- значим р — решение дифференциального уравнения P + PV* = fx> (а) Р(^) = Ч,. (М Существование и единственность решения уравнения (а) с краевым условием (bj) следует из теоремы существования и единственности ре- шения задачи Коши для линейных систем [АТФ, с. 191]. Из определений функции р и определения функции О следует, что d . — (pQ) = pQ + pH = fx£l - p<pxii + p<pxSl = ДП. di Отсюда lt i, [fSldt= f^- (pSl)dt = р^)ЩЦ) - p(to)D(£o) (= -G.n(ti) - P(to)- (*) J J dt 4 4 Распишем условия стационарности функции Лагранжа Л в точке £, учитывая лемму о приращении функционала и формулы из леммы об игольчатой вариации (см. ниже §2):
192 Глава 4. Задачи оптимального управления Ae,(z) = - f(Tj) - р(т^(<р(т,,х(т^,у^ - - р, = О ~ - f(Tj) - - <p(Tj)) = Pj > О, J=1,-..,2V; (c,t) I, AZo(z) = J fz(t)xXo(t,to,xQ,O)dt + tXo +ltlxXa(i[;to,xo,O) = 4) <1 = f fza dt + lXo + iXlQ(ii) = to = -iXl^(ti) - p(to) + 40 + 4.Щ4) = -p(t0) + 40 = 0; (b0) A At0(5) = -f(i0) + J fz(t)xto(t-,i0,£0,0)dt + 4 + lXlxlt)(ii;io,£o,O) = io = "/(4) " f A(i)0(i)^(4)dt + lt0 - 4,О(4)<₽(4) = £o = -/(4) + 4,0(t|)^(to) + p(to)ip(to) + lt„ - iXlSt(t,)ip(i9) = = -/(4) + P(4)i(4) + 4 = -/(4) + 4 + 40i(4) = 0; (do) A|, (z) = f(ti) + 4 + 4,^(4) = 0. (d|) Очевидно, что A # 0, ибо иначе из определений f,l и р следовало бы, что р = 0, а из соотношений (CrV) тогда следовало бы, что р = 0. А множитель Лагранжа (А,р) # 0. Умножением на положительную константу нормируем вектор А так, чтобы |А| — 1. Итак, получили: для точек ть ... ,tn G Т, управлений . ,vN G U, существует вектор А = (Ао, А,,... ,Am), |А| = 1, такой, что выполня- ются соотношения a)-f) принципа максимума Понтрягина с условием оптимальности с) для конечного числа точек т, и управлений . Е) Окончание доказательства. Рассмотрим в пространстве Rmbl подмножества К(г,v), т£Т, v EU, сферы К = {A g Rm+I | |А| = 1}, состоящие из тех векторов А, для которых выполняются утверждения a)-f) теоремы о принципе максимума Понтрягина, причем в п.с) взято t = т, u = V. Сфера К является компактом, множества K(r,v) С К замкнуты, конечное пересечение р| 0.
§ 1. Принцип максимума Понтрягина в общем случае 193 Лемма о центрированной системе. Пусть К — компакт, — система замкнутых подмножеств К, любая конечная подсистема которой имеет непустое пересечение (центрированная система). Тогда пересечение всех множеств системы {Ка}аел непусто ( П Ка Ф 0). аёА Доказательство. Обозначим Оа — дополнение к Ка в К (Оа: = К \ Ка)- Тогда Оа открыто в К. Если Q Ка = 0, то (J Оа = а€А а€А (J (К \ Ка) = К \ П Ка — К, т.е. {О0}а€х есть открытое покрытие а(~А а€Л компакта К. По определению компакта из любого открытого покрытия можно выделить конечное подпокрытие, т.е. можно найти а.],... ,ам, N N N N такие, что |J Oaj = К. Но тогда Q Ка, — П (К \ Oaj) — К \ IJ OOj — 0 >=i j=i j=\ j=i — противоречие с центрированностью системы. Значит, пересечение всех множеств системы Q Ка # 0. По лемме о центрированной системе все множества К(т, v) име- ют непустое пересечение. Значит, существуют ненулевой вектор А = (А0,...,Ат) и функция р € PC^A.R”) такие, что выполняются утвер- ждения теоремы a)-f) с условием оптимальности, выполняющимся для любых т € Т, v € U. Замечание. Принцип максимума доказан нами в пространстве PC'fA, Rn) х РС(Д, Rr)x R2. Небольшие измен ения доказательства по- зволяют обосновать его в пространстве W^A.R") х L00(A,Rr) х R2. 7 Зак 60
194 Глава 4. Задачи оптимального управления 1.4. Пример 4 В(х()) = f(x2 + х) dt —» extr; |i| 1, х(0) = 0. о Решение. Приведем задачу к виду задач оптимального управления, введя управление и: 4 j(и2 + x)dt —> extr; х = и, и 6 [-1, 1], х(0) = 0. о Функция Лагранжа: 4 Л = J (А0(и2 + х) + р(х -u))dt + AI z(0). о Необходимые условия: а) уравнение Эйлера для лагранжиана L = Aq(w2 + х) + р(х - «) d — ~Li + Lx — О ч > — р + Ао — 0; at b) трансверсальность по х для терминанта I = А(х(0) МО) = '«ОТ, М«) = ~М) <=> Р(0) = Аь ?(4) = 0; с) оптимальность по и min {Ао«2 — ри} = Аой2 — рй; «€[-1,11 d) неотрицательность Ао > 0 в задаче на минимум, Ао С 0 в задаче на максимум. Если Ао = 0, то из а) р = 0 и из Ь) р = А| = 0 — все множители Лагранжа оказались нулями. В задаче на минимум положим Aq = 1. Тогда из а) р = 1 и из Ь) р = t - 4. Из условия с) следует, что й = 2’ signp, i = t -1, 0^t<2, 2 i 4.
§ 1. Принцип максимума Понтрягина в общем случае 195 Интегрируя, получаем -t + ch t2 --2t + Cb 4 Os^t si 2, 2 sg t < 4. £ = Из начального условия г(0) = 0 выводим, что С( = 0, а из условия непрерывности в точке t — 2 имеем -2 = 1 - 4 + Cj <=> Сг = 1. Таким образом) {-/, 0 5$ t 5$ 2, t2 ---2Z + 1, 2 «U ^4. 4 Докажем с помощью непосредственной проверки, что функция £ доставляет абсолютный минимум в задаче. Возьмем функцию h е PC1 ([0, 4]) такую, чтобы £ + Л была допустимой в задаче. Для этого надо взять функцию Л, для которой |4 + Л| si 1, Л(0) = 0. Имеем 4 4 ((£2 + 4) dt = о о 4 4 4 — 2 J*£hdt + £ hdt + J* ООО 4 4 У £dh + У hdt. о о i.2 Интегрируя по частям в первом интеграле с учетом условий А(0) — О, £(4) = 0, получим 4 4 В(£ + Л) - В(£) > 24л|\ У(-24 + \}hdt = J(-24 + l)hdt. о о Подставляя в последний интеграл найденную функцию 4 и разбивая отрезок интегрирования на два, имеем 2 В(£ + А) - В(£) У hdt 0, о ибо A(t) > о при t € [0, 2], так как А(0) =0, и Л > 0 при t € [0, 2] (т. е. функция А возрастает на отрезке [0, 2] и, следовательно, неотрица- тельна). Итак, 4 6 absmin. smin = B(4)=: У(42+4)Л = j(\~t)dt + j+1--И+\^ел = 0 0 2 7«
196 Глава 4. Задачи оптимального управления / Г/t2 \ /Р 2 \|4 2 = U--I + (- - 4t + 5)dt = 2-2 + (- - 2t2 + 5t)\ = -4- \ 2 / Io J \ 2 / V6 /h 3 2 В задаче на максимум положим Aq — —1. Тогда из а) р = -1 и из Ь) р — 4 - t. Из условия с) min {—u2 - pti} = — й2 — рй i| следует,’ что й = х — signp = sign (4 — t) — 1, 0 t < 4. Интегрируя, получаем £ — t + С. Из начального условия х(0) = О вытекает, что С — 0. Таким образом, £ = t. Докажем с помощью непосредственной проверки, что функция £ доставляет абсолютный максимум в задаче. Возьмем функцию h Е РС'([0, 4]) такую, чтобы £ + h была допустимой в задаче. Для этого надо взять функцию h, для которой |£ 4-/i| < 1 («> |1 4- h\ < 1 О — 2 < h $ 0), Л(0) = 0. Как и при проверке экстремали на минимум имеем 4 4 4 4 4 В(£ + Л) - В(х) = 2 J £hdt + J h2dt + J hdt = J(2 + h)hdt + J hdt. 0 0 0 0 0 Оба интеграла неположительны, поскольку в первом интеграле h 0, a 2+h 0, а во втором интеграле h С 0, так как Л(0) = 0 и h 0 (т.е. функция h убывает). Следовательно, В(х + Л) - В(£) < 0, т. е. £ = t € absmax: г 4 2 Smax = B(£())= J(£2 + £)dt = J(l+t)dt= (t+y)|* = 4 + 8 = 12. о о To, что £ = t € absmax можно было бы получить и без непо- средственной проверки из условия самой задачи. Разобьем исходный 4 функционал на два интеграла. Максимум J х2 dt при |х| С 1 достигается о 4 на |i| = 1, а максимум /xdt при |i| 1, х(0) = 0, достигается при о наибольшем возрастании функции х, т. е. при х — 1 (<=> £ = t).
§2. Принцип максимума в частном случае 197 § 2. Формулировка и доказательство принципа максимума Понтрягина для задачи со свободным концом Приведем формулировку и доказательство принципа максимума Понтрягина для следующего частного случая задачи оптимального управ- ления — задачи со свободным концом и закрепленным временем: t, В (□:(•),«(•)) = J/(t,a:(t),u(t)) dt -> min; (P) i(i) - у?(4,г(«),ц(4)) =0 VteT, u(t) E U VieRo, t|], x(t0) = x0, где U C Rr — произвольное множество, T c Uo, i|] — множество точек непрерывности управления «(•). Теорема. Пусть (£(),и(-)) — оптимальный процесс в задаче опти- мального управления (Р). Функции f,<p и их частные производные по х непрерывны в некоторой окрестности множества {(t, £(t)) | t G [4>i ]}, декартово умноженного на U, а функция ф непрерывно дифференцируема в некоторой окрестности точки i(t,) (условие гладкости). Тогда выполняется условие оптимальности по w. f(t,£(t),u)-p(t)<p(t,£(t),u)^f(t)-p(t)<p(t) V t Е Т, V и Е U, (1) где р — единственное решение дифференциального уравнения -р(0 + Л(0-Р(0Рх(0 = 0 ytET (2) с краевым условием P(tt) =-Ф'(£(*>)) (3) Отметим, что принцип оптимальности (1) с условиями (2)-(3) может быть выведен из необходимых условий оптимальности в общей задаче оптимального управления, множитель Лагранжа Aq при функционале В оказывается равным единице, а условие трансверсальности по x(t0) не существенно. Доказательство. Единственность решения уравнения (2) с краевым Условием (3) следует из теоремы существования и единственности решения задачи Коши для линейных систем [АТФ,с. 191]. А) Игольчатые вариации. Зафиксируем точку т Е Т, элемент v Е U такое малое число а 0, что отрезок [г — а, т] С Т. Управление «(0> t t [т - а, г), t Е [т - а,т), и «а(0 =
198 Глава 4. Задачи оптимального управления назовем элементарной игольчатой вариацией управления й. Пусть £<,(•) — решение уравнения x(t) = <p(t,x(t),ua(t)) с начальным условием x(t0) = xq. По локальной теореме существования [АТФ, с. 186-189] функ- ция ха определена при малых а в некоторой окрестности точки to, но из леммы 1, формулируемой ниже, следует, что на самом деле вектор- функция ха определяется единственным образом на всем отрезке {to, tj. Функция ха называется элементарной игольчатой вариацией функции £, а пара (ха,иа) — элементарной игольчатой вариацией процесса (£,й). Тройку (т,в,а), определяющую эту вариацию, будем называть элемен- тарной иголкой. В) Лемма 1 (о свойствах элементарной игольчатой вариации). Пусть в элементарной иголке (г, v, а) точка г € Т и управление v Е U фикси- рованы. Тогда существует число е > 0 такое, что для любого а € [0, е] отрезок [т - а, т] С Т, а функция ха — игольчатая вариация функции — £ определена на всем отрезке [to, t, ]; при этом при а —► +0 1) функция ха( ) —♦ £(•) в метрике пространства C([to, tg ], Rn); 2) функция —------------► у( ) в метрике пространства С([т, t,] ,R”), где функция у кусочно дифференцируема на отрезке [т, t| ] и удовлетворяет дифференциальному уравнению y(t) = ^(t)j/(t) Vte[r, tjJnT (4) с начальным условием у(т) = <р(т, £(т), v) - ф(т). (5) Доказательство леммы следует из двух основополагающих фактов тео- рии обыкновенных дифференциальных уравнений: локальной теоремы существования и теоремы о непрерывной дифференцируемости решения по начальным данным. Мы не приводим их здесь, отсылая к книге АТФ, с. 89-91. С) Лемма 2 (о приращении функционала). Пусть в элементарной иголке (r,v,a) точка т € Т и управление v € U фиксированы, В (а) : = В(ха(),иа(У). Тогда функция В дифференцируема справа в нуле и В'(+0) = ~ /(т) ~ p(t)(<p(t,£(t),v) - 0(т)). Доказательство леммы 2. Используя теорему о среднем для опреде- ленных интегралов, правило перехода к пределу под знаком интеграла, дифференцируемость по Фреше и лемму 1, получим вЦ-н» = Um в<»>-*<°) = 1|и = а—+о а о—+о а
§ 2. Принцип максимума в частном случае 199 я= lim -( / (f(t,xa(t),ua(t))-f(t))di ) + hm -----------------= а-ч-о а \ J ) о—+о а to г <| = lim -( / /(/(t,*a(0,fi(0)-/(0)<tt) + a-*+o a \ j j j t-a т .. - *(ii)l+<’M>) - *(*»)) + hm------------------------------------------- a-+o a = lim (f(t,xa(t),v) - 7(0)1 + lim [ + a-+<r ' He[r-«;r| a-+<>J a V «1 +у>'(4(е1))1/(11) = /(т,Л(т),о)-/(т) + J fx(t)y(t)di — p(t])y(ti). T Выражая fx из уравнения (2), учитывая уравнение (4), и начальное условие (5) для у(т), имеем «I «I ‘1 /г / Г d fxydt= (p + p<f>x)ydt= (py + py)dt= —(py)dt = J J J at т т T T = ~ Р(т)у(т) = Р^\)У(1\) - P(t)(<p(t,£(t),v) - 0(r)). «i Подставляя найденное значение f fxydt в выражение для В'(+0), т получим искомое представление. D) Завершение доказательства. Из леммы 1 следует, что если а € [0, е], то (ха,иа) — допустимый управляемый процесс и ха() равномерно стремится к £(). Поскольку (4, й) — оптимальный процесс, то при малых a > 0 В(ха,иа)^ В(£,й) <=> В(а)^В(0). Отсюда по лемме 2 В'(+0) 0, и из выражения для В'(+0) вытекает, что /(т,£(т),о) - р(т)<р(г,£(т),о) > /(т) - р(т)ф(т) V т еТ, V v € U, т-е. выполняется соотношение (1). Теорема полностью доказана.
200 Глава 4. Задачи оптимального управления § 3. Избранные задачи оптимального управления 3.1. Простейшая задача о быстродействии Рассмотрим задачу о наибыстрейшей остановке лифта в шахте, во- шедшую во многие монографии по оптимальному управлению. Лифт управляется под воздействием внешней силы, которая может изменяться в заданных пределах, регулируемых человеком. Предположим, что воз- можности действующей силы, а следовательно, и ускорения, ограничены какой-то величиной, например, ускорение может изменяться от -1 до +1. Требуется за кратчайшее время Т остановить (ж(Т) = 0) лифт, для определенности в начале координат (ж(Т) — 0). Нетрудно видеть, что задача может быть формализована следующим образом: T->min; |ж| 1, ж(0) = ж(0) = £2, ж(Т) = ж(Т) = 0. Аналогично формализуется задача о машине, движущейся прямоли- нейно без трения по горизонтальной дороге. Машина может двигаться в любую сторону с ускорением, не превышающем единицу. Требуется остановить машину в определенном месте за кратчайшее время. Решение. Приведем задачу к виду задач оптимального управле- ния, вводя вместо функции х вектор-функцию (ж|,ж2), управление и и обозначения: ж, = ж, ж2 = ж, и = ж, Т —> min; Ж| = ж2, ж2 = и, и € [—1,1], *1(0) = 6, *2(0)=6, ж,(Т) = ж2(Т)=0. Функция Лагранжа: т л = J (Р1(О(Я| - Я2) +Рэ(0(я2 - «)) dt + 0 + АоТ + А|(ж|(0) — £|) + А2(ж2(0) — 4г) + + А4Ж2(Т)- Необходимые условия: а) система уравнений Эйлера для лагранжиана L — — ж2) + Р2(0(*2 - «) = 0, -Pi = 0 p2(i) = Cyt + C2; d ~~dtLi'+Lx' “°’ d 4 dt b) трансверсальность по ж для терминанта I — XqT + А|(ж](0) — £i) + А2(ж2(0) — £2) + АзЖ|(Т) + А4ж2(Т) bi,(0) =/Z1(o), Li^T) =<=> Pi(0) = A|, pi(T)=-A3,
§ 3. Избранные задачи оптимального управления 201 Дсг(°) - ~ ~1Z2(T) <=> Рз(О) = Аз, Рз(Г) = -Л4; с) оптимальность по и (не зависящие от и слагаемые не выписываем) г /а 1 J sign р2(J), р2(0#0, ™nit { - МО-} = -?.(0«(0 => -«) = ( „,6ое И11_! и гМ = d) стационарность по Т \т(Т) = 0 <=> Ац + A3i,(T) + A4i2(T) = 0; е) неотрицательность Ао 0. Учитывая то, что из начального условия следует i|(T) = 0, а из Ь) А4 — -р2(Г), получаем, что d) равносильно условию Ао = р2(Т’)й(Т). Поэтому если Ао = 0, то р2(Т) = 0 либо й(Т) — 0, но тогда из с) вновь р2(Т) = 0. При этом р2 не может быть тождественным нулем, ибо иначе все множители Лагранжа были бы нулями. Значит, из а) p2(t) = C(t — Т), а тогда из с) следует, что w(t) = 1 или ti(i) = -1. Множество начальных условий, соответствующих таким управлениям, описывается уравнением Действительно, пусть u(t) = 1 о x2(t) s °a:2(t) = t-T*'^ °Ж| (£) = (t~T)2/2 =>£, = &/2 > 0 => £i = — y/2£i (при извлечении квадратного корня берем знак минус, поскольку £}_ = ®2(0) = -Т < 0, при этом минимальное время движения Т = —£2 >0). В случае u(t) = -1 аналогично получаем, что & = \/—2£,, £| < 0. Ниже покажем, что Найденное время движения действительно доставляет минимум в задаче. Таким образом, в нашей задаче в этих случаях минимум достигается при Aq = 0. Если же Ci / то Ао 0, и мы полагаем Ао — 1. Тогда из d) вытекает, что |р2(Т)| = 1, т. е. имеются две возможности: p+(t) = C(t-T)+l, p^(t) = C(t-T)- 1. ^тим возможностям в силу Ь) соответствуют такие управления: ( — 1, 0 t < т, __ Г 1, 0 t < г, t 1, r<t^T, и ~ t-1, т < t Т. ям Рассмотрим траектории, соответствующие оптимальным управлени- и и и на плоскости (г,,^), называемой фазовой плоскостью.
202 Глава 4. Задачи оптимального управления Для тех значений t, для которых u(t) = 1, имеем , С • ff X л ±2 = 1 => ii = = t + С => Х| = у + C t + С = + С. Таким образом, фазовая траектория, соответствующая этим значе- ниям t, является куском параболы xt = + С. Направление движения по такой параболе определяется из условия возрастания ху, так как в этом случае х^ = 1. Аналогично получаем, что для тех значений t, для которых u(t) = — 1, фазовая траектория — кусок параболы г, = — + С, а направление движения определяется из условия убывания х^, так как X? = — 1. Укажем теперь то место на фазовой плоскости (х^х?), где долж- но совершаться переключение управления. В искомую точку (0,0) (xi(T) = xi(T) = 0) мы должны попасть не более чем с одним переключением, двигаясь по фазовой траектории по разрешенному направлению. Совокупность начальных условий, соответствующих упра- влениям и+ и и", описывается неравенствами & > ¥>(£1) (для и+) и & < V’(Ci) (для «”)• Переключения совершаются на кривой — <₽(6)- При этом, как нетрудно видеть, для каждого начального условия имеется единственная фазовая кривая, приводящая в точку (0,0). Рис. 7. Поскольку всегда |®2l = 1 на оптимальной траектории, то = RI+C и, значит, время движения Т = Var х2 (вариация функции х2). Одна- ко проще находить оптимальное время Т, строя функцию х( ) класса РС2([$о, <|]). удовлетворяющую необходимым условиям экстремума и на- чальным условиям. В примере 2 пункта 3.3 будет приведено решение одной из конкретных задач быстродействия.
§ 3. Избранные задачи оптимального управления 203 Покажем, что оптимальная траектория, начинающаяся в точке (41, £2), доставляет решение задаче. Пусть этой траектории соответствует управление й (для определенности й-), функция £ и время Т. Предпо- ложим, что имеется некоторый другой допустимый управляемый процесс (г,«,Т), Т Т. Доопределим функцию х( ) нулем на отрезке [Т, Т]. Воспользуемся следующей формулой восстановления функции по ее п-й производной х(т) = Лг - а)"-1аг(п)(а)<Ь + ^xw(0) (п - 1)! J к\ По этой формуле при п = 2 в силу условий на левом конце функции х и £ в точке т можно представить в виде т х(т) = J(г - s)i(s) ds + (2т + £|. о Поскольку £(s) = 1 х(з) V з £ [0, т], то т £(т) - х(т) = J(г — з)(1 — x(s))ds 0, о причем равенство здесь возможно только, если во всех точках непрерыв- ности х(з) = 1, а тогда x(t) = £(t) V t € [0, т]. Аналогично с учетом условий на правом конце функции х и £ в точке т можно представить в виде т х(т) = J (з — r)i(s) ds. Поскольку £(s) = -1 x(s) V s £ [т, Т], то т £(т) - х(т) = j(в - т)(—1 - i(s))ds 0, т причем равенство и здесь возможно только, если x(s) = ~ 1, а тогда x(t) = £(t) Vi£[r, f]. Таким образом, имеем, что х(т) = £(т) и, следовательно, x(t) = £(t) V t € [0, Г]. Отсюда Т = f.
204 Глава 4. Задачи оптимального управления 3.2. Аэродинамическая задача Ньютона Задача Ньютона — это задача о сопротивлении движению тела вращения в «редкой» среде. Необходимо выбрать форму тела вращения так, чтобы сопротивление движению было минимально. История задачи В 1687 году вышли «Математические начала натуральной философии» Ньютона. В седьмом разделе, озаглавленном «О движении жидкостей и сопротивлении брошенных тел», Ньютон рассматривает задачу о со- противлении шара и цилиндра в «редкой» среде. Затем в «Поучении», при исследовании сопротивления усеченного конуса, Ньютон делает следующее утверждение. Пусть DNEG — неко- ' торая кривая. Из произволь- Nr ной точки N кривой опустим s''______________________________У q перпендикуляр на ось АВ и ' ; и из заданной точки G про- -------------——1 Н ведем прямую, параллельную С М--------------------------Р касательной к кривой в точ- Н ке N. Эта прямая пересе- I чет ось АВ в точке Р. То- гда если имеет место пропор- Рис. 8. ция = 4BP.SGi, то те- ло получающееся вращением кривой DNEG около оси АВ, будет испытывать наименьшее сопроти- вление в вышеупомянутой редкой среде среди других тел такой же длины и ширины. Ньютон не дал объяснения тому, как он пришел к этому резуль- тату. Опубликованные в наше время материалы Ньютона показывают, что он владел элементами многих конструкций, которые потом были использованы при создании вариационного исчисления. Но, как будет видно в дальнейшем, задача Ньютона относится даже собственно не к вариационному исчислению, а к оптимальному управлению, теория которого начала разрабатываться только в середине этого века. Формализация задачи Сопротивление движущегося тела зависит от законов сопротивления среды. Ньютон представлял себе среду состоящей из неподвижных частиц фиксированной массы тп, являющихся абсолютно упругими шарами. Мы также будем придерживаться этого предположения.
§ 3. Избранные задачи оптимального управления 205 Пусть тело вращения вокруг оси х движется в направлении, обратном оси х в описанной выше среде со скоростью v. Элемент dr на оси т при вращении вокруг Ох описывает кольцо da. Этому кольцу соответствует пояс dE на теле вращения. За время dt этот пояс «вытеснит» объем dV — hrrdrvdt, где 2тгг dr — площадь da. При этом слой столкнется с N = ^-dV = ^-2-nrdrvdt частицами, где р — плотность среды. Предположим, что участок ds наклонен к оси г под углом <р. Тогда одна частица, ударившись о слой получит приращение импуль- са, равное тп(г>2 — i>i) = -2mvcos<p п, |vi| = |vj| — v, n — единичный вектор нормали к dE. По третьему закону Ньютона, тело получит прз - ращение импульса 2mv cos <рп. За время dt таких приращений будет N, а так как в силу симметрии компоненты пг вектора — п, т.е. ортого- нальные оси вращения, сократятся, то суммарное приращение импульса будет направлено вдоль оси х и модуль его будет равен 2pirrv dr dt 2 22 N2mv cos ip cos ip —----------2mvcos ip — 4pirv r cos <pdrdt. В силу второго закона Ньютона это приращение равно dFdt, следовательно dF = 4pirv2r cos2 <р dr, где к = 4pv2-rr. Просуммировав dF по всем поясам dE (т. е. по всем элементам dr), получим R F = k о г dr
206 Глава 4. Задачи оптимального управления Таким образом, заменив г на t и R на То, получаем экстремальную задачу: То f tdt / , , -2 — min; z(0) = 0, x(T0) = J 1 + a: о Очевидно, что нижняя грань интеграла равна 0. Действительно, 0 при t € [0, То], и выбрав ломаную x(t) так, чтобы |4(t)| был очень большим, получим сколь угодно малый интеграл. Получается противоречие, т. е. чем более зазубрен профиль на теле, тем меньше сопротивление. Дело в том, что в формализации неявно использовалась монотонность профиля, так как только в этом случае частица стал- кивается с телом один раз. Таким образом к условию задачи нужно добавить требование х 0. Форма тела вращения задается функци- ей x(t) такой, что г(0) = 0, х(То) = £ (£ — заданное число). Для того, чтобы столкновение частицы среды учитывать только один раз, налагаем условие и 0. Формализованно задача оптимального управления выписывается следующим образом: То / ----7 —» min; х = и, и Js 0, х(0) -- 0, х(То) = (. J 1 + и2 о Функция Лагранжа То Л - f + ~ “)) Л + Л1Ж(0) + Х2х(То)' о Необходимые условия: а) система уравнений Эйлера: — р = 0 (о р = const); b) трансверсальность по х: р(0) = А|, р(То) = -Аг; с) оптимальность по и: mm ] ---7 - ри ) и^о 11 + и2 J Aot 1 +й2 — рй; d) неотрицательность: Ао 0. Если Ао = 0, то р / 0 (если р = 0, то из Ь) следует, что At = Aj = 0 — все множители Лагранжа — нули). Минимум в соотношении с) конечен только, если р < 0, при этом й — 0, т. е. 4 = 0. Из условия х(0) = 0 вытекает, что 4 = 0, тогда 4=0. Пусть Ао / 0. Положим Ао = 1. Тогда для достижения минимума в с) необходимо, чтобы р < 0 (если р 0, то функция L(t,u): = t
§ 3. Избранные задачи оптимального управления 207 монотонно убывает с возрастанием и и не достигает минимума). Если й(1) > 0, то Lu = 0. И из с) управление й(£) должно находиться из уравнения Момент излома управления т характеризуется уравнениями 2й(т)т т (2) (второе уравнение в (2) Цт — 0,0) = £(т,й(т)) — условие совпадения минимумов в точке т). Подставив р из первого уравнения соотноше- ния (2) во второе, находим, что й2(т) = 1. Отсюда й(т) = 1 (ибо й is 0), и тогда снова из первого уравнения (2) получаем равенство т = —2р. После излома оптимальное решение удовлетворяет соотношению (1), из которого следует, что (=го + «у= р/1 ,, 2и 2\и / dx dx dx dt dt p / 1 3\ Ho — = u => — = — • — = u— = --(-----------F 2u + 3u I. Интегрируя dt du dt du du 2 \ и / это соотношение с учетом равенства 4(т) = 0, й(т) = 1, получаем параметрические уравнения искомой оптимальной кривой: f = _£(inl + u4|u4)+?p, t = -|(l + 2« + u3), р<0. Константа р определяется из начального условия х(Т0) = £. Эту кривую называют кривой Ньютона.
208 Глава 4. Задачи оптимального управления Покажем, что £ доставляет абсолютный минимум в задаче. В си л оптимальности по и для любой допустимой функции х € РС'([0, То х(0) = 0, х(То) = е, t t , "-27Д - Рг(0 - Р£^У 1 + X (t) 1 + X (t) То То . Интегрируя это соотношение и учитывая, что Ji(t)dt — J i(£)dt = о о То То получаем f -Mj f Значит, £ € absmin. о о l+f Сопоставим полученное решение с решением, полученным Ньюто- ном. Обозначим MN = t, ВМ = х, BG — т, угол BGP — <р. Тогда из построения Ньютона имеем = tgp = i(t) => BP = тх, GP1 = BG1 + BP1 = (x2 + 1)t2. BG Таким образом, из пропорции Ньютона MN GP2 t _ т2(х2 + 1)3/2 xt _т ~GP ~ 4BPBG2 (i2 + l)l/2r ” 4txt2 (x2 + I)2 “ 4’ Но это — не что иное, как соотношение (1), в которое подставлено значение ро = — j. Отметим еще, что «затупленность» кривой и условие на скачок в точке G — т (угол там равен 135°) были по существу предусмотрены Ньютоном в его «Поучении» об усеченном конусе.
209 § 3. Избранные задачи оптимального управления 3.3. Примеры задач оптимального управления Пример 1. 2 У xdt —» extr; |z| < 2, х(0) = i(0) = i(2) = 0. Решение. Эту задачу можно свести к задаче оптимального управле- ния, вводя вместо функции х вектор-функцию (х},х2) и управление и и обозначения: Х\ = х, х2 = х, и = х. Тогда наша задача сведется к задаче оптимального управления: 2 Si dt —> extr; i3 = u, о u € [—2, 2], X|(0) = 2:2(0) = 2:2(2) = 0. Функция Лагранжа: 2 Л = У (AoZi +Pi(t)(ii-x2)+p2(t)(x2-u)) dt + A1xl(0) + A23:2(0) + A3a:2(2). о Необходимые условия: а) система уравнений Эйлера для лагранжиана L = А0Х| + pj(t)x (i, - х2) + p2(t)(x2 - и) dtLil+LXi-0, г +Ао = о Гp,(i) = Aot + C, dr -о l-?2-Pi=0 1 p2(t) = —AOy — Ct + C"; J. ^*2 + U b) трансверсальность по x для терминанта I = Aii|(0) + A3a:2(0) + A3z2(2) ^ii(O) — ^,(0), bi,(2) — —G,(2) <=> Pi(0) —A|, Pi(2) — 0, £хг(0) = L2(o), £12(2) = “1*2(2) <!=!> Рг(О) = A2, p3(2) = -A3; с) оптимальность по и min “M-2,2| { - P2(<)«} = -p2(t)w(0 => U(t) ( 2signp2(t), \ любое из [-2, 2], р2(«) # 0, p2(t) = 0; d) неотрицательность Aq 0 в задаче на минимум, Ао < 0 в задаче на максимум.
210 Глава 4. Задачи оптимального управления Если Ао = 0, то из а) следует, что pt — С и из b) р\ = 0. Поэтому из а) Pi = С‘ £ 0, иначе все множители Лагранжа оказались бы нулями. Значит из с) й = 2 или й = -2, т.е. х = 2 или х = -2, откуда х = t2 + А|4 + д2 или х = —t2 + B[t + В2. В обоих случаях не существует функции такого вида, удовлетворяющей условиям на концах г(0) = i(0) = ±(2) — 0. Полагаем Ао = 1 в задаче на минимум. Тогда из a) pi (4) = t+C и из Ь) Pi (4) = t - 2, далее из а) следует, что р2(4) = + С". Получили, что p2(t) — парабола с ветвями, направленными вниз и вершиной на оси 4 = 2, следовательно, р2(4) или не меняет свой знак на отрезке [0, 2], или меняет его с минуса на плюс в некоторой точке т € (0, 2). И, значит, из с) оптимальное управление й на всем отрезке тождественно равняется двум или минус двум или меняет свое значение с минус двух на плюс два в некоторой точке т. Но как мы уже выяснили в первых двух случаях функций, удовлетворяющих начальным условиям нет. Осталось рассмотреть случай Интегрируя это равенство, находим, что ( -24 + Сь 0 4 т, t 24 + С2, т < 4 <: 2. Из условий на концах i(0) — х(2) — 0 Поскольку функция должна быть непрерывной в точке т, то —2т — 2т-4, откуда т = 1. Интегрируя еще раз, получаем -42 + Cb 0^4^ 1, 42 - 44 + С2, 1 С 4 < 2. Из начального условия ж(0) = 0 Ci — 0 и условия непрерывности в точке т = 1: -1 = 1 — 4 + С2 4» С2 = 2 находим допустимую экстремаль <• j V Ь 1 , 42 - 44 + 2, 1 4 2.
§ 3. Избранные задачи оптимального управления 211 Докажем с помощью непосредственной проверки, что функция 2 доставляет абсолютный минимум в задаче. Возьмем функцию h € рС2([0,2]) такую, чтобы 2 + h была допустимой в задаче. Для этого надо взять функцию h, для которой |£ + Л| 2, Л(0) = Л(0) = Л(2) = 0. 2 Имеем для функционала Z(x(-)) = J xdt о 1(2+ h) —1(2) hdt = 2 J plhdt = 0 Интегрируя по частям дважды с учетом условий Л(0) = Л(0) = Л(2) = 0, р2(2) = 0, получим 1(2 + Л) - 1(2) = Разбивая отрезок интегрирования на два и учитывая, что Л>0, 0 t 1, ( р2 0, 0 t $ 1, h < 0, 1 < t < 2, а 1Р2^0, 1 t $ 2, имеем 1(2 + Л) -2(х) = - 2 У hp2 dt 0. । Таким образом, 2 6 absmin. При этом 2 1 2 $min = !(£(•)) = [2dt= [ -t2 dt + I (t2 -4t + 2)dt = 0 0 I t3|l Л3 2 \l2 1 8 1 = -з1о+(з-2< +20l, = -3+3-8 + 4-3+2-2--2- Ясно, что при решении задачи на максимум —2 € absmax, = 2, как функционал 1(х) является нечетной функцией относительно х, а множество допустимых функций симметрично относительно нуля.
212 Глава 4. Задачи оптимального управления Пример 2. Т —» min; -1 х 3, х(0) — 1, х(Т) = — 1, х(0) = х(Т) - 0. Решение. Приведем задачу к виду задач оптимального управле- ния, вводя вместо функции х вектор-функцию (х|,х2), управление ц и обозначения: х, = х, х2 - х, и = х, Т —> min; х, = х2, х2 = и, и 6 [—1, 3], Xt(0) = 1, Xi(T) = —1, х2(0) = х2(Т) = 0. Функция Лагранжа: т А = j(pi(t)(xi - х2) + p2(t)(x2 - «)) dt + ° + А0Т + А] (х^О) — 1) + A2x2(0) + A3(xi(T1) + 1) +A4x2(T). Необходимые условия: а) система уравнений Эйлера для лагранжиана L = pi(<)(i| - хз) + PiWx2 - и) ~Lit+Lx,_o, d -Pi = о, ~P2 - Pl = 0 <—’ Рз(О — C\t + C2, b) трансверсальность по x для терминанта I = АцТ 4- Aj(xi(0) — 1) + А2Хз(0) + A3(xt(T) + 1) + А4х2(Г) ^,(0) = ZI|(0), Li,(T) = Pi(0) = AH p,(T) = —A3, LX1(0) — LX1(T) = -/z2(T) <=> Рэ(0) — A2, pi(T) — -A4; с) оптимальность по и min {-p2(t)«} = —p2(t)H(t) => u(t) — < 3, uef_|,3l l любое из [-1, 3], p2(0 < 0, p2(t) > 0, p2(0 = 0; d) стационарность по T: Ar(T) — 0 <=> Ao + A3ii (T) + A4x2(T) = 0; e) неотрицательность: Ao 0. Учитывая то, что из начального условия следует Xi(T) — 0, а из Ь) А4 = -р2(Т), получаем, что d) равносильно условию Ао = р2(Т)«(Т). Поэтому если Ао = 0, то р2(Т) = 0 либо й(Т) = 0, но отсюда из с) вновь р2(Т) — 0. При этом р2 не может быть тождественным нулем, ибо иначе все множители Лагранжа были бы нулями. Значит, из а) p2(t) = C(t - Т), С # 0, а тогда из с) следует, что fi(t) = -1 или й(<) : 3,
§3. Избранные задачи оптимального управления 213 - Л Л т.е. £ = -1 или £ = 3, откуда х = — у + Aft + A2 или х = Зу + B,t + В2. В обоих случаях не существует функции такого вида, удовлетворяющей условиям на концах х(0) = 1, а:(Т) = -1, ±(0) = ЦТ) — 0. Таким образом, в случае Ао = 0 нет допустимых экстремалей. Полагаем Ао = 1. В силу условий п. а) р2 — линейная функция, не тождественно равная нулю. Значит рз может менять свой знак на отрезке [0, Т] не более одного раза. Причем, если функция рз не меняет свой знак на [0, Т], то u(t) = -1 или &(t) = 3. В обоих случаях мы уже проверили, что нет допустимых экстремалей. Поэтому р2 меняет знак на (0, Т] ровно один раз в некоторой точке т € (0, 2). Получаем две возможности: й = £ = J 3’ 1-1, 0 С t т, т <t^T, или Гз? й — £ = 0 t < г, т < t < Т. Первый случай невозможен, так как тогда параболы с заданными условиями на концах не пересекаются. Интегрируя второе равенство, находим, что 1 _ Г -t + Ci, 0 < t г, X~\3t + C2, r<t^T. Из условий на концах i(0) = ЦТ) = 0 имеем ( — t, 0 < t < т, \3(t-T), т < < < Т. Поскольку £ € РС2([0, Т]), то функция i должна быть непрерывной в точке т, поэтому -т — 3(т - Т), откуда т = Отсюда 2 ; 3(t - Т)2 зт [±-T± + D’ Т Из начальных условий z(0) — 1, ЦТ) = -1 следует, что С = 1, D — - 1, а из условия непрерывности в точке т — -^- + 1 = ^ — 1 находим, что Т = Таким образом, имеется единственная допустимая экстремаль <2 <- -- + 1, 0«и^л/3, 2 X = г- -1 3(t - 4/л/З)2 _ ] л < t < _4_ 2 ’ " "Л’ Аналогично тому, как это было сделано в простейшей задаче быстро- действия, можно показать, что £ € absmin, т.е. найденное значение доставляет абсолютный минимум в задаче.
214 Глава 4. Задачи оптимального управления 3.4. Задачи оптимального управления 3.1. J х sin t dt —> extr; |£| 1, х(-т) = х(я) — 0. —Г 7ж/4 3.2. J х sin t dt —► extr; |i| 1, x(0) = 0. о 4 3.3. у\ж2 + x) dt —> extr; |x| 1, ®(4) = 0. о 2 3.4. j xdt—* extr; |x| 2, x(0) + x(2) = 0, x(0) = 0. о 4 3.5. J xdt —► extr; |i| 2, x(0) + x(4) = 0, i(0) = i(4) = 0. о 3.6. T -> min; |ж| 2, x(-l) = 1, x(T) = -1, i(-l) = x(T) = 0. 3.7. T —> min; —3 =s£ ж < 1, ar(O) = 3, x(T) = -5, i(0) = x(T) = 0. 3.8. T -> min; 0 < x 1, x(0) = i(0)=&, x(T) = x(T) = 0. 2 3.9. J |i| dt —> min; X 5 г -2, г(0) = 0, x(2) = — 1, i(2) = —2. 3.10. 0 2 J |i| dt —> min; 0 i X 5 5 2, г(0) = 0, г(2) = 1, i(2) = 2. 3.11. У x2 dt —► min; i < 24, z(0) = 11, x(l) =x(l) =0. 3.12. 0 2 J x2 dt —» min; 0 ! 6, x(0) - i(0) = 0, x(2) =17. 3.13. 1 J x2 di —» min; |i| $ 1, x(0) = i(0) = 0, □:(!) =-Il 24 0 3.14. J —у--------h |i|^ dt —> extr; s(l) = о
Ответы к задачам главы 4 215 Ответы к задачам главы 4 {7Г + *, —ТС t SJ ~ у, -*, —j $ t С 3, € absmin, 5т,п — -4, -£ € absmax; t-Ь Smax — 4. f-t, Os;* u . . . 2. £ = 5 т e absmin; -x G absmax. L‘_ 2> 4 1 Z4> 3 J 4 3> absmin; 4 — f G absmax. •*• 11 - 4, 2 s; t s: 4, 4. £ - t2 - 2 € absmin; Smin = -3, -£ € absmax; Smax — 3. 5. £ = < ' -t2, OsSfsU, (f - 2)2 - 2, 1 t < 3, € absmin; -£ € absmax. , -(t - 4)2, 3 < t 4, 6. - (—i2 — — \<t<0 — \ 1 ,2 ’ П t 1 T = 1 G аЬ5т*П 1 Smi" = L 7. ^4 = f-^ + 3, Л \ e Illi s T = ^ eabsmm;Smln=^. I 2 “5- 75^^75’ / 8. Допустимые экстремали существуют при > ^,£2 < 0; Smin = (1+K, 1 2*2 ’ 1 °ГЛ?,т=^’?=_^)еаЬ8™п’ 9. 4=1 II c E <Z> C E из xs CO W ГЧ v/v/ V/ V/ 0 - <= ем 1 o-T « 10. £= \ _ q2 1 < f < 2 absmin , Smin — 1 • 11. 4 = f 8i3 - 18* + 11, u . 112(*~ i)2, K*^i,eabsm,n- 12. £ = H3 + 6*2, 0^*^i bsmin \ 3t2 + 3* - 1, 1 s; t 2, 13. 4 = ГЧ1ГЗ II J c S X CO Ф — |C4 —« V/ V/ V/ V/ 0 —Iе4 "IS 1 ' + 4.1" । 1 4.1^ W. fc, :i=>4 = £€absmin; |4|>1=>±=^ , t > G (Cch(*-?), i^sS*s£l, absmin , где константа С отыскивается из граничного условия на правом конце: С ch (1 - j£j) = = +00 (xn(t) - n(t - 1) +0-
Глава 5 Условия второго порядка в вариационном исчислении В этой главе даны необходимые и достаточные условия экстрему- ма в простейшей задаче вариационного исчисления. Это классические условия — условия Лежандра, Якоби, Вейерштрасса и другие. При- чем эти условия будут выведены как следствия принципа максимума. Условие Вейерштрасса будет также выведено без принципа максимума с помощью игольчатых вариаций. При выводе достаточных условий в простейшей задаче вариационного исчисления будет строиться поле экстремалей, выводиться основная формула Вейерштрасса. Формулиру- ется и доказывается отдельно теорема о необходимых и достаточных условиях экстремума в простейшей задаче вариационного исчисления с квадратичным функционалом. Аналогичные необходимые и достаточные условия экстремума могут быть получены и в других задачах (Больца, изопериметрической задаче, задаче со старшими производными). § 1. Простейшая задача вариационного исчисления Рассмотрим простейшую задачу вариационного исчисления (для определенности задачу на минимум) ь 7(х()) = У Z/(t,®(t),i(t)) dt -> inf; x(tQ) = x0, a:(i,)=a;l. (P) to 1.1. Сильный и слабый экстремум Задачу (Р) мы рассматривали на слабый экстремум. Иногда чтобы подчеркнуть, что задача рассматривается на слабый экстремум, мы будем писать P(fV). Множество допустимых элементов в задаче на слабый экс- тремум D(P(W)) составляют непрерывно дифференцируемые функции класса С'([^о> М) с заданными условиями на концах.
§ 1. Простейшая задача вариационного исчисления 217 Напомним, что функция £ € D(P(W)) доставляет слабый локальный минимум в задаче (Р) (А € wlocminP), если она доставляет локальный минимум в пространстве С1([<о> ^1!)» те. если существует 6 > 0 такое, что 1(х) 1(A) для любой функции х е D(P(W)), для которой IM) - я(-)11с'фм,|) < й- Наряду со слабым экстремумом простейшую задачу КВИ будем рассматривать на сильный экстремум P(S) (буква S — начальная буква слова strong — сильный). Множество допустимых элементов в задаче на сильный экстремум D(P(S)) составляют кусочно-дифференцируемые функции класса РС'([<о, <,]) с заданными условиями на концах. Функция х € D(P(S)) доставляет сильный локальный минимум в за- даче (Р) (£ € strlocmin Р), если она доставляет локальный мини- мум в пространстве C([t0, <i]), т.е. если существует 6 > 0 такое, что 1(х) 1(A) для любой функции х G Z>(P(S)), для которой IM ) - *(-)ll<7(I*0,t,D < S- Так как множество функций, среди которых доставляется силь- ный экстремум, шире, чем для слабого экстремума, то если функция A G С1 ([<о, £1]) доставляет сильный, то она доставляет и слабый экстре- мум. Поэтому для функций A G С71([<о, ^1]) необходимое условие слабого экстремума является необходимым условием сильного, а достаточное условие сильного экстремума является достаточным условием слабого. 1.2. Пример слабого, но не сильного экстремума Приведем пример задачи, в которой допустимая экстремаль доста- вляет слабый локальный минимум, но не доставляет сильного локального минимума J A3 dt —»inf; ж(0) = 0, ш(1) = 1. о Необходимое условие слабого, а значит и сильного экстремума — уравнение Эйлера: d d , , ----Li + Lz = 0 <=> — 3i =0 <=> Зх = С <=> х = const. dt dt Общее решение уравнения Эйлера: х = Сit + C-i. Из условий на концах находим, что С\ — 1 , Сг = 0. Таким образом, имеется единственная допустимая экстремаль А = t. Покажем, что она доставляет слабый локальный минимум в задаче (х € wlocmin). Действительно, если । Л £ Со([0,1|), то для функционала I(x) — f х3 dt имеем о । । । I(A + h)-I(A) = j\l + h)3 dt - J l3di = J'h2(3 + h)dt. (*) 0 0 0
218 Глава 5. Условия второго поряди в вариационном исчислении Отсюда видно, что если ||Л||| < 3, то 3+Л(4) > 0 и, значит, /(44-Л) > /(4), т. е. Л € wlocmin. Покажем, что £ не доставляет сильного локального экстремума (£ & strlocmin). Рассмотрим последовательность функций /ц, (п > 1) такую, что Легко понять, что hn е PC^fO, 1J) и ||Ап|1о 0 при п оо. Поло- жим х„ = 4 + Ьп. Получим последовательность допустимых (в задаче на сильный экстремум) функций хп. ®п( ) —» 4(-) в метрике пространства С([0, !])• Для которых в силу (♦) 1 1/п 1 I(x„)-I(£) = f h2n(3 + h„)dt= fn(3-y/n)dt+ f ~(3+^=}dt = J J J П \ vn' 0 0 1/2 _ 6 4 = 3 - vn ----1---7= —* —oo, n nyn при n —» оо, т. e. функция £ не доставляет сильного локального минимума (4 £ strlocmin), более того 5«ге1вт>п = -оо. Ниже в п. 1.4.3 в лемме о скруглении углов покажем, что функция класса С1, доставляющая абсолютный слабый экстремум, доставляет и сильный, т.е. 8агаЬигйпр = 5м(кт|Пр. В нашей задаче можно было построить последовательность допу- стимых функций хп класса С1 такую, что 1(4П) —» -со, т.е. сгладить функции хп.
219 § 1. Простейшая задача вариационного исчисления 1.3. Условия Лежандра, Якоби, Вейерштрасса Рассмотрим простейшую задачу вариационного исчисления, для определенности задачу на минимум /(«(•)) = J L(t,x(t),x(t)) dt —»inf; x(tQ) = x0, x(tt) = xt. (P) *0 Пусть £ e C([to, t|]) — некоторая фиксированная допустимая (£(t0) = xo. £(ti) = zi) экстремаль (т.е. £ удовлетворяет уравнению Эйлера). Далее предполагаем, что интегрант L по меньшей мере дважды непрерывно дифференцируем в некоторой окрестности траектории £. Возьмем функцию h е Со ([io, i| J- Пусть £ € wlocmin Р, тогда функция одного переменного «I »j(A) = /(£() + АЛ()) = У L(t, £(t) + Aft(i), £(t) + AA(t)) dt to имеет минимум при А = 0. Из условий, наложенных на гладкость функции L следует, что функция дважды дифференцируема в ну- ле. Поэтому по необходимому условию минимума первого порядка (по теореме Ферма) ^'(0) = 0» т.е. <1 ^'(0) = J (Li(t}h(t) + Д,(0Л(О) dt = 0 VfteC(J([i0, t,j). (1) to В главе 3 п. 1.3 было показано, что из соотношения (1) следует уравнение Эйлера — необходимое условие экстремума первого порядка. По необходимому условию минимума второго порядка для функции одной переменной 9?"(0) > 0, т.е. ti у>"(0) = У* (Z**(i)fcJ(t) + 2b.i(t)ft(i)ft(t) + b„(t)A2(t)) di > 0 <0 V*€Cj(Ml)- (2) Из соотношения (2) выводятся условия второго порядка для про- стейшей задачи классического вариационного исчисления. Важную роль играет коэффициент Ln(t) при А2.
220 Глава 5. Условия второго порядка в вариационном исчислении Говорим, что на экстремали &выполнено условие Лежандра, если bii(i) 0 V t g [<о, ii] и усиленное условие Лежандра, если Lxx(t) > 0 Vfg [/о, t,]. В векторном случае х = (Ж1,.,., хп) g С1 (|to, < i ], R“), ^XtXn Ь±х ~~ \ ^хлх. f Lx,x, ^xx = | \ ъх„х. — матрицы размера их п. Условие L^t) 0 означает неотрицатель- ную определенность матрицы, условие Т±±(<) > 0 — положительную определенность матрицы. Соотношение (2) можно переписать в виде ‘‘ f +2{Lxji,h) + (LX3h Д)) dt to vhec№Q,tl],Rn). (2) Отметим, что матрица Lix(t) является транспонированной к матрице Lxx(t) и (Lxih,h) = (h,L*xxh) = {h,Lxxh). Пусть далее Lxx,Lix,Lxx g C'([io, <i],R” ) и выполнено усиленное условие Лежандра. Уравнение Эйлера по h и, ~ ~ -—L^t) + Lh(t) = 0 для интегранта Z = L(i, h, h): =Lxx(t)h2(t)-j- 2Lxx(t)h(t)h(t) + Lxx(t)h2(t), т. e. уравнение d л - *.. •• •>< + 4 Lxi(0A(0 + WHO =0 называется уравнением Якоби для исходной задачи на экстремали х. Точка т называется сопряженной к точке если для решения уравнения Якоби h() с начальными данными /i(to) ^-0 , Л((о) ^-1 , функция h в точке т обращается в ноль (Л(т) = 0). Говорят, что на ж выполнено условие Якоби, если в интервале (to, ti) нет точек, сопряженных с to, и усиленное условие Якоби, если в полуинтервале (to, 11] нет точек, сопряженных ct р. Уравнение Якоби — линейное дифференциальное уравнение второго порядка, которое (из-за усиленного условия!! ежандрг) можно разрешить относительно второй производной. Для вектор-функций х — (Ш|,... ,хп) ищется фундаментальная си- стема решений уравнения Якоби — матрица H(t) — ... hn(t)) =
§ 1. Простейшая задача вариационного исчисления 221 /л!(0 ... I ..............I с начальными условиями H(to) = 0 (нулевая мат- W). ... h2(t)J рица), H(to) = I (единичная матрица) или det^(io) # 0. Вектор-столбцы / Л’ \ h' = I .., I — решения системы уравнений Якоби. \^п / Пусть /: R" —> R — дифференцируемая функция и переменных. Функцию £&х') = ftp ')- /ф )- )ф х ) назовем функцией Вейерштрасса функции j. Геометрический смысл £ таков'. £(х ,а?) — разность в точке i мвкду значением / и значением аффинной функции, касательной к графику / в точке х. Отсюда ясно ,что если / выпукла ,то £(х р') >,0 .Можно показать ,что верно и обратное. Пусть L — интегрантфункционала/ простейшей задачи классичес- кого вариационного исчисления. Функция £(1,х,х,1$ : Ht,x,ii} -L(t ,х,х) — L,х,х)(и - ж) называется функцией Вейерштрасса интегранта L Таким образом £(t $,х,и) — функция Вейерштрасса функции х —» L(t,x,x), где t,x играют роль параметров. Говорят, что на экстремали х выполнено условие Вейерштрасса, если £(t $ £ р) == L(t р р) - L(t Дж)- ж) > 0 V в е Rn V t € [<о> М- Геометрический смысл условия Вейерштрасса на экстремали х: для любого фиксированного t G [^о, М график функции L — L(x) = х) (как функции от х) лежит выше касательной к кривой L в точке ®(t).
222 Глава 5. Условия второго порядка в вариационном исчислении 1.4. Необходимые и достаточные условия слабого и сильного экстремума Рассмотрим простейшую задачу классического вариационного исчи- сления для вектор-функций х = (xt,... ,гп) (для определенности задачу на минимум) I(x()) = J L(t, x(t),x(t)) dt —»inf; x(t0) = x0) x(tt) = X\. (P) to 1.4.1. Игольчатые вариации. Условие Вейерштрасса Понятие сильного экстремума ввел в вариационное исчисление Вей- ерштрасс. Для доказательства необходимого условия сильного минимума Вейерштрасс употребил специальные вариации экстремальной функции £ вида xx(t) — £(t) + hx(t), где А О, h (tx-h (t-г ex- /€А + (1-т)<, 1б[т-А, т], _ Рис. 12. Производная вариации hx(t) имеет вид, изображенный на рис. (для удобства изображения взято n = 1, £ > 0). Она несколько напоминает иголку, в связи с чем подобные вариации называют «игольчатыми». Такие вариации приспособлены к исследованию задач на сильный экстремум. Игольчатые вариации несколько иного вида использовались при доказательстве принципа максимума Понтрягина. Очевидно, что хх( ) —» £() в метрике пространства C([i0, t|],Rn) при А —► 0.
§ 1. Простейшая задача вариационного исчисления 223 С помощью игольчатых вариаций докажем условие Вейерштрас- са — необходимое условие сильного минимума в простейшей задаче вариационного исчисления на классе кусочно-гладких функций. Теорема. Пусть функция £ € С1 ([to, tj, R") доставляет сильный ло- кальный минимум в задаче (Р) (Л € strlocmin Р), и интегрант L не- прерывно дифференцируем в некоторой окрестности расширенного графика Г^ = {(М(0Л0) |t6 [to, til} (ZGC'(O(rfi))). Тогда на £ выполняется условие Вейерштрасса Е{т,£(т),£(т),£(т) +$: = L(t,£(t),£(t) +£) - L(t,£(t),£(t)) - - ILi (т, f (т), А(т)) О V 4 € Rn, V т ё [to, ti [. Нетрудно видеть, что выписанное условие Вейерштрасса является тем же самым, что и в п. 1.3: P(t,i(t),i(t),u) = b(t,4(t),u) -b(t,f(t),i(t)) -Li(t)(u-i(t)) >0 Vu € Rn, Vi 6 [to, tij, где t = г, и = i(r) + £. Доказательство. Для простоты записи проведем доказательство для п = 1. Возьмем точку т G (to, tj) (случаи г = to,t| доказываются предельными переходами т —»t0, т —»t,). Рассмотрим выписанную выше игольчатую вариацию xx(t) = £(t) 4- Лд(*) функции 4. При достаточно малых А > 0 функция хх допустима в задаче (Р): хд G PC1 ([to, tj), ®x(t,) = £(ti) + hx(ti) = х^, i = 0,1. Отметим, что ||Ла()||с(1<о,«,)) = AHI, |Лд(*)1 = V'AHI V t G (т, т + з/Л). Поскольку функции £(t) и x\(t) совпадают при t G [to, т — А] и t G [r, tj, то, разбивая отрезок интегрирования [to, tt] на три отрезка, имеем 1(хх) -Ц£) = У” (b(t, xA(t), £(t) + е) - L(t,A(t),i(t))} dt + г—А t+Va + У” (z(t,XA(t),iA(t)) - £(t,f(t),i(t))) dt =: л + I2. т При малых А > 0 It = X^L(t,£(t),£(t) + f) - L(t,£(t),£(t))^ + o(A).
224 Глава 5. Условия второго порядка в вариационном исчислении Поскольку при t € (т, т + х/Х) по теореме о среднем L(t, х + h\,x + Лд) — L(t, х, i) = Lx(t, x, x)hx + Lx(t, x, x)hx + + о(1(Ла, Лд)|) = Lxhx + Lxh,x + o(a/a) то T+i/X t+a/A t+a/A Ii — J" (Lxh.x + Exhx + о(уТ)) ~ j" Lxhx dt + j" Lx dh,x + o(A). Интегрируя по частям и пользуясь тем, что функция х удовлетворяет уравнению Эйлера, получим r + vA h= f (“ ^i+Lx)hxdt+Lx(t)hx(t)^+ * + о(А) = -X£Lx(r) + о(А) т Отсюда 1(хх) - 1(х) = Х(Ь(т,£(т),£(т) +£) - L(t) - £Lx(r)) + о(А). Так как х € locmin Р, то 1(хх) -1(£) 0. Деля на А и устремляя А к +0. получим L(t,£(t),£(t) +£) - L(t) - £Lx(r) 0. Условие Вейерштрасса доказано. В задаче на максимум условие Вейерштрасса меняет свой знак. В следующем пункте условие Вейерштрасса будет выведено из прин- ципа максимума Понтрягина. 1.4.2. Необходимые условия сильного экстремума. Теорема 1. Пусть функция х € С1 ([to, t| |, R") доставляет сильный локальный минимум в задаче (Р) (х G strlocmin Р), и интегрант L. непрерывно дифференцируем в некоторой окрестности расширенного гра- фика r±i (L € С1 (СЦГ.^))). Тогда на х выполняется уравнение Эйлера и удовлетворяется условие Вейерштрасса £(t,£,x,u) = L(t,x,u) — L(t,£,x) — Lx(t)(u — x) ^0Vu€ Rn, V t € [to, ti | Если при этом существует Lxx(t) V t G [to, tj, то выполняется также условие Лежандра: Lxx(t) 0 V t € [to, t|[.
§ 1. Простейшая задача вариационного исчисления 225 Доказательство. Формализуем задачу (Р) как задачу оптимального управления t, J L(t,x,u) dt —» inf; x = и, x(to) — xq, x(tl) = x\. (P1) io Условие x € strlocmin P равносильно тому, что пара (4,0), где u(t) = ®(t), является оптимальным процессом в задаче оптимального управления (Р'). Поэтому согласно принципу максимума Понтрягина найдутся множители Лагранжа Ао, А|,А2 и р(-) € PC1 ([to, til) не все равные нулю и такие, что для функции Лагранжа задачи (Р') ti Л= J(X0L(t,x,u) +p(t)(x - и)) dt + A|(x(t0) - ®о) + A2(a;(t|) - ж,) io выполняются условия: а) уравнение Эйлера: — — p(t) + Ao£x(t) — О V t € [to, tj; dt b) трансверсальности no x: p(to) = A,, p(t|) — — A2; с) оптимальности no u: min {XoL(t,x(t),u) —p(t)u} — Aob(t,4(t),4(t)) —p(t)x(t). Если Ao = O, то из с) (поскольку минимум конечен и равен — p(t)x(t)) вытекает, что p(t) = 0, а из Ь) — что все множители Лагранжа нули. Значит, Ао / 0. Полагаем Ао = 1. Тогда из с) следует, что Zj(t) = p(t) (необходимое условие I порядка минимума функции L(t,x(t),u) —p(t)u) и 0 V t е [t0, t|] (необходимое условие II порядка). Подставляя р = Li в условие стационарности по х, получаем уравнение Эйлера. Условие оптимальности по и при Ао = 1 и р = Li L(t,x(t),u) - Li(t)u L(t,x(t),x(t)) - Li(t)x(t) V и € Rn, Vt€[to, t|] есть не что иное, как условие Вейерштрасса. 1.4.3. Лемма о скруглении углов Лемма. Пустьфункция £ € PC'([to, t|],Rn), интегрант L € C(R2n+l). Тогда существует последовательность гладких функций {хп}п>1 € ^({to,t(),Rn), xn(t0) = 4(t0), ®n(ti) = x(ti), такая, что xn( ) -> x{ ) в метрике пространства C([to, ti ]), и lim I(xn) = I(x). n—»oo 8 Зак 60
226 Глава 5. Условия второго порядка в вариационном исчислении Доказательство. Для простоты записи проведем доказательство для п = 1. Возьмем функцию a(t) = (1 - 1Ю2 4 О, И < 1, |i| > I- Она непрерывна, а ее производная при t = 0 имеет скачок величины -1, |a(t)| Пусть 6 (t0, ti), * = 1,... ,m, — точки разрыва производной х и Д, = 4(т, 4- 0) - £(т,- - 0) — ее скачки в этих точках. Функция /in(-,r,) = ^а(п(- - т^), график которой получается из графика функции а преобразованиями подобия и сдвига, также непрерывна, и ее производная непрерывна, кроме точки т<, где она по-прежнему имеет скачок —1, кроме того |/i(t,т,-)| < |Л.(4,т,)| < j. m Тогда функция xn(t) = f (t) + 5? Aih(t, Ti) непрерывна вместе со своей i— I производной на отрезке [to, it], причем xn(t) = £(t) вне отрезков [т; - т, + £]. В частности, для достаточно больших п эти отрезки не перекрываются, xn(t0) — £(t0), xn(tt) = £(t|), 1 , д — max I Д, | =-----> 0 при n —» +oo, 4n i 4n m ч» 1 |i„(t)-i(t)| = 5? Aih(t,Ti) <-тах|Д,|=у (Д: = max|AJ). 1=1 На компакте |(t,a:,±) | to t t,, |ж — £(t)| |i - £(t)| у непрерывная функция L ограничена: |£(t,x,i)| M. Поэтому |/(x„) - ДЛ)| = 4Mm n при n > n0 и, следовательно, I(xn) —»I(x) при n —» +00. Следствие. Абсолютный экстремум в задаче (Р) на сильный и слабый экстремум совпадают. Б^пьыптР ~ ^wabsminP* Для локальных экстремумов это может быть не так (см. п. 1.2).
§ 1. Простейшая задача вариационного исчисления 227 1.4.4. Необходимые условия слабого экстремума. Теорема 2. Пусть функция £ 6 С2([to, t|], Rn) доставляет слабый локальный минимум в задаче (Р) (х € wlocmin Р), интегрант L трижды непрерывно дифференцируем в некоторой окрестности расширенного гра- фика rijt (L € С3 (О(Р^))). Тогда на £ выполняется уравнение Эйлера, условие Лежандра и, если на экстремали х выполнено усиленное условие Лежандра (Lxx(t) > 0 Vt 6 [to, t|[), то выполняется и условие Якоби, т.е. на интервале (to, t|) нет сопряженных точек. В задаче на максимум условие Лежандра меняет свой знак. Доказательство. Для простоты записи проведем доказательство для п = 1- 1) Вывод уравнения Эйлера и условия Лежандра. Поскольку функ- ция £ е wlocminР, то для любой функции Л € Co([to, tj) функция ^>(А) = /(£() + Ah()) имеет локальный минимум в нуле. Тогда по не- обходимому условию минимума функции одного переменного <p'{Q) = О и у>"(0) 0. В главе 3 п. 1.3 было показано, что первое условие равно- сильно выполнению уравнения Эйлера на функции £. Второе условие эквивалентно неотрицательности функционала 2Г(А( )) = У (fii(t)A2(t) + 2Lxi(t)h(t)h(t) + Zxz(t)h2(t)) dt 0 <0 V л e c<}([t0, t,]). Из неотрицательности и вида функционала К следует, что функция h(t) = 0 доставляет абсолютный минимум (слабый) в задаче ti K(h( )) = J(Lxxh2 +2Lxxhh + Lxxh2) dt - inf; A(t0) = Л(!,) = 0. (P") <0 По следствию из леммы о скруглении углов функция h = 0 доставляет в задаче (Р'') и сильный минимум. Тогда в силу теоремы 1 о необходимых условиях сильного минимума в задаче (Р") на h выполняется условие Лежандра для интегранта Z(t, h(t), ft(t)): = £ii(t)ft2(t) + 2Lxx(t)h(t)h(t) + Z„(t)ft2(t), т.е. L^t) 0 Lxx(t) 0 V t 6 [t0, tj. Таким образом, условие Лежандра в задаче (Р) выполнено. 8*
228 Глава 5. Условия второго порядка в вариационном исчислении 2) Вывод условия Якоби. Предположим противное, что условие Якоби не выполнено, т.е. существует точка т € (to, t,) и нетривиальное (Л 0) решение h е Cl([t0, tj) уравнения Якоби, для которого ft(t0) = Л(т) = 0. Отметим, что из нетривиальности решения h однородаого линейного дифференциального уравнения второго порядка с условием Л(т) =0 вытекает, что Л(т) / 0. Положим hit) — Так как ' ' х/ [О, r<t<t|. функция h удовлетворяет уравнению Якоби, то после интегрирования по частям получим K(h( )y = J(Liih2 + 2Lxihh + Lxxh1) dt - «О Lab? + Lxxhh Lte-hh 4- dt — io 4- Txx/i^/idt — hdt = 0. Таким образом, K(h) = 0, а это означает, что Л € strlocminP" (наряду с функцией h = 0). Проводя рассуждения, аналогичные проведенным В теореме Г, получим, что найдется функция р € PC'([to, tj) такая, что для лагранжиана квадратичной задачи L(t,hyh) — Ь±ХК2 + 2LxJih + £xJl2 на экстремали h выполняется уравнение j>(t) = Lh (t,h(t), ~h(t)) p(t) = 2(Lit(t)h(t) + (t)ft(t)). Поскольку ft(t) = 0 при t > г, то р(т 4- 0) = 0 и в силу непрерывности функции р 0 - р(т - 0) = 2f ii (т)Л(т - 0) = 2t±x(r)h(T) = 0, откуда Л(т) = 0 (ибо £±±(т) # 0 из-за усиленного условия Лежандра). Мы пришли к противоречию с условием h(т) # 0. Таким об разом, предположение противного неверно и условие Якоби выполнено.
§ 1. Простейшая задача вариационного исчисления 229 1.4.5. Поле экстремалей Пусть в простейшей задаче КВИ Xi Т(а()) = j L(t ,i(t) , dt —> irf ; a#o) = ®Ui) =«! (P) to in — некоторая экстремаль (т.е. на & выполняется уравнение Эйлера) из семейства экстремалей {ж(-,А)}, ж(-,А) € C'([to >R”) , с параметром А £ А € O(R") (<=> Л — некоторое открытое множество в пространстве Rn). Говорим, что экстремаль х окружена полем экстремалей х(-,Х), если существует окрестность G графика Г± — {(t,£(t)) е Rn+1 | t £ [to, 2|]} такая, что для любой точки (г, £) из этой окрестности имеется единственная экстремаль семейства, проходящая через эту точку. Точнее говоря, существует функция А. С? —> R", А — А(т,£), класса C'(G), такая, что ж(т, А) = £ О А = А(т, £). Функция «: G —+ R", и(г,£) - наз ывается функцией наклона поля. dtx 'Мт> О) 1=т Если существует такая точка (<*«.), что x(t »А) —х * для всех A G Л, то говорят, что х окружена центральным полем экстремалей. Точка (ti,xt) называется центром поля, семейство x(t.X\ — иентоальным полем экстремалей. Пример. 1(х( )) = f(x2 — ж2) dt (гармонический осциллятор). io Уравнение Эйлера ж + ж — О. Экстремали этого функционала имеют вид ж(1) = С\ sint + Ci cost. Совокупность экстремалей x(t, А) = A start есть центральное поле экстремалей с центром в точке (0£>) .включающее, в частности, экстремаль £(t) = 0, покрывающее полосу 0 < i < л. Функция наклона поля «(г, £), 0 < г < тг, вычисляется следующим образом; надо взять экстремаль поля, проходящую через точку (т,0 (т. е. £к!5£), и вычислить производную этой экстремали по t в точке т . Таким образом, и(т,£) = £ctgr. Отметим геометрический смысл сопряженной точки. Сопряженная точка — это точка пересечений «бесконечно близких» экстремалей. Если рассмотреть центральное поле экстремалей ж(-,А), удовлетворяющее условиям ж(1«,А) = £(tt), i(t*,A) = £(i,) +А, то сопряженные точки — это точки пересечения экстремали с оги бающе й этого семейства. Иначе говоря, надо решить уравнение x\(t, А) — 0. В приведенном выше примере сопряженные точки: ть = кт, к— 1,2,....
230 Глава 5. Условия второго порядка в вариационном исчислении Построение центрального поля экстремалей Теорема. Пусть £ € С2([<о> <i 1, R”) — допустимая экстремаль в за- даче (Р) (£ € Е(Р)), интегрант L трижды непрерывно дифференцируем в некоторой окрестности расширенного графика (L € С3(О(Г1^)))! выполнены усиленные условия Лежандра и Якоби. Тогда £ можно окружить центральным полем экстремалей. Доказательство. Распишем уравнение Эйлера d -—Lx(t,x,£) + Lx(t,x,£) — 0 <=> at Lxx(t, х, х)х + Lxx(t, х, £)£ + Lxl(t, х, х) - Lx(t, х, £) = 0. Так как выполнено усиленное условие Лежандра, т. е. неравенство Lxx(t) > 0 V t € [to, t|], то в силу непрерывности функции Lxx (на- помним, что L € С3) найдется такое U € <9(R2n+l), Pfj С U, что Lii(t, х, х) >0 V (t,x,x) G U. Значит, в области U уравнение Эйлера равносильно системе, разрешенной относительно производных х = у, y = &(t,x,y), где &(t,x,y): - L^(t,x,y)(Lx(t,x,y) - Lit(t,x,y) - L±x(t,x,y)y). В силу предположенной гладкости интегранта функция Ф непре- рывно дифференцируема в окрестности, U. Тогда по локальной теореме существования [АТФ, с. 186] и глобальной теореме существования и не- прерывной зависимости решения от начальных данных [АТФ, с. 195] найдутся такие е > 0 и 6 > 0, что а) решение £ продолжимо на отрезок [to - е, t| + е]; Ь) для любого А € Rn (|А| < б) на отрезке [to — б, i| + б] определено решение х(-, А) уравнения Эйлера с начальными данными x(tt, А) — 4(t,), i(t,, А) = £(t,) + А, где t, — некоторая точка интервала (to — е, to). По теореме о дифференцируемой зависимости от начальных дан- ных [АТФ, с. 204] функция (t, А) —> x(t, А) = (a;i (t, А),..., хп(t, А)) непрерывно дифференцируема. Покажем, что экстремаль £ окружена центральным полем экстремалей г(-,А). Дифференцируя функцию x(t,X) по А, полагая А — 0 и обозначая *x(t, А)1а=о = H(t,tt) (Hij(t,t,): = , M = 1>• ,n), \ OAj /
§ 1. Простейшая задача вариационного исчисления 231 получаем (поскольку x(t,A) — экстремаль для любого А, |А| < б) 0= — ( - — Lz(t,x(t,A),x(t,A)} + Lz(t,x(t, A),i(t,A)) ) => ЭА\ di / а=о - (Lzz(t)H(t, t.) + Lzz(t)H(t, t.)) + Lxz(t)H(t, t.) + Lzz(t)H(t, t.) = 0. Значит, матрица H(-,t,) удовлетворяет уравнению Якоби. При этом выполнены следующие начальные условия: д I д H(t„t.)=—x(tt,A)\ = —4(i.) = 0, дХ I а=о а А H(t„t.)=-^-x(t„A)\ = ±(i(t.) + A) =1. OX I А=0 ОД Пусть H(t,to) — матричное решение уравнения Якоби с условиями H(tftto) = 0, Я(to,to) = I- Поскольку выполнено усиленное условие Якоби, то не существует нетривиального решения h уравнения Якоби, удовлетворяющего условиям h(to) = Л(т) =0, to < т t\. Таким обра- зом, усиленное условие Якоби равносильно невырожденности матрицы H(t,to) = 0 при любом t € (to, t|]. Но тогда снова в силу глобальной теоремы существования и непрерывной зависимости решения от началь- ных данных [АТФ, с. 195] при достаточной близости t, к to матрица H(t, t,) будет невырожденной для любого t Е [to, t| ]. Рассмотрим ото- бражение ®(t,A) = (t,a:(t,A)) в некоторой точке (t,0), t € [t0) t|[. Имеем ®(t,0)= (t,4(t)), det ®'(t, 0) = det Q) 0) ) - det xx(t, 0) - det H(t, t,) # Q Значит, по теореме об обратной функции найдется такое 6 — 6{t) > 0, что для любой точки (г, £), для которой |t - т| < б, |f(t) — £| < б, существует единственное А — А(т,£), такое, что Ф(т,А(т,0) =(т,0 <=> х(т,А(т,£)) =£. В силу компактности графика Г£ = {(t,4(t)) е Rn+I | t € [t0, tj} (из любого открытого покрытия компакта можно выбрать конечное подпокрытие) можно найти одно 6q, такое, что для любой точки (т,£), т € [t0, t|[, |2(т) - < 60, существует (и, как нетрудно понять, единственное) А = А(т,£) при котором х(т,А(т,£)) = При этом гладкость функции А такая же, как гладкость £ т.е. С2. Построение Центрального поля, окружающего экстремаль, закончено.
232 Глава 5. Условия второго порядка в вариационном исчислении S-функция и ее дифференциал Пусть х( , А) — дважды непрерывно дифференцируемое централь- ное поле экстремалей с центром t,, окружающее экстремаль 4(.) и интегрант L — трижды непрерывно дифференцируем в некоторой окрестности расширенного графика Г^- (L € C3(O(rf;j)) ). Функция т S(r,g) = J L(t,x(t,X(r,O),x(t,X(r,O)) dt t. называется S-функцией центрального поля х(-,Х). Найдем дифференциал S-функции. Он понадобится нам для вывода основной формулы Вейер- штрасса при доказательстве достаточных условий сильного экстремума. Для нахождения частных производных S-функции нам понадобятся не- которые соотношения. Имеем по определению поля и функции наклона поля ж(т-, А(-Г,^)) =с Дифференцируя обе части этого равенства по т, получим i(1'>A(r)^)) + жа(т,А(т,^))Аг(т,^) = 0 => - ххХт = х(т, А(т,£)) =: и(т,£) (т) (и(т, £) — функция наклона поля), дифференцируя обе части равенства по £, получим Жа('г,А(т,С))А<(т,^) = I (С) (I — единичная матрица). Поскольку i, — центр поля, то = х», и, значит, выполняется следующее соотношение xx(t„X(r,£)) =0. (*) Найдем дифференцируя по т интеграл с. переменным верхним пределом, и используя непрерывность хх, вытекающую из того, что х(-, А) € С2. Имеем 9S . , — = д(т,е,и(т,о) + + У (Lx(t,x(t,X(r,i)),x(t,X(T,^)^xx(t,X(T,^))XT(T,() + с + L±[t,x(t, A(r,£)),i(f, A(T,£)))iA(t, Л(т,£))Аг(т,£)) dt = L(t,£,u) +
§ 1. Простейшая задача вариационного исчисления 233 + J\lxxxXt + LxxxXT)dt - L(t,£,u) + J LxxxXT dt + J LxdxxXr = t. t. t. r = L(r,C,w) + ДгЖаА,-|, + У ( - —Lx + Lx^xxXT dt - i, <г=’’£(т,£,«(т,С) - Li(T’t’U(r,£)) u(r,£). При выводе мы воспользовались тем, что функции х(-,Х) — экстремали, т.е. удовлетворяют уравнению Эйлера. Формула для || выводится аналогично. Дифференцируя по получим dS Г г г — J “Ь — J dt J Li dx\X^ — t. t i. г = LxxxX( I, + J ( - jtLx + Lx) xxX( dt Lx (r, u(r, 0). t. Таким образом, имеет место следующая формула для дифференциала функции 5: К дт = (ь(т,С«(т,С)) - dr +Lx(t,Cu(t,^)) di. В частности, для функции х G PC1 ([to, t|],Rn) формула для дифферен- циала функции S примет вид: rfS(t;X(t)) — ^L(t,x(t},u(t,x(t)}^ - Lx(t,x(t),u(t,x(t)^u(t,x(t))^ dt + + Lx^t,x(t),u(t,x(t))^ dx(t) = = L^t,x(t),u(t,x(t))^ + Lx(t,x(t),u(t,x(t))^ (x(t) - «(t,i(t))^ dt. (1) В таком виде мы ей и будем пользоваться в дальнейшем. Отметим также, Чт°, поскольку u(t, i(i)) — x(t), то dS(t,£(t)) = L(t). (2)
234 Глава ' Условия второго порялка в вариационном исчислении 1.4.6. Достаточные условия слабого экстремума Теорема 3. Пусть функция х £ t|],R") — допустимая экстре. ма.1ь в задаче (Р). интегрант L £ С (И х R"), где VCR”" — некоторая окрестность графика Г} = {(f, i(f)l { t £ |Т,, t\|} , на x выполнены ecu- leimnie условия Лежандра и Якоби. Тогда х доставляет слабый локальный минимум (.г б wlocinin Р) |АТФ. с. З-7?|. 1.4.7. Достаточные условия сильного экстремума Теорема 4. Пусть функция х £ C‘(|tOj t\), R’1) - допустимая экстре- маль в задаче (Р), интегрант L £ С3(И х R”), где V С R” ‘1 — некоторая окрестность графика 1, на х выполнены усиленные условия Лежандра и Якоби, интегрант L является выпуклым по х на V. Тогда х доставляет сильные локальный минимум (х £ strlocminP). Доказательство. Условия теоремы позволяют (см. п. 1.4.5) окру- жить х центральным полем экстремалей т(, Л), покрывающим не- которую окрестность U С V графика Pj.. Пусть х £ РС'([7о, М1 — произвольная допустимая функция, график Г; которой расположен в этой окрестности. Тогда г го формуле (2) п. 1.4.5 I(x) = У L(t) dt — у dS(t, x(t)) = S(t ।, i|) - S(tu, zq) = J dS(t,x\t)). In in Следовательно, по формуле (1) n. 1.4.5 И и I(x) - l(x) = J L(t,x(t), i(t)) dt - J dS(t,x(t)) = f, — J ^L{t.x(t),x(t)') - L^t,x(t),u^t, ж(£))) — Li x(t), u(t, x(t)) x ' x (x(t) - u(t, ж(<)))^ dt -- J £ [t,x(t),u(t,x(t)'), x(t)^ dt. Эту формулу называют основной формулой Вейерштрасса. Из выпуклости интегранта следует (см. п. 1.3), что если (t,x) g U, то Е(Тх, и,х) Э 0 тля любых (и, х) £ R'1 х R" . Таким образом, j £ ^t,x(t),u(t.x(t)),x(t)^ dt 0 и, значит, Цх1 7(г), т е. х доставляет сильный минимум. •
§ 1. Простейшая задача вариационного исчисления 235 1.4.8. Квадратичный функционал Выделим случай квадратичных функционалов для вектор-функций х() — (ж, (•),. , который исследован до конца. Рассмотрим задачу 4- dt —> inf; x(to) = ж0, ж(<1) = Ж|, (Р') где Л(1), B(t), C(t) — матрицы порядка п х п, на слабый и сильный минимум. Теорема 5. Пусть в задаче (Р') матрицы А и С непрерывно диф- ференцируемы, а В непрерывна', выполнено усиленное условие Лежандра (A(t) > О V t Е [t(>, t, ] — положительно определена). Тогда, если выполнено усиленное условие Якоби, то допустимая экстремаль существует, един- ственна и доставляет абсолютный минимум. Если же не выполнено условие Якоби, те. в интервале (to, ti) есть сопряженная точка, то значение задачи равно -оо (.SahsrrHn — -оо). Заметим, что по лемме о скруглении углов абсолютный минимум и сильный, и слабый совпадают. Доказательство. Отметим вначале, что для квадратичных функци- оналов имеет место равенство I(x + h) — I(x) + I' (ж) |/i) + -1" (х) [Л, Л]. Если х — допустимая экстремаль в задаче, то T'(x)[/i] = О V Co'([to, ii|) (это соотношение эквивалентно уравнению Эйлера). скольку для квадратичных функционалов -1"(4)[h,Л.] = 1(h), то на тремали х выполняется соотношение h е По- экс- I(x + h) = I(x) + 1(h) v h е Cd ([io, tj). (*) Предположим выполнено усиленное условие Якоби. Обозначим Н(i, т) — Матричное решение уравнения Эйлера (совпадающего для квадратичной задачи с уравнением Якоби), удовлетворяющее условиям Н(т, т) = О, Н(т, т) = I. Из усиленного условия Якоби вытекает, что матрицы H(t, t0) и H(t,tt) невырождены для i € (t0, tj и [to, t|) соответственно. Положим Hn(t) = H(t,t})H-'(t0,t}), Hi(t) = ff(i,io)P"'(t|,to). Тогда H,(tj) = 6,}1 )64 — символ Кронекера), i, j = 0, 1, и, значит, £(t) = Ho(t)xu 4- H](t)xf — допустимая экстремаль в задаче (Р'). Эта
236 Глава 5. Условия второго порядка в вариационном исчислении экстремаль единственна, поскольку если бы £() была бы другой допу- стимой экстремалью, то у — £ — х было бы нетривиальным решением уравнения Якоби с условиями y(to) — y(t\) = 0, а это противоречит усиленному условию Якоби. Поскольку уравнение Эйлера для квадратичного функционала I является однородным уравнением, то функция h = О будет экстрема- лью. Окружим ее центральным полем экстремалей. Семейство функций Л(-,А) — Я(-,<,)А, где t, < t(l настолько близко к t0, что матрица H(t,t,) невырождена при to t < покрывает всю полосу to t t,. Кроме того Л(т, А) = (« Я(т, Z,)A = < А = А(т,£) = Я-|(т,г.)4 € С1. Функция наклона поля и(т,£) = 4;h(t, А(т,£)) = Я(т,^,)А(т,^) = а‘ ' | t=T H(T,t,)H~'(T,t,)(. Для функции h € Cj([t0, I) по основной формуле Вейерштрасса I(£ + h)~ I(£) = 1(h) = 1(h) - I(h = 0) = *1 = J ^L(t,h,h) - L(t,h,u(t,h)) - (Lh(t,h,u(t,h)),h — u(t,h))^ dt = (для квадратичной функции L(h) — L(u)—L'(u)(h — u) = (^L"(u)(h — u), (h - и)) ) t, = J (^2^ith(t<h,u(t,h))[h — u(t,h)),h — u(t,h)^ dt 0, io ибо = A(t) > 0 (положительно определенная матрица) по уси- ленному условию Лежандра. Значит, £ € absmin Р'. Предположим, что не выполнено условие Якоби. Тогда функция h = С absmin Р" не доставляет абсолютный минимум в задаче il l(h( )) = У ((Ah, h) + 2(Ch, h) + (Bh, h)) dt — inf; <0 Л(«о) = Л(М = О (P") (по теореме о необходимых условиях слабого минимума, если h = 0 € absmin (Р"), то выполнено условие Якоби). Значит, SabsminP" < 0. Поэтому существует функция h € Cd(Ro, М) такая, что 1(h) < 0. Но тогда 1(£ + АЛ) = 1(£) + /(АЛ) = 1(£) + А2/(Л) —► -оо при А —* +оо, т.е. ^absminP* = СЮ- ®
§ 1. Простейшая задача вариационного исчисления 237 1.5. Правило решения Для решения простейшей задачи классического вариационного ис- числения с использованием необходимых и достаточных условий экстре- мума следует: 1. Найти допустимые экстремали, т.е. допустимые функции, удо- влетворяющие необходимым условиям экстремума 1 порядка. Для этого надо а) Выписать необходимое условие экстремума I порядка — уравнение Эйлера: d — — Lx + Lx — Q. dt b) Найти решения этого уравнения (они называются «экстремаля- ми»). с) Найти решения уравнения Эйлера, удовлетворяющие заданным условиям на концах (они называются «допустимыми экстремалями»). 2. Проверка необходимых и достаточных условий экстремума II по- рядка. а) Проверить выполнение условия Лежандра: Если Lxx(t) О V t G [to, tj (выполнено условие Лежандра), то значит, выполнено необходимое условие слабого (а, следовательно, и сильного) минимума. Если Lxx(t) < О V t € [t0, tj (выполнено условие Лежандра), то значит, выполнено необходимое условие слабого (а, следовательно, и сильного) максимума. Если же величина Lxx(t) знакопеременна на отрезке [to, tj (не вы- полнено условие Лежандра), то значит, не выполнено необходимое условие слабого (а, следовательно, и сильного) экстремума. В этом случае найденная допустимая экстремаль не доставляет слабого, и тем более, сильного экстремума. Если Lxx(t) > О V t € [to, tj или Lxx(t) < О V t € [to,ti[ (выполнено усиленное условие Лежандра), то значит, выполнено необходимое усло- вие слабого и сильного минимума, соответственно максимума. В этом случае переходим к исследованию условия Якоби. Ь) Проверить выполнение условия Якоби: Ь|) Выписать интегрант квадратичного функционала Z(t, h, Л): = L±i(t)ft2(t) + 2Lxx(t)h(t)h(t} + Lxx(t)h2(t). Ьг) Выписать уравнение Якоби на экстремали х, т.е. уравнение Эйлера для интегранта L(t,ft,Л):
238 Глава 5. Условия второго порядка в вариационном исчислении d ~ + i-Л — 0. dt и решить его с начальными данными ti(t0) = 0, /i(t0) =1*. Ьз) Найти сопряженные точки т, т.е. нули найденного решения h(t) уравнения Якоби при t > to- Ьд) Проверить выполнение условия Якоби: Если в интервале (to, i|) нет точек, сопряженных с io (выполнено условие Якоби), то значит, выполнено необходимое условие слабого (а, следовательно, и сильного) экстремума. Если же в интервале (to, tj) есть сопряженные точки (не выполнено условие Якоби), то значит, не выполнено необходимое условие слабого (а, следовательно, и сильного) экстремума. В этом случае найденная допустимая экстремаль не доставляет слабого, и тем более, сильного экстремума. Если в полуинтервале (io, t, ] нет точек, сопряженных с to (выполнено усиленное условие Якоби), то значит, выполнено достаточное условие слабого экстремума. Следовательно (напомним, что уже выполнено усиленное условие Лежандра), найденная экстремаль доставляет слабый локальный минимум (если Lii:(t) > 0 V t g [to, ti]) или максимум (если Lii(t)<OVte[to, tjl). Проверка на сильный экстремум. с) Если интегрант L является выпуклым по х при всех фиксиро- ванных t и х, рассматриваемых в качестве параметра, то х доставляет сильный минимум в задаче. Аналогично, если интегрант L является вогнутым по х, то х доставляет сильный максимум в задаче. d) Если интегрант L не является ни выпуклым, ни вогнутым, то следует проверить выполнение необходимого условия сильного экстре- мума — условия Вейерштрасса: £(t, *, i, и) = L(t, £, и) - L(t, £, £) - L±(t)(u - х) > О V и £ R, V t е [t0, ti] в задаче на минимум (£ ^0 в задаче на максимум). Если не выполнено условие Вейерштрасса, то в этом случае найден- ная допустимая экстремаль не доставляет сильного экстремума. Для вектор-функций х(-) = (ачС), •. ,гп()) ищется фундаментальная система ре- . , . (Л[(<) ... шений уравнения Якоби — матрица Я(1)=(Л (t) ... h”(t)) = I ........... j ... с начальными условиями Я(4о) = 0 (нулевая матрица), Я(<0) = I (единичная матрица) ( Л’|()\ или det Я (to) # 0. Вектор-столбцы h‘( ) = I ] — решения системы уравнений \Ч()/ Якоби. Сопряженными точками будут точки т — нули уравнения <1е1Я(т) ’ 0.
§ 1. Простейшая задача вариационного исчисления 239 1.6. Примеры Пример 1. Исследуем с помощью условий второго порядка задачу, рассмотрен- ную нами в п. 1.2: 1 l(x(-)) = jx3dt-*inf; x(0) = 0, x(l) = 1. о Мы выяснили ранее, что имеется единственная допустимая экстремаль £ = t, доставляющая слабый локальный минимум в задаче и не доста- вляющая сильного. При этом нами была построена последовательность допустимых (в задаче на сильный экстремум) функций о:п € РС^фо, < i ]), хп() —♦ £() в C([to, 11 ]), ДЛЯ которой Z(a:n( )) —» -оо при п —► оо. Поскольку Lzz(t) = 6£(t) — 6 > 0 V t € [0, 1], то выполняется усиленное условие Лежандра. Выпишем уравнение Якоби, которое является уравнением Эйлера по h d~ --LA(t)+£h(i) = O для интегранта L = Lzzh2 + 2Lzzhh + Lzzh2 = 6h2: d - —12Л =0 <=* h=0. dt Общее решение уравнения Якоби: h = C{t +C2. Начальным условиям h(0) = 0, h(0) = 1, удовлетворяет функция h(t) = t. Эта функция не имеет гулей в полуинтервале (0,1]. Значит, сопряженных точек нет, и стало быть выполнено усиленное условие Якоби. По теореме 3 выполнено достаточное условие слабого локального минимума, значит £ Е wlocmin. Поскольку функция L = х3 не выпукла по ж, то достаточное условие сильного минимума не выполняется. Проверим необходимое условие сильного минимума — условие Вейерштрасса.’ £(t,£,£,u) = L(t,£,u) — L(t,£,£) — Lz(t)(u — x) = = u3 - £3 - 3£2(u - £) = u3 - 1 - 3(u - 1) > 0 (?) VuGR, V t G [0, 1]. Оно не выполняется. Так как не выполняется необходимое условие, то функция £ не доставляет сильного локального минимума.
240 Глава 5. Условия второго порядка в вариационном исчислении Пример 2. Исследуем с помощью условий второго порядка задачу, рассмотрен- ную нами в главе 3 п. 1.6 (пример 2): Зж/2 /(□:(•)) = J (х2 - х2) dt —> inf; я(0) = а:( —) = 0. о Уравнение Эйлера: х + х — 0. Мы выяснили ранее, что имеется единственная допустимая экс- тремаль 4 = 0, не доставляющая даже слабого локального минимума в задаче. При этом нами была построена последовательность допусти- мых функций xn(t) — ^sin у, х„() —♦ х() в С1 ([0, 1]), для которых /(□;„(•)) <0 = 1(х( )). ” Поскольку Zii(t) = 2 > 0 V t € |о, yj , то выполняется усиленное условие Лежандра. Выпишем уравнение Якоби, которое является уравнением Эйлера по h d~ --Lh(t) + Lh(t)=O dt для интегранта L = .Lrzzh -f- 22х^г/гЛ. + Lxxh. — 2h — 'Ih : h -I- h ~ 0 4— > h, = Ci sin t + Cj cos t. Начальным условиям ft(0) = 0, h(0) = 1, удовлетворяет функция h(t) = sint. Эта функция в интервале (0, у) обращается в ноль в точке т = тг. Таким образом, в интервале (0, у) имеется сопряженная точка, и стало быть не выполнено необходимое условие Якоби слабого локального минимума, значит допустимая экстремаль ж(-) не доставляет в задаче слабый минимум, и тем более не доставляет сильный минимум. Если воспользоваться теоремой 5 о необходимых и достаточных условиях экстремума в простейшей задаче вариационного исчисления с квадратичным функционалом, то из того, что не выполнено условие Якоби, будет следовать, что абсолютный минимум в задача равен —оо. Уравнение Эйлера совпало с уравнением Якоби. Это не случайно. Так бывает, если интегрант исходной задачи является квадратичной функцией от х, х.
§ 1. Простейшая задача вариационного исчисления 241 Пример 3 (простейшая векторная задача КВИ, в которой допустимая экстремаль единственна и доставляет сильный экстремум). У(г()) = 7(г|(-),г2( )) = /(4 + + 2xtx2)dt —> inf; о х,(0) = 0, ж2(0) = О, Ж|(1) = sin 1, х2(1) =-sin 1. Условие экстремума 1 порядка — система уравнений Эйлера: пе. ( ж, = C1sht + C2cht + С3 sini + С4 cost, Общее решение: | = + sini - C4cost. Начальные условия: ( х,(0) = С2 + С4 = 0, _ _ г, _ „ Г я, = C|Shi + С3 sini, ( 0:2(0) = С2 - С4 = О, °2 ~ ~ t х2 = Cjsht - С3 sini, f xi(l) = Cish 1 + C3sin 1 = sin 1, ~ , [ ЖзО) =C|Sh 1 — CjSinl = — sin 1, l— ’ 3 Единственная допустимая экстремаль 4| = sint, x2 = —sini. Условия экстремума II порядка. Условие Лежандра. La = ( —I|Z| i.z,X1 ) = ( « 7 ) • Эта матрица положительно определена, следовательно, выполняется усиленное условие Лежандра. Условие Якоби. Квадратичный интегрант Z(t, h, h) = (Lah, h) + 2(ZxiA, h) + (LXxh, h) = 4G ЖШУМО 0(UO = 2ft, + 2/i2 + 4/i|/i2- Система уравнений Якоби (Эйлера для квадратичного интегранта L): /Ь. ^h2, ft(4) = h I /12= ht, 1
242 Глава 5. Условия второго порядка в вариационном исчислении Ищем фундаментальную систему решений уравнения Якоби — матрицу H(t) = (h'(t)h2(t)} = (такУю’ что я(°) = 0 (нулевая / А/(t) \ матрица), Я(0) — I (единичная матрица). Для вектора h'(t) = ( !; ' ) = \ МО / ( C|Sh t + C2ch t + Су sin t + C4 cos t \ I ид . X t > должны выполняться условия у C|Sht + C2cht - C3smt - C4cost ) 3 h{(0) = Ci + C4 = 0, fc2(0) = Ci - C4 = 0, Л|(0) = C| +C3 = 1, . Л2(0) = Ct - Ci = 0, = c3 = i C2 — C*4 — Oj (sht+sint \ / sht—sint shf-sinf ) • Аналогично находим: h2(t) = | sh/^sin/ 2 / \ 2 Сопряженные точки являются корнями уравнения (sh т + sin т shr-sin т 2 (shr + sin г)2 — (shr — sinr)2 — 0 <=> shrsinr = 0 <==> т = fcir, k € N. На полуинтервале (0, 1] нет сопряженных точек, следовательно, вы- полняется усиленное условие Якоби. По теореме 3 п. 1.4.6 вектор £ — (i\,£i) ~ (sint, - sin t) € wlocmin. Условие Вейерштрасса — необходимое условие сильного минимума — выполняется: E(t, £, £, и): — L(t, £, и) — L(t, £, £) — (Li(t, £, £), и - i) — = и] + «2 + ,Х2 - it - ii - 2£,£i - / ( g1 ) , ( \ = \ \ 2a52) \ «2 - *2/ / = («!-i!)2 + (u2-f2)2 0 V(ui,«2)€R2, V t € [0, 1]. Выпуклость интегранта no x. Функция L(t,x,x) = £2 + xj + 2xtXi выпукла no x, так как L±± — положительно определенная матрица для любых (t,x) G R3. По теореме 4 п. 1.4.7 вектор £ = (x|,f2) € locmin (сильный). (Отметим, что из условия выпуклости интегранта L по £ следует выполнение условия Вейерштрасса.) Если воспользоваться теоремой 5 п. 1.4.8 для квадратичных функци- оналов, то получим, что £ = (®|,£2) 6 absmin (и слабый, и сильный).
§ 1. Простейшая задача вариационного исчисления 243 1.7. Задачи х/2 1.1. j (х2 - х2 -I- 4xcost)dt -+ extr; z(0) = z(-) = 0. о 3r/2 1.2. f (x2 - x2 - 4xsini) dt —► extr; x(0) ——) = 0. о i 1.3. J(x2 + 3z2)e2e dt —> extr; x(0) = 1, x(l) = e. о i 1.4. (x2 — x2)e2t dt —► extr; a;(0) = 0, ar(l) = e. о i 1.5. J sinxdt —> extr; x(O) = 0, x(l) = —. о i 1.6. J cos x dt —► extr; x(0) = 0, sc(l) = 7r. 0 To 1.7. Уxex dt —> extr; a(0) = 0, ж(Т0) = £. о i 1.8. У i2 ex dt —> extr; x(0) — 0, x( 1) — 2. о i 1.9. У (x3 + 4i2)di —> extr; a?(0) = 0, □?(!) = -1. о 3/2 1.10. У (i3 4- lx) dt —> extr; x(0) — 0, = 1. о To 1.11. У (x5 + 5x) dt —> extr; z(0) = 0, x(Tq) = о i 1.12. У(1 -x2)2dt —> extr; x(0) = 0, s(l)=£. о
244 Глава 5. Условия второго порядка в вариационном исчислении Ответы к задачам главы 5 1. ^i — ij sint € absmin; 5max = +oo. 2. tcost £ wlocextr; 5т,п — —oo; Smax — +oo. 3. e( 6 absmin; 5'max = +oo. 4. ie2-< € absmax ; Smjn = —oo. 5. 5min —- 1, ~2 € absmax, Smax — 1. 6. Tri £ absmin , 5min — 1, ^'max — 1 7. > -2 => x = € wlocmin, £ strlocmin; < — 2 => x e wlocmax, £ strlocmax; = -2 => 2 £ wlocextr; Smin = -oo; 5max — +oo. 8. 2i t wlocmin; Smax — +oo. 9. — t € wlocmin, £ strlocmin; 5т,п = -oo; Smax = +oo. з 10. Qi) 2 £ wlocextr; Smin = -oo; Smax = +oo. 11. 4 > |T04 => & — + C)4 ~ C4) 6 wlocmin, £ strlocmin; 5 4 < — |T04 => —x & wlocmax, £ strlocmax, где константа С отыски- вается из граничного условия на правом конце: j ((t + С)4 - С4 ) = |£|; 5 5 5 5 =: |т04 => х = |t4 £ strlocextr; = -|Т04 => 4 = —1<4 Ч strlocextr; 5 |£| < |Т04 => допустимых экстремалей нет; Smjn — -оо; Smax — +оо. 12. => £ = £ wlocmin, Ч strlocmin; |£| < Ч strlocmax; Smin 0, (е2 - о2, lei 1, 1£1 > 1; ^тах — +0О. I 7з => £ € wlocmax,
Список литературы к части I [1] [АГТ] Алексеев В. М., Галеев Э. М., Тихомиров В. М. Сборник задач по оптимизации. М.: Наука, 1984. [2] [АТФ] Алексеев В. М., Тихомиров В. М., Фомин С. В. Оптимальное управление. М.: Наука, 1979. [3] Габасов Р., Кириллова Ф. М. Методы оптимизации. Минск. Изд-во Б ГУ, 1981. И! [ГТ] Галеев Э. М., Тихомиров В. М. Краткий курс теории экстре- мальных задач. М.: Изд-во МГУ, 1989. [5] Галеев Э.М., Кушниренко А. Г., Тихомиров В. М. Сборник задач по оптимальному управлению. М.: Изд-во МГУ, 1980. [6] Галеев Э. М. Классическое вариационное исчисление, оптимальное управление. М.: Изд-во МГГА, 1995. [7] Галеев Э. М. Линейное программирование. М.: Изд-во МГГА, 1995. [8] Галеев Э. М. Экстремальные задачи. М.: Изд-во МГГА, 1996. [9] Гонтмахер Ф. Р. Теория матриц. М.: Наука, 1988. [10] Демидович Б. Пи МаронИ. А. Основы вычислительной математики. М.: Наука, 1966. [11] Заславский Ю.Л. Сборник задач по линейному программирова- нию. М.: Наука, 1969. [12] Карманов В. Г. Математическое программирование. М.: Наука, 1980. [13] Курош А. Г. Курс высшей алгебры. М.: Наука, 1975. [14] Рокафеллар Р. Выпуклый анализ. М.: Мир, 1973. [15] Саульев В. К. Прикладная и вычислительная математика. Вып. 3. Изд-во МАИ, 1971. [16] Фихтенгольц Г.М. Курс дифференциального и интегрального ис- числения, тт. 1,2. М.: Наука, 1969.
Часть II Глава 6 Общая теория экстремальных задач §0. Введение В мире не происходит ничего, в чем не был бы виден смысл какого-нибудь максимума или минимума. Л. Эйлер Первой задачей на максимум, обсуждавшейся в научной литерату- ре, принято считать классическую изопериметрическую задачу о кри- вой заданной длины, охватывающей максимальную площадь, стимулом для постановки которой был для древних поиск совершенных форм. Две знаменитые задачи XVII века — задача И. Бернулли о брахи- стохроне (кривой наискорейшего спуска) и аэродинамическая задача Ньютона (о поверхности вращения, испытывающего наименьшее со- противление) были вызваны к жизни проблемами механики и техники, а рождение линейного программирования (транспортная задача, задача об оптимальном распределении ресурсов и др.) — запросами экономики и военно-промышленного комплекса. Огромное число задач на экстре- мум породили проблемы автоматического регулирования, космической навигации и другие задачи управления в технике. Об этом уже было сказано в первой части книги. Так что теория экстремума имеет весьма важные приложения. В этой главе (написанной на основе записок лекций, читавших- ся В. М. Тихомировым на механико-математическом факультете МГУ в осеннем семестре 1998 года) делается попытка вскрыть основные прин- ципы, на которых базируется теория экстремума (в основном, в части, связанной с необходимыми условиями). Прежде, чем переходить к изложению этих принципов, нужно кое о чем напомнить.
§ 0. .Введение 247 0.1. Основные темы и принципы общей теории экстремума Вследствие того, что экстремальные задачи (как правило) изначально описываются на языке той области науки, в которой они возникли, необходим перевод такого описания на язык математического анализа. Он называется формализацией задачи. Далее употреблется, как и в части I, такая запись формализованной проблемы: fo(x) —> min(max); х € D. (Р) В связи с каждой экстремальной задачей (Р) можно поставить такие вопросы: 1) каковы необходимые условия экстремума в задаче? 2) каковы достаточные условия экстремума и как изменяются реше- ния при изменении параметров задачи? 3) существует ли решение задачи? и 4) возможно ли найти решение явно и, если это затруднительно, то как найти его численно? В теории экстремума выделяются в соответствии с этими вопросами следующие четыре основных темы: необходимые условия; возмущения экстремальных задач и достаточные условия; расширения экстремальных задач и существование решений и алгоритмы отыскания решений. В каждой из перечисленных тем можно выделить одну или несколько важнейших общих идей (принципов), которые являются стержневыми в соответствующей части теории. Сформулируем их. Во всех задачах, о которых речь шла в предыдущих главах и мно- гих других, сосуществуют (хотя это нередко затруднительно усмотреть) две структуры — гладкая и выпуклая. К таковым относятся гладкие задачи с ограничениями типа равенств и неравенств; задачи выпуклого программирования, классического вариационного исчисления, опти- мального управления, ляпуновские задачи, задачи с распределенными параметрами и другие. Одной из фундаментальных идей, которые дают возможность про- явиться выпуклости в задачах вариационного исчисления и оптимального управления, является следующая: интегральные отображения, постро- енные по непрерывной мере имеют выпуклые (или почти выпуклые) образы. Формой проявления этой идеи служит, например, теорема Ляпунова о векторных мерах (о ней говорится дальше). А теперь сформулируем основные тезисы, касающиеся тех четырех тем, о которых говорилось. Тезис первый: необходимые условия экстремума в задачах, где сосуще- ствуют гладкая и выпуклая структуры, соответствуют одному общему принципу — принципу Лагранжа снятия ограничений. Принцип Лагранжа состоит в снятии ограничений с помощью функ- ции Лагранжа: условия экстремума в задаче с ограничениями совпадают с условиями экстремума функции Лагранжа в задаче без ограничений
248 Глава 6. Общая теория экстремальных задач (или с ограничениями, не включенными в функцию Лагранжа). Принципу Лагранжа посвящен § 1 этой главы. Тезис второй. Одной из центральных идей теории экстремума явля- ется мысль, выраженная Гамильтоном: следует рассматривать не одну задачу, а семейство задач, включающее данную. Такой подход предоста- вляет богатые возможности для исследования индивидуальной, исходной задачи. При этом, в частности, оказывается, что, если необходимые условия обладают определенной невырожденностью (в случае выпуклых задач, к примеру, — если множитель Лагранжа при функционале не ра- вен нулю), то принцип Лагранжа о снятии ограничений может быть доведен до логического конца: можно так слегка видоизменить функцию Лагранжа, что она сама будет иметь минимум в задаче без ограниче- ний (в выпуклом случае и видоизменять не нужно). Этот тезис кратко затрагивается в §2. Тезис третий: основным принципом доказательства теорем существова- ния решения экстремальных задач является принцип компактности очень широкий круг задач имеет решение, нередко, впрочем, в некоем обобщенном толковании этого понятия. Эту мысль выразил Гильберт при формулировке двадцатой из его знаменитых проблем (см. эпиграф к § 3 этой главы). Тема «существование и расширения экстремальных задач» обсуждает- ся в §3. Решения задач на экстремум делятся на две группы, получаемые с помощью необходимых условий и непосредственный минимизирова- нием функционала. В последнем случае поиски экстремума называют прямыми. Тезис четвертый. Алгоритмы нахождения решени й конечномерных экстремальных задач, применяемые в прямых методах, основываются на идеях целесообразного спуска, а также методах отсечения и штрафа. Бесконечномерные задачи редуцируются к последовательности конеч- номерных методами разумной дискретизации. Об алгоритмах говорится в §4. §5 посвящен обсуждению конкретных задач. В §6 делаются за- ключительные замечания и ставятся проблемы. 0. 2. Классы экстремальных задач Далее будут исследоваться следующие совокупности экстремальных задач: 1) Задачи математического программирования. Они формализуются так: /о(х) —* min; fi(x) < О, 1 < t т, F(x) = 0, х € А, (Р|) ’’ Принцип компактности Вейерштрасса—Лебега: полунепрерывная снизу на компакте функция достигает своего минимума.
§0. Введение 249 где X — линейное (векторное) пространство, % —» К — функци- оналы на X, F: X —► Y, где Y — другое векторное пространство, А — некоторое подмножество X. Это общая задача математического программирования, которая будет нами рассматриваться. Если X и Y — банаховы пространства, f,и F — дифференцируемы, а ограничение х 6 А — отсутствует, задачу (Р|) мы называем гладкой задачей с огра- ничениями типа равенств и неравенств. Если X и Y — векторные пространства, f, — выпуклые функции, F — аффинное отображение, а А — выпуклое множество, задачу (Р<) мы называем задачей выпуклого программирования или просто выпуклой задачей. Если в выпуклой задаче X и Y — линейные пространства (обычно конечномерные), функции fi — линейны, а множество 4 — полиэдральный конус, то задачу (Р,) называют задачей линейного программирования. Если функционал квадра- тичен, а ограничения линейны, то (Р|) называют задачей квадратичного программирования. 2) Задачи вариационного исчисления и оптимального управления. Мы будем изучать, в основном, задачи такого рода: Z?n(4) —” rnin; £?,(£) 0, г = 1,..., т, Bi(£) = 0, г = т + 1,..., т, x(t) - <р (t,x(t), «(<)) = 0 V t € Д, и е U, (Pj) где £ = (ac( ),u( ),to,^i) Е Н = РС'(Д,КП) х РС(Д,КГ) xR2, Д — задан- ный конечный отрезок, t0,ti € Д, U е КГ (PC — пространство кусочно- непрерывных, а PC1 — кусочно-непрерывно-дифференцируемых функ- й ций), £?,(£) = f Li (t, x(t), w(i)) dt + Ц (to, x(to),t\, x(tt)), i — 0,1,..., m. io Переменные x £ Kn называют фазовыми, переменные и £ Кг — управлениями, функционал Bi — функционалом Больца, функции £,• — интегрантами, а /, — терминантами. Условие i = называется диф- ференциальным ограничением или дифференциальной связью. Все функции (Li, Ц, <р) предполагаются по крайней мере непрерывными. Если ограничение на управление типа включений и € U отсутству- ет, задачу (Р?) называют задачей Лагранжа классического вариационного исчисления (в понтрягинской форме), если это ограничение присутству- ет — задачей оптимального управления в понтрягинской форме. Часто встречаются также задачи с фазовыми ограничениями типа g(t,x(Ff) = 0 или G(t,x(t)) 0, где g и G — непрерывные вектор-функции. Возмож- ны и смешанные ограничения g(t, х(<),«(£)) = 0 и G(t,x(t),u(t)) 4$ 0. Если интегранты не зависят от фазовых координат, время фиксиро- вано, терминанты выпуклы по х и дифференциальная связь отсутствует, задача (Р?) называется ляпуновской. Частными случаями задачи Лагранжа является задача Больца, простейшая задача классического вариацион- ного исчисления, задачи со старшими производными и другие задачи, подробно изученные в части I.
250 Глава 6. Общая теория экстремальных задач 0.3. О базе теории Базой теории экстремума являются линейный и выпуклый анализ, аппаратом — дифференциальное и выпуклое исчисление. В гладком анализе важнейшую роль играет теорема об обратном отображении. Фундаментом выпуклого анализа являются теоремы отде- лимости. Для нас достаточной окажется теорема Люстерника, которая была доказана в первой части. Приведем ряд теорем выпуклого анализа. Подробнее см. [МИ-Т]. Теорема (Фенхеля—Моро). Для того, чтобы имело место равенство f** = / необходимо и достаточно, чтобы f: X —> R U {+оо} была выпукла и замкнута. Эта теорема служит основанием для теории двойственности выпукл- ых функций. Доказательство. Необходимость. Если f = /**, то из определений следует, что epi/ есть пересечение надграфиков аффинных функций {(ж*,-) — /’(а:*) | х* € X*}, т.е. выпуклое и замкнутое множество. Достаточность. Если / = оо, то / = /** следует из определений. Пусть / выпукла, замкнута и существует точка шо, где |/(хо)| < оо. Строго отделим точку (х0,/(шо) — 1) от epi/, т.е. найдем (®о,/3о) такие, что (x*Q,x) + а(30 < (х*0,х0) + ^о(/(а!о) - 1) = со V(x,a) G epi/. Отсюда следует, что Д < 0 и можно считать, что = —1. Мы построили аффинную функцию ао() = (а:$,-) — со, график которой расположен под графиком функции /. Допустим, что в некоторой точке Ж| выполнено неравенство f(x\) > /**(xt) (неравенство f**(x) < f(x) следует из определений). Если f(xt) < оо, то отделяем точку (x\,f**(xt)) от epi/, как это было проделано выше, аффинной функцией лД-) = (г*,-) — cj, и получаем, что (xf,х) - с, /(ж) Уж, значит f*(x’) и (ж*,Х\) - Cj > f"(xi), т.е. (a:J,a:i) > /‘(ж{) +/**(ж|), что противоречит неравенству Юнга. Если же f(x\) = оо, снова отделяем точку (sei,/**(□:।)) от epi/. Если отделение происходит с помощью аффинной функции, приходим, как только что это произошло чуть выше, к противоречию с неравенством Юнга. Если же отделение происходит с помощью функционала х* такого, что (ж^,Ж|) > с и (ж!,ж) с V(x,a) G epi/, то построим семейство аффинных функций ад( ) = ао( ) + р((х*, ) - с). При достаточно большом д эта аффинная функция (которая всегда лежит под графиком /) будет превосходить в точке число /**(ж|) и это приведет к противоречию с неравенством Юнга.
§0. Введение 251 Таким образом, эта теорема утверждает, что выпуклая замкнутая функция, определяемая, с одной стороны, своим надграфиком, является с другой стороны и верхней гранью семейства непрерывных (в топологии а(Х,Х*)) аффинных функций х —> (х',х} — f*(x*), х' е X*. В этом состоит факт двойственности выпуклых функций. Приведем теперь общую схему построения двойственной задачи к данной. Пусть X — нормированное пространство, X* сопряженное к нему и /: X —» R. Рассмотрим задачу /(ш) —» min; х € X. (Р) Пусть, далее, Y и У* — другая пара пространств и функция F: X х У —» R такова, что Р(г, 0) — f(x) для всех х € X. Каждому у € У сопоставим задачу: F(x,y) —> min; х G X. (Р„) Семейство таких задач называется возмущением задачи (Р). Двой- ственной задачей к (Р) (относительно заданного возмущения) называется задача -Р‘(0,р‘) —> max, у* € У*, (Р‘) где F*: X* х У* —> R — сопряженная функция к F (относительно естественной двойственности между X х У и X* х У*). В основе этой схемы лежит все та же двойственность выпуклых функций. Действительно, если S(y) — значение задачи (Pv), то согласно предыдущему 5(0) > 5‘*(0) = supy.€y. (-5*(у*)). По определению S*(/) = suP((y*,yh - infF(x,y)) = кет zeX = sup ((i*,0)| + {у*,у)2) -F(x,y) = F*(°,»‘) и тем самым очевидна связь задач (Р) и (Р‘) и понятно, что условия со- впадения их значений могут быть получены из теоремы Фенхеля—Моро. Из приведенных рассуждений вытекает, что значение двойственной задачи не превосходит значения исходной. Приведем еще одно следствие из теоремы Фенхеля—Моро. Следствие (о субдифференциале и опорной функции). Для того, чтобы имело место равенство дзА - А, необходимо и достаточно, чтобы множество А было выпукло и замкнуто; для того, чтобы имело место равенство здр — р, необходимо и достаточно, чтобы сублинейная функция р была замкнутой. Теорема Моро—Рокафеллара. Пусть fi'.X —> R, i = 1,2 — выпуклые собственные функции и существует такая точка, в которой обе функции
252 Глава 6. Общая теория экстремальных задач конечны и хотя бы одна из них непрерывна. Тогда для всех х € dom/i П dom/2 справедлива формула = dft(x) + df2(x). Доказательство. В силу того очевидного факта, что (/, + /2)'(г; •) = /!(х; •) + f2(x-, •), х € X (где f'(x,) — производная по направлению функции f в точке а:; если f выпукла, f'(x, •) — сублинейна), достаточно доказать теорему для сублинейных функций р,() = f-(x;), i = 1,2. Мы ограничимся случаем, когда одна из них, скажем, р, замкнута, а другая непрерывна (и тем самым также замкнута). В этом случае др2 есть компакт и поэтому множество др\ + др2 замкнуто (это нетрудное упражнение из топологии). Нам еще понадобится одно соотношение: s(A| + Л2) = зД, +зА2 (г), верное для любых множеств Л| и А2 из X, проверка которого элементарна. Применяя теперь следствие о субдифференциале и опорной функции и используя (г), будем иметь d(Pi + Р2) = d(sdpi + sdp2) = ds(dpt + др2) = др{ + др2. Теорема Дубовицкого—Милютина. Пусть fi'.X —» R, i — 1,2 — выпуклые функции, непрерывные в точке х € X и ft(x) = f2(x). Тогда dmax(/i,/2)(®) = со (df>(x) U df2(x)). Доказательство. В силу легко проверяемого равенства (тах(/1,/2)У(х; ) = max(f't(x; ),f2(x; •)) теорему достаточно доказать для сублинейных функций р, = /'(а;; ), i = 1,2. Так как /<, i = 1,2, непрерывны вг, той функции р,, г = 1,2, непрерывны. Тогда по теореме о компактности субдифференциала, множества др,, i = 1,2, компактны, а значит, и множество со (Of ,(i) U df2(x)) компактно (это тоже простое утверждение из топологии). Нам еще понадобится следующее, просто проверяемое равенство а (со (Л) П .Аг)) = тах(зЛ|,зЛ2) (0> справедливое для любых А,; С X, г = 1,2. Применяя теперь последовательно первое утверждение теоремы о субдифференциале и опорной функции, (г) и затем второе утвер- ждение упомянутой теоремы, будем иметь 9max(pi,p2) = 0тах(з0р1,зЭр2) = 3s(co(0pi U др2)) = со (Эр, U др2). Теорема Дубовицкого—Милютина имеет следующее важное обобще- ние:
§ 1. Принцип Лагранжа для необходимых условий экстремума 253 Теорема (В. Левина об очистке). Пусть Т — компакт, Ln — п-мерное пространство, F: Тх Ln —♦ й, (t,x) —> F(t,x) — функция, полунепрерывная сверху по t при каждом фиксированном х и выпуклая по х при каждом фиксированном t. Положим f(x) = тах/6тР(4, х). Тогда для любого у £ д/(х) найдутся г € N, г п + 1, {т,}।, Ti € Т такие, что (A) f(r„x) = f(x), (В) у Е со{»|,...,уг}, где у, € dzF(Ti,x), 1 i s: г. Этот результат относится к еще одному важному принципу — «очистки». Весьма часто, и в случае конечно-параметрического семейства выпуклых функций это так (в этом и состоит теорема об очистке), все множество может быть заменено на свою часть с сохранением какого-то важного свойства. Так и здесь: можно выкинуть все точки множества Т, кроме п -f- 1 точки, и уже на семействе из п + 1 функции минимум их максимума совпадает с минимаксом по всему семейству. Более подробно о выпуклом анализе см. в книге [МИ-Т]. § 1. Принцип Лагранжа для необходимых условий экстремума «Можно высказать следующий общий принцип. Если ищется максимум или минимум некоторой функции многих переменных при условии, что между этими переменными имеется связь, задаваемая одним или несколькими уравнениями, нужно прибавить к минимизируемой функции функции, задающие уравнения связи, умноженные на неопределенные множители, и искать затем максимум или минимум построенной суммы, как если бы переменные были независимы. Полученные уравнения, присоединенные к уравнениям связи, послужат для определения всех неизвестных». Лагранж Этот параграф посвящен обоснованию следующего тезиса: необходи- мые условия экстремума в задачах, где воедино слиты гладкая и выпуклая структуры, соответствуют принципу Лагранжа снятия ограничений. (Из- начальный вариант принципа Лагранжа выражен в приведенном нами эпиграфе.) Мы докажем одну общую теорему, навеянную общим замыслом Лагранжа, которая в качестве следствий содержит необходимые условия экстремума в математическом и выпуклом программировании, вариа- ционном исчислении и оптимальном управлении, ляпуновских задачах и многих других. Но сначала мы (после формулировки теоремы) проде- монстрируем, как эвристически пользоваться идеей Лагранжа, т.е. как автоматически писать правильные необходимые условия в разнообразных задачах на максимум и минимум.
254 Глава 6. Общая теория экстремальных задач 1.1. Формулировка принципа Лагранжа для гладко-выпуклых задач Пусть X и У нормированные пространства, U — некоторое множе- ство. Рассмотрим задачу. fa(x) —» min; F(x,«) = О, и € W, (Р) где fa: Uo —> R, F: Ifa x li —+ У, Uo — окрестность в X. Таким образом, в рассматриваемой задаче имеются ограничения типа равенств, параметризованные множеством U. Мы скажем, что пара (£,й) доставляет сильный локальный мини- мум в задаче (Р), если найдется 6 > 0 такое, что для любой пары (х,и), для которой F(x,u) — 0, и G U и Ця - £||х < 6 выполняется неравенство: fa(x) fa(&)- Функция £((х,и), А,А0): = Ао/о(®) + (A,F(i,«)), Ао 0 называется функцией Лагранжа задачи (Р). Число Ао и элемент А € У* называются множителями Лагранжа ({Х,у) — это действие линейного функционала А е У‘ на элемент у € У). Отображение F в (Р) назовем гладко-выпуклым в точке (4,й), если отображение х —» F(x,ii) непрерывно дифференцируемо по х в окрестности точки £ (или даже строго дифференцируема в х) для всех и € U, а множество F(x,U) выпукло для всех х € Uq. Если F в (Р) гладко-выпукло, назовем эту задачу гладко-выпуклой. Если Р^(£,й)Х = У, то назовем F регулярным отображением, а если подпространство F^.(£,u)X замкнуто в X и имеет конечную коразмер- ность в У (т.е. дополняемо до X конечномерным подпространством), отображение F назовем слабо регулярным в точке (ж, й). Теорема (Принцип Лагранжа для гладко-выпуклых задач). Пусть X и У — банаховы пространства, U — множество, fa — дифференцируема в точке х, a F — гладко-выпукло и слабо регулярно. Тогда если точка (х, й) доставляет сильный локальный минимум задаче (Р), то для задачи (Р) в этой точке выполнен принцип Лагранжа. Если F регулярно, то Ао # 0. Расшифруем, что означает выражение «для задачи (Р) в данной точке выполнен принцип Лагранжа». В задаче (Р) два аргумента — х и и. В соответствии с замыслом Лагранжа, составив функцию Лагранжа, рассмотрим две подзадачи: — гладкую задачу без ограничений £((ж,й), А,Ао) —> min; — выпуклую задачу £((£,«), А, Ао) —» min; и € И (А, у) —♦ min; у е F(£,U).
§ 1. Принцип Лагранжа для необходимых условий экстремума 255 Необходимое условие экстремума в первой задаче пишется в соот- ветствии с теоремой Ферма для гладких функций; оно состоит в условии стационарности £х((х,й),Х,Х0) =0, & A0/i(4) + (Fz(®,«))’A = 0. (1) Условие минимума во второй задаче запишем в виде тавтологического принципа минимума min £((£,«), А, Ао) =£((4,й),А,А0) (\,F(£,v)) ^0 Vv € U. (2) Так что выражение «для задачи (Р) выполнен принцип Лагранжа», означает, что имеют место условие стационарности (1) и принцип ми- нимума (2). Соотношениями (1)-(2) можно пользоваться эвристически. 1.2. Доказательство принципа Лагранжа для гладко-выпуклых задач Доказательство. В основе доказательства лежат два основополага- ющих факта классического и выпуклого анализа: теорема об обратном отображении и теорема отделимости. 1. Регулярный случай. Хотя доказательство принципа Лагранжа и в об- щем случае достаточно несложно, считаем целесообразным провести сначала доказательство в регулярном случае, где оно особенно просто, но содержит в себе все важнейшие компоненты рассуждений, приво- дящих к цели в общей ситуации. Здесь все основывается на теореме Люстерника. Обозначим Р'х(£,й) = Л. Выбрав и € U строим отображение Ф(-, ;и): tZoxK-»r: Ф(х,а;и): — (1 — а)Р(£ + х,й) + aF(£ + х, и). Эта функция, очевидно, непрерывно дифференцируема в окрестности точки (0,0) € X х К и ф'((0,0);и)[з, а] = Ах + aF(£,u). (i) По теореме Люстерника, если Ах = 0, то х — касательный вектор к многообразию {х. | F(x,&) = 0}, и значит, существует отображе- ние г: [-1,1] —» X такое, что F(& + tx + r(t),&) = 0,r(i) = o(t). В силу того, что (£,й) — сильный локальный минимум в зада- че (Р), а (4 + tx + r(t),fi) — допустимая пара, получаем: fa(£) f0(£ + tx + г(/)) = fo(£) + t{fq(£),x) + o(t), откуда вытекает, что (/о(£),ж) = 0, т.е. /о(£) 6 (КегЛ)±. Из леммы об аннуляторе ядра регулярного оператора последует тогда, что найдется элемент А € Y*
256 [лава 6. Общая теория экстремальных задач такой, что fo(x) 4- Л*А = 0. А это равенство есть не что иное, как условие стационарности. Осталось доказать принцип минимума. Пусть v — некоторый элемент из 14. В силу условия регулярности суще- ствует элемент x(v) такой, что Fx(x, u)x(v) + F(x,v) — 0. Это означает (см. (i)), что пара (х(д), 1) € (КегФ'(0,0; v))х. Тогда снова по теореме Люстерника найдем отображения (г„(), р„()): [0, 1] —♦ X х R такие, что для x0(t) = х + tx(y) + rv(t) и a„(t) = t + pv(t) выполнено тождество (1 - a„(0)F(it,(O,«) +av(t)F(xv(t),v) = 0, r„(t) ~ o(t), pv(t) - o(t). Из определения гладкой выпуклости найдем элемент uv(t) £ 14 такой, что F(xv(t), uc(t)) = 0, и следовательно, (xv(t),uv(t)') — допустимая пара, т.е. fo(xv(t)) fo(x), откуда ° L=o = </о(^)>®(”)) = = -(Л* X,x(v\) = —(Л,Ло:(«)) = {X,F(x,v\). Принцип минимума, а с ним и принцип Лагранжа для регулярного гладко-выпуклого случая доказан. 2. Общий случай. Пусть теперь F — слабо регулярно. Обозначим Lq = 1тЛ, А = F(x,l4), С = Lo + А. Пусть тг: Y/Lq = Z — каноническая проекция. Из условия теоремы вытекает, что Z — конечномерное пространство. Надо разобрать два случая: 0 # int^C, 0 6 intxC — вырожденный и невырожденный. В вырожденном случае по теореме отделимости существует z* € Z* такой, что (z*,z) 0 Vz £ ъС. Положим А: = тг*г* (тг* — оператор, сопряженный к тг). В силу того, что тг — сюрьективный оператор, А 0. Имеем: (А, Ах 4- F(x, u)) = (tt*z*, Ах + F(x, и)) = = (z*, л (Ах + F(x, и))) 0 V х 6 X, и €14 <=>(]), (2). Осталось рассмотреть невырожденный случай. Коль скоро 0 6 int?r(7, т существует натуральное число тп, > 0 такие, что = 0, t-i т Zi =xF(x,Vi) и cone{zJ£L| = Z. Тогда по определению € Z>0i t=i _ — т т.е. существует элемент 4 € X такой, что Л£ -I- 52а;Р(г,д,) = 0. Далее >=i поступаем подобно тому, как в регулярном случае. Выбрав vg Е W, определяем отображение z т к т Ф(х, a0, a; Vo): = ( 1 - a, ) F(£ + □:,«) + a(F(i 4- х, v,), ' <=о ’ i=0
§ 1. Принцип Лагранжа для необходимых условий экстремума 257 х € X, а — (а,,... ,ат). Оно отображает X х Rm+I в X, строго дифференцируемо и Ф'(0,0,..., m 0; v0)[xc, а0, а] = Ах + 52 <iiF(sc, V,). Пусть Ах + F(x,v) = 0. Тогда 1=0 ф'(0, 0,..., 0; v)[£ + 1, еа) = Ах + F(x, v) + е^А£ + 52 OjF(£, v,)} = 0 и по теореме Люстерника найдутся г( ): [-1, 1] —» X, рр. [-1,1] —♦ R, 0 < 1i т такие, что r(t) = o(t), pi(t) = o(t) и Ф(х + «£ + r(t),t + p0(t),etai + pi- ,etam -t-pm(t)) = 0 Vt e [-1,1]. Из условия выпуклости получаем, что найдется элемент u(t) £ 2/ такой, что F(x + <i + et$ + r(t),u(t)) = 0, откуда (fo(x),x) 0. Положив v = х, получим, что fo(x) £ (КегА)х. Из леммы о нетривиальное™ аннулятора следует, что существует элемент А| € L'o такой, что fo(x) + А*А| = 0. Пусть теперь F(x ,и) е Lq. Тогда найдем элемент х(и) 6 X такой, что Ах(и) + F(x,u) = 0 (vi) Следовательно, 0 < (/о(2)>х(иУ) = -(A‘A|,a:(u)) = (А|,Лж(и)) (= (XltF(x,u)). Наконец, из теоремы отделимости (взяв С = со(С А В), где В шар с центром г] £ Lq> > 0, который не пересекается с {у | (А|,у) — 0}, => intС ф 0, убеждаемся, что можно применить теорему отделимости) получим, что существует элемент А € У’ такой, что A|to = А] и (A,F(sc,u)) 0 Vu, откуда следует принцип минимума. Из первого уравнения получаем (А,Аг) = (А|,Аг)' = (А‘А|,а:) = -(/q(x),o:) Va:. Это — условие стационарности. Таким образом, принцип Лагранжа доказан. Элементарные задачи Принцип Лагранжа сводит вопрос о необходимых условиях задач с ограничениями к необходимым условиям для более просто устроенных (элементарных) задач. Сформулируем необходимые условия экстремума для четырех важнейших элементарных задач. Элементарная гладкая задача — это задача без ограничений: f(x) -> min, (I) где функция f предполагается дифференцируемой. Согласно теореме Ферма необходимым условием минимума в (I) является равенство f'&) = 0. (1) 9 Зак 60
258 Глава 6. Общая теория экстремальных задач Аналогом теоремы Ферма для выпуклых функций является соотно- шение 0 6 3/(4). (1') Это необходимое и достаточное условие Минимума / в точке х (ср. с п. 6.1 и (1)). Элементарной задачей линейного программирования назовем следую- щую: А,ц,- —» min; и, > 0, (А = (Aj,...,А„) 6 R”). (II) «=1 Необходимым и достаточным условием того, что вектор й 0 является решением этой задачи, является выполнение условий неотри- цательности и дополняющей нежесткости'. Aj>0 АЛ = 0 Vt. (2) Этот факт совершенно очевиден. Элементарной задачей классического вариационного исчисления или за- дачей Бальца называется такая задача: ti В(®(-)) = y"b(t,a:(0,i(t)) dt + l(x(to),x(tt)) — min; (III) «0 где □:(•) = (xi(-)>- -,®n()) — вектор-функция, из пространства G1 (Ri,^],®”) непрерывно-дифференцируемыхвектор-функций, L и I — функции (соответственно) 2n + 1 и 2п переменных. Необходимые условия экстремума в задаче Бальца состоят из урав- нения Эйлера ~ьЖ) + ьх(!) = о (з) at и условия трансверсальности (они выполнены при условии непрерывной дифференцируемости интегранта и терминанта): bi(M = (-i)iiI(«, (Л где Lx(t) = Lx(t,£(t), £()), Lx(t) = Lx(t,£(t),A(t)), а 1х(М = lx<M (4(i0), 4(t])) (доказательство см. в §2 гл. 3). Элементарной задачей оптимального управления или простейшей ляпу- новской задачей мы называем следующую задачу: t. В(«()) = j h(t,v(t))dt — mm; «<<) € ZS, (IV) to
§ 1. Принцип Лагранжа для необходимых условий экстремума 259 где «(•): [io> М ~+ Rr — кусочно-непрерывная функция, Л(-, •): R х R' -» R — непрерывная функция, U — произвольное множество в Rr, u(t} &U во всех точках непрерывности. Легко понять, что кусочно-непрерывная вектор-функция &() доста- вляет абсолютный минимум в задаче (IV) тогда и, только тогда, когда в любой точке непвеоывности функции й() выполнено соотношение: min h(t, и) = h(t, fi(t)). (4) Соотношения типа (4) называ ют пр ищип ом мшимума. Применение принципа Лагранжа для гладко-выпуклых Задач к кон- кретным классам экстремальных проблем основывается на трех леммах — о нетривиальностианнулятопа, о замкнутости образа и ядре регулярного оператора Доказательстваэтих лемм см. в § 5 гл. 1. 13. Следствия принципа Лагранжа Задачи математического программирования Применение принципа Лагранжа для гладко выпуклых задач начнем с гладких задач математического программирования: A(a) /Хж) <0 , 1 , F(ar)-^0 . (Pi) Следствие 1 (Принцип Лагранжа в математическом программировании). Пусть в задаче (Р,) пространства X и Y— банаховы Uq— окрестность точки £ € X, fa Uq —» R, 0 i т, F: Uq —*Y. Тогда, если ft и F строго дифференцируемы, F'(£)X — замкнутое подпространство Y, а £ доставляет локальный минимум задаче, то для нее выполнен принцип Лагранжа. Если неравенств нет и отображение F регулярно в точке £, то множитель Хо можно считать равным единице (см. п. 8.2 гл. \). Фраза «выполнен принцип Лагранжа» в данном случае означает, что существуют не равные одновременно нулю числа Ао,..., Ат и элемент А € У*, которые удовлетворяют условиям неотоицатетьности, дополня- ющей нежесткости и стационарности’. т £х(£, А, А,,..., Am, Ао) = 52 А,-/?(4) + (F'(«))’a = 0. •=о Действительно, есди F'(£)X — собственное подпространство, то по лемме о нетривиальности аннулятора найдется элемент А / 0 такой, что Сх(£,Х,0,.. .,0,0) = 0, а если F^tyX = Y, надо положить U = R™, и =(ui,...,«m)rF(o:,i| == (/Has) + «|,... ,/^ж) + «m,F(a^) , F.X х К —» Rm х Y, применить сформулированную теорему (воспользовавшись 9*
260 Глава 6. Общая теория экстремальных задач леммой о замкнутости) и условия экстремума в двух названных выше элементарных задачах — гладкой без ограничений и элементарной задаче выпуклого программирования. Доказанная теорема содержит в себе правило множителей Лагранжа для конечномерной гладкой задачи с равенствами (это правило, подразу- мевая регулярность ограничения, Лагранж сформулировал, в частности, в своей книге Лагранж [18011, из которой мы заимствовали свой эпи- граф); правило множителей Лагранжа для бесконечномерной задачи с регулярными равенствами (теорему Люстерника [1934]); правило мно- жителей Лагранжа для конечномерной гладкой задачи с равенствами и неравенствами (теорему Джона) и т. п. Из гладко-выпуклого принципа выводится принцип Лагранжа для за- дач выпуклого программирования (теорема Куна—Таккера). Мы не будем проводить этого вывода, ограничившись краткой формулировкой. В вы- пуклых задачах принцип Лагранжа приобретает завершенную форму: при некоторых множителях Лагранжа, удовлетворяющих условиям неотри- цательности и дополняющей нежесткости, функция Лагранжа достигает в точке, являющейся решением задачи своего минимума по тем ограничени- ям, которые не были включены в функцию Лагранжа (см. [МИ-Т]). Ниже мы вернемся к этому результату при обсуждений условий экстремума ляпуновских задач. Принцип Лагранжа в задачах классического вариационного исчисления Следствие 2 (Принцип Лагранжа в задаче Лагранжа). Пусть в зада- че (Pi) U — Жг, t{ = ti, t = 0,1 — фиксированы, и все функции Li, 1,- и ото- бражение <р непрерывно дифференцируемы. Тогда, если (£(•),-й(-)) достав- ляет локальный минимум в пространстве С* ([to,^i],Kn) х С([£о1Л],Кг). то в этой точке выполнен принцип Лагранжа, т. е. существуют множи- тели Лагранжа (р( ), А|,..., Ат, Ао) € С1 ([£о,£|],Кп) xRm+l не равные одновременно нулю и такие, что выполнено необходимое условие в задаче Больца С — J L(t,x(t),i(t),u(t)^ dt + l(x(io),x(ti))т'т~, *0 l = 22 1 = 22Xili = °’ 1=о «=0 ги(О = о. ьх(«ж) = *=о>1- К этому надо присоединить условия дополняющей нежесткости и неотри- цательности. Если концы свободны, надо к этим соотношениям добавить равенства нулю производных функции Лагранжа по i, (ср. с п. 6.2 гл. 3).
§ 1. Принцип Лагранжа для необходимых условий экстремума 261 Действительно, условия гладкости позволяют редуцировать эту за- дачу к задаче математического программирования, а условие слабой регулярности вытекает из регулярности отображения (г(-),и()) —► £(•) — ¥>(-,х(),и()) и леммы о замкнутости образа. Из следствия 2 вытекают многие классические результаты, полу- ченные на протяжении двух веков, например, необходимое условие экстремума в простейшей задаче классического вариационного исчи- сления — уравнение Эйлера (впервые это уравнение было выведено Эйлером в 1728 году); необходимое условие в изопериметрической задаче; необходимое условие в задаче со старшими производными (урав- нение Эйлера—Пуассона)', необходимые условия в задачах с подвижными концами и многое другое (см. §§2-5 гл. 3). Эти условия составляют основное содержание большинства учебников по вариационному исчи- слению. Все эти условия с помощью принципа Лагранжа выписываются автоматически и, как мы видели, единообразно выводятся, основываясь по сути дела лишь на теореме об обратной функции и трех леммах, представляющих собой бесконечномерные версии тривиальных фактов линейной алгебры. Вывод следствия 2 из следствия 1 (а следовательно, и из гладко-выпуклого принципа) см. в первой части, а также в книгах АТФ и ГТ. Принцип Лагранжа для ляпуновских задач и линейных задач оптимального управления Пусть Д — промежуток числовой прямой (конечный или беско- нечный), U — некоторое топологическое пространство, Д х U —» R, О < I < т — непрерывные функции, X — линейное пространство, Qi'. X —» R, 0 i < т — выпуклые функции А — выпуклое множество U — совокупность измеримых отображений из Д в U*. Мы будем изучать здесь ляпуновские задачи вида: («()) 4- Ро(^) = / /о (*,«(*)) dt +Ро(я) -> min; д Fi («()) + 9i(x) = J fi (*» «(0) dt 4- 9i(x) < 0, 1 5$ i m. (P3) A Для того, чтобы можно было бы воспользоваться гладко-выпуклым принципом Лагранжа достаточно показать, что отображение (u(),x) -»Jo(«()+ до(х)),...,^т(и()+дт(х)) (w(-)eZ/, х Е А) является выпуклым множеством в Rm+I. А для этого достаточно доказать выпуклость только лишь интегральной части этого отображения. Вот именно здесь подтвердится один из наших основных тезисов, о котором * Об измеримости отображений из А в U см. в АТФ, пп. 4.2.6 и 4.3.3.
262 Глава 6. Общая теория экстремальных задач говорилось во введении: интегрирование порождает выпуклость. Этот тезис опирается на следующий результат. Теорема (Ляпунова). Если ре Д -> Шп, р(-) = (pi ( ), •• • ,Ря( )) интег- рируемая вектор-фюисиия. то множество М — {ж 6 Rn | х = J p(t)dt, Е Е 6 Е}, где Е — совокупность подмножеств & измеримых по Лебегу, являетсявыпуклымкомпактом- Доказательство этой теоремы см. в АТфп. 4 3 2 Докажемте перьнужную выпуклость. Пусть и jFt(u’(-)) =£1, * = 0,1, 0 ^к^т. Положив р*(0 =?= Л(^«°(0) е Д, 0<,Л < т , найдем по теореме Ляпунова множество Аа такое, что /рл(О^ "=-а(£0* "^*1 • 4м И остается сделать «микс» иа() двух управлений, положив равным если t £ Аа и «’(() в остальных случаях, и мы получаем, что Л««0) = «£°+(1- а)£', что и требовалось. Применив гладко-выпуклый принцип, получаем Следствие 3 (принцип Лагранжа для задачи Ляпунова). Если w = (й(),£) — решение задачи (Рз), то найдутся множители Лагранжа А = (А(,..., Ат) и число >в 0 не равные одновремен но нулю и такие, что выполнены условия неотрицательности, дополняющей нежесткости и принцип минимуМ3'. тт^А^Дж) = 52А,$,(£), 1 i=0 i=0 л tn т j» т tn %" / 52 52A<^ (*> “(o) ^ = / 52 52 A«^ (*><a- “()eWd >=0 i=0, J )=fl i^Q К задаче (P3) редуцируется задача оптимального управления ли- нейная по фазовым координатам. Сформулируем»эту задачу. Пусн Д ~ Ио, 11 ] — фиксированный отрезок числовой прямой, а<() € Ь|(Д,КП), 0 п и Л(-): Д —> b(Rn,Rn) — интегрируемая ма- тричная функция U — топологическое пространство, jf: Дх U—» R 0 < * "С т и F: Д х U —► К” — непрерывные функции и отображение 7<и> 7н> 0 * С т — элементы Ж”, с,, 1 < т — числа. Рассмотрим задачу Jo(®(),M())=y(ao(0.®(0)+/o(t,*»(0)dt+<7oo,®(io))+(7io.®(^))->min; д ж — A(t)x + F(t,u(t)), u(t) е U,
§ 1. Принцип Лагранжа для необходимых условий экстремума 263 Л (®( ),«( )) = J (ai(t),x(t)} + /,(*,«(*)) dt + + b<u,x(t0)) + {'r\i,x(ti)} < (P4) Ее и называют задачей оптимального управления линейной по фа- зовым координатам. Пусть р,( ) — решение сопряженной системы р, = —A*(t)p + Pi(t) с краевым условием Pi(ii) = —7н, 0 < i < т. Если положить Gi(t,u) = fi(t,u) - F*(t,u)pi(t), fa = 7W - p,(i0), то, как нетрудно понять, задача (Р3) редуцируется к задаче 4> М И) J (4 "(0) dt + (Аг & -* W д Ji («(• И) - У Q (t, и (0) dt + (fa £)<=<*, U<» <<m. (^') д И з слежтв ияЗ вытекает Следствие 4 (Принцип Лагранжа для линейных задач). Если пара (#(•), й(-)) — решение задачи (Р4), найдутся множители Лагранжа {А,}^, не равные одновременно нулю, неотрицательные, удовлетворяющие условию т дтолняющей нежесткости и принципу минимума minu€p Аг €?»(£,«) = 4—0 ш 52А/7,((,й(О) почти всюду. «=о Принцип Лагранжа для задач оптимального управления Принцип Лагранжа для задач оптимального управления в понтря- гинской форме также выводится из гладко-выпуклого принципа ,но мы не ; будем этого делать, ограничившись лишь формулировкой самого результата. Следствие 5 (Принцип Лагранжа в оптимальном управлении). Пусть в задтвоптимального управления в понтрягинской форме, ti ~ t^ i = 0,1 — фиксированы; функции k непрерывно дифференцируемы, а функции Lt и отображение <р непрерывны и нерерывно дифференцируемы по х .Тогда , если (£(), й( )) доставляет сильный минимум в за) аче, то выполнен принцип Лагранжа, т.е. сушрству ют множители Лагранжа >() ,А ь... ,Дт,А0) € С1 (Но,id,к”) x Km+1 не равные одновременно нулю и такие ,что выполнено неоохооимое условие в задаче Больца по х I, С =I L(t, x(t), x(ty,u(t)) dt + l(x(to), ®(£i)) -> min;
264 Глава 6. Общая теория экстремальных задач тп ш d Z = V А,Д, I = V АД => -~Lz(t) + Lz(t) = О, 1=0 1=0 принцип минимума по и minL(t,x(t),x(t),u) — L(t) и условия трансверсальности: Lz(ti) — (-г = 0,1. Если концы свободны, надо к этом соотношениям добавить равенства нулю производных функции Лагранжа по t,. В § 1 гл. 4 было приведено элементарное доказательство принципа максимума. Замечание. Применимость принципа Лагранжа к задачам оптималь- ного управления также может быть основано на возможности микса управлений с использованием параметрической теории об обратном отображении. Подведем итог: все необходимые условия экстремума во всех рассмо- тренных случаях соответствуют принципу Лагранжа. § 2. Возмущения экстремальных задач Следует сравнивать динамически возможные движения, варьируя крайние положения системы. Гамильтон Одной из центральных идей теории экстремума является мысль, выраженная Гамильтоном: следует рассматривать не одну задачу, а семейство задач, включающую данную. Краткому обсуждению этой идеи посвящен данный параграф*. 2.1. Возмущения в математическом программировании Задачу /(х) -» min; х € С можно записать, как задачу без ограниче- ний /(х) —> min; (Р) * Концепция возмущения экстремальных задач тесно связана с достаточными услови- ями экстремума, динамическим программированием, теорией Гамильтона—Якоби и симплектической геометрией. Всему этому кругу вопросов предполагается посвятить отдельную публикацию. О достаточных условиях рассказано в первой части книги.
§ 2. Возмущения экстремальных задач 265 если положить f(x) = +оо при х £ С. Если Y — некоторое семейство параметров, F : X х Y —► R U {+оо} и для некоторого уо имеет место равенство F(x,y0) — f(x), говорят, что семейство задач F(x,y) -> min (Ру) является возмущением задачи (Р). Теория задач линейного программирования строится на концепции возмущения, и суть этой теории может быть выражена очень кратко: эпиграф значения возмущенной задачи линейного программирования — вы- пуклый полиэдр, откуда вытекает разрешимость задачи (если ее значение конечно), совпадение ее значения со значением двойственной зада- чи, разрешимость двойственной задачи и невырожденность принципа Лагранжа для прямой и двойственной задач (ср. с гл. 2). В некоторых классах задач, которые рассматривались во введении, напрашиваются стандартные возмущения. Таковыми являются многие задачи, рассмотренные нами. Для задачи с ограничением типа равенств fo(x) —> min; F(x) = О, F: X —> Y стандартное возмущение таково: fo(x) —> min; F(x) = у, для простейшей задачи j(x( )) = f L(t,x(t)x(t)} dt —> min; x(tQ) = xQ, to x(i|) = X| рассматривается такое возмущение j(x()) = У L(t,x(t)x(t)) dt —» min; x(t0) — x0, х(т)=£ит.п. to (о котором как раз и говорит Гамильтон — см. эпиграф). Невырожденность необходимого условия первого порядка порождает «устойчивость» решения первоначальной задачи: при возмущении этой задачи решения возмущенной задачи плавно эволюционируют в зависи- мости от параметра возмущения и при этом зачастую удается вычислить субдифференциал S-функции в точке уо, в которой возмущенная задача совпадает с исходной. Эта мысль может быть реализована по отношению ко всем типам рассмотренных нами экстремальных задач, но мы проиллюстрируем ее лишь в самых простых случаях — гладкой конечномерной задачи с ограничениями типа равенств и для простейшей задачи классического вариационного исчисления. Пусть U — окрестность в Rn, f: U —► R, F: U -» Rm. Рассмотрим конечномерную задачу с равенствами: f(x) —> min; F(a:)=0 (2)
266 Глава 6. Общая теория экстремальных задач и ее стандартное возмущение: f(x) — min; F(x) = у. (Ру) Теорема (о поле в конечномерных задачах с равенствами). Пусть /, F € C2(U) (условие гладкости), х & U, F(£) = 0, ImF'(®) Rm (условие регулярности), существует множитель Лагранжа А € Rm такой, что для функции Лагранжа задачи (2) с единичным множителем Лагранжа при функционале (£(ж, А, 1)) = ](х) + (A, F(x)) выполняются: а) необходимое условие минимума первого порядка: 0 = £х = f'(A) + {X,F‘(£)) (£х = Сх(х,Х)\, (1) Ь) условие второго порядка: £хх>0 Wi€KerF'(£), Л/О (£„=£„(£, А)) (2) а) и Ь) — достаточное условие минимума второго порядка). Тогда суще- ствуют окрестность V точки 0 € Rm, окрестность U' С U точки £ и функция tp : V -» U х Rm, р G C'(V), р(у) = (х(у), Х(у)), у>(0) = (£, А) такие, что сх(х, х) = о, f(x) = у, хе и', у ev тогда и только тогда, когда х = х(у), X = Х(у). При этом х(у) — локальный минимум (Ру) и S'(0) - X. Доказательство этой теоремы см. в книге [ГТ, с. 140 и далее]. Такие же результаты можно доказать и для других разбиравшихся нами классов экстремальных задач. Одним из важных частных случаев приложения этой общей идеи о полном элиминировании ограничений является основная формула Вейерштрасса. 2.2. Простейшая задача классического вариационного исчисления Начнем с задач, интегрант которых не содержит фазовых перемен- ных. Класс простейших задач классического вариационного исчисления с интегрантами вида L = L(t,x), I:RxRn -»Ru {+оо} (не завися- щими от х) исследован почти до конца. (На самом деле не так мало замечательных задач редуцируется к задачам этого класса.) Суть дела в том, что эти задачи — ляпуновские: «I «! У L(t,u(t)) dt —► min, J u(t)dt = xt - х0, h A)
§ 2. Возмущения экстремальных задач 267 а ляпуновские задачи, как объяснялось, на самом деле выпуклые. К ним применим принцип двойственности. Если рассмотреть семейство задач, зависящих от параметра у, записав ограничение в виде равенства «I Ju(t)dt — у, и значение возмущенной задачи обозначить S(y), то ^0 двойственная функция имеет вид: S*(p): Rn —» R U {+оо}, S'(p) — J L'(t,p)dt. *0 Это — функция конечного числа переменных. Функция S при широких допущениях замкнута, и потому (по теореме Фенхеля—Моро) вычисле- ние значения задачи сводится к конечномерной выпуклой оптимизации: если у принадлежит относительной внутренности dom5, то <1 S(y) = max((p,j/) - JL*(t,p)dt^. io Причем если решение р принадлежит внутренности domS*, то решение £(•) существует и находится из равенства Z(t,sc(t)) + L*(t,p) = (f(t),p) почти везде. В достаточно общем случае удается описать обобщенное решение, оно включает в себя некоторое число скачков. Подробнее об этом см. (ИТ, §9.3]. В задачах классического вариационного исчисления и оптимального управления можно реализовать ту идею о полном снятии ограничений, о которой говорилось в п. 2.1. Мы проиллюстрируем ее лишь на про- стейшей задаче (2) .Допустим, что в этой задаче интегрант — достаточно гладкая функция во множестве U х R, экстремаль £() — также гладкая функция и при этом удовлетворяются условия невырожденности первого и второго порядка, сходные по сути с условиями теоремы из п. 2.1. Тогда область U удается покрыть полем экстремалей U —» R и при этом имеет место формула <1 - J(f( )) = У dt, <o где £(t, x, и, x) - L(t,x,x) - L(t, x, u) - (x - u)Li(t,x, u) (cm. n. 1.3 гл. 5 и [ГТ, с. 146]). Подобные формулы существуют для весьма широкого класса задач. Особенно красиво формула Вейерштрасса выглядит в квадратическом случае, когда при t0 = = 0, L(t, х,х) = Л(0±2 + B(t)x2. Пусть
268 Глава 6. Общая теория экстремальных задач Л(-) — решение уравнения Эйлера для простейшей квадратичной задачи, не обращающееся в нуль в полуинтервале (0,t|J. Тогда для любой функции х( ), г(0) = ж(<|) = 0 имеет место формула (Вейерштрасса): <1 <1 A(t)x\t) + B(t)x2(i)) dt = f A(t) о о ®(0 - ft(t) / § 3. Расширение вариационных задач и существование решений «Я убежден, что доказательства существования можно будет провести с помощью некоего основного положения, на которое указывает принцип Дирихле и который, вероятно, приблизит нас к вопросу о том, не допускает ли всякая регулярная вариационная задача решение, если в случае необходимости самому понятию решения придать расширенное толкование». Д. Гильберт Этот параграф в значительной мере посвящен осознанию того, что было высказано Гильбертом в приведенном выше эпиграфе. «Основ- ное положение», о котором он говорит, это, по-видимому, принцип Вейерштрасса—Лебега. Регулярная задача (классического вариационного исчисления) — это задача, где интегрант является строго выпуклым по производным. Регулярность гарантирует полунепрерывность снизу. Процедура, называемая «скользящим режимом» позволяет утверждать, что с теоретической точки зрения, интегрант (одномерной) вариационной задачи всегда можно считать выпуклым по производным (такие интегран- ты называются квазирегулярными). Квазирегулярность влечет за собой полунепрерывность снизу функционалов классического вариационного исчисления. И остается вопрос о компактности. Обо всем этом речь идет в этом параграфе. 3.1. Расширение вариационных задач Примеры несуществования решений Рассмотрим простейшую задачу классического вариационного исчи- сления б J(a:()) = y*L(t,a:(t),±(t))dt —► min; x(t0) — x0, x(t\) = x\, *0 и постараемся сначала понять, какие причины могут препятствовать существованию решения этой задачи (в естественном и — с определенной
§ 3. Расширение вариационных задач и существование решений 269 точки зрения наиболее широком — пространстве ([to, 1) абсолютно непрерывных функций). Пример 1 (Больца). i J, (х( )) = f ((i2 - I)2 + x2)dt —► min; г(0) — ж(1) = 0. о Ясно, что J| (□:()) > 0 на любой абсолютно непрерывной функ- ции х(). Если же взять последовательность функций равномерно стремящуюся к нулю, у которой производная по модулю равна по- чти всюду единице, то значение интеграла будет стремиться к (не- достижимому) нулю. (Например, можно взять последовательность, t xn(t) — Jun(T)dT, Un(t) = sgnsin2Trnt, n € N и убедиться, что о Ji (a;n(•))—> 0 при п —> оо. Такие процедуры называют «скользящими режимами».) Причиной несуществования решения здесь является неквазирегуляр- ность интегранта, т.е. невыпуклость по х функции х —» (г2 - I)2 + х2. Здесь возможно обобщить понятие решения и тогда в этом примере будет существовать обобщенное решение. (См. далее комментарий к теореме Боголюбова.) Пример 2 (Вейерштрасса). । Jz(x( y) = J t2i2dt —» min; х(0) = 0, аз(1) = 1. о Это — знаменитый пример, с помощью которого Вейерштрасс оспаривал утверждение, приписываемое Риману, о существовании ре- шения задачи Дирихле в области n-мерного пространства. (Якобы Риман утверждал, что у положительного функционала всегда долж- но быть решение; Риман, безусловно, был уверен в существовании решения задачи Дирихле, но навряд ли считал сказанное доказатель- ным аргументом.) Ясно, что J2(x(-y) > 0 для любого х(-) € Wz’ll(7'), а:(0) = 0, г(1) = 1, I = [0,1]. Но если рассмотреть последовательность xn(t) — < П^’ п € N, то получим, что lim J2(xn()} = 0. 11, t <2 п-*<х v ' ’ п ’ Снова мы видим, что решения нет. Причина тому — недостаточный рост интегранта, который препятствует компактному вложению множества функций с ограниченной величиной интеграла J2 в пространство Интересно отметить, что недостаточный рост интегранта имеется лишь в одной точке — нуль! И здесь возможно расширить понятие решения, дополнив кон- станту, равную единице, скачком, и тогда и в этом примере будет иметься решение, которому (по Гильберту) можно придать «расширенное толкование».
270 Глава 6. Общая теория экстремальных задач Пример 3 (гармонический осциллятор), т Ji (х()) = f(x2 - х2) dt —> min; Т > ir, х(0) = х(Т) — 0. о Если рассмотреть последовательность xn(t) = nsin(x£), п € N, то нетрудно понять, что <7з(а?„(-)) —» —оо, т.е. решения нет: функционал п—‘ОО неограничен снизу. Здесь, разумеется, никакого «обобщенного» решения быть не может, но допустима такая процедура: наложим «принудитель- ное» ограничение |i(t)| < 2V. Тогда решение xjv( ) будет существовать, и вычислив #з(г/у( )), можно будет убедиться, что эти числа стремятся к минус бесконечности. Эта же идея может быть применена и в примере Вейерштрасса, и мы пришли бы к описанному выше обобщенному ре- шению. Так что метод принудительного ограничения позволяет, вообще говоря, исследовать задачи, где нет ограниченности снизу интегранта или компактности. Теорема Боголюбова Общий принцип, о котором говорит Гильберт, это, вероятно, прин- цип компактности. Чтобы его применить нужны полунепрерывность снизу и компактность, которая возникает, если функционал коэрцитивен (т.е. имеется рост инте1рала J(x()) при стремлении х(-) к бесконеч- ности). Полунепрерывность снизу гарантируется квазирегулярностью, а коэрцитивность — ростом интегранта. Оказывается, что неквазирегулярность интегранта может быть те- оретически преодолена. Именно, можно расширить задачу, изменив функционал (сделав интегрант квазирегулярным) так, что минимизи- руемые последовательности у него и у исходного функционала будут одни и те же. Поясним, как это сделать на примере простейшей задачи классического вариационного исчисления: «I j(x()) = J £(t.a:(t),i(t)) dt —♦ min; x(ti)—Xi, i — 0,1. (P) to Обозначим L(t, x, •) — овыпукление L по x при фиксированных (£, x) (или, иначе говоря, вторую сопряженную функцию х > L**(t,x, х) по последнему аргументу.) Теорема (Боголюбова о квазирегулярном расширении). Пусть интегрант (t,x,x) •—» L: R3 —♦ R — непрерывен по всем переменным и удовлетворяет неравенству: L(t, х, х) (5, Тогда для любой абсолютно непрерывной функ- ции х( ) существует последовательность {□:„()} равномерно сходящаяся к £(•) и такая, что lim j(a:n( )) —<• j(a:( )) = f L(t,i(t),i(t)) dt. n^°° <0
§ 3. Расширение вариационных задач и существование решений 271 Идея доказательства теоремы Боголюбова проста. Устроив разбие- ние отрезка на N отрезков {Ai}*], заменим j(a:()) на сумму n 52 L{t,, Xi, ж,)Д,. Если при этом число _Е(т,, ц, попадает на «не- выпуклость» функции х L(Ti,Xi,x), то L(ri,Xi, *'Чд~*‘)Д,- заменяется на скользящий режим. Применим теорему Боголюбова к рассмотренному выше приме- ру 1. При овыпуклении интегранта этого примера получается интегрант L(x,x), совпадающий с интегрантом примера при |ж| 1 и равный ну- лю, если |ж| 1. При таком интегранте решение существует при любых граничных условиях. 3.2. Теоремы существования в задачах вариационного исчисления Общая теорема существования Пусть X — рефлексивное* нормированное пространство, Y — нор- мированное пространство, А С X — выпуклое замкнутое подмножество, A: X —» Y — линейный ограниченный оператор, J — функционал на А ограниченный снизу и полунепрерывный снизу относительно сла- бой сходимости в X. (Если J — выпуклый, то достаточно требовать полунепрерывности снизу в X). Рассмотрим экстремальную задачу. J(x) —> min; Л.х + уд = 0, х Е A, (Pi) где уо — заданный элемент. Обозначим через Т> — множество допустимых элементов, т. е. таких элементов х € А, для которых Аж + jfo = 0 и J(x) > —оо. Решение задачи, т.е. глобальный минимум обозначим £. Теорема 1 (общая теорема существования). Пусть множество допусти- мых элементов непусто и функционал J коэрцитивен (т. е. для некоторого R > О множество {ж € Т> | J(x) < R} ограничено в X.) Тогда задача (Р) имеет решение. Если J — строго выпуклый функционал, это решение единственно. Доказательство. Из условия теоремы следует, что для некоторого ж € Т> множество {ж е Р | 7(ж) J(x)} есть замкнутое (в слабой топологии) ограниченное множество рефлексивного пространства X. Как известно, это множество слабо компактно, значит, по принципу Вейерштрасса— Лебега решение задачи (Р) существует. * Банахово пространство X называется рефлексивным, если X** = X. В таких пространствах из ограниченной последовательности можно выделить сходящующся подпоследовательность.
Т12 Глава 6. Общая теория экстремальных задач Теорема Тонелли Применим этот общий подход к простейшей задаче классического вариационного исчисления и убедимся, что если исключить те три причины несуществования, которые были вскрыты при обсуждении приведенных выше трех примеров, то существование решения можно гарантировать. Первый результат такого рода был доказан Тонелли для задачи (Р). Теорема 2 (Тонелли о существовании решения в простейшей задаче). Пусть интегрант (/, х, х) •—> L: Ж3 —> Ж в задаче (Р) — непрерывная по всем переменным и выпуклая по х при фиксированных tux функция, удовлетворяющая неравенству: L(t,x,x) a|i|p + (3, а > 0, (3 € Ж, р > 1. Тогда существует решение задачи (Р), принадлежащее пространству абсолютно-непрерывных функций. Доказательство. Будем доказывать теорему, предположив, что (по- мимо непрерывности и выпуклости) интегрант L непрерывно диф- ференцируем по х. Из неравенства, приведенного в формулировке теоремы, получаем, что ||i(-)||£ (ц,» Q С, если рассматривать функ- ции, удовлетворяющие граничным условиям со значением функционала, не превосходящим J (х()), где х{ ) — некоторая допустимая функция. Это множество слабо компактно в Lp([to,t||). Рассмотрим миними- зирующую последовательность {a;n()}ngN. Из жп() можно выбрать подпоследовательность слабо сходящуюся к х( ). Тогда соответствующая г подпоследовательность xnk(t) = х0 + J жП1(т)<Гг сходится к x(t) и при- том равномерно. Легко доказывается, что х(-) 6 AC([Zo,ii])- А теперь интегрируя неравенство L(«,sn(i),in(t)) - L(t,xn(t),x(ty) (i„(f) - x(t))(Li(t) + Li(t,x„(t),x(t)) получаем неравенство: lim J(xni()) j(x()). При отсутствии роста можно иногда эффективно расширить понятие решения, скажем, дополнив его скачками (как в примере Вейерштрасса; впоследствии мы еще поговорим об этом). В принципе, можно перейти во «второе сопряженное пространство», т.е. достигнуть существования в слишком широком пространстве, где его затруднительно описать явно. Но есть еще одна возможность, о которой уже упоминалось. Ее мы сейчас обсудим более подробно.
§ 3. Расширение вариационных задач и существование решений 273 Принудительные ограничения и пример Лаврентьева Оптимальное управление представляет новые возможности для под- хода к проблемам существования. Имеет место такой результат: если интегрант простейшей задачи непрерывен и квазирегулярен и рассматрива- ется задача при дополнительном ограничении на производную |i| N, то при условии, что существует допустимая кривая, существует и решение задачи. Доказательство этой теоремы содержится в книге [ГТ, с. 157] (оно очень близко по сути дела доказательству теоремы Тонелли). Трудно сказать, в какой мере универсален подход, связанный с при- нудительным ограничением, ибо существует замечательный (правда, очень вырожденный) пример Лаврентьева. Вот одна из реализаций лаврентьевского примера. Пример (Лаврентьева). J4(a:( )) = f(t - х2)2х6 dt —> min; ж(0) = 0, x(l) — 1. i Функция t >—> ®(t) = Vt допустима, она абсолютно непрерывна (т.е. принадлежит (У|'(/)) и в этом пространстве достигает глобального минимума. Но в пространстве функций, удовлетворяющих условию Липшица минимум функционала положителен. Доказательство опирается на следующую лемму. Лемма. Пусть 0 < a < ft < 1 и ( t'/2 t'/2 w -|x() € И^([а,д])-. —<x(i)<— vte[a,£], Тогда P J(x( )) = / (t - X2(t))2x6(t) dt> co > 0. Действительно, в силу того, что С |(г), получаем: Р 7(ж(),а,Д)-. = f (t — х2 (t))2 г6 (t) dt P , . f> = / dt>^/ («)
274 Глава 6. Общая теория экстремальных задач Задача f t2x6(t) dt —> min; х(а) = , т(/3) = легко решается, и ответ а в ней 1/7 V/ ’ (1 - (а//3)3^5)5 55212. Лемма доказана. Остальное просто. Если □:(•) удовлетворяет условию Липшица, тогда, если t меньше некоторого то x(t) < *~, 0 < t < б\, а если 1 — 6-2 < t 1 (при некотором 62), тогда x(t) > ‘-у. Значит, существуют такие а и /3, как в лемме, и тогда J4(x()) 1(х(),а, 0) > со, что и требовалось. Метод принудительного ограничения здесь к цели не приводит. Не исключено, что ситуация примера Лаврентьева имеет место в некоем «общем положении». Но может ли она встретиться в реально интересных задачах? И что делать, если ответ окажется утвердительным? На эти вопросы пока нет отчетливого ответа. Проблемы существования решения задачи особенно остро стоят в многомерных задачах вариационного исчисления, ибо там почти нет «явных решений», и необходимо гарантировать себе возможность полу- чить приближенное решение, применив какой-либо метод финитизации. § 4. Алгоритмы оптимизации Таким образом, дело сводится к решению легкой задачи: даны две точки А и С и проходящая между ними горизонтальная прямая DE; требуется найти на этой прямой точку В, чтобы путь АВС был наискорейшим. Лейбниц (Из письма И. Бернулли 31 июля 1696 г. по поводу брахистохроны) Алгоритмы решения экстремальных задач делятся на прямые (т. е. ме- тоды, не использующие необходимых условий экстремума) и «непря- мые». В словах Лейбница, взятых нами в качестве эпиграфа, содержится первый намек на прямой метод в вариационном исчислении: задачу о брахистохроне Лейбниц решает, заменив кривую ломаной, исследуя конечномерную задачу и переходя к пределу. Прямые алгоритмы основываются, в основном, на идеях целесообраз- ного спуска, а также методах отсечения и штрафа. Расскажем о некоторых из них.
§4. Алгоритмы оптимизации 275 4.1. Алгоритмы минимизации квадратичной функции Задача К(х) = ^(Ах,х) — (Ь,х) - с —> min; х € Rd, А > 0, (Pi) где А — положительно определенная матрица размера d х d, без- условно принадлежит к числу простейших и актуальнейших проблем минимизации. Она коэрцитивна и конечномерна, и потому решение за- дачи £ существует. По теореме Ферма должно удовлетворяться уравнение К'(х) = 0 о Ах = Ъ, и дело сводится, таким образом, к решению линей- ной системы. Это — задача линейной алгебры. Ей посвящена огромная литература, не относящаяся к оптимизации. Одним из основных методов решения является метод Гаусса последовательного исключения неиз- вестных. Он прост по вычислительной схеме и устойчив по отношению к ошибкам округления. Этот метод требует у умножений (несмотря на значительные усилия последних лет существенное сокращение этого числа не удается). Многие методы минимизации функции К() реализуют идею целе- сообразного спуска. Таков, в частности, метод сопряженных градиентов (или сопряженных направлений; направления у и у' называются сопря- женными относительно симметрической матрицы А, если Ау ортого- нально у’). Метод состоит в следующем. Берется произвольная точка xq и из нее спускаются в нижнюю точку функции К() вдоль луча Л, исходящего из х0 в направлении «минус градиента» у0 = -Jf'(xo). Находится точка xt, где функция К(-) достигает минимума на этом луче. Далее рассматривается двумерное аффинное многообразие Ао, проходящее через точку х,, с приложенными к ней векторами уо и Jf'fci)- Линия уровня ограничения функции К() на это многообразие есть эллипс, касающийся луча J(. Затем находится (сопряженное) направление у\, ведущее в центр эллипса. Вдоль этого направления снова ищется минимум квадратичной функции, в результате чего мы попадаем в центр эллипса х2. Тогда берется аффинное многообразие А2, проходящее через х2, с приложенными к ней векторами г/, и K'(xi) и все повторяется. Через не более, чем d шагов достигается искомый минимум. 4.2. Метод центрированных сечений и метод эллипсоидов Рассмотрим следующую проблему: найти минимум выпуклой диф- ференцируемой функции f на выпуклом конечномерном компактном теле А С Rd: f(x) -> min; х G А. (Р2) Это — общая проблема выпуклой конечномерной оптимизации.
276 Глава 6. Общая теория экстремальных задач Метод центрированных сечений В середине шестидесятых годов А. Левин из России и Д. Ньюман из США предложили метод поиска минимума в задаче (Рз), бази- рующийся на теореме Грюнбаума—Хаммера, относящейся к выпуклой геометрии. Согласно этой теореме, если через центр тяжести некоторого выпуклого тела А в d-мерном пространстве провести гиперплоскость, то она разобьет тело на два множества А' и А и при этом объем любого из этих подмножеств не превосходит величины (1 — £) объема множества А. Сам метод (называемый методом центрированных сечений) состоит в следующем. Обозначим А через Ао. Найдем точку хо = grAo — центр тяжести Ао. Вычислим f'(xQ). Если этот вектор — нулевой, задача решена: минимум уже найден, а если этот вектор отличен от нуля, можно отбросить часть Ао, лежащую в полупространстве По: = {х | {f'(x0),x - Xi) > 0} (ибо, как мы помним, для любой выпуклой функции выполнено неравенство f(x) - f(£) (/'(С),® и, значит, если а: € Ао А П'о, то f(x) > /(ж,) min/.) Оставшуюся после отбрасывания А А По часть обозначим А| и повторим всю процедуру снова. И так далее. На n-том шаге выберем такую точку £п среди {г|,..., гп}, в которой значение / не больше, чем любое из значений {/(ац): 1 < i; п}. Дока- жем, что /(Сп) сходится к /min со скоростью геометрической прогрессии. Действительно, не ограничив себя в общности, можно считать, что 0 6 А и это — точка минимума в задаче (Р2)- Пусть а > (** j. (VoljC — объем d-мерного множества С). Тогда по определению Vold(aA) > VoldA„, т.е. найдется элемент х GaA\A„. Из конструкции алгоритма следует, что раз элемент х был отброшен, значит, f(x) > f(xt) для некоторого в, а значит, f(x) > f(£n)- Но х Е а А, следовательно, х = а£, £ Е А и значит по теореме Грюнбаума—Хаммера, (через Var/ обозначена максимальная разность /(а:) - /(0), х Е А): 7(6.) < /(*) = /(«4 + 0(1 - а)) <: а/U) + (1 - а)/(0) = . . . . defer = /(0) + а (/(О - /(0))) < /(0) + л Var/ </(0) + (^гт)l/dvar/ /(0) + (1 “ e-,)"/<iVarf Метод описанных эллипсоидов Немировского—Юдина—Шора Метод описанных эллипсоидов основан на комбинации двух идей — идее отсечения, о которой говорилось ранее, и на таком геометрическом факте: половину эллипсоида можно поместить в эллипсоид объема меньше- го, чем изначальный эллипсоид! При этом, во-первых, отношение объема эллипсоида, содержащего полуэллипсоид к объему самого эллипсоида
§4. Алгоритмы оптимизации 277 9(d) = ( меньше единицы, и центр нового эллипсоида можно вычислить по по- луэллипсоиду с затратой порядка d1 операций. Построим описанный эллипсоид. В силу аффинности задачи можно считать, что изначальный элли- d псоид — это шар ^2 xk ।> а полушар состоит из точек этого шара к=1 с неотрицательной последней координатой. Поместим центр описанного эллипсоида в точку 4 с координатами (0,... ,0, i/(d + 1)) и определим эллипсоид неравенством 4(d2 - 1) (xd - l/(d + l))2(d+ I)2 Объем построенного эллипсоида равен произведению полуосей на объем единичного шара, и делить потом надо на объем единичного шара, так что интересующая нас величина равна d \ d dd J d+ 1 ~ (d — l)d-l(d + l)d+l Без труда доказывается, что g(d) < 1 для любого натурального d 2. А теперь можно описать и сам алгоритм. Обозначим через Eq некоторый эллипсоид, содержащий в себе множество А. Если его центр со не принадлежит А, проведем через cq гиперплоскость, не содержащую точек из А и отбросим половину эллипсоида, не пересекающуюся с А. Если же со € Д вычислим /'(со), произведем отсечение «по Левину—Ньюмену» и снова мы получим половину эллипсоида, которую обозначим Eq. А теперь опишем вокруг Ео эллипсоид меньшего сбъема, чем объем Eq, обозначим новый эллипсоид Е\ и начнем все сначала. Это также приводит к стремлению по функционалу со скоростью геометрической прогрессии. К числу наиболее известных алгоритмов выпуклой оптимизации относится симплекс-метод. Симплекс-метод, изложенный в гл. II, сыграл исключительную роль в истории численных методов оптимизации. Многие убеждены в том, что именно на решение задач симлекс-методом было затрачено наиболь- шее машинное время в сравнении с другими методами оптимизации. В течение многих десятилетий было неизвестно, принадлежат или нет задачи линейного программирования к числу так называемых неполино- миальных (т.е. «трудных») задач. В 1970 году Кли и Минти построили примеры, показывающие, что симплекс-метод в некоторых ситуациях требует экспоненциального числа шагов. Многие математики (в том числе и сам Данциг) не раз говорили, что воспринимают, как чудо пяти- десятилетнюю триумфальную «службу» симплекс-метода в бесчисленных
278 Глава 6. Общая теория экстремальных задач исследованиях прикладного характера (Данциг сказал: «The tremendous power of the simplex method is a constant surprise to me»). И лишь недавно были построены полиномиальные алгоритмы, со- поставимые с симлекс-методом по эффективности. Важный шаг был сделан Хачияном, который применил к решению задач линейного про- граммирования метод эллипсоидов. Но метод Хачияна на практике уступал симплекс-методу. Однако вскоре появились новые методы, ко- торые во многих случаях оказались предпочтительнее симплекс-метода. Один из таких методов, получивших широкое распространение, стал метод, изобретенный индийским математиком Кармаркаром. Но потом выяснилось, что за много лет до работы Кармаркара ту же основную идею построения алгоритма, основанного на методе штрафа, выдвинул российский математик Дикин. Нет возможности здесь описать алго- ритм Кармаркара—Дикина (обо всех затронутых проблемах выпуклой оптимизации см. Шор [1989]). Алгоритмы решения задач классического вариационного исчисления и оптимального управления Одними из важнейших при решении задач вариационного исчисле- ния являются методы, редуцирующие задачу к конечномерной. Впервые такой метод применил, как было уже сказано, Лейбниц, заменивший искомую кривую ломаной. Затем эту же идею разрабатывал Эйлер (метод ломаных Эйлера). Метод Бубнова—Галеркина Необходимость решения задач вариационного исчисления, связан- ных с инженерными проблемами, стала особенно актуальной в начале века. Среди конкретных алгоритмов, реализующих идею редукции бес- конечномерной задачи к конечномерной, выделяется метод Ритца (1908), развитый Галеркиным (1915). Поясним суть методов Ритца и Галеркина на примере простейшей (вообще говоря — многомерной) задачи. Пусть требуется найти минимум функционала f L(t, x(t), £(<)) dt, при условии, что на границе области Q о функция х(-) принимает заданные значения. Для нахождения функ- ции близкой к минимальной, Ритц предложил рассматривать семейство функций, зависящих от нескольких параметров Ф(-,а), а — (а|,...,адг) такое, что при всех значениях параметра а граничные условия удовле- творяются. Галеркин, конкретизируя эту идею, для решения уравнения Эйлера рассматриваемой задачи, предлагал выбирать некоторое линейное пространство функций. Приведем пример применения метода Галеркина нахождения ми- нимума квадратичной задачи классического вариационного уравнения, приводящее к приближенному решению уравнения Штурма—Лиувилля.
§ 5. Приложения общей теории к решению конкретных задач 279 Рассмотрим задачу: 7 J (г()) = J (i2(i) - dt + 2/(t)x(t) dt -> min; о x(0) = x(T) = 0 (q > 0). Уравнение Эйлера в этой задаче — одно из самых популярных в матема- тике и ее приложениях — уравнение Штурма—Лиувилля: х + qx = f, х(0) = х(Т) = 0. Метод Галеркина (который конкретизировал идею Бубнова) состоит в том, что задавшись системой {6()}i=|, €*(•) € С* ([0, £]) линейно- независимых функций, удовлетворяющих нулевым условиям на концах, ищем решение, минимизирующее функцию многих переменных: tp(x) = ®*&()) > х = (*!,. •• >®п). Подставляя выражение жп() = £ ®*6() в минимизируемый интеграл, получаем: п п J(®п()) = У? + 2^2 fc=i где ак1 = а1к = /(&(06(0 ~ «(06(06(0) bk = f f(t)$k(t) dt. Задача о о свелась к конечномерной квадратичной задаче, которая обсуждалась выше. Упражнение. Вычислить по методу Галеркина приближенное решение рассматриваемой задачи при Т = q(t) = /(0= 1, rj(0 = £(l-0(ai+а20. § 5. Приложения общей теории к решению конкретных задач Математики прошлого столетия со страстным рвением отда- вались решению отдельных трудных задач. Я напомню только поставленную Иоганном Бернулли задачу о брахистохроне. Гильберт Следует поставить перед собой цель изыскать способ решения всех задач... одним и притом простым способом. Даламбер О роли отдельных задач в истории нашей науки замечательно сказал Гильберт в словах, приведенных нами выше (и при этом в качестве при- мера он привел задачу на экстремум!). Существует огромное число точно
280 Глава 6. Общая теория экстремальных задач решенных экстремальных задач — в классическом анализе, геометрии, алгебре... С точно решенными задачами на экстремум связаны имена многих крупнейших математиков всех времен. В этом параграфе приводится свыше сорока задач, поставленных и решенных в разные времена, начиная с классической изопериметри- ческой задачи, обсуждавшейся в IV веке до нашей эры (решение ее было предложено Зенодором) и кончая некоторыми задачами, ставшими актуальными в самые последние годы. Решения этих задач связаны с именами Архимеда, Евклида, Ферма, Кеплера, Ньютона, Лейбница, братьев Бернулли, Лагранжа, Эйлера, Чебышева, Бернштейна, Гильбер- та, Ландау, Адамара, Юнга, Блашке, Харди, Литтлвуда, Пойа, Надя, Колмогорова, Вейля и многих других. Нам представляется важным подчеркнуть, что все эти задачи (как и подавляющее большинство других, которые могут быть решены «явно») допускают решения, полученные по единому методу, обсуждавшемуся в этой части — методу Лагранжа. А именно, всюду можно поступать единообразно и «просто» (как, собственно, и рекомендовал поступать Даламбер). Сначала следует формализовать задачу, затем применять принцип Лагранжа, далее решать (или исследовать) получающиеся уравнения. В итоге находятся функции, подозреваемые на экстремум, и наконец (с помощью достаточных условий) следует доказывать, что получено именно решение задачи. Не все задачи решаются здесь с полной подробностью, во многих случаях мы просто ссылаемся на решения, детально разобранные в кни- гах [ИТ], [АТФ], [АГТ], [Т], [ГТ] или статье [МИ-Т], (а в ряде случаев — в первой части этой книги). Этот параграф книги не предназначен для легкого чтения. Почти каждая из предлагаемых задач — это отдельная тема, которая дале- ко не исчерпывается ее решением. Сами же решения могут служить комментарием к методу Лагранжа, к полезности изучения теории экс- тремума, к истории математики, и могут быть использованы на лекциях, семинарских занятиях, а также на занятиях различных математических кружков. Но вместе с тем большинство задач были в той или иной мере опробованы на семинарских занятиях или кружках (в частности, задачи 2, 6, 42 и 46 были предложены студентам для решения вместо сдачи экзамена, они справились с заданием, и их решения были использованы в этом параграфе), так что все задачи §5 интересны и доступны. Старинные задачи и их обобщения 1. Классическая нзопериметрическая задача Среди плоских кривых заданной длины найти кривую, охватывающую наибольшую площадь. Это — одна из стариннейших задач на экстремум. Считается, что ответ в этой задаче был известен Аристотелю (IV век до н. э.). Об истории
§ 5. Приложения общей теории к решению конкретных задач 281 этой задачи и различных решениях ее, не опирающихся на теорию экс- тремума, см. в книге [Т] (рассказ второй). Решение обобщенной задачи (так называемой задачи Чаплыгина) подробно изложено в книге (АТФ, с. 107-110). Как известно, начиная с IV в. до нашей эры, в классической изопериметрической задаче известен такой Ответ: решением задачи является круг. 2. Задача Архимеда Среди шаровых сегментов в R" с заданным объемом (или — в дву- мерном случае — заданной площадью) боковой поверхности найти сегмент наибольшего объема. При п = 3 эта задача была решена Архимедом (жившим в III в. до н. э.) в его сочинении «О шаре и цилиндре». Элементарное решение задачи Архимеда, основанное на идеях Архимеда см. в книге [Т, с. 31, 34]. Предлагаемое ниже решение n-мерного варианта задачи получено сту- дентом мех-мата МГУ В. Тимориным. Шаровой сегмент n-мерного шара в R” = {г = (о:^... ,хп) | х,; е R, 1 < г < п} зададим в сферических координатах системой неравенств ||г|| < R, хп Rsin0, где ||х|| — евклидова длина век- тора х, — у 0 С Тогда, как известно, объем этого сегмента равен <rn_tRnIn(0), а объем боковой поверхности этого сегмента равен (п - l)ffn_|Rn-’ 1П-2(0), где In(0) = f cosn<pd<p, ап — объем п-мерного в единичного шара. 1. Формализация: RnIn(0) —♦ max; Яп-1/п_2(0) = I. Это конечномерная гладкая задача. Решение ее существует и принцип Лагранжа применйм. 2. Принцип Лагранжа: £(R,0,A, — 1) = — RnIn(0) + XRn~'ln-2(0). Условие стационарности приводит к уравнениям: nRIn(0) = Х(п - l)In-2(0), R cos2 0 = А, откуда приходим к равенству (п - 1) cos2 01п-2(6) — п1п(0) (г). 3. Исследование. Если воспользоваться известной рекуррентной форму- лой 1п(еу= -sin 0 cos” 1 0 п - 1 —-— + —, п п получаем: sintfcos" 1 0 = (га - l)sin20Jn-2(0)- Это уравнение допускает очевидное решение 0=0. Других решений нет. Действительно, любое другое решение удовлетворяло бы равенству sin0/n_2(0) — в то время, как, воспользовавшись монотонностью синуса на отрезке у),
282 Глава 6. Общая теория экстремальных задач получаем: т ж In-iW) sin 0 = j cos"-2 <p sin в dip < J cos"-2 <psin <pd<p = -°S e t Еще надо проверить граничную точку в = — и убедиться, что объем шара меньше объема полушара той же боковой поверхности. В частности, если п = 3, то «из всех сферических сегментов, ограни- ченных равными поверхностями, наибольшим будет полушарие» (Архимед- Сочинения. М.: Физматлит, 1962). 3. Задача о брахистохроне и сходные с ней * В вертикальной плоскости даны две точки А и В. Определить путь AM В, спускаясь по которомупод влиянием силы тяжести, тело М, начав двигаться из точки А, дойдет до точки В в кратчайшее время» . Цитируется по статье И. Бернулли «Задача, к решению которой приглашаются математики», Acta Eruditorum, июнь 1696 г. Она обсужда- лась § 1 гл. 3. История этой задачи, ее формализация и решение «в духе Лейбница» читатель найдет в книгах [Т] (рассказ седьмой) и [АТФ, с. 113]. Обобщим несколько задачу И. Бернулли,> включив ее в однопараме- трическое семейство подобных задач. 1. Формализация: (в этой задаче и в задаче о наименьшей поверхности вращения мы пользуемся эйлеровскими обозначениями-а: вместо t и у вместо х): «2 Ja(y()) *= £уауЛ+у'2 dx min; y(^i) = Vi, i = O,l, а < 0, у(х) > 0. (3) Это — простейшие задачи классического вариационного Исчисления- Брахистохрона соответствует а = — при а = —1 — это задача о геодезических на полуплоскости Пуанкаре и т.п. 2. Принцип Лагранжа здесь сводится к уравнению Эйлера. Интегрант в (3) не содержит независимого переменного, следовательно, уравнение Эйлера имеет интеграл энергии: у~2а (1 + у12) = D2 3. Исследование. При отрицательных а интегрирование уравнения Эйле- ра приводит к семейству экстремалей: у = С sin71, х = С\ + Су I sin7 т dr, у — —. о
§ 5. Приложения общей теории к решению конкретных задач 283 3 случае брахистохроны экстремали — циклоиды, в случае полуплос- <ости Пуанкаре — полуокружности с центром на оси Ох. Экстремали, имеющие общую точку на оси Ох, образуют поле, покрывающее всю эткрытую верхнюю полуплоскость. Отсюда и из формулы Вейерштрасса зытекает, что единственная экстремаль, соединяющая граничные точки, является решением задачи. Ответ. В случае брахистохроны решение задачи доставляет един- ственная циклоида, проходящая через граничные точки; в случае по- гуплоскости Пуанкаре решение задачи — полуокружность с центром на оси Ох, проходящая через граничные точки. 4. Аэродинамическая задача Ньютона Найти «тело, получающееся вращением [...] кривой окало АВ, [ко- tiopoe] будет испытывать наименьшее сопротивление в [...] редкой среде греди других тел той же длины и ширины». (Цитируется по книге Ньютона «Математические начала натуральной философии»*.) 1. Формализация'. / 1 min’ ®(°) = °> x(T0) = xh i(t) > 0. (5) 1 + X (I) История этой задачи, ее формализация и решение, идейно восходящее к Нлотону, можно прочитать в кн иге [Т] (рассказ восьмой) а решение базирующееся на принципе Лагранжа, подробно изложено здесь в § 3 гл. 4 и в книге [АТФ, с. 99-103]. Хотелось бы сказать только, что задача (5) — типичная задача оптимального управления, ее крайне затруднительно исследовать методами классического вариационно го исчисления, и это обстоятельство являлось причиной того, что решение задачи Ньютона фактически нигде не приведено в учебниках по вариационному исчи- слению. Но она была решена Ньютоном, и решение было опубликовано в «Математических началах» в 1687 году! Так что первая задача оптимального управления была решена раньше рождения вариационного исчисления (годом рождения вариационного исчисления считается год брахистохроны — 1696). 5. Задача Ферма—Торичелли—Штейнера и ее обобщение Найти в п-мерном пространстве точку, сумма расстояний от которой до вершин некоторого симплекса минимальна. 1. Формализация'. п-И /ОО = 521® - min. (5) t=i ’ См.: Крылов А. Н. Собрание трудов, т. 7. М.—Л.: Изд. АН СССР, 1936.
284 Глава 6. Общая теория экстремальных задач Решение £ задачи (5), очевидно, существует. Это — выпуклая задача без ограничений и потому 2. Принцип Лагранжа выражается здесь теоремой Ферма: О G df(£). (t) 3. Исследование. Соотношение (t) (если допустить, что решение — внутренняя точка симплекса) расшифровывается так: сумма единичных векторов, смотрящих из точки х в вершины симплекса, равна нулю. Отсюда при п - 1 сразу следует у2лы между векторами, ведущими из решения задачи к вершинам, равны 120°. Точка внутри треугольника, из которой каждая сторона видна под углом 120° легко строится циркулем и линейкой и называется точкой Торичелли. Если построение невозможно, искомая точка — вер- шина тупого угла (что также сразу следует из теоремы Ферма). Подробнее задача обсуждается [ИТ, с.441[. и [АГТ, №4.12]. При п 3 такого рода построения неизвестны. Но численно решение может быть найдено для очень большого числа неизвестных. Однако, и в многомерном случае можно найти интересные явно решаемые варианты этой задачи. Например, найти точку в R" , сумма расстояний от которой до начала координат и векторов ej = (1,0, ...,0), — (0,1,..., 0) еп = (0,0,..., I) была минимальной. 6. Задача о минимальной поверхности вращения Среди кривых в верхней полуплоскости, соединяющих две различные точки, найти такую, которая при вращении вокруг горизонтальной оси порождает поверхность минимальной площади. Эта задача и различные ее модификации обсуждаются, начиная с XVII века, вплоть до нашего времени. Она связана с именами Лейбница, братьев Бернулли, Лагранжа и многих других. Эта задача присутствует почти во всех учебниках по вариационному исчислению, но редко, где решение доводится до конца. Мы здесь даем некоторые указания, по которым читатель сможет полностью исследовать эту задачу. 1. Формализация. Рассмотрим частный случай общей задачи — с симме- тричными краевыми условиями: *0 J У\/1 +yadx -> min; у(-х0) = у(х0) # 0, у(х) 0. (6) -Z0 Это — простейшая задача классического вариационного исчисления. 2. Принцип Лагранжа приводит к уравнению Эйлера. Ввиду того, что интегрант не зависит от независимого переменного, уравнение Эйлера
§ 5. Приложения общей теории к решению конкретных задач 285 допускает интеграл энергии: — dx D^'1 у(ху — D~' ch(Dx + Dt). V&y2 - I Мы видим, что эти экстремали — цепные линии. 3. Исследование. Все экстремали, соединяющие симметричные точки (тогда Di = 0), получаются из экстремали у = ch х гомотетией. Поэтому в совокупности они заполняют только угол, а не всю полуплоскость. Параметры этого угла находятся из решения уравнения х = cotha:, откуда получается, что tgpo = 1.50088... . Внутри угла экстремали покрывают его двукратно: существуют две экстремали, соединяющие точки (-г0,у0) и (хо,уа). При этом одна из экстремалей идет ниже другой и касается прямой у = tg^o®, т.е. эта прямая является огибающей семейства нижних экстремалей. Из общей теории следует тогда, что на нижней экстремали не удовлетворяется условие Якоби. А верхняя экстремаль доставляет сильный (локальный) минимум (все достаточные условия сильного минимума удовлетворя- ются). Помимо экстремалей, расположенных внутри угла, существуют «ло- маные»экстремали, состоящие из вертикальных отрезков и отрезка |®1 хо,у — 0. Это можно получить методом принудительного ограни- чения, когда в дополнение к условиям задачи добавляется ограничение |j/'| < N и N устремляется к оо. Таким образом, граничные точки (±хо,у) можно соединить либо одной «ломаной» экстремалью, либо двумя — «ломаной» и верхней цепной линией. Если сравнить значения на этих двух экстремалях, то оказывается, что они совпадают на прямой, угловой коэффициент, tgyi которой равен 1.89502... . Отсюда (с помощью формулы Вейерштрасса) получаем такой Ответ: если 22 > tg<p, решением является верхняя цепная линия, если же tg , то «ломаная экстремаль». (Некоторые дополнительные подробности см. в [ИТ, с. 427-430J.) 7. Задачи Кеплера Вписать в единичный шар а) цилиндр, Ь) конус, с) пирамиду, d) прямо- угольный параллелепипед максимального объема. Занимательная история постановки задач Кеплера и их решение см. в книге [Т[ (рассказ шестой). Это — более простые задачи в сравнении с предыдущими. Ограни- чимся лишь формализацией задачи о цилиндре. 1. Формализация: f0(x) — х\/1 - х2 —» min; 0 < х 1. (7)
286 Глава 6. Общая теория экстремальных задач Это фактически гладкая задача без ограничений. Читатель самостоятель- но может обдумать и n-мерные варианты всех этих задач. 8. Задача Герона и ее обобщение Даны две точки А и В по одну сторону от прямой I. Требуется найти на I такую точку D, чтобы сумма расстояний от А до D и от D до В была наименьшей. 1. Формализация: fo(x) — у/a2 +х2 + y^b2 + (d- х)2, (8) где координаты точек таковы: А — (0, а), В = (b,d). Это — про- стейшая одномерная задача без ограничений. Ее решение совершенно элементарно (см. ]Т|). Читатель может самостоятельно поставить и решить аналогичные за- дачи, скажем, заменив прямую на плоскости окружностью, плоскость — сферой (с поиском кратчайших путей с заходом на окружность большого круга), или плоскостью Лобачевского и т. п. 9. Задача Снеллиуса—Ферма о законе преломления света на границе двух сред Согласно принципу Ферма в геометрической оптике «в неоднородной среде свет избирает такую траекторию, вдоль которой время, затрачи- ваемое им на преодоление пути от одной точки до другой, минимально.» Таким образом, для установления закона Снеллиуса преломления света на прямолинейной границе двух однородных сред сводится к решению задачи Мх} = + w «I «2 С решением этой задачи, помимо Снеллиуса и Ферма, связаны имена Декарта и Лейбница — см. об этом в книге [Т] (рассказ третий). 10. Задача Аполлония Сколько нормалей можно провести из точки на плоскости к эллипсу? Иначе говоря, требуется определить число стационарных точек в задаче («1-^i)2 + (®2-6)2 —min; (^) + (~^) = L (Ю) Решение этой задачи приведено в §3 гл. 1. Об истории этой задачи см. в книге [Т, с. 130].
§ 5. Приложения общей теории к решению конкретных задач 287 Избранные задачи геометрии В геометрии было решено множество замечательных экстремальных задач. В книге [Т] приведено несколько задач элементарной геометрии. Здесь приводятся пять задач, связанных с именами Грамма, Адамара, Юнга и Бляшке и еще одна задача понадобившаяся для построения алгоритма выпуклой оптимизации. 11. Задача о кратчайшем расстоянии от точки до подпространства в гильбертовом пространстве Найти расстояние в гильбертовом пространстве от точки х° до линейной оболочки векторов {х(,..., х"}. 1. Формализация', п Пае0 - 52&а:*||2 -» min. (11) *=i Это — гладкая выпуклая (даже квадратичная) задача без ограничений. Решение ее см. в [АГТ, с. 221]. Ответ выражается через определитель Грамма. 12. Неравенство Адамара Пусть X = (a^)"J=| произвольная квадратная матрица порядка п. Имеет место неравенство'. (detX)2 П"=) (^(з^)2} 1. Формализация-. D(x',... ,хп) — detX —» min; ||а?(| = 1, 1 j п. (12) Это — гладкая задача математического программирования. Применение принципа Лагранжа приводит к цели (см. [ИТ, с. 444]). 13. Неравенство Юнга Для выпуклого компакта А С Rn доказать неравенство D(A) у/2{п + l)/nR(A), где D(A) — диаметр, a R(A) — радиус А. Проблема Юнга редуцируется к задаче на симплексах после решения следующей задачи (о чебышевском центре). 1. Формализация-. max ||а: - у|| —» min. (13) Это — выпуклая задача без ограничений, к которой применима теорема об очистке, и это редуцирует задачу к симплициальной. Симплици- альную задачу тоже нетрудно решить методом Лагранжа, но проще — непосредственное решение (см. [ИТ, с. 431-434]).
288 Глава 6. Общая теория экстремальных задач 14. Неравенство Бляшке Для выпуклого компакта А С R” доказать неравенство г(А) /3nh(A), где т(А) — наибольший радиус вписанного шара, h(A) — ширина А,а д n = 2fc, fceN, n = 2fc - 1, fc€N. Задача Бляшке редуцируется к задаче Юнга переходом к полярам. 15. Задача о центре тяжести Доказать, что через любую точку, лежащую внутри п-мерного тела, можно провести гиперплоскость так, чтоб эта точка оказалась центром тяжести сечения. 1. Формализация. Пусть заданная точка тела А — начало координат и V(w), о> £ S" — объем пересечения тела А с полупространством, ограниченным гиперплоскостью, перпендикулярной ш, проходящей че- рез начало координат. Следует рассмотреть задачу V(w) —* min; ш € Sn. (15) Анализ ее приводит к решению задачи (см. [АГТ, с. 229-230]). Задачи технического содержания 16. Задача Годдарда Как следует управлять ракетой, чтобы она в фиксированный момент времени достигла заданной точки с заданной скоростью, израсходовав минимум топлива. 1. Формализация-. «I J [uldt—> min; x = u+g, x(i,) = ж,, i(<,) = v,, г = 0,1. (16) *0 (Формализация задачи проведена в [ГТ].) Задача (16) — линейная по фазовым переменным. К ней применим метод двойственности. Подробности в книге [ГТ, с. 160-162]. 17. Задача о мягкой посадке Космический аппарат движется по прямолинейной траектории, пер- пендикулярной поверхности небесного тела. Требуется мягко посадить аппарат, затронув минимум топлива. 1. Формализация: то — т(Т) —> max; х = — - 7, т = -и, т х(0) = 6 > 0, ±(0) — &, т(0) = то,
§ 5. Приложения общей теории к решению конкретных задач 289 xt(T) = х(Т) = 0, (17) (По поводу формализации см. [ГТ].) Задача (17) относится к оптималь- ному управлению. Ее решение методом Лагранжа см. в [ГТ, с. 157—160]. 18. Задача о стрельбе 1. Формализация: J x/y + h\/\ +yadx —► min; 3/(0) = 0, у(х\) - У\ > -h. о Это — задача классического вариационного исчисления. Подробности ее решения см. в учебнике [А]. 19. Задача об оптимальном возбуждении осциллятора Найти оптимальный закон возбуждения жесткости осциллятора, при котором его энергия достигнет заданной величины за минимальное время. 1. Формализация: Т —> min; х + (1 - еи)х = 0, х(0) = х0, х(О) = уо, х(Т)2 + х(Т)2 = 1, O^u^l, 0 < £ < 1. (19) Формализация задачи и ее подробное исследование см. в [ИТ, с. 435-439]. 20. Задача быстродействия со смешанным критерием 1. Формализация: То У^(1 + е/(®)) dt —» min; о |i| < 1, х(0) = аг0. £(0) — «о, ®(Т) = х(Т) = 0, е > 0, (20) / — четная функция. Решение простейщей задачи о быстродействии (когда в (20) е = 0) изложено в первой части (§3 гл.4). В общем случае решение см. в [АГТ, с. 281]. Классические неравенства Точные неравенства всегда связаны с решением задач на экстремум, и потому они — замечательный полигон для общей теории. 10 Зак. 60
290 Глава 6. Общая теория экстремальных задач 21. Доказать неравенство Коши: (S^fcl/fc) (52 (52 У*) • 1. Формализация-, п п -» min; 52 1. (21) i=l *=1 Это — гладкая задача математического программирования. Существование имеет место из-за принципа компактности. Приме- нение принципа Лагранжа немедленно приводит к цели. В задачах 22-25 дело обстоит аналогично, и мы ограничиваемся лишь формализацией. 22. Доказать неравенство между средним арифметическим и средним п геометрическим: (П^хь)1'" < п-1 52 > ®» *=1 1. Формализация: п П"=1х, —» max; 52 х* = ’> х‘ (22) »=1 (Решение этой задачи см. в [ИТ, с. 445, 446]). 23. Доказать обобщенное неравенство между средним арифметическим п и средним геометрическим: < 22 <*k®k> а* > О, *=1 = 1, ж* 0. 1. Формализация: nj=l®k‘-» max; 52а*х*“1> ^ °- (23) *=i / « Х1/Г 24. Доказать неравенство для степенных ST(x): = ( 52 l®fcK ) > г G R: при 0 < р С 9 < Sq(x) Sp(x). 1. Формализация: ST(x) —» max; Sp(x) — 1. (24) 25. Доказать неравенство для средних степенных <rT(x): = (J2 |®*Г/п),/г, г G R: при 0 < р < q оо, к=1 <7Р(Х) <Т,(Х). 1. Формализация: <гт(х) —> max; ар(х) = 1. (25) Решение задачи см. в [АГТ], задача 2.67.
§ 5. Приложения общей теории к решению конкретных задач 291 26. Доказать неравенства Вельдера и Минковского: п / n \i/p / п «»\ i/р* । 1 a) 521 <Р<°°. ^ + 7 = !• 27. Доказать обобщенное неравенство Гельдера: если X — нормированное пространство, У = X* — сопряжен- ное пространство и р() — непрерывная сублинейная функция, то (х,у) < Р(х)рдр(.У) Vx € X, у € Y. (рА — функция Минковского множества А, др — субдифференциал р). Решение см. [МИ-Т, с. 101]. Г х1 г 2 28. Доказать неравенство Пмьберта.* / — dt 4 J х dt R+ R + 1. Формализация-. J ^|х|2 - j j | dt -» min; x(0) = 0. (28) R+ Решение см. в [ATT, с. 278]. В следующей задаче рассмотрено обобщение этого неравенства. 29. Доказать обобщенное неравенство Харди: /хр /р — 1\р Г „ -dt^l----------) xpdt, tP \ р / J R+ R+ 1. Формализация: J ^|х|р - |^|Р^ dt —> min; х(0) = 0. (29) R+ 2. Принцип Лагранжа приводит к уравнению Эйлера ^(|x(p-lsgnx) + И*“'sen* = °- 3. Исследование. Ищем решение в виде y>(t) = t“, и получаем, что а — Е^-. Основная формула Вейерштрасса приводит тогда к тождеству (опять- таки, доказываемому непосредственным интегрированием по частям) - (?-г Г11Г)л ««• Rt R. где £ — функция Вейерштрасса, подробнее см. [АТТ, с. 279]. 10*
292 Глава 6. Обпит теория экстремальных задач 30. Доказать неравенство Вейля (принцип неопределенности): К(Т) t2x2dt / x2dt, T = R, R+, K(R)=4, K(R) = 2. 1. Формализация: J x2(t) dt -> min; J(t2 - 1)ж2(0 dt = 1. (30) R+ R+ 2. Принцип Лагранжа, примененный к данной изопериметрической за- даче, приводит к уравнению Эйлера х + А(1 — t2)x = 0 и условию трансверсальности £(0) - 0. 3. Исследование. Уравнение Эйлера допускает решение <p(t) — Вх ехр(—At2), А > 0, которое принадлежит рассматриваемому классу и удовлетворяет условию трансверсальности, что позволяет, базируясь на основной формуле Вейерштрасса, выписать следующее тождество: J(x2(t) + (t2 - l)x2(t)) dt = У dt = f & + tx)2dt^O. (i) R, R, R|. Справедливость этого неравенства мгновенно получается интегрировани- ем по частям. Подставив теперь вместо x(t) выражение приходим к неравенству У y2(r)dT — a2 j y\r)dT + a4 J т2у2(т)Ат^0 Va, Rt R+ R„ и применив условие неотрицательности квадратного трехчлена, приходим к нужному неравенству. Экстремальные свойства полиномов 31. Доказать критерий Чебышева об альтернансе: для того, чтобы алгебраический полином степени п был полиномом наи- меньшего уклонения (в равномерной метрике) для функции непрерывной на конечном отрезке, необходимо и достаточно, чтобы разность функции и полинома принимала, чередуя знаки, свои минимальные и максимальные значения (одинаковые по модулю) в п+ 2 точках. Доказательство. Существование решения £() следует из принципа компактности.
§ 5. Приложения общей теории к решению конкретных задач 293 1. Формализация. Положим F(t,x()) — \y(t) — sc(t)|, t € [а,Ь], x(-) € Pn. Задача формализуется так: /(х()): = maxF(t,x( •)) — min, (г) <€[а,Ь| (i) — выпуклая конечномерная задача без ограничений. Критерий минимума в ней — 2. Теорема Ферма'. О G 5/(i(-)). 3. Исследование. Согласно теореме об очистке найдутся г < п + 2, точки а С Т| < ... < тт Ь, неотрицательные числа а, в сумме равные единице и векторы у, G 52г’1(.)(т;,г( )) такие, что Р(т{,£(-)) = max \y(t) - 1 < г < r, У а,у; = 0. (it). 1=| Но функция x(•) —► F(t{,x(-)) = |y(r,) - очевидно, дифференци- руема в точке £() и ЭРх(.}(ть£())=Р'(т,,£()), (^'(т{,£()),х()^ = ~sgn(y(Ti) - f (т,))а:(т„). Из (и) и (Hi) получаем тождество Г У^ otiSgn(y(Tj) - x(Ti))x(Ti) = О Wx( ) € Рп. (iv) t=l Если допустить, что г < п + 2, то подставив в (iv) полином &(£) = г П (t — Tj), получим, что а, = 0 для всех г, что противоречит тому, что их сумма равна единице. А при г = п + 2 подставим в (iv) полином Лагранжа &(•), принимающий значение нуль во всех точках Tj, кроме j — i, где он равен единице (1 < j < п + 1), и получим a,sgn(y(r,) - £(т,)) = -an+2sgn(y(Tn+2) - А(тп+2))<,(т„+2). Но числа &(тп+2), как легко понять, альтернируют, т.е. альтернируют и у(т{) — х(ъ). См. также [МИ-Т, с. 96J. 32. Полиномы, наименее уклоняющиеся от нуля в £р([—1,1]), р = 1,2,оо. Полином Тпр( ) = Уп( )~^( ), где yn(0 = i”, а £() — решение задачи НУп( ) - ®(-)11м-1.Н) -min; ®( )€7’п_| (32) называется полиномам наименее уклоняющимся от нуля в Zp([-1,1]). Доказать следующие формулы:
294 (A) (В) (С) Глава 6. Общая теория экстремальных задач Tnoo(i) = 2-<n-,)cosnarccost, пу f,\ ~-narcsin(n + l)arccos< Tn 1- 2 тйт * ТП2(0 = ~ О” (формула Родрига). Доказательство. Функция Тпж,( ) — многочлен степени п со стар- шим коэффиентом единица, имеющий n+ 1 -альтернанс. По теореме Чебышева об альтернансе он наименее уклоняется от нуля. Остались случаи р = 1 и 2. Решим их. 1. Формализация'. fnP(x) = у |f* - 5? xktk ' |Р<Й min • (») Это выпуклые (и гладкие даже при р = 1) задачи без ограничений. 2. Критерий решения — теорема Ферма'. fnp&) = 0. (И) 3. Исследование. При р — 1, дифференцируя /п)() и приравнивая производную нулю, получаем, что £() является решением задачи тогда и только тогда, когда । Г sgn(t" -£(t))tkdt = 0, 0^Л^п-1. («') Проверим, что Т„|( ) с одной стороны — полином степени п со старшим коэффициентом, равным единице, а с другой, что он удовлетворя- ет соотношению («'). Полином Tni() равен, очевидно, полиному (п + 1)-1Тп+1оо( ), откуда вытекает первое утверждение, и кроме того, I Ж Js%nTn\(t)tkdt *~¥?Т -2-1 fsgnsin(n + l)TCoskrsinr<tt = 0, — I —ж если 0 k п - 1, ибо разложение в ряд Фурье функции sgnsin(n + 1)т начинается с asin(n + 1)т в то время, как cos* т sin т при 0 к < n— I — тригонометрический полином степени п. Соотношение (и') доказано. Значит, Тп|() — полином наименее уклоняющийся от нуля при р = 1. Аналогично при р = 2, дифференцируя функцию /„2() получаем, что £() является решением задачи при р = 2 тогда и только тогда, когда -I OO^n - 1. («")
§ 5. Приложения общей теории к решению конкретных задач 295 Очевидно, что полином Тп2(), построенный по формуле Родрига, является полиномом степени п со старшим коэффициентом, равным единице. Остается проверить лишь, что этот полином удовлетворяет (»*"). Действительно, । । f Tn2(t)tk dt - f ^-(t2 J J dt -I -i 1)П?Л = 4 J(t2-l)n^;tkdt = O -I для 0 к n - 1. Итак, Tn2() — полином наименее уклоняющийся от нуля при р = 2. 33. Решить задачу Чебышева об экстраполяции*. доказать, что среди всех полиномов степени п, по норме в метрике С([— 1,1]) не превосходящих единицы, наибольшее значение в точке т > 1 принимает полином Чебышева Тп(t) = cosnarccost, а наименьшее — полином (—l)Tn(-). 1. Формализация (задачи минимизации): ж(т)—»min; ||ш(-)||с(Н,Ц) < 1, х( )еРп, (33) Задача (33) относится к числу выпуклых экстремальных задач. Решение £() в ней существует в силу принципа компактности (ибо множество полиномов, ограниченных по норме С([—1,1]) компактно в пространстве С([-1,1])). 2. Принцип Лагранжа. Применим к задаче (33) принцип Лагранжа (т.е. теорему Куна— Таккера; при этом условие Слейтера здесь выполнено). Согласно этому принципу, найдется множитель Лагранжа А > 0 такой, что соответству- ющая ему функция £(х(),А, 1) = х(т) 4- A max |х(*)| достигает в &() глобального минимума. Отсюда, из теоремы Ферма и формулы Моро- Рокафеллера вытекает включение: О € д£г(.} (£(), А, 1). (») Применяя далее теорему об очистке и теорему Каратеодори из конеч- номерной выпуклой геометрии (согласно которой элемент конической оболочки множества из Rm представим, как коническая оболочка не бо- лее, чем m элементов этого множества), заключаем, что существуют натуральное число 1 г < n + 1, г точек -1 $ Т| < т2 < ... < тт 1 Г и чисел {а, > 0}-=1, 52 а< = 1 такие, что имеют место следующие 1=1 соотношения (подробнее см. ]МИ-Т, с. 108]): х(т) + Х^2^явп£(т()х(т{) = 0 Vx( ) € Р„, (й) 1=1
296 Глава 6. Общая теория экстремальных задач Щт>)| = 1 (»=1,...,г). (Ш) Соотношение (И) назовем основным тождеством. 3. Исследование. Покажем, что г = п + 1. Предположим, что г п. Тогда подставив в (й) полином Xo(t) = fj(t - Tj), приходим к противоречию с (й) (ибо xq(t) 0). Значит, >=1 г = п + 1 и решение совпадает либо с Тп(-), либо с -Тп(-). 34. Доказать неравенство Бернштейна: Для любого тригонометрического полинома х() степени п имеет место неравенство l|i(')llc([-%,x|) «S п||я:(-)||с([-ж,Гр- Неравенство точное и достигается на функциях Asin(n • +7). Ввиду инвариантности задачи относительно сдвига возможна такая 1. Формализация. /о(®()) =*(0) -+ min; /i(a:( )) = max F(t,a:(-)) < 1, ie[-r,r] F(t, □:(•)) =Щ01, х(-)€Тп, где Тп — пространство тригонометрических полиномов степени п. 2. Принцип Лагранжа приводит к соотношению о еа(/о(4())+АЛ (£(-))). 3. Исследование. Здесь мы фактически повторяем рассуждения предыду- щего пункта. Применение теоремы об очистке к функции F(t,x( )) — х( ) € Тп приводит к основному тождеству: i(0) + Л^2 akS&n£(Tk)x(Tk) = 0, Vi( ) е Тп, (i) t=l где £(•) — экстремальный полином, А > 0, ак > 0, г < 2n + 2, |4(rt)| = 1, 22 at = 1. Аналогично тому, как это было проделано при исследова- нии задачи об экстраполяции, показывается, что г должно быть равно 2п и значит, экстремальный полином у( ) =: £(•) имеет 2п различных точек, где он достигает своего максимума и минимума по модулю равных единице. Значит, полиномы (у')2 и 1 — у2 степени 2п имеют одинаковые нули в числе 4п, откуда следует, что они пропорциональны. Коэффициент пропорциональности находится из приравнивания стар- ших членов. В итоге приходим к уравнению у'2 — п2(1 - у2), решая которое находим искомый полином: £(t) = - sinnt, откуда немедленно следует неравенство Бернштейна. См. также [МИ-Т, с. 109].
§ 5. Приложения общей теории к решению конкретных задач 297 Задачи о неравенствах для производных Под неравенствами для производных традиционно понимают муль- типликативные неравенства вида ll*(i)( )llMT) *11*0112,(О (где 0 < к < п — целые, 1 < р, q, г < оо, а,/3 О, Т — R или R+), справедливые для всех функций х( ) € Lp(T), у которых (п — 1)-ая производная локально абсолютно непрерывна на Т и х^(-) € Lr(T). Пространство таких функций будем обозначать через Wpr(T) или просто Wp(T), если р = г. При фиксированном Т неравенство (1) зависит от пяти параметров: п, к, р, q и г (величины а и р однозначно ими определяются: а ~ ~ 1 ~ а)- Точную (т.е. наименьшую возможную) константу в этом неравенстве будем обозначать через Кт(п, к,р, q, г). Рассматриваемая задача равносильна следующей: Ollier) - max; ||а:(-)||МГ) < 1, l|z(n>(-)lk(T) < 1 (Рп^,ч,г) Предлагаемые ниже задачи 36-45 представляют собой весьма со- держательные упражнения на применение принципа Лагранжа. Все они подробно разобраны в статье [МИ-Т1], а частично — в [МИ-Т]. 36. Доказать неравенство Э. Ландау: ll*llc‘(R+) < 2||x(-)llg2(R+)l|i(-)llSRt) (с этого неравенства началась вся проблематика). См. [МИ-Т, с. 124]. 37. Доказать неравенство Харди—Литтлвуда—Полна: l|i||WR)<l^(-)llSR)l|i()llSR)- Обобщение этой задачи см. в [МИ-Т1, с. 80]. 38. Доказать неравенство Харди—Литтлвуда—Полна: Решение этой задачи содержится в книге [ХЛП, с. 225-232], решение методом Лагранжа см. в [МИ-Т1, с. 90]. 39. Решить задачу (Р102002) (Надь, Габушин). Решение см. [МИ-Т1, с. 86].
298 Глава 6. Общая теория экстремальных задач 40. Решить задачу (P\flj>,<x,r)- (Надь) 1. Формализация. х(0) —> min; J |a:(t)|pd£ < 1, J" |i(t)|rdt < 1. (i) R+ R, Это изопериметрическая задача классического вариационного исчисле- ния и задача выпуклого программирования одновременно. 2. Принцип Лагранжа приводит к канонической системе 0 = А|я:|р_| sgnas, х — м1^Г sgn^>. (ti) 3. Исследование. Система (it) имеет интеграл (интеграл энергии) с кон- стантой, равной нулю (ибо на бесконечности х и х стремятся к нулю): a|i|r + b|x|p = 0 => х = —Ax?It. (ti) Интегрируя (it), получаем три типа решений: — при р = г: x(t,C, а) = Cexp(-at), — при р > г: i(t, С, а) = C(t + а)г^г-р\ — при р < г: £(t, С, а) = C(t —a)r^r~f^ при 0 t a, £(t, С, а) = 0 при t > а. Вычисляя параметры из изопериметрических условий ||а:( )||л,(к+) = ||i(-)lli,(R+) = 1 > приходим к ответу (ибо в выпуклых задачах невырожден- ные необходимые условия являются достаточными): К?(0,1,р,оо,г) = (2±<)г7(р+>-') См. также [МИ-Т, с. 114, 115]. 41. Решить задачу (Рз,*,® оо г) > fc = 0,1 (Арестов). Решение, см. в [МИ- Т1, с. 101-102], [МИ-Т, с. 124]. 42. Решить задачу (Рглдоо.со) > fc = 0,1 (Фуллер). 1. Формализация (для к = 0): J |i(t)|2 dt —> min, ж(0) = 1, х = у, у = и, |u(t)| 1 п. в. (i) r+ 2. Принцип Лагранжа. Функция Лагранжа задачи (i) имеет вид: £ = J (^x2(t)+q(t)(x(t)-y(t))+p(t)(y(t)-u(t))\ Л + д(х(0)-1).
§ 5. Приложения общей теории к решению конкретных задач 299 Это, с одной стороны, задача выпуклого программирования, а с дру- гой — оптимального управления. Пусть £() — решение задачи (г). Условие стационарности приводит к следующему тождеству: J(i(t)x(t) + q(x - у) + ру) dt + р(х(0) - 1) = О, R+ а принцип минимума к равенству £(t) = sgn^(t). Интегрируя тождество по частям, приходим к соотношениям £(0 = Р(°) = °- («) Из этих соотношений вытекает интеграл энергии'. + -у2 = М01- («') Кроме того, мы приходим к следующему основному тождеству: ~p(0)x(Qi) + J (£(t)x(t) + p(t)x(t)) dt = 0. (tit) R+ В том, что из (И) следует (iii) тривиально проверяется непосред- ственно. 3. Исследование. Для решения задачи достаточно построить пару (£(•), р()), удовле- творяющую (it). Действительно, если такая пара построена, то тогда из (tit) последует точное неравенство (для г(0) = 1, |aj(t)| < 1): / \ / \1/2 (т. к. согласно (iii) | р(0) - f |£(t)| dt ) = I / A2 dt I ). \ R, / \R+ / Для построения пары (2(0>1p(0) используем автомодельность этой задачи, т.е. инвариантность уравнений (ii) относительно преобразова- ний: А •-> («*(•)»Ра(-)), ®а(0 = А2х(~), Ра(0 = **₽({) Обозначим
300 Глава 6. Общая теория экстремальных задач 4(0) = -а, а > 0, тогда из (»*') последует р(0) = Получаем, что для малых t наши функции выражаются следующими формулами: t2 t t2 t3 f4 i(0=7T-«i+l. P(O = 7- - у +a- - —. 2 2a 2 6 24 Пусть T — T(a) — первый положительный нуль функции р(). Из опи- санной инвариантности и единственности решения (следующей из стро- гой выпуклости функционала) должно последовать, что х(Т)=(Л(Г)У'х^\А(Т)\1 + т), р(Т) = -(f(T))’2p(x/|f(T)|Z + т), откуда немедленно вытекает равенство = —а-2. Таким образом, для определения двух неизвестных а и Т имеются два уравнения: //Т12 х -a2(y-aT+l) = (Т—a)2, (tv) т т* т4 f(a) —----------1- а—----=0. (v) ' 2а 2 6 24 ' Из квадратного по Т уравнения (tv) получаем: Т = a • Таким образом, a > V'l, причем р(>/2) = 4(>/2) = 4(V,2) = 0. При этом легкий подсчет показывает, что /'(\/2) = —оо, и /(а) —» оо при а —» оо. Отсюда следует, что уравнение /(а) = 0 имеет положительный корень а. Это и завершает построение пары ($(£), р(0) на отрезке [0,Т(а)], а значит, из-за автомодельности задачи можно достроить решение на всей полупрямой. Оно оказывается финитным и склеенным из счетного числа парабол. Величина а легко считается приближенно и оказывается равной (с точностью до одной десятитысячной) 1.4997. (Оно находится и «явно»: а4 = 3+34'/33 -) Таким образом имеет место Теорема (решения задачи Фуллера для р — 2, г = 0). Имеет место неравенство где К = К(2,0,2, оо, 00, К+) = sI/s<3+3^32-'.<> = 1.69659.... (См. [МИ-Т, с. 117-121].) 43. Решить задачу (х2 4- i2) dt —» min; г(0) = 1. (43) R
§6. Заключительные замечания 301 (Решение этой задачи равносильно решению задачи (Рт,*,2,00,2), к - 0.) Ответ: £(t) = e“‘/'^cos § 6. Заключительные замечания Как было сказано вначале, вторая часть была написана на основе по- лугодового обязательного курса, прочитанного Тихомировым на механи- ко-математическом факультете МГУ. Несколько слов об «архитектуре» курса и этой части книги. В начале курса речь шла о базе, о «предварительных сведениях». Основная же часть курса делилась на пять частей: необходимые условия, достаточные условия, существование решений, алгоритмы, и решения задач. В этой главе книги «базовой» части мы не уделили внимания, ибо в курсе, хотя и несколько по-другому, но по сути дела излагалось содержание § 5 гл. 1. В курсе была охвачена значительная часть теории, касающейся необходимых условий экстремума, которая строилась на протяжении более, чем трех с половиной веков (с того момента, когда Ферма в 1629 году впервые получил общий прием решения задач на экстремум и кончая фактически нашим временем). Эта часть курса (с некоторым превышением) отражена в § 1 этой главы. Читатель может провести срав- нение содержащегося в этом параграфе соответствующим материалом, изложенным в учебниках [А], [Б], [ГФ], [Я]. Тем более важно обозначить те задачи, которые находятся за гранью описанной теории. Мы, в основном, рассматривали задачи вариацион- ного исчисления и оптимального управления в одномерном случае (когда переменное t одномерно). Одной из наиболее важных проблем теории экстремума представля- ется нам доведение теории многомерных задач (где незавимое переменное многомерно) вариационного исчисления и оптимального управления до того уровня, которого достигла одномерная теория. (О состоянии многомерной теории можно получить представление по книгам [Мог] и [К1].) Естественно начинать думать и над вариационным исчислени- ем в бесконечномерном случае — хотя бы на уровне условий первого порядка (скажем, в задачах об оптимальных диффеоморфизмах и т.п.). Но и в одномерной теории остаются нерешенные проблемы, напри- мер, те, которых мы коснулись, когда обсуждали неравенства для произ- водных — проблемы, когда функционалы определены на некомпактных множествах типа прямой или полупрямой. Кроме того, хотелось бы построить теорию, позволяющую алгоритмически действовать и в тех случаях, когда решения нет. В части достаточных условий в курсе излагался традиционный ма- териал, содержащийся в первой части книги. В §2 этой главы сделаны начальные попытки взглянуть на проблематику более широко. Размеры
302 Глава 6. Общая теория экстремальных задач книги не позволили сделать это подробнее. Предполагается специальное издание, в котором будут освещены проблемы возмущений экстремаль- ных задач, достаточных условий и симплектической геометрии. Материал §§3 и 4 (существование и алгоритмы) примерно соответствует тому, что было прочитано на курсе. Материал §5 (решение задач) отрабаты- вался на разного рода математических кружках, семинарах по курсам оптимизации и специальных семинарах.
Список литературы к части II [А] Ахиезер Н. И. Вариационное исчисление. Харьков: Изд. ХГУ, 1981. [АГТ] Алексеев В.М., Галеев Э.М., Тихомиров В. М. Сборник задач по оптимизации. М.: Наука, 1984. [АТФ] Алексеев В. М., Тихомиров В.М., Фомин С. В. Оптимальное упра- вление. М.: Наука, 1979. [Б] Блисс Г. А. Лекции по вариационному исчислению. Л.: Иностран- ная литература, 1950. [В] Васильев Ф. П. Численные матоды теории экстремальных задач. М.: Наука, 1980. [ГТ] Галеев Э. М., Тихомиров В. М. Краткий курс теории экстремальных задач. М.: МГУ, 1989. [ГФ] Гельфанд И. М., Фомин С. В. Вариационное исчисление. М.: Физ- матгиз, 1961. [ИТ] Иоффе А.Д., Тихомиров В. М. Теория экстремальных задач. М.: Наука, 1974. [МИ-Т] Магарил-Ильяев Г. Г., Тихомиров В. М. Выпуклый анализ и его приложения. М.: Эдиториал УРСС, 2000. Матем. сборник. Т. 188, № 12, 1997. [МИ-Т1] Магарил-Ильяев Г. Г., Тихомиров В. М. О неравенствах для про- изводных колмогоровского типа. Матем. сборник. Т. 188, № 12, 1997. [Пол] Поляк Б. Т. Введение в оптимизацию. М.: Наука, 1983. [Пон] Понтрягин Л. С. и др. Математическая теория оптимальнвх про- цессов. М.: Наука, 1976. [Р] Рокафеллар Р. Выпуклый анализ. М.: Мир, 1973. [Т] Тихомиров В. М. Рассказы о максимумах и минимумах. М.: Наука, 1986. [ХЛП] Харди Г, ЛиттльвудД. Е., Палиа Г. Неравенства. М.: Иностранная литература. 1948.
304 Список литературы к части II [ЭТ] Экланд И., Темам Р. Выпуклый анализ и вариационные проблемы. М.: Мир, 1979. [Я] Янг Л. Лекции по вариационному исчислению и теории опти- мального управления. М.: Мир, 1974. [К1] KlotzJer R. Mehrdimensional Variationsrechnung. Berlin, VEB Deu- tscher Ferlag, 1971. [Мог] Morrey Ch. R. Vultiple integrals in the calaulus of variations. New York: Springer, 1966.
Список обозначений absmin (absmax) — абсолютный, т,е. глобальный минимум (максимум) в задаче locmin (locmax, locextr) — локальный минимум (максимум, экстремум) Smin (-Smax), ИНОГДЭ, Чтобы подчеркнуть ГЛОбаЛЬНОСТЬ экстремума Sabsmin (Sabsmax)’ — численное значение абсолютного минимума (макси- мума) задачи (Р) — нумерация (обозначение) задачи ArgP — множество решений задачи (Р) Sp — численное значение задачи (Р) D(P), иногда DP, — множество допустимых элементов в задаче (Р) D(£) — множество функций дифференцируемых в точке х Dk(x) — множество функций к раз дифференцируемых в точке £ (к > 1) (а, Ь) — скалярное произведение векторов а и b lin {fl|,..., ат} — линейная оболочка векторов aj,..., ат I — единичная матрица {х | А.(х)} — множество элементов х, обладающих свойством j4(x) X* — пространство сопряженное с X (х*,х) — значение линейного функционала х* на элементе х L(X,Y) — пространство линейных непрерывных отображений из прос- транства X в пространство Y Ll — аннулятор множества L А* — оператор, сопряженный с оператором А, (А*у*,х) = {у*, Ах) х() — обозначение, которым подчеркивается, что х() является элементом функционального пространства C([t0, tj, =>) — пространство непрерывных на отрезке [£0, М функций х( ): с нормой ||ж(-)||о - maxte((0i(,| |x(t)| С(К, =>п) — пространство непрерывных вектор-функций х( ):К —>=>", заданных на компакте К с нормой ||х(-)||о = тах<£к |x(i)| СГ(К, =>п) — пространство г раз непрерывно дифференцируемых вектор- функций х( )-.К —»=>", заданных на компакте К с нормой ||х(-)||г = max {||х()||о, ||i(-)llo, • , ll®<r>()llo } :==>U {-оо} и {+оо} — расширенная числовая прямая сопеС, иногда соС, — линейная оболочка множества С
306 Список обозначений convC — выпуклая оболочка множества С dom/ — эффективное множество функции / epi/ — надграфик функции / defA(x) — индикаторная функция выпуклого множества А зА(у) — опорная функция множества А df(x) — субдифференциал выпуклой функции / в точке £ def+/(4,/i) — производная по направлению h отображения / в точке £ def/(4, ) — вариация по Лагранжу отображения / в точке £ /g(£) — производная Гато отображения / в точке х /'(ш)[Л[ — действие производной (Фреше) /'(£) на элемент Л SD(x) — множество отображений строго дифференцируемых в точке £ ф о ip — суперпозиция отображений <р и ф, (ф о <р)(х) = ф(<р(х)) В(£, def) — открытый шар радиуса def с центром в точке £ Т±М — множество всех касательных векторов к множеству М в точке £ Т£ М — множество односторонних касательных векторов к множеству М в точке £ хь (Л) — базисный вектор (матрица) в линейном программировании хп (-^п) — небазисный вектор (матрица) /* — сопряженная (в смысле Лежандра) функция к функции / /” — вторая сопряженная функция к функции / Р** — двойственная задача к задаче Р Е(Р) — множество экстремалей в задаче (Р) DE(P) — множество допустимых экстремалей в задаче (Р) wlocmin (wlocmax, wlocextr) — слабый локальный минимум (максимум , экстремум) strlocmin (strlocmax, strlocextr) — сильный локальный минимум (максимум, экстремум) РС(Д,=>П) — пространство кусочно-непрерывных на отрезке Д вектор- функций РС^Д,^") — пространство кусочно-дифференцируемых на отрезке Д вектор-функций С(Ж М) = {4)ec‘(ko. М) 1Л(М = Л(М = О} Р»: — {(t, £(t)) 11 е [t0, tj} — график функции £ = {(t,£(t),i(t)) 11 € [to, t|[} — расширенный график функции £ O(A) — (открытая) окрестность множества А
Предметный указатель А аннулятор множества 62 В вариация по Лагранжу 53, 57, 69, 145, 163 вектор базисный 70, 88, 111 — касательный 67, 255 — небазисный 88 — ограничений 87 — стоимости 87 возмущение задачи 251 стандартное 265 д дифференцируемость по Гато 54, 58, 59 — по Фреше 54, 56, 69 — строгая 53, 55, 57, 58, 60 3 задача Аполлония 4, 29, 286 — Арестова 298 — Архимеда 281 - Больца 5, 143, 153, 155, 249, 258 — быстродействия со смешан- ным критерием 289 — вариационного исчисления 249, 266, 284 — выпуклая без ограничений 45, 49, 284, 287 ---с ограничением 45 — выпуклого программирования 46, 249, 260, 298 — Герона 286 — гладкая бесконечномерная без ограничений 69 -------с равенствами 71 -------и неравенствами 75 — — конечномерная без огра- ничений 8 -------с равенствами 23 -------и неравенствами 33 — Годдарда 288 — Дидоны 166 — изопериметрическая 5, 143, 162, 166, 216, 246, 280 — Кеплера 285 — классическая изопериметри- ческая 298 — Лагранжа 143, 173 — линейного программирования в канонической форме 86, 87, 95, 101 -------в нормальной форме 87 99, 101 -----в общей форме 87 -----двойственная 99 -----— невырожденная 88, 92, 106 -------производственная 86 — ляпуновская 249, 258 — математического программи- рования 248, 259 — на минимакс 91 — Надя 298 — Надя—Габушина 297 — Ньютона аэродинамическая 186, 204, 246, 283 — о брахистохроне 143, 152, 246, 282
Предметный указатель 308 — о быстродействии 186, 200, 202, 289 — о кратчайшем расстоянии 287 — о минимальной поверхности вращения 152, 284 — о мягкой посадке 288 — о назначении 85, 138 — о полиномах Лежандра второй степени 22 ----— третьей степени 22 — о стрельбе 152, 289 — о центре тяжести 288 — об оптимальном возбуждении осциллятора 289 — оптимального управления 186, 187, 249, 283 — простейшая КВИ 216, 217 — с подвижными концами 143, 158, 161 — Снеллиуса—Ферма 286 — со старшими производными 143, 169, 172 — транспортная 85, 122 ---- двойственная 136 ----, замкнутая модель 123, 132 — Ферма—Торичелли—Штей- нера 283 — Фуллера 298 — Чебышева об экстраполяции 295 И иголка элементарная 198 иголок пакет 189 игольчатая вариация управления 189 -------элементарная 198 ----функции 189 -------элементарная 198 интеграл импульса 149 — энергии 149, 282, 285, 299 интегрант 144, 147, 249 искусственные переменные 110, 112, 113 К комбинация выпуклая 102 — коническая 102 конус допустимых вариаций 34, 79 — конечнопорожденный 103 критерий Коши 51 — решения 102, 105 — Сильвестра 13 — Чебышева об альтернансе 292 Л лагранжиан 162, 163, 165 лемма Банаха 60, 63 — Дюбуа-Реймона 147, 148 ---обобщенная 170 — Лагранжа 146, 147 — о замкнутости конечнопоро- ждеиного конуса 103 ---образа 63 — о нетривиальное™ аннулято- ра 62, 64 — о правом обратном 63 — о приращении функционала 198 — о свойствах элементарной игольчатой вариации 198 — о скруглении углов 225 — о центрированной системе 193 — об аннуляторе ядра регуляр- ного оператора 64, 78 — об игольчатой вариации 190 — основная КВИ 146 м матрица базисная 113, 128 — небазисная 131 — определенная неотрицательно 11 ---неположительно 17 ---отрицательно 19-21 ---положительно 11
Предметный указатель 309 метод Бубнова—Галеркина 278 — Гаусса 275 — искусственного базиса 113 — «Минимума по матрице» 126 — «Минимума по столбцу» 126 — «Минимума по строке» 126 — Ньютона 14, 15 — описанных эллипсоидов 276 — потенциалов 122, 128, 138 — «Северо-западного угла» 125, 129 — центрированных сечений 275, 276 минимум (максимум) 6, 45, 246, 248, 253 ---абсолютный 305 ---глобальный 144 ---сильный 254 --- слабый 153 минор главный 13 ---последовательный 13, 16 многогранник выпуклый 87, 103 множества отделимые 44 — строго отделимые 44 множество выпуклое 41,96 — решений задачи 7, 87 — эффективное 96 множители Лагранжа 23, 26, 34, 71, 248, 254 н надграфик функции 41 неравенство Адамара 287 — Бернштейна 296 — Бляшке 288 — Вейля 292 — Гельдера 291 ---обобщенное 291 — Гильберта 291 — для средних степенных 40, 290 — для степенных 290 — Йенсена 41 — Коши 290 — Ландау 297 — между средним арифметичес- ким и геометрическим 290 ---------обобщенное 290 — Минковского 291 — о неравенствах для производ- ных 297 — Харди 291 — Харди—Литтлвуда—Полна 297 — Юнга 96, 287 нормы эквивалентные 51 О оболочка выпуклая 78, 102 — коническая 102 ограничение ди фференциальное 187 — изопери метрическое 162 — на концах 162 отображение регулярное 254 — слабо регулярное 256 П поле экстремалей 216, 229, 230 ---центральное 229 полиномы наименьшего уклоне- ния 292 — наименее уклоняющиеся от нуля 293 поля центр 229, 232 последовательность фундамен- тальная 51 правило прямоугольника 9Q 114 преобразование Лежандра 96 пример Больца 269 — Вейерштрасса 269 — гармонический осциллятор 270 — Лаврентьева 273 принцип Лагранжа 7, 23, 33, 44 ---в математическом програм- мировании 259
310 Предметный указатель ----для гладко-выпуклых задач 254 — — для задач оптимального управления 261, 263 ----для ляпуновских задач 261 — максимума Понтрягина 186, 187, 192, 222 производная высшего порядка 55 — Гато 53, 54 — по направлению 53 — Фреше 53, 54 — частная 18, 55 пространство банахово 51 — касательное 67 — метрическое 25, 51 — нормированное 41, 51 — полное 51 — сопряженное 42, 52 процесс допустимый 187 — оптимальный 187 Р расширение экстремальных за- дач 248 С симплекс-метод 85, 86, 88, 91, 107, 277 субдифференциал 41, 42 Т теорема Банаха об обратном опе- раторе 62 ----об открытости 62, 63 — Боголюбова 270 — Вейерштрасса 25, 28 — двойственности 104 — Дубовицкого—Милютина 43, 252 — Крейна—Мильмана 88 — Куна—Таккера 46, 48, 260 — Лагранжа 59 — Левина об очистке 253 — Люстерника 65, 67, 250 — Минковского 87 — Моро—Рокафеллара 43, 251 — о касательном пространстве 67 — о поле в конечномерных за- дачах 266 — о полном дифференциале 61 — о смешанных производных 55 — о среднем 59, 60 — о суперпозиции 57 — об обратной функции 24, 25 — об обратном отображении 72, 250, 255 — отделимости вторая 44 --- первая 44 — существования 102, 104, 189, 271 — Тонелли 272 — Фенхеля—Моро 96, 98, 250 — Ферма 8, 9 — Эйлера—Лагранжа 174, 175 терминант 153, 155, 249 точка крайняя (угловая) 87 — критическая 33, 36 — локального минимума (мак- симума) 7, 8 — сопряженная 220, 229 — стационарная 16, 23 У управление 187 уравнение Эйлера 145, 258 — Эйлера—Пуассона 169—171, 180, 261 — Якоби 220 условие Вейерштрасса 216, 219, 221 — дополняющей нежесткости 33, 47, 48 — Лежандра 220 ---усиленное 220 — на концах (краевые) 144
Предметный указатель 311 — неотрицательности 13, 27, 48 — оптимальности 186 — Слейтера 46 — стационарности 23 ---по подвижным концам 159 — строгой положительности 11, 70 — трансверсальности 154, 258 — Якоби 220, 228 ---усиленное 220, 227 Ф фазовая переменная 187, 249 — плоскость 201, 202 — траектория 202 формализация 6, 247 — задачи 247 формула Вейерштрасса основная 216, 232, 234 — Родрига 294 — Тейлора 9, 59 функционал Больца 153, 155, 249 функция аффинная 41, 96, 221 — Вейерштрасса 221 ---интегранта 221 — выпуклая 41 — замкнутая 96 — индикаторная 42 — квадратичная 41 — кусочно-непрерывная 187 — Лагранжа 27-29, 254 — Минковского 42 — наклона поля 229 — опорная 42 — собственная 41, 96 — сопряженная 96 ---- вторая 96 — сублинейная 43 — целевая 86, 91 S-функция 99, 101, 232 —, дифференциал 232 Ч численное значение задачи 7, 102 Э экстремаль 145 — допустимая 145 экстремум 6, 8 элементарная задача вариацион- ного исчисления 258 ----гладкая 257 — — линейного программиро- вания 258 — — оптимального управления 258
Сведения об авторах Галеев Эльфат Михайлович, доктор физи- ка математических наук профессор кафе д ры общих проблем управления механико- математического факультета Московского го сударственного университета им. М. В Ломо- носова. Автор более 75 научных работ, в том числе ряда монографий по теории экстре- мальных задач. Научные интересы: теория приближений, теория экстремальных задач. Тихомиров Владимир Михайлрвич доктор физико-математических наук црофессор за- ведующий кафедрой общих пробле м управле- ния механико-математического факультета Московского государственного университета I им М В Ломоносова Автор более 140 на- I учных работ, в том числе ряда монографий по теории экстремальных задач и теории | п ргб лиженйи. Н аучные интересы- .теория I приближений, теория экстремальных задач .
Оглавление Предисловие............................................... 3 ЧАСТЬ I Введение .................................................. 6 Глава 1. Экстремальные задачи.............................. 8 § 1. Конечномерные задачи без ограничений.................. 8 1.1. Постановка задачи ................................ 8 1.2. Необходимые и достаточные условия экстремума .... 8 1.3. Правило решения................................. 16 1.4. Примеры......................................... 17 1.5. Задачи, упражнения.............................. 22 § 2. Конечномерные гладкие задачи с равенствами.......... 23 2.1. Постановка задачи .............................. 23 2.2. Необходимые и достаточные условия экстремума .... 23 2 3. П равило решения............................. 27 2.4. Примеры.......................................28 2.5. Задача Аполлония............................... 29 2 6. 3 адачи ..................................... 32 §3 . Конечномерные гладкие задачи с равенствами и неравенствами........................................ 33 3.1. Постановка задачи................................. 33 3.2. Необходимые и достаточные условия экстремума... 33 3.3. Правило решения................................ 36 3 4 . П римеры................................... 37 3.5. Задачи ........................................... 40 §4 . Выпуклые задачи.................................... 41 4.1. Элементы выпуклого анализа. Субдифференциал .... 41 4.2. Теоремы отделимости............................. 44 4.3. Задачи без ограничений.......................... 45 4.4. Задачи с ограничением........................... 45 4.5. Задача выпуклого программирования .............. 46 4.6. Задачи, упражнения.............................. 50 § 5. Элементы функционального анализа .................. 51 5.1. Нормированные и банаховы пространства........... 51 5.2. Определения производных......................... 53
314 Оглавление 5.3. Некоторые теоремы дифференциального исчисления в нормированных пространствах....................... 57 5.4. Дополнительные сведения из алгебры и функционального анализа............................... 62 5.5. Задачи ............................................ 68 § 6. Гладкая задача без ограничений ....................... 69 6.1. Постановка задачи ................................. 69 6.2. Необходимые условия 1 порядка...................... 69 6.3. Необходимые и достаточные условия II порядка.... 69 §7 . Гладкая задача с равенствами......................... 71 7.1. Постановка задачи.................................. 71 7.2. Необходимые условия I порядка...................... 71 7.3. Необходимые условия 11 порядка......... 73 7.4. Достаточные условия II порядка..................... 74 §8 . Гладкая задача с равенствами и неравенствами......... 75 8.1. Постановка задачи.................................. 75 8.2. Необходимые условия I порядка...................... 75 8.3. Необходимые условия II порядка..................... 79 8.4. Достаточные условия II порядка..................... 79 Ответы к задачам главы 1................................ 80 Тлава 2. Линейное программирование......................... 85 § 1. Симплекс-метод....................................... 86 1.1. Постановки задач. Геометрическая интерпретация .... 86 1.2. Правило решения задач по симплекс-методу.... 88 1.3. Примеры............................................ 91 1.4. Задачи ............................................ 95 §2 . Двойственность в линейном программировании........... 96 2.1. Элементы выпуклого анализа. Преобразование Лежандра................................. 96 2.2. Примеры............................................ 97 2.3. Вывод двойственных задач .......................... 99 § 3. Обоснование симплекс-метода......................... 102 3.1. Теоремы существования, двойственности, критерий решения ...................................... 102 3.2. Свойства множества допустимых точек............... 105 3.3. Доказательство симплекс-метода.................... 107 §4 . Методы нахождения начальной крайней точки .......... 110 4.1. Переход к решению двойственной задачи.............. НО 4.2. Метод искусственного базиса....................... 113 4.3. Примеры........................................... 115 4.4. Задачи ........................................... 121
Оглавление 315 85. Транспортная задача.................................. 122 5.1. Постановка задачи ............................... 122 5.2. Особенности задачи............................... 124 5.1 Методы нахождения начальной крайней точки........ 125 5.4. Метод потенциалов................................ 128 5.5. Примеры транспортных задач....................... 129 5.6. Задача двойственная к транспортной задаче........ 136 5.7. Обоснование метода потенциалов решения транспортной задачи................................... 137 5.8. Задача о назначении. Пример..................... 138 5.9. Задачи .......................................... 141 Ответы к задачам главы 2.............................. 142 Глава 3. Вариационное исчисление......................... 143 § 1. Простейшая задача классического вариационного исчисления 144 1.1. Постановка задачи................................ 144 1.2. Вывод уравнения Эйлера с помощью основной леммы вариационного исчисления.......... 145 1.3. Вывод уравнения Эйлера с помощью леммы Дюбуа-Реймона................................... 147 1.4. Векторный случай................................. 149 1.5. Интегралы уравнения Эйлера....................... 149 1.6. Примеры.......................................... 150 1.7. Задачи .......................................... 151 §2 . Задача Больца...................................... 153 2.1. Постановка задачи ............................... 153 2.2. Необходимое условие экстремума................... 153 2.3. Многомерный случай............................... 155 2.4. Пример........................................... 156 2.5. Задачи Больца.................................... 157 §3 . Задача с подвижными концами........................ 158 3.1. Постановка задачи................................ 158 3.2. Необходимые условия экстремума................... 158 3.3. Пример........................................... 159 3.4. Задачи с подвижными концами...................... 161 §4 . Изопериметрическая задача.......................... 162 4.1. Постановка задачи................................ 162 4.2. Необходимое условие экстремума.................. 162 4.3. Пример........................................... 165 4.4. Задача Дидоны.................................... 166 4.5. Изопериметрические задачи........................ 168 8 5. Задача со старшими производными..................... 169 5.1. Постановка задачи................................ 169
316 Оглавление 5.2. Необходимое условие экстремума................... 169 5.3. Пример........................................... 171 5.4. Задачи со старшими производными ................. 172 §6. Задача Лагранжа....................................... 173 6.1. Постановка задачи ............................... 173 6.2. Необходимые условия экстремума................... 174 6.3. Примеры.......................................... 177 6.4. Вывод уравнения Эйлера—Пуассона из теоремы Эйлера—Лагранжа ...................................... 180 6.5. Задачи Лагранжа ................................. 181 Ответы к задачам главы 3.............................. 182 Глава 4. Задачи оптимального управления................... 186 §1. Принцип максимума Понтрягина в общем случае.......... 187 1.1. Постановка задачи ............................... 187 1.2. Формулировка теоремы ............................ 188 1.3. Доказательство................................... 189 1.4. Пример........................................... 194 § 2. Формулировка и доказательство принципа максимума Понтрягина для задачи со свободным концом................ 197 § 3. Избранные задачи оптимального управления............. 200 3.1. Простейшая задача о быстродействии............... 200 3.2. Аэродинамическая задача Ньютона.................. 204 3.3. Примеры задач оптимального управления............ 209 3.4. Задачи оптимального управления................... 214 Ответы к задачам главы 4.............................. 215 Глава 5. Условия второго порядка в вариационном исчислении ... 216 § 1. Простейшая задача вариационного исчисления........... 216 1.1. Сильный и слабый экстремум....................... 216 1.2. Пример слабого, но не сильного экстремума........ 217 1.3. Условия Лежандра, Якоби, Вейерштрасса............ 219 1.4. Необходимые и достаточные условия слабого и сильного экстремума................................. 222 1.5. Правило решения.................................. 237 1.6. Примеры.......................................... 239 1.7. Задачи .......................................... 243 Ответы к задачам главы 5.............................. 244 Список литературы к части I............................... 245
Оглавление 317 ЧАСТЬ II Глава 6. Общая теория экстремальных задач.................... 246 §0. Введение................................................. 246 0.1. Основные темы и принципы общей теории экстремума . 247 0.2. Классы экстремальных задач ......................... 248 0.3. О базе теории....................................... 250 § 1. Принцип Лагранжа для необходимых условий экстремума . . 253 1.1. Формулировка принципа Лагранжа для гладко-выпуклых задач ............................ 254 1.2. Доказательство принципа Лагранжа для гладко-выпуклых задач ............................ 255 1.3. Следствия принципа Лагранжа......................... 259 § 2. Возмущения экстремальных задач......................... 264 2.1. Возмущения в математическом программировании . . . 264 2.2. Простейшая задача классического вариационного исчисления...................................... 266 § 3. Расширение вариационных задач и существование решений . 268 3.1. Расширение вариационных задач.............. 268 3.2. Теоремы существования в задачах вариационного исчисления...................................... 271 §4 . Алгоритмы оптимизации ................................. 274 4.1. Алгоритмы минимизации квадратичной функции .... 275 4.2. Метод центрированных сечений и метод эллипсоидов . . 275 §5 . Приложения обшей теории к решению конкретных задач . . 279 §6 . Заключительные замечания............................... 301 Список литературы к части II................................. 303 Список обозначений........................................... 305 Предметный указатель......................................... 307 Сведения об авторах.......................................... 312
Э. М. Галеев, В. М. Тихомиров Оптимизация: теория, примеры, задачи Директор — Доминго Марин Рнкой Заместители директора — Наталья Финогенова, Ирина Макеева Администратор — Леонил Иосилевич Компьютерный дизайн — Виктор Романов Главный редактор — Елена Кудряшова Верстка — Наталия Бекетова Обработка текста — Евгений Макаров, Андрей Стулов Техническая поддержка — Наталья Аринчсва, Анна Тюрина Менеджер по продажам — Алексей Петяев Нллтпслкттто • Э.тттторнал УРСС». II32OX. г. Москткт. ул. Чертановская, л. 2/11. к.п. Лицензия ЛР №064418 от 24.01.96 г. Тигиенпчсский сертификат на выпуск книжной пролукпии № 77.ФЦ.8.953.П.270.3.99 от 30.03.99 г. Подписано к печант 20 07.2000 г. трормаг <»0х88/16. Тираж 1000 акт. Печ. л. 20. Зак. №60. Отпечатано и АООТ «Пааитсх-4,. 129110. г. Москва, ул. Б. Переяславская. 46.
Уважаемые авторы и издатели! t J •T Межиздательский дистрибьюторский центр научной литературы, созданный при издательстве УРСС, приглашает авторов, издательства и другие организации к взаимовыгодному сотрудничеству по вопросам распространения печатной продукции. Межиздательский дистрибьюторский центр научной литера- туры ведет работу по распространению книг ряда авторов и несколь- ких издательств, среди которых московские издательства УРСС, «МЦНМО» (Московский Центр непрерывного математического об- разования) «Янус», «Факториал», издательство Санкт-Петербургс- кого университета и др. Уважаемые читатели! Уважаемые авторы! Издательство УРСС специализируется на выпуске учебной и научной литературы, в том числе монографий, журналов, трудов ученых Российской академии наук, научно-исследовательских ин- ститутов и учебных заведений. Основываясь на широком и плодотворном сотрудничестве с Российским гуманитарным научным фондом и Российским фондом фундаментальных исследований, мы предлагаем авторам свои услу- ги на выгодных экономических условиях. При этом мы берем на себя весь спектр работ по полной подготовке издания — от набора, ре- дактирования и верстки до тиражирования и распространения. I S « Э Книги, распространяемые Межиздательским дистрибьюторским цен- тром научной литературы, можно приобрести в магазинах: ♦Библио-Глобус» (м. Лубянка, ул. Мясницкая, 6.Тел. 928-87-44) •Дом научно-технической книги» (Ленинский пр., 40. Тел. 137-06-33) •Московский дом книги» (ул. Новый Арбат, 8. Тел. 290-45-07) •Москва» (м. Охотный ряд, ул. Тверская, 8. Тел. 229-66-43) •Академкнига» (Б.Черкасский пер., 9; ул. Вавилова, 55. Тел. 298-30-28) •Ad Maryinerm (1-й Новокузнецкий пер., 5/7. Тел. 231-93-60) •Русский путь» (ул. Нижняя Радищевская, 2. Тел. 915-10-47) • Гнозис» (Тел. 247-17-57) • С.-Пб. дом книги» (Невский пр., 28) а также в книжных киосках МГУ (Воробьевы горы) По всем интересующим Вас вопросам л Вы можете обратиться в издательство: яи./фас 135-44—23, тел. 135—42—46 s Попы* кгпьаог издаяпй представив в Лпеякг-лмапвве: http://nrss.ni