Текст
                    в.д.ногин
И.О, ПРОТОДЬЯКОНОВ
И.И.Е0ДАМПИЕВ
ОСНОВЫ ТЕОРИ И
ОПТИМИЗАЦИИ

В. Д. НОГИН, И. О. ПРОТОДЬЯКОНОВ, И. И. ЕВЛАМПИЕВ ОСНОВЫ ТЕОРИИ ОПТИМИЗАЦИИ Под редакцией И. О. Протодьяконова Допущено Министерством высшего и среднего специального образования СССР в качестве учебного пособия для студентов высших технических учебных заведений МОСКВА «ВЫСШАЯ ШКОЛА» 1986
ПРЕДИСЛОВИЕ В настоящее время теория оптимизации, успешному применению которой способствует современная вычисли- тельная техника, вносит заметный вклад в ускорение научно-технического прогресса. Трудно назвать такую область инженерной деятельности, где бы не возникали задачи оптимизационного характера. Это, например, за- дачи определения наиболее эффективного режима ра- боты различных технических систем, задачи организации производства, дающего наибольшую возможную при- быль при заданных ограниченных ресурсах, и др. Учебное пособие включает основные разделы теории оптимизации (теории экстремальных задач), нашедшие применение при решении различных прикладных задач. В книге представлены основы теории оптимизации, т. е. такие понятия, теоремы и методы, знакомство с ко- торыми не может дать исчерпывающего представления о всей теории, но которые позволят читателю войти в круг основных идей и методов решения прикладных задач и дадут возможность в дальнейшем ориентироваться в многообразии специальной литературы. Книга ориентиро- вана на читателей, подготовленных в пределах програм- мы по математике технического вуза. Постановка каждой задачи оптимизации включает два объекта: множество допустимых решений и целевую функцию (функционал), которую следует минимизиро- вать или максимизировать на указанном множестве. С этой общей точки зрения и рассматриваются различ- ные классы экстремальных задач, составляющие пред- мет изучения линейного программирования, динамическо- го программирования, нелинейного программирования, геометрического программирования, вариационного ис- числения и теории оптимального управления.
Условно книгу можно разделить на две части. Первая часть (гл. 2—6) посвящены изучению и решению задач оптимизации, в которых целевая функция — это функция многих переменных, а допустимым множеством является подмножество евклидова пространства. В гл. 7 дается понятие о сравнительно новой ветви теории оптимиза- ции— многокритериальной оптимизации, изучающей за- дами с несколькими 'Целевыми функциями. Во второй черти (гл. 8—11) рассматриваются задачи оптимизации с допустимым множеством из функционального про- странства, на котором минимизируется или максимизи- руется целевой функционал. При изложении этой части книги использован минимум дополнительных математи- ческих понятий, выходящих за рамки втузовской про- граммы. Каждая глава, кроме первой, вспомогательной, заканчивается подробно разобранными примерами ре- шения прикладных оптимизационных задач, что должно способствовать не только усвоению изложенного теоре- тического материала, но и развитию практических навы- ков решения конкретных прикладных, задач. Главы 1—11 (кроме § 9.7', 10.5, 11.3) написаны В. Д. Ногиным; § 9.7, 10.5 и 11.3 написаны И. О. Про- тодьяконов ым и И. И. Евлампиевым. Авторы выражают признательность С. А. Авдонину за полезное обсуждение материала книги. Кроме того, авторы благодарны В. В. Ананьеву, П. Н. Холодову и С. В. Чистякову, прочитавшим часть рукописи и выска- завшим ряд ценных замечаний. Авторы
Глава 1 ОСНОВНЫЕ МАТЕМАТИЧЕСКИЕ ПОНЯТИЯ Цель данной главы — напомнить понятия и основные сведения из курса математического анализа, которые будут часто использо- ваться в дальнейшем. Более подробно с доказательствами форму* лиру ем ых здесь утверждений можно ознакомиться в соответству- ющей учебной литературе (см., например, (16]). В § 1.1 введены евклидово пространство и простейшие разно- видности множеств в этом пространстве: прямая, отрезок, гипер- плоскость. В § 1.2 сформулированы понятия открытого, замкнуто- го и компактного множеств, дано определение и приведен ряд при- меров выпуклых множеств в евклидовом пространстве. Последний параграф посвящен функциям, определенным на множестве из ев- клидова пространства. Здесь напоминаются формулировки непре- рывной, дифференцируемой, а также выпуклой функций. Приве- дены два обобщения понятия выпуклой функции, которые обычно не рассматривают в курсах математического анализа для втузов. §1.1. ЕВКЛИДОВО ПРОСТРАНСТВО 1. Элементы теории множеств. Под множеством обычно пони- мают некоторый набор (совокупность) элементов произвольной природы. Примерами множеств могут служить совокупность стра- ниц в данной книге, печатных знаков, формул. Множества вещеег- венных, натуральных и целых чисел являются примерами число- вых множеств. Фразу «х является элементом множества X» («х принадлежит множеству X») записывают кратко в виде хеХ. Если х не принад- лежит множеству X, то пишут х^Х. Множества X и Y называют равными, если они состоят из одних и тех же элементов. Если каждый элемент множества X является элементом мно- жества У, то говорят, что X есть подмножество множества У, и пи- шут ХсУ. В частности, ХсХ. Символы е и с называют знаками включения, а соотношения вида х^Х и Хс:У — включениями. Равенство Х=У имеет место тогда и только тогда, когда одно- временно ХсУ и УсХ. Запись Х={хь х2, ...} означает, что множество X состоит из элементов xlt хз и, возможно, некоторых других, заданных тем или иным способом. Если множество X состоит из элементов х, обла- 5
дающих определенным свойствам то пишут Х={х|Р(х))- Например, (0, Цо{х|0<лС1Ь Для указания множества X, зтементы которого принадлежат У и, кроме того, обладают свойством ^(х), используют обозначение Jf=tasr|P(x)}. Множество, не содержащее ни одного элемента, называют иусгшв, jwiiwet-reojK и обозначают 0. ллозье^тд X, У называют множество, обо- значаемое ХЦ1, элементы которого принадлежат хотя бы одному из множеств X или У. Операция объединения множеств обладает с л еду ющим и свойства м и; Л Хиг-Уих 2й) (Xun u^^^uruZh Э“) лил=х, XU0^X, где X, У,. Z — произвольные множества. Первые два свойства ана- логичны: свойствам операция сложения для чисел. Г/|фёСёче«ш*ж мможжга А. У называют множество, обозначае- мое ХПУ( элементы которого принадлежат одновременно и множе- ству X, и множеству >'. Операции пересечения миажес-ь обладает следующими свойствами: I®) хли-грх, 23) (ХАПЛ^ЛЛГЛ^Ь Э) ХЛХ=АГ1 Xfi0=0t Первые три свойства аналогичны соответствующим свойствам операции объединения... Для введенных операций объединения и пересечения выполня- ются следующие свойства: 1”) (X U П Г Z = (X Л Z) U (Г h А 2й) (X Л П U £=(АГ и Z) n Г и ZL Разностью лсяожнств X я У .называют множеств о, состоящее из элементов, которые принадлежат множеству л, но не принадлежат множеству У (обозначение: Х\У). Ри'Д- L.1 иллюстрирует по- нятия объединения,, пересе- чения и разности двух wro- да,Г дц/ ЖеЮТВ. Множество всех у поря до- Р«с- 11 ченных пар1 вида (Д ^), где хе=.Х, ^еУ, называется 'de- карговым пронэвейевдем множеств X и У я обозначается XX Та.Щ например. (1.2}Х{3,4} = {(1.3). {1 4), (2,3), (2Л)}.
2. Евклидово пространство. Упорядоченный набор п ных чисел, записанных в виде столбца называется п-мерным вектором. Числа Xj, Х2, .... хл называют ком- понентами (или координатами) вектора х. Используя операцию транспонирования матриц, будем координаты вектора записывать и в виде строки: Лз,..., хя)т. Нередко для краткости, если это не приводит к неточности, знак транспонирования будем опускать. Два л-мерных вектора х и у считают равными, если их соответ- ствующие компоненты совпадают, т. е. если Xi—yi, t==l, 2.п. Суммой векторов хну называют вектор, обозначаемый х+у, компоненты которого находят по формуле х+{/ = (х1+й, х2+й,..., лл+ул). (1.1) Разность векторов хну определяют следующим образом: х—у={х1 — у1, х2—уъ....хя—уа). (1.2) Нулевым вектором (обозначение 0п) называют л-мерный век- тор, все компоненты которого равны нулю. Произведением вектора х на вещественное число 1 называют вектор, обозначаемый >.х, компоненты которого находят по формуле Xjc=(Xxlt Xjc2,..., Хл„). (1.3) Из приведенных определений непосредственно вытекает спра- ведливость следующих равенств: х-}-Оя=х, X(x-|-i/)=Xx+Xi/, (х+^)4-х=х-Ну-Н)> 0х=0я, (Хх+Х2) X—+Х^х. Каждой паре векторов х, у сопоставим число, обозначаемое <х, У> и определяемое формулой л (х, у} =2 (1.4) 7
Это число называют скалярным произведением векторов х и у. Отметим свойства, которыми обладает скалярное произведение: 1°) <*. </> = *). 2°) (л+у, z) = (x, г) 4-(у, z), 3°) у)=Х(х, у}. 4°) <х, х>^0 (равенство имеет место тогда и только тогда, ког- да х — нулевой вектор). Справедливость приведенных свойств легко проверить, опира- ясь непосредственно на определение скалярного произведения. Совокупность всех n-мерных векторов, для которых введены опе- рации сложения, вычитания, умножение на вещественное число, а также скалярное произведение согласно формулам (1.1)—(1.4), на- зывают п-мерным вещественным евклидовым пространством и обо- значают R". Для краткости это пространство будем называть прос- то евклидовым пространством. Множество вещественных чисел далее будем обозначать бук- вой R. Это множество является примером одномерного евклидова пространства. Пространство R2 будем геометрически интерпретиро- вать как совокупность точек плоскости с фиксированной прямо- угольной системой координат или же как совокупность векторов на этой плоскости, начало которых совпадает с началом прямо- угольной декартовой системы координат. Пространство R3 имеет аналогичную интерпретацию в пространстве трех .измерений. Принимая во внимание указанную выше интерпретацию, эле- менты пространства R'1 будем называть также точками. Если <х, У)~0, то векторы х и у называют ортогональными. В частности, нулевой вектор ортогонален любому вектору. Нормой (или длиной) вектора xeRn называют число, обозна- чаемое ||х|| и определяемое формулой =1/2 г *-1 Сформулируем основные свойства нормы вектора: 1°) Их||>0, причем ||х||=0 тогда и только тогда, когда х=0п; 2е) -ши = I м 11*11, где Л — число: 3°) *11*4-^11 11x11+На/II (неравенство треугольника); 4’) |<*!/>| ^11х1НЫ1 (неравенство Коши — Буняковского). Расстояние между точками х и у евклидова пространства обо- значают через р(х, у) и определяют следующим образом: Р(х, У)=|х—УЦ=1/ У (Хл—Ул)2- Систему векторов хП), х(2>, ..., х<т) называют линейно независи- мой системой, если равенство Мх^Н-ЛаХ^Н-—4-AmXtm,=0n возмож- 8
но лишь в случае ?.]=Х2=...—Хт=О. Систему векторов, не являю- щуюся линейно независимой, называют линейно зависимой систе- мой. В л-мерном пространстве существует линейно независимая сис- тема из л-векторов, а любая система из л+1 (и более) векторов является линейно зависимой. Любая линейно независимая систе- ма {е^ь,}пм«1 векторов л-.мерного пространства образует базис; при этом каждый вектор пространства х единственным образом пред- ставляется в виде линейной комбинации базисных векторов: х= =lie(1>+A2et2>+...-|-X,ne(^ при некоторых Ль Ла.Ля. Для векторов x<=RH, yeRn условимся считать, что запись х^у означает, что Xi^y,t i=l, 2..л, а запись х>у означает, что Xi>yit i=l, 2,..., л. 3. Линейные множества. Непустое подмножество L пространст- ва Rn называется подпространством, если в результате сложения любых двух векторов из Ц а также умножения произвольного век- тора из L на любое вещественное число получаются векторы, при- надлежащие L. Если максимальное число линейно независимых векторов, которые можно найти в L, равно г, то говорят, что L — r-мерное подпространство. Само пространство Rn можно рассмат- ривать как л-мерное подпространство. Множество точек вида {zgR/1|z—при некотором где х* — некоторый фиксированный вектор из Rn, a L — г-мерное подпространство, называют r-мерным линейным множеством. При х* = 0я это множество совпадает с подпространством L. Геометри- чески r-мерное линейное множество представляет собой сдвиг под- пространства на фиксированный вектор х*. Одномерное линейное множество называют прямой, двумерное — плоскостью, а (л—1)- мерное — гиперплоскостью. Любую прямую в Rn можно задать в виде {xeR”[x=a-|-Ac при некотором AeR}, (1-5) соответствущнм образом подобрав векторы а и с из R". Если в (1.5) число >. ограничено сверху или снизу, то получаем луч. Если А огра- ничено и сверху, и снизу, то множество (1.5) задает отрезок. От- резок, соединяющий точки xr, yeW,— это множество вида |хеR«|x=Ajc'4-(1 — Ъу' при некотором Множество решений хе R" уравнения (а, х)=Ь, (1.6) где вектор а^0п и число b фиксированы, представляет собой неко- торую гиперплоскость в R”. Справедливо и обратное: любую ги- перплоскость в Rn можно задать в виде множества решений урав- нения (1.6), подобрав соответствующим образом вектор а и чис- ло Ь. 9
$ 12. МНОЖЕСТВА В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ 1. Открытые, замкнутые, компактные множества. Множество вида С/. = [ х е R"| jx—х< 0,j < в} называют открытым шаром радиуса е с центром в точке x^eR" или ^-окрестностью точки х<0>. Пусть XczR”— некоторое множество. Точку хеХ называют внутренней точкой множества X, если найдется такое е>0, что Сг(х)сХ, т. е. если точка х принадлежит множеству X вместе со своей некоторой окрестностью. В том случае, когда каждая точка множества X является внутренней, это множество называют от- крытым множеством. Например, С/вС*^0’) — открытое множество. Точку пространства Rn (не обязательно принадлежащую мно- жеству X) называют граничной точкой множества XcRn, если в ее окрестности любого радиуса е>0 имеется хотя бы одна точка из X и хотя бы одна точка, не принадлежащая X. Совокупность гра- ничных точек множества образует его границу. Последовательность точек из пространства Rn назы- вают сходящейся к точке x^eR", если х<О)Ц=О; при этом пишут limx^^x101. А-^ов Множество XczRn называют замкнутым, если из соотношений Пшх<*)=л<0>еR", х(*>еХ, £=1,2,..., следует, что х(0)еХ. Другими словами, множество X замкнуто, ес- ли предельная точка произвольной сходящейся последовательно- сти точек из X принадлежит множеству X. Отрезки, прямые, ги- перплоскости в Rn служат примерами замкнутых множеств. Само пространство Rn является одновременно открытым и замкнутым множеством. Известно, что множество является замкнутым тогда и только тогда, когда оно содержит все свои граничные точки. Объединение, а также пересечение конечного числа открытых (замкнутых) множеств представляет собой открытое (замкнутое) множество. Множество X называют ограниченным, если существует такое е>0, что Хс=£Л(Оп). Замкнутое и ограниченное множество называют компактным множеством или компактом. Примеры компактов: конечное множе- ство точек в Rn; отрезок, соединяющий пару точек в R"; замкну- тый шар, т. е. множество вида (хе R"| (х—х<°^'С*|. Гиперплоскость не является компактом, так как для нее не выпол- няется требование ограниченности. 10
Известно* что декартово произведен ив компактных множеств само является компактом. 2, Выпуклые множества. Множество X называют в&дедоды.м, ес- ли для: любой пары точек из Л весь отрезок» соединяющий эти точ- ки, также принадлежит Л. Отрезок, прямая, гиперплоскость,, шэр .примеры выпуклых множеств. Каждая гиперплоскость» заданная уравнением (J..®)., порожда- ет пару множеств Ц*| (а,, х) >И |х^Нл| (аФ х} <.&)* которые называются эмжкнртылщ лод^лрострпнстваж (рис.. 2.2). Если в эта» олределении использованы строгие знаки неравенств:* го получаем открытые иодс/ррпстран- Сг.Ш Все указанные ио л у простран- ств а являются выпуклыми множест- вами, Проверим., например, .выпукло л и пол у прост р а нство (ле IF | < з, «»£}, ' Для этого рассмотрим две произвольные точки и л131' этого полупространства.. Для этил точек выполнены неравеистпа <в, x<ll»sA; (д1 Сложим эти 1], а второе — на. два неравенства.» предварительно умножив первое на произвольное число lefO. 1^1. В результате .получим неравенство 1 (а. +(1 (й., д-«) « <а„ М^+(1 -xN) >Л Поскольку А произвольно». весь отрезок, соединяющий выбранные точкч.» принадлежит данному .полупространству. Следовательно,.по- лупрострэиетво действительно является выпуклым множеством, Можно проверить», что' пересечение любого числа выпуклых мно- жеств представляет собой выпуклое множество. Поэтому множест- во решений системы линейных неравенств и уравнений вида (а^. л) Ы, 2...........Ли X) <*,, («го, л)=6„ 7'—4' К-» ^“^й4г я»*"* является выпуклым множеством ,хьк Пересечение замкнутых полу- пространств и гнперлласкосгей. Е 1Ж ФУНКЦИИ МНСГМХ ПЕРЕМЕННЫХ L Непрерывные, днфферёнцируемые функции Пусть Х и У — два множества. Если указано! правило, согласно' которому каждо- му элемту множества X поставлен в соответствие -определенный элемент множества ^» то говорят,, что задана fT отобража- ющая X в У. Этот факт аависываюгт щ виде f: Х->У или и
где х^Х, y^Y. Множество X называют областью задания или об' ластью определения функции f, а множество У — множеством зна- чений. В первых семи главах настоящей книги в основном рассматри- вают функции многих переменных y=f(x)=f(xi, х?, хп), т. е. функции с областью задания и множеством значений XcR. Такие функции называют числовыми функциями в отличие от век- торных функций, для которых т>1. В дальнейшем число- вые функции будем называть просто функциями. Множество вида {(х, у) е Rrt+I| у—f (х) при некотором хе/| называют графиком функции y=f(x). Функцию f называют непрерывной в точке х<°)еХ, если для лю- бого числа е>б можно указать такое число 6е>>0, что для всех х е X П (л(0)) выполняется неравенство |f (х) —f (х<°>) | <е. Заметим, что согласно данному определению функция f в изо- лированной точке всегда непрерывна. Напомним, что точка х^Х называется изолированной* точкой множества X, если существует такая ее окрестность, которая не содержит никаких других точек из X, кроме самой точки х. Определение непрерывности функции можно сформулировать и на языке последовательностей. А именно: функция f непрерывна в точке x(0>gX тогда и только тогда, когда для любой последова- тельности точек удовлетворяющих соотношениям имеет место равенство 11т/(х<Л^)=/(х(°0* k-f Функцию, непрерывную в каждой точке множества X, называ- ют непрерывной на множестве X (или просто непрерывной, если X=Rn). ' В качестве примеров функций, непрерывных на R", приведем линейную функцию Л (*)= {с, х) 4-*=^+^2+••• 4-сл+* и квадратичную функцию Xa(jc)=“ (Q-*» -я) “Ь (£• At где Q — числовая симметричная матрица размера пХл, с — неко- торый вектор из Rn и b — некоторое число, a Qx означает произве- дение матрицы на вектор по правилам перемножения матриц, при- нятым в линейной алгебре. Пусть XcRn —замкнутое множество и функция f непрерывна па нем. Тогда множество точек хеХ, удовлетворяющих неравенству /(х)^0, является замкнутым множеством. В самом деле, пусто <0,£=1, 2, ..., limxW=x(0)eRn. Множество X замк- нуто, поэтому х(0)еХ. А так как функция f непрерывна в точке л<0), то из f (x(ft>) s^O, fe= 1, 2,следует неравенство f (х(0)) ^0. 12
Пересечение замкнутых множеств само является замкнутым множеством, Поэтому множество вида {хоЛ .^(xj^O, /=i, X .... л] я в льется замкнутым н том случае, если все функции Яо(х), ЛН-*,' - -“т gfc(x) непрерывны на замкнутом множестве X Пусть х<0)— внутренняя точна множества X Функцию f газы- из ют о^0ферен.^.£/р^й?л;ой ® точке х£й>,, если существует вектор ^Rn такой,, что ДЛЯ всех Ae^Rn, удовлетворяющих условию =НФ-Х, имеет место формула /(^+ft)=/(^)+(A &>+И«<л(Ч А), где функция а обладает свойством Нто(хс% й}=0, ЯНн» (1.7) (UJ Веди указанный .вектор р существует,, то его называют ерос^ятом f я довод «ДО и обозначают Vf(jK4 Известно; чго если функция f дифференцируема в точке то о ла в этой точке непре- рывна я V/{*!">)=( Й/^<°>) , V ох л d/(x’105') V "dx2 “в” <?хй г первого порядка, то ее рф"Ч Рис. 13 X С- гс а дне кт представляет собой вектор частных производных пер- вого порядка, вычисленных в точке х(Д Функцию, дифференцируемую в каждой точке открытого множе- ству X называют ад жншкестш X (или просто ^дфферен^одррелюС если X=Rn) Если функция f имеет в некоторой точке х (или а каждой точ- ке X) непрерывные частные производные называют непрерывно ^цфферек^ддолой й этой точке (соответственно на множе- стве X). Известно (16’, что функция, не* прерывно дифференцируемая в точке, яв- ляется также дифференцируемой в этой точке, .Приведенные, выше ли ней на я и квад- ратичная функции непрерывно дифферен- цируемы, причем, как легко вычислить, V/fQ>=€:, 7fe(x)^Qx4c, Градиент,, как вектор пространства R", обладает важным геометрическим свойством, которое проиллюстрируем на •примере функции двух переменных у= ^(xr)a+(xa)s+L Графиком, этой функ- ции является параболоид вращении с вер- шиной в точке (О,, 'О, 1) (рис, 1,3), а ли* мнями уровня — 'Окружности в плоскости точке (х('а:\ Д®1) равен (2xf°\ 2хр) и перпендикулярен касатель- ной к окружности, проходящей через точку На рис, 1.3 It XjOxk- Здесь градиент в
градиенты: изображены приложен ни ми к точкам» в которых их вы* ч исля ют, Вообще градкент отличной от постоянной функции *==f (хц ХйХ вычисленный в точке (xf „4 Jl( перпендикулярен ка- сательной К ЛИНЮ уровня i'jtC'R2 ; /(Х|, XS)^/(x?\ X20))kпрохода щей через точку(х{е>» хР)- В случае функции трех переменных гра- диент ортогонален плоскости, проведенной через рассматриваемую’ точку и являющейся' касательной к соответствующей поверхности уровня. Пусть х*э>^внутренняя точка множества X. Функцию f назы- вают tfeoxvw а tow если существуют гра- днчет и матрица чисел размера обозначаемая гэ^(х£|°3)» такие» что для веек векторов АеНД удовлетворяющих условию1 (х^Н~й) ё Л, имеет место формула / (х<°1+А)=/ (*<’>) + (V/ А) } у (Vs/ (**’’) А, А) + 4-BftjP?<JC<®>. А), где функция ® обладает следующим свойством* нт иеч я)=-< Здесь числовая матрица V-f(х^) называется адесшшом (иди лот- /жцей Гессе). Ecrt функция f имеет непрерывные частные пронз- ведные второго порядка J(?.hojhtW даярерьдеяо в точке хеиз» то она дважды дифференцируема в ж*3! и обладает мат- рицей Гессе вида йх? ffs/ Ut0>) r^y и№) id г Л причем эта матрица симметрична, тв е. ц &— 1» 2, ,<>« К- Ц Т — “ ’ Функцию, дважды дифференцируемую в каждой точке простран- ства Кй» будем называть Йвижом ируодой» Квадратична я функция / (л)—=< Qx( х >+<с, х) 4-6 с сим м ет - ручной матрицей Дважды дифференцируема, причем» как легко .найти, V*f (х) =Q. 2. Выпуклы:ет псевдовыдуклые и киазивыпуклые функции, Вы- пуклые функции и их обобщения (псёндовыпуклые и хвазмьыпук- £4
лыс функции) играют важную роль в теории оптимизации., В гл, 2 с помощью этих функций будут сформулированы. достаточные усло- вия ОПТ ИМИ Л ЬН( 1СТГ1. Числовую функцию Д определенную на выпуклом. множестве X, XeR\ называют если для любых’ двух точек х<4 л:(Ч^х и произвольного числа Хе[Св 1] выполняется неравенство / М+(1 -1) л^) < 1/ и«>) +(! - М / Геометрически свойство выпуклости функции / означает, чтс лицо ее графикакоторая соответствует ~очкам отрезка.,, соединяющего точки x<JJ и x^i, располагается не выше прямой, которая соединяет точ пи гр афиша (Ж*Ч К#11)) и (х^’. К*1*’)) (рнс. 1.4). Простейшими примерами вы- пуклых функций одной перемен- ной служат парабола х2 и эко лонента у=еЛ. Если функция —/ выпуклая на множестве Xt то саму функцию / называют йойя^той. Таким обра- зом,, функции у==^5 и у—•— еж я в.! я югея с or му гыми, С пр а ведд ивы. [8J следу ющм е утверждения... Теорема J.I. Иепрерыяно сЩф* федеи1<нруежал яа былдот .ннож^гтве X функция f вылдода на 3TPJE множестве тоаЭа а только тоасМ, коайа йля любад J£ws- х4®еХ яерно яедовеястао f > f lJ) + (V/ С*”. лЯ -л<*»)} - (1А При меч дине. Если множество X не является пткрытым то и теореме 1..1 имеется! в виду непрерывная дифференцируемость функции / на некотором открытом’множестве» 'содержащем X, В этом же смысле далее в теореме к 2 понимается дважды непре- рывная дифференцируемость функции f ва. X.. Теорема 1,2, и,усть ф^нкц^я / йнтаеЛы йёпрерывно ^цффгрек^ц- Р'рслш ио мвджёбтвв X» хотя бы одну' вя^т- /?еннюю течкр, и W(x) = ее еееегт. Гоабо «Ъя выя$.кло£т. / яд .жноме^гае X не&бхтЗцлно п йостоточно» чтобы .матри^ц V2f(x) быдл ^еотрт^дтойяо онре^ьлеяд црц всех хеХ, г,, е. чгобы черааеястнО' >° <1лс^> выполнялось- йлл всех точек хеХ Аналогичные утверждения имеют место м для вогнутых функ- ций. При этом в формулах (L9) и (1J0) ан зге неравенства сле- дует заменить на С Яеотрщ{с1тельяа-я опр^йелекнО'С:т& матрицы М размера яХ^ по определению означает справедливость .неравенства <£Л4/, для ,15-
всех векторов 2eRn. Матрица М называется положительно-опреде- ленной, если для всех векторов zeRn, гУ=Оп, верно неравенство <Afz, z>>0. Если здесь знаки неравенств и > заменить соот- ветственно на и <, то получим определения неположительно- определенной и отрицательно-определенной матрицы М. Отметим некоторые важные свойства выпуклых функ- ций, предполагая, что X — выпуклое множество. Г. Если числа сь с2, ..., ст не отрицательны и функции fit fa ..., fm выпуклы на множестве X, то линейная комбинация, т. е. функ- п ция ckf* (*)• также выпукла на X. * -i Убедимся в справедливости этого свойства для т=2. Рассмот- рим две произвольные точки х(1\ и произвольное число Xs s[0, 1]. Функции ft и f2 выпуклые, поэтому имеем С1/1 (Хх< п+(1 - X) xt2>) + с (Хх< '>+(1 - X) x< a>)< < q (Vl (*tl)) + (1 -X) /1 (x<2>)) +c2 (X/2 (x<‘)) +(1 - X) f (x<2)» = = X (q/1 (x< 1 >)+Сч/2 (x*1»))+(1 — X) (cjfi (x<2)) + c<J2 (x<2))), т. e. функция сгЛООЧ-СаЫх) также выпукла. 2°. Если функция f выпукла на множестве X, то для любого aS eR множество вида ;хЕ/|/(х)<а| (1.П> является выпуклым. В самом деле, рассмотрим произвольные две точки х(|) и х<2> множества (1.11), т. е. пусть выполнены неравенства /(х°))^а, Складывая почленно эти неравенства, предварительно умножив первое на Хе[0, 1], а второе—на (1—Л), получим нера- венство Xf (xt*>) -|-(1 - X) / (я<2)) < a. Отсюда, используя выпуклость функции /, придем к неравенству /(X^+d-Xjxtsixa. Это означает, что точка Хх(1Н-(1—Х)хФ принадлежит множеству (1.11) при любок< Xs[0, 1], т. е. указанное множество действитель- но является выпуклым. 3°. Если функции fa fa fm выпуклы на множестве X, то функ- ция вида f (х)=max fi (х)=max {/у (x), f2 (x),..., fm (x)J также является выпуклой на множестве X. Действительно, в силу выпуклости функций /j, fa ..., fm имеем max (Хл(1) — Х)х(2)Х max Х)/,(х<2>)1 1-1,2..m 16
для произвольных х(,\ х(2>еХ, Х^[0, 1]. Отсюда следует требуемое неравенство max f i (Хх< 1 * -V (1 — X) х<2>) < X max ft (х<1 *) -|- /»1,2......т + (1 — X) max ft (х<20. 4°. Если функция f выпукла на множестве X, то для любых то- чек х1Ч х(2), ..., х<т>еХ и произвольных неотрицательных чисел Х,1ж л2, ...» Хт вида Xi+X24-..-4-Xm=l имеет место неравенство Йенсена • / (Х^п Ч-х^) 4-...+xfflx<«>) < xj (х(О)+xj <Х(2))4-... + 4-х/п/(л(“)). При т=2 это неравенство совпадает с неравенством из опреде- ления выпуклой функции. Для доказательства неравенства Йенсе- на при произвольном натуральном т>2 используют метод матема- тической индукции. 5°. Предположим, что функция <р(7) одной переменной t выпук- ла и не убывает на промежутке [а, £] (этот промежуток может быть и бесконечным), а функция f выпукла на множестве XczR", причем неравенство a^f(x)^b верно при хеХ. Тогда сложная функция g(x) =qV (х)1 выпукла на множестве X. Рассмотрим две произвольные точки х<]>, и произволь- ное число Х^[0, 1]. Имеем g (Хх<п 4- (J - X) = ?if (ХЛ(1)+(1 - X) х<2>)] < < <Р [X/ (лО)) + (1 - X) f (х<2>) ] < хт I/ (х<»)] + + (1 — X) <р I/ (Л<2,)1=Xg (х<^)+(1 — X) g (х<’>). Непосредственной проверкой можно установить, что линейная функция у—{.с, одновременно и выпукла, и вогнута. Ранее установлено, что гессиан квадратичной функции t/== =y<Qx, х> + <с, х> + 6 с симметричной матрицей Q равен матри- це Q. По теореме 1.2 квадратичная функция выпукла на Rn тогда и только тогда, когда Q — неотрицательно-определенная матрица. Числовую функцию f называют строго выпуклой на выпуклом множестве X, если для любых двух точек x,2IgX, и произвольного числа Л, 0<Х<1, справедливо строгое неравенство / (Хх(» + (1 - X) х<2>) < X/ (х(П)_|_(1 - X) f (х(2)). Для строго выпуклой функции имеет место утверждение, аналогич- ное теореме 1.1; следует лишь в .(1.9) знак неравенства заменить знаком строгого неравенства и дополнительно считать, что х(1>т^х(2Х Точно так же теорема 1.2 дает необходимые и достаточные условия строгой выпуклости функция в терминах матрицы вторых производ- 17
ных, если в (1.10) равенство исключить и дополнительно считать, что z^=On. На основании этого утверждения можно установить строгую выпуклость, например, функций е\ —1пх. В самом деле, для первой функции имёем <V2f(x)x, х>=х2ех>0 для всех х^О, а для второй функции <V2f(x)x, х)=1>0. Линейная функция не является строго выпуклой. Квадратичная функция строго выпуклая, если матрица Q положительно опреде- лена. Введем понятие строго вогнутой функции: функция /(х) строго вогнута на выпуклом множестве X, XczRn, если функция —/(х) строго выпукла. Существует два важных обобщения понятия выпуклой функции. Одно из таких обобщений — псевдовыпуклая функция. Говорят, что дифференцируемая на выпуклом множестве X числовая функция f псевдовыпукла иа X, если для всех точек х(’\ х^еХ, таких, что <v/(xfI)), >0. (1.12) выполняется неравенство ' (1-13) Пусть функция f непрерывно дифференцируема на выпуклом мно- жестве X. Тогда по теореме 1.1 имеет место неравенство (1.9) и поэтому, если верно неравенство (1.12), из (1.9) вытекает (1.13). Это означает, что непрерывно дифференцируемая выпуклая функ- ция всегда псевдовыпукла. Рассмотрим функцию одной переменной f(х) ==—ех. Здесь V)'(x) =fz(x) =—ех. Пусть для точек xj, x2eR верно неравенство (1.12), т. е. —е* - (хг—х^^О. Отсюда следует, что Xj^xa, а зна- чит, верно неравенство (1.13), т. е. —ех*^—ех‘. Таким образом, функция —ех псевдовыпукла на R. Заметим, что эта функция не является выпуклой (она вогнута). Это означает, что класс псевдо- выпуклых функций включает класс непрерывно дифференцируемых выпуклых функций и является «шире» последнего. Функция f (х) называется псевдовогнутой на выпуклом множест- ве X, если на этом множестве псевдовыпукла функция — Цх). Проверим, что дробно -линейная функция, т. е. функция вида где a. ceR”; b, deR, одновременно псевдовыпукла и псевдовогнута на про- извольном выпуклом множестве X, на котором выполнено неравенство <с, x>+d4fe0. Имеем <v/(x“>), х<2>-х<1>) = (g, х™-х™} ({с, х™) 4-d) — (с, «а. л<х>) + ») «с, х<1)) + d)2 ((д, х(2)) +ft)((c, х(|)) + d> — ((g, x<u) +О((с, л<2)) + d) ((с, х(1)) ч-d)2 18
Пусть (е* W Числа <с# ж^У+д, и <е# x'f2j)+d имен? одни и ют жи знак» поскольку в про- тивном случае нашлась такая точка r1Ss на эгрет между точками н ,sl‘}, что « хР’Н’#—О н Уыножвя мср^ЕенстРО (а,х<2>)+»\ = ((й, *<>) +Ы&, W) 0 («.х‘»)+^ «с, х“>) *-Л- ия положительное число «с. x',J)+<£)/(& л^’>+^). получаем <«.*<”)+» U .*<>)+» O.^J+rf {«.*<•>)+* *' млн Тем самым всевдойШуклость яробно-линейной функция, уетдако-йеил. Диалогично можно йрогерщь йсевдовогиутостъ этой фуннммн, Другим пажным обобщением выпуклой функции является ива- а нёс пух лаг функция. Числовая функция f„ определенная на вы пук- лом множестве X, называется квдч^яыпдодоб на множестве X, ес- ли для любых точек х<4 xWeX н любого числа Хй|[0, 1], выполня- ется неравенство / (MW+< 1 - X) XR < max (/5. Поскольку X/ (х<^+(1 - X) / (х<^ С max ./ *f)t / (х®)), Хе [0.. I], аьш.укдая т. е класс квазнвыпук лык функций содержит класс выпуклых функций. Более того., мож но .доказать* что &ШСС ссе/ф- gejM azhs? лмт функций Ш&ЁрЭОТ КЛАСС г2 Сдод&ВШ ПУХЛЫХ фрмодий. На рис^ Кб, й* б( в изобра жени графики выпуклой, исендошиуклой и квази вы- пукл ой функций од и ой пере- менной. Важное характеристике- свое свойство квази вы пук дш функций устанавливает г лед у ю ищи тес i ? м а.. Теорема £.3. Для того Рис.. J.S чтсЛы ф^н^«|Ыл: заданная на вылдолол< ляжете X была на зтлда оазывындооры,. wt обходндо а ^остаточяо, жтобы <?ля любого шела аоЦ .иножестзо Яв We=(XE^|/(X)<H| б&ыо выпуклым. 19
□ W e q 6 x о Д и моет ь. Пусть функция f квази выпукл я на мно- жестве X Рассмотрим две произвольные точки я<4 .^eWb, где п — произвольное фиксированное число. Тогда выполнены неравенства f(xtl!)C&, м* поскольку функция f квази выпукл а, при любом / Хе[0, 1} имеем /(UW+(I 1)< max |/( / СжИ>)| < а. —>• Это означает, что >.х№ + (1—ЭДлс^е etf* Выпуклость множества Я, уста- новлена. Достаточность, Теперь пусть Рис. D-fi для каждого a^R множество Яа зы- кукла. Рассмотрим две произвольные точки. t-', Предположим для определенности, что имеет не* сто неравенство /(x^>/(xW), (1.14) и' введем число а равенством в«/^ * С1Л5) Б силу выпуклости множества //* при данном а имеем 1 ёШ^(1 _F,a для .любого 1]„ По определению множества Д* это означает, что выполнено нера- венство' Отсюда, используя формулы (1-14) и (1.15), .получаем / (W +(1 X) <«=/(,- max (/ / (xOi)} - Следовательно, функция J квазнвыпукла, ri На рис, L6 приведена геометрическая иллюстрация к доказан- ной теореме. Глава 2 ТЕОРЕТИЧЕСКИЕ ОСНОВЫ ОПТИМИЗАЦИИ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ В главе дана математическая постановка задачи оптимизации, приведены определения оптимальной точки и оптимумом (ловаль- ного и глобального). Рассмотрены случаи, кое да задача оптимиза- ции разрешима, т. е. когда существует оптимальная точка и detm- мум. Проводится классификация задач оптимизации и рассматри- .20
ваются постановки задач линейного, нелинейного и геометриче- ского программирования, а также дана математическая постановка задачи оптимального управления дискретной системой. Основное содержание составляют необходимые и достаточные условия опти- мальности и теоремы двойственности выпуклого и линейного про- граммирования. § 2.1. МАТЕМАТИЧЕСКАЯ ПОСТАНОВКА ЗАДАЧИ ОПТИМИЗАЦИИ 1. Допустимое множество и целевая функция. Постановка за- дачи оптимизации содержит множество допустимых решений X и числовую функцию f, определенную на множестве X, называемую целевой функцией (а также критерием оптимальности или крите- рием качества). Множество X также называют допустимым множе- ством или множеством возможных решений. В первых семи главах настоящей книги понятие решения ото- ждествляется с вектором (точкой) «-мерного евклидова простран- ства Я». В соответствии с этим допустимое множество X представ- ляет собой некоторое подмножество пространства R", т. е. XcRn, а целевая функция — это функция f(x) «переменных хь х2.. хи. Не исключается случай равенства X=Rft. Для указания элементов множества X наряду с термином «решения» далее используются термины «векторы» и «точки». Нестрого говоря, задача оптимизации заключается в выборе средн элементов множества X такого решения, которое было бы с определенной точки зрения наиболее предпочтительным. Сравнение решений по предпочтительности осуществляется с помощью целе- вой функции. Выделяют два варианта сравнения произвольной па- ры решений с помощью функции f. Можно считать, что решение предпочтительнее решения х<2), если выполнено нера- венство f(х°>)<f(x^). Тогда поиск наиболее предпочтительного решения среди всех элементов множества X заключается в нахож- дении решения, доставляющего наименьшее возможное значение целевой функции f на множестве X. В этом случае задача оптими- зации представляет собой задачу минимизации. Если же считает- ся, что решение предпочтительнее решения х<а), когда выполне- но неравенство f(х0)) >J(xl2)), то поиск наиболее предпочтитель- ного решения представляет собой задачу максимизации функции f на множестве X. Чтобы решить задачу минимизации функции f на множестве X, нужно найти такой вектор х(0,еХ (а также соответствующее значе- ние чтобы неравенство / (х<0)) (х) было выполнено для всех х^Х. При зтом решение называют оптимальным (точнее говоря, минимальным), а значение f(x(0)) — оптимумом (миниму- мом). Тот факт, что решение л5°> оптимальное, т. е. доставляет наи- меньшее возможное значение функции f на множестве X, записы- вают в виде ж=Л' 21
а для постановки задачи минимизации используют запись у (х) — га». Зодавд дедеимдеофш заключается в отыскания такого вектора ^cteA’ (и соответствующего значения Д^й которого мера* веиство/(^03|)^Дж) имеет месте при всея хв*Х Если х[Щ} — ре- шение задачи максимизации, то используют запись / (л<®3) =тмх / (М* При 31 ом х’®1' называют .мгкън^дльягм* (оптнмдльмым) решек тол, а значение f tUs7Jj — ляксдидоод (олтиждоод). Как указано выше., решить задачу оптимизации означает найти оптимальную точку xR' и оптимальное значение /(^). Если най- дена оптимальная точка,, го определение оптимального значения обычно не -составляет труда. Если же найдено только оптимальное значение j'Ut0}X то- для отыскания оптимальной точки необходимо решить уравнение =/£:^Oj)i что может составить сложную вы- числительную задачу.. В настоящей книге в основном рассматриваются задачи мини- мизации. Все результаты, подученные для задач минимизации» можно легко переформулировать применительно к задачам макси* мнзацим. 2. Локальный и глобальный минимумы, В теории оптиммзашш удобно рассматривать дм я ид а оптимум ов: локальный и гл оба ль* ный. Говорят, что точка аЯеХ доставляет функции f на множе- стве X локальный жшшлим, если существует такая окрестность (е>б) точки ж<4 что неравенство Дж0*) <f(x) справедли- во- для. всех Глоб&лоый лшн&мдо функции f достав- ляет точка для которой вакнсанное яыше неравенство выпил* няегсм при. всех же Л. Таким образом» глобальны! минимум—это просто минимум, в смысле определен ня» .данного- в пре- дыдущем пункте. Прилага- тельное «глобальный». ис- пользуется ДЛЯ ТОГО, чтобы подчеркнуть отличие этото м инн му м а ст локального ми- нимума. В соответствии с приве- денными опрел ел-ениями и пер в о-м случае точку на- зывают точшй, локального рж. 2Л мйвддарш» а оо втором — ТОЧКОЙ ,сЛоблЛбНО0О МДОДОф» ля. Таким образом.,, выражения — минимальная точка»,, *.i‘® = решение задачи минимизации» и <x*BJ “ точк а глобального мини- мума» означают одно и то же.
Аналогично определяются понятия точки локального и глобаль- ного максимума, а также локальный и глобальный максимумы. Точка локального минимума не всегда является точкой глобаль- ного минимума (рис. 2.1), а значит, и локальный минимум не всегда совпадает с глобальным минимумом. В следующем ниже утвержде- нии формулируются условия, накладываемые на множество X и функцию Д, при выполнении которых указанные точки (и минимумы) совпадают. Теорема 2.1. Если множество X<=Rn выпукло, а функция f вы- пукла или же псевдовыпукла на X, то всякая точка локального минимума является и точкой глобального минимума. Напомним,* что определения выпуклой и псевдовыпуклой функ- ций приведены в п. 2. § 1.3. □ Пусть функция f выпукла и — точка локального ми- нимума, т. е. существует такое число е> О, что выполнено неравенст- во f (л50))(л) для всех №Xf]t7e(x(°>). Рассмотрим произвольную точку х'^Х. Множество X выпуклое, поэтому точка х = ?лс(0>Ч- + (1—>.)х' принадлежит множеству X при любом Х^(0, 1). Но при значениях Л, близких к единице, точка х «попадает» в окрестность £/е(х<0)) и, следовательно, для нее выполняется записанное выше неравенство, т. е. / (аг(°О < / (Хл<°>+(1 - X) х'). Отсюда, так как функция f выпуклая, имеем / (х<°>) < V (х<°>)+(1 - а) / Рс'). В результате несложных преобразований приходим к неравенству /(х<°>) ^f(x'). Так как л'— произвольная точка множества X, то Лчо> — точка глобального минимума функции f на X. Пусть теперь функция f псевдовыпуклая и f(jtf°>) —ее локальный минимум. Докажем, что f(x^) является и глобальным минимумом. Для этого предположим противное: найдется точка х*еХ, для ко- торой выполнено неравенство f(x*)<f(л(0)). Функция f псевдовы- пуклая, поэтому из последнего неравенства следует <Vf(A50)), х*—х<0,><0. Согласно определению дифференцируемости функции f в точке л(0> имеем /(л(°>+л(л*—л<°>))=/(л(°>)4-^ (v/Ctf01)» л*—+ л<°>|| а (л(0), Х(л* —л1°>)). (2.1) Поскольку участвующее в этом представлении скалярное произве- дение меньше нуля и а(х(0), Х(х‘—л5°>))-*-0 при >-0, найдется такое положительное число Хо, что для всех чисел (0, fa) будет выпол- няться неравенство лК?/(л(0)), х* — л<°>) +||х*-л(0,||а(л(0\ Х(л*-л^))1<0. 23
Следовательно, из равенства (2Д) получаем неравенство / (л<®>+1 (х* - -л-^</£л<^) для всех Х^СО,^, Здесь число 1 можно выбрать настолько малым, чтобы выполнялось условие хЯ+1(х*—хОТ)^ХГ||Уе{^с®}.Ь Эго .противоречит тому,, что *ОТ -точка локально:о минимума. Следовательно, сделанное пред- положен ice неверно и на самом деле локальный минимум. f яв- ляется глобальным. .Для оазнвыпуклой функции f утверждение теоремы, вообще го- воря, неверно. 3 этом позволяет убедиться простой пример функции одной переменной f = sign л, например на отрезке [—1, И. Здесь точка лОТ—0,5 является 'Точкой локального .минимума, но не являет- ся точней глобального минимума. « 2Т, РАЗРЕШИМОСТЬ ЗАДАЧИ ОПТИМИЗАЦИИ I. Теорема Вейер штрасса. Сформулированная в предыдущем параграфе задача оптимизации '.имеет решение не при любых целе- вых функциях и допустимых множествах. Существуют задачи,, в ко- торых невозможно найти оптимальную точку и оптимальное значе- ние. Например, не существует точек минимума функции одной переменной f на множестве X в случаях, изображениям на рис. 2J. В первом: случае точка минимума не существует, поскольку множе- ство X незамкнутое. Во втором случае вследствие неограниченно» рас. 2.2 ста X. Наконец,, ь третьем случае минимум не достигается из-за того, что функция f не является непрерывной. Эти примеры приво- дят к мысли, что в случае не прерывной целевой функции и: замкну- того ограниченного (?, е. компактного) допустимого множества за- дача оптимизации должна шметь решение, - Действительно, имеет место следующее утверждение, которое называют теоремой Вейерщтрасса. Теоремы 2,2. £₽лм XczR'1 ме л^сто м колпшктад., й? функция f нелрерквча на лея, то лмтзсссгло точек глобального лн- ннжуна fa также жиоясестно точек алобальадго лшмлфла) не / усг. iz компактно. Н lacTHOGTii, задача оптимизадин всегда разрешима,, если до- « verntoe множество содержит конечное число элементов.
- В теореме Вей ер шт р асса требование компактности множества X является' довольно «жестким». На практике нередко встречается допустимое множеств j вида X = [ж е5 Rw| > О, । = К 2,.,., л|т которое не является ограниченным., а значит, и компактны и. .Приве- дем утверждение аналогичное теореме Вейерштрасса, н котором не требуется ограниченность допустимого множества, однако предпо- лагается, что целевая функция кроме непрерывности должна, удо- влетворять некоторым дополнительным, условиям. Теорема 2.3, i/усть — яедд/сгое эдшугое жне^еегчо с фдокодоя ® .непрадьшн© rta нгл Рр^лоложмм, что а.ы до лнягтся ло леере оояп .цз фелоний: 1) вдщеегзрет гадоя точка ХеХ что лмсмесгво aweta {.veA'VWCfU')} ограничено; 2) о'ля любой лосде^вагельдостм точек жюжеетад X сбладдоодей тем сдойстдом, что Hm ljX*3j— J-ос (если такая после- л F Ml -йидат^льчост.& иайоетоя}, справедлив© равенство lin / 4=оо. ifc-FW Toao'o. множество точек едобадолого лшшшйрма яе пдото а jwjw- даятод Доказательства сформулированных теорем, можно найти в I8J. Рис. 2.3 иллюстрирует теорему .2.3 при выполнении условия 1). - 2. Обобщенная задача ы.тимн/ацнн. В теории оптимизации иног- да удобно рассматривать более общую задачу оптимизации, в ко- торой н©нятне решения определяет- ся: таким образом, что "оно всегда существует. Для того чтобы! сфор* мул.кровать зту обобщенную задачу, .понадобится определение точной нижней грани. Число (Или си мз о л — да) Я и &- .зывают точной кнжнвй. грам&ю или дафил<у.л«ож функции f на множестве X,. если, неравенство * име- Рнс. 2,3 ет места для всех xeiJY и,, кроме то- го, для любого числа /*>7е найдется точка такая,, что верно неравенство Тот факт», что р = точная няж-нян грань функции /из множестве X» записывают в виде (Z2) Аналогично вводится жжятие точной верхней Грайн. Число (или символ +aoJjF* называют точмлш .верхней аржью или. функции f о множестве X если неравенство справедливо для всех хеХ и для любого числа f <[* нгйделточка. х':=Х та- * Считается» что — « меньше люСого чнгла. 25
кая, что верно f(x')>f'. Для точной верхней грани используют обо- значение /*=sup/(x). х&Х В курсе математического анализа доказывается, что произволь- ная числовая функция на любом непустом допустимом множестве имеет точную нижнюю и точную верхнюю грани.Так, например, точ- ная нижняя грань в случаях 1) и 3), изображенных на рис. 2.2, обозначена через f°. В случае 2) на этом рисунке —оо. Из примеров видно, что не всегда можно указать точку, в кото- рой точная грань достигается, т. е. точку х(0), для которой /(х(0))= « inf / (х). Поэтому в обобщенной задаче минимизации / (х) —»inf леХ х->х под решением понимают не отдельную точку, как это имеет место в обычной задаче оптимизации, а последовательность точек {х(*)]Г-1 * х<*>еХ, А=1, 2,.., такую, что lim /(x<ftJ)—(2.3) Эта последовательность всегда существует и называется минимизи- рующей последовательностью. Любая подпоследовательность ми- нимизирующей последовательности сама является минимизирующей последовательностью. Поэтому, как правило, минимизирующих последовательностей «довольно много». Таким образом, обобщенная задача минимизации целевой функ- ции f на множестве X заключается в отыскании числа (или симво- ла —оо) и последовательности точек |х<*>|Г-ь к«1, 2, ..., таких, что выполняются равенства (2.2)—(2.3). Как отмечено выше, эта задача всегда имеет решение. § 2.3. КЛАССИФИКАЦИЯ ЗАДАЧ ОПТИМИЗАЦИИ 1. Задачи без ограничений и задачи с ограничениями. Если X=Rn, то говорят о задаче минимизации без ограничений. Действи- тельно, в этом случае нужно найти такую точку х^0), чтобы неравен- ство /(х<°>) ^f(x) выполнялось для всех точек пространства R” без ограничения. Часто задачу минимизации без ограничений называют также задачей безусловной минимизации. При этом для характери- зации точки минимума и самого минимума добавляют прилагатель- ное «безусловный». Если X^Rn, то имеет место задача минимизации с ограничения- ми. В этом случае также говорят о задаче условной минимизации, о точках условного минимума и об условном минимуме. Соответствующая терминология вводится и для задач максими- зации. ЕсАи допустимое множество X задано в виде [хееR* | gj(x)<0, /=1, 2,...,k\ g,(x)=O, /=А-|-m|, (2.4) 26
где все числовые функции g'j определены на Rn, то говорят о задаче математического программирования. Среди задач этого класса раз- личают задачи с ограничениями типа неравенств — когда множество X имеет вид (2.4) и m—k; задачи с ограничениями типа равенств — когда в (2.4) неравенства отсутствуют, т. е. k—О, и задачи со сме- шанными ограничениями — когда в задании множества X встреча- ются как неравенства, так и равенства. 2. Задачи математического программирования. Если целевая функция f и функции gj. g3,..., gm из (2.4) линейны, то имеем общую задачу линейного программирования. Часто рассматривают стан- дартную задачу линейного программирования, которая записывает- ся следующим образом: /(лс)= (с, х) —»min при условиях x)^bh у = 1, 2,..., k, х£>0, /=1, 2,..., л, где с, дМ, — фиксированные векторы из R", а Ь(, Ь2, .... bk — фиксированные числа. Выделяют также каноническую задачу линейного программирования: {с, х) —»mln; (aV\ x)—bJt /=1, 2.....А, х,>0, х = 1, 2,..., л. Линейные функции являются наиболее «простыми» функциями, по- этому задачи линейного программирования в определенном смысле проще остальных задач математического программирования и бо- лее детально исследованы. Если средн функций f, gh gz, ..., gm имеется хотя бы одна, не являющаяся линейной, то говорят о задаче нелинейного програм- мирования. В классе задач нелинейного программирования выделяют зада- чу квадратичного программирования. В этой задаче целевая функ- ция является квадратичной /(x)=~(Qx, х) + (с, х), где Q — числовая симметричная матрица размера пХп, с—фикси- рованный вектор из R", a gi, g%.gm — линейные функции. Задачей выпуклого программирования называют задачу мини- мизации выпуклой целевой функции f на множестве (2.4) при вы- пуклых функциях gh £2, ..., gh и ЛИНвЙНЫХ функциях gk+l, gm- Особое место занимают задачи геометрического программиро- вания и оптимального управления дискретной системой. 27
3. Задача геометрического программирования. В задаче гео- метрического программирования все функции f, gXt gs, ..., gh пред- став ляют собой позиномиальные функции (позиномы) вида т J \Х)—^>C[Xi Х2 •••Хп > e-i mi ,, eU> flM) а(Л g}(x)=^clinxia X22 -хЛ y = l, 2,...,A, i-i (2.5) (2.6) где все числа clt eV* —положительные, показатели степеней а1Ь а\{\ произвольные фиксированные числа и компоненты вектора х так- же положительные. Сама задача геометрического программирова- ния записывается следующим образом: / (х) — min; Sy (х)1< у^=1, 2,..., А, xf>0, Z=l, 2,...,/г, где целевая функция имеет вид (2.5) t а функции-ограничения — вид (2.6). Поясним, почему ограничения записаны в виде неравен- ства £у(х)^1, а не как обычно: gj(x)^®- Поскольку все коэффи- циенты и компоненты вектора х положительны, для функции gi вида (2.6) неравенство gj(x)^0 решений не имеет. Поэтому для позиномнальной функции gj ограничение естественно запи- сать в форме неравенства gj(x)^'bjt где Ь,>0. Разделив обе час- ти неравенства на bj, приходим к неравенству £>(х)=^1, где обо- значено gj (х) =gj (х) [bj. Многие задачи технического проектирования приводят к задаче геометрического программирования, которая представляет собой задачу нелинейного программирования специального вида. 4. Задача оптимального управления. Предположим, что имеет- ся некоторая система, в которой переход из одного состояния в дру- гое происходит в дискретные моменты времени t— 1, 2,...» N. В зада- че оптимального управления имеется два типа переменных: пере- менные управления (г-мерные векторы) и переменные состояния системы (л-мерные векторы) *'>=(4°. 4»......4’)’. Векторы управления и&) можно выбирать из соответствующих множеств допустимых управлений: / = 1, (2.7) При заданном состоянии х«-|> в момент времени t—1 изменение со- стояния от момента I—1 к моменту i задается векторной функцией 28
лршбразоваяш вида .....ЙРи»-1», «">))’. зависящей от предыдущего состоя имя ж**-» и управления мФ в дан- ный момент времени I. В векторных обозначениях закон изменения состояния системы с течением яремежи описывается равенствами Й(ОК f^is 2,_^ 1 (2Л) Яачолыюе шст&яяш tW в момент времени /=0 считают заранее заданным.. Говорят, что соотношения (2.7) и (2.81 определяют здстеод #продления. Процесс управления этой системой происходит следующим образом; При i=G система находится в состоянии .Л Выбор некоторого допустимого управления переводит си- стему в состояние x<!>=£01{jew\ соответствующее моменту времени /= 1, Далее, если выбрано управление аФ^Ё/д, то в мо- мент времени <=2 состояние системы определяется равенством (2,8) я имеет вид «(i,J нт, д, В результате 'лльдадодь- тедыюстб улр^елюшЯ н[,\ 'М®,, .... согласно (2.8), однозначно он редели г соответствующу ю последов а тел ьн ость состоя- ний j£w, ...,,,, .назы- ваемую1 траекторией сдоте- jwol Различным последова- тельностям допустимых управлений будут соответст- вовать. вообще говоря, раз- ли чи ьзе тр зек тор i и... Рис, 24 иллюстрирует переходы системы из одного состояния в другое для ДО=В и двухэлементного множе- ства допустимых управлений tOi *=1, 2, 3. Со- стояния 'Обозначены точками,, а переходам из одного состоя имя в другое соответствуют стрелки. В' этом, примере об лее число после- довательностей допустимых управлений и соответствующих траек- торий равно 23=& Качество управления дискретной системой оценивают кратарц- ожижальяосто суммарного'вида ^2^ й(П)л ~ (2i9> |у..г Зпб'ачо олтндадльмоао упрй.0Дйг«.ия заключается В отыскания та- кой. последовательности допустимых управлений и соответствую- щей траектории, для которых критерий оптимальности (2.9) прн- 25
нимает наименьшее возможное значение. Другими словами, в за- даче оптимального управления выбором допустимых векторов управлений требуется минимизировать критерий оптимальности /; при этом система должна удовлетворять начальному состоянию л<0> и изменяться во времени согласно равенствам (2.8). В более сложных задачах оптимального управления кроме ог- раничений, накладываемых на выбор переменных управления (2.7), имеются также ограничения на переменные состояния {фазовые ограничения): х(‘> е/,с R", /= 1, 2...ЛГ. (2.10) Несмотря на внешнее несходство задачи нелинейного программи- рования и задачи оптимального управления, между ними имеется тесная связь, которая будет установлена в следующем параграфе. Одним из распространенных методов решения задачи оптималь- ного управления является метод динамического программирования. Изложению этого метода посвящена гл. 4. § 2.4. СВОДИМОСТЬ ЗАДАЧ ОДНОГО КЛАССА К ЗАДАЧАМ ДРУГОГО КЛАССА 1. Задачи минимизации и максимизации. • Рассмотрим задачу максимизации Л (дс)—> max. (2.11) хек Эта задача сводится к задаче минимизации /(л)—* min, (2.12) хеХ если положить f{x) =—h(x). Действительно, если —решение за- дачи минимизации, т. е. /(х(0))</(х) для всех хе (2.13) то, учитывая равенство f{x)=—Л(х), получаем отсюда неравенство Л (дс(0)) Л (де) для всех хе/. Это означает, что каждое решение х(0) задачи минимизации (2.12) является также решением задачи максимизации (2.11). Аналогично можно проверить, что каждое решение задачи максимизации (2.11) является решением задачи минимизации (2.12), если f(x) =—h(x). При этом оптимальные значения обеих задач связаны равенством дх<0))---Л(х(°0- 2, Задачи оптимизации и математического программирования. Задача математического программирования представляет собой частный случай задачи оптимизации, когда допустимое множество X задано в виде системы неравенств (2.4). Но общую задачу мини- мизации (2.12), в свою очередь, можно записать в виде следующей 30
задачи математического программирования: f(x)->min при ограни- чении g (л) ^0, где функция g определяется, например, так: g(X)= 0, если хеЛ, 1, если х^Х. Следует отметить «неконструктивный» характер задания функ- ции g. 3. Монотонное преобразование целевой .функции. Пусть F— строго возрастающая функция одной переменной, определенная на множестве значений функции f (в частности, F может быть опреде- лена на всем множестве R). Множество точек минимума задачи (2.12) совпадает с множе- ством точек минимума задачи FI/ (*)1 — min. леХ (2.14) В самом деле, если выполнено неравенство (2.13), то в силу стро- гого возрастания функции F получаем неравенство для всех хе/, т. е. х<°> — решение задачи (2.14). Обратно: если точка х(0) удовле- творяет последнему неравенству, то выполняется неравенство (2.13), так как в противном случае из неравенства f(x<°>)>/(x) следует неравенство Flf (xi°>) ] >F[f (x) ]. rt t s В соответствии с этим целевую функцию /(х)=е'“* можно - п заменить, например, функцией FI/(x)]= л?, так как функция 4 — 1 F(t) =1n I строго возрастает на множестве (0, 4-оо). Вторая целе- вая функция проще первой, а множества их точек минимума на XcRn совпадают. На этом же основании вместо недифференцируемой функции |f(x)|, где f—дифференцируемая функция, можно использовать новую дифференцируемую функцию Р(х) (так как функция F (/) =tz строго возрастает на [0, + оо)). Вообще, если значения целевой функции f на множестве X по- ложительны, то ее можно заменить любой из следующих функций: /• (х) (а > 0), — 1// (х), 1 og₽ / (х) (fl > 1)- 4. Ограничения в виде равенств и неравенств. Ограничение-ра- венство g(x) —0 в задаче математического программирования всег- да можно заменить двумя ограничениями-неравенствами: g(x)=0- g(x)>0, g(x)<0. 31
С другой стороны, ограничение-неравенство можно замените экви- валентным ему ограничением-равенством: £(Л)<0<—> | g(x) I 4-g(x)=0. Этого же можно добиться, вводя дополнительную переменную xn+j: g (х)< 0 ----g (х) + х„1-1=0. 5. Задачи оптимального управления и математического про- граммирования. В предыдущем параграфе была сформулирована задача оптимального управления, которая представляет собой за- дачу оптимизации специального вида. Здесь будет показано, что между задачей оптимального управления и задачей математическо- го программирования существует тесная связь. Оказывается, любую задачу оптимального управления всегда можно представить в виде некоторой задачи математического программирования и, наоборот, каждая задача математического программирования представима в виде одношаговой задачи оптимального управления. Запишем задачу оптимального управления в следующем виде: найти последовательности векторов хт, л“’...х<к\ ... которые подчиняются равенствам j = 2....Л\ и неравенствам М“(ПХО, /=1, 2.........N, Л(х(О)<0, /=1, 2....N, (2.15) (2.16) и, кроме того, доставляют наименьшее возможное значение крите- рию оптимальности «<*>). Г-1 Приведенная постановка отличается от постановки задачи опти- мального управления из § 2.3 только видом ограничений на пере- менные состояния и переменные управления, т. е. вместо включений {2.7) и (2.10) здесь имеют место соответственно неравенства (2.15) н (2.16). Такая замена одних ограничений на другие право- мерна в силу рассуждений, приведенных в п. 2 данного параграфа. Введем переменную Z=(x<1\ х(’)...х<ЛГ>, представляющую собой вектор размерности nN + rN, составленный из компонент векторов состояний и компонент векторов управле- ний, которые записаны в порядке возрастания номеров компонент. 32
Введем следующие функции переменной г: Я(/<г)=д;У'-5У>(ж«-Ч «<'>),/=1, 2......JV, /=1. 2,..., л, i=l. 2....N, ^2,(г)=А(х«>), /=1, 2.....7\Z, Z-1 где — j-я компонента векторной функции преобразования g[t) из формулы (2.8). Теперь задачу оптимального управления можно представить в виде следующей задачи математического программирования: f (z) — min при ограничениях g0(z) =0, /=1, 2,...,/V\ у = 1, 2,..., л, /«I, 2...../V, «Рм<0, /=1. 2,...,N. С другой стороны, задачу математического программирования /(х) —min; gy(x)<0, 7 = 1, 2,..., А, можно записать как одношаговую задачу оптимального управления системы, в которо^ переход из состояния в состояние х(,) проис- ходит согласно закону x(')=g(O(Xt'-n /=1( при фазовых ограничениях «У’<0, / = 1, 2....k, с критерием оптимальности л*1»), где х<°>—0А, У1 л(1 >)=/(%), gJ1JC*(0J. «(1))~7=1, 2.........А. 6. Замечания. Рассмотренные простые приемы позволяют зада- чи оптимизации одного типа сводить к эквивалентным задачам дру- гого типа. Это указывает на их общую природу и позволяет методы, разработанные для какого-то одного класса задач оптимизации использовать для исследования и решения задач другого класса. 2-339 33
Однако ие следует считать, что, заучившись решать та дач и какого- либо одного гний (например, с ограничениями- ране нетвами), можно успешно решать и задачи другого типа (наир имер» с ограничения- мн неравенств а ми), сводящиеся к ним.,, Дело в том, что при сведении одних задач к другим может юярасти их .сложность (увеличиться число переменных или ограничений' и, кроме того, в новой задаче могут быть потеряны некоторые полезные свойства старой задачи (например, дифференцируемость функций-ограничений). § 2К НВОВХадНЛШЕ И ДОСТАТОЧНЫЕ условия ОПТИМАЛЬНОСТИ В СЛУЧАЕ ДИФФЕРЕНЦИРУЕМЫХ ФУНКЦИЯ 1. Антиградиент и его свойств®. Любой ненулевой вектор задает определенное я пространстве R". Так, на* пример, если —некоторая точка из Rnf то множество вида 1|х е Xя | при некотором r>U* представляет собой луч, исходящий из точки xW в направлении век- тора у (рис, 2.5). Если функция f дифференцируема в. точке iWeXcR”, то суще- ствует градиент Vf(.x®), который является некоторым вектором, .пространства R1. Вein op — Vf(rw) называется питаарддщ’нтол; его дли? на совпадает с длиной градиента, а иаправление i ротиво положив на- правлению градиента., Ст личный от нулевого вектора антиградиент за- дает определенное направление в пространстве R^. Это направление обладает важным свойством, смысл которого' раскрывает следующая лемма. Лемма X L Лх/сть функедш f гЬф* фе/меффуода в точке x<CJeRn, вектора y<eRrt вйиолнлстсч нерпвач.гтао /Тре$/юложн;м, «то йл.ч ._ и_________ ____ (.—у»0, Гоачйз ма.йс1е1г’Гя такое положительяой «пело о, что йо?х Тб (0, о) в£р*ю яерй^нство; /(x«+T^)</(x<&j).. (2ЛП П Рассмотрим вектор ,х=.х<^+“ЭД при т> 0. Так как функция / дифференцируема з точке х^\ тс инест место равенство / (х^+^)^/и^+ -Ф) +* f| £ ||| аСлП 34
Рис, 2.'G откуда следует v /(лс<4 у)- № I JrffDH +w>t (2Л8) Поскольку п(х®„ x^+tyJ-M) при t=HJ> и по условию вы полиене неравенство <—V^ifX11). #>>0, для некоторого достаточно малого числа о правая часть равенства (2.18) положительна при каждом т^(О, о], В этом случае положи- тельной будет и левая часть равен- ства (2,18),, что влечет неравенство (2-17). Отличный от нулевого вектора а и т и гр а диент — V j (jf№) опр е, дел я ет некоторое1 открытое полупрострам- ст во ' (уо R" I <—V,,c ,' 5 > >0} (рис, 16). На этом рисунке все век- торы изображены приложенными к точке Из леммы 2.1 следует, что любое достаточно малое пе- ре мешение из точки xtoi в ивправлении нет ора 4/ указанного полу- пространства ведет к уменьшений значения функции f со сравне- нию с ее значением в точке Таким образом,, аитиградмент ука- зы в1 де г на о рад лен и е у б ыь з И и я цел е вой ф у и вди и *, Эго за меча тел ь- ное свойство анти гр ад,пента положено в основу многих вычиедн- тельных методов поиска оптимальных точек, 2. Необходимые и достаточные условии минимума в задачах без ограничений- Теорема 2.4. Л^сте функция / йцфффешдаф^а е точке x$teR,4. Для того чтобы точтш были точкой бюдоде- ыого локального Ж'ШЛум® фикции Д необло^мло- чтобы шло жесте равенство v/(xOT)=Offl. (119) О Действительно, если — точка безусловного локального минимума и то для вектора получаем (—v / у) s ( - v / ~ V /(aR} Б этом случае согласно лемме 2.1, совершив достаточно малое перемещение на точки в. на драв лен пн вектора —можно получить значение целевой функции меньшее, чем f(x^).. Это .про- тиворечмт тому, что —точка локального' минимума. " Теорема 2:,4 представляет собой распространение известной из математического анализа теоремы Ферма н.а случай функции мно- гих. переменных. Поскольку точка глобального минимума является и точкой локального .минимума, равенство (2.19) представляет * Нрлрвмлеиие возр^стачья ф^'нкшжи: у£а?мраег еь рраднент, 2*
тахже необходимое условие того, ч^збк точка. ли была точкой глобального минимума в задаче без ограничений. Б соответствий с теоремой 2.4,'' если функция f дифференцируй на, точками локального (знечит, к глобального) минимума в зада- че без ограничений могут быть только те точки, и которых гради- ент функции обращается в; нулевой вектор. Таким образом, реше- ние задачи безус лобной минимизации функции / следует искать средн решений системы уравнений (2.19), которая в покосрдинат- кой форме имеет вид. ЗШ=О, i=l, 2.л. <4 Решении этой системы уравнений называют сгацномаркылш точка- лш функции Д Такне точки являются «подозрительны мн» на опти- мальные, Если известно, что число стационарных, точек конечно,, то остается найти их и отобрать точку минимума, сравнивая значения: функции в этих точках, Следует, одна koi, заметить» что решение си- стемы уравнений (2.1У) может соста- вить сложную вычислительную задачу и поэтому практически реализовать |Указ.анн,ый подход не всегда возможно» ( .Условие (2.19) является не обходи- /мы.мл. но не достаточным условием оп- тимальности точки Это означает., что' стационар и ал точка может ока- 19 л ваться точкой'локального иди глобаль- ного максимума* а в некоторых ^луча- *f*2-7 ж. не _ являться ми одной из них (рис. 2.7). В этом отношении полезным свойством обладают ясевдовыпуклые (в частности, дифференцируе- мые: выпуклые) функции: лн/бяя стационарная точка псен^овыирк- льй фдокфш яв'ллегся1 точкоД безусловного сльбсимозо .данчм.нужд». В самом деле, если — стационарная точка функции f то. спра- ведливо равенство! 7/(ДО)=(1П1 а значит, равенство верно, для любого вектора x^R". Функция / исевдовы- кукла я на множестве Rn, отсюда следует, что неравенство f) нмеет место для дюбого хеR/\ Таким образом* для псевдо выпуклых функций равенство (2Л9) является как необходимым, так и достаточным условием того, что- бы точка была точно»!: безусловного глобального минимум а.. Для задач максимизации аналогичным свойством обладают яеердовпг* нутые функции. Рассмотрим квадратичную функцию /«==• (<?*• *> + <«. *}+ь. где У (^4 j) n х-п — нест р .йцательно-обределенна я си мм стр ичн л я числовая матрица* ааЙя й Как отмечено в предыдущей гла* 36
ве, такая квадратичная функция является выпуклой. Вычислим ее градиент: и приравняем его нулевому вектору: Qx+a=0„. В развернутом виде это равенство можно записать так: 011*1 Ч“012*2 4“--4’01п*л = ~аи 0я1*14"<7л2-*2-Ь 4~?лл*л— лл- В силу отмеченного выше, решения этой системы линейных уравне- ний и только они составляют множество точек безусловного гло- бального минимума данной квадратичной функции. 3. Условия оптимальности второго порядка. Предположим, что функция f дважды дифференцируема в точке и V2/(х<0)) — соответствующий гессиан (матрица вторых производных). Если х<°) — точка безусловного локального минимума функции f и нера- венство <V2f(x*°>), х, х><0 выполнено при некотором xeR", то, используя определение дважды дифференцируемой функции и тео- рему 24, для точки вида х(0)+тх при т>0 можно записать равен- ство / (Х<°> + гл) — / (х<°>) — Т2 Г— ( V2/ <Х(0)) X, X } + L + Вхр₽<ж<% х<«>+|гх)1, где правая часть отрицательная при всех достаточно малых поло- жительных т. Следовательно, имеет место неравенство /(х(0>+тх)< </ (х<°>), что несовместимо с предположением о том, что х(°> — точка локального минимума. Таким образом, установлено следующее не- обходимое условие оптимальности: если х<°> — точка безусловного локального минимума дважды дифференцируемой функции f, то имеет место равенство (2.19) и, кроме того, справедливо неравен- ство (V2/ (х<0>) х) > 0 для всех х & Rrt. Последнее неравенство означает неотрицательную определен- ность матрицы Гессе, вычисленной в точке х(0). В формулировке полученных необходимых условий использует- ся матрица вторых производных, поэтому их называют условиями второго порядка в отличие от необходимого условия первого по- рядка (2.19). С помощью более сложных рассуждений [161 можно установить и достаточные условия оптимальности второго порядка: если точка 37
стшродерн® ц дфсше того, tUteer место неромястоо (^3/ (Хэ)хф х) >0 для любого х^Кя, Х^М)Я, то x<®>— TOW беэрслодного локального лшкшдаиа ф^як^а.у [> Неравенство, о катаром здесь идет речь, означает положитель- ную определен кисть, матрицы Гессе. Напомним, что симметричная матрица является положите льно-определенной тогда-И только тогда, когда все ее угловые миноры положительны (критерий Силь- вестра). 4. Необходимые услочня минимума в задачах с ограничениями. Рассмотрим задачу условной ммнимизаци:; вида / (л) =. ffi 1л; $7 (х) < а / = I „ 2В1.„ м #, (2.20) где все функции /, gi, gj, fA предполагаются определенными на ЙЛ Если точка минимума (локального или глобального) лежит на границе допустимого множества, определяемого записанной выше системой неравенств из (2..20), то градиент целевой функции не обязательно равен нулевому вектору. Это означает, что для задач оптимизации с ограничениям ч условия' оптимальности, сформулн- ронзкиыев предыдущих пунктах, непригодны. При решении задач условной оптимизации' ограничения учмты* на ют* вводя Лагранж® переменных х и 1: * /-1 Здесь li, йф, Яд — некоторые числа, называемые! л:.мож,ь1телллш Лсгддяш. которые составляют вектор, обозначаемый asR*. Условимся ограничение называть актедмше в точке х^,, если это неравенство' при х = обращается в равенство, т. е. если В случае строгого неравенства ^(х'£т)<С данное ограничение называю; йе- октдаакэдж & точке «<с>, I На ряс, 2.8 изображены точка в кото- '.> ’О?сй оба, ограничения активны, и точка в ко- ,?3 торой оба ограниченна неактивны. / Теорема Й 5. Л^ст* ьое фуно{0 f,, j^i, / £з. ..., а точке Есж gj Fs илесгсл xt?- гл бы «РЛ^кейная, та бОгаолвдтодьнО fijr- ’ - г)ел црвдлодезготь вылолненныд у с л О в и е регул я р н о с т и: «п^гщтоя тйхЫ аелтор j/e Рче. 2..® с'КГ. что ндрааенсгАо С V<f (х^), елра- аейлизо (Зля всех шдектов j йктовных оараин- чаяЫ' я точке х^. Ддп того чтобы б&глл точкой лта-ланого лш- яалу'/вд а зпбйчё (Л20'), ятбхо5ид«о, чтоб эд ^данстсюно 4 и тшше н«?- .чнож^тёлы Лагракжа Яь Ха Хд., что г;С*’">Х0./=1. 2......Ь <2-20 3®
VxL(.r, А) -=ОП или, что то же самое, vf (*<0,)+2 № ^°МЛ, (2.22) i-i */Мл(С0)=О> 7 = 1. 2>—А- (2.23) Здесь условие (2.21) очевидно: точка минимума х<°> должна удо- влетворять исходным ограничениям, т. е. быть допустимой. Равенст- во (2.22) аналогично равенству (2.19) из теоремы 2.4, где вместо f использована функция Лагранжа. Согласно равенствам (2.23), те множители Лагранжа, которые соответствуют неактивным в точке х(0> ограничениям, должны обращаться в нуль. Среди перечислен- ных условий основным является равенство (2.22). Теорема 2.5 утверждает, что необходимое условие равенства ну- лю градиента функции теоремы 2.4 можно распространить и на за- дачи с ограничениями, рассматривая вместо целевой функции функ- цию Лагранжа с соответствующим образом подобранными множи- телями Al, ..., Aft. Если все ограничения в точке х<0> неактивны, то из (2.23) следу- ет, что Ai»A2= ...=Л*=0 и условие (2.22) превращается в условие (2.19). Это говорит о том, что в рассматриваемом случае А|=А2=... ...=Ай=0 ограничения фактически не учитываются и необходимым условием локального минимума в такой точке является равенство градиента целевой функции нулевому вектору. Условие регулярности в теореме 2.5 геометрически означает, что все векторы Vgj (л*°>), отвечающие активным в точке xt0) ограниче- ниям, -расположены в одном и том же открытом полупространстве, порожденном некоторым вектором у. В случае когда все функции, участвующие в ограничениях, линейны, выполнение условия регу- лярности не требуется. Существуют примеры, показывающие, что если среди указанных функций имеются нелинейные, то без условия регулярности теорема 2.5, вообще говоря, не верна. На практике, как правило, условия регулярности выполняются. Часто более удоб- но использовать следующее условие: векторы Vgj(x<°>), отвечающие активным ограничениям в точке х(0), линейно независимы (можно доказать, что выполнение этого условия гарантирует выполнение условия регулярности из теоремы 2.5). Нередко задача оптимизации содержит дополнительное усло- вие неотрицательности переменных хь х?..хп, т. е. /(х) —min; g,(x)<0, /=1, 2,...,ft; -x<0„. Этой задаче соответствует функция Лагранжа вида й п LAxt Л, n)^/(x)-|-2^gj(x) —
Необходимые условия локального минимума в точке х(0) на ос- новании теоремы 2.5 .в этом случае можно записать следующим образом: /=1, 2.....Л; V/ +2 <-«|0>> - 2 Hi et'>=оя, j-1 i-L (х(0))=0, 7==lt 2,..., A; i=l, 2.....л, */>0. pf>0, Z=l, 2,..., ft, где e<° — л-мерный вектор с нулевыми компонентами, среди кото- рых только /-я отлична от нуля и равна единице. Условие регуляр- ности в данной задаче соответственно превращается в следующее условие: существует такой вектор что <Vgj(jd°>), у)<0 и <е(0, «/>>0 Для всех индексов / и i, при которых gj(x(°>)=0 И Х;10) = 0. Теперь на основании теоремы 2.5 запишем необходимые усло- вия оптимальности применительно к минимаксной задаче без огра- ничений: f (л) = max / j (х) —»mill, /"1»2....т XER" (2.24) где все функции ft, ft, ftn считают дифференцируемыми на R". Следует отметить, что теорема 2.4 непосредственно к задаче (2.24) неприменима, так как функция max /.-(х), вообщегово- ря, не является дифференцируемой. Для того чтобы воспользоваться теоремой 2.5, сведем задачу (2.24) к эквивалентной задаче мате- матического программирования, в которой все функции являются дифференцируемыми. Для этого введем дополнительную перемен- ную Xn+i и рассмотрим следующую задачу с ограничениями: Л(*, хп+1)^хл+1^ mln; хп+1)=//(х) —хя+1<0, Z=l, 2....т. (2.25) Точка х«» является точкой глобального минимума в задаче (2.24) в том и только том случае, когда (xi°\..., xl+i) — точка гло- бального минимума в задаче (2.25); при этом / (л<0)). В самом деле, пусть х(0) — произвольная точка глобального минимума в за- даче (2.24), т. е. / (х(0)) = max //(xt0,)< max У/(х) для всех xG R". (2.26) М1,2,.-.>л1 1 — 1,2,....гл Отсюда, полагая = / (х’°0* получаем неравенство xi?+l< max /i(v) для всех (2.27) 40
Если взять произвольную допустимую точку задачи (2.25), то для нее верно неравенство max ft(x)^xn+l. Отсюда и из неравенства (2.27) следу- /<= 1,2,...,т ет, что (2.28) для любой допустимой точки задачи (2.25). Это означает, что (х^°\.. -, , xj^j) — точка глобального минимума в задаче (2.25). Обратно: пусть (х£°\... «’xJfV произвольная точка глобального минимума в задаче (2.25), Так как эта точка является допустимой, то справедливо неравенство /;(х(0)) — < 0, i=l, 2,.... т, а значит, верно неравенство max /i(rt0)) < , I-l.2,...,zn .Точка (xtfl\ xj.°\ max /i(x<°>)) также является допустимой. поэтому для нее выполняется неравенство (2.28), т. е. х(0) < шах я+1 /=1,%т|я Сравнивая два последних 5' неравенства, приходим к равенству. xj^i = max /Цх10>). В соответствии с этим из неравенства (2.28) следует, что 1—1,2..т max //(х(0>) < хлд.1 (2.29) для всех допустимых точек задачи (2.25). Но точка (хь д*;, ..., хя, max fi(x)) является допустимой для любого xsRn. Для этой точки J—1,2,..,, rn неравенство (2.29) принимает вид (2.26). Следовательно, х(0)— точка глобаль- ного минимума в задаче (2.24). Прежде чем применить к задаче (2.25) теорему 2.5, заметим, что в любой точке ограничения этой задачи удовлетворяют условию регулярности; в качестве у можно взять, например, вектор (О, 0..0. 1)€=Rm.i. Пусть (л10>,.. 4S1) — точка глобального минимума в зада* че (2.25). Тогда, согласно теореме 2.5, существуют такие неотрица- тельные числа Ль Xj, Я™, что т v/t’.(^) (О, 0.....0, =0 ^(/<(Jtto’)-45i)=X,(/,(A«»)-/(x«l>))=0, 1-1, 2....т. Заметим, что здесь рассмотрение ведется в пространстве Rn+’. Пер- вое из полученных равенств распадается на два равенства: т т 2\т/<(х«»)=оя, 2х/=1- 1-1 1-1 Окончательно приходим к следующему утверждению. Следствие 2.1. Для того чтобы точка х(0) была точкой без- условного глобального минимума в задаче (2.24), необходимо, что- 41
бы нашлись такие числа.м, Ха,.... Хт, что т 2м/1(*<ч>=о1|. МЛРс(0))—/(*(0>))=0, 2...т, (2.30) 2x/ = h ^>0, /=1, 2...т. i=i Нередко в задачах оптимизации среди ограничений встречают- ся ограничения-равенства. В принципе равенство gj(jc)=O можно заменить двумя неравенствами: gj(x)^O, —gj(x)^O- Однако ес- ли функция gj нелинейная, то условие регулярности теоремы 2.5 требует, чтобы выполнялись два противоречащих друг другу нера- венства: 0>О, <—0<О. Следовательно, непосредственно применять теорему 2.5 к задачам с нелинейными ограничениями-равенствами невозможно. Рассмотрим задачу, некоторой среди ограничений имеются как неравенства, так и равенства: / (х) —»miri; ^/(х)<0, ;=1, 2...А; (2.31) й7(х)=0, / = Для этой задачи справедливы следующие необходимые условия оптимальности. Теорема 2.6. Пусть функции f, gi, gs,.... gb дифференцируемы в точке x<°^Rn, а функции gm непрерывно дифференциру- емы в этой точке. Будем предполагать выполненным расширенное условие регулярности: векторы Vgj(x(°)), / = А+1 т, линейно независимы и существует такой вектор 1/еЙп, что <Vg,(x<0>), у>= =0,/=А4-1, .... т, а также <Vgj(x<P>), у)<0 для всех индексов /^ {/, 2,ft) активных ограничений в точке Для того чтобы точка л<Я) была точкой локального минимума в задаче (2.31), необ- ходимо, чтобы существовали такие множители Лагранжа Хь Ха, Хщ» что £/(х(0,)<0, >1, 2,...,£; gj(xW)=Q, /=^4-1,..., от; /-1 ^(x*”)=0,/=1, 2.....Л; (2.32) ^>0, 7=1. 2,..., k. Заметим, что здесь множители Лагранжа, отвечающие ограни- чениям-равенствам, могут быть положительными, отрицательны- ми или же равными нулю, тогда как множители, которые соответ- 42
ствуют ограничен иям-неравенствзмд отрицательными быть не должны В этой теореме не исключаются случаи, когда отсутствуют ог- раничения типа неравенств gj(x) СО (А=0) млн типа равенств ЯДх)=О (ян-Л) или огр а ничем ня обоих типов (т='О).. При й = 0 расширенное условие регулярности превращается- в требование линейной независимости векторов Vgj(X9>), p=h 2#т, посколь- ку равенства. j—1, 2/..., .,щ заведомо выполняют- ся для ^=0su 5. Достаточ и .ъае условия мн н и му me в аздачаг с ограничениями. Если асе ограничения отсутствуют, то условия (2.32) превращают- ся в. равенство V/(j^)wOB. Как отмечено в п. 2, точка удов- летворяющая этому равенству, не обязательно должна быть точ- ной безусловного глобального минимума функции / (она является точкой глобального минимума, если функция ) лсевдовыпуклая). Если функция / не является псевдоньшуклой, то условия (2.32) в частном случае т.«0 не являются достаточными для сити дальности точки л(Ч а значит, эти условия не будут достаточными и В об- 9д щем случае ш^О. Более того, как пока- 1 / а. зывает приведенный ниже пример, для того чтобы .выполнение условий (2*32) /I гарантировало оптимальность точки / 1_____ в задаче (2.31), функции-ограничения j gi, gm также должны удовзгетво ; / рят^ определенным требованиям* “Z Пусть л='1, я=т=1, /(х)=д, / gi(x)«=xT4 L График дайной линейной Рис 2Э (а значит, псевдовыпуклой) функции f(X) и соответствующее допустимое множество изображены на рис. 2.4 Рассмотрим точку д(0)=4. ¥ слонин (2,32) при 11=1/2 для этой точки выполнены.: v/ (х<- :)-| XlYgs 1’ ' (- i'l =о, № Однако она не является оптимальной. В этой задаче вообще не существует точки глобального минимума.. Достаточные условия глобального минимум: а пр нм ан иге л сне к общей задаче минимизации (2,31) сформулированы е следующем утверждении* Теорема. 2*7.. что дум.и^;: f Яь -»I gfa Квоз^ыпуклы «а R» о gMDj.... лгшай- т. е. /=>+ U*-> m., аЗе /=^+1,...» ж £аьш to w а удовлетворяет со-
отношениям (2.32), то она является точкой глобального минимума в задаче (2.31). □ Рассмотрим произвольную допустимую точку х, х^х<°*, в задаче (2.31) и докажем неравенство f (лс<0)) (х) , где точка удовлетворяет (2.32), Прежде всего заметим, что, поскольку соответствующие функ- ции gi, g2t .... gnl квазивыпуклы и линейны, допустимое множество в задаче (2.31) является выпуклым (см. п. 2 § 1.3). Значит, каж- дая точка отрезка, соединяющего точки х и х<°), должна удовлет- ворять ограничениям задачи (2.31). Обозначим через / множество индексов активных ограничений- неравенств в точке х<0>: •/={;еп, 2.-.л| i^mi. На основании второго и третьего из соотношений (2.32) можно за- писать равенство v/Ut°))+2 w*(0>)+ 2 /-* + 1 Умножая это равенство скалярно на х—х<°), получаем m - 2 У-й+l (2.33) Так как верны равенства x>+bj=0 и Jd0)>4-bj=0, то вы- полняется н равенство х—х(°)>=<а<л, х>—(а®, х<0)>=0, / = «=Л+1,.... тп. Поэтому вторая сумма в правой части равенства (2.33) равна нулю. Далее, для каждого номера /е/ имеет место неравенство <Vg/(x<°>), х—х«»><0. (2.34) В самом деле, если это не так, то для некоторого ; выпол- няется неравенство (V£7e(x(0>)> х—х*0))>0. Отсюда согласно лемме 2.1 следует, что для некоторого числа те (0, 1) окажется справедливым неравенство g/0 (x^-J- т (х — х)(°>» gjn (х<°>). Но х<0)-|- 4- г (х—х<°))=хх+(1 — г) х<^ и gj0 (х<°>)=0. Поэтому получаем не- равенство g;0 (гх+(1 - т) х«0) > 0. Каждая точка отрезка, соединяющего х и х<°\ должна удовлетво- рять всем ограничениям задачи (2.31), тогда как последнее нера- венство противоречит этому. Таким образом, неравенство (2.34) верно для любого номера В соответствии с этим правая часть 44
равенства (2.33) не отрицательна. Тогда неотрицательной являет- ся и левая часть: <V/(x<0>), х—Функция f псевдовыпук- лая, поэтому отсюда следует требуемое неравенство f(x)^ Ж**). Доказанную теорему можно использовать и для установления достаточных условий оптимальности применительно к минимакс- ной задаче (2.24), учитывая при этом, что она эквивалентна зада- че (2.25). Следствие 2.2. Предположим, что .все функции ft (х) — хп+ь 7=1,2,.... mt квазивыпуклы на Rn+l (это будет заведомо выполнено, когда все функции ft выпуклы на R”). Если точка удовлетворя- ет соотношениям (2.30), то она является точкой глобального мини- мума в задаче (2.24). 6. Замечания. Понятия и результаты, изложенные в этом пара- графе, имеют принципиально важное значение как с теоретической, так и с практической точки зрения. Они относятся к широкому классу оптимизационных задач, в которых целевая функция и функции, входящие в ограничения, являются дифференцируемыми Необходимые условия дают возможность «выбраковывать» среди множества допустимых решений те, которые заведомо не могут Сыть оптимальными. На основании необходимых условий также строятся различные численные методы решения задач оптимиза- ции. С помощью достаточных условий проверяют, действительно ли найденное тем или иным методом решение является оптимальным. § 2.6. ВЫПУКЛОЕ ПРОГРАММИРОВАНИЕ. ДВОЙСТВЕННЫЕ ЗАДАЧИ 1. Условия оптимальности в терминах седловых точек функции Лагранжа. Если целевая функция и ограничения • являются одно- временно выпуклыми и дифференцируемыми, то соответствующие условия оптимальности в этом случае можно записать на основе теорем 2.5—2.7. В этом пункте будут сформулированы необходи- мые и достаточные условия оптимальности без предположения дифференцируемости указанных функций. Важным примером вы- пуклых, вообще говоря, недифференцируемых функций являются функции вида А(л)= max йДл), 1-1,2.......m где все функции hi предполагаются выпуклыми (в частности, ли- нейными). Рассмотрим следующую задачу выпуклого программирования: /(х)—►min; gj(х) <0, у = 1, 2,..., k\ х<= D сR”, (2.35) где функции f, gi, g*,..., gh предполагаются выпуклыми на некото- ром выпуклом множестве D. Эта задача отличается от рассмотрен- ных ранее задач условием x^D, которое добавлено из соображе- 45
ой удобства, В практических задачах, как .правило, или OM*wRH|xS04- Задаче (2 35) соответствует функция Лагранжа видя £ (х( X) / (х) + (жХ (2.36) /-в которую будем рассматривать при неотрицательных ij: х-= Ч......... Х1Г е а=|х <= й* ц х > oj И при Х«В;УГ Далее гудет показано, что решения задачи (2,3 Б) тесно связа- ны с седловыми тачками функции Лагранжа. Говорят, что Пира нектаров (хФ, ?Я), где х®^0, 1(<Ш, обра- зуют деддовдо точку функции Лагранжа (2 35), если при всех XO.D и te.A. выполняются не- Рие. ДЮ равенства £(Л M<£U<4 <£ (а ХМ). (2.37) График некоторой функции, имеющей седловую точку, где * и к — скаляры., изображен к а рис.. 2 Л О; Седловая точка функ- ции является результатом ее .минимизации по х и максимизации пи А. Иснользуи конкретный вид функции Лагранжа (2,36), можно сформулировать и доказать следующее утверждение. Лемм в 2 2, Пара вектораа (xR, &w) н.ри АЙ&А я.адя- ется ейлоной точкой функции Лагртгяжо (2.36) тойа и голысю тогДя, коз^а йинолмдао £(х(Ч А<°>)«тп£(х» А<% JTC.I9 (2.3S) gf и») < о, ul«}=С, J=1. -2..... к. (2.39> □ Л оста гоч иостъ. Пусть выдел йены соотношения (2.38), (2,39). Равенство (2,38) влечет саранедлквость правой части пера* венства (2,37) при всех хеО. Докажем вы пол не и ие левой части неравенства (2.37) для всея аё=А. Длй. .этого рассмотрим .произ- вольные неотрицательные числа Xi, А?,...» Хй. Очевидно, /=lj 2,,.., й. Поэтому, используя равенства из (2,39)» можно 'дописать нерамнгтьа , (x<Dj]< j= U 2. —» Следовательно, f +2’M/ <*w> < f +2 MV u'?). что означает справедливость левой части нераненстьа (2..37). 16
Необходимость. Пусть (х<°), Х<0)) — седловая точка. Выпол- нение правой части неравенства (2.37) для всех хеО означает справедливость равенства (2.38): Проверим справедливость соот- ношений (2.39). Если для некоторого номера / верно неравенство gj(x<°>) >0, то, полагая числа Л,, i—1, 2,..., /г; i=/=j нулевыми, а X, — достаточно большим, можно получить настолько большее значение L(x<°\ X), что левая часть неравенства (2.37) не будет справедливой. Сле- довательно, gj(x<°>) ^0, /= 1, 2.k. Поскольку Xjot >0 и gj(x(0))^0, j=l, 2... k, имеем неравен- ство 2 xJV (*“>)< о. /-1 С другой стороны, левая часть неравенства (2.37) при X=0ft принимает вид Поэтому имеет место равенство а 2 4V (*(<”)=о. У-1 Все слагаемые в этом неравенстве не положительны. Следователь- но, сумма может обращаться в нуль лишь в том случае, когда каж- дое из слагаемых равно нулю. Пусть (х<°\ >,<°>) — некоторая седловая точка функции Лагран- жа. Используя равенства (2.39), равенство (2.38) можно записать в виде неравенства / (JC*01) < f (*) + 2 для всех х е D' (2.40) Для всех допустимых точек х в задаче (2.35), т. е. для всех х, удовлетворяющих включению x^D и неравенствам gj(x)^0, J= = 1, 2,..., А, справедливо неравенство 2 0- Поэтому из неравенства (2.40) при всех допустимых х получаем f(x<°))^ ^/(х). Это означает, что х<°> — точка глобального минимума в за- даче (2.35). Тем самым установлены следующие достаточные усло- вия оптимальности. Теорема 2.8. Если пара векторов (х<°), Х<°>), где x<°>eD, является седловой точкой функции Лагранжа (2.36), то xt°) — точ- ка глобального минимума в задаче (2.35). Необходимо отметить, что лемма 2.2 и теорема 2.8 получены 47
без каких-либо предположений о свойствах функций ft gi, g2,...»gn и структуре множества D. В соответствии с теоремой 2.8, если удастся найти седловую точку Л(0)) функции Лагранжа (2.36), тем самым будет реше- на задача (2.35), в которой все функции f, git g2,..., gk и множе- ство D могут иметь различную природу (в частности, могут быть и невыпуклыми), причем хЯ будет точкой, доставляющей глобаль- ный минимум. Теоретически такой подход безупречен. Однако его практическая реализация возможна не всегда. Дело в том, что ес- ли функции f, gi, g2tgK и множество D не выпуклы, то функция Лагранжа часто не имеет ни одной седловой точки. Более того, даже если указанные функции и множество выпуклы и оптималь- ное решение задачи (2.35) существует, то в некоторых «вырож- денных» случаях функция Лагранжа также может не обладать ни одной седловой точкой. Для подтверждения этого положения рассмотрим следующую задачу, в которой п = I, k= 1: —x-nnin, х2^0, £) = {xeR|x>0}. Здесь функции f(x) =—х, gi(x) =®x2 выпуклы. Множество D также выпукло. Существует единственная точка х<°)=0, удовлетво- ряющая ограничениям задачи; она же является и точкой глобаль- ного минимума. Если седловая точка функции Лагранжа L(x, л) = — —х+Лх2 при х^О, существует, то она должна иметь вид (О, АЯ) и удовлетворять соотношениям (2.38) и (2.39), т. е. нера- венство 0^ —х+лЯх2 должно выполняться для всех х^О. Сле- довательно, неравенство АЯ^1/х должно иметь место для любого- (сколь угодно малого) положительного числа х. Легко видеть, что требуемое число АЯ найти нельзя. Условия, при выполнении которых хотя бы одна седловая точ- ка функции Лагранжа всегда существует, сформулированы в сле- дующем утверждении. Теорема 2.9. Предположим, что множество DczKn выпукло, функции f, gt, g2,... gh выпуклы на нем и имеет место условие Слей- тера: найдется такая точка x^D, что gj(x).<0, 2,.... k. Пусть х<°> — точка глобального минимума в задаче (2.35). Тогда найдет- ся такой вектор АЯеЛ, что пара (х&\ Л<°>) образует седловую точ- ку функции Лагранжа (2.36). Эта теорема (ее доказательство можно найти в [8]) представ- ляет собой необходимое условие оптимальности: для того чтобы точка х<°> была точкой глобального минимума в задаче выпуклого программирования (2.35), необходимо, чтобы нашелся такой век- тор АЯеЛ, что пара (х^°>, А(0>) образует седловую точку функции Лагранжа. Условие Слейтера исключает присутствие в задаче ограничений типа равенств. Это условие означает, что'Средн точек множества. D найдется хотя бы одна, в которой все ограничения являются не- активными. Теоремы 2.8 и 2.9 лежат в основе теории двойственности вы- пуклого программирования, элементы которой будут рассмотрены 48
ниже. Кроме того, они находят применение в численных методах решения задач условной оптимизации. С их помощью исходную за- дачу (2.35) можно заменить задачей отыскания седловой точки функции Лагранжа. 2. Двойственность в выпуклом программировании. Вернемся к задаче (2.35). Зафиксируем точку x^D и введем функцию, которая может принимать и бесконечное значение: /,*(%)=sup KSA А / (•*) 4" 2 /-1 Имеем |/(JC), если £,(Л)<0, / = 1. 2.k, L* (х)eI оо, если хотя бы для одного j верно керавенство I £;U)>0. Следовательно, исходная задача (2.35) равносильна задаче мини- мизации функции L*(x) по x&D, т. е. задаче sup£*(x, k)—>min. h=A лер (2.41) Эту равносильность можно записать и так: min sup L (х, X) = min f (x). xeDteA xeD ry(jrj<0, /-1,2.A Зафиксируем теперь некоторый вектор Ле Л и введем функцию, которая также может принимать бесконечное значение: (k)=inf А /-1 Задача максимизации функции L. (Л) по ХеЛ, т. е. задача inf £,(л, л) —»max, (2.42) xSD >.&Л называется двойственной, а задача (2.41)—прямой. Между эти- ми двумя задачами существует тесная связь; установим ее. По определению функций £*(х) и £«(/<.), справедливы неравен- ства £* (Л) ^£ (х, Л) (х). Поэтому £* (М < L* (х) Для всех 1еЛ, л е/Х (2.43) Предполагая существование оптимальных решений прямой и двой- ственной задач, получаем отсюда неравенство maxZ* (к) min £* (х), XSA xGO или, что то же самое, неравенство max inf L (х, к) < min sup L (х, к). AS A хеО jr^D >г= Л (2.44) 49
Здесь в правой и левой частях неравенства находятся оптимальные значения соответственно прямой и двойственной задач. Неравен- ство (2.44) означает, что оптимальное значение прямой задачи не может быть меньше, чем оптимальное значение двойственной зада- чи, т. е. оптимальное значение двойственной задачи дает оценку снизу для оптимального значения исходной задачи (2.35). Отме- тим, что неравенство (2.44) было получено без использования ка- ких-либо специальных свойств функций f, gi, gi,.... gk и множе- ства D. Если оптимальные значения прямой и двойственной задач сов- падают и двойственная задача в вычислительном отношении ока- зывается проще прямой, то можно вместо прямой решить более простую двойственную задачу и тем самым найти оптимальное значение исходной задачи (2.35). Возникает вопрос о том, при ка- ких условиях значения обеих задач совпадают. Ответ на него дает следующая теорема. Теорема 2.10. Пусть функция Лагранжа Цх, X) вида (2.36) имеет седловую точку (л<% AJ°>). Тогда оптимальные решения пря- мой и двойственной задач существуют, причем оптимальные значе- ния обеих задач совпадают и равны Х<°>), т е- max inf £(х, X)=mlfisup£(x, X)=£(jc(0>, (2.45) Х(=А XtjxD XczJD XSA □ Существование оптимального решения прямой задачи следу- ет из существования седловой точки, теоремы 2.8 и равносильности прямой задачи и задачи (2.35). Установим наличие оптимального решения двойственной зада- чи. Так как (х(0), —седловая точка, то имеют место неравен- ства (2 37). Переходя к нижней грани по хеО в правой части не- равенства (2.37), получаем £(х<°>, Х(°>х inf £ (х, ХС°>), Но леО ’ по определению инфимума верно неравенство £(л<0), Х(0>) > inf £ (х, .геО Х<°>). Поэтому £(х(°>, X(°)) = inf £(х, Х(°)). Далее, из левой части неравенства (2.37) получаем £ (х(0>, Х(°>) £ (х(0), X) > inf £ (х, А.) для всех X е Л. Следовательно, £(х(0), X(°)) = inf£(jc, M°>)t=inax inf £(х, X), xeD XSA.XSD т. e. X<0)—искомая точка максимума функции £*(Л) на множе- стве Л. Остается проверить равенства (2.45). Переходя в неравенст- вах (2.37) к нижней грани по x^D и к верхней грани по АеЛ» имеем sup£(x<°>, XXfnf£(x, Х<°)>. лед xeD 50
Поэтому и min sup Л (х, X)<max inf £(x, X)=Z(x<°\ X<°)). .reD XgA XGA X&D Сравнивая этот результат с неравенством (2.44), приходим к тре- буемым равенствам (2.45). Таким образом, существование седловой точки функции Лаг- ранжа гарантирует равенство оптимальных значений прямой и двойственной задач. В свою очередь, как. показывает теорема 2.9, седловая точка заведомо существует, если функции f, git g-2* —>gk выпуклы, множество D также выпукло, выполнено условие Слей- тера и задача (2.35) имеет оптимальное решение. 3. Двойственность в линейном программировании. Напомним формулировку стандартной задачи линейного программирования: {с, л)—*min; {aU\ x}^bh /=1, 2,...,k\ х>0л, где ct b^R, j=l, 2,..., k. Если ввести вектор-столбец b с компонентами bit b2,..., Ьк и матрицу А, строками которой служат компоненты соответствующих векторов а<’), а<2\..., то стан- дартную задачу линейного программирования можно записать в следующем матричном виде: {с, х) —*min; Ax^b, xe£)0, (2.46) где Do= {xeRn|x^On}. Этой задаче соответствует функция Лагранжа вида £(х, Х)=(с, х) (X, Ь — Ах}={\, Ь) (с —Л7Х, х) Отсюда в соответствии с определением функции £t(X) имеем (<Х, Ь), если с— Л’Х^Од, £4(Х)= inf £(х, X)=J со, если хотя бы одНа компонента х ° I вектора с—ЛТХ отрицательна. Точку Х<0)еЛ, в которой достигается максимум функции £*(Л) на множестве Л, можно искать лишь среди тех Ле Л, для которых с—ЛТЛ^ОП. Поэтому двойственную по отношению к (2.46) задачу можно записать вчвиде {b, X) —»тах; АЪ<с, ХеА. (2.47) Это также задача линейного программирования, причем перемен- ная х в ней отсутствует. Задачу (2.46) называют прямой задачей линейного программи- рования, а задачу (2.47) — соответствующей двойственной зада- чей линейного программирования. Переменную х называют пря- мой переменной, а Л — двойственной переменной. Прямая задача включает п переменных ха,..., хп и k ограни- чений-неравенств Ах^Ь, тогда как в двойственной задаче k пере- менных Xi, Л2,..., Ль и п ограничений-неравенств ЛтЛ^с. 51
Интересно, что если для задачи (2.47), в свою очередь, запи- сать двойственную ей задачу, то придем к исходной задаче (2.46). Чтобы убедиться в этом, рассмотрим эквивалентную задачу — {bt X) —»min; — — с, целевая функция которой отличается от целевой функции в (2.47) только знаком. Эта задача ло форме такая же, что и задача (2.46). Поэтому двойственная по отношению к ней задача имеет следую- щий вид (при этом вектор двойственных переменных обозначаем через х): — (с, х>—шах; (—Ат)тх£ — bt x>J)n. Ограничения здесь легко преобразовать к виду Ax^b, хеОо, а значит, последняя задача отличается от задачи (2.46) только зна- ком перед целевой функцией. Следовательно, двойственной по от- ношению к задаче (2.47) является именно задача (2.46). Оказывается, для задачи линейного программирования теоре- ма 2.9 верна и без условия Слейтера. Кроме того, для задачи ли- нейного программирования справедливо более сильное утвержде- ние, чем теорема 2.10, а .именно справедлива следующая теорема, доказательство которой приведено, например, в [8]. Теорема 2.11. Задачи (2.46) и (2.47) либо обе имеют оптималь- ные решения, либо его не имеют, причем в первом случае их опти- мальные значения совпадают: (с, x^) = (bt Х<°>), где — оптимальное решение задачи (2.46), а Х<°>— оптималь- ное решение задачи (2.47). Часто имеет место каноническая задача линейного программи- рования (в матричной записи): (с, х) —*min; Ax=b, x^D0. (2.48) Запишем двойственную ей задачу. Векторное равенство Ах^Ь всегда можно представить в форме неравенства М0\/х\ / й\ \0 аЦх/ поэтому в данном случае функция Лагранжа имеет вид £(х, X', Х")=(с, х) 4- <Х', b—Ах) — (X", Ь— Дх), где Х'^Оа, Вводя вектор Х=Х'—X", компонентами которо- го могут быть произвольные числа, получаем £(х, Х)==(с, х) + (Х, Ь —Ах) = (Х, —А’Х, х). Поэтому '~ЗД^(Х, Ь), если с — A^J^O,,, Д*(Х)= inf £(х, Х)= —оо, если хотя бы одна компонента вектора с — АТХ отрицательна. 52
В соответствии с этим двойственная по отношению к (2.48) задача записывается следующим образом: (А, X)—min; A^<ct X£R* (2.49) Эта задача отличается от задачи (2.47) лишь тем, что здесь пере- менные Xi, -7.2.Ak могут быть любыми числами, тогда как в зада- че (2.47) они не отрицательны. Можно проверить, что двойствен- ной для задачи (2.49) является исходная задача (2.48). Для пары задач (2.48) и (2.49) теорема 2.11 также имеет ме- сто. § 2.7. ПРИКЛАДНЫЕ ЗАДАЧИ 1. Задача о распределении поисковых усилий. Пусть в заданной области производится поиск находящегося в ней объекта. Это мо- жет быть поиск месторождения полезных ископаемых, самолета или корабля или же поиск точки минимума функции п перемен- ных. В соответствии с этим областью поиска являются части су- ши, моря или подмножество пространства R”. Вся область поиска разбита на т частей А'1( Х2,..., Ат. Предполагается известной ве- роятность pi обнаружения объекта в частичной области Xi, i = = 1, 2,..., т. Во многих практических задачах значения вероятно- стей pi, р2.рт могут быть получены на основе косвенных сведе- ний о положении искомого объекта. Например, если речь идет о самолете, то для определения pf может быть использована инфор- мация о его координатах во время последнего сеанса связи, его скорости, курсе, времени, прошедшем с момента связи, и т. п. Поиск сопровождается затратами, которые обычно связаны с ресурсами времени и т. п. Считается, что поиск во всех областях Л], Х2,.... Ат дол жен. быть начцт одновременно, так. что поисковые усилия следует каким-то образом распределить по указанным об- ластям. Эти поисковые усилия будем характеризовать соответству- т ющими числами q\, q2,..., qn* причем = /-I Сформируем целевую функцию переменных ?(, q2,.... qm. Если вероятность обнаружения объекта в некоторой частичной области есть р, то в результате k независимых попыток вероятность обна- ружения составит 1 — (1 — р)*= 1 — ае^, где а=1 и Ь =—In (1—р). Это* дает основание вероятность обнару- жения объекта в области Xi при условии, что он находится в дан- ной области, выразить следующей функцией усилия qi: I—а, где. atI bi — фиксированные положительные числа. С помощью ко- эффициентов Of и bi можно в выражении для вероятности учиты- вать дополнительную информацию (например, более труднодоступ- ным обследованию областям придавать меньшие значения или 53
же большие значения «<). По формуле полной вероятности веро- ятность обнаружения объекта в исходной области равна т 1-1 Поэтому математическая модель определения оптимального рас- пределения поисковых усилий принимает вид следующей задачи нелинейного программирования: P(9i. 4г.->?«)-» max; т 0, 2,,.., /и. /м1 Целевая функция представляет собой линейную комбинацию во- гнутых функций одной переменной, а значит, сама является вогну- той функцией (см. п. 2 § 1.3). Таким образом, для решения задачи достаточно найти стационарную точку. Из ограничения-равенства выразим, например q\ через остальные переменные и подставим полученное выражение в целевую функцию. Освободившись таким образом от ограничения-равенства и приравняв частные производ- ные целевой функции нулю, получим — Pi<hbi е*’ (ff,+'”+ff'n_1>+p2a2^e-ft»ff’=0, - = — p^l^ е*’ ,+™+*т-1) р3а3д3 е-^ •=0, -—= -p^by 1>+pmamdme ^«=0. Эту систему равенств нетрудно преобразовать к следующей си- стеме линейных относительно <7г» 4з. Ят уравнений: Pl^lh bi (4г+ -••+Ят" I) "I" ЬъЯъ — In t V\a\b\ I Piaiii Неотрицательное решение Яг^^Ят этой системы вместе с qi= 1 — V2— -• — Ят<>0 образует искомое оптимальное распреде- ление поисковых усилий. 54
2. Задача о выборе сечения проводников. Металлический про- водник кругового сечения АВ длиной Iq разветвляется в точке В на л проводников BCi, ВС2, ВСп кругового сечения (изготовленных из того же материала, что и Л В) с длинами llr 12.1п. Требуется, чтобы сила тока в проводнике АВ была равна /о, а в проводниках ВСь BC2tВСп — соответственно /ь /2, —» Л». Какого сечения следует взять проводники, чтобы расход материала был минималь- но возможным, а разность потенциалов на каждом из участков ЛВС;, /=1, 2,.... п, не превышала заданного значения С? Обозначим через Xi площадь поперечного сечения с-го провод- ника, i=0, 1, п. Масса материала проводников с точностью до п константы равна объему: На участке ЛВС;, согласно за- 1-0 кону Ома, разность потенциалов составляет Л (Р^о/хо)4"Л (Р^у/*у), 2,...,л, где р — удельное сопротивление материала. Следовательно, задача оптимизации имеет вид л min; /-о /о(Р^о)+Л<Р//./хр-6г/==1. 2,...,я, при дополнительном условии положительности всех переменных л0, Ль.... хп. Здесь целевая функция линейная, а все функции-огра- ничения выпуклые как линейные комбинации с положительными ко- эффициентами выпуклых функций 1/х0 и 1/х, при х0, Х;>0 (см. п. 2 $ 1.3). Таким образом, имеем задачу выпуклого программирова- ния. Составим функцию Лагранжа п л 2^+2 ъ J/o<P^o/*o) 4-Л £/J 1-0 j-l и запишем для нее\?оотиошення типа (2.22)— (2.23): /о— IqPA) 2 7-1 /у — Х//ур/ху=0, 7=1, 2.....л, ^/1^о(Р^оМо)4“^у (Р^уМу)— i/J=0, /=1, 2,..., п. (2.50) (2.51) (2.52) Из равенств (2.51) в силу положительности следует, что Ху>0, 1, 2,..., п. Таким образом, из равенств (2.52) получаем Xy = //y/(t//p—/(/о/Хо), /=1, 2.......п. (2.53) 55
На основании (2.53) из (2.51) находим /-1, 2...................................л. Подставляя найденное выражение в (2.50), определяем х0=р далее, используя формулу (2.53), находим л. Согласно теореме 2.7, найденное решение х0, хь..., хп является оп- тимальным. 3, Задача о пропускной способности канала связи. С помощью передающего устройства по каналу связи посылают в определен- ной последовательности .сигналы, для обозначения которых будем использовать символы Пь а2,..., ап. Известно, что каждый символ а{ последовательности выбирают независимо от других с вероятно- стью P(at), х=1, 2,..., п. На другом конце канала связи имеется приемное устройство. Из-за помех в канале связи приемник при- нимает, вообще говоря, другие символы Ь}, Ь2,Ът. Качество пе- редачи символов по каналу связи характеризуется заданными ве- личинами P(by|af)—условной вероятностью приема символа bf при условии, что был послан символ /«=1, 2,..., т\ i=l, 2,.... п. При передаче символа а< какой-то символ из набора bt, b2,bm обязательно поступит, поэтому должно выполняться равенство т 2^(Ь/1 а/)=1, i=l, 2,...,п. y-i Количество информации, которое несет символ с вероятно- стью появления Р(Пг), определяется величиной —log2P(a»). Тогда среднее количество информации, посылаемое по каналу связи, со- ставит Н (а) = - р 1о&2р /=1 Аналогично, если P(aj|by)—условная вероятность передачи сим- вола Qi при условии, что был принят символ bit то величину Н (a I by)= — JJP (at j by) log2р «h I by) 2-1 можно интерпретировать как среднее количество информации, ко- торое теряется в канале связи из-за помех при условии регистра- 56
ции символа bp Тогда среднее количество всей потерянной в кана- ле информации равно Н (а | b)= — ^Р (bj) <а/ I (А । */>• /-1 f-i где Р(bj)=^P (at)P (bt | at) —вероятность приема символа bjt j— 1, 2,..., m. Таким образом, разность Я(а)—H{a\b) представля- ет собой количество информации, переданное через канал связи, а максимальное значение этой разности С=шах (Я (а) — Н (а | £)), где максимизация ведется по всем возможным вероятностным рас- пределениям Р(а]), Р(А),.... Р(ап), называется пропускной способ- ностью канала связи. Запишем подробнее задачу максимизации, возникающую при вычислении пропускной способности канала. Для этого введем следующие более краткие обозначения: р<=Р(а{), р,,=Р(frj|at), i=l, 2...л; / = 1, 2,.... т. В соответствии с этими обозначениями для всех i и / имеют место равенства л л Р(а, [ bj^PiPu^PtPu, Plb^^p.p,,. l-l /-1 Задача нахождения пропускной способности принимает вид / (А. А./>«)= ~2а>0К1й+ /-1 log2 [PiPi> / 2/v«)_”nex; \ / Z—1 / A+a + -+a=1, А. А—,Рл>0. (2.54) Ограничения в этой задаче линейные, причем O^Pi^l, i— «1, 2,..., п. Таким образом, допустимое множество не пусто, вы- пукло, замкнуто и ограничено. Вместе с непрерывностью целевой функции это влечет разрешимость задачи максимизации (2.54) при произвольных фиксированных значениях р^. Установим вогнутость целевой функции на допустимом множе- стве. Для этого убедимся в справедливости неравенства V М" /4”) -5- (1 - М Z W21 Л”) - / (М‘ ’+ +(1 - М /4” Ьр!.1’ -и 1 - >•) А”) < о (2.55) для всех Ле[0, 1] и любых допустимых в задаче (2.54) наборов 57
ffl и /42>,...1/»JI2). Используя равенство можно i-i записать /(А. Рг.Л)=-22Л/’"1<*2Л+22 |АХ /л X л т / f л \ 2^« =22 PlPlj 1°&2 I Pl} I 2 Р&Ч ) ’ /-1 ) \ / iTi / В соответствии с этим левую часть неравенства (2.55), которую обозначим через Д, легко преобразовать к виду л т л=\22^1)/’"1ОВ! +(1—^22Л|о8’ 2М,>+<1-Х)^Л'/2'{2’л' /-и-i L/=i / J-i Отсюда, используя неравенство logax^(x—1) log2e (х>0), полу- чаем неравенство т п д < * 2 21^*’+(1 -к) р‘2)) А/-/’‘”Ру] log>e + /-U-l +(i—х>2 ^p^)pt}—p?}Pu\ logs®- Ли-i С помощью несложных преобразований в правой части этого не- равенства можно показать, что она равна нулю. Следовательно, неравенство (2.55) доказано, а значит, рассматриваемая задача (2.54) является задачей вогнутого программирования. Глава 3 ЛИНЕЙНОЕ ПРОГРАММИРОВАНИЕ Задачи линейного программирования составляют наиболее простой и хорошо изученный класс задач математического про- граммирования. Распространенным методом решения задачи линейного про-, граммирования является симплекс-метод, который излагается в § 3.1. На практике обычно используют видоизмененный вариант этого метода — модифицированный симплекс-метод, требующий меньшего объема вычислений. Рассмотрению модифицированного симплекс-метода посвящен § 3.2. Еще один вариант симплекс-ме- тода— двойственный си мп леке-метод — разобран в § 3.3. 58
S ЭХ СИМПЛЕКС-МЕТОД L Гео м етр нч еск ая и л л юст ради и задач л я ней но то п р о гр а ими р о- цания.О6и|ая задача лилейного проарад,адргоададл (ЯП) состо- ит в минимизации (максимизации) линейной целевой функции (ЗЛ) когда допустимое множество задан о конечным числом линейных ограничений вада ®дА г АзА I- ijjjJ щ 5^- j&f,, Ji =~1- 2,,.,й[ j^|e. А. 4= д /2 А пК •-' 4“ Ал А "С $ JII /' —1 Hh 1«* 1 At (3 2> ^л.А f А. M+U А* Ь частности, ограннчемиямн могут быть только равенства (в этом случае Д=-^г=С) или только нергиенства (А=А)- Часто среди ограничений встречаются условия неотрицательности переменных; х [ О1. <та О,.. .,, хи r3s 0. Ограничен и к в з а дачах лине й нет о пр о - грамм ирон а ния. обязательно должны присутствовать, так как в противном случае функция (ЗЛ) заведомо не будет достигать ни минимума, ни максимума. Так, в задаче (с, л) = — ,xt4 А~♦ mln; А +2А <2., А— А<1> А*1 имеются две переменные.^, хл, два ограничения типа неравенств к условие неотрицательности переменных. Ограничения этой задачи определяют плоский четы- рехугольник (рис. ЭД)» Ли- нии уровня минимизируемой функции, т. е. множество то- чек, уд-t )нл етвор я ЮЩ. н х ра - неиству % ( д.,. ~ — х« *4” .а = (С—const}, (>бр а эу зот семе и ств о и р я - мых, перпендикулярных ъек- тор-гр адиенту с * 1, I) Рис.. ЭЛ (ил рис., ЗЛ изображены, две лиеши уровня, соответствующие С=0 и —1), Нас интересует минимальное значение целевой функции на четырехугольнике. 1а- кое значение дает линия уровня, имеющая, общие точки (одну tlw- ку) с данным четыреху гольян кем и являющаяся крайнем т напраз- S9
леннл, противоположном градиенту с. .Это прямая x?”L Сле- довательно, минимальное значение железой функции равно —J и достигается оно я тех точках прямой — которые принад* лежат четырехугольнику; Заметим, что среди точек минимума име- ются Две вершины четырехугольника.,, В рассмотренном примере линейные ограничения .задают огра* ничейный плс скин четырехугольник, Вос tee же при ,п=2 допусти* мое множестве в задаче линейного программирования может ока- заться пустым (а) или неограниченным (б, е), может не иметь ни одной вершины (в) (рис. 3.2). Иэ геометрических соображений рис. 3.3 Рис. очевидно, что в. случае негустого плоского ограниченного много* угольника среди точек минимума линейкой функции обязательно должна быть хотя бы: одна вершина этого многоугольника (рис. 3.3). Геометрическая интерпретация задач линейного программиро- вания большей размерности (л>2) аналогична. О1 раннчения (3.2:> определяют допустимое множество, являющееся пересечением ко- нечного' числа поду пространств, к: гиперплоскостей, которое назы- вают многзарпянйш лможестволь Оно выяуоо и замкнуто' (см, § 1.2), В частности, оно может оказаться пустым или неограни- чен нам. Мно/о^рпнноа шжтстад не более чем коле «ное чис- ло вершвд. 'Точка многогранного множества называется вершиной, ее л и она. не лежит внутри И и одного" из отрезков, целиком привад» лежащих данному .множеству. Поверхностями уровня .<>s=eC} и ^-мерном случае являются гиперплоскости, ортогональ- ные градиенту .г. Справедливо [3] следующее утверждение: еш dorter алое множество млеет верщшы, то грейи точек жнп* лг^л ршка.ищА(й,) Лилейной фикции в£ёе$й будет ио камней мере ооно ю вершин. Здесь предполагается,, что точки минимума (максим ум а) су шествуют. ha основе этого утверждения можно .предположить следующий способ решений задач линейного, программирования, множество ограничений которых имеет вершины: сначала определять все вер- шины допустимого многогранного .мисжества (это осуществимо, так как количество' вершин конечно), и затем среди наа1деиних вершин выбрать чу, в которой .целевая функция принимает наи- меньшее' (наибо.льш«е)| значение, 1акчм образом, задача линейно- го
го программирования будет решена за конечный промежуток вре- мени. Предложенный метод не вызывает принципиальных возра- жений, однако всерьез говорить о нем не приходится, так как ко- личество вершин в реальных задачах оказывается слишком боль- шим и перебор их даже с помощью самых быстродействующих ЭВМ может потребовать непомерно большого времени. В излагаемом ниже симплекс-методе для нахождения оптималь- ной вершины также производится перебор вершин многогранного множества, но этот перебор осуществляется целенаправленно, что позволяет исключить из рассмотрения значительное количество вершин, заведомо не являющихся оптимальными. 2. Каноническая задача линейного программирования. Посколь- ку задача максимизации функции (с, эквивалентна задаче мини- мизации —<с, х>, далее будем рассматривать задачи минимиза- ции. Простейшая версия симплекс-метода приспособлена для реше- ния канонической задачи линейного программирования (с. х) — mln; Ах—Ь, (3.3) Здесь с= (ci, с2, -> £л)т — вектор коэффициентов целевой функции; —прямоугольная матрица размера Ахп, называемая матрицей коэффициентов ограничений; Ь2, .... Ьл)т — вектор ограничений и х= (хь х2,.... хп)т— вектор переменных. В развер- нутом виде каноническая задача записывается следующим обра- зом: ^1*^1 ~Н£3X2'^- -.*4* ^пХц. * mln, ДИХ1 4“ ^12*2 + • • • + а1ихл — а21х14" а22х2 4" - - + а2пхп = Ь2, (3.3') + а»2х2 + • • • + а»пхп = &Л . ч > О, Х2 > О хп Любую задачу линейного программирования можно привести к каноническому виду. Например, ограничение типа неравенства а ЛХ1 4" айХ2 + • - + аЫХп &1 можно представить в виде равенства, если ввести дополнительную неотрицательную переменную xn+J: anxi +а/2х2_г — 4“ amxn']-x„+l — bi. (3.4) Если левая часть исходного ограничения-неравенства больше либо равна правой, то в соответствующем ограничении-равенстве (3.4) 61
знак перед дополнительной переменной следует изменить на про- тивоположный. Если на переменную Xj не наложено условие неотрицательности, то ее можно заменить двумя неотрицательными переменными x'j и х], полагая Xj = x'j — xj, xj, Такая замена правомерна, так как любое число можно представить в виде разности двух не* отрицательных чисел. Каноническую задачу можно еще сформулировать так: среди неотрицательных решений системы линейных уравнений аи *1 И- — 4"а1я*»—^1» Д21+ а22Х2 + • • • + а2пхп — (3-5) аМх 1 ~kaMx2 + *• + аАпхп — &А найти такие, которые доставляют минимальное значение целевой функции <с, х>. Если система (3.5) вообще не имеет решений, т. е. является несовместной, нли же не имеет неотрицательных решений, то и каноническая зада4а (3.3) также не имеет решения. В том случае, когда система (3.5) имеет единственное неотрицательное решение, это решение, очевидно, является и оптимальным. Поэто- му собственно о задаче оптимизации (3.3) имеет смысл говорить лишь тогда, когда система (3.5) имеет более чем одно неотрица- тельное решение. Предполагая, что из системы (3.5) исключены «лишние» урав- нения, которые выражаются линейной комбинацией остальных, можно считать, что ранг матрицы системы (3.5) равен числу урав- нений, т. е. гап§Л=Л. 3. Идея симплекс-метода. Распространенным методом решения систем линейных уравнений является метод последовательного ис- ключения неизвестных (метод Гаусса). Напомним, что в его осно- ве лежат следующие элементарные преобразования: а) умножение какого-либо уравнения на число, отличное от ну- ля; б) сложение двух уравнений и последующая замена одного из этих уравнений получившейся суммой; в) перемена местами двух уравнений. Элементарные преобразования не изменяют множества решений данной системы. Поясним идею симплекс-метода на следующем простом приме- ре: минимизировать функцию £/=Х|-|-*2+*з при следующих усло- виях: хх>-0, х2>-0, х3^>0. €2
Поставим в соответствие этой задаче следующую систему линейных уравнений: у — л2— х3=0, xi~ +2х3= 1, (3.6) — Л1-|-2х2— х3=2. С помощью элементарных преобразований можно прийти к систе- ме с неизвестными у, хь х2, х3: у -j-3x3=7, (3.6') х, +ЗХ3=4, (3.6*) х2+ л3=3. (3.6”) Уравнение (3.6'") —это сумма второго и третьего уравнений из системы (3.6); уравнение (3.6") является суммой второго из урав- нений (3.6) и уравнения (3.6"'); уравнение (3.6') — сумма первого из уравнений (3.6) и уравнений (3.6"), (3.6'"). Значения переменных у=7, Х]=4, х2=3, х3=0 являются реше- нием системы (3.6') — (3.6'") (а значит, и системы (3.6), причем Х|, х2, х3^0, т. е. найденное решение допустимо. Величина у — это значение исходной целевой функции. Так как t/=7—Зх3 (см. (3.6')), то при увеличении х3 величина у уменьшается. Необходимо полу- чить наименьшее возможное значение у, поэтому увеличим на- сколько возможно х3. Величина х3 должно удовлетворять условиям (3.6") и (3.6'"); следовательно, увеличивать неограниченно ее нель- зя, иначе величины Xj и х2 станут отрицательными. Здесь Х[=4— —Зх3 и х2=3—х3. Итак, наибольшее значение х3, при котором ве- личины X! и х2 не отрицательны, таково: x3=min {4/з, 3/i}=V3. Пусть л3=4/3, Тогда xj=0 (см. равенство (3.6")). С помощью эле- ментарных преобразований систему (3.6') — (3.6'") можно привести к виду у —Xi=3 л3 4-1/Зх1=54/3, (3.7) л2 — 1/3^! =5/3. Теперь запишем решение системы (3.7): у=3„ xi=0, x2=5/3i хэ= =4/з- Здесь у=34-Х!, поэтому с увеличением Х| значение у увели- чивается. Следовательно, значение целевой функции у=3 умень- шить нельзя, а значит, оно является минимальным. Ему соответст- вует оптимальное решение Х! = 0, х2=Б/3, х3=4/3. 4. Алгоритм симплекс-метода. Пусть требуется минимизировать функцию */=(с, л) 63
при условиях Ах—Ь, где система уравнений Ax=b (rang,4=ife<n) в результате элемен- тарных преобразований уже приведена к виду Х1 ;4-а1,*+1х*+14'"*4'Л1лхл^^1' х2 ; 4“а2,*+1х*+1 4'---4-С2лхл —^2’ ..X*L4" аЛ.А+1Х*+1 4“ - - 4“ а*лхл = ^6* (3.8) причем i=l, 2,.... fe. Случай, когда такое преобразование вы- полнить достаточно трудно, рассмотрен в следующем пункте. При- бавляя к уравнению у—<с, х>=0 все k уравнений (3.8), предвари- тельно умноженные соответственно на с2) .... сА, получаем урав- нение для у, в котором все переменные xj, х2, хА отсутствуют (од- нако может появиться свободный член). Полагая у=х0, bi=ajo, i=l, 2, ..., k, уравнение, содержащее Хо, вместе с системой (3.8) окончательно можно записать в следующем виде: 4” а0.Ь+1х*+1 4- - 4-в ОлХл “ а<Ю • 4" ai.*+ix*+i 4"—4"а1лхл ~ лю> 4-aX*+Ix*+l4“— -ha2nXn—a10> { ' ) “л*,й+1хй+1 4“'" 4"а*вхл=яЛ0* » й Здесь fl(y=2 /=A-f-1,..., n; cmdm. Л1-1 Систему (3.9) называют диагональной формой относительно пере- менных Хо, Х], ..., хь (или говорят, что система приведена к диаго- нальному ейду относительно указанных переменных). Решение этой системы (без учета уравнения, содержащего Хо) вида xi==a/o- /=1* 2,...,k\ x*+l = .. =xrt=0 • (3.10) называется базисным, а хь х$г ..., х*— базисными переменными. Ранее мы предположили, что компоненты вектора ограничений Ь не отрицательны, поэтому базисное решение является допустимым. Если среди элементов ою, а», имеются нулевые, то соответст- вующие компоненты базисного решения также равны нулю. Базис- ное решение, хотя бы одна базисная компонента которого равна нулю, называют вырожденным базисным решением. Как отмечено выше, базисное решение — это определенное ре- шение системы уравнений, приведенной к диагональному виду. В теории линейного программирования понятие базисного решения используют и применительно к системе уравнений Ах—bc произ- 64
вольной матрицей А, имеющей ранг k. Заметим, что матрицу А можно рассматривать как совокупность составляющих ее столбцов. Количество столбцов совпадает с количеством переменных п. Та- ким образом, между номерами столбцов матрицы Л и номерами пе- ременных имеется взаимно однозначное соответствие: i-й перемен- ной соответствует i-й столбец и обратно. Приведем определение базисного решения: ненулевое решение х(0) = х[6\...,х^У системы Ах=Ь называется базисным, если вектор-столбцы, соот- ветствующие ненулевым компонентам вектора линейно неза- висимы. Нулевой вектор х<0)=0п, если он является решением сис- темы, также причисляют к числу базисных решений. Если компо- ненты базисного решения не отрицательны, то его называют допус- тимым базисным решением. Так, решение (3.10) системы (3.9) (без первого уравнения), согласно последнему определению, является базисным, поскольку ненулевыми могут быть только компоненты Xi, х2. •••» хь, а им соответствуют линейно независимые столбцы Компоненты допустимого базисного решения — это координаты вершины многогранного множества, заданного условиями Ах=Ь, (доказательство этого факта, устанавливающего геометриче- ский смысл допустимых базисных решений, приведено, например, в[3]). Систему (3.9) обычно записывают в виде табл. 3.1. Таблица 3.1 *• 1 Ж, 1 ... Хм ХА+1 1 - I ж. х0 God 0 0 ап 0 fli, fc+l » • * Gon х( G10 1 . . 0 • • • 0 «t. *+< • • *2 flao 0 1 « # • 0 °2. »+1 « • * Одп а < • ха Gao а • • 0 0 а • 1 Ga. A+L • « ЙАп Каждая строка табл. 3.1 задает соответствующее уравнение из (3.9), свободный член которого записан в самом левом (нулевом) столбце. Слева от таблицы записаны текущие базисные перемен- ные. Столбцы, соответствующие базисным переменным, составля- ют единичную подматрицу таблицы. Табл. 3.1 называют симплекс- таблицей. Исходную задачу линейного программирования можно привес- ти к диагональной относительно х0 и каких-то других k переменных 3—339 65
из набора Xi, xs, ...» хп форме. В этом случае изменятся и базисные переменные. А столбцы, отвечающие этим базисным переменным, располагаясь в соответствующих графах симплекс-таблицы, состав- ляют подматрицу, отличающуюся от единичной лишь перестанов- кой столбцов. В любом случае текущее базисное решение—это такое реше- ние, в котором все небазисные переменные имеют нулевое значение, а базисные переменные соответственно равны элементам нулевого столбца. Например, системе (3.7) соответствует симплекс-таблица 3.2, в которой текущее базисное решение таково: *i=0, хг=5/з» Хз=4/з- Таблица 3.2 ж» Х2 Рассмотрим алгоритм симплекс-метода. Начинать следует с таб- лицы, которая соответствует диагональной форме относительно х$ и некоторых А (базисных) переменных из полного набора хь Хг, ...» хп. Все элементы нулевого столбца (кроме, возможно, оо0) должны быть неотрицательными. Шаг 1. Если среди элементов нулевой строки (не считая Ооо) нет положительных, то вычисления следует закончить, так как те- кущее базисное решение оптимально и минимальное значение це- левой функции равно Цад. Таблица, соответствующая этому положе- нию, называется оптимальной таблицей. Если таблица не являет- ся оптимальной, то следует среди положительных элементов нуле- вой строки (исключая Доо) выбрать некоторый элемент. Обычно среди положительных элементов выбирают максимальный, однако это не обязательно. Пусть выбран элемент aos2>0. Тогда столбец с номером s называют ведущим столбцом. Если все элементы нулевой строки таблицы не положительны, то значение х0 целевой функции, найденное из нулевого уравнения, является разностью между аоо и суммой небазисных переменных с соответствующими коэффициентами: х0=Ооо—SaOjXj (так как ко- эффициенты при базисных переменных равны нулю). Таким обра- зом, величина х0 зависит только от иебазисных переменных. Коэф- фициенты aOj не положительны, а небазисные переменные не от- рицательны, поэтому минимальное значение Хо достигается только в том случае, когда значения всех небазисных перемен- ных равны нулю. Следовательно, число хо=Доо действительно ми- нимум, а текущее базисное решение является оптимальным. •66
Отметим, что выбор максимального элемента нулевой строки на шаге 1 обеспечивает максимальное убывание целевой функции, т. е. в конечном счете ведет к сокращению общего числа вычисле- ний. Ш а г 2. Выделить среди положительных элементов ai9 ведуще- го столбца элемент, для которого отношение ак1а,8 является наи- меньшим. Пусть этот элемент ап. Его называют ведущим элемен- том, а строку с номером г— ведущей строкой. При выполнении вычислений шага 2 ’ предполагается, что в ведущем столбце s найдется по крайней мере один положительный элемент. Если это предположение не выполняется, т. е. все элемен- ты ведущего*столбца (кроме аоа) не положительны, то исходная за- дача не имеет конечного решения (целевая функция на допусти- мом множестве не ограничена снизу). Чтобы убедиться в этом, предположим, что симплекс-таблица имеет вид табл. 3.1 и s—n. Решение Xi / = 1, 2,..., А, Л/к)=0, / = А-|-1 л—1, так как а.о^О, t=l, 2, Л, при любых является до- пустимым, т. е. удовлетворяет соответствующей системе уравнений и имеет неотрицательные компоненты. Из нулевой строки табл. 3.1 имеем =а<л — k Поскольку Ссп>-0. отсюда следует, что, увеличивая Л, можно не- ограниченно уменьшать значение Хо целевой функции. При выполнении вычислений шага 2 может получиться так, что минимум отношения a.o/a<e («/«>0) окажется одинаковым для не- скольких i, т. е. сразу несколько строк таблицы могут быть веду- щими. В этом случае обычно в качестве ведущей выбирают стро- ку с наименьшим номером. Такое правило выбора ведущей строки из нескольких равноправных строк на практике обычно не вызыва- ет недоразумений, однако теоретически может приводить к зацик- ливанию, т. е. бесконечному повторению некоторого неоптимально- го базисного решения. Задачи линейного программирования, в ко- торых возможно зацикливание, называют вырожденными. В п. 6 будет указано, как можно предотвратить зацикливание. Ш а г 3. Используя элементарные преобразования, сделать так, чтобы ведущий элемент ап стал равным единице, а все остальные элементы ведущего столбца — нулевыми. Иными словами, преоб- разовать данную систему уравнений к диагональному относительно нового набора базисных переменных виду. Новый набор отличается от прежнего тем, что в нем вместо переменной хг участвует пере- 3* 67
менная ха. Поэтому базисную переменную хт слева от таблицы сле- дует заменить на xs. После этого вернуться к шагу 1. Последовательное выполнение вычислений шагов 1—3 состав- ляет одну итерацию симплекс-метода. Итерации выполняют до тех пор, пока среди элементов нулевой строки таблицы (не считая а<ю) не окажется нн одного отрицатель- ного. Тогда текущее базисное решение является оптимальным, а ми- нимальное значение целевой функции равно левому верхнему эле- менту таблицы. Если целевая функция не является ограниченной снизу на до- пустимом множестве, то на одном из шагов 2 будет получен ве- дущий столбец, в котором нет ни одного положительного элемен- та (не считая элемента нулевой строки). Замечание. 1. Алгоритм симплекс-метода обладает тем важ- ным свойством, что после выполнения некоторого конечного числа итераций либо будет найдено оптимальное решение, либо установ- лена неразрешимость данной задачи. Действительно, в канонической задаче количество различных базисных решений (вершин допустимого многогранного множест- ва) конечно — оно не превышает СА Поэтому, если исходная зада- ча разрешима, то на основании утверждения из п. 1 оптимальной является по крайней мере одна вершина многогранника. В невы- рожденной задаче в результате перебора конечного числа вершин будет найдена оптимальная. Если задача вырождена (т. е. возмож- но зацикливание), то, используя правило для предотвращения за- цикливания, приведенное в п. 6, в конце концов также придем в оптимальную вершину. В том случае, когда исходная задача не имеет оптимального решения, на одном из шагов 2 будет получен ведущий столбец, в котором нет ни одного положительного элемен- та, и тем самым будет установлена неограниченность целевой функции. Замечание 2. На каждой итерации симплекс-метода сохра- няется допустимость базисного решения, т. е. элементы нулевого столбца (не считая верхнего) все время остаются неотрицательны- ми. Это свойство следует из правила выбора ведущей строки на шаге 2. Кроме того, алгоритм симплекс-метода таков, что при перехо- де от одного допустимого базисного решения к другому значение целевой функции, равное левому верхнему угловому элементу таб- лицы, уменьшается. В самом деле, если в табл. 3.1 ведущим вы- бран элемент ам, то после выполнения шага 3 в левой верхней клет- ке таблицы будет находиться разность о0о—(и^/аГ5) которая в силу положительности коэффициентов Сго, ura, Оов меньше, чем cico. Величина этой разности и является новым значением целевой функции. Указанное положение может нарушаться лишь в случае вырож- денного базисного решения, причем когда имеет место зациклива- ние. В этом случае значение целевой функции может не изменять- ся, пока продолжается зацикливание. 68
Проиллюстрируем вычисления алгоритма симплекс-метода на следующем примере: х0=-|-х2-|- х8—х4 -|- х5— х6 “* Xj +2х4—хБ+х6=1, -|-Х34-’*6=2» Х3— х4+х5—х6=1, Xg0. Здесь в качестве исходного допустимого базисного решения следу- ет взять *1 = 1, х2=2, х3=1, х4=х5=х6=0. Начальная таблица после сложения нулевого уравнения со всеми остальными уравне- ниями принимает вид табл. 3.3. Таблица 3.3 X. X, * ха X. | Хп 4 0 0 0 2 0 2 Xt 1 1 0 0 2 —1 1* X* 2 0 1 0 0 1 1 Хз 1 0 0 1 —1 1 —1 В нулевой строке имеются положительные элементы, поэтом у те- кущее решение не является оптимальным. Среди двух равных поло- жительных элементов нулевой строки выбираем, например, а06=2. Таким образом, ведущим является последний столбец. В этом столбце имеются два положительных элемента: а16=а26=1. Срав- нивая отношения <Zoi/flie=l/l и 020/^26=2/1, приходим к выводу, что первая строка является ведущей, а ведущим элементом будет flie= 1 (в таблице он помечен звездочкой). В соответствии с этим переменную xj из базиса следует вывести, а вместо нее ввести пе- ременную х6. Для этого первую строку табл. 3.3 последовательно умножаем на —2, —1, 1 и получившиеся строки складываем соот- ветственно с нулевой, второй н третьей строками. В результате все элементы ведущего столбца (кроме ведущего элемента, который равен 1) станут нулевыми и симплекс-таблица на второй итерации принимает вид табл. 3.4. Таблица 3.4 *1 1 х* 1 1 | Хз | Хо 2 —2 0 0 —2 2 0 хв 1 1 0 0 2 —1 1 Хл 1 —1 1 0 —2 2* 0 хз 2 1 0 1 1 0 0 Здесь в нулевой строке имеется единственный положительный элемент a0s=2, т. е. ведущий столбец определяется однозначно. 69
Так же однозначно определяется и ведущий элемент с35=2>>0. Теперь переменную *2 следует вывести на базиса и ввести перемен- ную xs. Для этого сначала все элементы ведущей строки разделим на 2 (для того чтобы ведущий элемент стал равным 1), а затем с помощью элементарных преобразований добиваемся того, чтобы все остальные элементы ведущего столбца стали нулевыми. Приходим к оптимальной табл. 3.5, в которой среди элементов нулевой стро- ки (не считая ооо=1) нет положительных. Таблица 3.5 1 X1 | х3 1 х' 1 * I Хе х0 1 —1 —1 0 0 0 0 Хе 1,5 0,5 0,5 0 1 0 I Xs 0,5 -0,5 0,5 0 — 1 1 0 Xs 2 1 0 1 1 0 0 Следовательно, текущее базисное решение xt=*2=*4=0, х3= ~2, *5=0,5, *6=1.5 оптимально, а минимальное значение целевой функции равно 1. 5. Двухфазный симплекс-метод. Выше алгоритм симплекс-мето- да был сформулирован применительно к канонической задаче ли- нейного программирования специального вида. Мы предполагали, что исходная задача уже приведена к диагональной относительно *о и некоторых k базисных переменных форме. При этом счита- лось, что свободные члены во всех уравнениях (исключая нулевое) не отрицательны. Установим, как поступать в тех случаях, когда эти предположения не выполнены. Для приведения произвольной канонической задачи к диагональному виду с неотрицательными свободными членами можно использовать изложенный выше алго- ритм симплекс-метода, если предварительно ввести дополнитель- ные переменные. Приведение исходной канонической задачи к диагональному виду равно- сильно указанию некоторого допустимого базисного решения системы ограниче- ний. В самом деле, если диагональная форма имеет, например, вид (3.9), где с<0>0, £=1, 2, .... Л, то из этого представления сразу находим допустимое базисное решение (3.10). Обратно: пусть задано некоторое допустимое базисное решение xl°J = (xj°\ х^°\..., xJ,0})7 ^0п системы ограничений Ах=ф. Не уменьшая общности, можно считать, что положительными являются первые I. компонент вектора х10>. Согласно общему определению базисного реше- ния, первые I вектор-столбцов матрицы А линейно независимы. Если !<k, то в силу того, что rangA=A должны найтись k—l вектор-столбцов матрицы Д, которые вместе с первыми I векторами образуют линейно независимую систему. Поэтому будем считать, что первые k столбцов матрицы А линейно независимы. Обозначим матрицу размера Ах Л, которую они составляют, через Аб, а осталь- ную часть матрицы А—через Аи. Кроме того, пусть Хб=(Х1, *», . х»)т к х,= (хх+1, ,,,, хп)т. Тогда систему уравнений Ах=Ь можно записать так: [АдЛн] [ 1 — A(*5 + Акх„ = Ь. L *и J 70
Для матрицы Ле существует обратная матрица поэтому после умножения последнего равенства слева на эту матрицу получаем Хб + Л^ ^Лихи = Лд Ч. Эта система уравнений равносильна исходной системе Ах=Ь, н поэтому х(0>— се решение. Из этого условия находим х£0} = А~Ч, где = (х|0), х^0),... , х^)т, используя х,0) =0, i=A+l.......... п, и в результате получаем систему Хл _L А-1А х — ,(°) •*б ’ лИ-*«---*б » которая имеет диагональный вид (относительно xh х21.... xfc) н неотрицатель- ные свободные члены. Итак, пусть требуется решить общую каноническую задачу ли- нейного программирования: 4"*Л +~.+^Л—min; ®n*i 4-«12*2 4- • • - «21 *1 4" «22*2 4" • -• 4“ а2яхп — ^2» (3.11) «41*1 4“ «42*2 + • • • + «4п*л — **. *Ь *2.....*л>0- Можно считать, что здесь все свободные члены £2. Ьк не от- рицательны (так как уравнение, содержащее отрицательный сво- бодный член, всегда можно умножить на —1). Выполнение равен- ства rang А =А не обязательно. Введем дополнительные неотрицательные переменные хп+ь *«+2» *n+k, которые называют искусственными переменными, и рас- смотрим новую задачу: 4"*п+Л miu; у- qXi - с^2 -... - с„х„=0, «11*14* «12*2 4" • • • 4" «1 л*л 4" j » «21*14“«22*i4“’” Н"а2л*л j 4“ *л+2 *1» -ATj»’••*П’’" •» *rt+A^0. 71
Складывая уравнение z—xn+1—Jcn+2—...—xn+ft*»0 co всеми уравне- ниями, содержащими переменные хп+ь ...» Xn+м придем к системе х>» х2,..., хл, Хп^д О, а » где г0=2^т- /-! т-1. Система (3.12) имеет диагональный вид относительно z, у, x„+i» ...» *п+л (где переменная у мажет принимать н отрицательные значе- ния). К системе (3.12) уже можно применить симплекс-метод, изло- женный в предыдущем пункте. Все искусственные переменные не отрицательны, поэтому минимальное значение функции z=xn+i~l- Ч-...4-хп+а есть Zinin=0. Следовательно, если исходная система ограничений х^0п совместна, то значение zmin=0 будет достигнуто и при этом все искусственные переменные должны стать равными нулю. Вместо них в число базисных переменных вой- дут переменные из хь х2, —. хп. Далее, строку с z можно вычерк- нуть и перейти к минимизации у. Такой способ решения исходной канонической задачи называют двухфазным симплекс-методом. На первой фазе, минимизируя г, из числа базисных переменных выво- дятся все искусственные переменные, а на второй фазе минимизи- руется целевая функция у и определяется оптимальное решение ис- ходной задачи. Рассмотрим более подробно случаи, которые могут встретить- ся на первой фазе: I) Если в результате решения задачи (3.12) окажется, что Zmin>0, то это свидетельствует о том, что система ограничений Ах=Ь, х^0п несовместна. 2) Если Zmin=0 и слева от симплексной таблицы нет ни одной искусственной переменной, то можно приступать ко второй фазе. 3) Если Zmin=0, но слева от таблицы имеются искусственные переменные, то, используя элементарные преобразования, эти пе- ременные следует вывести из числа базисных, а вместо них ввести исходные переменные. В этом случае базисное решение вырожден- ное (имеет нулевые базисные компоненты). Если искусственную пе- ременную Хл+г невозможно вывести из базиса из-за того, что arj=0 72
для всех /=1, 2, п, то это означает, что r-е уравнение системы (3.11) «лишнее» и его нужно вычеркнуть из таблицы. Следующий пример иллюстрирует первую фазу симплекс-ме- тода: у=Xi — х2 +1 —► min 2^1+ х24-Зх3=1, xl—3x24- х3=— 3, Jfj + 11X24-3^3=11, xb x2, x3 > 0. Умножим второе из уравнений на —1 и составим задачу для пер- вой фазы, введя искусственные переменные х4, х5, хб: z— х4— хе—хб =0, Х14- х2 =1, 2xj4~ х24~Зх34"Х4= 1, — Xi 4-3 х2— х34-х5=3, Х14-1 1х24-Зх34-х6= 11. Исключая из первого уравнения искусственные переменные, полу- чаем систему z-|-2 Xj 4” 15х2 4“ 5х3 ^=15, у— х,4- х2 =1, которой соответствует табл. 3.6. Таблица 3-6 г У ха Хе X, х’ 1 “ 1 * х& | Ха 15 2 15 5 0 0 0 1 —1 1 0 0 0 0 1 2 1* 3 1 0 0 3 —1 3 —1 0 1 0 11 1 11 3 0 0 1 В качестве ведущего выбираем второй столбец. Сравнивая от- ношения 1/1, 3/3, 11/11, делаем вывод, что ведущей может быть лю- бая из трех последних строк. Выбираем в качестве ведущей строку с наименьшим номером. Таким образом, базисную переменную х4 73
следует заменить на х2. В результате соответствующих преобразо- ваний приходим к табл. 3.7. Таблица 3.7 г 0 —28 0 —40 0 0 У 0 «—з 0 —3 0 0 Хл 1 2 1 3 0 0 Xi 0 —7* 0 —10 1 0 Хл 0 —21 0 —30 0 1 Четвертый столбец, соответствующий выведенной базисной пе- ременной далее не понадобится, поэтому из таблицы он исклю- чен. Из табл. 3.7 следует, что минимальное значение z достигнуто и равно нулю. Однако искусственные переменные х& и х6 еще ие вы- ведены из базиса. Выведем переменную х$. Элементы предпослед- ней строки, соответствующие переменным х1 и *э. отрицательны, по- этому предварительно умножим эту строку на —I (что допустимо, так как в нулевом столбце этой строки стоит элемент, равный ну- лю). Введем вместо *5 переменную Для этого элементы веду- щей строки разделим на 7 и с помощью элементарных преобразо- ваний добьемся появления*нулевых элементов в ведущем столбце. В результате получаем табл. 3.8. Переменную х6 из числа базисных вывести нельзя, так как все соответствующие элементы равны нулю. Значит, третье из уравне- ний было «лишним». Исключив верхнюю и нижнюю строки, а так- же последний столбец, можно перейти ко второй фазе. 6. Правило предотвращения зацикливания. В п. 4 отмечалось, что если на одном из шагов 2 симплекс-метода ведущая строка определяется неоднозначно, то при решении может возникнуть за- цикливание, т. е. бесконечное повторение одного и того же базис- ного решения. Сформулируем правило выбора ведущей строки, ис- пользуя которое можно предотвратить зацикливание алгоритма симплекс-метода. Предположим, что в качестве ведущего выбран столбец s и min • • • = о!аг •• :>°} . 1 г 74
Если /=1, то ведущая строка определена однозначно. Это строка П. Если />1, то вычислим отношения a,i/a<e для х=и, r2t .... и и аналогично находим строки, которым соответствует минимум это- го отношения. Если таковой является единственная строка, то ее следует считать ведущей. В противном случае составляем для най- денных строк отношение и снова определяем строки, которым соответствует минимум отношения, и т. д. В результате ведущая строка будет определена единственным образом. § 3.2. модифицированный симплекс-метод 1. Алгоритм модифицированного симплекс-метода. Алгоритм симплекс-метода, описанного в п. 4 предыдущего параграфа, таков, что на каждой его итерации полностью вычисляется новая табли- ца, после чего таблица предыдущей итерации становится ненуж- ной и может быть «забыта». Более экономным с вычислительной точки зрения является модифицированный симплекс-метод, соглас- но которому переход от одной итерации к другой осуществляется на основе одной и той же начальной таблицы. Кроме того, на каж- дой итерации модифицированного симплекс-метода вычисляются не все элементы таблицы, а лишь нулевая строка, нулевой и веду- щий столбцы, знание которых позволяет перейти от старого набо- ра базисных переменных к новому. Рассмотрим один из упрощен- ных вариантов этого метода. Предположим, что каноническая задача линейного программи- рования уже приведена к диагональному виду (3.9) и ей соответст- вует начальная табл. 3.9. Таблица 3.9 *1 1 1 - | «А + 1 1 ”• | Хп ХС ООО 0 0 0 Оо, Ооп 010 1 0 0 О). *4-1 О] п *2 а20 0 1 0 *4-1 вал Xh ОкО 6 6 i i » 1 О*. *4-1 Оки Прежде чем рассмотреть модифицированный симплекс-метод, отметим следующее. Допустим, что ведущий столбец имеет номер 5, а ведущая строка — номер г (т. е. ars — ведущий элемент). Шаг 3 обычного симплекс-метода заключается в применении элементар- ных преобразований, позволяющих привести исходную систему к диагональной форме относительно нового набора переменных, в ко- тором вместо хг участвует переменная хв. Непосредственной про- веркой можно убедиться в том, что такой переход к новой днаго- 75
нальной форме (новой таблице) можно осуществить, умножая табл. 3.9 слева на матрицу 1 0 0- • - О — а^а„ 0. - - 01 0 1 0... О — а^а„ 0. • .01 О 0 0 - . .1 — ar_lf^a„0* • -О О 0 0. . -О 1/ам 0. . -О О О 0... О —ar±\ti/ars 1 • • . О О О 0. . .0 ~а^агз 0- • - 1/ строка О строка г которая отличается от единичной матрицы (£Ц-1)-го порядка лишь столбцом г. (Имеется в виду умножение по обычным правилам умножения матриц.) Начало алгоритма модифицированного симплекс-метода такое же, как и в обычном симцлекс-методе. Прежде всего выявляют по- ложительные элементы нулевой строки табл. 3.9 (не считая вот) и фиксируют некоторый из них, например Оо£>0. Далее, в ведущем столбце s среди положительных элементов из условия минимума отношения а^1аи (i: ^,>0) определяют ведущий элемент ап. Вме- сто переменной хг в число базисных должна войти переменная xs. На этом завершается нулевая итерация алгоритма модифи- цированного симплекс-метода. Первая итерация. Последовательно умножают нулевую строку матрицы A4rJ на столбцы табл. 3.9 и тем самым вычисляют элементы aJP, i=l, 2, .... п, нулевой строки новой таблицы. Если среди этих элементов не окажется положительных, то остается вы- числить новый нулевой столбец, который определит оптимальные значения базисных переменных. В противном случае выбирают положительный элемент определяющий ведущий столбец. По- следовательно умножая строки * матрицы Мгя начиная с первой на нулевой столбец и столбец I исходной табл. 3.9, вычисляют новые элементы aJP, /=1, 2, .... kt нулевого столбца и элементы Д/Р. /=1, 2, .... k столбца I. Остальные элементы новой таблицы далее не понадобятся. Сравнивая отношения MP/eJPtf •' л$Р^>0). на- ходят ведущий элемент. Если ведущий элемент определяется неод- нозначно, то поступать нужно так же, как в обычном симплекс-ме- тоде, т. е. выбрать в качестве ведущего элемент строки, номер ко- торого удовлетворяет условию минимума отношения Д;Р/Д/Р и является наименьшим номером. Или жеследует использовать прави- * Точнее говоря, следует умножать строки матрицы Мг, без левых элементов, соответствующих нулевому столбцу. 76
ло предотвращения зацикливания. Заметим, что использование это- го правила предполагает предварительное вычисление соответст- вующих столбцов таблицы, которое также выполняется с помощью матрицы Мгв. Пусть ац* — новый ведущий элемент. Первая итера- ция закончена. Новая матрица Af(/ будет отличаться от единичной лишь столб- цом t: -о» -aJL’iXP 1/аЯ’ -«ЯАу/вЯ» -аМ строка t С помощью матрицы Ми осуществляется замена базисной перемен- ной Xt на переменную Xi. Для этого следует таблицу, полученную в результате первой итерации, умножить слева на Ми. Указанная таблица сама является произведением Мгя и табл. 3.9, поэтому бу- дет получен тот же самый результат, если начальную табл. 3.9 умножить слева на произведение матриц М«А1„. Таким образом, следует вычислить матрицу MtiMr9 и последо- вательно умножить нулевую строку этой матрицы на столбцы ис- ходной табл. 3.9. В результате получают нулевую строку таблицы второй итерации. Далее, вновь определяют ведущий элемент (при условии, что в нулевой строке есть положительный эле- мент), составляют матрицу Mpq и вычисляют произведение MpqlMtfMrs), с помощью которого можно определить элементы таблицы третьей итерации, и т. д. Окончательно либо будет найдено оптимальное решение, либо установлено, что исходная задача неразрешима. 2. Пример. Проиллюстрируем применение модифицированного симплекс-метода на примере задачи, решенной ранее обычным симплекс-методом. Начальная таблица этой задачи имеет вид табл. 3.10.
В качестве ведущего выберем четвертый столбец. Ведущим эле- ментом является 014=2. Составим матрицу (1 -1 О 0\ О 1/2 О 01 О 0 1 О I О 1/2 О V и вычислим элементы новой нулевой строки: (4 О 0 0 2 0 2\ 1 1 0 0 2 -1 1 ]=(3 —1 0001 1). 2 0 1.0 О 1 11 10 0 1-1 1 -V Возьмем теперь в качестве ведущего, например, пятый столбец и найдем элементы нового нулевого и нового пятого столбцов. Име- ем 1/2 0 О X /IV /1/2 \ О 1 0 ]. 2 ]=( 2 1, 1/2 0 1 / \ 1 / \3/2 / 1/2 0 ОХ /-1 X /-1/2 \ О 1 О - I 11=1 1 I. 1/2 0 1/ \ 1 / \ 1/2 / Новая таблица принимает вид табл. 3.11. Таблица 3.11 3 1/2 2 3/2 — 1 0 0 0 1 -1/2 1 1/2 1 Пустые места в этой таблице соответствуют тем элементам, зна- ние которых в данном случае не обязательно. Сравнивая отношения 2:1 и 7s Vs, видим, что переменную х2 следует вывести из бази- са. Составим новую матрицу О 1 О О -1 О X 1/2 0 | 1 о I -1/2 I/ 78
и вычислим произведение: /1 -1 -1 1 О О О 1/2 1/2 О 1 О 100 1 О J Ч) 1/2 -1/2 Находим элементы новой нулевой строки: (1_-1 -10)- 4 0 0 0 110 0 2 0 10 2 О 2 -1 О I 10 0 1-1 1 1 1 -1 =(1 -1 -1 0 0 0 0), Мк’лИи— 2 1 1 В этой строке положительных элементов (не считая левого) нет, поэтому минимальное значение равно 1. Наконец, имеем (1/2 1/2 0\ / 1 \ / 3/2 \ о 1 ОМ 2 1=1 2 I. 1/2 -1/2 1/ X 1/ \ 1/2/ Таким образом, оптимальное решение имеет вид Xi=Xa=0, х3=*/2» х4=3/2, х5 = 2, х6=0. § 3.3. двойственный симплекс-метод 1. Идея двойственного симплекс-метода. Рассмотрим следую- щую задачу линейного программирования: *о=*з+2х4 — Щ1п; Записав ее в виде — х3 — 2х4=0 приходим к диагональной относительно переменных х0, хь х2 фор- ме, которой соответствует табл. 3.12. В табл, 3.12 в нулевой строке нет положительных элементов, однако сделать вывод об оптимальности нельзя, поскольку теку- щее базисное решение не является допустимым, так как х2 ——1< <0. Для того чтобы решить данную задачу с помощью симплекс- метода, ее нужно предварительно привести к диагональной форме
с неотрицательными свободными членами (элементами нулевого столбца). Но мы поступим иначе. Попробуем сделать базисное решение допустимым. Для этого переменную х2 следует вывести нз числа базисных. Вместо нее .можно ввести переменнущ ха или Таблица 3.12 Хо 0 0 0 —I —2 Xi 1 1 0 1 1 х2 —1 0 ! —2 — 1 х± Постараемся избежать появления положительных элементов в нулевой строке. Для этого сравним отношения аоэМгз=—1/—2— — Чг, ^04/^24——2/—1=2 и выберем в качестве ведущего третий столбец, для которого такое отношение имеет наименьшее значе- ние. Теперь, как и в симплекс-методе, введем в число базисных вместо х2 переменную Хз- В результате преобразований получим табл. 3.13. Таблица 3.13 0,5 0 —0,5 0 — 1.5 0,5 1 0,5 0 2,5 0,5 0 —0,5 1 0,5 В табл. 3.13 все элементы нулевого столбца не отрицательны и среди элементов нулевой строки (не считая аоо=0,5) нет положи- тельных. Следовательно, текущее базисное решение xi=0,5, х2— =х4=0, хз=0,5 является оптимальным. Способ, с помощью которого была решена исходная задача, на- зывается двойственным симплекс-методом. 2. Алгоритм двойственного симплекс-метода. Дадим строгое опи- сание двойственного симплекс-метода. Начинать вычисления следует с составления таблицы, которая соответствует диагональной форме относительно х0 и некоторых k (базисных) переменных из общего списка переменных хь х2, .... хл. В этой таблице все элементы нулевой строки (не считая Ооо) долж- ны быть не положительны: ао(-г^0, i= 1, 2,..., п. Шаг 1. Если среди элементов нулевого столбца (не считая Лоо) нет отрицательных, то текущее базисное решение является оп- тимальным. В противном случае среди отрицательных элементов нулевого столбца следует выбрать некоторый элемент йто<СО. Та- ким образом, r-я строка таблицы — ведущая. Шаг 2. Среди отрицательных элементов ведущей строки най- ти элемент, который реализует минимум отношения (j: ar/<C <0). Пусть это элемент drt. Значит, ведущим является столбецs. Если в ведущей строке не окажется ни одного отрицательного элемента (кроме Ого), то исходная задача не имеет допустимых 60
решений. В самом деле, в этом случае уравнение, соответствующее ведущей строке с номером г, имеет вид алх1 ••• +йгл^л где Дг/^0, / = 1, 2, п; я^СО. Этому уравнению не могут удов- летворить никакие допустимые значения переменных i=l, 2,л. Отметим, что если минимум отношения Qoj/arj соответствует сра- зу нескольким столбцам, то обычно в качестве ведущего выбирают столбец с наименьшим номером. Шаг 3. Так же как на шаге 3 прямого симплекс-метода, опи- санного в § 3.1, вместо переменной хг в число базисных ввести пе- ременную х6 и вернуться к шагу 1. Последовательное выполнение шагов 1—3 составляет одну ите- рацию двойственного симплекс-метода. После конечного числа ите- раций либо будет найдено оптимальное решение, либо установле- но, что данная задача не имеет допустимых решений. В идейном отношении алгоритм двойственного симплекс-мето- да имеет много общего с алгоритмом прямого симплекс-метода. Образно говоря, двойственный симплекс-метод — это прямой симп- лекс-метод, взятый со знаком минус, в котором роль строк игра- ют столбцы, а роль столбцов — строки. В самом деле, в прямом симплекс-методе вычисления нужно начинать с составления таб- лицы, в которой элементы нулевого столбца не отрицательны; в двойственном — с таблицы, в которой элементы нулевой строки не отрицательны. В прямом методе сначала определяют ведущий столбец, а затем ведущую строку; в двойственном методе — наобо- рот: сначала ведущую строку, а затем ведущий столбец. Признак оптимальности текущей симплексной таблицы, который позволяет установить момент окончания вычислений, для обоих методов оди- наков: неотрицательность элементов нулевого столбца и неполо- жительность элементов нулевой строки. Отметим, что существует и модифицированный вариант двой- ственного симплекс-метода. § 3.4. ПРИКЛАДНЫЕ ЗАДАЧИ 1. Транспортная задача. Пусть имеется т поставщиков не- которой однородной продукции. Считается, что i-й поставщик рас- полагает я< единицами продукции, t=l, 2, ..., т. Продукцию по- ставщиков используют п потребителей, потребности которых характеризуются числами Ь\, 'ба, Ьп (т. е. J-му потребителю не- обходимо bi единиц продукции). Все числа я/, bj положительны н считаются заданными. Кроме того, известна стоимость перевозки единицы продукции от i-ro поставщика /-му потребителю: с,/, i— = 1, 2, .... т\ /=1, 2, ..., л. Продукция однородна, поэтому любой поставщик может предложить ее любому потребителю (рис. 3.4). Требуется определить такое количество единиц продукции, перево- зимой от каждого поставщика к каждому потребителю, чтобы 81
Рж.. 34 транспортные расходы были минимальными и тютрёбности всех го^рьбхтел'йй были удовлетворены.. Задача предполагается разре- шимой в. том смысле, что общий объем возможных поставок дол- жен быть не меньше общего объема по- требностей. * Обозначим через число единиц г ро- лу кд инк перевознмой от i-го поставщика /-му потребителю. Тогда транспортные расходы этой пары поставщик- потреби- тель составят одгф а общая стоимость всех перевозок (от кв ждого постав* щи ка каждому потребителю) рав^э ffl л 22 ГцХ^ Тот факт, что потребности' Я /-г каждого потребителя должны быть удав* m летворены, можно' выразить в эидС1 неравенств; ** *,/> >/> /=1» 2, л:г а условие осущейвнмости выполнения1 поставок—в виде и неравенств v U»lf 2, ж. Крема того,, все величины jt.;j й должны быть подчинены у с ловя! о неотрнидтель пости. Такта образом^ транспортная задача принимает вид следующей аалачи л инеяного пр огра м мировання: Л| Я 2 2 сих</— m,n: i-l /=1 jCjfjf ^fi|fn £:=' 1„ ж, /-1 2 х(/ >ij¥ у = I, 2,^» к* (3,13) *= I» /=1(' .............j®* В. этой задаче ж-л переменных и т+л ограничений, типа нера- венств' (не считая условий неотрицательности переменных). Если суммарные волможнот-ти поставок совпадают с требуемой (.та п. X Т, е. V' I* 70 можно так ,w / организовать перевозки, чтобы вся имеющаяся у поставщиков про- дукции была вывезена, и каждый потребитель 'полу 4 и л неебходи- чое количество продукции. 3 этом случае транспортная задача
принимает вид канонической задачи линейного программирования 2 2 счхч п,1п: /-1 /-1 i = 1, 2,,.., п?, 7-1 (3.14) m _/== 1» 2,..., nt i-i f=li2,..., m; /=1, 2,..-.,л и называется закрытой транспортной задачей, m п Если Т0 СПРОС потРебителей будет удовлетворен, Z-1 /-1 но у поставщиков останется «лишняя» продукция и ограничения транспортной задачи имеют вид п I == 1, 2,..., tnt i-i m jCjj — bjt _/ —1, 2„..., л. i-1 Если безразлично, у каких именно поставщиков и в каком коли- честве останется неотправленная продукция, то, вводя фиктивного Л1 п (п+1)-го потребителя, потребность которого 2°<~2 fy» мы Ф°Р" /-1 /-1 мально придем к закрытой транспортной задаче. А для того что- бы введение фиктивного потребителя не повлияло на суммарные расходы по перевозкам, следует принять с{, п+1=^0, х = 1, 2, .... тп. m П Случай 2 а'<2 bj соответствует ситуации, когда потребности i-l 7-1 потребителей не могут быть удовлетворены полностью. Этот слу- чай с самого начала был исключен из рассмотрения, хотя как с практической, так и с теоретической точек зрения он не лишен ин- тереса. Отметим, что закрытая транспортная задача всегда имеет опти- мальное решение [3]. Это решение можно найти с помощью симп- лекс-метода. Однако обычно для решения транспортной задачи ис- пользуют специальные методы, учитывающие ее специфику [3]. 2, Задача об оптимальном распределении деталей по станкам. Пусть некоторый прибор состоит из k различных видов деталей, 83
которые мы занумеруем числами 1, 2, .... к. Имеется т типов раз- личных станков, причем количество станков i-ro типа равно а/, t= = 1, 2, .... т. Детали могут быть изготовлены на станках разного типа. Производительность станка i-ro типа при изготовлении /-й детали составляет Сц. После изготовления детали поступают на сборку. Требуется закрепить станки за деталями так, чтобы в еди- ницу времени получать максимальное количество приборов. Пусть хц — количество станков i-ro типа, на которых можно из- готовить /-ю деталь. Очевидно, количество станков i-ro типа, изго- товляющих детали 1, 2, k видов, не должно превышать заданное число аг. к 2 t= 1, 2,..., т. (3.15) Общее количество деталей /-го вида, изготовленное на станках за то единицу времени, составляет / = ^> 2.в каждом при- боре имеется ровно одна деталь с номером / (/=1, 2, .... А), поэто- му, для того чтобы не было изготовлено лишних и не было дефици- та деталей, должны выполняться условия комплектности: т т 2 1•/’ = (3.16) /-I Общее количество комплектов деталей, необходимых для сборки прибора, равно общему количеству какой-либо одной детали, име- ющей, например, номер 1. Поэтому решение задачи заключается в максимизации линейной функции при ограничениях £— 1 (3.15)—(3.16) с дополнительным условием неотрицательности всех переменных Хц. Найденные оптимальные значения этой задачи не обяза- тельно целые числа. Например, хй>=2,5 означает, что на двух станках первого типа в течение единицы времени будут изготов- лять деталь с номером 1, тогда как третий станок того же типа будет работать лишь половину указанного времени. 3. Задача о загрузке оборудования. Имеется т станков, на ко- торых могут быть изготовлены п типов деталей. Производитель- ность i-ro станка при изготовлении детали /-го типа составляет сц. Величины плановых заданий Aj на изготовление /-й детали и ре- сурс времени Bi работы i-ro станка приведены в табл. 3.14, Требуется, учитывая ресурсы времени работы каждого станка распределить задания между станками таким образом, чтобы об- щее время работы всех станков было минимальным. «4
Пусть —время изготовления /-й детали i-м станком. Соста- вим ограничения по ресурсу времени для каждого стайка: /=1, 2,.„, т. (3.17) Условия выполнения плановых заданий имеют вид . т i-1 j= 1,2....П. (3.18) Математическая модель сформулированной задачи состоит в ми- т л химизации линейной целевой функции (суммарное время) 2 2 при ограничениях (3.17) — (3.18) и условии неотрицательности всех переменных tij< 4. Задача о производстве продукции при ограниченных запасах сырья. Из л видов сырья производится т различных типов продук-. ции. Стоимость реализации изготовленной продукции i-ro типа со- ставляет <ц, i=l, 2,..., т. Запас сырья /-го вида на планируемый период равен /=1, 2,..., л. Потребность в сырье /-го вида для производства продукта i-ro типа на данный период составляет Рц. В ходе производства могут образовываться побочные продукты, представляющие собой сырье для других продуктов. Это приводит к тому, что среди коэффициентов рц могут быть и отрицательные. Исходные данные задачи приведены в табл. 3.15. Требуется для каждого типа продукта i—1. 2,..., т определить такой объем производства xit чтобы обеспечить максимальную стоимость реализации изготовленной продукции при условии не- лревышения запасов имеющегося сырья. 85
Стоимость продукции равна гл <w (3.19) ограничения по запасам сырья имеют вид m i-i j—I» 2,..., itt (3.20) Таблица 3.15 Таким образом, задача заключается в максимизации линейной функции (3.19) при ограничениях (3.20) и дополнительном усло- вии i= 1, 2,т. Глава 4 ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ В настоящее время под динамическим программированием по- нимают методы решения оптимизационных задач, в основе кото- рых лежит идея разбиения исходной задачи на последовательный ряд более простых задач. Основной областью приложения динами- ческого программирования являются многошаговые процессы, т. е. процессы, протекающие во времени (дискретном или непре- рывном). В настоящей главе динамическое программирование рассмат- ривается применительно к решению задачи оптимального управ- ления дискретной системой. В § 4.1 напоминается формулировка этой задачи, а также приводятся различные ее разновидности. В § 4.2 на примере демонстрируется идея динамического програм- мирования, а затем формулируются и доказываются условия оп- тимальности в форме рекуррентных соотношений динамического программирования. Эти условия являются теоретической основой 66
численного метода решения задачи оптимального управления ди- скретной системой, который приводится в § 4.3. Обсуждаются до- стоинства и недостатки численного метода. $ 4.1. ЗАДАЧА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ И ЕЕ РАЗНОВИДНОСТИ 1. Постановка задачи оптимального управления. Напомним формулировку задачи оптимального управления дискретной систе- мой. Изменение состояний системы происходит в дискретные момен- ты времени t и описывается уравнениями д(О), /= 1, 2„.„ N. (4.1) где —n-мерный вектор состояния (фазовый вектор), а —г- мерный вектор управления в момент времени I, 7=1, 2,..., Л'. Век- торная функция gW считается заданной на множестве RnxRr, т. е. £(<>; R«><Rr->R”f 7 = 1, 2, N. Управления uW могут выбираться из соответствующих множеств допустимых управлений иШ е Ut <= Rr, /== 1, 2,..., ЛГ. (4.2) Чтобы была возможность выбора, обычно предполагают, что каж- дое множество Ut содержит по крайней мере два элемента. Соотношения (4.1)—(4.2) определяют дискретную управля- емую систему. Начальное состояние считается заранее задан- ным. Управления uO, .... удовлетворяющие (4.2), образу- ют последовательность допустимых управлений, которую будем обозначать через U. Последовательности допустимых управлений при фиксированном начальном состоянии, согласно (4.1), соответ- ствует определенная последовательность состояний л(0), л<ч,.... лс*^, называемая траекторией системы. Траекторию будем обозначать через 3t. Управление системой осуществляется следующим образом. При 7=0 система находится в состоянии В результате выбора уп- равления согласно (4.1), однозначно определится состоя- ние в момент времени t= 1. Дальнейший выбор управления в силу (4.1) приведет систему в некоторое состояние х&> и т. д. Окончательно последовательность допустимых управлений И ={«(>), ...} определит траекторию системы хП),..., xiv>}, соответствующую данной последовательности управлений. Выбору некоторой другой последовательности допустимых управ- лений 11' будет отвечать, вообще говоря, новая траектория системы Г. В качестве критерия оптимальности I будем рассматривать критерий вида w / =2 /' С-*'-1’. “'°). (4.3) /-1 где числовые функции 7=1, 2......N, считаются заданными иа множестве RnxRr. 87
Задача оптимального управления состоит в том, чтобы для за- данного начального состояния средн всех последовательностей допустимых управлений U найти такую последовательность U и соответствующую ей траекторию, которые доставляют наи- меньшее возможное значение критерию оптимальности (4.3). При этом U будем называть оптимальной последовательностью управ- лений, а отвечающую этой последовательности управлений траек- торию — оптимальной траекторией. 2. Условие разрешимости задачи оптимального управления. Со- гласно (4.1), при <=1 верно равенство «<>). Поэтому на основании (4.1) при (=2 можно записать Л(2)==^2)(Л.(1)1 tt(2)) = g(2)(g(i)‘(X(O)i U(1)K K(2))e Последовательно используя равенства (4.1), все остальные состоя- ния л<3>,.... можно выразить через «(*>, и<2\ ..., и№~1К Подстав- ляя найденные выражения для хП», хФ,.... в правую часть ра- венства (4.3), получаем критерий оптимальности 7, зависящий только от управлений u<l), и<2\ (напомним, что х(0) фиксирова- но). При условии непрерывности всех функций #1°, и !!, 2,..., Л', на RnxRr полученный критерий оптимальности представляет собой непрерывную функцию r-N переменных и^на множестве UiXU2X ... X XUNi При этом если указанное декартово произведение — непу- стой компакт (это заведомо выполнено, если каждое из множеств t/'i, U2,Un является непустым компактом), то согласно теореме Вейерштрасса (см. § 2.2) существует набор управлений й<1>, й<2\..., й(Ч доставляющий наименьшее возможное значение критерию оп- тимальности /. Таким образом, имеет место следующее утвержде- ние. Теорема 4.1. Пусть все функции gi\ g¥\..., gn\ /*, 7== «1, 2,..., АГ, непрерывны на RrtxRr и непустые множества допусти- мых управлений Uit U2,.... UN компактны. Тогда задача оптималь- ного управления разрешима. В частности, задача оптимального управления разрешима всег- да, если каждое из множеств U2......... UN содержит конечное число элементов. 3. Разновидности задачи оптимального управления. Нередко в задаче оптимального управления вместо критерия оптимальности / (4.3) рассматривают критерий оптимальности, зависящий только от конечного состояния: /==<p(jc<N)). (4.4) Возникающую при этом задачу называют задачей оптимизации конечного состояния или задачей терминального управления. За- * Эти функции представляют собой компоненты вектор-функции g(1>. 88
дачу терминального управления легко свести к задаче оптималь- ного управления с критерием оптимальности (4.3), если положить /' = /-1,2....ЛГ-1; /"(*(*-1), ttW)= ^(^(дЧЛГ-П С другой стороны, задача оптимального управления с критерием оптимальности (4.3) может быть приведена к некоторой задаче терминального управления. Для этого следует увеличить размер- ность вектора состояния на единицу, введя дополнительную пере- менную согласно следующему правилу: 4°Л=0; ЛЙ1-2 /Чх''-1’, /=1. 2,..., N. i-1 Тогда к векторному равенству (4.1) добавится еще одно равенство •*Wi-4'm’4-/4x“-*». «<*>). «-1,2...JV, а суммарный критерий оптимальности принимает вид функции ко- нечного состояния Таким образом, задачи оптимального управления с критериями оп- тимальности вида (4.3) и (4.4) эквивалентны. Иногда в качестве критерия оптимальности рассматривают /=<р(д:(лг>)-|-2 /' ««>). (4.5) 1-1 Задача оптимального управления с критерием (4.5) также эквива- лентна задаче с критерием (4.3), поскольку — = 4p(gW(jC(*-4 Ц^))). Существуют задачи с дополнительными ограничениями на пе- ременные состояния: ^=1.2....ЛГ, (4.6) где хотя бы для одного /г{1, 2,..., /V). Это задачи опти- мального управления с фазовыми ограничениями, поскольку век- тор состояния х<(> называют н фазовым вектором. В частном слу- чае, когда из всех условий (4.6) имеется только одно условие причем множество Хдг состоит из единственного элемен- та, соответствующую задачу называют задачей оптимального уп- равления с фиксированным конечным состоянием. Задачи оптимального управления с фазовыми ограничениями в условиях выполнения предположений теоремы (4.1) и компактно- сти непустых множеств Х2,...» XN не обязательно имеют реше- ние. Это может быть, например в случае, когда не найдется ни одной траектории системы х(°>, .... х1Л'), для которой были бы выполнены все условия (4.6). 89
В задаче управления со свободным начальным состоянием со- стояние Jd0> заранее не фиксируют, а выбирают из заданного мно- жества: JcWeXgcR". По существу, является дополнительным вектором управления и задачу со свободным начальным состояни- ем легко привести к обычной задаче с фиксированным состоянием. Встречаются также задачи с нефиксированной продолжитель- ностью, где время управления Л' заранее не задано. Важным при- мером задач подобного типа является задача об оптимальном быстродействии. В этой задаче требуется найти последователь- ность управлений, переводящую систему из начального состояния в заданное конечное состояние за минимальное возможное число шагов N. Кроме дискретных управляемых систем вида (4.1)—(4.2), в ко- торых состояние однозначно определяется предыдущим состоя- нием х((->) и управлением и(0, встречаются системы, имеющие з а- паздыванне. В системах с запаздыванием состояние в мо- мент времени i зависит не только от предыдущего состояния х<<_ио и от «более ранних» состояний в моменты времени t—2, t—3 и т. д. В общем случае система с запаздыванием на один шаг описы- вается следующим обрйзом. Известны состояния л*"1), лч0), а даль- нейшее изменение состояний описывают равенства f=lt 2.....ЛГ. (4.7) Критерий оптимальности для систем с запаздыванием на один шаг имеет вид /=2 /' JC"-2). «*'’). (4.8) /•=1 а выбор управлений стеснен ограничениями (4.2). Задача опти- мального управления системой с запаздыванием заключается в том, чтобы для заданных состояний xt-o, среди всех последова- тельностей допустимых управлении, найти такую последователь- ность и соответствующую ей согласно (4.7) траекторию, которые доставляют минимальное значение критерию оптимальности (4.8). Данную задачу можно привести к задаче оптимального управле- ния, сформулированной в п. 1. Для этого введем дополнительный вектор состояния Лд+2,..., лЙ) по правилу ytn=xu-i)t /=0. 1,2,...,ДГ. (4.9) В новых обозначениях равенства (4.7) можно записать так: Х(П=£(П(Л('-П, И(О), /=1,2.....JV. (4.10) В результате приходим к следующей задаче, в которой 2л пере- менных состояния Хь х2,..., хп, хп+],.... х2п н г переменных управ- ления иг, .... иг. Задана дискретная система управления (4.10), 90
(4.9), (4.2), начальное состояние (xl0’,..., Ад0*, и кри- терий оптимальности «10)- t-i Требуется найти оптимальную последовательность управлений ...» й(Л) и соответствующую оптимальную траекторию. Эта задача того же типа, что и задача оптимального управления, рас- смотренная в п. 1. Если дискретная система имеет запаздывание на два ш ага, то функции в правых частях равенств (4.7) и (4.8) зависят еще к от лс((-3\ В этом случае, для того чтобы соответствующую задачу управления привести к задаче из п. 1, необходимо исходное число переменных состояния Хь Хг, .... хп утроить. Запаздывание может иметь место не только по переменным со- стояния, но и по переменным управления. Так, запаздывание на один шаг как по состояниям, так и по управлениям будет выра- жаться в том, что функции в правых частях равенств (4.7) н (4.8) будут зависеть еще и от В этом случае для сведения полу- чающейся задачи управления к задаче из п. 1 потребуется ввести п+r дополнительных переменных состояния ^<()= (xn+i, j£+2,..«, •4а), 2(0=(*2л+Ъ---» *£i+r) согласно (4.9) И = /=1, 2, .... /V. § 4.2. МЕТОД ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ 1. Идея динамического программирования. Для того чтобы ми- нимизировать функцию аддитивного вида ц<2>,.... &w) = = Л1 (uO))+ft2(ui2>) 4- ... +ftJV(u</v)) по i=l, 2,.... Л/, достаточ- но найти минимальное значение каждого слагаемого й{(и<{)) на со- ответствующем множестве Uf. Тем самым решение исходной зада- чи сведется к решению N более простых задач. Это возможно бла- годаря аддитивной структуре минимизируемой функции и выбору переменной и№ в пределах соответствующего множества (7, неза- висимо от остальных переменных. Критерий оптимальности (4.3) в задаче оптимального управле- ния дискретной системой (4.1), (4.2) также обладает аддитивной структурой и управление М‘> выбирают независимо от остальных управлений. Однако минимизация критерия (4.3) не сводится к минимизации каждого слагаемого /((х((-*), и<*>) на множестве Utr поскольку это слагаемое зависит еще и от х0-1\ В свою очередь, состояние Jt<,—>, согласно равенству (4.1), зависит от х*1-2) н и т. д. Таким образом, состояние х<(-‘) (а значит, и /Цх*'-1», и(0)) определяется последовательностями предыдущих состояний х<°, х<2>,х<*-2> и управлений ы<1\ w<2\ Итак, для того что- бы указать оптимальное управление и в момент времени /, необ- ходимо знать последовательности предыдущих состояний и управ- лений. Тем не менее исходную задачу минимизации критерия оп- 91
тицальндсти (4.3) также можно разбить на ряд боле® простых подзадач, которые решают в определенной последовательности. . Пример, Пусть п=1, г=1. Л'=4 и задача оптимального уп- равления имеет вид ХЮ = - ly x«-i / = 'I г Я, 3, 4; £/,=£/= {-1; 1 ], /= 1, 2., $, 4; дМ-. 1; < /=2 х<‘=»2«('’=. m<n. J -1 (4 - i> <4-12> (4,13) На рис. 4J изображены все возможные переходы из одного состоя- ния в другое под действием допустимых угра вл сияй —1 и L Из Ш возможных последовательностей допустимых управлений требует- ся выбрать такую последовательность и соответствующую ев тра- екторию, которым отвечает наименьшее .возможное значение кри- терия оптимальности (4,13), Обозначим исковую оптимальную траекторию' через I, F13, 1’4 ^4 Рассмотрим последнее слагаемое в сумме (4,13), т. е» функцию = х^2«{4 При <-"Э возможны два состояния: tP»=l и х® — —I. Предположим,, что оптимальным является вер- ное состояние: Ва>—1.,. Для этого состояния имеем /*И4 ’-и=0Л<2=/4(хт, 1), а значит. 3. Г-1 +0.5 <2* xt'-42:<,1-i-2. f-8 Следовательно, если ^1, то унравление fat*1—1 заведше не бу- дет оптимальным; таковым является управление —J, Плэто- ,м.у стрелку,, которая соединяет точки, соответствующие состояв ины дЯ=1 и х«^1, и соответствует управлению н^=!, можно исклю- чить из дальнейшего рассмотрения' (рис, О), На рис. 4.2 также указано значение /4Й4 —I) —0,5. 92
Теперь предположим, что х(3)=^= —1. В этом случае /Члс3). —1) = —0,5> —2=/4(л(3), 1), а значит, управление иСО——1 (при условии х(3)=—1) не может быть оптимальным. Этот факт также отражен на рис. 4.2. Таким образом, для каждого возможного состояния системы при t = 3 найдено «условно-оптимальное» управление и&\ которое является действительно оптимальным при условии, что оптималь- ным окажется соответствующее состояние. При /=2 также возможны два состояния: л<2>= 1 и лс<2>=—1. Предположим вначале, что х(2)=х(2>= 1. В этом случае выбор уп- равления 1 приводит к состоянию х<3)=—1, а в результате действия управления —1 система перейдет в состояние л<3>= = 1. Поэтому Р(х<2>, —1)+/*(1, —1)=0,5+0.5>2—2=f3(x<2>, 1)-|- +f4(—1, 1), т. е. если х<2)=1, то оптимальным является управление 1г<3>—1. Аналогично находим, что при —1 оптимальным явля- ется управление и<3>= —1. Аналогично для f=l получаем, что при х^>=1 и х^= —1 соот- ветственно П<2)= —1 Если /=0, то состояние задано однозначно: лЯ=1. Поскольку f (Jd°), —1)+0.5—0,5—2 1,5>—2,5=fl(*<0). 1)—2—0,5—2, оп- тимальным является управление uOJ—iiUJe 1. Теперь легко воссоздать всю последовательность оптимальных управлений й<1)=1, й<2)=1, й(3)=—1, й<4>=1 и соответствующую оптимальную траекторию £<’>=—1, —1, .т(3)=1, я<4>= —1 (см. рис. 4.1 и 4.2). Если задачу (4.11) — (4.13) рассматривать только для #=3, то оптимальной последовательностью управлений является й(1>=1, ut2)=l, и<8*=1, где значение цФ = 1 не совпадает с полученным вы- ше значением й*3) для N—4. 2. Условия оптимальности. Рассмотрим дискретную управля- емую систему из п. 1 предыдущего параграфа: л(О=£г(о(Л(г-п /=1,2,..., АГ, u^<=Uti /-1,2..JV. (4.14) с критерием оптимальности /=2/,(x('_I’-<415> I— 1 Предположим, что множества О’ь С/2,.... UN непустые и ком- пактные, а все функции g{‘\ gn\ f*, i= 1, 2,..., /V, из (4.14) и (4.15) непрерывные на RnXRr. При этих предположениях, со- гласно теореме 4.1, задача оптимального управления разрешима. Определим рекуррентным способом функции co.v(x). oN_) (х)>..., оо(х), заданные на Rn: u>w(x)=0, «/~i(x)=minI//(^, «)+ш/(^(/)(-«, «))]. /=1, 2,..., АГ. (4.16) sec/f . 93
Функция <от(л) тождественно равна нулю для всех xeRn. По- этому из равенства (4.16) при f—.V имеем w?v_1(x)=min /*(х, и). u^U Далее, используя функцию gi.v-i(x), из формулы (4.16) при / = = V—1 определяем следующую функцию: ^_2(x) = min tt)-|-mfn fN(xt и)J “etZA'-t usU,V и t. д. и, наконец, находим ©0(x). Функции £1°, gi0..-, g« \ f*, i = l, 2,... ЛГ, непрерывны, а множества Uit V2. Un компактны, поэтому минимум в правой части (4.16) всегда достигается при каждом фиксированном xeRn. Следовательно, определение функ- ций (o.v, шЛ-1» —> ыо корректно в том смысле, что равенства (4.16) действительно определяют указанные функции, заданные на всем пространстве R”. Динамическим программированием называют метод решения задач оптимального управления, основанный на следующих необ- ходимых и достаточных условиях оптимальности. Теорема 4.2. Пусть П={й(1), й<2),.... —некоторая последова- тельность допустимых управлений, a £ = {f(°), £(*),£(*)} —соот- ветствующая этой последовательности управлений траектория. Для того чтобы последовательность управлений U и траектория £ были оптимальными для дискретной системы (4.14) с критерием оптимальности (4.15), необходимо и достаточно, чтобы для каждо- го t=lt 2,N выполнялось равенство ц(О)) = =min «)+®/(g(n(x<z-l,t u))J. (4.17) □ Необходимость. Пусть последовательности Ц и £ явля- ются оптимальными. Докажем справедливость равенства (4.17) для всех ( = 1, 2.. П. Предположим противное: для некоторого непустого множества индексов Г<г(1, 2,..., JV) равенство (4.17) не имеет места. Обозначим через k наибольший элемент множества Г. Согласно предположению, существует управление u№^Uk, для которого верно неравенство /й(л<*-1>, «<*0+«A(g(ft)(^tA-1\ «(А)))< < /* С?*-1», и(Ю) _|_ Ша (g(*> (^*-0 й<л>)). (4.18) Положим x(O=x(nt / = 1,2.....Л— 1, в<*>=и(О, /=1,2,.... й—1. (4.19)
Введем вектор xW=^b)(x<fc-1), u(fe>). По определению функции шь имеем «(*>))=а>*(х<*>) = min [/*+1(x(ft\ «) + uec/*+i +<o*+i(g(A+1J(*(4 »))L Множество Um-} компактно, а функция от и, стоящая под знаком минимума, непрерывна. По теореме Вейерштрасса, существует уп- равление м<Л+,)ей\+1, на котором минимум достигается: <o*(xW) ==/*+> (х<4 K<»+I))+<«A+l(g(*+1)(x<ft), Теперь введем jc<*+j)=£(*+*> (x<k>, ut^+O) и т. д. Аналогично постро- роим последовательности U= (uW, u<2>,а(Л)}, £={£t°>, лО),x(V>}, для которых выполняются соотношения (4.14) и, кроме того, на основании (4.18) верно неравенство v «<'))<Вс*))+«Л(£<») (*(*->), £(*))). (4.20) 1-Л Поскольку k — максимальный элемент множества Г, равенства (4.17) имеют место для f>k: /"-i#"-2), в<лг-11)+<йлг_1(^^-1)(ллг-2, p+i(X(*)t в(*м>)+«д+1 (£<*+») вС*+1>))==<оА(х<»>). Складывая почленно эти равенства, получаем ш,(х<»>)=2 а<0). /- *+1 Теперь, подставляя значение соа (х(А)) в (4.20) и приходим к неравенству 2 /' «(°х 2 f‘ 1-1 1-1 учитывая (4.19), Следовательно, для последовательностей St и J значение критерия оптимальности меньше, чем для последовательностей 15, £. Это противоречит^ ача л ьному допущению об оптимальности последо- вательностей И, X. Достаточность. Пусть для последовательностей St, £ ра- венство (4.17) верно при каждом £=1, 2,..., N. Установим опти- мальность данных последовательностей. Для этого рассмотрим произвольную последовательность допустимых управлений Я= 95
=- {»(*), k(-V)) и соответствующую ей, согласно (4.14), траек- торию £= {х<°\ х Л’}. Из (4.16) при имеем ш/_1 (g<‘> ttto)), f=l, 2,...,ЛГ. Складывая почленно эти неравенства и учитывая, что gW(x<t~*,1 л<о) =ха\ получаем Мх'0))<2 Л и(О). (4.21) Г-1 С другой стороны, записав равенство (4.17) в виде /* (g{f) U(M), = и просуммировав по t— I, 2,...» N, найдем w0(z<°>)=2 л «(0>- <4-22> Г-1 Начальное состояние у траекторий £ и £ одно и то же, поэтому Следовательно, из (4.21) и (4.22) вытекает неравенство N N г-1 /-1 которое благодаря произвольности выбора £ означает оптималь- ность последовательностей управлений Я и состояний £. Для оптимальных последовательностей И и £, согласно дока- занной теореме, выполняется равенство (4.17) при каждом / = 1, 2,..., N. Суммируя это равенство no f=l, 2.Л/, придем к равенству (4.22), где в правой части стоит оптимальное значение критерия /. Обозначая начальное состояние через х<0), прихо- дим к следующему утверждению. Следствие 4.1. Минимальное значение критерия оптималь- ности (4.15) для дискретной системы (4.14) с начальным состояни- ем равно coo (jtf0)) • Следствие 4.1 приводит к следующему способу отыскания ми- нимального значения (1)0(#°>). Сначала, согласно (4.16), следует найти функцию о,у-1(лс). Затем можно определить функции 4»x-z(*) и т. д. и, наконец, шо(х). Вычислив значение функции ©о(лс) в точке х<0>, получим минимальное значение критерия опти- мальности. Заметим, что, найдя функцию ою(^), можно легко по- лучить минимальное значение не только для х(°), но и для другого произвольного начального состояния. В простейший случаях, как показывает приведенный ниже пример, указанный подход удается реализовать аналитически. 3. Пример использования теоремы 4.2. Рассмотрим дискретную управляемую систему, в которой п=2, г= 1, N= 10 и 96
afOet/z-l-l, 1J, /=1.2.....10. л««>=(-2, If, с критерием оптимальности в виде функции конечного состояния Решим эту задачу терминального управления, используя результа- ты, полученные в п. 2. По определению (4.16), верно равенство (i>io(xj, х2)^0. Далее имеем «о(х., x2)=min f/w(xlt х2, «)4-0|=mln (xl — x7)u. ш=[-1,П ее [-i,i i При фиксированных Xi и х2 выражение (xt— х^и представляет со- бой линейную функцию переменной и. Следовательно, среди точек минимума этой функции обязательно будет хотя бы одна гранич- ная точка множества U, т. е. и= —1 или и—1. Поэтому можно за- писать «в(лх, jC2)=min (xx — x2)a = min|x2—хх; Xi — х2]. 1:1} Минимум в правой части равенства достигается при и=1, когда Xi—х2^0, и при и——1, если На основании (4.17) не- трудно определить оптимальное управление: а(м» = е€ли xi9> “<°» —1, если xt9)—х£9>>0. В частности, при х$9) — х$9)=0 оптимальным является любое из уп- равлений 1 или —1. Теперь можно определить следующую функцию: “аС*!, x2)=min *2. «))!= =mfn mln {(дч — х2)я — хх — х2; хх-|-л2 — (Х| — х2)и}. и£[—1,1] Очевидно, функция min (...) переменной и является вогнутой при произвольных фиксированных хх и х2. Значит, среди ее точек ми- нимума обязательно будет хотя бы одна граничная точка множе- ства U. На основании этого имеем “вC*i. х2)=min miti }(xi — х2) и — хх—х2; u<={-i: 1) **“1+х2—(*i ~ xz)। — m,n I —2хх; —2х2; 2хх; 2x2J, причем если Xj^x2, х(^—х2 или Xj^x2, х^—х2, то минимум достигается в точке и=1, а если х,^х2, х(>—х^ или Х]^х2> 4—339 97
х2, то в точке и= —1. Согласно (4.17), это означает, что оп- тимальное управление имеет вид «<’>= 1, если или xF>-x£>t -1. если х1”>х?\ или . Далее аналогично имеем «7 Ui> =min min[04-d>a(g<8> (х,, х2, w»] = ue(- 1Д] =mln mln (— 2(Xi+x2); —2(xt —x2)и; 2(Xj+xj); {2(Xj —x2)u}— »e[-i,n =m!n mln[—2(Xj4x2); — 2(Xi— х2)и; З^+х^; 2(X!— x2)n}= «ei-isij ==min{—2Xi—2x2; 2xi4-2x2; 2x2—2xj- 2Xj —2x2); причем последний минимум достигается на любом из управле- ний и=—1 или н=1. Следовательно, в качестве оптимального мо- жет быть взято управление п(8)= —1 или и(й)= 1. Аналогично, в качестве оптимального управления п<7) можно взять как управление u(7>=—1, так и п(7>=1, причем o6(xi, х2) — =min {—4xi; —4х2; 4xi; 4х2) и т, д. На каждом последующем ша- ге также оптимальным является любое из управлений —1 или 1. При этом <1>о(хь х2)—min {—32х(; —З2х2; 32xj; 32х2). Находим оп- тимальное значение: «0(—2,l)=mln{64; -32; -64; 32} =-64, Теперь восстановим оптимальную последовательность управлений. Поскольку начиная с и<8> в качестве оптимального можно брать любое из чисел— 1 или 1, для определенности примем ut‘> =«(*)=... ... = «,8’ = 1. Находим соответствующую этим управлениям часть оп- тимальной траектории: х°= (—2, 1)\ х^=(—1, 3)г, х<2>=(2, —4)г, 2, 6)г, х<*)=(4, —8)г, х<®)=(—4, 12)г, xi»>-(8, — 16)г, xffl=(8, — 24)r, x<e>=(—16, 32) Л Так как хР<х£”. х|”>-х?’. то ы<0)=1. В этом случае х<9>—(16, —48)т. Следовательно, хР—х£9,^0 и поэтому —1. Запишем окончательно опти- мальную последовательность управлений и соответствующую тра- екторию, на которых критерий оптимальности имеет минимальное значение, равное —64: / 8 \ /-16\ / 16\ 7—32\1 1ч-24/ 32/ L-48/’ 1.-64Д ’ 98
По построению данные последовательности удовлетворяют равен- ству (4.17) при /=1, 2,..., 10, записанному применительно к рас- сматриваемой задаче оптимального управления. 4. Принцип оптимальности. Разобьем весь промежуток времени от 0 до/V, где 2, на два периода ^ = {0, 1,..., k] н Т2= — {k +1,..., Л/), где А—некоторое натуральное число вида 1^А^ г^Л/—1. Предположим, что в результате применения допустимых управлений u<4 uW ...t д(Л) дискретная система (4.14) из начально- го состояния х(0) перейдет в некоторое состояние х(А). Это состояние можно рассматривать как начальное состояние для второго пери- ода управления Т2. При этом первому периоду соответствует кри- * терий оптимальности Л а второму — /-1 /г=2 й(О). Установим связь между оптимальной /-Л-М последовательностью управлений и подпоследовательностью уп- равлений, отвечающей второму периоду Т2. Обозначим через й<4 «(Ч ..., оптимальную последователь- ность управлений и через аг<°>, .... х^— соответствующую оп- тимальную траекторию. Имеет место следующее утверждение. Принцип оптимальности. Оптимальная последова- ность управлений йР\ ..., й(ЛГ) для системы (4.14) с критерием оптимальности (4.15) обладает тем свойством, что для произволь- ного Ае{1, 2,..., N—1} подпоследовательность управлений «(*+*). u(-v> является оптимальной последовательностью во вто- ром периоде времени относительно критерия оптимальности /2 ы состояния, в котором оказалась система после первого периода. Для доказательства предположим противное: найдется такой номер Ле (1, 2 V—1} и подпоследовательность допусти- мых управлений u<fc+1\ .... и№ такая, что Л' м 2 «“’х 2 /* «<'>). (4.23) где через х(Ч ...» обозначена последовательность состо- яний, отвечающая и<*+1>, ..., u(N), т. е. xW«ig(O(jK<-Of «(0)t t=A-f-l,..., /V. На основании последних равенств последователь- ность управлений ШЧ > 5*4 н(А+Ч .... w(A/) является допустимой в исходной задаче и ей отвечает траектория х<0), ...» x<h+4 .... причем в силу (4.23) имеет место нера- венство /-1 которое противоречит оптимальности последовательности управ лений ы<1>, й<2). йЮ. Полученное противоречие завершает дока зательство. 4 99
Принцип оптимальности — это необходимое условие оп- тимальности. Согласно этому условию, подпоследовательность уп- равлений, не являющаяся оптимальной в каком-либо втором пери- оде, не может входить ни в одну оптимальную последовательность относительно всего временного промежутка от 0 до М Для критерия оптимальности /, отличного от (4.15), принцип оптимально- сти может нарушаться. В этом можно убедиться на следующем простом приме- ре. Пусть л-1, r»l, 7V=3, jc(€>=I, f=l, 2, 3; и(()е£/«з = [—1, 1], /=1, 2, 3, и критерий оптимальности имеет вид /=тах |х(г“1,1. Г—1,2,3 Ясно, что /^1 я минимальное значение критерия, равное 1, достигается, напри- мер, для последовательности управлений й*1>=—1, i?2)=—J, 5<s)=], Однако подпоследовательность й<а>, й(Э> не является оптимальной относительно критерия max |х(<~|}| и начального состояния = Этим требованиям удовлетвори- ет последовательность управлений ii<a»=0, E<s*=0. § 4.3. ВЫЧИСЛИТЕЛЬНЫЕ АСПЕКТЫ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ 1. Формальное описание численного метода. В. предыдущем па- раграфе было показано, что метод динамического программирова- ния для решения задачи оптимального управления состоит в поша- говом построении функций (йл-_1(х), .... од(х) согласно равенствам (4.16). Найдя последнюю функцию од и вычислив ее значение в начальном состоянии, определяют искомое минимальное значение критерия оптимальности. В процессе вычислений на каждом шаге /для каждого состояния необходимо запоминать соответствующее оптимальное управление (точнее, «условно-оптимальное» управле- ние). На основе этой информации «восстанавливается» оптималь- ная последовательность управлений и оптимальная траектория. Пример подобных вычислений приведен в п. 3 § 4.2. Однако на практике, как правило, аналитически решить зада- чи оптимального управления не удается и приходится использо- вать численную процедуру, простейшая версия которой приводит- ся ниже. Выделим в пространстве состояний х, т. е. в Rn, прямоугольное множество вида ( = 1, 2,.... я|, в котором содержатся все возможные состояния дискретной систе- мы, т. е. такое множество, что выполняется условие t— =0, 1,..., А7, для всех допустимых последовательностей управле- ний. Отметим, что точное определение границ а* и bi часто сопря- жено с трудностями. Каждый отрезок [ait разделим на части, а именно выберем число Ах<>0, характеризующее точность вычис- лений, и положим *=1.2,..., Л„ Л, =[ 1+1» 100
где ( 1—-символ целой вдета числа. Тем самым в пространстве состояний образуется сятш (ти- 4.3}, узлам ч которой являются точки вида (jcj*'1, Д*га>)т, где &1<Иь ••>» <;4П. Эту сетку можно рассматривать в различные моменты вре- мени t—0. I, ....... Л-. Тогда в про- странстве (х. г) будут заданы сет* О, которые обоздачмм. соответствен - но' через Q, С3( B.,t CjV (рис., 4.4). Аналогично- выбираем некоторую сетку в пространстве управлений RF для каждого f=l, 2, ....,, Ж и че- pva t/? обозначаем множество узлов этой сетки, содержащихся в ыноже- Рнс. 4.3 стве допустимых управлений ЭД (рис. 4.5; множество ЭД0, отмечено кружками). Теперь опишем численный метод. Сначала прямым пере- бором вычисляют и заносят в память ЭВМ значения функции 4v-i(*)==E^ 7*4#, а) для всех х, являющихся уялэми сетки Cy-v Условимся далее узлы Сёток г пространстве состояний обозначать через х^[, а узлы сеток в пространстве управлений — через t№> и т_ д., опуская индекс 1 Для каждого узла jbM следует зядюммиать также управление $л* «Д‘¥(да)^ЭДЛ реализующее минимум и правой, части равенства. Б результате в намята ЭВМ будут храниться все значении функ- ции ь»5ч(х) и управлений nW(t), соответствующие уздам сотки Сл.^ь- На следующе-я шаге вычисляют и запоминают значения функции «ж-э Ш=ral-n [/^-и ( X,. йЗ +^JV_1 (g<flr=li (х, й))1 “^-1 в узлах, сетки C1V=2,. Для каждого узла одедует запомнить и управ- ление Й^=,-Ц.г} па котором достигается минимум в правой части равенства. Поскольку функция c»»_i задана ь виде таблицы, могут возникнуть трудности при вычислении зиаче- Ш|
НИЙ функции ш--<ь Дело в том, что состояние £й) при фиксированных 2(hJ и $0 (где |=*Л'^2 для Д^й> и /^Л‘г—I для находясь внутри сетки С^=ь может не совпадать ни с одним из ее узлов и поэтому из таблицы для ш-i нельзя определить значе- ине (л1^ й^)),. В таких случаях состокниеДЯ) можно‘отождествить с б^нжаЛшим узлом сетки С^. и требуемое значение’ определить из имеющемся. таблицы для функции <a_nr-i. :1рн этом точность вычислений уменьшается. После за несен и я. в память ЭВМ таблиц значений функций и соотзетстаую- щих управлевдй таблица значений для (вЛ.^ может быть «забыта». Дальнейшие шаги аналогичны, Процесс вычислений продолжи- ест до тех пор, пока не будет получена таблица функции set в узлах сетки Со. Минимальное значение критерия оптимальности равно значению функции дор, вычисленному в дЯ (или в узле, ближайшем к Приближенную оптимальную последовательность управле- ний и соответствующую траекторию по хранящимся в памяти ЭВМ таблицам функций <Л13(х)., цй(х), „., ц<А’Цх) находят в следу- ющем порядке: ^ЙСЧ(Л<О.1), =f£m ИЛ)}1 х™ =^г>(34 йИ; £f№b 2, Анализ численного метод*. Отметим достоинства описан того метода, 1) Метод не йредполагает использования каких либо зналити- ческьх свойств всех функций, участвующих в постановке задачи Рте. 4.6 оптимального управления, примем множества £>t могут иметь произвольную структуру;. 2) .Метод, позволяет построить приближе- ние к г л о б а л ь но м у минимуму критерия оптимальности. 3} Таблица последней. функции получа- ется нс только для одного заданного состоя- ния а для всех узлов, сетки Со. Это позво- ляет проанализировать «чувствительность» ре- шения задачи к изменен ню начальник данных. 4}' Метод можно использовать при реше- нии задач с дополнительными фазовыми огра- ияченнимя x(t*£=Xt, t^l, 2, ..., М Для этого следует производить вычисления не для всех узлов сеток. G, а лишь для множества «допустимых» узлов Уг Множество Fi, JC sJtf-CiV, получается из множества узлов- сетки С» удалением узлов, не входящих Хь а также узлов $4 Для. которых состояние (jj не принадлежит множеству Хт ни для каких не F^^3TO совокупность узлов сетки Cv, ВХОДЯЩИХ В Jj¥. Оказывается, что при доба^ении фазовых ограничений эффектнв- Ю2
ность метода лишь возрастает, поскольку уменьшается количество переборов при отыскании минимума на каждом шаге. Основной недостаток численного метода динамического программирования заключается в непомерно большом требовании к объему памяти ЭВМ. Уже для п=4; 5 и 4j=100 эти требования превышают возможности современных ЭВМ. Приходится умень- шать число узлов, выбирая «крупные» ячейки сеток (т. е. увеличи- вая ДХ|) или занижая границы щ и bi множества X. Однако в этом случае снижается точность вычислений, а при заниженных значе- ниях а, и bi процесс вычислений не всегда удается довести до кон- ца (рис. 4.6). § 4.4. ПРИКЛАДНЫЕ ЗАДАЧИ 1. Задача о кратчайшем пути. Пусть имеется некоторая система, которая может находиться в одном из конечного числа состояний. Переход из одного состояния в другое осуществляется по опреде- ленному правилу за определенное время. Требуется из заданного начального состояния перевести систему в желаемое состояние за минимальное время. Для наглядности будем интерпретировать эту задачу как зада- чу нахождения кратчайшего пути в сети. Предварительно напом- ним понятия, связанные с сетью. Ориентированная сеть состоит из непустого конечного множества вершин V и подмножества X мно- жества Элементы множества X представляют со- бой упорядоченные пары вершин и называются дугами сети. Зану- меруем вершины сети числами натурального ряда 1, 2,..., N. Нали- чие в множестве X упорядоченной пары (/, /) означает, что из вер- шины с номером i исходит дуга, которая входит в вершину с номе- ром у. Каждой дуге (t, у) поставлено в соответствие некоторое не- отрицательное число которое будем интерпретировать как длину данной дуги. Путем называется конечная последователь- ность вершин, обозначаемая (и, *2, *п) и такая, что из вершины ik исходит дуга, которая входит в вершину iA-n, 2 п—1. Длиной пути называется сумма длин входящих в него дуг. Путь, в котором начальная и конечная вершины совпадают, т. е. h = in, л ^2, называется циклом. Сеть, не содержащая циклов, называет- ся ациклической. Вершины ориентированной ациклической цепи всегда можно занумеровать так, чтобы для каждой дуги (i, у) было справедливо неравенство i<Zj- Поэтому далее будем считать, что такая нумера- ция произведена. Рассмотрим ациклическую сеть, имеющую 10 вершин, которая изображена на рис. 4.7. Вершины изображены в виде кружков, а дуги — стрелками. Возле каждой стрелки указа- на длина данной дуги. Внимательно просматривая данную сеть, можно выделить кратчайший путь из вершины 1 в конечную вер- шину 10. Однако если бы сеть содержала достаточно большое чис- 103
л о вершин^ то, нспол ьзу Я1 метод просмотра, справиться е задачей было бы не просто. Построим на данном простом примере алгоритм решения зада- чи, основанный иа идеях динамического программирования и при- годной для сетей с большим числом вершин... Начнем искать оптимальный дуть «с .конца».. Из. вершин 5 и & движение а вершину Z0 определено однозначно, Присвоим указа и» ным вершинам числа,, соответствую- щие длинам дуг, т. е. 13 тс 1В. Из вершимы 7 исходят две дуги: в. вер- шину /0 и в вершину 5', I □скольку f7, |0 == /Ti в+ /д. j 0 20, пр иена и на е м. вершине 7 число 20. Из вершины f исходят три дуги, причем, оптималь- ным движением из вершины б явля- ется перемещепие по дуге /0), длина которой равна J5. Приписы- ваем взо число вершине б. Из вер- Рис. 4.7 шины 5 можно попаси либо в вершину о либо и вершину f. Срав- ниваем длины: 12+1.8<1б+ IS; следовательно., вершине 5 следу- ет приписать число 1.2+18 — 30; Посту па я аналогично, придем в. вер- шину /, которой будет приписано число 32— длина искомого крат- чайшею пути. Нетрудно' восстановить и сам кратчайший путь: /, 2, 4. 6'. М Теперь сформулируем, в общем виде длгермтж логгагс1₽н«я крет- чайшего пути. Будем считать, что требуется найти кратчайший путь из вершины / в вершину Ж. Шаг L Положить d,v=0 и 7=М—1, где №— число вершин данной сети. Шаг 2. Положить ®,=-тш (^+&м)» гас минимум вычисляется ДЛЯ всех />/. для которых существует дуга (i, J). Запомнить дуть, на котором реализуется указанный минимум.. Если минимум дости- гается сразу на нескольких путях, то можно запомнить любой ил них. Шаг 3.. Если test, то вычисления закончены. Б противном слу- чае уменьшить 1 на единицу и вернуться, .к шагу 2.. Вершины сети должны быть занумерованы таким образом, что номер вершины,, из которой дуги исходят, должен быть меньше ко- мера вершины, в которую она. входит. Это»,предполагает ад выпол- нена ым для каждой дуга. 2. Задача, об оптимальном распределении примени пребывания рев гейтов в каскаде ре я к горой идеального смешения (7J,. В химиче- ских реакторах 5 результате химических превращений из исходно го' сырья получают необходимые продукты. Реак ор идеального смешения .представляет собой идеализированную модель реактора (сосуда), снабженного перемешивающим устройством,., причем пе« ремешивание происходит настолько интенсивно, что обеспечивает- ся- равномерность состава и температуры смеси в объеме реактора. 104
Пусть в реакторе происходит превращение реагента А в ре- агент В. Концентрации реагента А на входе в идеальный реактор Лих и на выходе из него хВЫх связаны {7] зависимостью *.ых = хк/< I + (4.24) где т — время пребывания реагента А в реакторе, k — константа скорости химической реакции (зависящая от температуры). При этом скорость реакции прямо пропорциональна концентрации ре- агента. Соединим выход первого реактора с входом второго реактора, а выход второго — с входом третьего реактора н т. д. В результа- те получим каскад реакторов (многоступенчатый реактор). Обоз- начим через W число реакторов в каскаде. Заданы концентрация Jt<°) реагента Л на входе каскада и концентрация на выходе по- следнего реактора. Требуется определить минимальное время пре- бывания реагента в каскаде и распределение этого времени по ре- акторам, если температура во всех реакторах одинакова. Обозначим через jdf> концентрацию реагента на выходе реакто- ра е номером t. Используя зависимость (4.24), можно записать + / = 1,2..N, где т: — время пребывания реагента А в реакторе с номером /. Температура во всех реакторах считается одинаковой, поэтому можно принять kt = k, /=1, 2,..., N, и вводя «обобщенное время» записать /=1.2..N. (4.25) Эти соотношения определяют дискретную управляемую систему с начальным состоянием и фиксированным конечным состоянием х(ЛГ). На управление наложено ограничение uW>0. i=l, 2, ..., Л'. Критерий оптимальности, согласно условиям задачи, имеет вид /=£««> /-1 и явно от х№ не зависит. Его значение с точностью до множителя k совпадает с общим временем пребывания реагента в каскаде ре- акторов. Заметим, что в данной задаче параметр I, который в пре- дыдущих пунктах играл роль времени, означает номер реактора каскада. Из (4.25) при t — N находим и<А>= (xtA'_]>/xW)— 1. Следователь- но, величина и'Л'> однозначно определяется заданным значением х(АГ) и величиной Поэтому шлг-1 (л(Л'-1))=т1п 1. J 05
Далее, используя равенство (4.25) при t=N—1, имеем <“at-2(^w-2,)= mln в'^’ + Ан;-----------1 = { ,.(*-2) \ min I -|—гтг—---- — 1) . и(Л2-1)>0 \ Х(ЛГЧ1 +«(ЛГ-1}) / Продифференцируем функцию, стоящую под знаком минимума, по »(^-о и приравняем производную нулю. Имеем Л*-2) 1________________=0 х<*> (1 + uW-V)* Отсюда находим единственный положительный корень «(*-'>= — (jc^-^/xW)—1. Если повторно продифференцировать функцию под знаком минимума, то полученное выражение будет положи- тельным для любого Значит, найденный корень доставляет минимум. Таким образом, окончательно получаем <^2 (х(ЛГ-2))=2 -1 J. Аналогично находим: ">лг-з(х(ЛГ-3,)=т1п {«(лг-2)-{-2[(л(лг-2>/^лг))1/2— 1]}, ц(ЛГ—2)>0 а(Л^2)=(л(Л'-3)ул(Л))1/3_ lf Шлг_а(Х^-Э»)=3{(л;(^)/х(^)1/3_ Ц. В общем случае имеем 1 Я(Л’*) = (х(^-1)/х(Л'))*+1„ lf U)Ar_Jk_1 (х(ЛГ-Л-1)) = 1 = (jfe+1J. (4.26) В частности, при k=N—1 B(i)=(X(0)/x(/v>)W_1, ш0(л<«))=1]. (4.27) Здесь (оо(лс<0)) —оптимальное значение «обобщенного времени». “ Восстановим последовательность оптимальных управлений. Для этого в (4.25) при /=1 подставим и<]> из формулы (4.27). Имеем jtf1)=[(X<0))'v-1 Л^41/ЛГ. Используя найденное выражение, из (4.26) при k=N—2 получаем i 1 B(2) = (XU)/X(*)yV-l_ _ lt т. е. время пребывания реагента А во втором реакторе совпадает с временем пребывания в первом реакторе. 106
Аналогично приходим к равенствам В(«)==И(2) = ... = Й(Л') = (Х(О);.Х(<У))1^_ t Следовательно, оптимальным является распределение времени, одинаковое для всех реакторов каскада, а минимальное время пре- бывания реагента в каскаде равно 7V (х(°)/х<х>)1/АГ—Л!. 3. Задача регулирования скорости истечения жидкости. В верх- нюю часть резервуара, имеющего форму кругового цилиндра, по- дается жидкость, а из нижней ее части жидкость вытекает. Заданы начальный уровень жидкости h н требуемый расход жидкости Qt* в данные моменты времени /=1, 2, N. Регулируя скорость поступления жидкости, нужно добиться наименьшего отклонения расхода жидкости Qt от заданных значений Q(*, /=1, 2,.... N. Отклонение набора величин (Qj, Q2,.... Qn) от заданного набо- ра (Qi*. Q2*, •. Qn*) будем измерять как расстояние между точ- ками Af-мерного евклидова пространства. Тогда минимизация отк- лонения сведется к минимизации выражения 1/ ^(Qf—Qt)2» r f-i что равносильно минимизации функции /=2 (.Qr-ti)1- (4-28) Г-1 Обозначим теперь через qt скорость поступления жидкости в емкость, а через ht — уровень жидкости в момент времени t. Запи- шем соотношение материального баланса в момент времени /—1,2,..., N. (4.29) где 5 (м2)—площадь поперечного сечения емкости. Будем счи- тать, что скорость истечения жидкости пропорциональна ht*. Qt— /= 1,2,..., АГ. (4.30) Переменные qt играют роль управлений. Согласно равенствам (4.30), состояние могут описывать как переменные Qtt так и ht. Для определенности выберем в качестве переменных состояния Qi. Выразив из (4.30) величину ht через Qt и подставив найденное выражение в (4.29), получим квадратное уравнение относительно Qt. Найдем единственный положительный корень этого уравнения: /=1’2.....” (4-31) Теперь сформулируем задачу оптимального управления. Име- ется дискретна^! управляемая система (4.31) с начальным состоя- нием Qo^kyffi. Требуется найти последовательность управлений <7ь 7а.. <7л- и соответствующую последовательность состояний 107
Qi, Qz, ...» Qiv, доставляющие минимальное значение критерию оп- тимальности (4.28). Кроме естественных ограничений на выбор управлений ^>0, f=l, 2,..., N, в сформулированной задаче могут быть и дополни- тельные ограничения, например вида <7* <7*» где /= 1, 2,.... N и Л*, й*, ?♦, ?*, Q», Q* — заданные числа. Решить полученную задачу оптимального управления при кон- кретных значениях входящих в нее параметров можно с помощью процедуры, описанной в § 4.3. В заключение отметим, что если скорость истечения жидкости регулируется насосом, то равенство (4.30) можно заменить равен- ством Qt — Kht и вместо (4.31) управляемая система будет описы- ваться более простыми соотношениями вида / = 1,2„..,ЛГ. Глава 5 НЕЛИНЕЙНОЕ ПРОГРАММИРОВАНИЕ В этой главе рассматриваются численные методы решения за- дач минимизации нелинейной функции как при ограничениях, так и при их отсутствии. Задачи и соответствующие методы рассматриваются в данной главе по схеме «от простого — к сложному». Сначала излагаются наиболее распространенные методы минимизации функции одной переменной. Далее разобраны методы, пригодные для решения задач без ограничений с целевой функцией нескольких перемен- ных. Наиболее сложные задачи оптимизации с ограничениями и методы их решения рассмотрены в § 5.3. Универсального метода (алгоритма), с помощью которого мож- но было бы успешно решать разнообразные задачи оптимизации, не существует. Поэтому для решения каждого конкретного класса задач используют (и, как правило, не один) «свой» численный ме- тод. Следует помнить о том, что эффективность численного решения зависит от того, насколько полно и точно отражается в применя- емом методе специфика данной задачи, ее «индивидуальные» осо- бенности. Изложение в основном сводится к описанию и обсуждению ме- тодов. С доказательствами приводимых утверждений можно озна- комиться в [8, 17, 19, 21]. Заметим, что в этой главе рассмотрены наиболее простые чис- ленные методы, разработанные к настоящему времени. 108
§ 5.1. МИНИМИЗАЦИЯ ФУНКЦИИ ОДНОЙ ПЕРЕМЕННОЙ I. Классический метод минимизации функции одной переменной. Рассмотрим задачу нахождения минимума функции f одной пере- менной на отрезке [а/ Ь]. Классический метод подробно излагается в соответствующем разделе курса математического анализа. На- помним его содержание. Предполагается, что непрерывная функ- ция f имеет непрерывную производную на всем отрезке {а, 6], за исключением, быть может, конечного числа точек. Согласно клас- сическому методу, вычисляют производную f'(x) и определяют критические точки, т. е. такие внутренние точки отрезка [а, Ь], в ко- торых производная обращается в нуль или не существует. Далее, в окрестности каждой критической точки исследуют знак произ- водной и отбирают те из них, при переходе через которые производ- ная меняет знак с — иа -J- (это точки локального минимума). На- конец, в каждой из выделенных точек (включая концы отрезка [а, &]) вычисляют значения целевой функции. Сравнивая найден- ные значения, определяют минимальное. Точка, соответствующая этому минимальному значению, является точкой глобального ми- нимума функции / на отрезке (а, Ь]. Если функция f имеет непрерывную производную в каждой внутренней точке отрезка [а, д], то процедура упрощается: находят все точки, в которых производная равна нулю, и, вычислив значе- ния функции в найденных точках (включая концы отрезка), вы- деляют точку глобального минимума. Основным недостатком классического метода является узкая область его применимости. Так, если значения целевой функции определены из наблюдений или в результате проведения экспери- ментов, то получить аналитическое выражение для ее производ- ной трудно. Но даже если производная найдена, то отыскание кор- ней уравнения f'(x)=0 может составить сложную вычислительную задачу, для решения которой потребуется неоправданно много вре- мени и средств. Ниже изложены методы минимизации, применение которых не требует знания производных и в которых, кроме того, объем вы- числений значений целевой функции в определенном смысле явля- ется наименьшим. 2. Унимодальные функции. Выделим класс функций, облада- ющих с вычислительной точки зрения важным свойством. А имен- но: функция f называется унимодальной на отрезке (а, &], если она имеет на этом отрезке единственную точку глобального минимума •Тщ:п и слева от этой точки является строго убывающей, а справа — строго возрастающей. Другими словами, функция f унимодальна, если точка хт)ц существует и единственна, причем для любых двух точек Х|, д] таких, что из неравенства Х]Жт1п всегда следует /(Х])</(х2), а из неравенства Х2<лтщ необходимо выте- кает неравенство fUi) >/(х2)- 109
На рие, 5,1 приведен пример графика унимодальной функции. Рассмотрим две. произвольные точки Хэ^{щ 1] такие, чта a<JCi<ta<fr. Имеет место следующее важное свойств© уня- м одальной ф у и к ц и к если f jxi) Cf (я,), то ЖтисОвд еом ясн f CM Й®), то Ж«й>Д . В гамом .деле,,, пусть вн пил ищется неравенств® /(xn)^f (ха). Предположим противное: .кя1п>х2. Если xfflta>x$.1 по определению унимодальной функции колучнм что невозможно. Ес- Р®с, 5.1 ли же Хщщ—ла., то,, поскольку имеем две различ- ные точки глобального минимума x.L и х>. Это также проюоречиг он ре делению унимодальной функ- ции, В случае /(xjjjM (х^) дона- з ателъство аналогично. Рассмотренное: свойство уни- модальной функции иллюстриру- ет рис. .5.2. 3, Метод «золотого сечения», Будем искать точку глобального минимум а унимодальной функции; f на отрезке Н &] так, чтобы количество вычислений значений це- левой функции, необходимое для обесречення заданной точности, было по возможности меньшим. Рассмотрим на исходном отрезке точку и вычислим /(rj. Зная значение целевой функции в одной точке, невозможно сузить область потока точки Ять, Поэтому выберем вторую точку ха так, чтобы: a<X|<;jE^Cbj и: вычислим Kxaj Возможен один из следу- ют их двух С л уч аев: f Ot) С f (-Tz) или f (х t) > f (xs). С огл ясно, ено! - ству унимодальной функции, установленному в п. 2, в перлом слу- чае искомая1 точка хш.|Ь не может быть ня отрезке *т2, f«]L а во вто- ром — на отрезке [о, х5| fra рис,. 5.2 эти отрезки отмечены штрихов- кой). Следовательно.,, теперь область поиска сужается к следу- ющую точку ха следует брать в одном из укороченных отрезков (а„ Хз] или [ль Н ПО
Установим, где на исходном отрезке лучше всего выбирать точки х; и л2. Так if а к первоначально ничего не известно о поло- жен. и и точки хга1ш то оба указанных выше случая равновозможны, Т. е. «лишним» может оказаться любой из отрезков. Jx^ Л] и 1[с, Отсюда ясно, что точки jq и jq должны быть 'расположены симмет- рично относительно середины отрезка [а, Ж]. Далее, для того что- бы максимально сузить область поиска, эти точки должны: быть «поближе* к середине исходного отрезка. Однако слишком близ- кими их брать не следу л, поскольку мы .хотим построить алго- ритм, дли реал изыщи которого необходимо минимальнее количе- ство вычислен и* значений функции. Это имеет ^есто тогда, когда на. второ» этапе сужения области .поиска .потребуется вычислить лишь одно значение ИХа)* 'которое будем сравнивать с уже име- ющимся значением: или f(Xs) в ла висим ости от того, какой пл двух случаев реализовался. Поэтому если точки. Xi и ха взять рядо^ с серединой исходного отрезка, то на. втором этапе сужение обла- сти .поиска будет незначительным (рис. 6.3). Таким образом:, с од- f i 4 1.---------^4. Л .Z, ! JFj i к 1— у' * Рис. 5.3 Рис. 5 4 ной стороны, точки X] и ,х-2 следует выбирать рядом с серединой от- резка, а с другой — слишком близким я их брать нельзя... Для того чтобы найти «золотую- середину», рассмотрим для простиш вме- сто Ja, &J отрезок ГО, 1] единичной длины (рис, 5А), Для тоге чтобы точка В была «выгодной» как на данном, так и на следующем этапе, она должка делить отрезок AD в таком: зке от- ношении, как и АС: AB/AD=BC/AC, При этом и силу симметрии аналогичным, свойством, будет обладать и точка С, В терминах ко* Ординаты х за писанная пропорция принимает вид х _I — 2л 1 в I - ж ’ Уравнение имеет один корень, меньший 1, и равный 3—>/ 5)/2 ж 0,362, О точке, которая, расположена нс расстоянии 3—'И 5)/2 %' длины от одного из кон доч отрезка, говорят, что она осуществляет золотое сечодве данного отрезка. Очевидно, каждый отрезок имеет две такие точки, расположенные- симметрично относительно сере- дины. Итак, точки X; и xj должны осуществлять золотое сечение на- чального отрезка [я, &]. Отбрасывая ту часть [о, Ь|„ з которой хти Ш
заведомо1 быть не может, к укороченному отрезку (обозначим его через (#1, fe|p применнем аналогичные рассуждения с той лишь раз- ницей, что здесь уже имеется одна внутренняя точка, осуществля- ющая золотое сечение* .Поэтому к ней симметрично добавляем точ- ку хэ и сравниваем .значения целевой функции в указанных двух точках. 3 результате приходим я & к еще более короткому отрезку . ж. (который обозначаем через Д л} Л Хг [@ЯТ &J), содержащему х„|п* Диалогично строим пос ледова- Рие» тельность течем х(, xS] ,.., сходя- щуюся. к Хпим* При этом после- довательность отрезков (л, ЭД, |[Л], (ЭД]„ [aJt &г], стягивается в. точку xmui. Рис. 5.5 иллюстрирует построение четырех 'членов поеледенд- телыюсти, соответствующей неравенствам Ш,) f(x4< Приведем строгое описание алгоритма метода «золотого се- чениях Для удобства введем следующие обозначения: а₽в, fio=L Ш а г 0, Вычисляем координаты точен, осуществляющих эоло- тое сечение исходного отрезка: #0=^ (£0 — aj, г®= =<и + ^о—Кроме того» вычисляем значения ,r(v0) н /'(zoJi- ll] я с -fe (jfe^.,1). В результате предыдущего шага известны ве- личины .2Ь„Ь iiftHh Нв-Л. f (ZjwJ . Сравниваем, значения f (Ш-d й f (пх-i). Если J </ (zA_j )., то полагаеы orf^ oft=( , Zh=^-.i И, .используя эти числа, вычисляем координату симметричной totw (слева от имеющейся) —т* и эн а* чениё/Ха), Если ж® выполняется, противоположное неравенство >/(гЛ-1), то следует принять а^у*-ь A-j и вы- числить координату симметричной точки (справа от имеющейся) К—вместе со значением f Независима от того,, какой из этих двух случаев реализуетея.к иужн© вычислить длину следующего Р+1)-ГО отрезка, т. е. вели- чину а ни =#Л—yfe==ZA—д*. Шаги алгоритма осуществляют до тех пор,, пока не будет напол- нено неравенство Л*+,^, где еj>б•—заданная точность вычисле- ний. Затем выбирают и.эг.меььшее из чисел f(y*) и — прибли- женны! минимум. А точка.,, которая ему соответствует, дает йрм- ближеиме к xmir* При этом отклонение точки приближен мото мини- мум? от тачки Xjnun действительного минимума не превышает е. В результате будет известна максим алы: а я возможная величи- на отклонения «5 точки приближенного минимума отточки Xgjii> а об отклонении значения приближённого мьчммуж от f ко г;реж* нему ничего нс известно. Установим, что отрезки [<?*,. (ц]|, Л— 1, 2, ...... построен я ые с по- мощью метода золотого сечения, действительно' стягиваются а
точку Летт. На k-м шаге значение длины отрезка [а*, Ьл] составляет —ак— ~—z— (^к—1 — ак—i)> А = 1, 2,.... Поэтому Ьк — ----) <^о — «о) < °>7* Фо — ас) — 0- \ 2 / £->» Следовательно, отрезок [afc, Ь*], в котором находится точка xmm, при неограниченном увеличении k стягивается в точку, принадле- жающую одновременно всем отрезкам [а^, 6ft], k= 1, 2,.... Функция f унимодальная, поэтому такой точкой может быть лишь xm>n- Еще раз отметим, в методе золотого сечения на нулевом шаге вычисляют два значения целевой функции, а на каждом последу- ющем шаге— лишь одно. 4. Метод Фибоначчи. На практике количество вычислений зна- чений целевой функции часто бывает ограничено некоторым чис- лом п (тем самым ограничено и число шагов вычислений по мето- ду золотого сечения; оно не превышает п—1). Метод Фибоначчи отличается от метода золотого сечения лишь выбором первых двух симметричных точек и гарантирует более точное приближение к точке xmln за п—1 шаг, чем метод золотого сечения за то же коли- чество шагов. Согласно методу Фибоначчи, на нулевом шаге координаты первых двух симметричных точек вычисляют по формулам Afo = ~ Фо — ao)i ^п+2 гй=а0-\-Ь0—у$у через Ли* обозначено (п+2)-е число Фибоначчи, определя- емое рекуррентной формулой Fи+2—Fn-\~Fя+1, п—1, 2, 3,...; F1—F2—1. Запишем первые десять чисел Фибоначчи: F|=F2="1. F3=2, F,= =3, Еб=5, Л=8, F7==13, F8=21, Ffl=34, F10=55. Дальнейшие вычисления по методу Фибоначчи совпадают с со- ответствующими шагами метода золотого сечения. Отличие состо- ит в том, что нахождение величин Д* становится лишним, так как при k=n—1 процесс вычислений заканчивают и уп-\ принимают за приближенное значение Хт<п. Рассмотрим подробнее ситуацию, возникающую при k~п—1. Используя математическую индукцию и определение чисел Фибо- наччи, можно доказать, что &ь=Ьк — Ф() 1. (5.1) из
С помощью этих формул для симметричных точек уц и гЛ запишем следующие выражения: *л+2 Zk~ак4“А*+1 4----- *+1 — flo)* *л+2 Отсюда видно, что при k=n—I две симметричные точки сольются в одну (так как yn-{=zn-Y) и разделят отрезок [art-i, Ьп-}] на две равные части. Согласно формуле (5.1), длина этого отрезка равна Дя-1= (2/Л1+2)(до—Со). Следовательно, принимая уп-\ за прибли- женное значение Хпш» имеем следующую оценку отклонения этого значения от истинного: I Уп—1—-*mlQ I —— • (5.2) * л+2 Таким образом, погрешность вычислений по методу Фибоначчи при фиксированном п не превышает значения правой части неравен- ства (5.2). На практике заранее может быть задано не число п вычисле- ний значений целевой функции, а погрешность е>0. В этом случае, для того чтобы определить необходимое для обеспечения задан- ной точности число л, можно воспользоваться неравенством (5.2). В самом деле, если (d©—ao)/fft+2^e, то требуемая точность будет достигнута. Отсюда вытекают условия для определения л: с *0~а0 х- R г п+1 г д+2* Можно доказать [8], что nmF„/Fn+2=(3 —1/5)/2, поэтому при достаточно больших л вычисления согласно методу Фибоначчи и методу золотого сечения начинают практически из одной и той же пары симметричных точек. В обосновании методов золотого сечения и Фибоначчи важную роль играет свойство унимодальности минимизируемой функции. Это не означает, что рассмотренные методы неприменимы к функ- циям, которые не обладают этим свойством. Унимодальность, в частности, влечет совпадение локального и глобального миниму- мов. А оба рассмотренных метода носят «локальный характер». Поэтому если целевая функция не является унимодальной, то чис- ленная реализация обоих методов приведет, вообще говоря, лишь в окрестность точки локального минимума. При этом само значе- ние локального минимума может оказаться весьма далеким от зна- чения глобального минимума (рис. 5.6). 5. Метод равномерного перебора. В идейном отношении (и при реализации на ЭВМ) наиболее простым методом отыскания гло- бального минимума является метод равномерного перебора. Со- гласно этому методу, фиксируют величину шага Л>0, вычисляют 114
значения целевой функции в точках х(=а (или в. точке, «близкой» к а справа), x&=x(=j=ft. и пол ученные значения сравнивают, Запо- минают меньшее из этих двух значений. Далее вычисляют эначе- имё функции f при ж.з==хН*й' и сравнивают его г нем; значение^ которое хранится и памяти. Снова запоминают меньшее значение. Таким образом последовательно перебирают значении * в точках хА»Ха-|+^г. 5, до тех пор,( пока при некотором £=п очередная точка «не поки- нет» отрезок [а, 6]- Значение нуле- вой функции, которое останется в памяти тосле остановки (это rJn У IX-)), полагают при- ближе иным значением глоба ли- того минимума. * Пру практической реализации такого подхода основная пробле- ма заключается в установлении Рис. 5-6 величины шага Л. Простые примеры (рис. 5.6) убеждают, что да- же при сравнительно малом .ft существует возможность «проско- чить» глобальный минимум, В общем случае невозможно решить вопрос о том, насколько малым следует выбирать Л, чтобы значе- ние приближенного минимума отличалось от истинного не более чем. но е>0: min /(хД— mln /(х) ^£, (оЗ) | МД—Л JrS[®»l || Одна КО' существует достаточно широкий класс функций, для кото- рых можно1 решить эту проблему. Говорят, что ф^нкдая f $$овдетворяет условию Лгтшдца с кон- стантой L^sD, если | /(х)—/(х*) | <£ j х—х* | Для всех х, х'г-Jd, Н (5.4) Геометрически неравенство (5.4) означает, что тангенс угла накло- на любой секущей (прямой,, пр ©ходящей. через две: точки графика) и положительному направлению оси абсцисс не может превышать £ млн же может быть меньше, чем —£. Выполнен не не равенства (5.4) влечет непрерывность [на (ц, 5]. Значит, функция,, удовлетворяющая условию Лияшяиа, достигает на fa, 51 своего наименьшего (и наибольшего) значения (при этом может быть несколько локальных минимумов и максимумов). П^СТЬ ФУНКЦИЯ I Ц^в4^ГвОДЯ£Г с констпнтоь £ и Х|=а4-й/2, ft—2,X...trr—), лч==тт &L гО'е л ноЭблф^тся так, чтобэд было явдтолнянс условие й/2'С&— ^=Xn-} C’Mi/Z, Tbedo: йыбор ыаг« ло формуле Л=2к/£ аярангцр^т вьшолнаяше мфазедатап (5,3). □I Заметим., что система отрезков кг) A/2j. [х3—й,/2, Xa+Zi/S), „.j, [Ху,—Л/2, хд--Нс/:У покрывает ведь исходный отрезок .115
[a, b]. Поэтому точка глобального минимума xroin принадлежит од- ному из них, т. е. хт—Л/2^Лп»1П^Хт4-Л/2 при некотором № ^{1, 2, ..., п}. Используя неравенство (5.4) для точек хт и Лтш, имеем | I | хт xmln I “5 £ £ Отсюда, так как /Qcm)> min / (х(), вытекает требуемое нера- i -1,2.......................л венство (5.3). На практике константа £, как правило, не известна. Поэтому вычисляют угловые коэффициенты нескольких секущих графика целевой функции и в качестве L берут значение; наибольшее по аб- солютной величине. Следует отметить, что если взять слишком большое значение L, то это приведет к слишком малой величине шага h, а «заниженное* значение может привести к нарушению не- равенства (5.3). § 5.2. ЧИСЛЕННЫЕ МЕТОДЫ е ЗАДАЧАХ БЕЗ ОГРАНИЧЕНИИ 1. Общая схема методов спуска. Будем рассматривать задачу безусловной минимизации, т. е. задачу минимизации целевой функ- ции f на всем пространстве R". Сущность всех методов приближен- ного решения этой задачи, излагаемых в данном параграфе, состо- ит в построении последовательности точек jd0>, х(1>, х(2), ..., xi*\ ...» монотонно уменьшающих значение целевой функции: / (л<°»)> / (х(1>)>/ (л(2)) > ...>/ (xW) >... . (5.5) Такие методы (алгоритмы) называют методами спуска. При ис- пользовании этих методов применяют следующую схему. Пусть на А-й итерации имеется точка х(*>. Тогда выбирают направление спус- ка p<*>eRn и длину шага вдоль этого направления а*>0. Следу- ющую точку последовательности вычисляют по формуле Л=о, 1, 2.... Согласно этой формуле, величина продвижения из точки х(*> в х<*+‘> зависит как от ал, так и от pi*). Однако а* традиционно на- зывают длиной шага. Формально различные методы спуска отличаются друг от дру- га способом выбора числа ад и вектора р<*>. Если для определения ал и pi*> требуется вычислять только значения целевой функции, соответствующие методы называют методами нулевого порядка или методами поиска. Методы первого порядка требуют, кроме то- го, вычисления первых производных целевой функции. Если же метод предполагает использование и вторых производных, то его называют методом второго порядка и т. д. С помощью методов нулевого порядка можно решать задачи U6
более широкого класса, чем с помощью методов первого или вто* рог© порядка. Однако методы нулевого порядка,, как правило, тре- буют больших вычислений для достижения заданной точности, поскольку использование только значений целевой функции не по- зволяет достаточно точно определить направление на точку мини- мума. Важнейшей характеристикой любых методов спуска, является их о'о^цдасть. Сходимость здесь понимается & том смысле, что по- следовательность {х*11’-’) должна сходиться к точке глобального (ло- кального) минимума. Однако точки минимума могут составлять целое множество и многие алгоритмы позволяют построить после- довательность (х«}( которая сама не является сходящейся, но лю- бая ее сходящаяся подпоследовательность имеет в качестве пре- дельной некоторую точку минимума (рис, 5.7). В этом случае го- ворят, что каждая предельная точка последователыюсти явля- ется точкой минимума. С помощью подобных алгоритмов можно строить последовательности точек, сколь угодно близко приближа- ющихся ко множеству точек минимума. Возможен случай, когда ничего определенного сказать и о схо- димости последовательностей нельзя, однако известно, что соответ- ствующая последовательность значений функции сходится к -минимальному значению (локальному или глобальному миниму- му). Тогда говорит, что последовательность {#<*>) сходится к ми- нимуму до фдмкцдш (рис. 5.8). Кроме того, существуют еще более слабые типы, сходимости, когда, например,. последовательность (каждая ее подпоследовательность) имеет в качестве пре- дельной стационарную точку (т. е. точку, в которой градиент равен нулевому вектору), являющуюся лишь «подозрительной» на опти- -ыальную. Как правило, тип сходимости одного и того же метода зависит от конкретного вида целевой функции, т» е. в разных задачах ме- тод может сходиться по-разному. При достаточно жестких тре- бованиях к функции f с помощью метода можно строить, последова- тельность, сходящуюся в точке гл обильного минимума. Если же этот метод применить к функциям,, не удовлетворяющим этим тре- ну
бованиям, то может быть получена последовательность, сходящая- ся только по функции, либо последовательность, не являющаяся сходящейся ни в каком смысле. Методы спуска в силу условия монотонности (5.5) обычно не приводят к точке локального (глобального) максимума. Отметим, что даже в тех случаях, когда нет сходимости ни в одном смысле, последовательное уменьшение значения целевой функции может представлять практический интерес. 2. Метод покоординатного спуска. Согласно этому методу, на- правление спуска выбирают параллельным координатным осям. Сначала производят спуск вдоль первой оси Oxh затем — вдоль второй— Ох2 и т. д. до последней оси Охп. Обозначим f-й орт пространства Rn через т. е. вектор, у кото- рого все координаты нулевые, кроме t-й, равной единице. Пусть х<°>— начальная точка и сю — некоторое положительное число. Точ- ку х(1) определяют следующим образом. Вычисляют значение функ- ции f (х) при х=х<°>4-аов(1> и проверяют выполнение неравенства f (л<°) + аоеП >) < f (5.6> Если это неравенство справедливо, то вдоль направления оси 0xL значение функции f уменьшилось и поэтому полагают jc<1)=xCQ)-|-(ioe<1), «, = &(). Если (5.6) не имеет места, то делают шаг в противоположном на- правлении, т. е. проверяют неравенство /(^-М^Х/^). (5.7) В случае выполнения этого неравенства полагают «1 = 00- Возможно, что оба неравенства (5.6) и (5.7) окажутся невыпол- ненными. Тогда следует считать x(0=x<0), ai=ao- Второй шаг производят вдоль координатной оси Ох2: если f (x(l>+aie<2>) (х(|)), то полагают х<2>=х<*)-|-а1е<2), «2= си, если же последнее неравенство не имеет места, то проверяют неравенство f (х<*>—ai^2)) <f (х0>) и в случае его выполнения считают х<2)=х<1)— —<xje<2>, Ой=а1( Если ни одно из двух неравенств не выполняется, то полагают х(2>=х(1), аз—Так перебирают все п направлений коор- динатных осей. На этом первая итерация закончена; на п-м шаге бу- дет получена некоторая точка х<">. Если при этом x(Tl)=/=x(°\ то, анало- гично, начиная с х(п> осуществляют вторую итерацию. Если же х<п)= =xi°) (это имеет место в том случае, когда на каждом шаге ни одно из пары проверяемых неравенств не окажется выполненным), то вели- чину шага следует уменьшить, взяв, например, an+i=ian/2, и в сле- дующей итерации использовать новое значение величины шага. Последующие итерации производят аналогично. На практике вычисления продолжают до тех пор, пока не выполнится некоторое 118
условие окончаний стета. Чаете используют следующие условия: | д4*+1} _ лгСС» || а ИЛИ (5.8) где £ я ₽, = некоторые лоложнтелгные чйглг, характеризующие точность решения исходной задачи кшшмвдашш. На рис.. 5S изображены несколько линий уровня некоторой «функции двух переменных и проиллюстрирован описанный метод. Сходимость метода покоординатного спуска устанавливает сле- дующее утверждение. Itycm f ойреЭедеи^ еылдозд меюрврышю шдощщ на R\ гарычем ючадокоя точка дЯ выбрана так, что л*ю- г^есгвэ (хе Ял |f(X) Сц^)} оаранячета ГогЭ«Е кажво Пре- -дёл&ная точка лосдедоватвдь- ноезъу досгроёЖоА но jw/rod'jy локоор^пяатноео етуета» стоя точкой гдобддвлоео лшш- JK^MU. Заметим, что сходимость .гарантируется, если началь- ная точка вы®рана надле- жащим образом. Рассматриваемый метод от* носится к классу методов ну- Рие ,§9 лево го порядка и для его реа- г'" лизании не требуется вычислять производные. Однако в условиях сформулированного утверждения имеется требование непрерывной дифференцируемости А Примеры показывают [8J, что если метод покоординатного спуска применять к функциям, не удовлегворяю- щнм этому требованию,, то точка минимума может быть не полу- чем я. Иногда,, стремясь ускорите сходимость метод а, величииу «ы под- <бнрают так, чтобы при переходе от к вдоль направления спуска обеспечивалось наибольшее возможное убывание целевой функции. Другими, словами, а* находят из условия минимум .а функ- ции одной переменной «: / (л<* >+сягf = та’п У (х* -1 rt^ где номер te(l, 2, .... п} определяется номером; шага й. Такой вы- бор а*, вообще говоря, приводит к тому, что для достижения за- данной точности потребуется меньшее число шагов. Однако выпол- нение каждого .шага будет сопряжено с решением зздзчн м анлми- зацн'м функции одно?’ переменной., что приведет к до полк игольным счислениям. Кроме того, нахождение точного значения в этой задаче нё всегда возможно; если же га место точного значения; нс- пользовать приближенное, то> может нарушаться условие убывания 1 as
3. Градиентные методы. Как отмечалось в гл. 2, ненулевой анти- градиент— V/(л(0*) указывает направление, небольшое перемеще- ние вдоль которого нз х(0) приводит к значению функции f меньше- му, чем f(x(0)). Это замечательное свойство антиградиента лежит в основе градиентных методов, согласно которым на k-н итерации по- лагают р<*’=—V/(*<*>)> т. е. х(*+1)_%(*)—a (%<*)), aft>0, А=0, 1, 2(... . Эти методы отличаются друг от друга способом выбора величины шага ад. Достаточно малый шаг щ обеспечивает убывание целевой функции f (ХС*+1>) = f (х<*> - а* V/ (х<*>)) < / (х<*>), (5.9) но может привести к слишком большому количеству итераций для достижения требуемой точности. С другой стороны, выбор большого шага может привести к нарушению неравенства (5.9). На практике нередко в качестве величины шага выбирают не- которое а>0, одинаковое для всех итераций. При этом если усло- вие (5.9) (при Па—ю) нарушится, то для текущей итерации величи- ну а уменьшают до тех пор, пока указанное неравенство не станет выполненным. Часто величину ад рекомендуют выбрать так, чтобы имело мес- то более жесткое условие убывания, чем (5.9): /(xW)-/(x<*> —aftv/(x<A>))>£aft || v/(*{*}) || , (5-10) где 0<е<1 —некоторая фиксированная константа. Здесь также сначала фиксируют некоторое ah=<j>0 (например, а*=1), оди- наковое для всех итераций, а затем при необходимости уменьшают его до тех пор, пока не будет выполнено неравенство (5.10). В методе наискорейшего спуска величину ад>0 определяют в результате минимизации функции (их) =f(x<b>—aVf(x'M)) одной переменной а: У* (a»)=ntfn <?л (а). (5.11> а>0 Функция ф«(а) в точке ад>0 достигает минимума, поэтому ее про- изводная в этой точке равна нулю: d a d s ( UM - df — —J l ““ u da \ dxi = - У ------(v/ v/ (JC<*>)) =0. Ox, Ox, Последнее равенство означает, что направление спуска на (А-(-1)-й итерации ортогонально направлению спуска на предыдущей А-й ите- рации. Таким образом, кривая движения по методу наискорейшего спуска представляет собой ломаную, соседние звенья которой вза- 120
ьмно ортогональны, причем звено, соединяющее Х'-ь1 и хСЙ+1}, лежит в гиперплоскости, касательной к поверхности уровня /£*)“ = f (jK*+!>) (р нс. 5.10). При реализации градиентных методов в качестве критериев 'Окончании счета кроме (5.8) использу- ют также условие вида в где у >0^ фиксированная точность вычислений. ( \ Точный смысл сходимости гради- \ ептных методов раскрывает следующее к / утверждение." \. 1 > /7#т фикция / огрдшчена итдфынно бнфффга^црре- лш на Rn а ее сроЭисдт Vf(x) , , . т. 1/^дл£тга.гыег 5‘£Л0йзию Лыл.шс*р.г III V / U)—V / РП 111 < L М—** If для л?*х ** е ЦЛ, cote £^0—некоторая фиксированная константа. Кролю тоео, пусто нмбор н&дошик йДга ш дродэвсгёдтся й»з осноне уыоыш (510) клл (5.11). /шва, какова б&* чш была начальная точках^. оба драоденгмык .метода приводят к носгрдошю последовательности (vW),, облйдиюц^й свойством Г!га || v / 1||| ^0- ift-*-» £сли, кроме того *5, фя/нкфш f д&ажды ftewpepw&tiv фыфферемцл- р^ема а CfKjecrfl^or такие «исла М^т^О, «го м II £ III3 < F> < Af ii j/ II1 'бдя всех X, JF# (5.12) то Шя обоих ^лазачяйгх йрлбн^к^яглх лято^оа йосдебоодтедьяостй. {х<й>} б^Зет схоб'нт&ся к тош.е адсбальяоео мжпмулза. Первая часть утверждения гарантирует сходимость лишь в смысле Hm || v/ Й*) [ =А т. е» сходимость по функции либо к точ- ной и и жней грани Inf /(х), либо к значению функции f в нт кото- su» рой стационарной течке х*. При этом сама точка. лв не обязательна является точкой локального минимума; ома может быть точкой седлового, типа... Однако .на практике подобная ситуяин^ мал о веро- ятна и применение градиентных методов, чан правило, поэполяет получить приближенное значение, минимума целевой функции (во- обще говоря, локального).. Сравнивая рис. 51.0 и 511, можно сделать вывод, что для целе- вой функции, линии уровня которой близки к окружностям, требу- емая точность будет достигнута довольно быстро, тогда как. если *J В эт®Й чэс1ги утверждения требование 'Огрднкченностн синзу функция f на саШж деле является лжшинн,, так как егян фуькцня f удовлетворяет (5,ОК то она эаведоко ограничена снизу [2Г|. 151
лйним уровня сильно вытянуты в окрестности. оптимальной точки,, то градиентные методы приведут к медленному зигзагообразному Продвижению е направлении на. оптимальную' точку. О функции* по |ерхности уровня которой сильна вытянуты, говорят, что она име- ет «овражный» характер' (в случае, двух переменных график, танин функции действительно и а пом ина е г овраг), О степени ^оьр аж ро- ста» функции f можио получить представление, зная минимальное (т) и максимальное ГШ собственные числа матрицы - " Гессе Vs/, вычисленной в оп- тимальной течке: чем ь.ень- ше ©^нои^миё tfi/M, гем ~ больше «овражность» дан- / /. J ной функции. Применение градиентных, методов к та- к нм функциям, приводит к спуску на «д_-о пер а гад, пое^ „ .... .ле чего, поскольку на пр^вле- уте' ' ине спуска почти перлонди- кулярно «лиинн дна»* точки последовательности (х^4 'будут поочередно находиться то на одном «склоне оврага», то на другом я продвижение к оптималь- ной точке сильно замедляется. Иногда при минимизации функции «овражного» типа, удастся использовать следующую процедуру. Выбирают дне близкие на- чальные точки и Из этих точек совершают градиентный спуск, на. «дно оврага», в. результате получают соответственно точ- ки и лЯ* Далее полагают >ч-*т_Д1 и Е,в"{f<***’» где сравнительно большой (овражный') шаг. Затем kj i2 вновь совершают градиентный спуск (он может состоять из не- скольких итераций.) на «дно оврага- и получают точку А. Следу- ющую точку Ж находят по формуле,, аналогичной приведенной выше: *(2} *(>> ;о>=х(ЗД-А, -„ * -П-Slgnf/(х»1’» и т. д, (рис, 5.12). Эффективность описанного метода зависит от зелични овражных шагов Ль - * Если овражный шаг слишком велик* то можно довольно' далеко отойти от линии «дна оврага»; если же этот шаг мал, то продзижение будет незначительным. Точ- ных методов выбора овражного шэгэ не существует; его величину подбирают зм лирически, учитывая известные свойства мин им из и- руемпй функции,. 4. Метод Ньлтона. Это метод второго порядка,. Одно из преиму- ществ; этого метода по. сравнению с градиентными методами со- 122
(5* 13) Рис. 5.0 стоят в ток, что он. «не реагирует» на овражный характер миними- зируемой функции. Метод Ньютона заключается а применении фор- мулы Д=< 1...., где (V®f(xW)]"1—-матрица, обратная. матрице Гессе (матрице вто- рых Пр©ЛЭВОДНЫ х), ВЫЧИСЛЕН- НОЙ в точке j^4 Предполагает- ся, что Vsf(^*>) — нсзырож- денная матрица, поэтому об- ратная ей матрица существует. Для того чтобы, установить геометрический смысл форму- лы (5.13)? будем считать, что Va'f (л^>) = положительно- определенная матрица, и рас- смотрим квадратичную аппроксимацию функции f в окрестности точки хс*>: /, С*>=/ (*“>)+(V/ U«l). X -**>) +4- < W <*“>) (х -х<*>), -X Вычисляя градиент этой функции и я^яравнидо его нулю, воду» чаем v/i (*)—V/ <л{й|) 4= v9/ (д^) (X = л<*>)=Од. Стсюгд, умножая равенство на матрицу [Vaf(^|j“l слева, нахо- дим стационарную точку функции fa (х): Рис. 5J3 л “It3/ v'/ pc<*fy. (б, 14) Матрица положительно. определена, поэтому точка х вида {5.14) является точкой глобального минимума квадратичной функции fa far) (см, и. 2 § 2.5). Правые чгхгм равенств (5ЛЗ) и (5.14) идентичны. Слецо- б /*7-4г>'%7 в ател ию, на каждой итера- ции метода Ньютона очеред- ную точку выбирают такой, чтобы она доставля- ла глобальный минимум кга др ати ч нои а п п ро кс и м з- ции. (риСь 5.13). Градиентам» методы,, по су- ществу, используют линей- ную аппроксимацию целе- вой функции и поэтому ме- нее точно определяет направление на точку минимума« Таким об- разом, метод Ньютона позволяет достигнуть .заданной точности за меныьее число и терапий, чем градиентные методы. Однако каждая 123
итерация метида Ньютона связана с вычислением матрицы V=jiW)j и последующим ее обращением, что требует большего объема вычислений по сравнению' с одной итерацией грз диен п:о- го метода. Направление' движения из точки jfW по методу Ньютона опре- деляется вектором V/ Сн- если матрица положительно определена, то и обратная матрица также положительно определена, * Поэтому а это,, согласно лемме 2Д, означает, что небольшое: перемещение вдоль направления М*+|3—xW должно привести к уменьшению зна- чения нелепой функции. Однако в методе .Ньютона величина пе- ремещения не регулируется; она однозначно определяется тонка ... ми Л1*5' И Л^+Л (и ря.ВНЯ 1И*+Н— .^1 Поэтому если: начашдо точка я®' выбрана сравнительно «далеко» от точки минимума, то ме- тод Ньютона может приводить к «большим» тег смещен ины, что по- __________________*__ - влетет нарушение: условия убывания J j Л‘" Это положение ил- люстрирует пример функции одной Рнс. 5.14 переменной, изображенной на рис.. 6.14- Здесь вторая производная име- ет в точке л10) положительное значение» но оно слишком мало, так мак в окрестности х(Ьз функция f близка к линейной. В результате значение величины, Обратной второй производной, довольно боль- шое и точка jcW оказывается дальше от хрй1, чем Л По тем же причинам и лс(®»--Хтш^М01—'Лаш к т.. д. 'Таки и образом» в данном сл у лае использование метода Ньютона приводит к построению по- следонательносга, удаляющейся, от точки минимума. ‘ Имеет место следующее утверждение.. Пцсть функция f .i?a£Hh"3'4'{ непрерывно б'афференцар^ехЩ -на iRM, х*— гтодипвдрпш точка f д латрнца Гесде неныяжбем- «ад. Foada с^ёстарет окрдетнот точки х* гакад что оля .любого начаочоео приближеямя хст из этой окрестности, гащдегЫатоль- ность '{х^}» листроенноя гоалпсно (5.13Н стойнтоя к л*. Таким обратом» если начальное приближение л^®> выбрано до- статочно близким к точке минимума» то поел едой атедьность^ по- строенная 5Ю.методу Ньютона» будет сходиться к этой точке. Однако., не зная, положения точки минимума, такой выбор практически • Таг кич матрица предполагается неварожавмя&н, то л»бьЯ еектцр УУМЭи можно представать б виде A!=Af. x^IR-*. П&ложжельиая 01ф^дь№Н- нжп» натриды Ч опиачаег» что <.4х. ле»-® для Beet х^Ои... СН^ди при х== —А-|0 получаен <ЛД=1у4 .rfMsr>=(y, Д="1^)г^<4=1 у, ^>>0 для либого что означает по.яожн.тельи¥к отпейеленгость обратней матрицы Д-*. 124
осуществить невозможно. Поэтому были разработаны модифика- ции метода Ньютона, которые обеспечивают сходимость независи- мо от начального приближения. Это методы Ньютона с регулиров- кой шага: Величину а* здесь выбирают следующим образом. Сначала (как в методе Ньютона) полагают a= 1 и проверяют условие убывания /(х<‘>4-а/Я*>)-/(*(*))<ea (?/(х<*>), >»), (5.16) где р<Л>=—[V2/(л^*^)Х7/(хСЛ)) —направление спуска, а 0<5е<’/2— некоторое число. Если неравенство (5.16) выполнено, то полагают a*=-a= 1 и производят следующую итерацию. В противном случае берут меньшее значение а (например, и снова проверяют выполнение неравенства (5.16). Таким образом, шаг делится до тех пор, пока не будет выполнено неравенство (5.16). Как только это произойдет, текущее значение а принимают за величину ша- га aft. Другой способ выбора ад такой же, как и в методе наискорей- шего спуска,— из условия минимизации функции в направлении движения, т. е. из условия =min[/ (х™— olys/ у/ «>0 Пусть функция f дважды непрерывно дифференцируема и суще- ствуют числа и т>0 такие, что выполняется условие (5.12). Тогда последовательность (5.15), где а« выбирают одним из двух указанных выше способов, сходится к точке глобального минимума независимо от выбора начального приближения. 5. Метод сопряженных направлений. Рассмотрим сначала метод сопряженных направлений первого порядка для квадратичной це- левой функции, а затем обобщим его на случай функции более об- щего вида. Пусть целевая функция f является квадратичной, т. е. /(x)=-b- (Q.r, х) + (с, х), (5.17> * причем Q — симметричная неотрицательно-определенная матрица размера пХп и ceRn. Говорят, что линейно независимая система п векторов |р(А,|лй> является системой сопряженных направлений (относительно мат- рицы Q), если <<2р^, р<>>>=0 для всех i, j=0, 1, .... п—1, В частном случае, когда Q — единичная матрица, система со- пряженных направлений превращается в систему попарно ортого- нальных векторов. В этом смысле первую систему можно рассмат- ривать как определенное обобщение второй системы. 125
Зафиксируем некоторую систему сопряженных направлений {р1А)’л-о (о ее построении сказано ниже). Вычисления согласно ме- тоду сопряженных направлений проводятся по обычной схеме 1,..., (5.18) где величину шага си выбирают из условия минимума функции <р*(а)=/(jc<*)4-«pW). Найдем конкретное выражение для ад. В ре- зультате несложных преобразований получаем ~р-=а (QpW, /»») + (Qx<»>, /И»>>4-(с, >»>>. (5.19) da Приравняем эту производную нулю и найдем искомое значение <х=сц. Имеем «»- ~ *=0-1......................п~1 • (5 20) Здесь предполагается, что знаменатель дроби отличен от нуля. Ес- ли же <Qp<*>, рю>=0 для некоторого k и, кроме того, (*<*>), p(A))^fcO, то из (5.19) следует, что производная dtp^/da отлична от нуля в каждой точке a^R. Это означает, что целевая функция не может достигать минимума на луче {jceRn|x=x<ft)-Hip<ft), aeR}. А значит, она не достигает минимума и на Rn, т. е. исходная зада- ча решения не имеет. Как следует из формулируемого ниже утверждения, метод со- пряженных направлений при минимизации квадратичной функции является конечным. Этим он выгодно отличается от уже рассмот- ренных методов. Пусть (р(Л,}д7о — некоторая система сопряженных направлений (относительно Q). Тогда с помощью формул (5.18), (5.20) метода сопряженных направлений для произвольно выбранного началь- ного приближения точка минимума х* квадратичной функции (5.17) (если она существует) вычисляется не более чем за п шагов, т. е. Доказательство. Поскольку {р<*>}—линейно независимая система из п векторов, она является базисом в Rn, а значит, век- тор х*—х<°> можно представить в виде линейной комбинации век- торов этой системы. Таким образом, найдутся такие числа aj, Oi,».., (Хп—}, что л—1 Л*=х(0)+ 2 (5.21) fto Умножая это равенство на матрицу Q, а затем скалярно на вектор рю, получаем равенство (Qx‘, p«>) = (Qx<»), р«>>+2 al (<?/><»>, ₽•'>>. *-£) 126
Отсюда, используя сопряженность системы направлений а также равенство Qx*=—с (см. п. 2 § 2.5), имеем а* Р(О)= —(Р40. Q*t0,+c)> следовательно, * (у/(х<<>?), Р(0) о 1 п—1 <5 22> a/— (Qp(O, Р(О) » О. 1,..мл 1. (5.22) Теперь рассмотрим соотношения (5.18). Имеем jrf«>=л"-1 -|- aд_1p(,|-1)=л<л-2, + ая_2р<я“2) а„_1р<л“1) =.., • л—1 ,„^0)+2 a*pW. А-0 Сравнивая это равенство с (5.21), видим, что для завершения до- казательства остается убедиться в том, что ал=а**, А=0,1 п—1. Последние равенства вытекают из формул (5.20), (5.22) и равенств <у/(*<*>). p<*>) = (Qx(*>+c, = pW> = {Q^*-n-|-c, p<*))=...= (Qjc(°) + c, /?<»)) = = (v/(jc<0’), p(*>), A=0, 1..л-1. Укажем способ построения системы сопряженных направлений. Для этого используется итерационный процесс вида p(°>=-V/(x<0)), (5.23> + А=1. 2....л-1, где Р-i- I*?,' к= ’’ 2.. - «-1. (5.24> Сопряженные направления (доказательство сопряженности систе- мы направлений (5.23) см., например, в [17]) вычисляют последо- вательно одно за другим по мере того, как в .этом возникает необ- ходимость при вычислениях по формуле (5.18). Если целевая функция нелинейная и не является квадратичной, метод сопряженных направлений уже не является конечным, хотя можно использовать те же формулы (5.18), (5.23) и (5.24), причем at также определять из условия минимума *Ра («*)=/ (•*<*> 4- aAp<*>)=min <?» (а). а>0 Числа рл-1 можно выбирать в виде А — <У /V/— у /и(*~п)) 1 п t ...п L 127
После нахождения точки х(п), если условие окончания счета IIVf(х(Л>)||<е еще не выполнено, процесс можно повторить, взяв точку х<п> в качестве начальной. Если и следующие п шагов не приведут к требуемой точности, вычисления продолжают. Следующее утверждение определяет характер сходимости мето- да сопряженных направлений в случае неквадратичных функций, градиент которых удовлетворяет условию Липшица. Пусть функция f ограничена снизу и такова, что для некоторой константы L>0 неравенство 1|Vf(x')—V/ (х") || £Цх—х'Ц) выпол- няется при всех х', x"&Rn. Тогда для последовательности точек {х<*)}, построенной указанным выше способом, справедливо равен- ство Пт || II =0- 6. Замечания. На практике часто комбинируют описанные мето- ды. Сначала обычно используют метод покоординатного спуска, поскольку он не требует для определения направления спуска сложных вычислений. Далее переходят к градиентным методам, так как направление антиградиента точнее указывает на точку ми- нимума, чем направление координатных осей. Наконец, «попав в окрестность точки минимума», для получения более высокой точ- ности используют метод Ньютона или его модификации. $ БД. ЧИСЛЕННЫЕ МЕТОДЫ В ЗАДАЧАХ С ОГРАНИЧЕНИЯМИ 1. Метод покоординатного спуска. Изложенный в п. 2 § 5.2 метод покоординатного спуска можно распространить на задачи с огра- ничениями, если эти ограничения достаточно просты: RB | /=1, 2,..., я], (5.25) где ait bt — заданные числа, £=1, 2, ..., п. Опишем этот метод. Пусть известны точка (А-е прибли- жение) и величина шага а*>0 при некотором Направление спуска выбирается по формулам п [”"]+1* где [ ] — символ целой части числа. Этот выбор аналогичен выбору направления спуска в п. 2 § 5.2 и состоит в циклическом переборе единичных ортов е(1\ еФ,.... е(п) пространства Rn. Вычисляют новую точку х<*Н-алр<*> к проверяют условия допустимости и убывания: х(»)+айрЮ е X, f (х<*>+аАр<*>) < f . Если оба условия выполнены, то очередное приближение опреде- ляют по формуле xtft+|)===x<A)+aft/H»>, аА+1=аА; в противном случае пытаются сделать шаг в противоположном на- правлении, т. е. проверяют условия х<*>—f (х<*)—а*р‘Л)) < 128
,'</. 3 случае выполнения это двух, условий полагают а*р£*> ль+. = £ih- Если же хотя бы одно ио указанных усло- вий не имеет места, то очередное приближение определяют по „ формулам Л<1+:^ xW, Ап* при £й.^й, х<*>жх*^й*1, ад при jz п или в^*^зг<*-'®+1\ ИДИ С<Л<д — 1, где X—заданный параметр метода, 0<A<J (например ?-== :,/а)'- Анализ последних 'формул показывает,, что очередное приближен не в задаче с •ограничениямк строится аналогично задачам без ог- раничений. £сли фуедедш? / ямярнлга «надгсегде X (5J5)' д непре- рыеяо дифференцируема, то при любом еыбере начальной точки x^'teX к мдоддеяодо значения а^^Х) кйзедая предельная. точка по- оедоастельностц построенной отшеаяным яёгодеш, является точ- кой глобального условного мнншлрма. 2- Мётвд уело я кого градиента, Этот метод находит применение при решении задач митшизашш нелинейной функции на таком выпуклом компактном множестве А, на котором' можно без особо- го труда решить задачу минимизации линейной функции. Пусть вобрано начальное' приближение x^feX Через М*>еХ как и раньше, обозная нм А-е приближение, £>Э. Запишем линей- ную аппроксимацию функции / в точке х(*>: /lUJ^/OT+iV/OT. х-лй>). Множество X предполагается компактным, поэтому линейная фунт,- имя /1Е..(х) ад этом множестве .достигает своего наименьшего значе- ния... Обозначим черта такую произвольную точку минимума. Точку обычно находят в резуль- тате решения более простой, эк я и вз- лет ной задачи (V/ Uwh Je} -»min,, .«sx Точку W используют для опре- делении направления спуска:pW= “—Л Следующее приближе- ние да ходят по формуле л(**3)= = хй41“|Нщ^'Ч тде 0<а^С1- В силу нъгпуклости множества X всегда вы- полняется условие допусти ?Д'Оетн х<*+’»еХ. На рис, В. 15 проиллюстрирон.а.1Н метод условного градиента. Отметим,, что если X задано конечной системой линейных не- равенств н равенств, то веномогательная задача нахождения; точ- ки x(>J является задачей линейного программирования и для ее ре- шения может быть использован с им пл ено метод. Часто точное решение во вспомогательной задаче найти не уда- 5—339 129 Тче. 5 15
ется и приходится использовать приближенное решение. В этом слу- чае точка x(k) определяется с точностью до еа: < V/ (*<ю). JC<A)> < min ( v/ х) еА > О, л£Х причем lim6ft=0. Последнее равенство представляет собой требо- ванне с увеличением номера итерации k все более точно решать вспомогательную задачу. При разных способах выбора длины шага а* получаются раз- личные варианты метода условного градиента. Рассмотрим неко- торые из них. 1) Величину аЛ выбирают из условия минимизации целевой функции на отрезке, соединяющем точки и х(*\ т. е. из условия /*(«»)= min/, (а), 0<а<1 где /А(а)=/(х(*Н-!а- х(А>)). Для решения этой задачи могут быть использованы методы минимизации функции одной перемен- ной, изложенные в § 5.1. Как правило, точное решение здесь найти невозможно; следовательно, можно ограничиться приближенным значением величины а*, удовлетворяющим следующим условиям: /*(“*)< min/,(a)+8„ 0<в<1 «» Л-0 Здесь условие 2&А<^-|-оо означает, что би должны стремиться к А-0 нулю при й-*-оо «достаточно быстром' Например, при А-*-оо, но для дй=(А+1)-1 получаем гармонический ряд, который, •» как известно, расходится: 2 +°°- Л-0 2) Величину можно выбирать и вне всякой связи с целевой функцией. Требуется лишь, чтобы было выполнено условие limaA = 0, Vafc— лГо Этим требованиям удовлетворяет, например, следующий выбор: aft= (Л+1)-1, А=0, 1...Достоинством данного способа выбора а* является простота его реализации, однако метод условного гради- ента с таким выбором ад не обязательно является методом спуска. Нетрудно привести пример, где требование монотонного убывания f (xtfc+’J) <f для некоторых k нарушается. Пусть XczRn — выпуклое компактное множество, функция [ выпукла, непрерывно дифференцируема и ее градиент удовлетво- ряет условию Липшица, т. е. 130
где — некоторая константа. Тогда, какова бы ни была началь- ная точка х<0>еХ, описанные выше варианты метода условного гра- диента приводят к построению последовательности {х(к)}, каждая предельная точка которой является точкой глобального минимума функции f на множестве X. 3. Метод барьерных функций. Этот метод предназначен для ре- шения задач нелинейного программирования с ограничениями в форме неравенств: /<х) —min; X=(xeR’|gj(x)<0, / = 1, 2,..., да). (5.26) х^Х Введем множества точек: ^-IxeR^^xXO, /«1, 2,..., да], Х2= |хе R«|g7(x)=0 для некоторого /}. Очевидно, XiUX2=X и Xif|Xa=0. Будем предполагать, что Хх^0. Это предположение запрещает присутствие в задании мно- жества X ограничений-равенств. На множестве Xj определим функцию В(х), которая называется барьерной функцией. Барьерные функции могут быть двух типов: В(х)—2 a/gjix», 5(л)=2 max {—ln(—g7(x))*, 0). j-i Отметим следующие очевидные свойства барьерных функций: Г. В(х)^0 для всех хеХь 2Э. limB (xt*>) = 4-оо для любой последовательности точек {х(*>} из Xi и такой, что Нтх^еХг- Составим функцию: F, Ю=f(x)-\-rkB(x)t 6=1,2.... (5.27) гДе — монотонно убывающая, сходящаяся к нулю последо- вательность положительных чисел. Лемма 5.1. Пусть X —замкнутое ограниченное множество, у которого Х1#:0. Пусть также f{x), gi(x),..., gm(x) —непрерывные на X функции. Тогда задача F*(x)-»-min имеет решение при каж- лелг, дом k= 1, 2,..., □ Возьмем произвольное натуральное 6. Обозначим F*= =inf 7\(х) По определению точной нижней грани сущест- вует минимизирующая последовательность {х<й>} такая, что xWeXt и lim f\(x(e))=F*. В силу компактности множества X из этой по- 5 131
следовательности можно выделить сходящуюся подпоследователь- ность. Без ограничения общности можно считать, что сходится са- ма эта последовательность: lim Jt<’)=xeX. Включение хееХ2 не- возможно согласно свойству 2° барьерной функции. Следовательно, хеХь Наконец, используя непрерывность функции Тл(х), получа- ем lim Fk = F* (f) = F*. Рассмотрим метод барьерных функций. Выберем последователь- ность {о,}* обладающую указанными выше свойствами. Например, можно положить гл=k~l или Гй==10_\ А=1, 2, ... . Очередное при- ближение xiki находим в результате минимизации функции Лл(х>' вида (5.27) на открытом множестве X». Существование такой точ- ки x(fc) обеспечивается леммой 5.1. Точное решение возможно здесь редко, поэтому в качестве возьмем приближенное решение, т. е. будем исходить из следующих условий: F* (Х<*>) < mln Fa (х) + eft, eft > О, JfGX, 11m -й=0. Для минимизации Fk(x) на множестве X] можно использовать, на- пример, градиентные методы безусловной оптимизации, изложен- ные в предыдущем разделе. Это возможно, поскольку Xt— от- крытое множество. Нужно лишь дополнительно после каждой ите- рации градиентного метода проверять, принадлежит ли очередное приближение множеству Хь и в случае выхода за его пределы уменьшать величину шага. Для иллюстрации описанного метода рассмотрим следующий простейший пример: х—»mln; X' = {xeR|x >0}. jt£X Здесь л=1, m=l, f(x)=xt gt(x)=—x, X| = {x]x>0}, X2={0}. Очевидно, решением этой задачи служит граничная точка jtmIn=O. В качестве барьерной функции возьмем, например, В(х)= — Ifx при х>0 и положим га=А-*, А=1, 2, ... . В этом случае функция (5.27) принимает вид Fk(x) =x+(kx)~x. Нетрудно найти ее точку минимума 1//k на множестве положительных чисел. Имеем lim jc(fc>=xmin- На рис. 5.16 дана- геометрическая иллюстрация к процессу решения примера при £=1, 2, 3. При увеличении k и при- ближении точки x(h) к границе допустимого множества линия гра- фика функции ffc(x) становится все более крутой, как бы воздви- гая «барьер» и не давая возможности точке х(Ь) выйти за пределы допустимого множества. Пусть X<=Rn — компактное множество, у которого Х\=£0, функ- ции f, £[, g2,..., gm непрерывны на X и Inf / (x)=min/(x). (5.28) хеХ Тогда каждая предельная точка последовательности, построенной с помощью метода барьерных функций, является точкой глобаль- ного минимума в задаче (5.26). 132
Если равенство (5.28) не выполняется, то метод барьерным функций может и Ре приводить к точке минимума. Так,, и а пример» в случае, изображенном на рис. 5Л7, к течке минимума линейной функции <с, х> подобраться «изнутри» невозможно. Достоинством метода барьерных, функций является широта, его применения. Как доказывает приведенное выше утверждение, тре- Рис. &16 буется лишь непрерывность функций, фигурирующих в постановке исходной задачи. Отметлм еще одно важное свойство метода: его можно использовать и в локальном варианте.. А именно: гсли н ка- честве хw выбирать точку локального минимума функции А(х). то получающаяся последовательность {х<*>} даст' приближе- ние к точке л о к а л ь и or о минимума целевой функции. Недостатком метода, затрудняющим иепосредственное приме- нение алгоритмов безусловной минимизации ЛЦ.т) для определе- ния точен л*Ч является .ярко выраженная «овражная» структур!» барьерной функции при малых значениях *>. Кроме того, напомним, что метод неприменим к задачам, е которых среди ограничений имеется котя бы одно равенство'. 4, Метод штрафных, функций, Основная идея метода цграфпых функций состоит в сведении .исходной задачи минимизации с огра- ничениями (как в форме неравенств., так к в форме равенств} к по- следовательности задач без ограничений, для решения кето рыл нс- пользуются соответствующие методы, безусловной манимнзации. Внешне этот метод напоминает метод барьерных функций. Будем рассматривать общую задачу нелинейного программиро- вания /(х)—»щ1й, (5.29) ЛЕХ X=(xeRfl|f)(xXO. ftUM. /=-ж-|- 1,..., з), в которой нее функции Д Я/ счнтзюгс.я непрерывными и а асем про- стр а ьстЕс R*. Функция' Р(х), определенная а непрерывная на называется штрофдой фдовдшей, если выполняются следующие условия: В ,Р(х)=0 для всех хеХ, 2) Р(д)>0 для всех х^Х 133.
Образно говоря, функция Р(х) назначает положительны» «штраф» за выход за пределы допустимого множества X, тогда как для точек из X «штраф» отсутствует. Указанными свойствами обладает, например, функция вида <max to(Л); °i)₽+5 to j-1 /—m+1 (5.30) где p — произвольное фиксированное натуральное число. Если функ- ции gj непрерывно дифференцируемы (дважды непрерывно диффе- ренцируемы), то и функция штрафа (5.30) непрерывно дифферен- цируема (дважды непрерывно дифференцируема) при р^2 (соот- - ветственио р^З). При р=1 функция (5.30) непрерывна, но диф- ференцируемой на Rn может и не быть. Введем вспомогательную функцию (6=1, 2, ...) Ф» W=f (X)+lkp (х). (5.31) где /й>-0, и перейдем к описанию метода штрафных функций. Вы- берем некоторую последовательность положительных чисел {Л»}, обладающую следующими свойствами: ... <Zlh<. — и lim/h=-{-co. Например, можно положить ln=k или /А=10\ ft=l, 2...Для k=l, 2, ... последовательно решаем задачи безус- ловной минимизации Ф*(х)-min , где функция Фь(х) имеет вид (5.31). Обозначим через х№ произвольное решение этой вспо- могательной задачи. При определенных условиях последователь- ность точек {xik>} дает приближение к решению задачи (5.29). Точ- ное решение вспомогательной задачи безусловной минимизации возможно крайне редко (оно может и вообще отсутствовать при некоторых %), поэтому можно использовать приближение к ниж- ней грани, т. е. исходить из условий Ф*(л(*0< inf Фй (л)-f-а* «*>0; НШ€4=0. х£Яп ’ *-* При этом можно применять известные методы безусловной мини- мизации. Заканчивая описание метода, отметим, что точки после- довательности {х4**} не обязательно будут принадлежать допусти- мому множеств^' X. Проиллюстрируем метод штрафных функций на примере зада- чи из п. 3. Рассмотрим в качестве штрафной функцию вида (5.30) при р=2, т. е. Р(х) = (тах{—х; О))2. Положим /*=Л, Л = 1, 2, .... Тогда Фл(х)=х+&(тах {—х; О})2. Для определения минимума функции Фл(х) вычисляем ее производную по х и приравниваем нулю: Ф* (Jt) — 1 — 2Л max {—х: 0}=0. Отсюда находим —(2k)~*, А=1, 2 Очевидно, полученная последовательность точек сходится к решению исходной задачи: 134
lim x^W'O’^.’Cain. Обратим внимание л а то, что х{4,<С, £ = = 1, 2..., т, с. и к одна точка х(А| не является допустимой для нс- ходноЙ задачи. Геометр и ческая иллюстрация примера дана на рис. 5.18. Прежде чем формулировать у слое ия сходимости для метода штрафных функций,, введем вспомогательное множество кг =* [х е Яйа<1 w < / 4=Ja | Ф где x<IDj—некоторое решение исходной задачи (5.29), Лусть асе в эиоаче (5.29)г и таре- рьийкы иа Кп„ зйпйдщд, (5.29) шкеег хотя бы <pcWo решение и „нноаге- cnv £2 ле л^сто и оардамчеж Гог^й каждая предельная i очка т»- следодогедености (>'|[МЬ логтроеякой г пожатью яетоая штрАфшде ф^чкдоД, является рёш^вдеи задачи (L.29L Доказательство этого утверждения можно найти в книге Ю. Г., Евтушенко «Мето- ды решении экстремальных за- дач и их применение и систе- мах оптимизации^ (Мл Наука, Рис. 5.18 I982). Отметим» что функции Ф*(А") при достаточно больших 4 Становится, овражной. Таким о бра зо м, недост ат к и м е года барьерных функция связи иные с овражностью Ffe(jr), в пол- ной мере присущи и методу штрафных функций. Еще одни иедо1 статок метода штрафных функций состоит в том, что тачки после- довательности как правило., оказываются недопустимыми. R. таких случаях, прекращай вычисления на некотором шаге, по- л уча ют приближенное решение, которое не удовлетворяет ограни- чениям исходной .задачи. 5. Конечный ял1 притм решения простейшей задачи квадратич- ного програмимирл'Удми^.. В п., 5 § 5.2 приведен алгоритм метода со- пряженных направлений, чоторый является конечным, в случае квадратичной целевой функции. Метод сопряженных направлений испрльэуется на промежуточных этапах алгоритмов решения за- дачи квадратичного программирования, причем свойство конечно- СТи удается сохранить. Ра сем отр и м ла дач у кв а др атич ног о п рогр а м м и ро из ния /(x)=i <Qx, jc) + {ер х) =-Шщ х5,„я.., хд >0; dfa в которой линейные ограничения общего вида отсутствуют, но име- ете и: условие неотрицзтельн7>стн переменные. Матрицу Q считаем симметричной и неотрицательно-определенно'й. Для этой простей- шей задачи квадратичного программирования конечный алгоритм формулируется следующим образом. 1Эо
Пусть имеется А-е приближение—точка х<4 x<*J^On (Ле е{0, 1, ...}). Если выполняется равенство d/(x<*))/3jq=0 для всех i вида x!*J>0, а также неравенство >0 для всех i вида х/й)=0, то х<*>— решение задачи и вычисления окончены. Это утверждение является прямым следствием теоремы 2.7, поскольку при- веденные выше условия— это соотношения (2.32), записанные применительно к простейшее задаче квадратичного программирования. В противном случае полагаем А=(/е (1, 2 п)|>0 или a/(x(ftJ)/dxy<0, xJA>=0| и минимизируем квадратичную функцию f с помощью метода со- пряженных направлений по переменным х„ j^Jk> принимая х7—0, j&Jh. При минимизации надо следить за сохранением неотрица- тельности переменных. Это делают следующим образом. Обознача- ют через х вектор тех переменных, по которым ведется минимиза- ция. Согласно методу сопряженных направлений, на шаге I вычис- ляют “»»= <у/ (х1*»1), р’*'1) (ЗУ*», р<‘<>) где и Q имеют аналогичный вектору х смысл. Кроме того, не- обходимо найти a*(=min I— jeJh />‘*'’<0), а если имеет место для всех /еД, то полагают <1^ = = 4-оо. Теперь следует сравнить аЛ[ и а*,. Если то оче- редную точку строят по формуле если же то используют формулу Если при минимизации переменная х}, обращается в нуль, то но- мер / из множества Jh нужно исключить. Полученная в результате применения метода сопряженных направлений точка с включением отброшенных ранее нулевых компонент дает x(ft+l>. 6. Метод линеаризации. Этот метод предназначен для решения задач нелинейного программирования, и его суть в общих чертах состоит в следующем. На каждом шаге ограничения задачи линеа- ризуют (т. е. вместо исходных ограничений используют их линей- ные аппроксимации в очередной точке), а целевую функцию также линеаризуют, но, для того чтобы получающаяся линеаризованная задача имела решение, к целевой функции добавляют некоторое 136
квадратичное слагаемое. Решение этой задачи квадратичного про- граммирования принимают за следующее приближение. Будем рассматривать задачу нелинейного программирования fo(x)->mln; i е /= {1, 2,..., в которой все функции предполагаем дифференцируемыми. Введем функцию F (л)==шах [/, (х) |/е=/J и будем считать, что F(x) ^0 для всех х (это допустимо, так как в число функций в ограничениях задачи всегда можно включить функцию, тождественно равную нулю). Введем множество /б(^)={/е/|Л(л) >F(x) —5), Ь>0. Пусть х(0>—начальная точка, е (0<е<1)—фиксированное число и — £-е приближение. Кроме того, пусть N— положитель- ная константа, обладающая тем свойством, что множество вида {х е R" |/0 (х)+^ (х) < /0 +NF (*<*>)} ограничено. • Очередное приближение строят следующим образом. При х— =xW решают задачу квадратичного программирования <v/oW. * р (Vfi(x), p)-\-ft(x}^Qt хе /«(*)- Проше всего это выполнить, перейдя к соответствующей двойствен- ной задаче, которая в данном случае состоит в максимизации по неотрицательным А,(, ie/ft(x), функции вида mfo Г(т/,(*), Р>4-уИР+^\«?Л(х), />)+//(*))} (5.32) Вектор р, реализующий здесь минимум, легко найти, дифференци- руя по р выражение в квадратных скобках и приравнивая получен- ный результат нулю: Р:=—v/o рс) — \ f I (х). (5.33) Подставив найденное выражение для р в (5.32), получим, ч^о двой- ственная задача сводится к максимизации по неотрицательным г^/в(л*), квадратичной функции --^||v/oW+^ ’+2 Это уже простейшая задача квадратичного лрограммярования, н для ее решения может быть применен конечный алгоритм преды- 137
дущего пункта. Обозначим решение указанной задачи через Х/Ч Подставляя Xi==VftJ в (5.33), найдем соответствующий вектор р=р<4 который определит направление движения из точки л<4 Для установления длины шага последовательно' проверяем нера- венства /0(х<*>+2~У *>)+NF 4- < /0 (ж<*>) 4- +NF (лГЛ’) - 2- 'г||р<*>|р для i=0, 1, 2, ... и фиксируем первое значение i=io, при котором неравенство выполнится. Окончательно следует положить aA=2-z«, Константу N подбирают таким образом, чтобы выполнялось не- равенство N >у = 2 Х(. Очень большим /V выбирать не сле- дует, поскольку это приводит к слишком малой длине шага щ. Ес- ли на некотором шаге оказывается jV^Jy, то N заменяют на Лг = 2у. Величину б нужно уменьшать в том случае, если вспомогательная задача квадратичного программирования не имеет решения. Вооб- ще же значение б желательно иметь по возможности большим. При довольно общих предположениях [21] последовательность построенная методом линеаризации, обладает следующим свойством: каждая ее предельная точка удовлетворяет исходным ограничениям 2, .... m, и является стационарной точкой функции Лагранжа М*)4- 2 пРи некоторых не- отрицательных fa- Метод линеаризации универсален, и его можно использовать при решении задач нелинейного программирования, в которых кроме ограничений-неравенств имеются и ограничения равенства. $ 5.4. ПРИКЛАДНЫЕ ЗАДАЧИ 1. Задача определения параметров функции. Пусть некоторый процесс характеризуется следующей зависимостью: ^=a4-bx4-e~rjf. (5.34) где а, Ь, с — параметры, подлежащие определению. В результате проведенных измерений установлено несколько значений искомой функции при определенных значениях переменной (табл. 5.1). Требуется определить значения параметров а, Ь, с, при которых отклонение значений функции (5.34) от значений, приведенных в табл. 5.1, было бы наименее возможным. Для того чтобы сформулировать соответствующую задачу оп- тимизации, необходимо указать «меру рассогласования», т. е. вы- брать функцию, с помощью которой вычисляются отклонения фак- 138
тическнх значений функции (5.34) от значений, приведенных в таблице. Для определенности условимся отклонение одного векто- ра из R5 от другого измерять как евклидово расстояние. Тогда, ис- Таблица 5.1 л 0,5 2.4 8 — 1 —3 у —1,5 12 50 8 8077 пользуя эквивалентность задач V h (x)->min и Л(х)-*-гпш, приходим к следующей задачей безусловной минимизации: /(а, 6, С)=(а+0,5б4-е-°^4-1,5)2+(а + 2,4д4-е-2^-12)24- +(а + 86 4-е-8'—50)2 4- (а - 64~ее — 8)2+ +(а - 36 4- е3с — 8077)2 -» m In. я Ac Это задача нелинейного (невыпуклого) программирования. Исполь- зуем для ее решения численные методы, изложенные в § 5.2. В ка- честве начального приближения выберем начало координат, т. е. положим л<°)= (0, 0, 0). Результаты, полученные в случае применения метода по- координатного спуска с шагом единичной длины, приве- дены в табл. 5.2. Как видим, на протяжении 15 итераций величину шага делить не пришлось. Значение целевой функции уменьшилось от 65224353 до 25,86, т. е. почти в 2522210 раза. Поскольку целевая функция не может принимать отрицательные значения, минимум находится в пределах от 0 до 25,86, а значит, можно считать, что в точке (—3, 7,3) значение функции близко к минимальному. Можно проверить, что /(—5, 7,3) «0. Это означает, что (—5, 7,3)—точка приближенного глобального минимума, и с помощью метода покоординатного спуска мы приблизились к ней достаточ- но близко. Обратим внимание на «непрямолинейный» характер приближения: на протяжении первых шести итераций по перемен- ным а и 6 имело место удаление от точки глобального мини- мума, а не приближение к ней. Наконец, отметим, что приближе- ние именно к точке глобального минимума оказалось возможным благодаря «удачному» выбору начальной точки и величины шага. Перейдем к рассмотрению метода градиентного спус- к а. Найдем частные производные целевой функции к вычислим градиент в начальной точке х<0}= (0, 0, 0): 7/(0, 0, 0)=(—16281; 47636; -47636). 139
Таблица 5.2 Номер а 5 ь у к а ь с f(a. b, с) Номер итерации а с На, Ь, с) 1 0 1 1 1 I 0 0 1 —1 —1 0 0 0 0 1 65224353 65208077 65255810 65157363 64852935 9 5 3 3 3 3 2 2 3 3 3 3 3 3 4 2 1762,17 1715,4 1120,31 «2-10” 58930372 2 2 2 2 2 —1 0 —2 —2 1 1 1 2 64836597 64884101 64789395 58365374 10 4 2 2 2 2 3 3 4 4 4 3 3 3 4 2 1152,45 1006,13 649,26 s=2-i0‘° 59037577 3 3 3 3 3 —2 — ] -3 —3 2 2 2 3 58749843 58794785 58705114 7091,15 3 1 * А 1 1 4 4 5 5 5 3 3 3 4 2 685,24 623,28 320,63 «2-10” 59098842 4 4 4 4 4 1 1 1 1 * * 3 3 4 2 7040,5 5911,09 «2-10»’ 58765100 | 12 2 0 0 0 0 5 5 6 6 6 3 3 3 4 2 360,42 290,84 134,41 »2-10” 59160396 5 5 5 5 5 7777 3 3 4 2 5632,08 , 4424,76 ♦ «2-l0to I 58764006 13 1 —I —1 —1 —1 6 6 7 7 7 3 3 3 4 2 207,99 100,83 90,62 «2-10” 59221893 6 6 6 6 6 —1 0 0 0 3 3 4 2 4421,74 3388 «2-Ю*4 64819273 14 0 —2 —2 —2 —2 —2 7 7 8 6 7 7 3 3 3 3 4 2 138 53,25 189,26 77,26 «2-10,° 59237287 7 7 5 5 б 5 0 0 1 1 1 3 3 3 4 2 3408,77 3377,21 2489,67 ®г2-10'° 58853010 15 —1 —3 7 7 3 3 90,62 25,86 8 6 4 4 4 4 1 1 2 2 2 3 3 3 4 2 2544,26 2475,09 1733,78 «г-ю*0 58915328 140
Далее воспользуемся формулой х<»)=(0, 0, О)-ао?/(О, О, 0)=—а0(—16281; 47636; -47636). Проверка показывает, что при ао^>Ю~4 значение f(x(l)) больше, чем [(х(0\ а при оо^Ю"® продвижение из х<°> в х0) незначительно. Поэтому выберем среднее, т. е. примем ао=5-1О-5. В результате получаем х<П= (0,58; 2,38; 2,38), f(х<’)) = 46542509<f(x<°>). Вычисляем градиент в полученной точке Vf(x<l))==(—13707; 40419; —51633754). Имеем х(21=(0,58; 2,38; 2,38)— а, (—13707; 40419; —51633754). Здесь величина шага 10-7 оказывается слиш- ком большой, поэтому принимаем 01=10^ и находим л52)= (0,58; 2,38; 2,9), f(jt(2)) =4330134,7 <f(x(,))- Затем определяем Vf(x<2>) = = (—4210; 11957; —74939424) и вычисляем х<3>=(0,58; 2,38; 2,9) — —аз (—4210; 11957;—74939424). Приа2=10“9 (величина 10-8 ведет к увеличению значения целевой функции) получаем х<8>=(0,58; 2,38; 2,98), f(x<3)) = 204635</(х<2)). Анализ показывает, что дальнейшие вычисления согласно гра- диентному методу приведут к приближению третьей переменной с ж оптимальному значению, равному 3, тогда как первые две пере- менные практически не изменятся. Эта ситуация характерна для функций «овражного» типа' Применим теперь метод Ньютона. Вычислим матрицу вто- рых производных целевой функции в начальной точке (10 13,8 -13,8 \ 13,8 Д6.0 -160 | -13,8 160 -151617/ я найдем обратную матрицу: / 17228 -1485,73 0\ |v2/(0. О, 0)]-*=-J—I -1485,73 1075,62 -1 I \ 0 -1 -1/ В соответствии с формулой (5.13) имеем х<»=х(°)—[v2/(x<°))]-iv/(x«’))=(2315; -497,42; 0)т, причем / (х(,)) = 34540556<f(x<°)) . Далее находим 10 13,8 -13,8 13,8 160 —160 —13,8 -160 -278618,25 ( 31643,75 -2728,93 0\ -2728,93 1976,49 -1 I; I 0 -1 -1/
v/(a(1>)=(4,88; -14,13; 14,13)- x(2)=x(i)__jv2y(JC(i))j-i v/(X(l))=(2314,33; -497,27; 0)T, причем f(x<2)) =3454053 Кf(x(1>)*. Можно проверить, что частные производные целевой функции в точке х<2> близки к нулю. Следова- тельно, применение метода Ньютона приводит в окрестность неко- торой стационарной точки, которая находится на значительном уда- лении от точки глобального минимума. 2. Задача распределения воды по отстойникам. Пусть в системе сооружений, предназначенной для биологической очистки сточных вод, имеется п отстойников для удаления компонентов загрязнения с удельным весом большим, чем у воды. Тяжелые частицы оседают на дно и с помощью специального насоса периодически удаляются, а верхний слой сливается и проходит следующие стадии очистки. Пусть в систему очистных сооружений подается количество воды Q. Требуется это количество воды распределить по отстойникам таким образом, чтобы на выходе суммарное количество взвешенных частиц было минимальным, т. е. чтобы очистка была наиболее полной. Эта задача имеет смысл, даже если все отстойники имеют одинаковую конструкцию, поскольку они, как правило, обладают -различными характеристиками по удалению взвешенных частиц. Обозначим через Qi количество воды, поступающей в i-fi отстой- ник, а через Ci — концентрацию взвешенных частиц на выходе i-ro отстойника, i = l, 2, .... п. Задача сводится к минимизации функции п i-l при ограничениях V Qi=Q. Q/>0, i==l,2,..., n. z-i Будем считать, что концентрация взвешенных частиц пропорцио- нальна количеству воды Qi, подаваемому в этот отстойник, т. е. примем Ci=«iQi, где си (ш>0) —коэффициент пропорциональности, характеризующий «качество работы» i-ro отстойника. Вводя пере- менные xi = Qi/Qt i= 1, 2,.... п, окончательно приходим к следующей задаче квадратичного программирования: л 2 O/JC? —> mln; 4=1 1, О, i—1, 2,..., л. i-i 142
Рассмотрим задачу описанного типа со следующими числовыми данными: / (х)=л? 4- 1 ,2л?. +1 .Зл? +1,5л? 4-1,5л? —* min; 5 л^= 1, Л^, Л2,..., Л«£ ^-0. 1=1 Для ее решения воспользуемся методом, изложенным в п. 5 § 5.3. Предварительно «избавимся» от ограничения-равенства, выразив переменную Х| через остальные и подставив полученное выражение в формулу для f: f =*(1 —л2—... —л5)24“ 1»2лг-}- 1,5лб= =2,2л2 4" 2,3л? 4- 2,5 л? 4~ 2,5л? 4- 2л^Хд 4~ 2л$х4 4“ 2 лал64~ 4- 2л3л4+2л3л84- 2л4л6—2л3—2л8—2л4—2л5 4- 1. Для упрощения записи последнее слагаемое далее учитывать не бу- дем и, кроме того, обозначим х= (х2, Xg, х4, Xs)T. Находим 4,4л24-2л34-2л44-2л5—2 \ у4,4 2 2 2\ 2л2 4- 4,6л3 4- 2л4 4- 2л5 — 2 2л2 4- 2л3 4- 5 л4 4- 2л5—2 2л24-2ла4-2л4-|*5лч—2 2 4,6 2 2 2 2 5 2 2 2 2 5 ?/(л) = В качестве начальной возьмем точку (0,2; 0,2; 0,2; 0,2)т. Далее определяем: v/(x«»)=(0,08; 0,12; 0,2; 0,2у, р<0>=—у/(л<0))=(—0,08: -0,12; -0,2; -0.2у, <у/<0)>» Р(01> а0= -0,1 1,012 =0,099, а0= min {0,2/0,08; 0,2/0,12; 0,2/0,2}= 1. Так как ао<ао, то л(1>^х(О)4-аоР<о,=(0.192; 0,188; 0,18; 0,18)т. Далее выполняем следующий шаг: v/(x<l))=(-0,059; -0,031; 0,02; 0,02у, =0,053, уо=-7/(л<1))4-М0,=(0.055; 0,025; -0,03; -0,03у, “>-----</(п>1))’<п? =0-347- “1=°-’8/0,03=0,6> а1( <Q?U. р(,)> л(2>=л(1>4-а1^1)=(0,211; 0,197; 0,17; 0,17)\ 143
Наконец, имеем v/(x(2))=(0,0024; 0,008; 0,006; 0,006)\ >2)=_vy(x(2))+piP(i)==(_o,OOl; -0,0073; -0,0068; -0,0068г, а2 — = 0,117, а2=min [0,211/0,001; 0,197/0,0073; 0,17/0,00681 = 2,5 >а2, х<3)=л<2)-|-а2/Н2)—(0,211; 0,196; о; 169; 0,169)т. Учитывая, что Xi = 1—х2—...—Хб, окончательно запишем найден- ное приближенное решение: (0,255; 0,211; 0,196; 0,169; 0,169)т. Глава 6 ГЕОМЕТРИЧЕСКОЕ «ПРОГРАММИРОВАНИЕ - Геометрическое программирование, как отмечалось в гл. 2, по- зволяет решать задачи минимизации нелинейного программирова- ния с функциями специального вида, которые называются позино- мами. Многие технические задачи оптимизации удается сформули- ровать именно в терминах геометрического программирования. Решение подобных задач, как правило, можно свести к решению более простых задач максимизации, в которых целевая функция является вогнутой, а ограничения—лилейные. Такое сведение обо- сновывает приведенная в '§ 6.3 теорема двойственности геометри- ческого программирования. § 6.1. ЗАДАЧА ГЕОМЕТРИЧЕСКОГО ПРОГРАММИРОВАНИЯ, ПРЕОБРАЗОВАННАЯ И ДВОЙСТВЕННАЯ-ЗАДАЧИ 1. Постановка задачи геометрического программирования. Вы- ражение вида CJCi"X2*...x“n, fl где с>0 и a/sR, х=1, 2, ..., л, называют одночленным позиномом. Сумму конечного числа одночленных позиномов, т. е. функцию / U)=2 (x>0„) Х-1 переменных хи х2...хп, называют позиномом или позиномиаль- ной функцией. Все коэффициенты с1( с2, .... ст считают положитель- ными, тогда как показатели степеней ац (х=1, 2, .... т\ /=1, 2, ...„ 144
п) —произвольные вещественные числа. Область определения по- зинома состоит из тех векторов пространства R", координаты кото- рых положительны. Простейшими примерами позиномов являются следующие функ- ции: f । (xlt х2) =*1 + 2хг + (W-Vi)z. ft {Xi, xz, ..., xn) = l;xi + +2/л22+...+л/хп". Очевидно, сумма и произведение любых двух поз и номов также являются позином а ми. Задача геометрического программирования — это задача мате- матического программирования, в которой все функции являются позином иальным и. Для позинома f(x) неравенство f(x)^O при .т>0п решений не имеет, поэтому ограничение с позиномиальной функцией записыва- ют в виде f(x}^b* где б>0. Последнее неравенство эквивалентно неравенству f(x)/ft^l, где f(x)/b— позином. Поэтому можно сразу считать, что ограничения задачи геометрического программирова- ния имеют вид fh (х) 1. В соответствии с этим задача геометрического программировав ния формулируется следующим образом: /о (л)—» min; X (Д*1 , . . . , «ХЯ)Т Од, где все функции fo, h..fp— позиномы. Ограничения, состоящие в требовании положительности всех переменных, называют естест- венными ограничениями* а ограничения вида fh(x)^l —вынужден- ными. Естественные ограничения должны быть в каждой задаче геометрического программирования; вынужденных ограничений мо- жет и не быть (в этом случае р=0). Обозначим через т, число одночленных позиномов в fj, /—О, __ р 1, .... р. Пусть 2 Введем следующие множества индексов: >-0 J0=(1.2....«0{. Л = {«o-l-1, m0-j-2.m0+mJ,.-. Легко видеть, что U JA= (1, 2....m }. А-0 Теперь, если все члены позинома fA занумеровать числами из множества Л, можно записать Л(*)в2 с^х^.х^* Л=0, 1,..., р. (6.1) /67* Матрицу Л, составленную из элементов ац* называют матрицей экспонент. Она содержит m строк и п столбцов. 145
Запишем задачу геометрического программирования в развер- нутом виде: /о(^) = У —mln; л<*>=2 «е/i лм=2 с1^°а 'еЛ /р(х>= V <1, feJp Это задача нелинейного программирования, и в общем случае она не является задачей выпуклого программирования. Любая задача геометрического программирования может быть сформулирована так, что*ранг ее матрицы экспонент А будет совпа- дать с числом неизвестных п. Действительно, если rang Д<п, то среди столбцов матрицы А есть линейно зависимые от остальных. Не уменьшая общности, предположим, что последний столбец мат- рицы А линейно зависит от остальных, т. е. для некоторых чисел Л—1 Ль ?.2,Xn-i выполняется условие Д,я — m. Вводя новые переменные х>, ..., zn-i с помощью равенств х;= г=х;Хл*Л /=1, 2, п—1 получаем л—L х х!т1 /‘ti * /=1’2...т- Это означает, что в каждом одночленном позиноме задачи геометри- ческого программирования множители x^in можно вычеркнуть (т. е. положить хп = 1) и это не повлияет на оптимальное значение самой задачи. Исключая все столбцы матрицы А, линейно зависи- мые от остальных, придем к матрице, ранг которой совпадает с чис- лом неизвестных. Эта матрица получается из исходной вычеркива- нием столбцов, линейно зависимых от остальных. Выбор таких столбцов ие однозначен, поэтому и сокращенная матрица определя- ется не однозначно. Исходная задача геометрического программиро- вания и задача с сокращенной матрицей экспонент либо обе имеют оптимальное решение, либо обе их не имеют, причем оптимальные значения этих задач (если они существуют) равны. Зная оптималь- ное решение задачи геометрического программирования с сокра- 146
щенной матрицей экспонент, всегда можно записать оптимальное решение исходной задачи. Так, если была исключена только пере- менная хп и Xi*, «2*.£*n-i — оптимальное решение новой задачи, то xt=xi*t i—1, 2, .... п—1, Хп = 1 — одно из оптимальных решений исходной задачи геометрического программирования. Итак, всегда можно предполагать выполненным равенство rang А — п. 2. Двойственная задача геометрического программирования. Рассмотрим функцию вида * т р ®<8)=п (тТП <6-2> . \ о/ / Л-0 переменных С2,.... 6m, где х»=2 Л=0, 1...р, (6.3) а С], с2, ...» ст — коэффициенты задачи геометрического программи- рования. При' вычислении значений этой функции считаем, что 8’f = 1 при 'di—0 и ^*= 1 при Ха=О. При этих допущениях функция и (б) непрерывна при всех б^0т. Ее называют двойственной функ- цией, а переменные 6i, б2> dm — двойственными. Если имеется не- которая задача геометрического программирования, то по коэффи- циентам С], с2, ...» ст, можно однозначно записать двойственную функцию. Каждый множитель a** (£—1, 2, ..., р) в двойственной функции отвечает вынужденному ограничению fh(x) 1 задачи гео- метрического программирования. Теперь сформулируем двойственную задачу геометрического программирования: г» (8) — max; Л’8=0„, V 5,= 1. 8>0„. isJ о где А — матрица экспонент задачи геометрического программирова- ния. В подробной записи двойственная задача имеет вид ®<8>=П (f-/' П —шах; М Л-С ДИ®1 +Д2Л+ ' • - 4" Д«п18т=^, al2Bj + аИ81 + - • + Дт28т = Оэ д1п81 4-®2п82+ - • ’ = 814"®?4- - • 4“8т« = 1; ®1» 8т где Лл, k=0, 1, .... р, определяются равенствами (6.3). Число двой- ственных переменных m равно общему числу одночленных позино- 147
нов в исходной задаче. Сумма первых т0 двойственных переменных должна быть равна единице (то — число одночленных позиномов целевой функции задачи геометрического программирования). Для каждой задачи геометрического программирования можно записать (и притом только одну) соответствующую ей двойственную задачу. Рассмотрим, например, задачу геометрического программи- рования вида —-min; <1, х„ ха>0. (6.4) *2*3 X1JC2 /х2 Здесь одно вынужденное ограничение. Матрица экспонент содержит четыре строки и три столбца: причем rang 4=3, т. е. чцсло переменных уменьшить нельзя. Огра- ничение содержит только одночленный позином, поэтому Учитывая, что с1=с2=Сз=С4= 1. запишем двойственную функцию: •и (8) = 8Г41БГ*’8Г* ?ВГ8<в{4. Таким образом, задаче геометрического программирования (6.4) со- ответствует двойственная задача вида 8Г’,8Гг’8Г(, — |пах; — Bi — 8Э -|- о4=О, --J-S4=O, (6.5) 4 —Si — 8i4-B3-|——84== О, ®tj"82“|_®3= 1; 81» 83 84^0. 3 Преобразованная задача геометрического программирова- ния Вернемся к задаче геометрического программирования и про- изведем замену переменных: с,«=еЧ /=1. 2.....л. Такая замена правомерна, поскольку верно неравенство х,>0, J = = 1.2 л. В результате позиномы (6.1) преобразуются в функции л S aijxj г>=2 С^1 • 1...А (6.6) иь
и задача геометрического программирования станет преобразован’ ной задачей геометрического программирования: где компоненты вектора г могут принимать любые вещественные значения, а функции определяются равенствами (6.6). Оптимальные значения задачи геометрического программирова- ния и соответствующей ей преобразованной задачи совпадают (при условии, что они существуют). Преобразованная задача имеет не- сомненное преимущество перед исходной задачей геометрического программирования: она является задачей выпуклого программиро- вания. Убедимся в этом. Функция е®— выпуклая, поэтому для Ze [О, П, z<l>, 2(2)eRn. имеем 2 (utn+(i-u}2>) x 2 +(I~X) 2^!2> e‘ =e 1 * > 2M1} 2-/? >Xe '' +(1 — X)e ' %atgi Следовательно, функция нескольких переменных типа е‘ — выпуклая и линейная положительная комбинация подобных функций, в частности все функции hh(z) вида (6.6), также выпук- лые*. Анализ преобразованной задачи позволяет сделать важный вывод об исходной задаче геометрического программирования. Ес- ли п=т, то вектор-столбцы матрицы экспонент А образуют базис в пространстве Rn (при условии, что rangA«=n), а значит, любой вектор из Rn можно получить как линейную комбинацию этих ба- зисных векторов. В частности, найдутся такие числа z/\ что л i=l,2............л; 1=1,2..... В этом случае из равенств (6.6) следует, что о, Л=0, 1...р, где z^—zj0,..., zl0)T. I —• Таким образом, множество допустимых решений преобразован- ной задачи не пусто, но решения, реализующего условный минимум функции ho, не существует. Следовательно, и задача геометрическо- го программирования, в которой rang 4=n=m, бессодержательна и всегда можно полагать, что rangA=n<m. Заметим, что, если rang A ^n—mt система уравнений ЛТ6=ОП в двойственной задаче имеет только нулевое решение б=Оп- Но для • На самом деле ех строго выпуклая, поэтому и функции типа е( также строго выпуклые (если средн ыт'ел а< есть отличные от нуля). 149
такого решения равенство V не выполняется, а значит, двой- ственная задача не имеет допустимых решений. Рассматривая преобразованную задачу, можно также устано- вить, при каких условиях исходная задача геометрического про- граммирования разрешима, т. е. когда ее оптимальное решение и оптимальное значение существуют. Лемма 6.1. Если найдется хотя бы одно допустимое решение х* задачи геометрического программирования и хотя бы одно допус- тимое решение 6* соответствующей двойственной задачи такое, что 6*>0лъ то задача геометрического программирования разрешима. □ Если существует допустимое решение задачи геометрическо- го программирования, то, очевидно, существует и допустимое реше- ние z* соответствующей преобразованной задачи. Поэтому, задача A0(a:)-*inf, A=l,2,.../\ где все функции й* имеют вид (6.6), разрешима. Это означает, что найдется минимизирующая последовательность векторов такая, что 1йпЛ0 (£<*>)=V* (6.7) I—« ЛА(а<‘))<1, А₽1,2,...,р; Z=l,2,..., (6.8) где у — точная нижняя грань функции Л0(г) на множестве допусти- мых решений преобразованной задачи. Пусть t/!-n=2 auzT* /=1,2,... (6.9) y-1 И !/(П = (4/1П> .Так как Л*(г(1,) = 2 А=.О, 1,...,д то при /-»-оо компоненты вектора yw ограничены сверху. В против- ном случае нарушается равенство (6.7) (получается, чтоу—+оо) или же окажется невыполненным по крайней мере одно из нера- венств (6.8). Вектор 6* является допустимым в двойственной задаче; следова- тельно, Л’тб* — 0я. Поэтому, используя (6.9), получаем m л / м х 2 5 а<>8‘И'-°-z=1-2......... 1-1 J-l /-1 / Ранее было установлено, что компоненты вектора у™ ограничены сверху. Принимая это во внимание, из последних равенств в силу 150
неравенств $(*> 0, i= 1, 2, .... т, можно сделать вывод, что указан* ные компоненты должны быть ограничены и снизу. На основании замечания, предшествовавшего лемме, можно счи* тать, что rang>3=n<m. Не уменьшая общности, предположим, что первые п строк матрицы А являются линейно независимыми. Обо- значим квадратную матрицу размера пХп, которую они образуют, через А и введем вектор = {Ап,...,Ул })т. В этих обозначе- ниях первые л равенств из (6.9) можно записать в виде yll,=Az<‘>, /—1. 2.... Определитель матрицы А отличен от нуля, поэтому для нее сущест- вует обратная матрица А~'. Следовательно, 2«>=Л-7'>, /=1, 2...... Таким образом, каждая компонента вектора z<'> является линейной комбинацией компонент вектора у11\ которые ограничены сверху н снизу. Следовательно, компоненты векторов /=1, 2.......также ограничены сверху и снизу. Из ограниченной последовательности {z^} в силу соответствую- щей теоремы математического анализа можно выделить сходящую- ся подпоследовательность. Без ограничения общности можно счи- тать сходящейся саму эту последовательность: Функции Лл(а), Л=1, 2, .... р, непрерывны, поэтому множество до- пустимых решений преобразованной задачи замкнуто. Следова- тельно, Лл(zt°)) 1, fe = l, 2, ..., р. Кроме того, в силу непрерывности A0(z) имеем Ao(z<O)) =у. Таким образом, преобразованная задача имеет оптимальное решение z<°>. В этом случае исходная задача гео- метрического программирования также имеет оптимальное решение ffll *,0) =е '* , Z=l, 2..п. В задаче вида (6.4), например, Л1 = Л2=х*— 1 —допустимое решение. С помощью метода исключения Гаусса можно определить единственное допустимое _решение двойственной задачи (6.5): $1 = 1/10, 62=3/5, д3=3/10, б<=4/5. Все эти числа положительные; следовательно, на основании доказанной леммы можно сделать вы- вод, что исходная задача (6.4) разрешима. § 6.2. ОСНОВНАЯ ЛЕММА ГЕОМЕТРИЧЕСКОГО ПРОГРАММИ РОВАН ИЯ 1. Вспомогательные неравенства. Согласно неравенству (л1Ч-х24-...-глЯ1)/т >(х1л2...хт)1'т. (6.10) среднее арифметическое любых т положительных чисел не меньше их среднего геометрического, причем они равны тогда и только тог- да, когда Х]-х2=...=хт, Более общий результат, связывающий среднее арифметическое 151
и среднее геометрическое чисел с «весами», содержит следующая лемма. ' Лемма 6.2. Для любых чисел х\, х* ...» хт>0 и любых весов си, аг, ат>0 таких, что 01+02+... + ame 1, справедливо неравен- ство m m 2 “»*» > п *»*. J?-l Л-1 (6.11> причем равенство имеет место тогда и только тогда, когда X[=Xi= □ Функция £=1пх строго вогнута на своей области определе- ния, поэтому в соответствии с неравенством Иеисена (см. п. 2 § 1.3) для любых Xi, Х2, .... хт>0, среди, которых есть хотя бы од- на пара различных, и любых <ц, 02....Om>0, oi + a2+...+am= 1 вы- полняется неравенство >2a*lnjc*—,пП »-1 « Л-1 Отсюда, потенцируя, получаем неравенство m m 2 а**й>п & ft-l .r-l Если среди чисел Xi, х2, ..., хт нет ни одной пары различных, то m Xi=x2=...=хтп. В этом случае, поскольку 2 аА=1.обе части нера- л-1 венства (6.11) одинаковы. Обратно: равенство в (6.11) в силу стро- гой вогнутости функции 1пх имеет место только в случае Х]=х2 = ... Неравенство (6.10) для среднего арифметического . и среднего геометрического получается из неравенства (6.11) при ai=as=... =am=l/m. Неравенство (6.11) имеет общий вид, однако нам понадобится подобное неравенство в еще более общей форме, когда весовые ко- эффициенты не нормированы, т. е. не обязательно подчиняются тре- бованию iai+a2+-..+'am= 1- Лемма 6.3. Для любых чисел Stь Я2,.... SU>0 и любых чисел бь 62. —, 6m0 выполняется неравенство * m <Я14-Яг+-+Яи)‘ П (-Г-Г*- <6.12> \ о* / *-1 • Считаем, что в неравенстве (6.12) при б1™62=.. .—6т»0 и (Ujt/dfc) йл=1 при 6л=0. 152
m где Знак равенства возможен только в одном из следую- *-л щих двух случаев: a) =&от—0; б) 6т^>0 и 31.'81 = Я2;82=...=?1т(/б|Л. □ Если к=0, то 61 = б2=--=йт=0 и обе части неравенства (6.12) совпадают и равны единице. Поэтому пусть Х>0. Рассмотрим сначала случай, когда все 6ь б2, 6т>0. Для нор- мированных весов ал=блА и чисел 9U/6*. А=1, 2, .... /п, воспользу- емся неравенством (6.11): у! А *£ > ПГ*-» К Ju X ай "" 11 / Л-l А—1 ИЛИ откуда, возводя обе части неравенства в степень X, получаем нера- венство (6.12). Знак равенства возможен только в случае 9Ij/6i = ~ Sts/da =“ 9tm/6m- Теперь допустим, что среди чисел йь 62. —» 6m имеются равные нулю. Не уменьшая общности, можно считать, что дь б2. ...» 6$>0 и 6s+1 = ...=дт=0 (s> 1). Положим 0=61+62+ —+6s- Применяя толь- ко что доказанное неравенство, получаем Отсюда, учитывая очевидные соотношения A=f имеем 153
2. Основная лемма геометрического программирования. Лемма 6.4. (основная лемма геометрического программирова- ния). Если вектор х удовлетворяет ограничениям задачи геометри- ческого программирования, а вектор б — ограничениям соответству- ющей двойственной задачи, то /о(х)>т(8). (6.13) Более того, при этих же условиях равенство fo(x) = о (6) имеет место тогда и только тогда, когда С.Х°12Х%2.. .Х^п Jo (*) при /(=4 C/Xi« X2a...Xntn' 2 Ир*1 А=1, 2..р. (6.14) □ Введем обозначение и( (л) = cfXi«X2n - -. х^л, i— 1, 2,„., m, и применим лемму 6.3 к числам Й*=н<(х)>0 и неотрицательным числам б<» i= 1, 2,пг, считая, как и в предыдущем параграфе, что 2 Получаем А=0, 1,...,р. (6.15) Отсюда, в частности, при 6=0 имеем (6.16) так как ^0=25?==^- Согласно условию, верно неравенство 1^Д(х), А=1, 2, ...» р, по- этому из соотношений (6.15) вытекают неравенства 1>х»»П *=1,2....р' <6Л7) Умножая почленно неравенство (6.16) на произведение неравенств (6.17), получаем /0(х)>пр^)‘'П*- Но (6.18) (*) 4i Т/ \ ь/ / 154
следовательно, т т 2 *n*t X ainlt fa (х) > v (В) х!“1 . Хл"1 По условию, вектор 6= (б|, 62,.... бт)т является допустимым в двой- m ственной задаче, а значит, удовлетворяет равенствам ^д^Ь^О, /=1 / = 1, 2, .... п. В соответствии с этим последнее неравенство принима- ет требуемый вид fQ (х) и (б). Докажем вторую часть леммы. Пусть fo(x) =0(6). В этом случае - неравенство (6.16) и все неравенства (6.17) выполняются как ра- венства (если это не так, умножая почленно (6.16) на (6.17), мы получили бы неравенство fQ(х)>и(6)). В силу леммы 6.3 равенство в (6.16) может иметь место только при М*) = 'fg(x) = итл (*) ®1 ®2 Вя. Отсюда, согласно известному свойству пропорций, имеем Мх> /о(х) f —— =——-------——— — 7 о W *' 2 \ 1 при каждом ieJ0. Следовательно, 6t—ui(x)/f0(x) при ieJ0, т. е. справедливость первых тп равенств в (6.14) проверена. Установим справедливость остальных равенств. В силу леммы 6.3 равенства в (6.17) возможны лишь в одном из следующих двух случаев: a) 6i=0 для всех i&h, 6=1, 2, ..., р; б) б,->0 для всех ie/fc и Hi(x)/6i=M/(x)/6i при всех i, /еЛ, Л= 1, 2.р. В первом случае 2^=0 и доказываемые равенства в (6Л4) при каждом А=1, 2, .... р превращаются в очевидные: 0=0. Во втором случае, согласно свойству пропорций, получаем S иЛх) 2...р (6.19) при каждом (еД. Отсюда 6f=—при Л=1, 2,...,р. (6.20) 155
В (6.17) неравенства выполняются как равенства, поэтому, под- ставляя в эти равенства ut(x)/б< вида (6.19), получаем откуда Д(х) = 1, А=1, 2..р. Следовательно, равенства (6.20) пре- вращаются в доказываемые равенства из (6.14). Остается показать, что для допустимого решения х задачи гео- метрического программирования и допустимого решения-б двойст- венной задачи, связанных равенствами (6.14),выполняется равенст- во fo(x) — и (6). Из равенств (6.14), согласно лемме 6,3, следует, что неравенство (6.16) должно выполняться как равенство. Более того, все неравенства (6.17) также должны быть равенствами. В са- мом деле, если Л*=0, то справедливо б<=0 для всех teA и, следо- вательно, правая часть неравенства (6.17) при этом А, так же как и левая, равна единице. Если же Х*>0, то из (6.14) получаем ра- венство /й(х) = 1 при этом k и, кроме того, имеем «/(*)/$/==Ч при всех i£=Jk. На основании этого в соответствии с леммой 6.3 делаем вывод, что для этого k неравенство в (6.17) выполняется как равенство. Таким образом, неравенство (6.16) -и все неравенства в (6.17) выполняют- ся как равенства. Перемножая почленно все эти равенства, придем к требуемому равенству Д>(х) = о(б). Из доказанной леммы следует, что если задача геометрического программирования и двойственная ей задача разрешимы, то опти- мальное значение первой задачи не меньше, чем оптимальное значе- ние второй. Как будет показано в следующем параграфе, на самом деле при довольно общих условиях оптимальные значения обеих задач совпадают. Замечание. Если выполняется равенство Ь(х) = и(б) при не- которых векторах х и б — допустимых решениях задачи геометриче- ского программирования и соответствующей ей двойственной зада- чи, то на основании последней леммы f0(x) =t>(6) ^fo(x) для любо- го вектора х, являющегося допустимым решением задачи геометри- ческого программирования, т. е. х — оптимальное решение задачи геометрического .программирования. Кроме того, согласно той же лемме, справедливо и (б) =fcj(x) ^и(б) для любого вектора б, явля- ющегося допустимым решением двойственной задачи, а значит, б — оптимальное решение двойственной задачи геометрического про- граммирования. Таким образом, равенство f0 (х) = v (6) является достаточным условием оптимальности решений х и б.
§ 6.3. ТЕОРЕМА ДВОЙСТВЕННОСТИ ГЕОМЕТРИЧЕСКОГО ПРОГРАММИРОВАНИЯ 1. Теорема двойственности. Теорема двойственности, доказыва- емая на основе основной леммы геометрического программирования и необходимых условий оптимальности выпуклого программирова- ния, представляет собой основной результат главы. Она показыва- ет, что при довольно общих предположениях, решая двойственную задачу, можно определить оптимальное решение и оптимальное зна- чение исходной задачи геометрического программирования. Теорема 6.1. Предположим, что ограничения задачи геометри- ческого программирования удовлетворяют условию регулярности Слейтера: найдется такая точка х>0п, что выполнено неравенство /*(х)<1, й = 1, 2, .... р. Справедливы следующие два утверждения: если существует оптимальное решение х задачи геометрического программирования (в силу леммы 6.1 такое решение заведомо су- ществует, когда соответствующая ей двойственная задача имеет по крайней мере одно допустимое решение с положительными компо- нентами), то существует оптимальное решение б двойственной зада- чи, причем оптимальные значения обеих задач совпадают: f0(x) = =*(6); пусть х и б — допустимые решения задачи геометрического про- граммирования и соответствующей двойственной задачи. Для того чтобы эти решения были оптимальными, необходимо и достаточно, чтобы они были связаны равенствами при при kt=K, (6-21) где >•*= В/, а К — подмножество множества номеров {1,2,..., пг}, для которых ?.л>0. □ Пусть х—точка минимума в задаче геометрического про- граммирования. От задачи геометрического программирования с помощью замены л>=е*Л / = 1, 2, ..., п, переходим к преобразован- ной задаче: й0U)—» min; йА(г)<1, й=1, 2..р. При этом, очевидно, вектор z с компонентами Z} — In Ху, ./ = 1, 2....л, (6.22) является оптимальным решением в преобразованной задаче. Кро- ме того, ограничения прербразованной задачи удовлетворяют ус- ловию регулярности Слейтера: ftfc(z)<l, й=1, 2, .... р, где z— век- тор с компонентами z/=lnxj, / = 1, 2,..., п. В § 6.1 отмечалось, что преобразованная задача является зада- чей выпуклого программирования. Поэтому для точки z можно 157
применить необходимое условие оптимальности теоремы 2.9. Со- гласно_этой теореме, найдутся такие неотрицательные числа рь Р-2, ..., Рр, что пара векторов (х, ц), где р= (pt, рг, .... р₽)’, образу- ет седловую точку функции Лагранжа р Р) = Л0(г) + 2рй(Л*(г)—1), t-i т. е. неравенства р)<А(г, р)<Д(г, р) (6.23) выполняются для всех zeRn и всех векторов ц с неотрицательными компонентами. Правая часть неравенства (6.29) означает, что функция L(z, р) достигает безусловного минимума в точке I. Эта функция диффе- ренцируема, поэтому, согласно теореме 2.4, справедливо равенство V2Z, (г, р)| г=7=0я„ которое в покомпонентной форме имеет вид для любого s — 1, 2, .... п. Если это равенство разделить на h0(z) и ввести m-мерный вектор 6 с неотрицательными компонентами вида я 1 ,-> при IS «о W п _ - Д’"*' ji с е' * \ -----при Ы1, 2,...,Д, «о W (6.24) то придем к равенству т для любого s —1, 2,..., п. /-1 Из (6.24) следует, что равенство Ь, -о2 . -|- 6mq=1 также вы- полняется, поскольку 2 attKJ Jqe'-- =Л0(л). ii=J0 Следовательно, введенный вектор б удовлетворяет всем ограниче- ниям двойственной задачи. 158
Если будет установлено равенство (6.25) то, согласно замечанию к основной лемме геометрического програм- мирования, б — оптимальное решение двойственной задачи и тем самым первое утверждение теоремы будет доказано полностью. Проверим справедливость равенства (6.25). Суммируя по i&Jk вто- рое равенство в (6.24), получаем *»= Ул= • *=•’.2..............р- <6-26> Теперь докажем, что = *=1. 2,...,л (6.27) Из левой части неравенства (6.23) при р=0р имеем L (z, О₽)=йо (z) < L (z, р) . С другой стороны, поскольку рА^О и справедливо нера- венство Р*(Л*(*)-!)<О* А=1. 2...А (6.28) и поэтому ло (z) > L (г, р) = й0 (z) + Р* (Л* (z) — 1). Л-1 Таким образом, выполнено равенство ho(z)=L(zt р), а значит, 2 !**(*»(») Л-1 Отсюда в силу (6.28) вытекают равенства (6.27). Теперь, учитывая (6.27), равенства (6.26) можно записать так: й=1, 2,...,/?. В соответствии с этим равенства (6.24) после выполнения замены (6.22) принимают вид jcS^/Zo(-*) ПРИ CiXiHX2i2 • - Xnin ' 2 ПРИ 1 е Л’ й=1, 2,...,^. В этом случае основная лемма геометрического программирования гарантирует выполнение равенства (6.25). Первое утверждение тео- ремы доказано. 159
Проверим справедливость второго утверждения. Необходи- мость. Пусть векторы S и 6 — оптимальные решения задачи гео- метрического программирования и двойственной задачи геометри- ческого программирования соответственно. В силу доказанного пер- вого утверждения для данного вектора х можно указать оптималь- ное решение б* двойственной задачи, причем будет выполняться равенство ft>(z) =£($*)• Очевидно, о(б)=о(б*), поэтому верно ра- венство fo(x) =v(6). Применяя вторую часть основной леммы гео- метрического программирования и используя последнее равенство, приходим к требуемым равенствам (6.21). Достаточность. Суммируя первые равенства (6.21) по /е/о, получаем fo(£) = o(d), откуда в силу замечания к основной лемме геометрического программирования следует оптимальность решений х и z Если оптимальное решение б двойственной задачи найдено, то с помощью равенства (6.21) можно определить оптимальное решение исходной задачи геометрического программирования. Для этого обычно равенства (6.21) логарифмируют, в результате чего они превращаются в систему линейных уравнений относительно лога- рифмов неизвестных, т. е. относительно Inxt, 1пхз, ..., Inicn- Таким образом, как показывает теорема 6.1, найдя оптимальное значение двойственной задачи, при достаточно общих условиях мож- но быть уверенным в том, что тем самым найдено оптимальное зна- чение исходной задачи геометрического программирования. Для то- го чтобы по оптимальному решению двойственной задачи опреде- лить оптимальное решение исходной задачи геометрического программирования, нужно решить указанную выше систему линей- ных уравнений. 2. Пример использования теоремы двойственности. Вернемся к задаче (6.4) из § 6.1. При si = l, x2=2t х3-=1 ограничение в этой задаче выполняется как строгое неравенство, т. е. условие Слейте- ра теоремы 6.1 выполнено. В конце § 6.1 было установлено, что со- ответствующая двойственная задача имеет единственное допусти- мое решение 6= (1/10, 3/5, 3/10, 4/5)т, компоненты которого поло- жительны. Согласно первому утверждению теоремы 6.1, оптималь- ное решение этой задачи геометрического программирования, а также оптимальное решение двойственной задачи существуют. По- скольку 6 — единственное допустимое решение двойственной зада- чи, оно является и оптимальным. Тогда оптимальное значение двойственной задачи равно г* (в)=vQ= 101'1* (5/ЗЛБ (10/3)3'10. Таким же является и оптимальное значение исходной задачи гео- метрического программирования (согласно первому утверждению теоремы 6.1). Найдем оптимальное решение задачи (6.4), которое J60
обозначим через х=(£ь хз» хз)т. Для этого запишем систему ра- венств (6.21) применительно к данному примеру: X] __vp х2 __ Зуд х8 Зор л] if ха I х2х3 10 * Х1Х3 5 * Х1Х2 10 * Г и прологарифмируем их: InXj-- lnx2— 1пХз==1п-~ — Injq-j- lnx2— lnx3=In— — (пл.— lnx«4- lnxs=ln^-» 10 Inx. — — lnx2+ — inx8—0. 1 4 2 1 2 e 1 Получена система линейных уравнений относительно неизвестных 1пх[, 1пх2, 1пх3. Из первых трех уравнений находим единственное решение: 1пХ|=1п , 1пд*2=:1п — * , 1пха=1п-^- 2 3 Нетрудно проверить, что при этих значениях четвертое из уравне- ний также удовлетворяется. Следовательно, оптимальное решение задачи (6.4) имеет вид 2 3 В данном примере решение задачи оказалось несложным н све- лось к решению системы линейных уравнений. Анализ примера по- казывает, что в.тех случаях, когда m=n~|-l (при условии выполне- ния равенства rang А = л), двойственная задача всегда имеет не бо- лее одного допустимого решения, а значит, оно является оптималь- ным и процесс решения двойственной задачи (тем самым и процесс решения исходной задачи геометрического программирования) сво- дится к решению соответствующих систем линейных уравнений. 3. Схема решения двойственной задачи геометрического про- граммирования. Число т—п—1 (при условии выполнения равен- ства rang А = л) называют степенью трудности задачи геометриче- ского программирования. В случае нулевой степени трудности про- цесс решения двойственной задачи сводится, как указано выше, к решению системы линейных уравнений. Если степень трудности не- нулевая (т. е. т>л+1), то совместная система ограничений двой- ственной задачи имеет бесчисленное множество решений и сразу записать оптимальное решение двойственной задачи невозможно. 6-ззэ 161
В таком случае поступают следующим образом. Вместо двойствен- ной задачи решают задачу вида In v (6) —»max; Лт6=0т, Si + SaH-...+U= h »>0m, (6.29) которая отличается от двойственной задачи видом целевой функ- ции. Она эквивалентна двойственной задаче в том смысле, что каждое ее оптимальное решение является оптимальным решением двойственной задачи и наоборот. С вычислительной точки зрения преимущество задачи (6.29) в сравнении с двойственной задачей раскрывает следующее утверждение. Лемма 6.5. Функция 1п о (б) является вогнутой при 6>Gm. Доказательство этой леммы можно найти в [91. Итак, задача (6.20) является задачей вогнутого программиро- вания, и поэтому ее решение в смысле вычислений проще, чем ре* шение двойственной задачи, целевая функция которой не обладает свойством вогнутости. Иногда удается, не решая двойственную задачу, получить до- вольно точное представление о ее оптимальном значении. Пример [10]. Пусть нужно минимизировать позином /о (л)= *L »4- 20x^3 -|- XI ух2х3 при условии I___I 4 У *2 - f 3x^2 Зх3 Это ограничение удовлетворяет условию Слейтера. Ранг матрицы экспонент равен 3, поэтому трудность данной задачи равна 5—3—1 = 1. За- пишем двойственную задачу: ^<+8, тах; — ®i "Ь ^2 4“ —2и4.=о, 81-Нз - + 4" 85 0, Л Лг — 514"52_|_®3 — &5 = 0. 814"52-|-6з—1, S5 0. 162
Используя ограничения-равенства, любые четыре двойственные переменные можно выразить через оставшуюся переменную*. Вы- разим двойственные переменные, например, через 62- 6j —1—&-Jt 63=^2, о<=---(6.30) * Эти равенства, в частности, показывают, что в данном примере двойственная задача — это задача, в которой независимой являет- ся только одна переменная 62» т. е. число независимых переменных двойственной задачи равно числу степени трудности (последнее утверждение имеет место и в общем случае, когда степень трудно- сти больше 1). Все двойственные переменные должны быть неотрицательными, поэтому переменная 62 может изменяться в пределах 1/4^62^1/2. При 62=3/8 значения всех двойственных переменных положитель- ны, значит, оптимальные значения /о (ж) задачи геометрического программирования и v (6) двойственной задачи существуют и рав- ны: /о(я) =f(6). Найдем теперь верхнюю и нижнюю оценки этих значений. Для этого рассмотрим несколько допустимых (пробных) решений задачи геометрического программирования, например х(Ч=(1, 1, 4)т, х<2>=(1, 1,3)’ ^=(1, 1,5/2)», х<<)=(1, 1, 17/18)’, и вычислим соответствующие значения целевой функции: /о(х(1*) = = 170; /0(я(2)) -133,3; fo(xt8>) = 116; f0(xW) = 103,82. Очевидно, опти- мальное значение исходной задачи не превосходит наименьшего из полученных значений, т. е. /о(х) ^103,82. Далее, поскольку 1/4^62^1/2, возьмем несколько пробных значений для 6г, напри- мер б2(1>=1/4, 62<2,=3/1О, 62{3,=7/2О. Согласно (6.29), получаем сле- дующие три допустимых решения двойственной задачи: б<1) = (1/2, 1/4, 1/4, 0, 0)т; 6^ =(2/5, 3/10, 3/10, 1/10, 1/5)’, 6<3>= (3/10, 7/20, 7/20, 1/5, 2/5)т. Вычисляя значения функции v(6) в этих точках, найдем: v(6(l>)=80, u(6(2f) =90,9; u(6t3)) =97,14. Оптимальное зна- чение двойственной задачи не может быть меньше наибольшего из этих значений, т. е. и(6)^97,14. Окончательно приходим к оценкам 97,14^1» (6) =/о(х) 103,82, которые позволяют сделать вывод о том, что оптимальное значение /о(х) равно 100 с погрешностью не более чем 4%. § 6.4. ПРИКЛАДНЫЕ ЗАДАЧИ 1. Задачи выбора оптимальных размеров контейнера. Для пе- ревозки строительного материала, например гравия, требуется наго- товить открытый контейнер. Объем гравия, подлежащего транспор- тировке, равен V, а стоимость одной перевозки составляет С. Кро- ме того, заданы а, b и с — соответственно стоимость единицы пло- щади днища, боковой и торцовой поверхности. Контейнер большого • В общем случае, если степень трудности задачи геометрического программи- рования равна из ограничений-равенств двойственной задачи m—I двойственных переменных можно выразить через оставшиеся I переменных. 6* 163
размера позволяет уменьшить число рейсов, значит, и расходы по перевозке. При этом, однако, велика стоимость самого контейнера. Контейнер небольшого размера стоит недорого, но возрастают рас* ходы на транспортировку. Следует определить оптимальные разме* ры контейнера х, у, z (длину, ширину, высоту), при которых сум* мирные затраты на транспортировку и изготовление контейнера бы- ли бы минимальными. Число рейсов равно V/(xi/z), а стоимость всех перевозок— CV/{xyz). Стоимость днища, боковой и торцовой поверхности со- ставляет соответственно аху» 2bxz, 2cyz. Следовательно, суммарная стоимость (целевая функция), подлежащая минимизации, имеет вид /о(х, yt z)=CV/(xyz)-^axy-[-2bxz-[-2cyz. По условию, имеются только естественные ограничения х>0, у>0, z >0-3 а пишем матрицу экспонент для сформулированной задачи: Ее ранг равен 3. Степень трудности задачи нулевая, так как 4—3— —1=0. Запишем двойственную задачу: (СИД)»» (a/bj)®* (2Ь/ V (2с/V — max; ~ Н"®3 = 0, — 4-Й2 -Ь®4== 0. ®1 "Н2“Нз+84= !• Система ограничений двойственной задачи имеет единственное ре- шение fi|—2/5, 62=63=»б<= 1/5, являющееся и оптимальным решени- ем этой задачи. Оптимальное значение двойственной задачи совпа- дает с оптимальным значением исходной задачи, т. е. min/oU. у. \ 2/0 / \1/О / \ I/O/ \ 1/5/ Первое равенство из (6.21) можно записать в виде ctXil^X2{i ... л®л/Ь/=г>(г) при i & Jo. Отсюда получаем = 5аху= Wbxz= lQcyz — 5 {C^V^abc}1^. 2х у2 Следовательно, оптимальное решение исходной задачи имеет вид х = "в(СУ z=-±- (CVa3/(b2c2))^. 164
На основе полученного решения нетрудно подсчитать, что 40% об- щей стоимости составляет стоимость перевозок, а 60% приходится на стоимость контейнера. Рассмотрим теперь другой вариант задачи о контейнерах. Пусть продукция предприятия перевозится в закрытых контейнерах, кото- рые на предприятие не возвращаются. Ежемесячно отправляется 1000 м3 продукции в контейнерах, длина которых х, ширина у и вы- сота z (м). Днище и торцовые поверхности изготовляются из отхо- дов и на их изготовление не требуется затрат. Однако ежемесячно может быть использовано ие более 10 м2 отходов. Стоимость квад- ратного метра боковой поверхности составляет 0,2 руб., а квадрат- ного метра крышки— 0,1 руб. Стоимость транспортировки одного контейнера составляет 0,5 руб. Найти оптимальные размеры кон- тейнера, при которых суммарные затраты минимальны. Суммарная стоимость выражается функцией , , ж Л к 1000 . Л л 1000 . п . 1000 500 , 400 100 /о(А !/. -г)=0,5-------|-0,4jcz-----h 0,lxi/-----------1-------, xyz xyz xyz xyz у z а ограничение на использование материала при изготовлении дни- ща и торцовых поверхностей имеет вид xy+2yz^. 10. Итак, получа- ем следующую задачу геометрического программирования: 500x~ly_,z~I-|-400^”14-100z-1—*min; 0,lxj/+0,2yz< 1; X, у> z>0. Степень трудности задачи равна 5—3—1 = 1. Составляем соответст- вующую двойственную задачу: v (8) = (500/Б,)’ * (400/82)’* (Ю0/Вз)в* (0,(0,2/85)в> (84+М — max; — 8i + 64 = 0, —8j—82+^4+85=0, — 81 — 83+85 = 0, Bj +82+83= 1, 81( S2.85>0. Из ограничений-равенств находим В2=1/2, 83=1/2-^, 84=6j, B5=l/2. (6-31) В соответствии с этим получаем \ В. / \ 1/2 — 6j / Логарифмируя эту функцию, а затем дифференцируя и приравни- вая производную нулю, найдем значение 61 —1/V 12 — 0,29, достав- ляющее максимум функции & (61). Из (6.31) находим оптимальные значения остальных двойственных переменных62—65=0,5, 6з~0,21, 6<=»0,29. Теперь на основании равенств (6.21) можно определить оптимальное решение: я—1,56 м, у—2,31 м, г—1,38 м. 165
2. Проектирование гидравлического цилиндра минимального диаметра, На рнс. 6,1 изображена схема тидравлячёского ЦНО1|Д‘ ра, предназначенного дгя создании значительных усилий, ннпри- мер и подъемниках. Подъемная сила f и толщина i стеной .цилинд- ра не должны быть меньше Неко- торых заданных значений F й Т. г. е, f~^F, Давление жидко- сти д и напряжение в стенках з же должны превышать заданных значений: р<Р, д<$. Сила, дав- ление и внутренний диаметр цй- линдрэ связаны равенством /«= ^ л4^р/4, а напряжение в стенках определяется формулой —Jp/fEf), При указанных огра- ничениях требуется спроектнро- с наименьшим возможным диамет- ром d p2t * Записываем задачу геометрического программирования IP ।: с в. Р ваш гидравлический цилиндр + 2/ - - min.; (6ЛЙ) где первые два неравенства соответствуют требованиям и s<S. Переменны!© 4 р и / считаем положительными.,. Соответству- ющая двойственная задача имеет вид ёл——0» ®j—81, — К — ®з” I т- - * = 0> 8141 Ь (6.33) 8.5 Можно проверить, что, например, значения ?=р/(Г + U 7=Г4-о+ь 2=2^(Г+1нГ4-’^. где o^lFP/;iSa(T+lJ]K удовлетворяют всем ограничениям' зада- чи (6..32) в форме строгих нерёземств, а положительные значения &’j= 85=0,1, 85=0,6' удовлетворяют всем огр.аымчемня.м двойственной задачи (6J33). Следовательно, .при любых фиксированных положительных числах F, A S, Г* согласно теореме двойственностн, задачи (5.32) и (6.33) имеют оптимальные решения, причем! оптимальные значения обеих задач оовйадают, Трудность исходной задачи равна 5—3—1 =2, поэтому опти- мальное решен не двойстве® ной задачи получить не просто. Но мы I6v
и не будем решать двойственную задачу. Найдем оптимальное ре- шение исходной задачи, используя «простую структуру» ограниче- ний задачи (6.32) и второе утверждение теоремы двойственности. Для этого выразим все двойственные переменные через б3 и 64: Bj = 2o3 — 8j= 1—2&з65=83 8§= 1 2В3. (6.34) Как и ранее, оптимальные значения исходных _и двойственных пе- ременных будем обозначать через d, р, t и 61, 62. ---.6e- Ec.4H"6j = 0, то равенство в (6.21) при 7=1 принимает вид 5= =0*с,(6)=0, что противоречит условиям задачи. Следовательно, 6?=#=0. Аналогично можно установить справедливость неравенства 62#= 0. Выполняется и неравенство бзТ^О, так как в противном слу- чае из первого равенства (6.34) и условия неотрицательности двой- ственных переменных следовало бы, что б|=0. Рассмотрим случай, когда б4=#=0, 65^0, 6«¥=0. Равенства (6.21) здесь принимают следующий вид: d=lyv (в), 27=8^ (б), _4£___ I dp .1 1 _L ’ 23? ” ’ Р ’ t (6.35) Отсюда, используя третье, пятое и шестое равенства, найдем d=2(F/(nP))1/2, р=Р, (6.36) Для полученных значений переменных должно быть выполнено и четвертое из равенств (6.35), т. е. (F/(nP))71 Р/(57') = 1. В этом случае всегда можно подобрать такие положительные числа 6|, 62,6б, которые были бы допустимыми в двойственной задаче и вместе с числами J, р, t вида (6.36) удовлетворяли всем шести ра- венствам (6.35). Следовательно, согласно второму утверждению те- оремы двойственности, решение вида (6.36) является оптимальным. Если 64=0, бь^О, 6б=5^О, то согласно (6.21) и равенству 6д=0 четвертое из равенств (6.35) может не выполняться. Но оно для по- лучения значений (6.36) и не использовалось. Поэтому решение (6.36) также является оптимальным, если для него второе из нера- венств (6.32) выполняется как строгое неравенство, т. е. если (F/fnP))^ P[(ST)<\. Объединяя рассмотренные случаи, приходим к следующему вы- воду: если FP/(nSaTa)Cl, то решение вида (6.36) является опти- мальным. Из равенств (6.34) следует, что если б4=0 и верно хотя бы одно из равенств 65=0 или б«з0, то выполняются равенства 6|=0 или 62=0 соответственно. Этот случай можно исключить из даль- нейшего рассмотрения. Проанализируем оставшиеся возможности. Пусть 64^0, 65=0, 6б#=0. Из ограничений двойственной задачи (6.33) следует, что 167
это имеет места тогда и только тогда* когда 6i<l/2. Так как Й5=0, ТО' пятое из равенств (635) может Нарушаться, Поэтому из треть.* его, четвертого и шестого равенств (6.35) находим 2—аг/^г)1=г» д=я$т*/а Ьа основания второго утверждения теоремы двойствен кости, это решение является оптимальным, если: р<Р (т е. если. FP/(ть4^Р)> >1), при однойр-емен'ном выполнении требования 6i<l/2t которое равносильно неравенству F/(jtST®)<L Пусть З*/О, Из страничений двойственной задачи (ОЗ) следует, что «тот случай возможен тогда и только тогда, когда й'ц>1./2.г Не принимая во ни нм а и не последи ее из равенств (6.35), аз трЕНГ^его, четвертого и пятого равенств находим Г=2(^/<лР))П д=а Полученное решение, по теореме двойственности, является опти- мальным при О Г (т, е. при FP/(jiOT^)>l),, а также гр и условии й^>1/2„ которое равносильно неравенству P<S, Накснед, пусг-> 6А^С^й§=йа—О. Тогда из равенств (6.34) сле- дует, что fi 1=йа =* йз=6ь = 1/2. В этом случае о (й) = 4 (F/ [))11 и из первого, второе и третьего равенств (6.35) на- ходим 3=2 OW4 7= = (F/^S))4 jy-6\ Эт.з решен не является опти- мальным., если одновремен- но имеют место неравенств вв р<Р и 1>Т, т,. е, если S<F и ШгЛЛ) >1 На основания второго утверждения теоремы двой- ственнее ги (необходимость) можн©' ^делать вывод о том, что других оптимальных решений в данной задаче нет. В соответ- CTBHif с полученными результатами оптимальные параметры гид- равлического иилнидра можно рассчитывать по схеме, нзображен- ной на ряс. 6.2. Другие технические приложения геометрического программиро- вания можно найти в [101. а также в книге Д. Уайлда «Оптималь* рое проект и р сван не» ( Мл Мир, г 1).
Глава 7 ЭЛЕМЕНТЫ МНОГОКРИТЕРИАЛЬНОЙ ОПТИМИЗАЦИИ Эта глава занимает особое положение. Она посвящена рассмот- рению многокритериальных задач, т. е. задач оптимизации, в ко- торых имеется не одна, а сразу несколько целевых функций (кри- териев). На практике многокритериальные задачи возникают, ког- да, удается сформулировать и формализовать в виде критериев лишь ряд отдельных требований, предъявляемых к оптимальному решению. «Объединить» эти отдельные критерии в единый, обоб- щенный, критерий не представляется возможным. Нередко к мно- гокритериальным задачам приходят в случае отсутствия полных и точных сведений о решаемой задаче или тогда, когда оптимальное решение следует оценивать сразу с нескольких точек зрения. В настоящее время теория многокритериальной оптимизации сформировалась в самостоятельный раздел теории оптимизации и находит многочисленные приложения в самых различных об- ластях техники, экономики и математики. Здесь введены начальные понятия и сформулированы простей- шие результаты теории многокритериальной оптимизации, дающие общее представление о предмете. Более подробно с этой областью оптимизация можно-ознакомиться, например, в [18]. $ 7.1. НАЧАЛЬНОЕ ПРЕДСТАВЛЕНИЕ О МНОГОКРИТЕРИАЛЬНОЙ ЗАДАЧЕ ОПТИМИЗАЦИИ 1. Общая задача принятия решений. Задача принятия решения состоит в выборе среди множества возможных решений (их назы- вают также вариантами, планами и т. п.) такого решения, которое являлось бы в определенном смысле лучшим, или, как говорят, оптимальным. Удобно считать, что выбор решения производит некоторое лицо, принимающее решение, которое преследует вполне определенные цели. В зависимости от конкретной ситуации в роли лица, прини- мающего решение, может выступать как отдельный человек (инже- нер, научный сотрудник и т. п.), так и целый коллектив (группа специалистов, занятая решением одной задачи). Каждое возможное решение характеризуется определенной сте- пенью достижения цели. В соответствии с этим у лица, принимаю- щего решение, имеется свое представление о достоинствах и не- достатках решений, на основании которого одно решение предпочи- тается другому. Оптимальное решение —это решение, которое с точки зрения лица, принимающего решение, предпочтительнее других возможных решений. Таким образом, понятие оптимального решения связано с предпочтениями лица, принимающего решение. Эти предпочтения на практике выражаются в различной форме, и их математическая формализация может составить сложную за- 169
дачу, поскольку лицо, принимающее решение, как правило, не может ясно и метко сформулировать их. Цель теории принятая решений и состоит я разработке мето- дов, которые 'помогли бы лицу, принимающему решение, наиболее полно' и точно вы разить свои предпочтения в рамках соответству- ющей математической модели и в конечном счете обоснованно вы- брать действительно оптимальное решение, Многекрнтермаль1наи задача оптимизации, Многокритермаль- ные задачи оптимизации, рассмотрению которых посвящена дан- ная глина, вместе со множеством еозлюжяых (додрстшиых) реша- мдой X«=RW включает адбор jje/fiwx функций (называемых также кдцуерцянц) /а., /2, ...... [т, заданных не множестве X. Предполага- ется, что m>h при т--1 задача оптимизации является одаокри- теркалькой. Набор целевых функций 'образует вектор-функцию, ко- торую далее будем обозначить через f (х) ^(ЬЙК teW-— Jm(xf). .Наряду со множеством допустимых решений X удобно рас- сматривать множество У=/(Х) = {^ёК,я I и=/(.*), при некотором л = Х},( (7*1) деивя о том, что желательно целевые которое называют множеством оценок, я его .элемента—оценками. Часто пространство R*,. в котором содержится X, называют прост- родством а пространство Rw, я котором содержится У, — пространством оцешж ил и нрдг.ерд£1ль<ылг пространством. Каждому решению хёХ соответствует одна вполне определен- ная оценка е/=/(<)еУ. С другой стороны, каждой оценке У отвечают те решения ХС.Х (их может быть и более, одного), для которых ,f(x)*$ (рис. 7.1). Таким образом., между множеством X и У имеется тесная связь, и поэтому выбор решения из X в указанном смысле р а в носнЛ'е н з ыбор у соот - ветел вующей оценки из У Е отличие Ст общей задачи принятия решений г мзоаокритернальцоЛ за- даче оптимизации зара- нее известна определен- ная информация о пред- почтениях лица, афиняма- юадего решение,. Это сне- функции максимизировать (или мннцмизировгть). Ирл этом может быть нивестна м исполь- зована и различная дополнительная информация о предпочтениях.. Для Олиса Имя предпочтений лица, приинмающегО' решение, ис- пользуют математическое понятия, называемое отношением, ^оч- ному определению: и. изучению отношений посвяшен следующий парщрдф. 170
§ 7.2. ОТНОШЕНИЯ 1. Определение отношения. С простыми примерами отношений мы уже встречались, когда для сравнения вещественных чисел использовали знаки <» ^» =• Применение этих символов предполагает наличие пары чисел, одно из которых записывается слева от символа, а другое — справа. При этом говорят, что данные числа находятся в некотором отношении друг относительно друга (первое число больше второго, первое число больше либо равно второму и т. д.). В определенных отношениях могут находиться не только числа, но и более сложные объекты, причем отношения между ними но- сят различный характер. Дадим строгое определение отношения. Пусть А — некоторое множество. Образуем декартово произведение А^А— множество всех упорядоченных пар вида (а, д), где а^А, Ь^А. Отношением К, заданным на множестве А, называют подмножество множества АХЛ, т. е. такое множество R, что Если выполнено соот- ношение (a, £)&/?, то говорят, что элементы а и b находятся в от- ношении R, и при этом пишут aRb. Заметим, что декартово произ- ведение— это множество упорядоченных пар, поэтому запись aRb и bRa означает не одно и то же (за исключением случая а=Ь). На одном и том же множестве А могут быть заданы различные отно- шения в зависимости от того, какие именно пары (а, Ь) составляют множество R. В частности, множество R может не содержать ни одной пары, содержать все возможные пары, т. е. J?=AxA, вклю- чать только пары из одинаковых элементов (а, а) {отношение ра- венства). Рассмотрим примеры отношений. Пусть A = Rn. Уже встреча- лись отношения и >, заданные на Rn: а >Ъ означает, что а^Ъ^ 2,..., л; означает, что а^Ь^ /=1,2,..., л, где а= (дь а2, ..., ап), Ъ= (Ьь .... йп). Далее будем использовать еще одно отношение на R". а>_Ь означает, что а^Ь и афЪ. Таким образом, а;>Ь имеет место тогда и только тогда, когда i=l, 2,...,л, причем хотя бы для одного номера te{l, 2..., п} выполняется строгое неравенство При л=1 отношение > совпадает с отношением > для чисел. При т=2 неравенство а^>Ь геометрически означает, что точка а находится в заштрихованной области, имеющей форму прямого угла с выколотой вершиной Ь, стороны которого параллельны координатным осям (рис. 7.2). А точка а, для которой выполняется неравенство а>Ь, является внутренней точкой такого угла. Если А — это множество всех прямых на некоторой плоскости, a R составляют пары прямых, не имеющие ни одной общей точки, то R не что иное, как отношение параллельности прямых. 171
Если А—множество людей, то на этим множестве можно за- дать, папрчмер. отношения «валяется родственинком», «старше, чем» и т. п. На .множества А автомобильных двигателей внутреннего сгора- ния одинакового объема можно ввести -отношение. Д: «белее эконо- мичен, чем», А именно; соотношение яМ (двигатель я более экономичен,, чем fej верно тогда и только тогда, когда у двигателя д меньший рас- ход горючего, че^ у .двигатели L Так как отношение-—это некото- рое множества, то к различным, от- ношениям, заданным на одном и том же множестве, можно приме- Ряс. ?.2 пять все известные теорегико-юо жественные операции.. В частности, можно рассматривать объединение, пересечение и разность двух отношений. Например, отношение 25 Для чисел* представляет со- бой объединение отношений > '0 отношение = есть, пересече- ние отношений и С а ыношваие для векторов из R* (л> >1) представляет Собой рая несть отношений п =—. 2. Типы отношений. Тот или иной тип отношения подучается в зависимости от того, .какими свойствами обладает данное отреше- ние, Приведем наиболее важны® типы отношений. Отношение J? называют рефлексгдекы< если а₽а верно для любого д<=Л. Примерами рефлексивных отношений служат отно- шения равенства « и неравенства я a R". Отношение R называют иррефлвкедаяьш, если а/? о не может иметь места ни для какого аеА. Например, отношения. > и яррефлекемвны на пространстве Ю, а отношение «старше, чём» :мррефлексивно на множестве., элементами которого являются люди, Отношение .*? называется сылЕ.ьягрпчныж, если для Произвол ь- ной пары л ^=А из выполнения яВД1 всегда следует выполнение Ьй*?; если для произвольной пары п* fi&A из -спра- ведливости oRfr вытекает, что не выполнено, и дн/мендшет/шч- код, если для произвольной' пэры .с, яыподнеяне двух, соот- ношений «Яй и всегда, влечет совпадение а и Так, на соответствующих множествах отношеиня равенства и парад дель- ности симметричны, отношения > и £ асимнетртчны, а от1"оше- нне X- аитнеимметркчно. lie все перечисленные типы отношений независимы, Например, если отношение R1 асимжётрпчно, то от и нр'рёфлёкгильо, В самом деле, если оно не. паяется иррефлвкенвным,, то для некоторого ылемевта ашА выполнено соотношение аКр, откуда в силу аенм- мегричкости следует, что соотношение йЯп ие должно иметь- места, йто противоречие говорит о том, что отношение А* яр рефлексивно.. • Лия вдятьры п6ъедннеи.не кгиошений > н « не сомадает с итвиниением 17.2
Отношение R называют транзитивным, если из -выполнения двух соотношений aRb и bRc, где а, Ь, с^А, всегда следует соотно- шение aRc. Все отношения, приведенные в данном пункте в качест- ве примеров, являются транзитивным к. Рассмотрим на множестве R2 отношение R, определяемое следующим образом: aRb верно тогда и только тогда, когда выполняется хотя бы одно из нера- венств й)>5ь аг>Ьл. Это отношение не является транзитивным, о чем свидетельствует простой пример: справедливо (1,1) TR(3,0)T, (3,0)*/? (2,2)т, однако (1,1) TR (2,2)т не верно. Взаимосвязь различных типов отношений можно продолжить. Так, если отношение R иррефлексивно и транзитивно, то оно и асимметрично. Предположим противное, т. е. что отношение не является асимметричным, т. е. для некоторой пары элементов а, Ь^А, удовлетворяющей соотношению aRb, выполнено соотношение bRa. Из aRb и bRa, согласно транзитивности, следует соотношение aRa, что противоречит условию иррефлексивности. Значит, отноше- ние R асимметрично. Элементы а и b множества А называют сравнимыми по отноше- нию R, если обязательно выполняется соотношение aRb или bRa (может быть и то и другое вместе), и не сравнимыми по отношению R, если не верно ни соотношение aRb, ни bRa. Например, любые два вещественных числа сравнимы по отношению но могут быть не сравнимыми по отношению > (поскольку неравенство а> >а не верно). Если любые два элемента множества А сравнимы по отношению R, то такое отношение называют полным. Если же в множестве А найдется хотя бы одна пара элементов, не сравни- мых от отношению R, то R называют частичным отношением. На множестве вещественных чисел отношение является полным, а отношение >—частичным. Для множества 4 = R" отношение S уже не является полным, так как, например, векторы (1, —1)т и (—1, 1)т не сравнимы по отношению Значит, в этом случае от- ношение является частичным. Если отношение R рефлексивно, антисимметрично и транзитив- но, то его называют отношением порядка (или порядком). Отно- шение порядка может быть полным или частичным в зависимости от того, сравнимы любые два элемента из множества А по этому отношению или же не сравнимы. Так, отношение представляет собой полный порядок на множестве вещественных чисел, а отно- шение —частичный порядок на множестве Rn (л>1). Отноше- ние > на пространстве Rn(n^l) является частичным отношением порядка. $ 7Д. ОТНОШЕНИЯ ПРЕДПОЧТЕНИЯ И НЕРАЗЛИЧИМОСТИ. МНОЖЕСТВО ОПТИМАЛЬНЫХ РЕШЕНИЯ 1. Отношения предпочтения и неразличимости. Выбор решения из множества возможных решений X равносилен выбору оценки из множества оценок У (см. § 7.1), поэтому в этом параграфе для удобства множество возможных решений будем обозначать буквой 173
Z, считая, чго в качестве Z может быть взято как множество X, так и множество У. Прямой выбор некоторого наилучшего (наиболее предпочти- тельного) решения из всего множества Z, как правило, оказывает- ся трудным. Поэтому упростим задачу и выберем лучшее из двух данных решений, что значительно проще (если, конечно, Z вклю- чает более двух решений). Далее, аналогично, выяснив предпочте- ние для каждой пары решений, получим информацию, на основа- нии которой лицо, принимающее решение, произведет выбор ре- шения и из всего множества Z. Для определенности зафиксируем некоторое лицо, принимаю- щее решение. Если из двух заданных решений а и b множества Z лицо, принимающее решение, выбирает решение о, то будем гово- рить, что решение а более предпочтительно, чем решение Ь. Все пары вида (а, Ь), где a, b^Z, для которых решение а более пред- почтительно, чем решение Ь, образуют некоторое множество, кото- рое будем называть отношением строгого предпочтения и обозна- чать символом )>. Указанное множество является отношением, за- данным на множестве Z. В соответствии с этим запись озна- чает, что решение а для лица, принимающего решение, более пред- почтительно, чем решение Ь. Если лицо, принимающее решение, ведет себя «разумно», то от- ношение >- должно быть иррефлексивным. В самом деле, бессмыс- ленно решению а предпочитать то же самое решение а. Более того, естественно считать отношение асимметричным, так как в про- тивном случае могут одновременно выполняться соотношения и Ь>а, что противоречит смыслу. Во многих случаях целесообразно предполагать введенное от- ношение еще и транзитивным. Транзитивность отношения )> означает, что если лицо, принимающее решение, решение а считает более предпочтительным, чем решение Ь, а решение b — более предпочтительным, чем решение с, то из двух решений а и с будет выбрано а. Однако в некоторых ситуациях руководствуются не- транзитивным отношением предпочтения (см., например: Фиш- берн П. Теория полезности для принятия решений. — М.: Наука, 1978). Когда сравнивается по предпочтительности пара решений а и Ь, возможен и такой случай, когда не будет отдано предпочтения ни одному из них. Это заведомо имеет место, если, например, а=Ь. Поэтому имеет смысл ввести следующее определение. Будем гово- рить, что решения а и Ь, где a, b&Z, неразличимы, если не выпол- няется ни соотношение а)>Ь, ни 6)>а. Другими словами, решения а и b неразличимы, если они не сравнимы по отношению Мно- жество всех пар вида (а, Ь), в которых решения а и b неразличи- мы, называют отношением неразличимости (отношением безразли- чия) и обозначают символом Не надо считать, что соотношение а~Ь означает равенство а*=Ь. Если, например, Z=Rrt(n>l) и в качестве отношения > взято ,отношение >, то верно (1,0)т~ (0,1)т, однако (1,0)'г=#= 174
=?^(0,1)т. Соотношение a~b может иметь место тогда, когда лицо, принимающее решение, считает, что в смысле предпочтения для него нет разницы между решениями а и b (в частности, когда а—Ь). Кроме того, неразличимость может быть и в случае, если решения а и b лицо, принимающее решение, вообще никак не мо- жет сравнить друг с другом. Непосредственно из определения отношения ~ следует, что оно симметрично, т. е. соотношение а~Ь равносильно соотно- шению Ь~а. Из иррефлексивности отношения >• следует реф- лексивность отношения ~. В самом деле, если отношение ~ не является рефлексивным, то найдется элемент a^Z, для которо- го соотношение а^а не выполнено. Отсюда, по определению отно- шения следует справедливость соотношения a>a, что несов- местимо с условием иррефлексивности отношения Отношение ~ может не быть транзитивным, даже если тран- зитивно отношение )>. Так, например, для транзитивного отноше- ния на пространстве R2 выполнены соотношения (3, 0)’ — ~(I, 1)т, (1, 1)т~(2, —1)т, однако (3, 0)т^> (2,—1)т, поэтому со- отношение (3, 0)т~ (2, —1)т не имеет места. Итак, для произвольно выбранной пары решений a, b^Z вы- полняется одно и только Одно из следующих трех соотношений: by-at а~Ь. Нередко удобно рассматривать еще одно отношение <не менее предпочтительно, чем», являющееся объединением отношений и Будем называть его отношением нестрогого предпочтения и обозначать Таким образом, соотношение а> Ь обозначает, что имеет место соотношение а^-Ь или же выполнено соотношение а^Ь. При транзитивном отношении >• отношение неразличимости может не быть транзитивным, поэтому и отношение > также мо- жет не обладать свойством транзитивности. Отметим, что > — полное отношение, так как для любых двух решений a, 6eZ вер- но а^Ь или Ь>а (возможно, и то и другое вместе). 2. Множество оптимальных решений. Пусть лицо, принимающее решение, при выборе решения из множества Z руководствуется некоторым отношением строгого предпочтения являющимся асимметричным и транзитивным. Воспользуемся отношением для того, чтобы выделить решения, которые могут быть «лучши- ми», т. е. оптимальными, решениями. Все те решения, для кото- рых найдутся более предпочтительные, следует удалить из Z; их заведомо нельзя считать оптимальными. В результате подобного исключения в Z останутся решения (единственное решение), каж- дое из которых может быть признано оптимальным согласно дан- ному отношению )>. Решение будем называть оптимальным * по отношению на множестве Z, если не существует другого решения zeZ, для * Вместо термина оптимальное решение в литературе часто используют терми- ны максимальное, минимальное, неуличшаемое, недоминируемое решение. 175
которого справедливо соотношение z^^K Используя отношение >, построенное описанным выше способом на основании отноше- ний и можно привести эквивалентную формулировку: реше- ние z^eZ называют оптимальным по отношению если для лю- бого zeZ выполняется соотношение zfoj^z. Множество всех опти- мальных решений множества Z будем обозначать через opt^Z В зависимости от структуры Z и вида отношения множество optyZ может содержать единственный элемент, конечное или бес- конечное множество элементов, а также не содержать ни одного элемента. Пусть непустое множество opt>-Z содержит по крайней мере два элемента. Рассмотрим два произвольных оптимальных реше- ния zf и z". Поскольку ни z'>-z", ни г" >>2' не может иметь места, решения zr и z" неразличимы: z^z". Таким образом, если отноше- ние неразличимости ~ совпадает с отношением равенства то множество opt>-Z (если оно не пусто) содержит единственный эле- мент. Условие совпадения отношений ~ и = является довольно «жестким». Согласно этому условию, для каждой пары решений a, b^Z должно выполняться одно и только одно из следующих трех соотношений: Ъ>а, а=Ь, т. е. решения а и b либо срав- нимы по отношению либо равны друг другу. Сформулируем требования, гарантирующие существование оп- тимальных решений. Теорема 7.1. Если множество Z не пусто и содержит конечное число элементов, а отношение >- асимметрично и транзитивно, то opt>*Z=#:0. □ Доказательство этого утверждения носит конструктивный характер и представляет собой алгоритм нахождения всего мно- жества оптимальных решений. Введем обозначение Z = ZI = {z<11), Если Пу — 1, то Z| = {zf11)} =op(x>ZI. Поэтому далее будем считать П|>1. Первый шаг алгоритма заключается в попарном сравнении ре- шения zf1*) с каждым из остальных решений. Если для некоторого ie{2, 3,..., nJ выполняется соотношение zfn)>-z<H), то решение z(*0 из множества Zi удаляют; оно не может быть оптимальным. В противном случае, т. е. когда либо zf’O^-zt11), решение z<H) сохраняют. После выполнения всех сравнений решение 2<п) также следует удалить из Z(. При этом если ни для какого i=? =2, 3... И) не оказалось выполненным соотношение zO^zf11), то решение zf11) является оптимальным и его нужно запомнить. Остав- шееся в результате удаления множество решений обозначим через Z2= {zf21>, 2(22), , n2<nb Если Z2=0, то решение zf*1) оптимальное (оно хранится в па- мяти), поскольку в силу асимметричности отношения )> из соотно- шения zf|1>>z(li) следует, что соотношение zf^zf11», »=2, 3,..., «ь 176
не может иметь места. В этом случае процедура отыскания множе- ства optyZi закончена. Если же Z^0, то переходят к следующе- му шагу алгоритма. Второй шаг аналогичен первому и заключается в попарном сравнении решения z<20 с каждым из решений а<82\.... z<2n«>.Bce ре- шения z<2i>, для которых из множества Z2 исключают. Кроме того, удаляют решение ztzi>. При этом, если ни для какого i=2, 3...п? не оказалось выполненным соотношение z<2,)>-z<21), то а^еорК^а. Более того, z*2,)eopt>Zi и решение z<2l> следует за- помнить. В самом деле, соотношение z<u')>z(21> не может иметь ме- ста, так как решение z<21) не было удалено из Z] на первом шаге. Соотношение z(H)^>zt20 для z<10gZi\ Z21 iy= 1, также не может быть выполнено, поскольку z<n))»z<lii и отношение )> транзитивно: из и z<U)>-z<31) следует, что г*11’^'20. Оставшееся после иск- лючения множество решений обозначают через Z3={z<s,), z(32), ..., л3<л2. Если z3^t0, то переходят к следующему шагу н т. д. Алгоритм таков, что, согласно транзитивности отношения решение z(A1\ оптимальное на множество Z*, является оптималь- ным на Zk-u fe = 2, 3,а значит, и на исходном множестве Zt. Так как множество Z> содержит конечное число элементов, то через конечное число шагов процедура закончится. Решения, хра- нящиеся в памяти, образуют искомое непустое множество opts^Z Оценим «трудоемкость» сформулированного алгоритма, т. е. оп- ределим наименьшее и наибольшее возможное число попарных сравнений, которое потребуется для нахождения всего множества opt>Z, Наименьшее число сравнений Л]—1 имеет место, если /=2, 3,.... Ль В самом «длинном варианте» придется сравнивать между собой все возможные пары решений, и поэтому максимальное число сравнений равно ni(nt—1)/2. $ 7.4. МНОГОКРИТЕРИАЛЬНЫЕ ЗАДАЧИ ОПТИМИЗАЦИИ. ПАРЕТО-ОПТИМАЛЬНЫЕ ОЦЕНКИ И РЕШЕНИЯ I. Согласованность отношений предпочтения на множестве ре- шений и на множестве оценок. Пусть целевая векторная функция f(x) = [fi (х), fs(x),..., fm{x)) определена на множестве допустимых решений XczRrt. Данному множеству X при отображении f соответ- ствует множество оценок У, определяемое равенством (7.1). Будем полагать, что на множествах X и У заданы отношения строгого предпочтения и соответственно. Каждому решению х^Х соответствует определенная оценка y=f(x)^Y, и, наоборот, каж- дой оценке у соответствуют такие решения х, для которых f (х) =у, поэтому указанные отношения согласованы друг с другом: y^lf имеет место тогда и только тогда, когда где y=f(x) и у*= =f(x'). Следовательно, результаты, сформулированные в терми- 177
flax оценок, могут быть переформулированы применительно к ре- шениям, и наоборот. В данном параграфе рассмотрены «минимальные» требования к указанным отношениям предпочтения, на основании которых полу- чена оценка сверху для искомого множества оптимальных решений (оценок). Под оценкой сверху будем понимать подмножество ис- ходного множества возможных решений (оценок), которое содер- жит множество оптимальных решений (оценок). 2. Аксиома Парето. Многокритериальные задачи. Рассмотрим две произвольные оценки у, y'eRm, которые связаны между собой неравенством у>у' (т. е. у^у' и y^if). При этом оценка у может оказаться для лица, принимающего решение, предпочтительнее, чем у'. Многокритериальная задача максимизации характеризует- ся тем, что оценка у всегда предпочтительнее оценки у', если толь- ко у^у'. Иначе говоря, в многокритериальной задаче максимиза- ции считают выполненной следующую аксиому. Аксиома Парето* (в терминах оценок). Для любых двух оце- нок у, y'^Y, удовлетворяющих неравенству всегда выполне- но соотношение у^у'. Аксиома Парето (в терминах решений). Для любых двух реше- ний х, х'еЛ', для которых верно f(x)^f(x')t всегда имеет место соотношение х^х'. В многокритериальной задаче минимизации считают, что для двух произвольных оценок у, у'^У, связанных неравенством у>у', всегда выполняется соотношение Для определенности огра- ничимся рассмотрением задач максимизации (полученные резуль- таты и выводы можно легко переформулировать применительно к задачам минимизации). Аксиома Парето накладывает определенные требования на ха- рактер отношения предпочтения в многокритериальной задаче мак- симизации. А именно: для лица, принимающего решение, жела- тельно по каждому из критериев Л, /а.fm получить по возможно- сти большее значение, т. е. максимизировать каждый из критериев. Точка максимума на множестве X одновременно всех функ- ций fi, заведомо является оптимальным решением много- критериальной задачи максимизации. Однако на практике этот случай имеет место крайне редко, так как такой точки максимума, как правило, не существует. Поэтому при отсутствии дополнитель- ной информации о предпочтениях и f в многокритериальной за- даче удается лишь указать определенную оценку сверху для иско- мого множества оптимальных решений. 3. Парето-оптимальность. Согласно аксиоме Парето, в много- критериальных задачах отношение >• играет важную роль. Поэ- тому множество оптимальных оценок по отношению на мно- * В. Парето (1848—1923) — итальянский экономист и социолог. 178
жести е У имеет специальное натвзнке: яшядестзд гарего-смт»- мяльных (олгинольмых по Лодато) или эффективных овдеда^ Это множество1 обозначают через Р(У), Используя символику, приня- тую э § 73, но определению можно записать: Р(У)^=ор<>К Далее будем использовать обозначение Р(7). Таким образом, включение имеет место тогда и только тогда.,, кода не существует оценки реУ, для кото рей било бы выполн ен о не раненом ,у'й.^'33* При т=1 от ношение ?> превращается l отношение > для чи- сел и Парето’оптимальная оцени а совпадает с максимальный эле- ментом числового множества, Ус Й. Если т=2 (т. е, имеется два критерия), то множество Р(У) имеет простую геометрическую интерпретацию пространстве (рис, 7.3). Для изображенною на этом рисун- в критериальном ке мнсжестьа У иаретэ-епти- мальные оценки состоят из то- чек. кривой 6с {исключая точку с) и линии fife. Образно гово- ря, Р(У) является «север©-вис* точной» границей множества 7 без тех ее частей, которые параллельны одной из коордн- ватных осей или же лежат в «глубоких провалах», Для то- го чтобы' убедиться к этом, го- ст? точно- вспомнить, что все 7ш3 точки f/czR2,. для которых вер- но неравенство образуют прямой угол, стороны которого па- раллельны координатами осям, а вершиной является точка х/ (см. рис. 7,2). Поэтому если для точки y'eF указанный угод располо- жен вне множоства. У, то эта точка парвто- оптимальна, в про г ин- ном случае она таковой не будет. Решение для. которого справедливо включение = ?=/(.xW)g=P(F)( называют паретомэдгйдальибш. Г отгадал ьыыд л о Пйрйто) или эффективные ремдемдеик относительно вектор-функция /ня множестве X. Множество зсех таких решений обозначают че- рез Pj(X). Таким образом,, включение x1&JigPj(.X) имеет место тог- да и только тогда, когда не существует хоХ такого-, что выполня- ет-ея неравенство /(х) Если ж«1, сформулированное определение парето-егтималь- мого решения' превращается в определение точки максимума число- вой функции ft* Таким образом, понятие парето-оптималъной точки можно рассматривать как обобщение понятия точки максимума функции на случай нескольких функций. Для функций ft к /а, изображенных, ьа рис. 7.1» множество' Pf(X) представляет собой отрезок, который соединяет точки мак- симума данных функций (одна из них на рис... 7.1 обозначена бук- ной г*’). Для функций, изображенных на рис. 7.4, имеем Га» di 179
Из аксиомы Парето вытекает следующее утверждение. Следствие 4.L уключеиыя F е Р (Г)» орК, X а. Р/ (XX (7.2) LJ Проверим пер все включение, Пусть ^eopU/'. Предпола- ’жим противное, т... е. что огда найдется такая оценка у^У, что Согласно аксиоме Парето,, отсюда вытекает со- отношение а значит,. ^0Мор1>К Это противоречит на- чальному условию. Следовательно, выполнено включение оР(У). Аналогично можно проверить справедливость второго включения. Согласно включениям (7,2), множества Р(У) и jPf(X) представ- ляют собой оценки сверку для множества орк»-У и орКЛ соответ Put* T/ll ственио, Следовательно, в много- критериялььой задаче окенча- тельный выбор оптимальной оцен- ки (оптимального решения) дол- жен производиться в пределах мкс ж ества лир ето оптима л ыных. оценок (решений). Вне множест- ва Р'(У) (соответственно1 РН^))1 оптимальных оценок (решений) быть не может.. 4. Слабая аксиома Парето и ела б ая папетонопти мальв ость. Часто дли тога чтобы было можно рассматривать более, широкий -класс задач чиксии.иаадни, вместо аксиомы Парето принимают ее <осл а бленный» в а риант. Слабая аксиома Парето, Для любых d'ayx osjfwoK у, /еУ (dayx решений х, УеХ) из ашюл нения недяденсз-од ,у>'У (яерйоанстоа f (jk) >,f (У)) всегда следует, что у /(х > У), По аналогии с оптимальными. но Парето оценками и решениями наедят слабо олгшнольный1 ио /йзрето (слабо аффективные) оценки F решено, Множества, которые они составляют» обозначают соот- ветственно через 5 (У) и 5/(Х). Таким образом, 5(У) ^opt У„ я включение x^oSj (X) .выполняется тогда и только тогда» когда не Существует решения хеХ, для которого верно неравенство f(x)> Неравенство у>У Представляет собой частный случай вер а вен- ете а .поэтому1 на выполнения в кейсы и Парето вытекает вы- полнение слабой аксиомы Парето, но не наоборот. На этом же Ос- новав ни имеют место! включения Л (П с:. (П, Pz (X) <- Sj. (X)» (Па) которые свидетельствуют о том, что множество слабо ептвмальных по Парето оценок (решений) может быть разве что шире множест- ва парето-оптимальных гщенок (решений). JK
Для множества У, изображенного на рис. 7.3, множество S( У)— это объединение кривых аос и def (включая точки а, с, d, f)t т. е. это множество Р(У) вместе с точкой с и теми участками северо- восточной границы множества У, которые параллельны одной из координатных осей. Для случая, изображенного на рис. 7.4, Sf(J)=X=[a, d], так как ни для какой точки d] нельзя найти такую другую точку х, чтобы выполнялись оба неравенства 5. Условия оптимальности по Парето. Множества парето-опти- мальных решений и оценок, а также слабо парето-оптнмальных решений и оценок играют важную роль в теории многокритериаль- ной оптимизации, поэтому рассмотрим их более подробно. Приведем достаточные условия оптимальности по Парето и слабой оптимальности по Парето. Говорят, что числовая функция Г (у), определенная на множест- ве УсКт, является возрастающей по отношению > (по отноше- нию >), если из выполнения неравенства у^у' (неравенства у> >t/') для векторов у, tf^Y всегда следует справедливость нера- венства F(y) >F(y'). Это определение представляет собой обобще- ние понятия возрастающей функции одной переменной на случай функции многих переменных. Функция Г, возрастающая по отно- шению на множестве У, является возрастающей и по отношению > на том же множестве. Теорема 7.2. Пусть функция F(y) определена на множестве оце- нок y<rR/". Для того чтобы точка yW^Y была оптимальной по Па- рето (слабо оптимальной по Парето) оценкой, достаточно, чтобы она являлась точкой максимума на множестве У функции F(y), возрастающей по отношению 7> (по отношению >). □ Доказательство проведем для парето-оптимальных оценок, так как для слабо оптимальных по Парето оценок рассуждения аналогичны. Пусть, по условию, и F(^0))>F(у) для всех y^Y. (7.4) Предположим противное, т. е. что для некоторой оценки у'еУ вер- но неравенство у'^уЮ. Отсюда, поскольку функция F возрастаю- щая, получаем неравенство F(y')>F(yW), которое противоречит (7-4). Теорема 7.2 сформулирована в терминах оценок. Однако ее можно переформулировать и в терминах решений. Так, если функ- ция F(у) возрастает по отношению и х<°>—точка максимума функции FГ/(х) ] ==.F[A (х), f2 (х),..., fm (х) ] на множестве X, то f (х<0>)еР(Г), а значит, и x<0)^Pf(X). Приведем примеры различных возрастающих функций многих переменных. Я1 1) Функция F(ylt у2,...,ут)— является возрастающей по t-i 2 отношению ;> на всем пространстве Rm, если все числа щ, цг,..., pm 181
положительны, и возрастающей по отношению >. когда все ука- занные числа не отрицательны и хотя бы одно из них положитель- но. Следовательно, согласно теореме 7.2, максимизация функции1 1Л (*) на множестве X в первом случае приводит к парето-оп- тимальиому решению, а во втором — к решению, слабо оптималь- ному по Парето. В частности, при и ц/=0, / = 1, 2...т\ =/=1, получаем, что всякая точка максимума функции fi(x) на мно- жестве X является слабо оптимальным по Парето решением. т 2) Рассмотрим функцию F(yit = П У*1 ПРИ положи- i—1 тельных фиксированных числах jn, да,... Пусть y>iy'>0m. Тогда справедливо неравенство у** (у^дяя всех i= 1, 2,...,/и, причем хотя бы для одного i имеет место строгое неравенство. Сле- довательно, лз т П»?'>П wn. 1-1 /-1 m а значит, функция [] у<1 является возрастающей по отношению t-i на множестве R> == {yERm|y>0m}. Аналогично можно проверить, что при неотрицательных фиксированных числах щ, р2,.... цт, средн которых есть хотя бы одно положительное, указанная функция яв- ляется возрастающей на R> по отношению >. 3) Рассмотрим функцию F(yti yz,..., Ут} = при фик- сированных положительных числах щ, ра,..., р«- Если /, г= = 1, 2...т, то и i=l, 2...m. Отсюда следует нера- венство minp^> mlnp^k i i свидетельствующее о том, что рассматриваемая функция является возрастающей по отношению > на Rm. 4) Пусть у^у'- Следовательно, верно неравенство у*—у'^У*— —у. При y*.>sup yi, i= 1, 2,..., т, отсюда имеем #€Г Значит, функция F(yi, уг,..... 1/2 является воз- растающей по отношению > и, по теореме 7.2, минимизация функ- 162
я дни на множестве У приводит к парето-оятимнлынш оценкам. Приведем необходимые у с д о в о я оптимальности по Пар сто и слабой оптимальности по Парето* Заметим, что ь силу включений (7.3) любые необходимые условии слабой огтнмально- сти по Парето являются также и необходимыми условиями еарети- оптимальности. Теорема 7.3, Лдость ляождегвсг Jf выпукло & все.- кодаоменты fln fa, Jin еёКтор*ф-р«К4мц f ма множеству X Для того «тобы рсщедме слабо олтилсальнэдк по Парето Й зяачцг. и йарето-опшмоьйьииЛ деоблодяио, чтобы с^естёооала числа Щ >0, >= 1,2,..., т, у г,= 1 вижчс, «ио Л1 V t>l/,(^°»)=max Я ieJC У н</< W- :-1 *а убывает, поэтому S-,(X) Доказательство теоремы нсжео найти и [18]* При т=2 утверждение теоремы 7*3 допускает простую- геомег- рическую интерпретацию- г критериальном пространстве (рис* 7.5). Для всякой слабо оптимальной по Парето оценки можно по- добрать вектор ц= (я» Нз) ёЛи <Pi+p®= 1. такой, что линейная функция <р, р} достигает макси- мума на множестве У в точке На рис, 7.5 вектор р приближен к точке /А Требование вогнутости функ- ций ?ь fs- *» fm ь последней тео- реме является существенным. Ъ этом убеждает следующий про- стой пример. Пусть n=.t, m=2B 1], МхНх, Ь(х)=е- Функция /| возрастает, а функция ^РдгХ)=[0# Ц Рассмотрим слабо' оптимальную па Парето точ^у Л внутри отрезка [С, 1] и рассмотрим функцию ц^+^е-я при фиксированных неотрицательных числах ш., j^, одно из которых положительно. Если рэ=О, то невозможно- подобрать такое число р Д>0, чтобы функция ujx достигала максимального- значения ьо внутренней точке отрезка [О, I], Пусть цзХ Тогда вторая прс- иэюдная. функции щх+рге-* есть ,uiie^>0: следовательно, указанная функции строго- выпукла и ни для каких чисел рц^О. ps'^'O1 не может иметь точкой максимума внутреннюю точку Ш
Теорема 7.4. Пусть множество X выпукло, компоненты ft, ft,... ,fm вектор-функции f вогнуты на X и положительны, г. е, fi(x)>Q для всех х^Х, i=l, 2...m, Для того чтобы решение х<°>еХ было сла- бо оптимальным по Парето (и парето-оптимальным), необходимо, m чтобы существовали такие числа /=1, 2........./и, = 1, что- /-i бы было справедливо равенство П [/,(х<<|>)Г'=тахП (-1 xeJf /-1 Доказательство теоремы см., например, в [18]. В теореме 7.5 в отличие от теорем 7.3 и 7.4 отсутствуют предпо- ложения о выпуклости множества X и вогнутости компонент век- тор-функции f. Поэтому ее можно применять при решении широко- го класта многокритериальных задач. Теорема 7.6. Предположим, что дДОбХ и f(x<o>)>Om. Для того чтобы решение было слабо оптимальным по Парето (и парето- оптимальным), необходимо, чтобы нашлись такие числа ци>0, i= тп — 1, 2,....т, 21. что имеет место равенство /-1 min pz/r(x(0))=max min л^=Х 1-1.2................m □ Доказательство носит конструктивный характер, т. е. для каждого слабо оптимального по Парето решения следует указать соответствующий ему набор чисел щ, р.2,... ,рт. Пусть x<0>e5f(X). Это означает, что не существует вектора хеХ, для которого вы- полнялось бы неравенство f/(x)>ft(x(°>), Ь=1, 2.т. Следова- тельно, для любого хеХ найдется такой номер хе{1, 2,... ,т}, при котором справедливо неравенство А(х(0>)^А(х). Возьмем в качестве щ, ра,..., р« следующие числа: Очевидно, что pi + p2+...+pm = l. Из неравенства ft (х<°>) , (х) получаем (7.5) Следовательно, для каждого вектора хеХ существует номер ie{l, 2,... ,m}, при котором выполняется неравенство (7.5). Число L Й-1 184
одинаковое для всех номеров i= 1, 2,..., т, поэтому можно запи- сать равенство PJi <х(0>) == mi n (х<°>). I-1.2,...,rn Учитывая это равенство, из (7.5) получаем неравенство min Р///(х(0)) > min руЛ(х) для любого хеХ. / — 1,2 т 1-1.2,..., т Теоремы 7.2—7.5 показывают, что при определенных предполо- жениях, подбирая коэффициенты >|Xi, рг...р,т, любое слабо оп- тимальное по Парето (и парето-оптимальное) решение можно по- лучить в результате решения соответствующей однокритериальной задачи максимизации. Аналогичный вывод справедлив и для оце- нок. 6. О существовании и нахождении парето-оптимальных оценок т и решений. Рассмотрим функцию где функции fi, ....fm i—i непрерывны на множестве X. Сумма непрерывных функций также непрерывная функция, поэтому, если множество X не пусто, зам- кнуто и ограничено, то, по теореме Вейерштрасса, существует точ- m ка х(0)еХ, доставляющая максимум функции (х) на множест- i-i ве X. Согласно теореме 7.2, верно включение (X), а значит, и включение x<0>e5f(X). Таким образом, доказано следующее ут- верждение. Теорема 7.6. Пусть компоненты вектор-функции f(*) = (fi(x), fa(x)...непрерывны на непустом компактном множестве X. Тогда Pf(X)^=0, 5;(Х)^0. Следствие 7.2. Если Уе=Ят — непустое компактное мно- жество, то Р(¥)=^=0 и S(Y)=£0. □ Рассмотрим линейную вектор-функцию вида (ук У2,...,Ут). Ее компоненты непрерывны на Rm, и, в частности, на К По теоре- ме 7.6, существует точка у(0)еУ, являющаяся ларето-оптимальной относительно этой линейной вектор-функции на множестве У. Ясно, что y*°^P(Y). Следовательно, Р(У)=?ь0, а значит, и 5(У)^=0. Из доказательства теоремы 7.6 вытекает следующий способ отыскания к а к о г о-н нбудь одного парето-оптимального решения (если, конечно, предположения теоремы выполнены): най- m ти точку, реализующую максимальное значение функции /t (х) i-i на множестве X. Найти все парето-оптимальные оценки (решения) значительно сложнее. Если множество оценок Y конечно, то найти все множест- во Р( У) можно с помощью алгоритма, описанного в доказательстве теоремы 7.1, используя вместо отношения отношение >. Если множество У бесконечно, но УсЯ2, то часто множество Р(У) уда- 185
ется найти геометрически, предварительно изобразив на плоскости все точки множества У (см. рис. 7.3). Аналогично можно поступать и при нахождении множества 5(У). Если же количество критериев больше двух и У— бесконечное множество, то наглядно изобразить множество У трудно. Поэтому в таких случаях геометрически най- ти все элементы множества Р(У) (или 5(У)), как правило, не уда- ется. $ 7.5. ВЫБОР РЕШЕНИЯ ПРИ НАЛИЧИИ ДОПОЛНИТЕЛЬНЫХ СВЕДЕНИИ ОБ ОТНОШЕНИИ ПРЕДПОЧТЕНИЯ 1. Проблема сужения множества Парето. Как отмечалось в предыдущем параграфе, в многокритериальной задаче оптималь- ную оценку (оптимальное решение) следует выбирать среди эле- ментов множества Р(У) (Pf(X)). Если множество Р(У) сравнитель- но «узкое» (в частности, если Р(У) содержит единственный эле- мент), то в качестве искомой оптимальной оценки можно выбрать любукьпарето-оптимальную оценку. В таких случаях можно счи- тать, #го отношение строгого предпочтения >- совпадает с отноше- нием > и поэтому opt\_ У=Р(У). Однако часто на практике множество Р(У) оказывается доста- точно «широким», так что для лица, принимающего решение, не- безразлично, какую именно оценку выбрать из Р(У). Такое поло- жение свидетельствует о том, что отношения >- и > хотя и связа- ны аксиомой Парето, однако не совпадают. Иначе говоря, разница между множествами opt-^У и Р(У) значительная и оценка сверху ор1^_УсгР(У) является слишком «грубой» и требует уточнения. Обоснованное уточнение оценки сверху или, как говорят, сужение множества парето-оптимальных оценок возможно лишь при ис- пользовании дополнительных сведений об отношении предпочте- ния >-. В конкретных ситуациях дополнительные сведения могут быть заданы в различном виде. Иногда они вообще отсутствуют н их получают в результате анализа отношения предпочтения ко- торое используется в данной задаче. 2. Выбор решения в случае существования функции ценности. Пусть >---некоторое асимметричное и транзитивное отношение строгого предпочтения на множестве оценок Ус:Кт. Числовую функцию Ф переменных yi, уъ...,ут называют функцией ценности для отношения V, если для произвольных векторов yt у'^У нера- венство Ф(у) >Ф{у') имеет место тогда и только тогда, когда ^>- > У'- Предполагаем, что отношение >- удовлетворяет аксиоме Паре- то. Поэтому из неравенства у>у' следует соотношение уУ~у\ а зна- чит, Ф((/)>Ф(у')- Следовательно, функция ценности (если она су- ществует) является возрастающей по отношению >. Если Ф (у) — функция ценности для отношения >- и й— воз- растающая функция одной переменной, то й[Ф(у)1 также функция ценности. Таким образом, функция ценности определяется с точно- 186
стью до возрастающего преобразования h. В частности, всякая функция аФ(у)+а, где а>0 и ceR,—функция ценности, если та- ковой является функция Ф. По определению отношения неразличимости отношение у~ ~у' выполняется в том и только том случае, если не верно ни со- отношение у>у', ни соотношение у'^у. Поэтому если имеет место равенство Ф(у) =Ф(/), то не может быть ни Ф(#)>Ф(у')» ни Ф(^) >Ф(у), а значит, верно соотношение у~у'. Справедливо и обратное, т. е. из соотношения у~у' всегда вытекает равенство Используя функцию ценности, вопрос сравнения по предпочти- тельности векторных оценок у н у1 можно свести к сравнению со- ответствующих чисел Ф(^) и Ф («/')- более предпочтительной оценке соответствует большее значение фукции ценности, а двум оценкам, находящимся в отношении неразличимости, отвечают равные зна- чения функции ценности. Если для отношения существует функция ценности Ф, то очевидно, что орКК = {уФ* е У |Ф (уФ*) ~ max Ф (у) | y^Y и отыскание оптимальной оценки сводится к решению однокрите- риальной задачи максимизации функции Ф на множестве К Необходимым условием существования функции ценности явля- ется транзитивность отношения ~. Это следует непосредственно из определения функции ценности и транзитивности отношения равен- ства = . Отношение >. на Rm порождает нетранзитивное отношение не- различимости (см. л. 1, § 7.3), поэтому для отношения ;> на про- странстве Rm функции ценности не существует. Однако в частных случаях, например если множество У конечно и имеет вид У =! У{1\ у,2).У» > е R^y") >у<‘ п функция ценности существует; это, например, функция вида Ф=i, i^l, 2, ...,Z. Таким образом, существование функции ценности зависит и от структуры множества У. Вопросы существования функции ценности подробно изучают- ся в книге П. Фишберна «Теория полезности для принятия реше- ний* (М.: Наука, 1976). Если отношение ~ транзитивно, то его называют отношением безразличия и обозначают Оценки у и у', для которых верно соотношение у~у\ одинаково предпочтительны (безразличны) в том смысле, что если найдется оценка у* строго предпочтительнее одной из них, то она строго предпочтительнее и другой оценки, т. е. из соотношения y*^yt У~У' всегда следует соотношение В этом можно легко убедиться, рассуждая «от противного*. Заме- тим, что для нетранзитивного отношения — подобное утверждение, вообще говоря, неверно; в подтверждение этого достаточно в ка- честве взять отношение >. 187
и* Ганим образом» если функция ценности Ф 'Существу®г,, то see оценки у„ имеющие одно ч го же фиксированное значение ©(рК являются безразличными для лица» принимающего решен де.. 1'одо- рят. что такие оценки составляют кладе безразличия. Каждом у яма чей ию функции цен кости соответствуй ет свой класс безразличия. При иг=Й класс безразличия представляет собой не которую линию уровня функции ценно- сти (рис. ?М- ha этом рисунке каждая оценка из класса е большим номером строго предпочтительнее любой' оценки с меньшим номером: Кик отмечалось выше, в случае суше- / g -С*—2-*- СтвО'Вання функции ценности Ф опти- й мяльная оценка находится макснм1гзаив- ей этзй функции на множестве Jr1. 'Ответ *н®- на вопрос о том, как построить функцию ценности» сели известно» что ина тущест- йуег можно' найти в {13]]. Укажем лишь» что функция ф нередко допускает сддитцАяое Аредстдолеямё.' m Ф(У1, y3.-» где возрастающие функции ^fe-.L i=L 2»,...*п, одной переменной определяют» анализируя отношение строгого предпочтения Ь част* мости. аддитивное представление может иметь я следующий, линей- ный вид: Ж ф(ур ^.„.ч $’ет) = V i-t где рь to,..। pm — некоторые положительные числа, подлежащие определению- Учитывая связь между отношениями > и >- , все сформулнро- ванные выше определения и выводы можно перенести на случай отношения > . Так, например, в случае существования функции ценности Ф множество' оптимальных решений имеет вид opt'>X-={x£'QJ''^'.i¥ |Ф[/ (jc^tyjssmax^l/ ле. JT 3. P-iifon решения при строго упорядоченных по важности кри- териях, Часто для липа. принимающего решение, желательно полу- чить возможно' большее значение» например критерия /ь Даже за счет «потерь* по остальным критериям, т. е. критерий fi оказыва- ется более важным» чем остальные. Возможен и случай, когда весь набор критериев flt ft, sf.Jra строго у торя дочей по важности, так. что .критерий Д более* иажен. чем все остальные критерии ft» IBB
fs,.... Jm, критерий /2 более важен,, чем все критерии. [3,..., Дл, и т. Д. Это соответствует сю у апн и когда грн с равней ни оценок н реше- ний используется лекеикс-графическое отношение. Приведем опре- деление этого отношения. Пусть имеются два вектора у,, У sI'c.-V’* Лелсоо-ардфмёское i-rt отношение >- О-трн^гл яется емддоидем обровди: отношёНЖ 1еж р>-#‘ шиевт место готда и только тог^Ц, когда выложено одно «Э сдес^едцдо ДОЛОвШЬ U Й>>* 2} (7.6) где ^=(й> W^T*FmK (|4) - При m= I лексико-графи- ческое отношение совпадает с отношением > на година зсестве не- Шественных чисел . 1ё* Если выполнено' соотношение то говорят, что вектор F лет^ш^ароф^ч^ки бол&ше, wjm wcrop (Д lex Геометрическая иллюстрация отношения > приведена на рис, 7.7. Если лида* принимающее решение, в качестве от ношения стро- гого предпочтения использует лексико-графическое отношение, то это означает, что к:з лары, оценок для него предпочтительнее, та, первая компонента ко- торой больше (независимо от соотношений между остальными ком ио не нт ами), Если первые компоненты двух оценок одн- каковы, ГО'для лица, принимающего решение,, пред почтительнее оценка, имеющая ббльшую вторую компоненту; остальные компоненты данной оценки могут при этОм тэяачятелььо уступать» соответствующим компонентам ито- Рм 77 рой оценки и т. д. В таких случаях говорят, что компоненты Гь Уа..- (? критерии fa* М строго *?npp.sdoww по важности: самым: важным является критерий fu менее важным /а, ешс мопсе и а жида д.; наконец, критерий f-и имеет- 'наименьшую важность. В определении, лексико-графического отношения важную роль играет порядок перечисления критериев-. Изменение нумераций критериев приводит к другому лекснко^графНФескому отношению* ta Теорема 7.7. Отношение > йсц.м-чстрлчнс, гранзитпжо и рдав- летаВ'Дяет иксцеме Пйрето* U9
lex номером п. Следовательно, у'Ху' и lex □ Установим транзитивность лексико-графического отношения. Пусть р>- у* и у*)>- у', причем, согласно первому соотношению, имеет место условие типа (7.6) с некоторым номером fte{l, 2... т}> а согласно второму — условие типа (7.6) с некоторым номером /е{1, 2...т}. Положим n=mtn{/s, /}. Тогда для оценок у и //' вы- полнена условие из (7.6) с транзитивность доказана. Так как соотношение #> у не может быть выполнено ни для какого у, то лексико-графическое отношение иррефлексивно. В п. 2 § 7.2 указывалось, что произвольное транзитивное и ир- рефлексивное отношение всегда асимметрично. Поэтому и отноше- ние >- асимметрично. Если верно неравенство у~^.у', то одно из условий в (7.6) будет выполнено. Поэтому неравенство У1>у' влечет выполнение соотно- 1ех шення у', т. е. лексико-графическое отношение удовлетворяет аксиоме Парето. Пусть имеются векторы у, y'^Y и у=£у'. Тогда справедливо лн- j lex lex <5о соотношение у Ху', либо соотношение ifX у. Следовательно, когда не выполнено ни одно из этих двух соотношений, то у=у'- Поэтому для произвольной пары оценок.1/, / имеет место одно и lex lex только одно из следующих трех соотношений: у'Х у\ У' >- У, у—у'- Лексико-графическое отношение на множестве оценок порожда- lex lex ет отношение X на множестве решений X: х'Хх' тогда и только х х lex тогда, когда у'ХУ'* где y=f(x), if=f(x'). Очевидно, отношение lex >- также является асимметричным, транзитивным и удовлетворя- X ет аксиоме Парето (в терминах решений). Множество решений (оценок), оптимальных по отношению lex >- на множестве X (соответственно У), называют множест- вом лексико-графически оптимальных (точнее говоря, лексико-гра- фически максимальных) решений (оценок) и обозначают через opttexA' (соответственно ори^К). Так как для любых двух векторов у, у' либо один лексико-гра- фически больше другого, либо они равны, то множество optiexK, ясли оно не пусто, состоит из единственного элемента. Для множества Y, изображенного на рис. 7.3, лексико-графиче- ски оптимальной оценкой является точка е. Непосредственно из теорем 7.1 и 7.7 вытекает следующее след- ствие. 190
Следствие 7.3. Если множество У состоит из конечного чис- ла элементов, то лексико-графически оптимальная оценка сущест- вует и единственна. Введем множества, определяемые рекуррентным способом: %! = (х(О g= X |/, (л<»)=шах Л (х)|, .геХ А'2={л(г)еЛ'1|/2(л<2>) = тах/а(л>|, т&Х, х„ = | ле»-» Г- X„_x\f„ (Х<"Ъ=max /„ (х)). «а*.-, Xi — это множество всех точек максимума первой компоненты век- тор-функцин f, т. е. функции fj, на множестве X. X? — это множест- во всех точек максимума [2 — второй компоненты вектор-функцию f — на множестве Xi и т. д. По определению, каждое последующее множество является подмножеством предыдущего, т. е. имеют место включения Хт с Xm-i c.-.cXacXjCX. (7.7> Теорема 7.8. Для того чтобы решение x<°teK было лексико-гра- фически-оптимальным, необходимо и достаточно, чтобы выполня- лось включение х(0>еХт. □ Необходимость. Пусть выполнено x<0>eoptклX. Пред- положим противное: х(0^Хл. Последнее означает, что либо выпол- нено Х<°>еХт-1 И /т(х(0)) <maxfm(*)» -Либо Х<0)^Хт_ь В Первом- ай—! случае найдется такое решение х'еХт-ь что x=k 2... m—I, fm(x')>fm(xW). Следовательно, верно соотношение fex что противоречит лексико-графической оптимальности ре- шения х’Ч Поэтому выполняется х*°^ХЛ1_|. Отсюда следует, что- либо имеет место x*°ieXm-2 и <max fm_((x), либоспра- _2 ведливо х(0>^Хм_2. Рассуждая, как и выше, придем к соотношению х^^Хт-2 и т. д. Окончательно получаем противоречие: х<°>^Х. Достаточность. Рассмотрим решение х(°>еХт и допу- стим противное: существует решение хеХ, для которого справед- lex lex ливо соотношение х>- xf01. Отсюда следует соотношение у >- yi01^ lex где у=[(х), Пусть согласно соотношению у^у^у выполняется А-е условие из (7.6), &е{1, 2, .... m—1). Тогда х<°>е &Xft, а значит, в силу (7.7) имеем х(0)еА'т. Следствие 7.4. Если все функции f\t /г.fm непрерывны на непустом компактном множестве XcR" то справедливо неравенст- во optlex Х=£0. 191
□ По теореме Вейерштрасса (см. § 2.2), множество Xi не пус- то и компактно. Тогда таким же свойством обладает и множество Хз и т. д. до Xm_i. Множество Хт не пусто в силу того, что Хж-i не пусто и компактно, а функция непрерывна. В таком случае, по теореме 7.8, множество лексико-графически-оптимальных реше* ний также не пусто. Теорема 7.8 дает следующий поэтапный метод нахождения лек- сико-графически-оптимального решения. Сначала находят мно- жество точек максимума функции f\ на множестве X, т. е. множест- во Хь Далее на этом множестве максимизируют функцию fs и оп- ределяют множество Х3 и т. д. до множества Xm_i. Наконец, мак- симизируя fm на множестве Хт_ь находят лексико-графически-оп- тимальное решение. С точки зрения вычислений описанный метод сложен, посколь- ку на каждом А-м этапе (кроме последнего) нужно целиком стро- ить множество Ха. Удобнее для нахождения лексико-гра- фически-оптимального решения решать такую последовательность задач: 1) найти f*i=maxfi(x) при условии хеХ; 2) найти f*2=fnaxf2 (х) при условиях хеХ, ^(х)=/*[; < т— 1) найти f*m-i=maxfm-i(x) при условиях хеХ, ft(x)—f*it .'—1,2...m-2; m) найти точку максимума функции fm(x) при условиях хеХ, i==l, 2,... ,m— 1. 4. Оценка сверху для множества оптимальных решений в усло- виях отношения предпочтения, инвариантного относительно пере- нумерации критериев. Лексико-графическое отношение не является инвариантным относительно перенумерации критериев. Однако на практике встречаются задачи, в которых для лица, принимающего решение, несущественно, в каком порядке перечисляются компо- ненты yi, у?, ..., ут оценки f/eRm, а важны только числовые значе- ния этих компонент. В таком случае если одна из оценок предпоч- тительнее другой, то и каждая оценка, полученная из первой пере- становкой компонент, является более предпочтительной, чем оцен- ка, образованная из второй оценки произвольной перестановкой компонент. Такие дополнительные сведения можно использовать при построении оценки сверху для искомого множества оптималь- ных оценок и тем самым сузить множество парето-оптнмальных оценок. Пусть имеется вектор у={уи уъ ..., ут). Множество векторов, которое состоит из у и всех векторов, получающихся из у переста- новкой его компонент, обозначим через П (&). Очевидно, множест- во П(^) содержит не более чем ml элементов. В частном случае при у1=у2—...=ут выполняется равенство П((/)={^}. Элементы множества П (у) будем обозначать через л(^), л" (у) и т. п. Далее считаем, что отношение строгого предпочтения У опре- делено на множестве U H(0c:Rm. Кроме того, как и раньше, 192
предполагаем, что &то отношение асимметрично, транзитивно и удовлетворяет аксиоме Парето. ПтаоШЁН«е > называют тноодздэдо лере^уж* -рацш* крзтерэд если для произвольных векторов Уе¥ из сэ* отношения уХ^ всегда следует соотношение д(р}>л'(£Л для ли* бых векторов я (р)бП(р)>я''(/)е11(£')> Отношение .>- на пространстве R1” че является нннарнактным Относительно перенумерации критериев, так как, ЕШЕрнмгр, из пе- ра в г нства / 2,3) * 7? [ 1,3j » не ел едует егра ведлнвость н е ра венстеа (2,3)TS (311)т- Если для. .отношения > существует функция пенно- JB стн ОДЕ* / (г/i, pS1 ...,|«) = ^тфд то, очевидно, такое отношение инвариантно отлогнтельно перенумерации критериев, .Далее б^дгл одтать, что об отношении строгого дреййочте/шя > w&secraA что оно яагяйтц® кнворидяжмм отдедоеддно ларену- лера^ьш критериев., Оценку сверку для: множества opi > ¥ пшу- Чим с помощью симметрического- отношения., .г _ _ г Смлпметрднеслое отношение X на множестве У П (г) илреде- 1₽еГ $ л лете я следующим образом: соотношение выполняется тогда II только тогда,- 'косда для некоторого- n(yjsH(^) верно неравен- ство у^л(|Л- Г есм етрич ее кая ил л: остра цы я сим метра ноского ° ст и оше ния пр и т = 2 приведена, на рис. 7'8. Точка $/. для которой верно соотноше- мне у> у\ принадлежит объединению двух звштрихованЕЫХ ут- лов,' расположенных симметришо относи- тельно биссектрмсы коордакатнога угла. Сшс ад етрачесхое <зт»эшёвиа « апшжтрмчно, В самом деле, пусть со- S 5 гласно- соотношениям выпол- нены неравенства PSm* (Fh Дли некоторыж векторов- я*(ц*)€=П(^*Х еТГ(ff), Переставим компоненты вектора так, чтобы получился вектор Ана- логичная перестановка компонент вектора, я'(у') приведет к некоторому вектору Рис 7 8 sXfF). В результате имеем неравенства s (у*)(у')»- т, ё верно соотношение Транзитивность установлена, Сим.метряческое отношение, иррефлексивно. Дейст- > ж’ эительно., выполнение соотношения у>/ означает,, что от- куда. следует» что сумма компонент вектора больше гуммы ком- понент вектора л (у),, а тто не может иметь места. Ле>:.мметрич- ность является следствием транзит ин нести и иррефлексцвиостн. Сны метр нчес кое -отношение инвариантно относительно ле реку * 7-339 193
мерации критериев к удовлетворяет аксиоме Парето, т* е. из нера- венства следует соотношение i? > р*, Теорема 7,®, Спрвведливы соозкошеямл Q (7J) м ножес гео cap его- о птимальных до opt У— множество оптимальных оценок пп отношению > на множестве У, а Я (” U (p)j = оценок нь множестве И Ц(^)* L4 Проверим включение из соотношения (7.8). .Пусть имеется вектор y^eopt^. F. Предположим противное: для некоторого век* “ s торн верно соотношение Тогда для неко торото вектора я(^®>|оП(^®*)|., Отсюда, согласят яксном« Парето, следует ^отношение И, используя инвариаитноеть отно’ шении > отизснтел.ы]п перенумерации критериев, получаем ^>,^4 что протгворечнт канальному допущению. Теперь докажем справедливость включения optsKcfFn Л Пусть имеется вектор ^<e>eopt^K. Предполагая противное, пшгучн'йМ ^<л'еГ и Я U П(И|- Следов яте jj ьно, существует вектор для которого1 уеУ такой, что выпои* немо л (у) 2>згЛ Надлежащем о б разом (1 переставляя иомцоиенты векторов, входящих j это неравенство, получаем нерэиеиство '^лй(^)(1 где вектор Последнее означает, что s Это противоречит пред положе.- полнено! соотношение самым справедливость включения доказана, Справедливость обратно- го включения устава вливается аиа- дОГНЧЖХ При 2 оценку сверху для множества ор(>У, т. е< множество К Л Я ' U П (Ю |р нас то м ожно полу* чнть геометрически, Так, на рис Л ,9 изображены множества У и U П (у) Здесь Я f U О(уМ -это объедине- нис отрезков Ьг н cd. Но множеству У принадлежат только точки отрезка cd; они и дают искомую оценку сверку,. Множество Я( F) — это весь отрезок acd, тяк что исподьэованне информации об игыва- риантности отношения стро» это предпочтения относительно пере- ЬЯ4
нумерации критериев его существенно сужает. Однако можно при- вести пример множества У', для которого P(K')=opt$K' (рис. 7.9). В этом случае использование информации об инвариантности отношения строгого предпочтения к сужению множества парето- оптимальных оценок не приводит. § 7.6. ОЦЕНКА СВЕРХУ ДЛЯ МНОЖЕСТВА ОПТИМАЛЬНЫХ РЕШЕНИЯ В УСЛОВИЯХ ОТНОШЕНИЯ ПРЕДПОЧТЕНИЯ. ИНВАРИАНТНОГО ОТНОСИТЕЛЬНО ПОЛОЖИТЕЛЬНОГО ЛИНЕЙНОГО ПРЕОБРАЗОВАНИЯ 1. Отношение предпочтения, инвариантное относительно поло- жительного линейного преобразования. В данном параграфе рас- сматриваются только отношения предпочтения, связанные со мно- жеством оценок, поэтому условимся для краткости вместо )> пи- сать )>. Заметим, что полученные результаты можно переформули- ровать в терминах решений. Бинарное отношение строгого предпочтения />, заданное на пространстве Rm, называют инвариантным относительно положи- тельного линейного преобразования, если для произвольных векто- ров у, y'^R,n из выполнения соотношения у^у' следует справедли- вость соотношения ky+c'^-ky'+c при всех А>0, ceRm. Инвариантность отношения относительно положительного линейного преобразования означает, что если оценка у предпочти- тельнее оценки у', то оценка вида ky предпочтительнее оценки вида ky' при всех fc>0 и, кроме того, оценка вида у+с предпоч- тительнее оценки вида у'+с при каждом векторе ceRm. Свойст- вом инвариантности обладает, например, отношение ;>. Если для отношения строгого предпочтения существует линейная функция ценности Ф (у) = 2 где pi, . gm — фиксированные чис- j-i ла, то отношение будет инвариантно относительно положитель- ного линейного преобразования. Этим же свойством обладает лек- сико-графическое отношение. Однако симметрическое отношение > не является инвариантным относительно положительного ли- нейного преобразования. Например, имеет место соотношение s (1,3) т> (2,1)т, и о соотношение (1,3)т+(—1*0)т=(0,3)т>-(1,1)т=(2,1)т-|-(—1,0)т не верно. 2. Основные требования к отношению предпочтения. Дальней- шее изложение ограничено случаем двух критериев: т = 2. В этом параграфе считаем, что отношение строгого предпочте- ния данного лица, принимающего решение, удовлетворяет следую- щим требованиям. 7* 195
Требование 1 (иррефлексивность). Ни для какого вектора y^R2 не может быть выполнено соотношение у^-у. Это требование естественно для отношения строгого пред- почтения. Требование 2 (аксиома Парето). Для любых векторов у, y'eR2 из выполнения соотношения у^>у' следует выполнение соотноше- ния у>у'. Это требование свидетельствует о том, что дальнейшее рассмот- рение ограничено задачами многокритериальной максимизации. Требование 3 (транзитивность). Для любых векторов у, у', у"^#2 из выполнения соотношений y>y't у^у" следует выполне- ние соотношения у>у". Требование 4 (инвариантность относительно положительного линейного преобразования). Для произвольных векторов у, y'eR2 из выполнения соотношения y^t/ следует соотношение ky+c>- >-ky' + c при всех А>0, се Я2. Всем перечисленным требованиям удовлетворяют, например, отношение ^>, лексико-графическое отношение и отношение для которого существует линейная функция ценности. Отношений, удовлетворяющих всем указанным требованиям, существует бес- численное множество. Если отношение строгого предпочтения >- точно известно, то в качестве «наиболее предпочтительного» решения можно выбрать любое решение из множества opt^. К Однако на практике подоб- ные ситуации встречаются редко. Как правило, об отношении > известно только, что оно обладает некоторыми свойствами или удовлетворяет некоторым требованиям. Неполная информация об отношении строгого предпочтения порождает неполные и неточные представления о множестве opt^K В этих условиях актуален во- прос построения точной оценки сверху для неизвестного множества орКУ. Решению данного вопроса и посвящен § 7.6. Нередко на практике в результате анализа ранее предприни- мавшихся действий' лица, принимающего решение, или непосред- ственным опросом удается выявить несколько пар оценок у, у*, для которых не верно ни неравенство у^у', ни неравенство у'^у однако лицо, принимающее решение, может с уверенностью ска- зать, какая из оценок данной пары предпочтительнее. Как будет показано ниже, такая информация дает возможность построить оценку сверху для искомого множества opts»У и тем самым спо- собствует обоснованному выбору оптимального решения. Введем еще одно требование к отношению строгого предпочте- ния. Требование 5 (дополнительная информация об отношении )>). Имеются пары векторов такие i=l, 2,..., I, что для всех Z 2.../}, где 7V#=0. Причем указанные векторы таковы, что не выполняет- ся ни неравенство ни неравенство Тот факт, что не может выполняться неравенство 196
озяачьет содержательность дояолннтельирй ЕНфорчации. Е само^ деле, если неравенство имеет место, то., согласно требо- ванию 2Г выполняется соотношение аналогичное имеюще- муся в требовании 5. Второе условие вводится .для того, чтобы не ио змякло противоречия с-требованиями 1 я 3. Действи- тельно, если справедливо соотношение .То1 согласно требованиям Д и 3, верно соси мощение луп несовместимо с требованием 1.. Условие В .поа.ёднем требовании означает» 1Ю' какая-то дополнительная информ тени-.и этом требовании со- держится. "Замечание В силу требования I, если потребуется, всегда можно считать, что а требдваняи 3 все векторы иС’> нулевые, В са- мом десе, гели выполнено сооттогаенгге то, согласно тро боваиню 4» также выполняется соотношение ^>0s- Теперь, если левую часть полутснадс1 соотношении обозначить через ми», придем к требованию 5 с нулевыми векторами гМ Далее дли краткости вместо слова «требование* будем писать букву Т с соответствующим индексом. 3, Мажорантное отношение й свойства. Введем хож«оронг- ное отношение > , на основа йен которого будет получена'сценка сверлу для неизвестного множества. opt^F, Запись $> tf для чт- торон у, j'gR*, по определению, означает, что выполняется еера- .веистно или же что при некоторых ^">0, г&Лг имеет место неравенства -р/ где а*Ч iko — нектары из з соответствии с этим определением выполнение: соотношении м л л О'й означает, что выполняется неравенство или же что при некоторых A’j>DP teJV вы- полняется неравенство £ (,ц№=, ДО). Г ©ом етр «ческа я ин । ер п рета ни я соотношен ня ^>0а. при и и«1й^.^ = 0.а приведена на рис 7.1 0l. В отме- чеиноъ® штриховкой тутом углу (исключая начало координат) находятся все векторы р, дл? которых справедливо гоптча- шегше Для тотэ чтобы получить представление о век- торах ,у'“, для которых имеет и место соотношение необходимо, этол угол с помощью парал- лельного переноса сместить така чтобы его верш»; ной ока залась точ- ка (рис. 7.10). Установки свойстве мажорантного отиошейпя. F.. Отяошенад ^«ЗоойгАоряет требованиям тика Гь. □I Пред положим противное, т. е, что отношение > не удовлет- J97
воряет Т{. Тогда для некоторого вектора у будет верно соотноше- ние у >у. Так как неравенство у^.у невозможно, то верно нера- венство y^k (u<*>—ut0)+# при некоторых fe>0, i&V. Отсюда полу- чаем неравенство которое несовместно с Т5. Следовательно, Л1 отношение > иррефлексивно. л Выполнение аксиомы Парето для отношения вытекает непо- средственно из определения этого отношения. /Н Пусть имеет место соотношение у > у”Если, согласно этому соотношению, верно неравенство у^у', то имеет место инвариант- ность относительно положительного линейного преобразования. Когда справедливо неравенство#^k(«(»>—о<0)верно и неравен- ство Ay+c^Ak иЮ)+Л#'+с для любых Д>0, ceR2. Следо- _ м вательно, Л для отношения >. выполняется. ' ~ м Справедливость Ts для отношения > вытекает из очевидных неравенств f=i( 2....I. Следующее свойство раскрывает «мажорантный характер» отно- шения > . 2°. Пусть — произвольное отношение, удовлетворяющее — Т5. Тогда для любых векторов у, #/gR2 из выполнения соотноше- ния у^у' следует выполнение соотношения y'>yf. □ Пусть у > у. Выполнение этого соотношения, по определе- нию, означает, что возможны два случая: справедливо неравенст- во у>у* или неравенство y^k(u№—сН1"1)А~У' при некоторых /г>0, /&V. Выберем произвольное отношение удовлетворяющее Ti—7$. В силу Ts имеет место соотношение а согласно Т4 верно соотношение —>) + #'>-#'. (7.9) Если имеет место первый случай, т. е. когда выполняется неравен- ство #>:#', согласно Т2 выполнено соотношение #)>#'. Если реали- зуется второй случай, то, учитывая соотношение (7.9), получаем соотношение y^k (и&—+#'>•#'. Если неравенство выпол- няется как равенство, то верно соотношение #>#'. Если же нера- венство реализуется в виде то, согласно Т2 и 7з, также по- лучаем соотношение уУ-у'. Введем следующие множества индексов: На основании Tg имеют место равенства Wi(W2=0- При te/V] паре векторов и^\ vV* соответствует точка —гЯ’>, рас- положенная во II координатном углу. Если же i^N2t то точка jj(i) находится в IV координатном углу. Возможно выполнение 198
равенства Ni = 0 или же равенства N2—0, но одновременное вы- полнение этих равенств в силу того, что невозможно. Введем положительные числа (7-Ю) В случае необходимости перенумеровав векторы и(*\ »<0, всегда можно считать, что справедливы равенства. /Са=шах/С(. (7.11) /e.v, Если одно из множеств или Ns пустое, то определено только одно число К2 или К) соответственно, /м Определим сокращенное мажорантное отношение > следую- /п щим образом: соотношение у >// для векторов у, выпол- няется, если справедливо неравенство у^у\ или при некоторых ft>0, ie{l, 2} имеет место неравенство y^>A(ut0—v^)) +у'г где векторы нЮ, иЮ из Tg удовлетворяют равенствам (7.11). Если АГ1 = 0, то в этом определении следует считать i—2, а при N2=0 полагаем «=1. м m Как показывает следующее свойство, отношения > и > сов- падают друг с другом. 3°. Соотношение у > у' имеет место тогда и только тогда, когда верно соотношение у £ у*. □ Достаточность следует непосредственно из определе- ний рассматриваемых двух отношений. Необходимость. _ At , „ Пусть выполнено соотношение у. Проверим, что в этом случае верно соотношение у > у'. На основании свойства 1° и Т4, не умень- шая общности, можно считать, что у'=02, v<0=02, i = l,2,.... I (см. замечание из предыдущего пункта). В этих условиях выполнение м л _ * соотношения 02 означает, что верно неравенство у>02 или неравенство y^kuW при некоторых k>Q, i&N. Если, согласно данному соотношению, выполнено неравенство */>02, то, по опре- делению отношения >, имеем 02. Пусть верно неравенство y^ku& при некоторых Л>0, ietf. Для определенности предполо- жим, что ieATj. Случай f=l тривиален. Поэтому пусть Из равенств (7.10)—(7.11) имеем неравенство u{nfu\l} < «г’М1- Следовательно, найдется такое число А'>0, что ь___!_ Из левого и правого неравенств следует соответственно неравен- ство k'u\l> и неравенство ku2l) В свою очередь, 199
эти неравенства влекут неравенство kuW^k'iW. Окончательно по- ' лучаем неравенства означающие, что верно соот- Л7 ношение у > 02. Случай ie/V2 аналогичен. Свойство 3° утверждает, что из всех I соотношений /=1, 2..../, представляющих собой дополнительные сведения об отношении строгого предпочтения )>, на самом деле нужно учи* тывать только два из этих соотношений (если же одно из мно- жеств М, И2 пусто, то одно), остальные можно из рассмотрения исключить. 4. Оценка сверху для множества оптимальных решений. Обоз- ли т начни множества оптимальных оценок по отношениям > и > на множестве YczR2 соответственно через opt«y и optmK Согласно свойству 3° мажорантного отношения optjw У=optm У. Следующее утверждение показывает, что множество оптимальных оценок по мажорантному отношению представляет собой оценку сверху для неизвестного множества opt^ У. ' Теорема 7.10. Для любого отношения, строгого предпочтения удовлетворяющего 7\—Т^, выполняются включения opt^X с optm Г с Р (Г). □ Левое включение вытекает непосредственно из свойства 2° мажорантного отношения. Правое включение имеет место в силу свойства 1°, согласно которому мажорантное отношение удовлет- воряет аксиоме Парето. Как утверждает следующая теорема, оценка сверху, т. е. мно- жество optm У, совпадает с множеством парето-оптимальных реше- ний относительно некоторой двумерной вектор-функций на мно- жестве У. Теорема 7.11. Имеет место равенство optmr=P/f(F), (7.12) - Ь * ’ где Pf(Y)—множество парето-оптимальных решений относитель- но вектор-функции F вида - + (7.13) ' 44/1 + (1 — Уъ ' на множестве YcR2. Здесь Х(, Х2 — числа, определяемые в случае N^b0r ,V2^0 равенствами eL1) — х/=-7п-----тп---7Й----77Г>°- /=1,2 * • I 1 (7.14) В случае выполнения равенства М\ = 0 число Х2 определяется из •(7.14), а Ь, =0; если же справедливо равенство Л?2 = 0, то следует положить ?.2=0, а число. Х| находить из равенства (7; 14). 200
□ Проверим, что соотношение 0> д' для векторов у, y'eR? выполняется тогда и только тогда, когда выполняется неравенство ^(0) ;>F(0'). Предварительно отметим следующее. На основании свойства Зэ мажорантного отношения и замечания п. 2, не огра- ничивая общности, положим ч<1)=о<2>=02- Далее так как неравен- ство F(y)^>F(y') в силу линейности вектор-функции F равно- сильно неравенству F(y—y')^F(Q2), а соотношение у равно- т сильно соотношению у—у' > 02, то можно'считать, что /—Оз- Пусть ^^=0и Достаточность. Проверим, что выполнение неравенства F{y) ^Г(0а)’=02 влечет выполнение соотношения 02. Неравен- ство F(y) ^02 можно записать в виде Отсюда следует, что выполнение неравенства у^$2 невозможно. Рассмотрим оставшиеся случаи. а) Если y^ti2t то, по определению отношения > , выполняется m соотношение у > Оя- б) Пусть yi <0, у2>0. Из неравенства (7.15) следует неравенст- во y^kuW при Л=02/н2(1>>,О. Поэтому верно соотношение у£ Оз- в) Пусть #1 >0, 02<0. В этом случае из неравенства (7.15) вытекает неравенство y^kiffi при k—yifu^^O^ а значит, спра- Л1 ведливо соотношение у 0^ Необходимость. Пусть 0> (Ь. Здесь возможны два слу- чая. а) Если имеет место неравенство у>02> то, очевидно, выпол- няется и неравенство F(у) >• F(02) — 02, поскольку все числа Xi, (1—>.j), Х2, (1—Х2) положительны. б) Пусть верно неравенство y^kuW при некотором k>0 и t=l или i=2. Для определенности будем считать, что i=l (второй случай аналогичен). Из неравенства y^kuW вытекают следующие покоординатные неравенства: „(О „(и --Щ-0! + 02 ---fiy + 02= — ЛиР+ 02 > 0, и\4 4\f uL2) ц(2> ---ЙГ > ЙГ Ли! *+02- (7.16) u’j ’------------------------------------------------иу' Докажем неравенство -Ж'< -«V7«'.l>. (7-17) 201
Предполагая противное, подучаем, что существует такое положитель- ное Д', для которого верно неравенства ₽uj 3/« jfc' <C‘=wl’ VW' Отсюда следует векторное неравенство Q&fe£,lrf1>+»*s>, означающее' справедливость соотношения. U > иЛ Но отношение >' удовлет- воряет требованию гига Ts (см. свойства Iе' и 3® мажорант него от- ношения) , поэт ому имеет место со отношение > 0в. 1а ним: об- разам, «и полнпется соотношение Os > Cfe, из которого, ссг- ласид свойствам 2s и 3° мажорантного отношения, следует соогвд* шейке lfe>^>0g. Используя транзитивность отношении >г полу- днем соотношение противоречащее Г3« Теперь, согласно доказанному неравенству (7Л7)1» из второго неравенства (7.16) получаем неравенства (ДЭ»‘ —^55- И+й > -М1)+?2 > 0. где нестрогое нёравёиство имеет место, поскольку Отсюда и из лер в ото неравенства (7.16) окончательно имеем 4% — tti" Ч > О. -М !|>! +45 > Р- Отсюда следует требуемое неравенство Г(у) й0,г. Случаи М1 = 0 или iVp=0 рассматриваются аналогично, " Используя формулу (7J4), можно проверить справедливость равенств: MbV’^H+U-I,) /=1.2, которые означают, что вектор 1—Aj)t перпендикулярен век- тору и®—!<’>, I, 2. Значит, линии уровня первой компо- ненты вектор, функции F на теоремы 7.Г1„ т„ е, функции A if .1 + (1 —Al) f s» па pa л ле ль и ы вектору —rj(4t з линии уров- ня, отвечающие второй компо- ненте вектор-функции F, па- раллельны вектору На рис. 7.11 приведен пример геометрического построения множества opt™ У. Отмеченные штриховкой углы получены в результате параллельного пе- реноса угла, образованного точками' 0, ыЯ, На этом рисунке множество opt® г совпадает с кривой fit, а множестве Р(У} составляв! иск кривая afierf. Пример., Найдем оценку сверху для множества ор1^>У, где
при условии, что отношение строгого предпочтения > удовлетво- ряет Т\—Л и, кроме того, Г5 в следующей форме: i= 1, 2, 3, причем «<Ч=(°\ «<»> = ( I \5) \2) \0) \1 / Находим jV] = (1.3} и Л/2={2}. Далее, на основании (7.10)—(7.11) вычисляем “2°-4° 3 К,-”м »''>-<> ~ _Т ’ „ _ «?,-42) _ i Л2“ Ц2)_Р(2) “ 4 ’ Минимум при определении реализуется для : = 1, поэтому усло- вие может быть исключено, как не содержащее дополни- тельной информации по сравнению с соотношениями i= = 1, 2. Найдем оценку сверху, т. е. множество Pf(Y). Согласно (7.13)—(7.14), определяем вектор-функцию F (w) = I \(V5)y1 + (4/5)y2./ ‘ Теперь найдем множество ларето-оптимальных решений: Полученная оценка сверху означает, что векторы (2,3)т и (3,2)т заведомо не могут быть оптимальными, а для множества opt>K возможны следующие случаи: оно может состоять из элемента (1, 1,5)т или элемента (5, 1,5)т, а также содержать оба указанных элемента. Для более определенных выводов требуется новая до- полнительная информация. § 7.7. ПРИКЛАДНЫЕ ЗАДАЧИ 1. Анализ конечного набора проектных решений. Предположим, что имеется девять различных вариантов .... проекта станка. Эксперты оценили их по следующим шести показателям: надежность, производительность, экономический эффект, удобство в эксплуатации, простота изготовления, внешнее оформление. Оце- нивание производилось по 11-балльной шкале от 0 до 10 (табл.7.1). Из имеющихся проектов требуется выбрать наилучший. Заметим, что по всем шести показателям предпочтительно иметь наибольший балл. Следовательно, получаем многокрнте- 203
риальную заДачу максимизации, в которой шесть критериев и де* вять возможных решений (оценок). Выберем наилучшее решение в два этапа. Используя алгоритм теоремы 7.1, сначала найдем множество парето-оптимальных ре- шений opt^X, где Х={х<1\ х<4.х<9>). Через ~ обозначим отно- шение неразличимости: а~Ь означает, что не верно ни ни Таблица 7.1 Основные показатели JT1 .г* х» JT4 X* X1 х7 х* Надежность' 10 4 6 9 5 3 3 3 2 Производитель- ность 2 7 8 2 1 8 5 6 5 Экономический эффект • • 3 3 4 . 3 3 0 0 4 3 3 Удобство в экс- плуатации 2 4 5 2 5 2 2 4 1 Простота изготов- ления 2 3 4 1 2 4 7 4 5 Внешнее оформле- ние 4 1 2 3 2 1 7 1 7 Ь^а. Пусть Х1 = Х. Сравниваем решение х<’> со всеми остальными решениями: х(1>/ч-'Х<2), х(1^х<3\ х<*)^х<4\ xW^xW, i=5, 6, 9. Запоминаем парето-оптимальное решение х<*>. Удаляя из X] реше- ния x°J и х<4\ приходим к множеству Х2«={хФ, х<3\ х<®>,х^}. Сравниваем теперь решение хЛ со всеми остальными решениями множества Х2: х(3>^х(2), х®~х1й, ё=5, 6, .... 9. Следовательно, Х3={х(3), .....х(9)}. В результате сравнения решения х<8) с остальными решениями множества Хз получаем Х«={х(3), х<в>, х(7>, х<8)}, причем решение хс*> запоминаем как парето-оптимальное. Аналогично находим Х$=(х<*>, х<9>}, Х6={х<7>, х^}, Х7#=0, при- чем х№— парето-оптимальное решение, так как л57)^>х(9). Таким образом, получено три парето-оптимальных решения: opt>X = {x<l\ jc<a>, jcC”)- Остальные решения оказались заведомо непригодными. На втором этапе из трех решений нужно отобрать наилучшее. Понятие «наилучшее решением здесь четко не формализовано, 204
постом у стр ого обосновать окончательный выбор, невозможно. Необходима дополнительная информация об отношения пр ед поч- тения. Например, если поломка станка может повлечь травму ра- бочего, то главным показателем следует считать надежность и принять решение х*1). Если же это не так, то главным является показатель производительности и наилучшим следует признать решение х<3\ поскольку этот вариант более надежен в эксплуата- ции, чем х(7), и, кроме того, незначительно уступает ему по пока- зателю экономического эффекта. Решение может оказаться наилучшим, если, например, сроки изготовления станка ограниче- ны и определяющим фактором является простота изготовления. Насколько выбранное на втором этапе решение окажется наилуч- шим, в значительной степени зависит от опыта и интуиции лица, принимающего решение. 2. Лексико-графическая транспортная задача. Транспортная задача (см. § 3.4) состоит в определении такого объема перевозок продукции из одних пунктов в другие, при котором транспортные расходы минимальны. Нередко транспортная задача имеет не единственное решение. В таких случаях можно рассматривать лексико-графическую транспортную задачу. Например, если марш- рут, соединяющий некоторые два пункта, перегружен транспорт- ными средствами, то еще одним критерием, подлежащим миними- зации на множестве решений транспортной задачи, может быть объем перевозок по данному маршруту. Рассмотрим конкретную задачу. Пусть т=п=2. fi—2хп -|- ЗХ12+x2i+2хд — mln: ^2^=Х22—’ min; -*и + хтх—3, •X21_hXZ2 — 7, Хц, *12» -*21’ Xjj О- Решим сначала обычную транспортную задачу с критерием fa. Для этого отбросим, например, последнее ограничение-равенство, поскольку оно является следствием остальных ограничений, а из первого и второго равенства найдем —*2i = 3. Окончательно за- дача принимает следующий канонический вид: f J—2хц ЗХ}2 **21 *4” mln; *11» -*12* Х21* -*22 0. Приведем соответствующую этой задаче начальную симплексную таблицу (табл. 7.2). 205
За один шаг можно найти оптимальное решение Хц=0, Xt2=^6, Х21=3, *м=1 и оптимальное значение, равное 20. Следовательно, вторая задача, соответствующая минимизации второго критерия/ на множестве решений транспортной задачи, принимает вид f rnlrtj Таблица 7.2 Оптимальное решение этой задачи xu=0, Xi2=6, x2i=3, хда=1 является искомым лексико-графически-оптимальным решением. Глава 8 ТЕОРЕТИЧЕСКИЕ ОСНОВЫ ОПТИМИЗАЦИИ В ФУНКЦИОНАЛЬНЫХ ПРОСТРАНСТВАХ Материал этой главы вводит в круг вопросов, связанных с за* дачами оптимизации функционалов, и подготавливает к восприя- тию последующих глав. Здесь сформулированы необходимые усло- вия оптимальности для общей задачи математического програм- мирования, являющиеся распространением соответствующих необ- ходимых условий, рассмотренных в гл. 2, на случай функциональ- ных пространств. Приведены условия разрешимости задачи опти- мизации, а также обсуждены численные методы решения. Вспомогательные сведения из функционального анализа (§ 8.1) будут использованы в последующих главах, посвященных вариа- ционному исчислению и теории оптимального управления. Более подробно ознакомиться с аппаратом функционального анализа можно, например, в [14]. 206
§ 8.1. ВСПОМОГАТЕЛЬНЫЕ СВЕДЕНИЯ ИЗ ФУНКЦИОНАЛЬНОГО АНАЛИЗА 1, Линейное пространство. Множество £ называют линейным пространством, если для него выполняются следующие три группы аксиом: А, В и С. А. Задано правило, согласно которому каждой паре элементов х, y^L сопоставлен определенный элемент из L, называемый сум- мой элементов хи у (обозначение: х+у), причем: 1°) сложение коммутативно: х+у=у+х; 2°) сложение ассоциативно: (х+у) +z=x+ (^+z); 3°) существует единственный элемент, который обозначают О и называют нулевым элементом, обладающим следующим свой- ством: х-|-0=х; 4°) для каждого x^L существует единственный элемент из L, называемый противоположным (обозначение: — х), который обла- дает следующим свойством: х+ (—х) = Q. В. Задано правило, согласно которому каждой паре xeL, XeR сопоставлен определенный элемент из L, называемый произведе- нием числа А на элемент х и обозначаемый 7.x, причем: 1°) X (рх) = (Хр) х; 2°) 1-х=х. С. Указанные операции сложения и умножения на число свя- заны следующими равенствами; 1°) X (х+^) =Хх+Ау; 2°) (Х+р)х=Хх4-рх. Заметим, что равенства в приведенных аксиомах должны иметь место для всех х, у, z^L и всех A, p^R. Понятие линейного пространства играет важнейшую роль в ма- тематике и используется почти во всех ее разделах. Приведем ряд примеров линейных пространств. Пример 8.1. Множество всех векторов (направленных отрезков в пространстве), для которых сложение и умножение на число определяются правилами векторной алгебры, является линейным пространством. Пример 8.2. Множество n-мерных векторов с введенными ранее операциями покомпонентного сложения и умножения на число (см. § 1.1) образует линейное пространство. В частности, линейным пространством является множество вещественных чисел. Пример 8.3. Множество всех сходящихся числовых последова- тельностей вида {хА}, для которых сложение и умножение на чис- ло производятся по правилам математического анализа ({х*} + + {У4 {**+ */*}. X {хА} = {Хх*}), образует линейное пространство с нулевым элементом 0 = {0, 0,.. Далее будем в основном рассматривать линейные пространст- ва, состоящие из того или иного класса функций, т. е. функцио- 207
надьные пространства. Напомним, что су хилой двух функций имеющих одну и ту же область определения, является функция, обозначаемая действие которой определяется равенством (Н-£) (*) (*)+£(*)> а произведение числа X на функцию f — это функция Xf вида (V) х=Xf (х) • Пример 8.4. Множество непрерывных на отрезке (a, 6]c:R функций образует линейное пространство, обозначаемое С (а, 6]. Нулевым элементом 0 в этом пространстве является функция, тождественно равная 0 на (а, 6]. Пример 8,.Б. Рассмотрим множество всех функций, имеющих на отрезке [a, непрерывные производные до порядка k включи- тельно. Это множество также является линейным функциональ- ным пространством (обозначение: С\[а, &])• При этом обычно счи- тают, что Со(а> Ь]=С[а, Ь]. Из приведенных примеров следует, что элементы различных линейных пространств могут сильно отличаться, что свидетельст- вует о высокой степени общности понятия линейного пространства. В линейном пространстве, аналогично пространству Rn, вводят линейно независимые и линейно зависимые системы элементов. А именно: систему элементов {xt, Хъ...xm} линейного простран- ства L называют линейно независимой, если равенство XjX, 4-^х2+•.. + К„хт=0 возможно только при Х|—Лз... — Хт—0. В противном случае, т.е. если существуют числа Х|, Х2,..., Хт, среди которых хотя бы одно Л9 отлично от нуля и такие, что 2 4x*=0i система элементов {Х|, х2, - - -, Хт} называется линейно зависимой. Если в линейном пространстве L найдется линейно независи- мая система из п элементов, а любая система, содержащая более чем п элементов, является линейно зависимой, то L называют ко- нечномерным пространством размерности п. В смысле этого опре- деления размерность Rn действительно равна л. Если для любого натурального п в линейном пространстве L можно указать линейно независимую систему из л элементов, то такое пространство называют бесконечномерным. Например, в пространстве С [а, 6] для любого л система элементов вида {1, t, t2r . . . . , /я-1} линейно независима (поскольку равенство Л-1 2 ^*=0 для всех 6] возможно только при Xo=Xi=...^= »-о =Xn-i=0), поэтому С (а, &] — бесконечномерное пространство. Такими же являются и функциональные пространства из приме- ра -8.5. В дальнейшем чаще всего будем иметь дело именно с бес- конечномерными пространствами. По аналогии с Rn в линейном пространстве вводят определения отрезка, соединяющего элементы хе£ и х'е£, и выпуклого мно- 208
жества. Эти определения формально не отличаются от соответст- вующих определений из § 1.2. 2. Линейное нормированное пространство. Линейное простран- ство Е называют нормированным, если для каждого элемента х^Е задано неотрицательное число» называемое нормой элемен- та х и обозначаемое ||х||, причем выполняются следующие аксио- мы: 1°) НхЦ>0; причем равенство Цх||=0 имеет место тогда и толь- ко тогда, когда х=0; 2°) IM=|X|-||xl!,XeR; 3°) 1|х+р|| ||х|1 + ||р|| (неравенство треугольника). Пример 8.6. Пространство Rw, введенное в гл. 1, является нор- мированным :|хД=Их{4-х| 4-где хи хъ...,хп— координа- ты вектора х. В частности, множество чисел R—пример нормиро- ванного пространства, в котором нормой числа является его абсо- лютная величина. Пример 8.7. В пространстве С[а, Ь] непрерывных на [а, Ь] функций x=x(t) норма определяется формулой |4)=niax |л(/)|. Можно проверить, что все аксиомы нормы в данном случае вы- полняются. Пример 8.8. В линейном пространстве С|[а, 6], полагая txl = niax |x(/)|-|-max |х' (/)|, можно убедиться в том, что |(x||i также удовлетворяет всем аксио- мам нормы. Одно и то же линейное пространство можно превратить в раз- ные нормированные пространства, если норму вводить с помощью различных формул. Например, пространство С|(а, Ь] можно пре- вратить в нормированное пространство еще одним способом, вводя норму вида ||х||0. В нормированном пространстве расстояние между любыми дву- мя его элементами определяют по формуле р(х, Я На основании аксиом нормы можно установить следующие свойства расстояния: 1°) Р (*> !/)>0, причем равенство р (х, у)=0 имеет место тогда и только тогда, когда х=у; 2°) Р (хг £/)=р (&х); 3°) р (х, у)<р (х, z) + p (z, у). По аналогии с Rn в нормированном пространстве Е множество вида U. (х0) = [хfl Jx—xj < е} . называют открытым шаром радиуса е с центром в х$ или е,-окре- 209
стностью элемента хоеЕ. Если еХ) мало, то множество t/,(Xo)cr сС[й, Ь] образуют функции, значения которых мало отличаются от соответствующих значений функции Хо=Хо(О (в одних и тех же точках 1&[а, &]). Если элемент х^.Е принадлежит множеству Х^Е вместе с не- которой своей окрестностью, то его называют внутренним элемен- том множества X. Открытое множество — это множество, состоя- щее только из внутренних элементов. Примером открытого множе- ства является множество Us(x0). Говорят, что множество ограничено, если оно целиком содержится в некоторой окрестно- сти нулевого элемента. Последовательность элементов нормированного про- странства Е называют сходящейся к элементу Хо^Е, если limp (ха, Хо) =lim|)Xft—х0||=О; при этом пишут limXA=x0. Множество X нормированного пространства замкнуто, если пре- дел каждой сходящейся последовательности элементов из X при- надлежит множеству X. Если из любой последовательности {х*} элементов множества Xcz.E можно выделить сходящуюся подпосле- довательность, предел которой принадлежит X, то множество X называют компактом. Это определение не повторяет дословно опре- деление компакта из § 1.1. Однако если E^=Rn, то, согласно тео- реме Больцано — Вейерштрасса [16], оба определения эквивалент- ны. Как показывают примеры, в бесконечномерных пространствах не всякое замкнутое и ограниченное множество является компак- том. Говорят, что последовательность pcJcE сходится в себе (яв- ляется фундаментальной), если для любого числа е>0 найдется такой номер N8, что неравенство ||хп—хто||<е имеет место для всех n, Если последовательность {хл} сходится, то она сходится в себе. Действительно, пусть Итхл=х0. Тогда, по определению сходимо- сти, для любого е>0 существует такой номер Afe, что ||хп—х0||< <е/2 для всех x^Nt. Поэтому, согласно неравенству треуголь- ника, ki — К - * J4- ко — J < е/2 + е/2 = Е для всех л, ги^Л7е, что и требовалось проверить. Утверждение, обратное сформулированному выше, справедли- во не всегда. Поэтому введем следующее важное определение. Нор- мированное пространство, в котором всякая фундаментальная последовательность сходится, называется банаховым простран- ством. Согласно критерию Коши о равносильности сходимости в R" сходимости в себе [16], пространство R” является банаховым. Пример 8.9. Рассмотрим нормированное пространство С[а, 6] функций, непрерывных на отрезке [а, 6] с нормой Цх|)о, введенной выше, и выясним, чтб представляет собой сходимость в этом про- 210
странстве. Пусть имеется последовательность {хь}сС[а, Ь], сходя- щаяся к элементу х0. Согласно определениям сходимости в С[а, Ь\ и нормы ||л||0, это означает, что шах |хй(/)— х0(О1-*0, Jt-M) т. е. для любого числа е>0 найдется номер ЛГе такой, что выпол- нено неравенство max |лЛ(0 — *о(ОКв ПРИ всех л^ЛГв. Следо- вательно, справедливо неравенство |лл(/)—x0(f)|<:e для всех и всех fe[a, Ь], что означает равномерную сходимость функ- циональной последовательности {хь} к функции ль на [а, &]. Таким образом, сходимость в пространстве С[а, 6] совпадает с равномер- ной сходимостью функциональных последовательностей, В силу критерия Коши функциональная последовательность сходится рав- номерно тогда и только тогда, когда выполняются определенные условия, которые означают фундаментальность данной последова- тельности [16]. Следовательно, пространство С[о, Ь] является бана- ховым. С помощью аналогичных рассуждений можно убедиться, что введенное выше нормированное пространство CJa, b] также явля- ется банаховым. 3. Функционалы и операторы. Числовая функция многих пере- менных— это отображение, заданное на множестве пространства Rn, т. е. функция, аргументом которой является л-мерный вектор (точка из Rn). Рассмотрение более общего случая, когда аргумент принимает значения из функционального пространства, приводит к понятию функционала. Отображение вида £->R, где L — линейное пространство, назы- вают функционалом. Согласно этому определению, функция многих переменных также является функционалом, так как R" — линей- ное пространство. В дальнейшем термин функционал будем, как правило, использовать для отображений, заданных на бесконечно- мерных функциональных пространствах. Для отображений типа Rn->R сохраним термин функция. Задать некоторый функционал f означает указать множество XcL (возможен и случай X=L) и правило, согласно которому каждому элементу нз X поставлено в соответствие определенное вещественное число. Множество X называют областью определе- ния данного функционала, а множество чисел f (Х) = [уе R]y=/ (л) при некотором х е X} — множеством значений (или образом множества X). Функционал [, для которого И?иХ1+Х2Х2>“М (хО +М (х2) Для всех хь x2<=L; Хь X2<^R, (8.1) называют линейным функционалом. Если L=Rn, то линейный функ- ционал—это линейная функция вида у=(с, х>, где ceRn —неко- торый вектор. 211
Пример 8.10. Каждой непрерывной функции х—x(t) сопоста- вим число вида /(x)=J (8.2) а где у—y(t)—некоторая фиксированная непрерывная функция на отрезке [а, 6]. Тем самым на линейном пространстве С[а, 6] задан функционал. Согласно свойствам определенного интеграла, J S(OI4*iOT+4*s(Ol«= а =Х, J jftfJx.OTdZ+X, у ?(ОХ2(()Л, а а т. е. рассматриваемый функционал линейный. В гл. 1 были введены вектор-функции с множеством значений из пространства R'n. Понятие вектор-функции более общее, чем по- нятие числовой функции, так как последнее является его частным случаем при т=1. Аналогично, обобщая понятие функционала, придем к следующему определению. Отображение вида Lj->-Z.2, где Li и — линейные пространства (возможен и случай Li=L2), называют оператором. Для операто- ра термины область определения и образ используют в том смысле, что н для функционала. Если для оператора f выполняется равен- ство (8.1), то его называют линейным оператором. В случае £з= — Rm оператор f является векторным функционалом, т. е. f— (fi, b. fm)t где h, f2, fm — функционалы, заданные на простран- стве Li- Сопоставим каждой числовой функции x=x(t), заданной на от- резке [а, 61 и имеющей производные любого порядка, ее производ- ную x'(t). Это отображение является примером линейного операто- ра (оператора дифференцирования) типа С«[а, 6], где С«[а, Ь] — линейное пространство функций, имеющих производные любого порядка (пространство бесконечно дифференцируемых функций). Пусть функционал f определен на некотором множестве X нор- мированного пространства и х0— элемент множества X. Говорят, что функционал f непрерывен в х0, если для любого числа е>0 можно указать такое число бв>0, что для всех элементов хеХП Л£\(.*о) выполняется неравенство |f(x)—f(xo) | <е. Для того что- бы из этого определения получить определение непрерывного в х0 оператора f:X-*Y, следует неравенство |f (х)—f(xb) |<е заменить на ||f(x)—f(x0)||<e, где ||...|| — норма пространства У. В пространстве Rn линейная функция у=(с, х> непрерывна на Rn. В бесконечномерных пространствах существуют линейные фун- кционалы, не обладающие свойством непрерывности. Примером ли- 212
нейного непрерывного на С[а. А] функционала служит функционал 7, который определяется формулой (8.2). Рассмотрим множество всех линейных непрерывных функцио- налов, заданных на некотором банаховом пространстве И. Будем считать, что на этом множестве заданы операции сложения и ум- ножения функционала на число, определяемые теми же формула- ми, что и для функций. В этом случае всё аксиомы линейного про- странства выполняются, а значит рассматриваемое множество является линейным пространством линейных непрерывных функцио- налов, которое называют сопряженным с В и обозначают В*. Ну- левым элементом пространства В* является линейный непрерывный функционал,, сопоставляющий каждому элементу х^В число 0. Значение элемента с сопряженного пространства В* на элементе х^В обозначают с(х) или <с, х)в- Второе обозначение аналогично скалярному произведению векторов, и его можно объяснить тем, что (R7*)*— это множество линейных функций вида у=<с, х>, ceRn. § 82. НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ В ЗАДАЧАХ БЕЗ ОГРАНИЧЕНИИ 1. Дифференцируемые функционалы. Пусть х0 — внутренний эле- мент множества ХеВ, где В — банахово пространство. Функцио- нал f {заданный на X) называют дифференцируемым в *о» если су- ществует линейный непрерывный функционал р^В* такой, что для всех элементов АеВ, удовлетворяющих условию (хо-|-Л)^Х, име- ет место представление /(JC0+ft)=/(x0)+<p, Л)в-|-г(л0, Л), где функционал г(хо, Л) обладает свойством Нт (|г(л0> А)|>|)=0. Последнее равенство означает, что по каждому числу е>0 мож- но указать такое бв>0, что для всех элементов Л, Л#= 0. удовлет- воряющих неравенству ||А||<бе, выполняется неравенство |г(х0> А) |/||А||<8. Функционал р называют градиентом (или про- изводной) функционала /, вычисленным в х0. При этом использу- ют обозначение Vf(x0) или f'(x0). В случае B=Rn данное опреде- ление дифференцируемого функционала совпадает с определением дифференцируемой функции из § 1.3. Рассмотрим заданный на пространстве CJa, А] функционал 7 вида I (х)= [ F (t, х (/), х' (/)) ё/, (8.3) а где F — заданная на [a, A]XR2 фиксированная, дважды непрерыв- 213
но дифференцируемая функция трех переменных. Имеем i /(x+*)-/(x) = j IF(Z, *от+Л(О, х'Ю+*'ОТ)- а -F(tt л (0, x'(O)id/. Используя для функции F формулу Тейлора (по второй х и треть- ей х' переменным), можно записать /(л-|-Л)— /<х)=р(А)Ч-г(л: Л), где рЧС х£),ж'<0)А(0+^«- *«)• (8.4) а Ь Г(х, Л)=± ([^.Л2(О+2-^7й(/)Л-ОТ+^-Л'2«)]<11. (8.5) 2 J I дх* . дхдх' дх^ I В правой части равенства (8.5) вторые частные производные вы- числены в «средней точке> (t, x(t)+6(O *М0. *'(0+8(0 ‘Az(0)» где О<0(О < 1 при 6]. В силу линейности интеграла функционал р линеен по й: р(МА14-Х2Й2)=Х)р(й1)Ч-Х2р(й2). Убедимся в его непрерывности. Пусть С — число, которое больше, чем каждое из наибольших зна- чений модулей производных dF(tt x(t)t x'(t))/dx, dF(t, x(t), x'(t))/dx' на отрезке [a, 6]. Тогда по формуле (8.4), используя из- вестные свойства интеграла, получаем неравенство ь |P(Ai) — Р(Л2)| < f max а ([£| -IMO-MOI + дх которое влечет непрерывность функционала р. Теперь, чтобы окончательно доказать справедливость равенства p=V/(x), остается убедиться, что верно соотношение lim|r(x, й) /||й||] = 0. Для этого достаточно проверить неравенство |г(х, й) ^у|1й|112, где у—положительная константа. Так как ||Л|1г*0, можно ограничиться случаем HhJIC 1. Обозначим через А положи- тельное число, которое больше каждого из чисел |sup d2F/dx2|, | sup d2Fjdxdx' |, | sup <32F/dx'2|, где супремум вычисляется на мно- жестве II x'(t))c№. Согласно определению нормы (£(в, Ф 214
ПЛ||]„ для всех t^[a, д] имеют место неравенства |h(f) | ^||Л|1ь | <||Л[|ь Учитывая это, из формулы (8.5) получаем » |г(х, Л)|< 4" Г Ь|»>1+2Л|4|?+Л|»ЙШ= * *7 а = 2Л.|д-а|.|Л#=у|< где у=2Д*|Ь—а|. Таким образом, доказано следующее утверж- дение. Теорема 8.1. При сделанных выше предположениях функционал 1, определяемый равенством (8.3), является дифференцируемым на каждой функции хеС([а, Ь] и его градиент задается формулой ь <v/(x), Л)С1[в,»] = | fFxft(n+F>*'(/)]d/, (8.6) а где Fx=dF (/, х (О, х' (Л)/<Эл; /v=dF (t, х (О, xr (f))/dxr. 2. Необходимое условие оптимальности. Здесь знакомое по гл. 2 необходимое условие оптимальности, состоящее в том, что гради- ент в точке экстремума равен нулю, распространяется на функцио- налы, заданные на множестве банахова пространства. В гл. 2 при- ведена постановка задачи оптимизации целевой функции на мно- жестве евклидова пространства и введена соответствующая терми- нология (допустимое решение, оптимальное решение, глобальный и локальный минимумы, задачи безусловной и условной оптими- зации и т. Д.). Задача оптимизации функционала на множестве функционального пространства по форме не отличается от случая евклидова пространства и связанная с ней терминология совпада- ет с соответствующими определениями из гл. 2. Пусть X—подмножество некоторого линейного пространства L и f— (целевой) функционал, заданный на X. Говорят, что элемент хо^Х реализует (доставляет) минимум в задаче минимизации /(л)— min, хеХ если неравенство f(xa)^f(x) выполняется для всех хеХ. Если X совпадает со всем рассматриваемым линейным пространством, то получаем задачу без ограничений (задачу безусловной оптимиза- ции); в противном случае имеем задачу с ограничениями (задачу условной оптимизации). Приведенная ниже теорема дает необходимое условие экстре- мума в задаче безусловной оптимизации функционала на всем ба- наховом пространстве. Теорема 8.2. Пусть функционал f задан на банаховом простран- стве В и дифференцируем в Хо^В. Для того чтобы элемент х0 реа- 215
лизовал безусловный минимум (или максимум) функционала f, не- обходимо, чтобы имело место равенство vf (*о)=О. (8.7) □ Пусть W(xo)=#0 . Тогда существует элемент Ьа&В, для ко- торого <Vf(x0), Ло>в=/=О. Будем считать, что <Vf(*o). Ло>в<0 (ес- ли имеет место противоположное неравенство, то оно легко приво- дится к виду <VJ(jc0), —Ло>в<О). На основании определения диф- ференцируемости, используя свойство линейности градиента, запи- шем равенство /(Xo+^-ZW^Rv/(*<>). Мд + . Знак выражения в квадратных скобках при X, достаточно близком к нулю, определяется знаком первого слагаемого. Поэтому суще- ствует такое Х)>0, что при Х=Х0 правая, а значит, и левая части записанного равенства являются отрицательными. Это несовмести- мо с тем, что Хо — минимальный элемент. Следствие 8.1. В, условиях доказанной теоремы, для того чтобы элемент х0 реализовал безусловный экстремум функциона- ла ft необходимо, чтобы выполнялось равенство (у/ С*о)> Л}в=0 для всех h^B. (8.8) Левую часть равенства (8.8) называют первым дифференциа- лом или первой вариацией функционала f в хо. Следствие 8.1 ут- верждает, что необходимым условием экстремума является тожде- ственное равенство нулю первой вариации функционала. Условие оптимальности (8.8) допускает обобщение на опреде- ленный класс задач условной оптимизации. Рассмотрим множе- ство Н вида HczB, для которого сумма любых двух элементов из Я, а также произведение любого элемента из Н на произвольное вещественное число, принадлежат Н. Зафиксируем элемент хо^В и введем множество Вн={х^В\х—х^-\-Ь. при некотором ЛеН\. Очевидно, если то MtoeW при любом вещественном X, а зна- чит, и хо+ХЛоеВ^. Учитывая этот факт и анализируя доказательст- во теоремы 8.2, убеждаемся, что оно сохраняет силу и в том слу- чае, когда Хо реализует условный минимум функционала f на мно- жестве Вн. Следствие 8.2. Пусть функционал f определен на банаховом пространстве В и является дифференцируемым в XqgB. Для того чтобы элемент х0 реализовал условный минимум (или максимум) функционала f на множестве Вн, необходимо, чтобы выполнялось равенство (v/(Ai)’ Л)а=0 для всех h^H. 216
По аналогии с конечномерным случаем функцию х, удовлетво- ряющую равенству V/(x) = 0> будем называть стационарной. Та- ким образом, решение задачи оптимизации (если оно существует) следует искать среди стационарных функций. В п. 1 было показано, что записать градиент функционала сложнее, чем градиент функ- ции. Кроме того, решение уравнения Vf(x) = q уже в конечномер- ном случае — сложная вычислительная -задача, в бесконечномер- ном же варианте трудности резко возрастают. Следовательно, не- посредственно решить функциональное уравнение Vf(x)=0 прак- тически невозможно. Поэтому обычно конкретизируют целевой функционал и выделяют классы оптимизационных задач, для ко- торых, учитывая специфику данного класса, удается получить усло- вия, равносильные равенству Vf(x)=0 и такие, чтобы их было можно проверить. Один из таких классов задач составляет пред- мет изучения вариационного исчисления. § 8.3. ПОНЯТИЕ О ВАРИАЦИОННОМ ИСЧИСЛЕНИИ 1. Постановка простейшей задачи вариационного исчисления, В простейшей задаче вариационного исчисления среди всех плос- ких кривых, являющихся графиками функций вида х=х(() и про- ходящих через две заданные точки Л (Л, х() и B(^t х2), тре- буется выделить такую кривую, на которой реализует свой мини- мум интегральный функционал / (х) = J F (Z, jc (О, X- (fl) dt, (8.9) ' t. где F — некоторая фиксированная функция трех переменных. Бу- дем считать, что F дважды непрерывно дифференцируема на R3 й что таким же свойством на отрезке [/|, /2] обладает искомая функ- ция х(/)_ Если, например, в качестве F взять функцию вида F = = то интеграл (8.9) определяет длину кривой и простей- шая вариационная задача заключается в определении плоской ли- нии кратчайшей длины, соединяющей точки Л и В. 2. Уравнение Эйлера — Лагранжа. Для получения необходимого условия оптимальности в сформулированной выше задаче восполь- зуемся следствием 8.2 из § 8.2. Для этого обозначим через Н мно- жество всех дважды непрерывно дифференцируемых функций h = =/:(/), заданных на отрезке [fj, /2] и удовлетворяющих условию А (/1)=Л(/2)=0. (8.10) Очевидно, сумма любых двух функций из Я, а также произведе- ние каждой функции из Н на произвольное число принадлежат введенному множеству Н. Пусть функция х=х(0 является решением простейшей зада- чи вариационного исчисления. Рассматривая сумму х-|-й при раз- 217
личных h^H, получаем множество всех возможных дважды непре- рывно дифференцируемых функций, графики которых проходят через точки A (Zb xj и 5(/2, х2). Обозначим это множество через Вн. Тот факт, что функция x~x(t) является решением простейшей задачи вариационного исчисления, означает, что элемент х банахо- ва пространства CJZj, G] реализует условный минимум функциона- ла (8.9) на множестве Вн, Поэтому, согласно следствию 8.2, учи- тывая теорему 8.1, делаем вывод, что функция х—х (/) удовлетво- ряет равенству х(О, x4/))A(Z)+Fx4/. х(0, xW(/)|(V«O (8.11) для всех функций h = h(t), подчиненных условию (8.10). Вычислим интеграл от Fxh'(t)t применяя формулу итерирова- ния по частям * и учитывая равенства (8.10): Л (Z)dt. Равенство (8.11) принимает вид (8.12) для всех функций h=h(t), удовлетворяющих равенствам (8.10). Теперь, для того чтобы произвести дальнейшее упрощение и «избавиться» в (8.12) от интеграла, докажем вспомогательное утверждение, которое называют первой основной леммой вариаци- онного исчисления. Лемма 8.1 (лемма Лагранжа). Пусть со — непрерывная на от- резке [/), /2] числовая функция одной переменной t. Если равенство J ц>(/)Л(Пй/=0 (8.13) л имеет место для любой дважды непрерывно дифференцируемой функции h=h(t), удовлетворяющей условию (8.10), то &>(/)=0 для всех /2]. □ Пусть в некоторой точке отрезка (Л, Z2] значение функции со отлично от нуля (для определенности будем считать его положнтель- * Аккуратное применение формулы интегрирования по частям требует двукрат- ной дифференцируемости функций F и х. В гл. 9 эти требования к функции х будут ослаблены. 218
ным). В силу непрерывности функции со существует отрезок (Г, t"jc: cz(/j, 6). на котором й)(0>0. Введем функцию (/-Г)»(Г-/)8 для t <= [Г, П> О для остальных точек отрезка |/и /2|. Эта функция дважды непрерывно дифференцируема и удовлетворя- ет граничным условиям fto(fi)=fto(/s)=0. Следовательно, равенст- во (8.13) сохранится, если h(t) заменить на йо(О- С другой сторо- ны, используя определение йо и учитывая, что w(/)>0 при /"], получаем противоречие G Г j ш (О МО dZ = [ (О (О (/ — Г)3 (/" — /)’ d/ > 0. ь *' Принимая во внимание равенство (8.12) и лемму 8.1, приходим к следующей теореме. Теорема 8.3. Если функция x=x(t) является решением прос- тейшей задачи вариационного исчисления, то она удовлетворяет дифференциальному уравнению Fx(t> х, х')—л, х')=0, аг (8.14) которое называют уравнением Эйлера — Лагранжа. Замечание. Из приведенного доказательства следует, что уравнение Эйлера — Лагранжа представляет собой более простую запись равенства Vf(x)=0, которую удалось получить, учитывая специфику простейшей вариационной задачи. Таким образом, функция х—х(1) является стационарной тогда и только тогда, ког- да она удовлетворяет уравнению Эйлера — Лагранжа. Воспользуемся необходимым условием (8.14) в задаче опреде- ления кратчайшей плоской линии, соединяющей точки А и В. Име- ем F = J/" 1 +х'*» и так как Fx=0, Fж»=л7УГ14-х,’1 то получаем уравнение Эйлера — Лагранжа вида d откуда последовательно находим: x'fy 14-xz’=C, х'=Сь х= — Cjf-I-Ca, где постоянные С(, определяют, используя граничные условия прохождения найденной линии через точки А и В. Как и следовало ожидать, кратчайшей линией, соединяющей две точки, является прямая. $ 8.4. НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ В ЗАДАЧАХ С ОГРАНИЧЕНИЯМИ 1. Постановка общей задачи математического программирова- ния. Пусть X — линейное пространство, на котором заданы функци- 2)9
оналы f, gi, g2* ...» gk и оператор Gt принимающий значения в ли- нейном пространстве У. Общая задача математического программи- рования имеет следующий вид: / (х) —* mln при ограничениях gj(x)<0, /=1, 2,..., А, G (х)=Ь- (8.15) (8.16) (8.17) Если y=Rm-A, m>A, то оператор G является векторным функцио- налом б=(£л+ь ...» gm) иограничение (8.17) в «покоординатной форме» записывается в виде равенств gj(x)=O, /== А-|-1 т. В этом случае общая задача математического программирования отличается от задачи математического программирования (2.31) с ограничениями в форме неравенств и равенств только тем, что в ней вместо функций рассматриваются функционалы. Если, про- странство У бесконечномерно, то ограничение (8.17) можно тракто- вать как бесконечную систему равенств. В класс общих задач, математического программирования вхо- дят задачи, являющиеся предметом изучения вариационного исчис- ления и теории оптимального управления. Более подробно эти два направления теории оптимизации рассмотрены в последующих гла- вах. Здесь ограничимся формулировкой соответствующих задач. При этом фигурирующие в них линейные пространства конкретно указывать не будем. В вариационном исчислении исследуются задачи с целевыми функционалами следующих трех типов. 1) Интегральный функционал задается формулой /(х) = f F(t, х(О, х'(О)«. где х=х(О—л-мерная вектор-функция вида л(/) = (*i(0. *1(0. Хп(О). *'(0 = (*'i(0. х'г(0» ...» *'п(0). ?— числовая функция 2п-|-1 переменной. Функционал такого вида при л=1 участвует в формулировке простейшей задачи вариационного исчисления. 2) Терминальный функционал определяется равенством V(х)=ф|х (/)|/.в, х (0|f где ф — числовая функция двух переменных. 3) Смешанный функционал представляет собой сумму интег- рального и терминального функционалов: J Fa. х(Л, x'(t)) d/-HIx(/)|/-a, х(/)М. Если в вариационной задаче ограничения имеют вид системы функциональных равенств gi (х)—Л=0, gz(x)—/2=0, .... gh(x)— 220
—1&—0, где Яь gz, ...t — функционалы и /j, Ь.... Z*eR, то ее называют изопериметрической задачей. В более сложных вариационных задачах встречаются диффе* ренциальные ограничения (дифференциальные связи), имеющие вид х(/), л'(0)»0, Z=l,2,...,m; /<=[а, А], где В1( D2, Dm — числовые функции 2л4-1 переменной. В част- ности, при m-п дифференциальные ограничения могут иметь сле- дующий вид: /=1,2,..., л, (8.18) где Фь ф2> .... q>n — числовые функции п-|-1 переменной. Ограниче- ния (8.18) представляют частный случай общего ограничения (8.17). Для того чтобы убедиться в этом, обозначим через функ- ционал, который определен на рассматриваемом линейном про- странстве векторных функций х=х (t) формулой О/(х)=л;—<р,(/, х), / = 1,2,..., п. Равенства (8.18) равносильны равенствам Gi (х) = Q , х=1, 2. л, которые, вводя векторный функционал G=(Gi, G2, .... Gn), мож- но записать в виде (8.17). Во всех указанных выше вариационных задачах фигурируют только первые производные искомой функции. Задачи, в целевой функционал (а также ограничения, если они имеются) которых входят производные более высокого порядка, называют задачами высшего порядка. сЭти задачи наиболее трудны для исследования. В задаче оптимального управления имеется два типа переменных: переменные состояния x=x(f) (n-мерная вектор- функция) и переменные управления u = u(t) (m-мерная вектор- функция). Целевой функционал в общем случае может быть сум* мой интегрального и терминального членов ь j F(t. х(0, и(0)(И+ф[хОТ|,-., xOTfc_»I, в а дифференциальные ограничения, которые обязательно присутст- вуют в задаче, обычно имеют вид (/, х, ц), i— 1, 2,..., п. Здесь f, ф(, i= 1, 2*,.... п — функции n-|-m-|-l переменной. Кроме то- го, в задаче оптимального управления имеется ограничение на воз- можность выбора переменных управления: при е[а, Ь], где U обычно замкнутое ограниченное множество евк- лидова пространства. Подобных ограничений в классических вари- ационных задачах нет. 2. Необходимые условия оптимальности. Задачи условной опти- мизации в бесконечномерных пространствах более разнообразны и 221
сложны, чем конечномерные задачи. Однако ограничения в этих задачах можно также учитывать с помощью функции (функцио- нала) Лагранжа, являющегося аналогом функции Лагранжа из гл. 2. При этом необходимое условие оптимальности в дифферен- цируемом случае заключается в равенстве нулю градиента функции Лагранжа. Для того чтобы сформулировать необходимые условия оптимальности для задачи (8.15)—(8.17), введем понятия диффе- ренцируемого и сопряженного операторов. Пусть задан оператор G: Х->-У, где X, У — некоторые банаховы пространства. Дифференцируемый оператор определяется анало- гично дифференцируемому функционалу. А именно: оператор G диф- ференцируем в х0 если существует линейный непрерывный опера- тор Р: Х-*-У такой, что для всех элементов ЛеХ, удовлетворяющих включение (хоЧ-А) еХ, имеет место равенство О (х0+Л)=0 (Xq) +Р (А) + R (х0, й), причем оператор 7?(хо, А) со значениями в пространстве У облада- ет свойством Игл (|/?(х0, Л)|К/ИХ)=О, 1И|х-м> где II..-IU и Ц...||у — нормы в соответствующих пространствах. Опе- ратор Р называют, градиентом (производной) оператора G и обо- значают VG(x0). Для обозначения значения градиента в й будем использовать запись VG(x0) (Л). Пусть, например, А:Х-»-У — линейный непрерывный оператор и хоеХ — произвольный элемент. Тогда VA(x0)=A, т. е. градиент такого оператора совпадает с самим оператором. Это следует из равенства Л(хо-|-й) =А (хо)+Л(Л), выполняющегося в силу линей- ности оператора А. Рассмотрим линейный непрерывный оператор Ф, действующий из одного банахова пространства в другое: Ф: Х->У. Линейный не- прерывный оператор Ф*: У*-*-Х*, где X* и У* — сопряженные про- странства, называют сопряженным по отношению к Ф, если равен- ство <с, ф (х)>у=<ф*(с), х>х выполняется для всех хеХ, се У*. Для общей задачи математического программирования функ- ция (функционал) Лагранжа определяется формулой L{xt Xt, Хо, Xlt..., ХА)=Хо/(x)-f-“kjgf (х)-|-(Хж, O(x))y,J /-1 где (Ao, Zi.ln)eRk+,1 Х«еУ*. Числа Xo, Xj, .... Xx вместе с линей- ным непрерывным функционалом Х« называют множителями Лаг- ранжа. В частном случае, когда G— векторный функционал G— ~ (ffft+i. Ят), Т. е. когда y=Rm-ft, m>A, последнее слагаемое в выражении для функционала Лагранжа упрощается: (Ч, G(x)),=2 \gjW. (8.19) /-*+1 222
где (Хл+ь ...» Xm)eRm“ft. Таким образом, чтобы «обслужить» конеч- ную систему функциональных ограничений, требуется конечное чис- ло числовых множителей Лагранжа. Если же пространство Y бес- конечномерно, то в функционале Лагранжа присутствует «функци- ональный множитель» X*. Следующая теорема, доказательство которой можно найти в [2], представляет собой распространение теоремы 2.6 на случай функциональных пространств. Теорема 8.4. Пусть X, У— банаховы пространства. Предполо- жим,, что оператор G: X-+Y и функционалы f, gt, gz, ...f gk непре- рывны и дифференцируемы в некоторой окрестности элемента Ха^ еХ, удовлетворяющего ограничениям (816)—(8.17), причем гра- диент оператора VG(x0) является непрерывным в х0. Кроме того, будем считать, что образ пространства X при отображении VG(xo), т. е. .множество ^С(х0)(Х)с:У, замкнут. Для того чтобы элемент Хо был решением задачи (8.15)—(8.17), необходимо, чтобы сущест- вовали одновременно не равные нулю множители Лагранжа * /=1, 2,.... А; Х,еУ‘, такие, что VjZ, (Х(), X*, (Xg) -f- A + 2 M^(xo)+(vO(x0))*(^)=C, >1|2.....A. (8.20) Если, кроме того, выполняется условие регулярности: VG(x0)(X) = = У и существует такой элемент х^Х, что VG(xo)(x)=O, (.Vgj(x0), x>x<ZQ для всех тех индексов /, 1^/^А, для которых gi(XQ)—Q, то в равенстве (8.20) можно положить !Хо=1. В частном случае векторного функционала 6= (gft+i, ..., gtn), учитывая равенство (8.19), необходимое условие оптимальности (8.20) при выполнении условия регулярности можно записать в следующем виде: ?/(*о) +2 x/Vg/(-*o)=O, что совпадает с соответствующим необходимым условием теоре- мы 2.6. $ ВЛ. РАЗРЕШИМОСТЬ ЗАДАЧИ ОПТИМИЗАЦИИ 1. Пример задачи оптимизации, в которой оптимального ре- шения не существует. Рассмотрим задачу минимизации интеграль- ного функционала, определяемого формулой Зс/2 /(x) = f (л'*(О-*2(О)<1/ * Здесь имеется в виду, что либо среди чисел Ао, А...... А* имеется отличное от нуля, либо все эти числа могут быть равны нулю, но А, =А0. 223
на множестве функций из пространства Ci[0, Зл/2], удовлетворяю- щих граничным условиям лс(О) =х(Зл/2)=0. Это простейшая за- дача вариационного исчисления, для которой уравнение Эйлера — Лагранжа имеет вид х"4-х=0. Общее решение такого дифферен- циального уравнения определяется формулой л=С[sinН~С2cost Единственная функция этого семейства, удовлетворяющая задан- ным граничным условиям, есть х0=х0 (/)=(), te[0, Зл/2] Таким об- разом, в данной задаче имеется только одна стационарная функ- ция. Казалось бы, что именно она и должна быть оптимальной. Од- нако это не так. В данной задаче оптимальное решение вообще отсутствует, так как целевой функцио'нал не ограничен снизу. На- пример, для последовательности допустимых функций вида хп (/) = sin 2t/3, п= 1,2,.... имеем Зж/2 ,. , (* /4rtf « 21 - .2 21 \ .. 5лп2 /(л.)= ! — cos2------л2 sin2— ш=----------------- — со. " J I 9 3 3 ) ]2 я— и Сама стационарная функция х0 не реализует даже локального минимума функционала. Действительно, рассмотрим последовательность допустимых функ- ций хп(/) = (1/л) sin2//3, 2, ... . Для этой последовательности имеем I 1 л I 12 2/15 |хя — х0Ц1 = max I— sin 2//3 + max —cos — = — О, 1 tetcwd n '| fta[0.3«/2] |3л 3| Зл а значит, хп-»-хл т. е. в любой окрестности элемента х0 найдутся элементы по- следовательности {in}. Вычисляя значение функционала на членах этой после- довательности Зж/2 ' <*> “ J (9^-“” Т - sin! f)d ‘ “ -1^ < 0=' О убеждаемся в том, что элемент х0 не может реализовать локальный минимум. Рассмотренный пример показывает, насколько важно быть уве- ренным в существовании оптимального решения. Если оптималь- ное решение существует, то оно находится среди стационарных элементов; только в этом случае при условии единственности стаци- онарного элемента можно справедливо заключить, что он же явля- ется и оптимальным. 2. Обобщенная теорема Вейерштрасса. В функциональных пространствах справедлива теорема, аналогичная теореме Вейер- штрасса: непрерывный функционал достигает своего минимально- го (максимального) значения на компактном множестве. Ниже сформулирована и доказана более общая теорема, в которой тре- бование непрерывности функционала заменено более слабым тре- бованием полунепрерывности, что расширяет область ее приме- нения. Напомним определение непрерывного функционала. Функцио- нал заданный на множестве X нормированного пространства, непрерывен в хоеХ, если для любого числа е>0 можно указать 224
такое Число б«>0. чго для всех L\(a'j) выполняется нера- венство rnwwil<®‘ <8-2S* Неравенств©' (8,21) эквивалентно двум следующим неравенствам:’ / (X) > / W “е. / (х) < / Uo)+в. (02) I по- Определение полунепрерывного функционала можно получить на определения непрерывного функционала, Заменяя неравенстве» (8J!) одним иэ неравенств (8J2) . А именно: -функциейал / назы- вали: лолркодредыекмм ошар (сверху) a XoSX, если дли любого ®>С существует бя>0 такое что для всех элементов €\(хф) выполняется ле. ьой (яравое) неравенство (8J2), Из определений следу ет, что нелре рывный функционал лол у непрерывен (как снизу, так и сверху), но не н?обо- рот. При ЛеЦя получаем определение полунепрерывной функции. Простым .при- мером полунепрерывной сверху функции служит функция- р=[х] («целая часть числа л»)„ график которой изображен на рис. 8.1. Из неравенств (8,22) следует, что функций ня л =/ полунепрерывен снизу,, если функционал лу непрерывен сверху. Если функционал f полунепрерывен снизу (сверху) на -каждом, элементе множества К, то его называют лелдоепрерывякл ошзр (mepjq/J шг хчлз^еетж X Теорема S.5, £Ьш ляодажстед А нодавровдямодо пространств® №.мли,кт.чо, а фуик^ц.пн:й!Л / лолдоелрерывея снизу (сверху) яд X, то задача оптимизаций: / U) т(п (/ (х) -» nmi ТЕХ лгбЛ цлтеет решение* О Ограничимся рассмотрением задачи минимизации и обозна- чим Л=: Ы f(x). По определению' точной нижней грани, сущест- лг^Х . Р' нует мввнмизирующая последовательность*1, т, е. последователь- ность. элементов (хп)еХ такая, что. Vim |(хп) =Л* В сяду компакт- л-*- ... р| кости множества X найдется такая: последовательность йЬмеррв. {njtl^Wp что предел последовательносж [x^j принадлежит X’, т. еЛШхя х-и^Х. Используя тот факт, что функционал f полу- непрерывен снизу и го, получаем, что. для каждого числа e-m=l/m, ’ Определение MWHHMiOHpTOmeft последоьагед ыностн для мяячл и нкиммз-шна функции дало к §-2„2. Для задачи мннммнэяцнь функционал* э*о определемне яиал&гнчт, ..... в—зав 2И
(m= 1,.2,...) найдется число 6m> 0 такое, что для всех xeXf|47jm (х0) верно неравенство f(x)>f(x0)—1/m. Следовательно, так как хПл—»х0, можно указать последовательность номеров {л,„}о{пх), обладающую следующим свойством: f (хЛя)) >/(*о)—1Ди, т«1, 2,.„ Отсюда, переходя к пределу при т-+<х>, получаем Л = 1пп/(хЯт)>: ^Дх0), что вместе с неравенством Л</(х0), вытекающим из опре- деления Л, приводит к равенству /(хэ)=Л. Таким образом, х0— решение задачи минимизации. Пусть минимизирующая последовательность {хп} в задаче ми- нимизации функционала f на множестве X (не обязательно ком- пактном) сходится к элементу Xq^X. Если функционал полунепре- рывен снизу в х0, то, повторяя рассуждения, использованные при доказательстве теоремы 8.5, придем к заключению, что элемент Хо является решением данной задачи минимизации. Сформулируем полученный результат в виде следствия. Следствие 8.3. Пусть функционал f определен на множестве X нормированного пространства и последовательность элементов {хя) такова, что lim/(x„)=inf/(х), Jimxn=xoeAr. Тогда если функционал f полунепрерывен снизу в х0, то элемент х0 реализует его наименьшее возможное значение на множестве X. Это утверждение используют при обосновании численных мето- дов решения задач оптимизации в функциональных пространствах. § 8.6. О ЧИСЛЕННЫХ МЕТОДАХ ОПТИМИЗАЦИИ В ФУНКЦИОНАЛЬНЫХ ПРОСТРАНСТВАХ 1. Возможности обобщения численных методов нелинейного программирования. В гл. 5 были рассмотрены численные методы приближенного решения задачи минимизации числовой функции на некотором допустимом множестве евклидова пространства R” (а также на всем пространстве Rn). Это метод покоординатного спуска, градиентные методы, метод Ньютона, метод условного гра- диента, метод сопряженных направлений и т. д. Среди них только в методе покоординатного спуска используется -«конечномерность» пространства R”, и поэтому его нельзя распространить на задачи минимизации функционалов. Остальные же методы (возможно, с некоторыми непринципиальными поправками) можно обобщить на задачи в функциональных пространствах *. При этом соответст- вующие утверждения о характере сходимости этих методов будут аналогичны конечномерному случаю. Более подробно ознакомить- ся с обобщениями численных методов нелинейного программиро- вания на задачи в функциональных пространствах можно в [9]. 2. Метод Ритца. Рассмотрим кратко численный метод, который используют для оптимизации функционалов, не имеющий аналога * Для обобщения методов второго порядка требуется понятие двукратной диф- ференцируемости функционала, которое здесь не определялось. 226
в нелинейном программировании. Его суть заключается в сведе- нии решения бесконечномерной задачи оптимизации к решению последовательности конечномерных задач. Предварительно введем некоторые определения. Пусть фь <р2. фп—элементы нормированного пространства X. Множество Х(ф(.. фп], состоящее из всех возможных линейных комбинации элементов фь фз,.... фп» называют линейной оболочкой этих эле- ментов, т. е. К[Т1...<p„]=|;ceXlx=V при некоторых X(eR, /=1* 2....я) Говорят, что последовательность элементов нормирован- ного пространства X полна в X, если для каждого элемента х^Х и произвольного числа £>0 можно указать такое натуральное чис- ло л и элемент хеК[фь —»Фп], что ||х—лг0||<е- Например, в про- странстве непрерывных функций полной является последователь- ность многочленов 1, /, /2,.... (14]. Теорема 8.6.. Пусть }— непрерывный'функционал на нормиро- ванном пространстве X, который достигает глобального минимума в хо^Х. Предположим, что имеется такая последовательность эле- ментов [’рА|Г-1С:Х’, что: 1) последовательность {<рд} полна в X; 2) для каждого натурального п существует элемент jcnsKfoi,..., фпЬ удовлетворяющий равенству f (хл) ~ min / (х). (8.23) -Г^:^[Рц.’чУд) Тогда последовательность (хп} сходится к минимуму по функцио- налу, т. е. Jim f(xn)—f(xQ). Зафиксируем Произвольное е>0. В силу непрерывности функционала f существует б>0 такое, что для всех хе(/4(х0) вер- но неравенство f (л)—/ (*о) <е- (8.24) Последовательность {ф*} полная, поэтому существуют натуральное я и элемент хе/^фь <.,фп), для которых ||х—дсо||<6, т. е. выполня- ется включение хе(Л(хо). Значит, для этого элемента х верно не- равенство (8.24), т. е. f (х)-/(Хо)<е, х (= К ]ft, ....ГпЬ Согласно второму условию теоремы, найдется элемент xrtG ^Мфь ф2,...,фп], для которого выполняется равенство (8.23). Сле- довательно, для указанного хп справедливо и неравенство /(-*„>-/WO (8.25) 8* 22Т
Очевидно, что с увеличением номера п множество К[<р..., <рп] ста- новится разве что шире и поэтому числовая последовательность {/(хп)} не возрастает. На основании этого можно сделать вывод, что неравенство (8.25) имеет место не только для указанного номе- ра п, но и для всех бдльших номеров. Отсюда, учитывая, что е произвольно, получаем.требуемое. Из доказанной теоремы вытекает следующий способ прибли- женного решения задачи минимизации непрерывного функциона- ла. Выбирают последовательность функций обладающую свойствами 1) и 2) теоремы 8.6, и далее последовательно решают задачи вида "(8.23) при п=1, п=2 и т. д. Получающаяся в резуль- тате последовательность функций Х\*, хг‘, ... сходится к минимуму по функционалу. Заканчивая процесс вычислений на некотором й-м шаге, получают значение /(хь*), приближенно равное глобаль- ному минимуму (при этом сама функция Хц* может «сильно отли- чаться» от оптимальной). На практике последовательность {<рл} обычно строят с помо- щью системы многочленов 1, /,... или же системы тригономет- рических функций sin tt sin 2/,..., sin nt,.... Так, если решается простейшая вариационная задача миними- зации интегрального функционала / вида (8.3) на множестве не- прерывно дифференцируемых функций, подчиненных граничным условиям x(6)=xi, x(ti)=X2. то в качестве последовательности Фо, ф,..фъ.... как- правило, выбирают одну из последовательно- стей *2 — *1 *=1,2,... ?,(O=sin-2^=4i-. 4=1,2........... Г2 — »1 При этом задача (8.23) состоит в безусловной минимизации функ- ции £(Ч. \....U=' + 2 X*v*(0 на пространстве Rn. Эта задача является конечномерной, и для ее решения можно использовать методы конечномерной оптимизации, изложенные в предыдущих главах. § 8.7. ПРИКЛАДНЫЕ ЗАДАЧИ 1. Задача определения траектории распространения света в среде с переменной плотностью. В плоской прозрачной неоднород- ной изотропной среде имеется точечный источник света. Свяжем с этой средой прямоугольную декартову систему координат хОу. Обозначим через о=и(х, у) скорость света в точке (х, у). Выбе- 228
рем пару точек Д(хь у^ и В(х2, у2) (х}<х2 и j/j>0, у2>0) и рас- положим источник света в точке А. Определим форму кривой, вдоль которой свет распространяется от точки А до В. Согласно принципу Ферма, свет распространяется по такой траектории, для перемещения вдоль которой требуется наименьшее возможное время. Пусть у=у(х)—функция, график которой представляет искомую кривую, проходящую через точки А и В. Обозначив через з длину пройденного светом пути, через t — вре- мя, получим для скорости света выражение , ds У1 +y'*dx г! — =---------------. d/ dt Отсюда, интегрируя, находим время Т распространения света от точки А до В: r=j' d/=J K1 ±Х- dx. о xt Таким образом, приходим к простейшей вариационной задаче ми- нимизации функционала 7’(у)=С +/. <5.)_ dx. J v (*.!/(*» Xi на множестве гладких функций, удовлетворяющих граничным ус- ловиям y(Xt) =y}t у(х2) =У2- Рассмотрим частный случай, когда скорость распространения света пропорциональна ординате: v—kyt где Целевой функ- ционал принимает вид dx. У(х) Воспользуемся необходимым условием оптимальности теоремы 8.3. В данном случае р _ У1 + у'*' р Vl +у'* р у' ку ' у М ’ у' kyVTTF' Следовательно, уравнение Эйлера —Лагранжа, которому должна удовлетворять искомая функция, имеет вид . У 1+у'’____d_______у* __ __Q. *У2 dx ktJ Kl+y'* Умножим обе части равенства на у' и запишем его так: (8.26) (8.27) 229
(Выполняя в последнем уравнении дифференцирование по х, мож- но непосредственно получить уравнение (8.26).) В результате ин- тегрирования уравнения (8.27) находим где Ci=const, или Общее решение этого дифференциального уравнения, т. е где C2=const, определяет семейство окружностей с цент- ром на оси абсцисс. Значения постоянных С\ и С2 находят из условия выполнения граничных условий: y(xi)=i/i, у(xs)=y2. Таким образом, заданная пара точек А и В. через которые должна проходить искомая траектория, выделяет единственную окруж- ность из найденного семейства (ее центром является точка пере- сечения оси абсцисс и перпендикуляра, проведенного через середи- ну отрезка, соединяющего эти точки). Из физического смысла за- дачи следует, что оптимальное решение должно существовать. Таким образом, найденное стационарное решение в силу единст- венности является оптимальным. 2. Задача определения формы подвешенной инти. В двух точ- ках вертикальной плоскости закреплены концы однородной абсо- лютно гибкой нити длины I. Требуется определить форму, которую нить примет под действием силы тяжести. Расположим в данной плоскости прямоугольную декартову сис- тему координат хОу так, чтобы действие силы тяжести было про- тивоположно направлению оси ординат. Для простоты ограничим- ся случаем, когда точки Л и В, в которых закреплена нить, распо- ложены на одной высоте: Л(—Хо, Л), В(х0, й). Пусть у=у(х)— уравнение искомой кривой. Тогда выражение для потенциальной энергии нити имеет вид (8.28) где р —линейная плотность, g— ускорение свободного падения. Длина нити постоянна и равна I. Запишем это условие в виде огра- ничения-равенства J )Л1+£'’(•*) °- (8.29) 230
Нить займет положение, в котором ее потенциальная энергия при- мет наименьшее возможное значение, и поэтому задача сводится к отысканию гладкой функции у, реализующей минимум функ- ционала (8.28) при ограничении (8.29) и удовлетворяющей гра- ничным условиям У(—X()=y(x^=h. (8.30) Составляем функцию Лагранжа: 4=] [Ч₽» V1 +?’’+ (Z1+/-£-)] d*- (8-31) На основании теорем 8.3 и 8.4 делаем вывод, что оптимальная функция должна удовлетворять уравнению Эйлера — Лагранжа, в котором , _____ ___________ F =ЪР8У /1+Z+ *1 (/1 +»*’ . Рг^^еу+ЫУ'/уГ i+y'\ т. е. уравнению W/1+7' - £ [('«+м J/71/1+»’’)] =0. Непосредственной проверкой (дифференцированием по х) можно убедиться в том, что полученное уравнение равносильно уравнению ±[хсРСТ/н7‘+х,рн7- ‘+~У'•]=0. которое в результате интегрирования и несложных преобразова- ний принимает следующий вид: \fgy+Ч-С1 / Г+71. (8.32) где С)=const. В случае С]=0 из (8.32) получаем решение у= =s const, что возможно только в случае /=2хо- Поэтому далее можно считать, что С]=#0 и Г>2хю Если в уравнении (8.32) вы- полняется условие Хо=0, то приходим к уже рассмотренному слу- чаю у=const. Значит, можно считать, что А«= l/(pg) =#=0 и М=Х. Тогда из (8.32) получаем уравнение »+*=С,/!+(/'•. Общее решение этого дифференциального уравнения имеет вид y=CjCh (8.33) 231
Используя симметрию граничных условий, приходим к равенству С2=0. Длина-кривой, определяемой уравнением (8.33), равна <U=2C,sh -^-=1. Cl Из правой части равенства можно однозначно определить значение CJ = Cl*, при котором оно выполняется. Граничное условие позво- ляет также однозначно найти значение множителя Лагранжа — =й—C/chxo/Cj*. В результате получаем единственную стацио- нарную функцию y=CiCh-£— X*, являющуюся решением исход- ной задачи. Найденная функция определяет кривую, называемую Цеп ной л ин йе н. Глава 9 ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ В настоящее время в,теории вариационного' исчисления разра- ботан мощный и универсальный математический аппарат, позволя- ющий решать экстремальные задачи в функциональных пространст- вах. Этот аппарат находит широкое применение при решении раз- личного рода технических задач. Первые четыре параграфа посвящены рассмотрению простей- шей задачи вариационного исчисления, которая уже сформулнро- цана,в гл. 8. Здесь изложение автономно и основывается на поня- тии первой и второй вариаций целевого функционала (исторически первыми были введены именно эти понятия, а затем появились по- нятия дифференцируемого функционала и его градиента). Сфор- мулированы как необходимые, так и достаточные условия опти- мальности. Рассмотрены более общие вариационные задачи и соответствующие им Необходимые условия оптимальности. Приве- дена вариационная задача Лагранжа в поитрягинской форме, формулировка которой близка к формулировке задачи оптималь- ного управления. ' * Для изучения материала данной главы необходимо предвари- тельно ознакомиться с § 8.1. § 9.1. ПОСТАНОВКА ПРОСТЕЙШЕЙ ЗАДАЧИ ВАРИАЦИОННОГО ИСЧИСЛЕНИЯ 1. Задача о брахистохроне*. Эта задача, о которой упоминает еще Галилей, после исследований И. Бернулли 1696 г. послужила толчком к появлению методов решения широкого класса подобных задач, составивших впоследствии основу вариационного исчис- ления. * Слово «брахистохрона» образовано из двух слов, которые в переводе на рус- ский язык означают «кратчайший» и «время». 232
Пусть в. вертикальной плоскости имеются две точки Л и Н (пер- вая выше второй). Данные точки могут быть соединены различ- ными плоскими кривым is (в частности, ,н прямой линией).. Пред- положим, что в Л поыеЬцема материальная точка массы. которая под действием силы тяжести может «скатываться» иэ течки Л в В по различным кривым., соединяющим Л hj9. Геометривдскк задача о брахистохроне за- f F ключается в отыскании такой кривой, (если ’7,|Г”---г-;---Т^”Г она существует), 1,0 которой материальная \ ; точка достигнет В за кратчайшей врем:<. Эту кривую псзывают брахистохроной, для тоге чтобы дать математическую ^--—------------ формулировку задачи, введем! на рассмат- ч рнваСМЙ плоскости прямоугольную смете- му координат. Поместим ее начало в точку Э1 Л и направим ось ординат вертикально -° .. вниз (рис.. 9.1). Обозначим координаты точки-В через (г, По условию, материальная: точка начинает двигаться из ,Л (О, G) без начальной скорости., поэтому согласно закону сохранения энергии м ожно з а и нс ат.ь от^/2 — где о — скорость, у-1—ордината материальной точйи- (g—уОко ре- мне свободного- падения). Отсюда находим щ="^2^./'Будем. счи- тать, что р'₽^(х) уравнение кривой,, ио которой «скатывается® материальная точка. Если обозначить через s длину пройденного точкой йутн, а через t — время, то можно записать „ V il г jF" -fix di d/ Б С л едсва телъно, ,jj| -zX -_ >^д + ^'r*d * ’ :м 1 Интегрируя, получаем следующее выражение.", 7~ = С С |/| <Д' 11<: , (9.1) .1 • K2FJ К» ' -О с где ,5г'—время,, в течение которого материальная точка движется, вдоль кривой f=y(.x) {О^х^х) из Л в Ж- Равенство (9.1) задает функционал Г» определенный на-множе- стве кр и вих. (тонне е- фу и кди й) и и да $ s р (х), по дч инея н ы к гр ьн ич- н.ым условиям ‘ y(0)sQ,y(x)=ff. сад. Из фшичйких соображений ясно, что. рассматрмваемйе.' кривые 233
не должны иметь <изломоз» («углов») и поэтому функции у-=у(х) можно считать гладкими (негрерыено дифференцируемыми): f^Ci[0, х]* Математическая постановка задачи о брахистохроне такова; средн, всех функций вада ^=о(ж) пространства С^О. £]„ которые удовлетворяют условиям (9.2)» требуется найти функцию (если она существует), реалмзуюшую минимум функционала Г, опреде- ляемого .формулой,, (9.3) S. Постановка простейшей вариационной задачи, Опишем класс экстремальных задач, в который входит задача о брахнстро кроне В простейшей вариационной задаче фдом модем, кото- рой будем обозначать через 7, имеет вид / (Ir1) — J / <*» & U). (О d*, I (9,4) где подынтегральную функцию' / трзх переменных х, # н р' считают заданной на некоторой области’ Рассмотрим также об- ласть (проекцию множества Й и а плоскость xtfy} вида 0= {(х, p)^R3| при некотором /sR верно (х, ,/eD) и. обозначим' через Л(х[я, yj. фиксированные точки ятого множества, предполагая,, что они не лежат на одной вертикальной пря* мой, т. е. XfCXa (рис. 9,2). Опишем лможестет г donyern- м*«х фуякццй. на котором следует минимизировать целевой функций- на эт, У~|[^е С\ |Xj., Ха, | 1 ^(Х!>= F(*">Уг (х, уик /^’))ё/9 при все* хё[хм xjb (9Л) Второе требование в (9,5) геометрически означает, что кривые, определяемые допустимыми функциями, не должны выходить, за пределы области £). Будем предполагать, «то множество ¥ содер- жит по крайней мере один элемент* в йротнаном случае постанов- ка задачи оптимизации теряет смысл. э.а£пчд ейркшцпонного нечцоешдя состоит в мннн- миэацни функционала (9.4) и,а множестве ¥ вида (9.5).. * OOtMTbitf называется' dtk^wtqe м^ожьетьо. любые две точки котсрег® можн® соединить пёпрарыаноЙ [' i 6J.
Выше не был конкретизирован класс функций, которому при- надлежит функция f из (9.4). Требования, которым должна удов- летворять функция /, по крайней мере должны быть такими, что- бы существовал интеграл (9.4). Это выполняется, например, если функция f непрерывна на D. На самом деле для того, чтобы мож- но было формулировать те или иные условия оптимальности, сле- дует накладывать более жесткие требования непрерывной диффе- ренцируемости или даже двукратной непрерывной дифференцируе- мости. Такого рода предположения в практических задачах, как правило, выполняются. Задача о брахистохроне — это простейшая задача вариацион- ного исчисления, в которой /U, У. 0')—у, tf'JeR3 I е>0, х1== у,=0, х2=х, у2=у. 3. Типы экстремумов в вариационных задачах. Простейшая ва- риационная задача, сформулированная выше, заключается в отыс- кании глобального минимума целевого функционала. В данной задаче можно рассматривать также и локальные минимумы. В пространстве С|(хь х2] определена норма 11 у |) i= max [ у (дс) | + max | у'(х) 1 , xeijr..*,) xG(xlt.ral а значит, имеет смысл говорить об е-окрестности элемента уо xj| ||y-MiOh Такую окрестность называют ^-окрестностью первого порядка. При малом е>0 она состоит из функций, значения у(х) которых (а так- же значения у1 (х) их первых производных) мало отличаются от значений г/о(х) (соответственно уъ(х)) функции в одних и тех же точках хе(х|, х2]. Иными словами, е-окрестность функции у о образуют функции, близкие к уо как по значениям, так и по вели- чине производной. В соответствии с этим элемент yo^Y реализует слабый локаль- ный минимум, функционала / на множестве УсС](х(, х2], если можно указать такое число е>0. что неравенство 1{уъ}^Цу) име- ет место для всех уЕУри,’ [у$). Рассмотрим теперь норму пространства непрерывных функций Gki, х2]: max |у(х)|. Так как Cifci, X2]cCd[xi, х2], то ||...||0 можно рассматривать как еще одну норму в пространстве CJxi, ха]. В соответствии с этим введем понятие е-окрестности нулевого порядка ^!(у0)=кеС1{л1> х2]| которую при малом е>0 составляют функции у, значения которых 235
мало огличавптся от да при этом производные могут отличаться .значительно. Говорят, что элемент }\реа.л изугт сильньш локальный .лш- Wjui/M функционала / на множестве fcCjki, ла], если существует е>и такое, что неравенство выполнено для всех Лрш'челем натуг-яа.м:ь,1Й пример. шглппгрнрующнА различие езжбого л сильного ликалмшх дывчиумов. Цррдг&ложим, что парусная лодка л а и ж ел с я ль точений широкоА реки от точки 4 к точке В при сильном встречном: ..---*--*------------— ----- ветре (рнс. 9-Зу. Нуле ко как можно скорее: попасть из А в \ / „д. т fi- Движение без паруса ио V"----у ' - Лг_- 7J V' “--У" * пряи&Й, сосд и ияюшеЯ точки .А и В. доставляет докажиый ню _ . нинзгм, так как при движении —----- — -------------------- по близким гшдкнм кривым парусом воспользоваться нель- рн£ $3. зя, я пройденный лодкой путь будет ддотгее чем пс прямой. Однако эго г локмдьный мини- мум, будь: лишь слабым лздьльтшн мнннмучок,, поскольку, двигаясь -с га ру- ст» галсами {зигзагам hL можно зффекпнввд: использовать силу ветра и в ре- зультатЁ выиграть во ириигнн. Пример, Рассмотрим: простейшую варйацнойную задачу.-, в ко- торой /(л, .У, Л xs=K D==R^ В этой задаче .элемент (х&[0; 1]) реализует слабый локальный мийимум. Понажедо это. Рассмотрим (О, О к произвольную допустимую функцию #i=6't' 1(^'0), Поскольку /UK гаях | (л> | [|| j.< s.< ] .для ' всех 1], учить.- xejojj дач, что / (-Vb) ~'Э; получаем: неравенство 1 / (у) — / w = f U) (1 - sr’u)) J х > О. |Q В силу произвольности выбора функции неравенство означа- ет что1 элемент -эсалнзуйт слабый локальный минимум, 3 л смект уд, яё pic-ал сильный докадвный В са- мом делрассмотрим пос--,.е.доьательиость допустимых функций ктЭялх, n= L Й,.... Поскольку ,|| ’^оНи— I sin 2лих || = ViAt-^O., ИТ= |1 11 ' 3 любой сколь угодие малой окрестности нулевого порядка элемен- та содержатся члены последовательности пиа], 2,.., . Вычис- ляй значение функционала на здементах этой последоват^ьности 236
и сравнивая его с Цро), получаем требуемое: 7 tee) =| (t _ W» W 2км а = — — (1 — COS Bnwj CU=-----^<0=1/ (fgl, Л&1, 2,..,. 2 J 2л 2 4. Расширение множества, .допустимых функций. В простейшей вариационной задаче оптимальные решен ня .ищут средн непрерыв* на дифф <Р<и Ц й ? ушы х (гл ад ки х) фу и кций. Вак йог и х . реа л ик н х задачах вред положение о глад- кости решения оправдан^ одни ко имеются и те кие» □ которых усло- вие гладкости является «слишком Жестким» и по смыслу задачи оп- тнмальйая функция может иметь разрывную производную. Пусть а плоскости хС^ заданы же точки А{л|я. fO, В(хг» ^а), Лг<дэ. Эти точки мою соеди- нить различными кривыми» урав- Рне. &.4 нения которых имеют над Вращая каждую такую кривую вокруг оси Ох, будем по- лучать соответствующие поверхности а ражен и я (рис. 9.4). о ашнйлшлбвдй поверхности орошения заключается з отыскан и и такой кривой,, которая при вращении образует поверх- ность наименьшей возможной площади. Здесь минимизируемый функционал определяется равенством / (у)=2'я J у (х) ZI (х) dx\ а множество допустимых функций .имеет-вид» аналогичный (&.&)- О дна ко н данной задаче допущение М не пре дета н л нет- се естественным; .в число допустимых кривых можно включить я такие,, которые имеют «изломы» («углы»). В результате приходим к задаче в которой допустимыми япляютси функции из класса ку- сочно-гладких. Напомним, что числовая функция называется к^сочло* (к^^ечно-нелрфынно й^фф'еренццр^елго'й) на отрезке jjfy( xjl, если она непрерывна и a (xts хД а ее производная непрерывна всюду на xj,. за исключение^"..» быть может» некоторого конеч- «ого числа внутренних точек.,, где ома терпит разрывы первого ро- да [16], Множество кусочно-гладких функций с введенными стан- дартными операциями сложения и умножения на. число- образует -линейное простравегво, которое далее... будем обозначать'’ через КС||{Х1, х2]_ 237
Введём еще одно определение, Пусть peKCiCXh Ха1 Говорят, что точна %. ^(XqJJeR3, где ха <жсСлсг^ кривой ^=gr(x) является угловой тонкой (тонной нзлшш), если односторонние произ родни г функции $=^(х) слей а и справа з точке ха существуют, но не рав- и и друг дру ту: у' ( г в—О1) / fa + 0) - //ростейщця расшцданшя вариационная задача 'заключается в мннимидазши функщнжала {9.4) на рдсклреммо/и доплатил ом жнр- 3K£TJW Г = |^КСГИЬ y(A)3^i« (X, р(Х), j/'l(X))^D при КАЖДОМ Х^[Г1# xj|.p Заметим. что в предйоложемин уеЯС^, Гз]| при условия не» прерывности функции f на множестве /; интеграл в правой части $М) существует* поскольку в атом случае । функция f(jr, у(г), у'(*)) кусочно'непрерывна * на отрезке [х>. xj [161 Решением расширенной вариационно! задачи является функ* ни я, реализующая глобальный минимум. Дли расширенной задачи вводят также понятие вокального минимума., При этом используют окрестность нулевого горя'дка, поэтому локальный минимум .в рас- шнренной задаче — эти сильный локальный минимум. Оказывается, что при переходе от простей'пей вариационной задачи, к расширенной задаче оптимальное чначенне целевого фунхцночала существенно не изменяете hi точные нижние {точные верхние) грани обеих задач совпадают, Это следует из леммы о скруглении углов. Лемма 9.1 (о скрутя ей ин углов}, Дрсть f шз (9.4) не прерывна на. D==Ra. Для лроцзаольном $ez.F ц любого е> >0 жожно ^кад-ать гак^/ю фденкцща что нёрно неравенство 1 /fe.) — /II' <® (&J5) к, кроме TWO, ||$—#||1о<Е. □ Случай, когда функция у не ое- ет угловых точек, тртеиален. Рассмот- рим случай, когда существует только одна угловая точка (хр, ^(Хо)). Если их больше, то рассуждение проводят аналогично для каждой из них. Доказательство заключается .□ «скруглении» функции в окрестности точки to, т. е, в подборе такой функции которая отличается от только в некоторой окрестноста точки х® (рис, 9,5), причем, выполняется неравенство (9.6). * Числовую функцм1ю назывлнчг к^очвьнчег.ре.рмедюа ня отрезке Гжь ww ®»а иеиреравнз на атом: <и-реэис» ал ксключеинеи, йпъ может, йтееторого койёчидго числа. еиутре«миг точек, где йна терпит разрывы пер- ваго роде. 238
Требуемыми свойствами обладает, например, функция ^а(х)=5(х)4-Дфв(х), х2], где A=i/'(xo+O) — 0'(хо —0) и (>— | х—х0| р Фе (х) = 4Ь если | х—х0 | 0, если | х—х0 | >8, причем число б>0 выбрано достаточно малым. В самом деле, функция <рв непрерывна на отрезке [хц х2], фб(Хо±6) —0, а произ- водная фа' только в точке хо имеет разрыв первого рода, причем Ф«' (х0±б)=4:1/2. В этом легко убедиться, воспользовавшись ра- венством Umd | х | /dx= + 1. Поэтому функция уъ непрерывна и х-*±0 имеет непрерывную производную, так как единственный угол скруг- лен: у/(*о±0)— (£'(*о+0) +^(хо — О))/2=#б'(хо)- Таким обра- зом.г/веУ. Определим, насколько малым должно быть число б. Для всех х&[хь х2] справедливы неравенства 1 Ув(х)-5(х) I О Д I 8/4, | Ых)-?(х) I < 1 Д | /2. Здесь (а также ниже в формуле для К] вместо производной */' (хо)» которая не существует, взято число (|7'(*о+О)+^'(*о — 0))/2. Рас- смотрим компактное множество tf=[(x, у, y')eR3 | Xi<x<x2; I У — У(х) | I Д1 /4: I £/'-?(*) I < | Д | /2 при x./rx0; И/'-?(х0)|<|Д i | и обозначим M=max | f (x, y^ у*) | . По теореме Вейерштрасса, к этот максимум достигается. Для точки х, #е(х), ув'(х))сК можно записать I /(£>)—I (У) |< f I f(x, ^(х), yUx)) — x.—fc —/(X, у(х), /(x)) I dx<4Aft. Таким образом, число б нужно взять таким, чтобы выполнялись неравенства б<1, 4Л46<е, а также включение (хо — б, Хо+б)с= <=[*!> х2]. Поскольку II Уъ~У II о= I Д I тах 1-Фв (X) ] == 1 Д | 8/4, xelxlfxt] для выполнения неравенства ||у« $11о<е Следует взять такое „чис- ло б, для которого справедливо неравенство | Д16/4 <е. 239
Следствие -9.1. Пусть функция f непрерывна на множестве D=RS. Тогда имеет место равенство Id 1 (f/) = int /(у). (9.7) П Согласно включению ТССфи, Л2]зэС|{х], х2] имеет место нера- венство 1^/ (у) С inf / (£). Для проверки справедливости равенства (9.7) предположим противное, т. е. что inf / (у) <;inf / (^).По опре- Р j- делению точной нижней грани, последнее неравен'ство влечет су- ществование такой функции реУ л числа ₽>0, что/ (tfXinf/ (у) —> ... Y — б. .Согласно лемме 9.1. найдется- функция i/еУ, для которой /(уХ'-id/(у), что невозможно. у Таким образом, если простейшая задача вариационного исчис- ления имеет, решение 1/©еС][Х|, Хз]. оно же является решением со- ответствующей расширенной задачи (однако если расширенная за- дача имеет решение </oeKCi[xi, *2]. то не обязательно (/©еСДль *г])- § 92. ПЕРВАЯ ВАРИАЦИЯ. УРАВНЕНИЕ ЗИЛ ЕРА-ЛАГРАНЖА I. Определение первой вариации. Рассмотрим простейшую ва- риационную задачу, сформулированную в предыдущем параграфе, и сформулируем необходимое условие слабого локального мини- мума. ’ Пусть функция. У, где множество У дме(ет вид (9.5), .реали- зует Слабый локальный минимум функционала 7 (9.4). Это озна- чает, что при некотором е>0 неравенство /(у) ^/(р) выполняется- для всех ^еУ|Ч4’(р).' ‘ Пустй А — произвольная функция, удовлетворяющая ’ условиям h sCJjCt, xj, Л(л,)=Л(л2)=0. (9.8) Рассмотрим семейство функций дида 't/H-АЛ, зависящее от парамет- ра A€R. По условию, множество D открытое, поэтому при всех X, достаточно близких к нулю, выполняется включение (</НРХЛ)е е УП^е' (у) • Значит, для всех указанных К верно' -неравенство Ф (0) ^<р (А), где ф (А) =1 (y+Mi) — функция одной . переменной А (при фиксированных у и Л). Таким образемг функцня ф достигает локального минимума при Х==0? Предполагая функцию f в форму-' ле (9.4) непрерывной вместе с частными производными [у и на Д согласно правилу Лейбница 461, получаем, что функция ф диф- ференцируема. Следовательно,-по теореме Ферма, ее производная при А==0 равна нулю: ф'(0) = 0. Учитывая^ что * <*• U А * , I ’* 1“ ' ч " * 240
равенство <р' (0)=0 запишем в виде т'<0)= 4- GA (х, У (л)4-ХЛ (л), у' (л) -j- ХЛ' (л)) бл Х-0 V = J 1Л.(*« У'(*)>*(*)+/«"<«» У(х), y'(x))h'(x)]dx=0. Л>: (9-9) где дифференцирование по % выполнено под знаком интеграла. Ра- венство (9.9) справедливо для любой функции h, удовлетворяю- щей соотношениям (9.8). Введем следующее важное определение. Предположим, что функция f, а также ее частные производные fy н fyr непрерывны на множестве D. Пусть t/еУ— произвольная фиксированная функ- ция. Функционал 61, определяемый формулой Ъ1 (Л) =J |Д (л, у (л), у’ (л)) Л (л) +/> (л, у (л), у’ (л)) h' (л)] dx, . <910> называют первой вариацией функционала 1 (относительно элемен- та у), Этот функционал задан на множестве функций, удовлетво- ряющих условиям (9.8). Полученный результат в терминах первой вариации можно сформулировать следующим образом. Лемма 9.2, Пусть функция y^Y реализует слабый локальный минимум в простейшей вариационной задаче. При сделанных выше предположениях относительно функций f, fa fa', первая вариация целевого функционала (относительно элемента у) тождественно равна нулю: « .. ( [/# (а У (*)• У' (*))А (*)+f у* У W. У’ (*))А' (*)1 d*=O (9-Н) для всех функций Л, удовлетворяющих условиям (9;8) ‘" 2. Уравнение Эйлера — Лагранжа. Преобразуем необходимое условие (9.11) к болеё удобному виду. Введем следующие обозна- чениям г • 7v (*)— fy (X, у (л), у* (Л)), (Л)=/у, (л, у (л), у' (л)). Интегрируя по частям первое из слагаемых (9.11) и используя равенства из (9.8), получаем, < , л* ~ Р ~ J fv (х) h (л) d л = J Л (л) d у Jv (/) df = • jrt ’ - *»». Lxi . Д(Об/ А'(х)бл. 241/
В соответствии с этим равенство (9.11) можно записать в следую- щем виде: (9.12) для всех ht удовлетворяющих условиям (9.8). Для получения тре- буемого необходимого условия следует в равенстве (9.12) «изба- виться® от внешнего интеграла. Это позволит сделать следующая лемма, которую называют второй основной леммой вариационного исчисления *. Лемма 9.3 (лемма Дюбуа — Реймона). Пусть соеС [х1ж х2] и ра- венство ш (х) й'(х) d х=0 (9.13) выполняется для всех h, удовлетворяющих условиям (9.8). Тогда функция w постоянна, т. е. для некоторого числа С равенство ы(х) = С верно при всех хе[Хь х2]. □ Рассмотрим произвольное число С. Так как A(xJ — h(xi)=0, равенство (9.13) можно записать в виде [ш (л) — С] й' (х) dx=0. (9.14) Введем функцию й0(х) =j[»(/)-Cold/, xe[xlt х2]. Функция <в(/) — Co непрерывка, поэтому AoeCi(xi, xj [16]. Кро- ме того, fto(Xi) =й0(х2) =0; следовательно, функция h0 удовлетво- ряет условиям (9.8) и при С=С0 должно выл Сняться равенство (9.14): j [«> (X)—Со] Йо (x)d [ш (х) — сор dx=0. X, л, Отсюда, согласно неравенству [<о(х) — Сор>0 для всех хе[хь х2], получаем [16], что со(х) — С=0 для всех хе[хь х2]. * Первую основную лемму вариационного исчисления см. в $ 8.2. 242
Вернемся к равенству (9.12).. Воспользовавшись леммой 9.3, по- лучаем у(х), y'(x))=j Д(х, у (л), у'(х)) dx-|-C, xejXp x2I, (9.15) где С — некоторая постоянная. Правая часть полученного равен- ства является непрерывно дифференцируемой функций. Значит, в левой части равенства также непрерывно дифференцируемая функ- ция. Дифференцируя обе части равенства (9.15), имеем (х, У(х), #'(*))=Д(*. У(х\ У'(х)), хе|*1. х2]. ох Сформулируем полученный результат. Теорема 9.1. Предположим, что функция f непрерывна на мно- жестве /> вместе с частными производными fy и Если функция y^Y реализует слабый локальный минимум функционала 1 (9.4), то она является решением дифференциального уравнения fv<x, у, у’)—^-Л'(х, yt y')*=0, (9.16) ол? называемого уравнением Эйлера — Лагранжа. Если некоторая функция реализует сильный локальный мини- мум, то она же реализует и слабый локальный минимум. Поэтому всякое необходимое условие слабого локального минимума являет- ся также необходимым условием сильного локального минимума. В частности, такое условие сформулировано в теореме 9.1. В фор- мулировке этой теоремы термин минимум можно заменить терми- ном максимум, поскольку уравнение (9.16) при замене функции f на функцию —/ (т. е. функционала I на функционал —7) -не ме- няется. Тот факт, что функция у=у(х) является решением уравнения Эйлера — Лагранжа, эквивалентен тождественному равенству ну- лю первой вариации целевого функционала (относительно у), и по- этому функции, удовлетворяющие (9.16), логично было бы назвать стационарными *. Однако; следуя исторически сложившейся в ва- риационном исчислении традиции, в этой главе решение уравнения Эйлера—Лагранжа (9.16) будем называть экстремалями функ- ционала (9.4). Экстремаль не обязательно является слабым локаль- ным решением простейшей вариационной задачи. В § 8.5 рассмот- рен пример, где имеется единственная экстремаль, однако опти- мального решения не существует. По теореме 9.1, для определения экстремали нужно решать диф- ференциальное уравнение второго порядка с заданными краевыми условиями: Л—£/(х1)=//1, у(.хд=у2, * См. также $ 8.3 предыдущей главы. 243
Это так называемая краевая задача. Для ее решения находят об- щее решение уравнения Эйлера — Лагранжа, которое зависит от двух произвольных постоянных (поскольку уравнение имеет второй порядок). Затем, используя краевые условия, определяют значения этих двух постоянных. В настоящее «время не существует общего метода решения диф- ференциального уравнения Эйлера — Лагранжа, поскольку в об- щем случае оно может быть очень сложным. 3. Частные случаи уравнения Эйлера — Лагранжа. Рассмотрим некоторые частные случаи уравнения Эйлера — Лагранжа, в ко- торых благодаря специальному виду подынтегральной функции f это уравнение можно упростить, в частности понизить его порядок. 1) Функция f не зависит от tf, т. е. f=f(x, у) при (х, у, В этом случае fy,=0 и дифференциальное уравнение (9.16) пре- вращается в функциональное уравнение (в котором отсутствуют производные): f 2) Функция f не зависит от у, т. е. f=f(x, у') при (х, у, у')^&. Тогда fp=0 и (9.16) принимает вид -7-Л'(х. /)=0, dx откуда, интегрируя, получаем дифференциальное уравнение перво- го порядка /,'(*> у')=С, (9.17) где С — некоторая постоянная. 3) Функция f не зависит от х, т. е. f=f(y, if) при (х, у. у')^&. Для упрощения уравнения (9.16) умножим обе его части на у', а затем прибавим и вычтем выражение h'(y> у')у"- Имеем fv(y, У')У’+/у'(У* y^-fy-ty* У')У*~У -^fv-ty* У'^О- Полученное уравнение можно записать в виде у'Я=о. ах Таким образом, получаем дифференциальное уравнение первого порядка /(У. /)-//^(У. /)=С, (9.18) где С — некоторая постоянная. Теперь выясним, когда порядок дифференциального уравнения (9.16) можно понизить в общем случае f=f(x, у, if). Для этого, предполагая функции f и у дважды непрерывно дифференцируемы- ми на множестве Л и отрезке [лг», хг] соответственно, выполним в 244
(9.16) операцию дифференцирования по х (что возможно благода- ря сделанным предположениям) и запишем уравнение Эблера — Лагранжа более подробно: fy(x, у, у, у')~/Уу‘{х. у. у*)у'~ —fy‘y'(x, у, y’)y”=Q. (9.19) Отсюда следует, что уравнение имеет первый порядок тогда и толь- ко тогда, когда равенство Гу.и-(х, yt у')=0 верно для всех точек (х, у, y')^D. Интегрируя последнее равенство, находим f(x, у, 0)==P(x, 0+Q(x> y)y't где Р и Q — некоторые функции двух переменных. Для этой функ- ции / уравнение (9.19) принимает вид Ру{х, 0—Qx(x, 0=0. (9.20) Здесь возможны два случая. а) Равенство (9.20) является тождеством, т. е. имеет место для всех точек (х, y)^.D. Тогда 461 существует такая функция и=и(х, у), что dw(x, 0=P(x, 0dx-|-Q(x, y)dy, (х, 0e=D. При этом область D предполагается односвязной (она является таковой в случае, например, если D — выпуклая область). Следо- вательно, / (0 = ( [Р (х, у (х)) -J-Q (х, у (х)) у' (х)] dx= ж/ = [ d/z (х, 0=и (х2, у^ — и (х(, уд для любой допустимой функции у. Это означает, что задача опти- мизации бессодержательна: /(#<) = const для всех у, о) Равенство (9.20) представляет собой функциональное урав- нение относительно у. Если это уравнение имеет дважды непрерыв- но дифференцируемое решение и если для найденного решения вы- полнены краевые условия y(xi)=yt, i=l, 2, то оно является экстре- малью. На практике рассчитывать на такое «стечение обстоя- тельств» не приходится. Таким образом, в общем случае f=f(x, у, у') порядок диффе- ренциального уравнения Эйлера — Лагранжа, как правило, не по- нижается. 4. Решение задачи о брахистохроне. В задаче о брахистохроне f (xt у, у ) = = Уi ~ 0> х^—х, Уъ~У‘ 245
Здесь f=f(y, у'), поэтому можно воспользоваться уравнением (9.18), которое в данном случае имеет вид ^'±У'_____у _ -Г /2gy yr2^у /1 + у'* /2£у /1 +ir** Отсюда следует, что 2^(14-^”) = 1/С2. Вводя новую константу Zti= 1/(2 C2g) >0, получаем , **,. • (9.21) 1 4-У' Далее придется дифференцировать уравнение (9.21), поэтому, прежде чем приступить к его решению, обоснуем возможность такого действия. Для этого убедимся в существовании второй производной р", т. е. проверим, что первая производная у7 является дифференцируемой на интервале (хь хг) функцией. Предположим, что решение задачи о брахистохроне yeCJxj, ла] существует. Тогда оно удовлетворяет уравнению (9.21), а значит, у1* (х) =ktly(x)—1, хе[хь ха]. Поскольку у —непрерывно дифференцируемая функция, согласно по- следнему равенству, функция у" также непрерывно дифференцируема. Далее, суперпозиция двух непрерывно дифференцируемых функций z—y'=>y'w[ w>0, w= у’ (x) является непрерывно дифференцируемой функцией. Очевидно, чти w —у' (х)^0 для всех х. Остается показать, что т. е. что р'(х)#0 для всех *е(хь х2). (9.22) Справедливость соотношения (9.22) проверим в три этапа. J) Экстремаль не может быть постоянной ни на одном интервале (a, i)(=(xb xs), а<Ъ. В самом деле, если у=с, с—const, для всех хе (а, 6), то, подставляя р—с в левую часть уравнения Эйлера — Лагранжа (9.16), получаем, что око не удовлетворяется: 2(/2gp)3 dx V^gy /1 4-р'* /J 2(^7 ХС(в,<)' 2) Производная экстремали может обращаться в нуль не более чем в од- ной точке. Если это не так, то можно выбрать такие точки х\ х"е(х(, х?]> х'<х", что у'(х') ^^(х")—0, причем р*(х)ч^0 при всех zef/, х"). Тогда в силу (9.20) верно равенство р(х')=р(х") и, по теореме Ролля, производная р' обращается в нуль в некоторой внутренней точке интервала (х', х"), что про- тиворечит выбору х' и х". 3) Производная экстремали может обратиться в нуль только при х=х2. Поскольку в выбранной системе координат ось Оу направлена вниз (рис. 9.1), производная на [Хь х2] не отрицательна. Значит, функция у не убывает и, согласно равенству (9.21), в точке х, в которой р'(х,)^0, она принимает наи- большее возможное значение. Следовательно, х. не может быть внутренней точкой и поэтому х.=хя. Решение у задачи о брахистохроне является экстремалью, а значит, для этого решения неравенство (9.22) выполняется. Тем самым двукратная непре- рывная дифференцируемость оптимального решения доказана. Используя двукратную непрерывную дифференцируемость решения задачи о брахистохроне, с помощью аналогичных рассуждений можно доказать трех- кратную, а затем четырехкратную непрерывную дифференцируемость и т. д. Это означает, что решением задачи и брахистохроне является бесконечно дифферен- цируемая функция. 246
Решение уравнения (9.21) будем -искать в параметрическом ви* де. Воспользовавшись подстановкой У'—ctgy. t е (0, 2л), (9.23) запишем уравнение (9.21) в виде l + ctg2-y- или У=-^-(1—cos/). * (9.24) Для того чтобы -найти функцию x—x(t), продифференцируем (9.24) по х и воспользуемся подстановкой (9.23): . t *i z k dr ctgT=T(s,nZ)zr • Отсюда имеем dx— kx sin2 d/ ==-—(1 — cos /) d/, а значит, x=^-(/ —sin/) Итак, общее решение уравнения Эйлера — Лагранжа (9.21) в параметрической форме имеет вид х=-^- (/ — sin t) 4-А2, (1—cos/), ^>0, /е(0, 2л) и задает на плоскости хОу семейство циклоид, зависящих от двух произвольных постоянных и Аг. Значения этих постоян- ных определяют из краевых условий y(Q) =0, у (к) —у, что приво- дит к решению следующей системы уравнений: 0=~(/i — sin /j) 4-А2, O=-|L(1—cos /(), х=-у- (/2 — sin /з) 4- Л21 У=^ U-cos /2). 247
Можно доказать, что эта система уравнений относительно klt k2, iir t2 (при x>0, р>0) всегда имеет единственное решение. Таким об- разом, для указанных краевых условий существует единственная экстремаль, соединяющая точки (0, 0) й (х, у). Только на основа- нии выполнения необходимого условия оптимальности делать вывод о том, что экстремаль является решением задачи о брахисто- хроне, нельзя. Однако физический смысл данной задачи подсказы- вает, что оптимальное решение должно существовать; следователь- но, им и является -найденная экстремаль (циклоида). 5. Решение задачи о минимальной поверхности вращения. Эта задача сформулирована в п. 3 § 9.1 и сводится к минимизации функционала /(£/) = 2л j1 у (л) Z 1 (х) dx на множестве функций у~у(х) с граничными-условиями у(х,)~ —Уг, i— 1, 2. Оптимальное решение задачи будем искать в про- странстве гладких функций, хотя в первоначальной ее постановке фигурирует более широкое множество (пространство кусочно-глад- ких функций). На основании следствия 9.1 найденное решение бу- дет оптимальным и в пространстве кусочно-гладких функций. Данная задача является простейшей вариационной задачей, в ко- торой fv = 2лУ 1 -}-у'\ fy'—Ялуу'Г^ 1 + У'*• Подынтегральная функция / — 2луТ l-f-tf' явно не зависит от х, поэтому мы не будем записывать уравнение Эйлера — Лагранжа, а сразу восполь- зуемся эквивалентным ему уравнением (9.18), которое в данном случае имеет вид 2яу /Г+7’ —^L=C, У 1+у* или ____________ !/=С,/!+»', (9.25) где С1 = б/(2 л). Запишем общее решение дифференциального уравнения первого порядка (9.25), не разрешенного относительно производной: у=С, ch/£-+<?,). (9.26) где С2 — произвольная постоянная. Уравнение (9.26) задает с е - мейство цепных линий, зависящее от параметров С, и С2, которые следует определить из граничных условии, т. е. в резуль- тате решения следующей системы уравнений: С, ch (-?+С,) = у,; С, ch +С2)=уг. (9.27) Если С] и С2 находятся однозначно, то, подставляя их значения в 248
(9.26), получаем оптимальное решение задачи. Однако система (9.27) при определенных комбинациях чисел Xj, Х2, </ь уг может не иметь решения (в этом случае гладкого решения задачи о- мини- мальной поверхности не существует) или же обладать1 не единст- венным решением. В последнем случае для нахождения оптималь- ного решения необходимы дополнительные исследования. § 9.3. ВТОРАЯ ВАРИАЦИЯ. УСЛОВИЕ ЛЕЖАНДРА I. Определение второй вариации. Пусть функция f, фигурирую- щая в определении целевого функционала (9.4), дважды непрерыв- но дифференцируема на множестве А Рассмотрим произвольную функцию y^Y, где множество У имеет вид (9.5). Функционал б2/, заданный на множестве функций (9.8) и определяемый формулой Ьг/ (Л>=J Jp (х) Л2 (х) -f- 2q (х) Л (х) h' (х)-J-г (х) Л'* (x)J dx, (9.28) где P(X)=/^U, $Цх), y'U)>. ?(х)=/„Дх, у(х), у'(х)), (9.29) г(х)=/^(х, у(х), £/'(*)),= называют второй вариацией функционала 1 (относительно элемен- та у). При определении первой вариации подынтегральное выражение в (9.10) было линейным относительно Л, hf. Под интегралом в фор- муле (9.28) находится квадратичная относительно h, h' функция. Введем ряд' определений, которые потребуются в дальнейшем. Функционал б2/ неотрицательно (неположительно) определен, если для всех функций h вида (9.8) верно неравенство W(A) >О(82/(Л)<0). Если же для всех функций Л вида (9.8), кроме A(x)s0 на [хь х2], выполняется строгое неравенство »V(A)>0(b2/(A)<0), то функционал б2/ положительно (отрицательно) определен. В слу- чае когда функционал б2/ принимает на множестве (9.8) как поло- жительные, так и отрицательные значения, его называют знакопе- менным. Используя введенные понятия, сформулируем следующее необ- ходимое условие оптимальности. Лемма 9.4. Пусть функция f дважды непрерывно дифференци- руема на множестве А Если функция y^Y реализует слабый ло- кальный минимум в простейшей вариационной задаче, то вторая 249
вариация б2/ (относительно у) является неотрицательно-определен- ным функционалом. □ Рассмотрим произвольную функцию h вида (9.8). Повторяя рассуждения, аналогичные приведенным в п. 1 § 9.2, и учитывая, что функция у реализует слабый локальный минимум, приходим к утверждению, что функция вида ф(1)=/(у+1Л) достигает локаль- ного минимума при 1=0. Согласно сделанным предположениям относительно f, функция ф дважды дифференцируема. В соответ- ствии с результатами п. 3 § 2.5 вторая производная функции ф в точке 1=0 должна быть неотрицательна: ф"(0)^0. Записывая это неравенство более подробно и учитывая при этом равенство j 2 ^+хЛ/)=/1//2 + 2/^А/г'+Л'«/'Л' . аАХ получаем ?"(0) = к-0 = J [fyy (х, У (х)» у' (х)) А2(л) -h2/w> (X, у (X), у' (X)) h (х) х X А' (х)+fy y, (X, у(х), у’ (х)) А? (X)dl х=Ь3/ (А) > 0. Как и в случае первой вариации, теперь следует вывести усло- вия, эквивалентные неравенству б2/(А)^О и удобные для практи- ческого применения. Однако сделать это гораздо труднее, чем по- лучить уравнение Эйлера — Лагранжа. 2. Условие Лежандра. Предполагая функцию f дважды непре- рывно дифференцируемой на множестве Л, говорят, что функция y^Y удовлетворяет условию Лежандра (сильному условию Ле- жандра), если неравенство Д'у' (х, у (х), у' (х)) > 0 (/w (х, у (х), у' (х)) >0) имеет место для всех xefa, х2]. Теорема 9.2. Предположим, что функция f дважды непрерывно дифференцируема на множестве Л. Если функция y&Y реализует слабый локальный минимум в простейшей вариационной задаче, то она удовлетворяет условию Лежандра. □ Пусть функция y^Y реализует слабый локальный минимум функционала /. Предположим, что теорема не верна, т. е. найдется такая точка х&[хь х2], в которой r(x)=fy,y,(x, у(х), t/'(x))<0. Функция г непрерывная, поэтому существуют такие положительные числа у и то и точка хое(х1) х2), что г(х)<—у для всех хе U4(х0) с [хь х2]. 250
Введем семейство кусочно-гладких функций 1 Г Ft о. если xei/JXo), если J₽(jfe6\(xcK зависящее, от параметра те (0# тс) (рис. 9.6). Неравенства ( йт(х) I < С | ЛИХ) I < l/Ft« I A,U)*iW < 1 выполняются для всех хеОЛ(х0)я х^хо* Используя эта нгрчвекства, а также вводя обозначенкя Й = эирр(х), х e U4 W ж s £/_ (х0) получаем * W GM= f (р<х)л1 (-<)+24 (х) Л, (х) nt {х] =f=.r(х) pr)J dx <. Ряс. О < 2xsa+4t? -2v Отсюда видно,, что, выбирая число т достаточно малым» можно до- биться выполнения неравенства бэ1(М <0. Теперь» если к функ- ционалу б'2/ применить лемму 9J о скруглении углов, то получим, что cywecTBVET такая функция й вида (9.8) •% ч.'ТС’ dW(A)d). Но это не имеет места, поскольку, согласно ^емме ОД .для всех функций й ви- да (9.8) верно неравенство О*/(А) ^С, Полученное противоречие за- вершает доказательств©,, При доказательстве теоремы P.J Зыло установлено, что иеотрица- телъность-. второй вариации (относительно' у) влечет выполнение условия Лежандра для: функции. Обратное утверждение» вообще говоря, не имеет места. Даже из выполнения сильного условия Ле- жандра не обязательно следует неотрицательность второй втрпа- нн и» I ассмотрим следующий пример. Пример. Пусть в простейшей вариационной задаче / = х3з₽-2л. • Втирай ажрнашя ране? бнла с-прсэвлии ив, июжегтее гладки! фумкадй й вида (9J8).. Здесь функцией*# СЭД вычисляется »д кусечаё-тдддков Фумина* Л.г. Это .допустимо', поскольку дли кусочно-гладкой функции ft м чепрерыв- мкл. функций р, г интеграл (9,k81 сущее гвугт (пак интеграл от кусачи□- чienpeрьганой функции). ” Здесь расширенное допустимое множество составляют кугачиэ-гпадкие функ- ции, которые на концах отрезка йи„ rj обращаются в- иуда, Знааит, фунадчя А, о сущюапвдннн которой гив-орилось выше» также обращается в нуль кв Коцц1 т этого йтреака, 2GJ
Здесь р(х)=—2, у(х)==О, г(х)=2 для всех хе (0, 2л). Функции р, q и г не зависят от х, поэтому вторая вариация 62/ одинакова относительно любой функции у\ 2ж 82/(А)=2 ( — Л2(х)+Л'‘(л))бл. о В частности, такой вид имеет вторая вариация относительно любой экстремали (которая здесь задается формулой у=С sin х, где С — произвольная константа). Вычисляя эту вторую вариацию, напри- мер, для функции й0(х)=х2— 2лх, получаем, что она отрица- тельна: 2« 82/(й0)=2 f I~(Л'2— 2лх)?+(2х — 2n)2Jdx= О, J 3 5 о хотя условие Лежандра (даже в сильной форме) выполняется: /в,у,=г(х)=2>0. Между задачей безусловной минимизации функции <р одной пе- ременной и простейшей вариационной задачей имеется аналогия. А именно: необходимому условию локального минимума <р'(х)=О соответствует необходимое условие слабого локального миниму- ма — уравнение Эйлера — Лагранжа fy--~fyr=Q- Необходи- мое условие второго порядка имеет вид неравенства <р"(х)5:0, и ему «можно сопоставить условие Лежандра fyv> ^>0. Однако оши- бочно предполагать, что экстремаль, для которой имеет место силь- ное условие Лежандра должна реализовать слабый ло- кальный минимум, так как в стационарной точке х, такой что <р"(х) >0, функция <р достигает локального минимума. Дальнейшее исследование необходимых (достаточных) условий слабого локального минимума приводит к условию Якоби, кото- рое связано с экстремалями функционала второй вариации. $ 9.4. УСЛОВИЕ ЯКОБИ 1. Уравнение Якоби. Предположим, что подынтегральная функ- ция f из (9.4) трижды непрерывно дифференцируемая на множест- ве О. Рассмотрим экстремаль вида yEC2[xit х2] функционала (9.4) и допустим, что для нее выполняется сильное условие Лежандра: r(x)=/BV(x, у (л), у'(л))>0 для всех ле[лр л2[. Тогда дифференциальное уравнение Эйлера— Лагранжа, записан- ное применительно к функционалу второй вариации 62/ (относи- тельно у), называют дифференциальным уравнением Якоби, связан- ным с исходным функционалом J относительно у. 252
Запишем в обозначениях (9.29) уравнение Эйлера — Лагранжа для второй вариации (9.28): (рй2+2$йй'+гА%- — [/?А2 + 2qhh' + rft'2]* = dx =2pk+2qh'----4-[2?Л + 2гй'1=0; dx дифференцируя по х и упрощая, имеем ]р (х)—q' (х)| ft — г' (х) h' 4- г (х) Л" = 0. (9.30> Согласно сильному условию Лежандра, верно неравенство г(х)=#0 для всех хе[Х|, х2], поэтому уравнение Якоби (9.30) является обык- новенным линейным однородным дифференциальным уравнением второго порядка, которое можно записать в виде ft"+(х) h' 4-^2 (*) Л—О, где аг (х)=г' (х)/г (х), а2 (х)—(^' (х) — р (х))/г (х). При сделанных предположениях функции at и с2 непрерывны, а значит, согласно соответствующей теореме* из курса дифферен- циальных уравнений, задача Коши для уравнения Якоби всегда имеет, и притом единственное, решение. В частности, существует единственное решение й=Л(х), удовлетворяющее начальным усло- виям Д(х1)=0, (9.31) В терминах этого решения и формулируется условие Якоби. 2. Условие Якоби. Пусть выполняются предположения, сделан- ные в начале п. 1. Говорят, что функция у удовлетворяет условию Якоби, если решение Д уравнения Якоби (9.30), подчинен ное-на- чальным условиям (9.31), не обращается в нуль внутри отрезка [хь х2], т. е. Д(х)^=0 для всех хе (хь х2). Если, кроме того, верно неравенство Д(х2)=#0, то говорят, что функция у удовлетворяет сильному условию Якоби. Уравнение Якоби (9.30) записано для некоторой фиксированной экстремали у функционала 7, поэтому решение Д, а также усло- вие Якоби связаны именно с этой экстремалью. Было бы разумным вместо Д писать, например, Д(|/), подчеркивая тем самым зависи- мость решения уравнения Якоби от экстремали у. Однако для крат- кости записи мы этого делать не будем. В приведенном выше определении условия Якоби отмечается, что некото- рое специальным образом выбранное решение б уравнения Якоби не обращается в нуль всюду на (xh На саном деле из выполнения условия Якоби следует, * В теореме, о которой здесь идет речь, все функции рассматриваются на от- крытом интервале, тогда как в данной задаче фигурирует отрезок [хь %s]. Поэтому в качестве указанного интервала следует взять любой интервал, со- держащий этот отрезок. Такой интервал существует, поскольку множество D открытое. 253
что любое отличное от тождественно равного нулю решение уравнения Якоби, которое равно нулю в точке х|( нигде больше на интервале (хъ хя) в нуль не обращается. Рассмотрим произвольное ненулевое решение h уравнения Якоби (9.30), удовлетворяющее условию /i(xt)=0 и решение Л вида (9.31). Определи- тель Вронского для этих, двух решений при x==Xi равен нулю: Л(хО Д(хО Л'(жО Д'СЧ) 0 A' Ui) ° I а значит, согласно соответствующей теореме из курса дифференциальных урав- нений, система функций h, Л является линейно зависимой на отрезке [х(, х2]. Отсюда следует, что множество точек, в которых одна из этих функций обра- щается в нуль, совладает с подобным множеством для другой функции. Тем самым справедливость сформулированного выше утверждения доказана. В соответствии с этим при определении условия Якоби в (9.31) вместо ра- венства Д'Сжч) = 1 можно записать равенство A'(xt)=c, где сч^О. Значение с=1 в (9.31) выбрано из соображений простоты. Точки х, х"г(хь х2], х/^ьх", называют парой сопряженных точек относи- тельно ненулевого решения h уравнения Якоби (9.30), если Л(х') ==Л(х") =0. Таким образом, выполнение условия Якоби означает, что ненулевое решение Д, удовлетворяющее начальным условиям (9.31), не имеет сопряженных точек вида х(. х", где хб(х() х3). Оказывается, из выполнения условия Якоби следует, что любое ненулевое решение уравнения Якоби не может иметь ни одной пары со* пряженных точек вида х', х", где х', х*е(х|( ха]. Используя условие Якоби, можно сформулировать как необхо- димые, так и достаточные условия слабого локального экстремума. Теорема 9.3. Предположим, что функция f трижды непрерывно дифференцируема на множестве П, а экстремаль у функционала (9,4) дважды непрерывно дифференцируема на отрезке [xi, х2]. Бу- дем считать, что экстремаль у удовлетворяет сильному условию Лежандра. Тогда если функция у реализует слабый локальный ми- нимум функционала (9.4) на множестве У (9.5), го она удовлетво- ряет условию Якоби; обратно: если функция у удовлетворяет силь- ному условию Якоби, то она реализует слабый локальный минимум функционала (9.4) на множестве К □ Доказательство достаточности (см., например, [15]. Для того чтобы доказать необходимость, предположим, что функ- ция у реализует слабый локальный минимум, однако условие Яко- би для нее не выполняется, т. е. существует такая точка (хь jc2), что Д(х0) =0. Если при этом оказывается Д'(*о)=О, то в силу единственности решения задачи Коши для уравнения Якоби с на- чальными условиями Д(хо)=Д'(*о) =0 имеет место тождественное равенство Д(х)=0. Но, по определению условия Якоби, Д —нену- левое решение, значит, A/(«o)4fcO- Введем функцию h^KCi[xi, с помощью формулы A(JC) = ( Д(лг) при XoL [ 0 при х е [х0, л2]. Для того чтобы установить справедливость равенства Ь2/(Л)=0, (9.32) 254
преобразуем с помощью формулы интегрирования по частям вто- рое и третье-слагаемые а вы ражен ни (M.26J, Получаем 2 J f (X)Л (X)U) dx = J < (х) dft3(x)= — f ff (х) ft3 (X) dx, г (х) Л**(х) dx=₽ f г (x) Г (x) dft (x) ₽ - i [г г (X) ft* (x)l ft (xj dx. Здесь были использованы равенства A*xj)^ft(*&)=EL Далее имеем W*)=J 1> (х) Л2 <x)+2f lx) h (x) Л' (x)+r <x> Л'® (x)J dx= Л 1 = C [(/> (x) -4' <x) Д (X» - £ (r (x) Д' (X)] д (X) dx. Б квадратных скобках иаходится левая часть уравнения Якоби (9,30) при Й(х) = Д(х).,, Х|^хСЖ* Согласно условию, Л — решение уравнения Якоби, поэтому равенство (9,32) действительно выпил- мется. Рассмотрим семейство функций из KCa[xi, хЯ определяемых формулой г й(х) при х ш|хь х&—й]. ftp (X) = при Леи„_ Е. XJ, I +« зависящее от параметрЕ, е, во(0, xQ1—Х|), где с-хи—т0 (рис 9,7), Теперь с помощью равейстеа Ф (®) =бу/ (М» её (0, Ха—Xii))s од- редел нм числовую функцию ip й докажем, что ф* (+0) < 0. Введем следующие обели аче- нгя: S2«=j?(x) ft3 (х)+2# u:> X Xft(x)r(x) + r(x)ft^{x)t Рис. 3.7 a,=p (x} U)+39 fxj Л. (x) ht U)+r (x) Й? (x). Учитывай: равенства ф(0')=б3/(Л) =0, составим разиосты ф (г) ф (О) = ф (£) = J 2'tdx = j Odx + f Qdx — j 2dx + jt® Ж® aedx^W£ft)- J Sdx+ J f Sedx- [ Qdx.
Отсюда, используя первую теорему о среднем для интеграла [16], получаем Ф О - Ф (0) =[^№1)+2?Л{g,)+7A; (ЗД] _ S « - 1рлг (W 4- 2?Л (W Л' (fc) 4-“*'2 (W. (9.33) 1 где P=Ptf.i), q—?«2), '-«з); £1Л2Л3е(*о—6»*2>. Р=М<). 4= —?(U,r=r (U; (хо—е,Хо).Выбор точек gj, .... & зави- сит от е; это следует учитывать ниже при переходе к пределу при 8-*-+0. .. Установим поведение слагаемых в правой части равенства (9.33) при е-*~1-0. Поскольку (х0—£, х2), по определению функ-. ции верно равенство Л. (Е,) = (~ti+ *» + «)*(*.—) . . » + « Далее, по теореме Лагранжа найдется такая точка г|^(х0—е, х0), что А (х0—с)=й (х0—г) — Л Сч) = — Л' (ц) е. (9.34) Следовательно, llmp^«1)'-±^-=llm ?<-ti + *о + *'г(ч)5=0 (9.35) • -МО ' • t-»+0 • + с так как дробь в правой части равенства (9.35) является огра- ниченной при е-*—НО- Аналогично, используя формулу (9.34), можно записать равен- ство *.&)- (-ь W <)(->'0>2* По определению функции йв имеем Лв'($2) =—а значит, согласно формуле (9.34), верно равенство ** (ч)« в + с А»(;2)— Имеют место равенства Пт 2^й, «2) «2)*—=Ит 2?<~Ь+ хо + ОА'г01) е=0, (9 36) •—+о « »-м-о * + с поскольку и здесь функция, записанная в виде дроби, ограничена. 25$
То же верно н Для третьего слагаемого & правой части (9.33): Hmr*;!(53)Si-2=lim fft'2(,1) «=0. (9.37) • -+0 < «-*+0 I + с Далее, так как h(x0) =0, имеем Jim рЛ2(и = Ит2?А«в)Л,аб)=0; (9.38) •-*+D а-М-0 lim^'»««)=»-(Xo)A,J(-Ko)- (9.39) «-►+0 На основании равенств (9.35)—(9.39) из (9.33) при в-Н-0 по- лучаем ф'(+0) = —г(хо)Л,2(*о). откуда, используя сильное усло- вие Лежандра и неравенство hf(x0) =Д'(хо)^О, получаем требуе- мое неравенство ф'(+0)<0. Итак, можно сделать вывод, что для достаточно малого «о>*0 выполняется неравенство В2/ (*<.)=№) “Ф (0)=ф' (+0) во+о(ч) <0. Отсюда на основании леммы 9.1 можно сделать вывод, что сущест- вует функция До. удовлетворяющая условиям (9.8), для которой вторая вариация (относительно у) отрицательна: 62/(Л0)<0- Это противоречит тому, что функция у реализует слабый локальный ми- нимум. Покажем, что достаточные условия слабого локального миниму- ма теоремы 9.3 не являются достаточными для того, чтобы функ- ция у реализовала сильный локальный минимум. Пример. Рассмотрим простейшую вариационную задачу, в ко- торой /<х, у, у')=у”- + у'\ Х1=й=уа=0, х2=1. Для этой задачи уравнение Эйлера — Лагранжа имеет вид л - /- Л-=~ &у'+W3)—2iT-W=0- их ах Общее решение полученного дифференциального уравнения тако- во: y^C^-^-Ci, где Cit С2 —произвольные постоянные. Используя краевые условия, получаем Ci = C2=0, т. е. у=0 (хе{0, 1]) — един- ственная экстремаль. Убеждаемся, что для нее сильное условие Ле- жандра выполняется: /\//у,|4(и0=-^“{_6у,|уи0 = 2 >0. Для того чтобы записать уравнение Якоби для найденной экстре- мали, находим: p(x) = 0, ?(х)=0, r(x) =6+4(/'|=2. Следова- тельно, вторая вариация (относительно j/=0) равна 1 62/(Л)=2 f/t'2 jt)dx а 9-339 257
и уравнение Якоби принимает вид 0- —2А'=-2А"=О. dx Найдем общее решение этого уравнения: Л = СзХ+С4, где Сз, С4— произвольные постоянные. Функция Л(х)=Д(дс) =х является реше- нием, удовлетворяющим начальным условиям й(0)=0, Л'(0) = 1, Для найденной функции Д(х) имеем Д(х)#=0 для любого хе (О, 1), т. е. сильное условие Якоби выполняется. На основании теоремы 9.3 делаем вывод, что функция у=0 реализует слабый локальный минимум. Убедимся, в том, что сильный локальный минимум функция i/=0 не реализует. Для этого рассмотрим последовательность {^п}л* 2 функций из пространства ХС)[0, 1] вида 3... где £Л(0= О, если /е||0, 1/л], если t е J 1/л, 1/2J, если /е (1/2, 1]. Очевидно, ул (0) —Он, кроме того, F.(l)=j g.OT<K—J VnAt +J -y=-=0. "=2-3- fl 0 1/2 т. е. функции данной последовательности принадлежат расширен- ному допустимому множеству. Поскольку Jy.-Ho—max |У,(х))=-т=-—О, хе{0,1) у П л-*-« в любой сколь угодно малой окрестности нулевого порядка эле- мента у=0 содержатся члены рассматриваемой последовательно- сти. Вычислим значения целевого функционала на элементах по- следовательности: 1 I 1/л /<Уж>=J gi(O<K+J g£(t)<H=f (n-n^dt+ 1 На основании леммы 9.1 о скруглении углов заключаем, что функ- ция </=0 не реализует сильный локальный минимум. 268
3. Задача определенич критической нагрузки балки. Балка ЛВ длины Г, имеющая цилиндрическую форму», расположена верти- кально. Ее нижний конец 4 жестко закреплен,, а верхний под. де .ст- анем нагрузки Р может перемещаться по вертикально й прямой та- ким образом, ето касательная, приведенная к осевой линии балки в точке В, все время проходит через от- резок Л В (рнс. 9,9), Требуется определить критиче- скую нагрузку Р’, при которой вертикальное положе* ине балкн является положением устойчивого раВНОВе- СИЯ, Обозначим через з длину дуги осевой линия балки, отсчитываемую от точки А, .а через ф^ф(а) меньтнЙ мя углов, образованных отрезком АД я касательной к осевой липин, .проведенной в точке, которая располо- жена на расстоянии а от А Потенциальная энергия изогнутой балки равна. ГИ(Ф) ds. (9.40} где pZ>0 — константа, зависящая от коэффициента Рис, £.3 упругости и момента инерции поперечного сечения. Состояние устойчивого' раэнсве*ил характеризуётся минимумом потенциальной энергии, поэтому задача сводится к определению таких значений Р,. грн которых функция реализует нал- меньшее возможное значение функционала {Я.Ф21 ’на множестве функций айда ф^СЦС» .Г], 'Ф(^)=ф0) s(l. Для решения этой задачи воспользуемся теоремой 9,3, ’ % Запишем уравнение Эйлера — Лагранжа: —Р ski —— |р-^2-1=0. dj у ds ; Очевидно, функция q (з)=0 удовлетворяет этому уравнению, а зна- чит, является экстремалью. Кроме того, выполняется силе ное ус- ловие Лежандра /rd^.0i=p>Oe Н и ходим (относительно фу и кц и и ф (, sj э С) р (s) = (s) 0, г(д)'^р и записываем уравнение Якоби: рГ+Яй=0„ Обадее решение этого уравнения имеет вад Д (з).й=Д $i.n ф Р^+С^соарФ/й* я его решением при начальных условиях Л (D) =-0( Д*'(0) = 1 явля- ДТСИ' функция A'UJ = Fli/P sin 9* 259
Согласно теореме 9А решение является оптимальным, ес- ли Д(д)Й0 для всех эго равносидыю условию siuK^W >* О. Наименьшее положительное Р> при котором послед- нее неравенство нарушаемся, определяет критическую нагрузку. Следовательно, Р*/р/ = ^откуда находим Р* = л®р/Я $ 9,5. НЕКОТОРЫЕ МОДИФИКАЦИИ ПРОСТЕЙШЕЙ ВАРИАЦИОННОЙ ЗАДАЧИ 1» Простейшая задача Больца. В задаче Вольца целевой функ- ционал В^./4-V, подлежащий минимизация, является суммой ин- тегрального и терминального функционалов: 5 (*/)= j / U# f (А Г U)) dx+Ш Ш i Uf)L Г| (9.41) где ^ — числовая функция двух .переменных, определенная на некотором открытом множестве б с И2* Терминальный функци- она л ¥ задан на том же множестве функций $*=^(х)Ф что :i ивдс- тральный функционал, sr его значения вычисляют по формуле Uftro.* У Wk-дЛ=Ф IfW. У Будем считать, что функция f из (9.41) задана и по крайней мере непрерывна на некоторой области. DcR®. Опишем множество У допустимых функций, на котором минн- мнзируется функционал (9.41): К [У е Q [JC|, дг/ I (л, (x)t (x)) e D При всех x>pci, xj|. Рис. 9.9 Здесь отсутствуют краевые условия, множества У -вида (9.5), фигу- рнрующе^о в пьстановке простейшей вариационной задачи.. С гео- метрической точки зрения это озна- чает, что минимальное значение Функционала В ишется на классе гладких кривых вида у=^(х)9. кон- цы которых не фиксированы и мо- гут быть произвольно расположены на прямых. х^хг и л-=?хг (рис. 9,9), Ре шеи нем. задачи Больца являет- ся допустимзя функция, реализую- щая на указанном: множестве У наименьшее возможное значение функционала В. Введем понятие ло- кального решения. Допустимая 4 ункцин ,Уо^С-[лл],, реализует оабый локальный жцшмум в за- даче Больна, если существует такое число еД>0, что неравенство - (й) СБй) справедлино' для всех функций ^УГШМдо?) *орема 9Д. ///^/голо.ткхи, что ф^нкцад / оцрейедем ц ,ней да- рыдвд .влесте1 с частиWMH /и ц m л«ножё£тёе Д а 24л)
функция ф непрерывно дифференцируема на множестве G. Для то- го чтобы допустимая функция i/gCi[xi, х2] реализовала слабый ло- кальный минимум в простейшей задаче Больца, необходимо, чтобы она удовлетворяла уравнению Эйлера —Лагранжа fy(X' У, у, j/')=0 (9.42) и, кроме того, чтобы для нее были выполнены следующие условия трансверсальности: /у' (хп У (хД У' {У (хг), У (х2)1, fy- (Х2, У (xj)> у' <*2» = — Ф». (У U1). У W1- (9.43) (9.44) □ Доказательство теоремы аналогично выводу уравнения Эйле- ра— Лагранжа (см. § 9.2.) Пусть функция у—у(х) реализует слабый локальный минимум в простейшей задаче Больца. Введем семейство функций вида y-f-yh, где ЛеСДХ], х2], зависящее от параметра y^R. При значе- ниях у, достаточно близких к нулю, функции данного семейства принадлежат окрестности первого порядка U4(y) функции у из определения слабого локального минимума. Значит, числовая функ- ция вида <Р(У)=В($/4-уЛ)= J f(x, //(х)-|-уЛ(х), у'(*)+УЛ'(х»<и+ + Ф1у (JC1+уА (х,), у (х2)4-уЛ (х2)] достигает локального минимума при у=0. Отсюда, используя тео- рему Ферма, после дифференцирования под знаком интеграла по- лучаем <р' (0)=j fy (х, у (х), у' (х)) Л (х)+/,, (х, у(х), y'(x))h'(x) dx -ф- -гФ₽.1уС*1)* У С*а)|А (^и+Ф^Гу <хД !/(х2)]Л(х2)=0- (9.45) для всех функций fteCi[xb x2]- В частности, для всех функций Л, подчиненных условиям й(Х|) =й(х2) = 0, из равенств (9.45) следу- ет, что J \ fv (х, у (х), /(х))Л<х)+/у/(х, У (*). у'(*)) A'(x)Idx=0. *1 Интегрируя первое слагаемое по частям и применяя лемму Дю- буа— Реймона, получаем, что функция у удовлетворяет уравнению Эйлера — Лагранжа (9.42). 261
Теперь выведем условия трансверсальности. По формуле от©- rp'ipcaaajHJi по частям * имеем Xi Хр f Л- (х. у {<), е/' (х)) А' (х) d х = ' (х, у (х), ' (х)) dA (х)— XI Jf I = Й (X) /> (Xf > I Xje gf (X)) >(х, ^(х), $fU)) dx. Р соответствии с aww из равенства (9,45)» используя у равней не Эй- лера— Лагранжа ('&-42), нт йдем *'(0>=nz' -fl U, sr UK yf U)l= 7=Л" U> £ Uh У (4) 1A (x) dx + ot +Д (x) /“r (X, 0 Uh / (x))l.! UiK U Ua)J A Ui> 4- +%., I/Uih ?W!AU>{Л'?хУ» ГСф. F*WH ^Uii- Mx3>.:: йUa)+j =дихь t^xj, ^,[xld + ^UiK w И(х^а Подставляя последовательно в последнее равенство функции вида AU)^x—xt и Л(х)^:х—х2а придем к уеловинм трансверсальности (9~44) и (9ЛЗ) соответственна. И Сравнивая теоремы 9-4 и 9-L видим:., что необходимые условия для задачи Вольца отд и чаются от соответствующих условий для простейшей вариационной задачи наличием условий т р я нсверсь л ьгшет и вм есто краевых условий. В за и.иен уело вий трансвер сальности фигурируют как значения функции в. но.нце1_ых точках, так и значения производ* ных. Поэтому граф их оптк мяльной функции вблизи концевых точек (т. е„ вбли- зи точек псресечечип с лря- мымн jt=Xii и х=х3) не мо- жет быть про«з>Ш1ь:ии.м;( а подчиняется определенным требовани- ям Наличие условий трансверсальности в задаче Больца связано' с и озм ож костью перемещения! концов допусти мыл линий вдоль прямых Х “Х|, Х“ХЙ. 2, Простейшая задача с подвижными нонцахи. Пусть в плоско- сти хО# с помощью уравнений jf-q>i(x) и «/=ф2(хк зз- " Исмдм<>в.йвде мой формулы правомерна., *ак как фуиыщя Ju непрерывна, а значит, .согласно данчлиу равенству Лун щи и fyf нелрерысмо диф^'ё|'гн'.инруема. ,it2
даны две кривые. Рассмотрим линии, определяемые уравнением # = #(х), концы которых.расположены на данных кривых (рис. 9.10). На таком классе допустимых кривых (функций) у = у(х) можно рас- сматривать задачу минимизации некоторого функционала — зада- чу с подвижными концами. В простейшей задаче с подвижными концами минимизируемый функционал определяется формулой / (У, хх , х2)= J /(*. У(х\ у’(хУ)дх* (9.46) где х'<Х|<х2<х", причем х', х" — фиксированная для данной за- дачи лара чисел. Будем считать, что для функции f выполнены те же предположения, что и в постановке обычной простейшей вариа- ционной задачи. Допустимыми здесь являются функции у=у(х), удовлетворяю- щие следующим условиям: peCJxj, х2], #(x/)=<pi(x,)t i=l,2. (9.47) (х, #(х), /W)g6 при всех хе[х', х"], где ф), фз — заданные гладкие на отрезке [х', х"] функции. Решением задачи с подвижными концами (реализующим гло- бальный минимум) является функция у и пара чисел хь х2, да я ко- торых функционал (9.46) принимает наименьшее возможное значе- ние. Тройка у, Х|, х2 реализует слабый локальный минимум в прос- тейшей задаче с подвижными концами, если можно указать такое число е>0, что для всех функций у вида (9.47) и всех пар чисел X], х2е(х', х"). X|<Xit удовлетворяющих неравенствам II#—#llj <е, jxt—Х11 <е, |х2—х2| <е, верно неравенство /(у, xi, £2)^/(у, xIt х3). В этом определении числа Хь х2 также выбирают «локально», т. е. бЛИЗКИМИ К Х| и х2. Теорема 9.5. Будем считать, что функция f непрерывно диффе- ренцируема на области Д а функции <pi н ф2 непрерывно диффе- ренцируемы на отрезке [х', х"). Для того чтобы допустимая тройка у, Xt, Х2 реализовала слабый локальный минимум в простейшей за- даче с подвижными концами, необходимо, чтобы функция у—у(х) удовлетворяла уравнению Эйлера —Лагранжа (9.42) при xe[xi х2] и, кроме того, были выполнены следующие условия трансвер- сальности: f(xlt y(xt), y'W)^=fv'(xlt #(хД #'(х,-))(#'(*.) — </(*/)), (9.48) *«1,2. □ Пусть тройка у, xJt х2 реализует слабый локальный минимум. Тогда функция у реализует слабый локальный минимум в обычной простейшей вариационной задаче с фиксированным отрезком [хь х2] и краевыми условиями #(xj) =#(xi), #(х2) =#(х2). Поэтому, 263
согласно теореме 9.1, функция у удовлетворяет уравнению Эйле- ра— Лагранжа (9.42) при хг]. Докажем условие трансверсальности (9.48) при i=r (т. е. на левом конце). При i=2 доказательство аналогично. Введем семей- ство числовых функций переменной х вида У (х; у) = у(х) 4- у (х — х2), зависящее от параметра yeR, и функцию двух переменных jq и у F(xt, Y)=y(xt; у)— МА)- Для этой функции выполнено равенство F(xi, 0) =у (xi) —qpi (xi) =0, а для производной имеет место неравенство Fy(xi, 0)—xi— х2=#0. В этом случае применима теорема о -неявной функции [16], согласно которой существуют такие окрестности (7(xi), £7(0) и непрерывно дифференцируемая на l/(*i) функция у=Г(Х1), что Г(х1)=0, Г(х[)е(/(0) и, кроме того, у (лг, Г (л1))=ф1 (Xj) дли всех е (7 (Х0, (9.49) Рассмотрим семейство функций у=^у(х; Г(*|)) переменной х при Г(х1)^(7(0). Согласно равенству (9.49), левый конец графи- ков этих функций находится на кривой y=qpt(x) (в окрестности (7(£»)). Правые их концы совпадают с точкой (х2, tp?(x?))- Трой- ка у, Х[, xz реализует слабый локальный минимум, поэтому на бо- лее узком множестве допустимых функций, а именно среди всех функций рассматриваемого семейства *, наименьшее значение функционала (9.46) также реализует функция у—у(х)=у(х\ 0). Иначе говоря, числовая функция f(x, 1/(л)4-Г(х1)(х — л2), /(Jc)4-r(JCt))djc достигает локального минимума в точке Х[ = Х[. Отсюда, согласно теореме Ферма, следует, что o'(xi)=0 или V' (хр = —/ (хи у (Xi), у’ Ut)) -|- 4-Г'(Х!) [ [/р(х, у (х), f?(x), (х — х2)4- 4-/Их, tf(x), у’ (х)] dx=0. (9.51) * Считаем, что рассматриваемое семейство функций входит в окрестность пер- вого порядка функции у из определения слабого локального минимума. 264
Используя формулу интегрирования по частям, имеем 7, _ _ __ _ 7, [ /г (А У <*>• У' <*)) dx = (х —х2) fu. (х, у (х), у' (х)) | — 7, 7 — С (л — Xj) [Д /г (х, у (х), у' (х))1 dx. J Id-* J 7, Учитывая последнее равенство, из (9.51) получаем —/(А. Й£). Fub+r'Cxtf х X [ У<х>' — У(*)> у'(х))](х — X0dx + 7. 4-(Л — л-)Г^(х, ?(Х), ?(Х))| = 0. Отсюда, принимая во внимание, что функция у удовлетворяет урав- нению Эйлера — Лагранжа, и используя равенство (9.50), прихо- дим к равенству (9.48) при х = I. Если подвижным является только один конец, например правый, то для функции, реализующей слабый локальный минимум, усло- вие трансверсальности должно быть выполнено только на правом конце (при этом левый конец закреплен: у(х1)=у1). Для иллюстрации условий трансверсальности рассмотрим зада- чу о брахистохроне, в которой, по условию, правый конец подви- жен и может перемещаться вдоль гладкой кривой у==ф2(х), при- чем ф2(х)>0 для всех хе[0, х"]. Запишем для этой Задачи условия трансверсальности при i—2: 1 (у' _%), V2W 2gy 1 4- у'1 откуда У'(х2)?И'Ч) = — 1. Геометрически последнее равенство означает, что -касательные к брахистохроне и кривой у=Фз(х), проведенные в точке их пересе- чения, взаимно перпендикулярны (рис. 9.11). 3. Простейшая изопериметрнческая задача *. До сих пор мы рассматривали вариационные задачи без ограничений, в которых * Термин изопери метрическая задача появился в связи с задачей отыскания замкнутой кривой фиксированной длины (периметра), ограничивающей плос- кую область наибольшей возможной площади. 265
фигурировал б е з у с л о-в н ы й (локальный -или глобальный) экст- ре му;и. В зтоmi пункте будут сформулированы необходимые усло- вии у ел о в ното (слабого локального) экстремума в простей’ шей вариационной задаче с единственным. фуикцкопальным ограничением в форме равенства. Вариационные задачи с функцио- калышмп ограничениями в форме равенств называют цзолерЕшег- рй«егхад.н да^ачажь, В. поста нов не простейшей изоте* р и метрической задачи имеются .два функционала: /(Я*] /«, FPO. ^'Wdx,, (9.52) y(x). Г(О)бх. (9.53) Первый ад них =—целевой функционал — подлежит минимизации., функционал. (9.53) используется и записи функционального огра- ничения. Для функционалов / и / считаем выполненными предпо- ложен ня из постановки простейшей вариационной задачи, В част- ное ти, функции, / и g предполагаются'Заданными (л, по. крайней мере, непрерывными) на связной области ОсЦ3. Множество допустимых функции, на котором минимизируется' функционал (9.52) „ имеет вид Г [у е Cj хэ| |! J (у)=/, (Х|)=J/j, i — L 2, и» ур& при всех x^fxr, (9.54) где £, х/, „ i== 1, .2 — заданные числа. Функция., минимизирующая функционал ./на множестве (9,54 }„ реализует .глобальный (условный) минимум этого функционала. Понятие локального экстремума здесь определяется обычным обра- зом, Говорят, что' функция реализует глабый локальный (условный) лш«и.я(лм з простейшей изоиарнметр и ческой задаче, ес- ли найдется такое число е>0, что неравенство ./(jj) имеет место для всех Теорема 9.6, Допустим, что фэдикцнц f u g нлпрсры^но о^-фф* • ял жножесгл^ D, Для того чтобы р*?о- лнзойада слобий локцд&яый лшяш«ум н лростеЩцей юо-лерцлегди- ческой аш?пч^ ягобхойцло тагах не разные одмо- gpawHHO чисел 10,, 1а., при которьа подлог драянгнию Эйлера — Лйфанжй йнбп £ —i„. = 0. (9.65> Jjr зй £/W» ^'U))s у UK Г(х)), 2fcfi
□ Пусть функция у, реализующая слабый локальный минимум, является экстремалью функционала J. Тогда она удовлетворяет уравнению Эйлера — Лагранжа вида gy------а значит, и dx уравнению (9.55) при Zo=O, Xi = l. Таким образом, можно счи- тать, что функция у не является экстремалью функционала J. Рассмотрим две произвольные функции hi и h2 вида JCj], —йДх2)—О, Z—1»2, и семейство функций (9.56) У<х> Yi. Уд=У<х)+У11ц(х)+ч2к2(х\ зависящее от параметров у>, Если эти параметры взять до- статочно близкими к нулю, то функция у~у(х; уь у2) (при фикси- рованных уь уз) будет принадлежать окрестности первого порядка радиуса е>0 из определения слабого локального минимума для у. Введем функцию двух переменных F с помощью равенства ^(Yi, v2)=^(i/(jc: Vi. y2))—/. Согласно предположениям теоремы, эта функция непрерывно диф- ференцируема в некоторой окрестности начала координат (0, 0) и для нее выполняется равенство F(0, 0)=/(£) —1=0. Дифферен- цируя функцию F с помощью правила Лейбница и учитывая ра- венства hi(xi)=hi(x2) — 0, i=l, 2, получаем FV1(0, 0)=6J(ft2), где в правой части равенства находится функционал первой вариации для J (относительно у). Функция у не является экстремалью функ- ционала /, поэтому функцию h2 можно выбрать так, чтобы имело место неравенство гТ1(0, 0) =б/(Л2) #=0. Функцию й2, удовлетво- ряющую этому -неравенству, в дальнейшем будем считать зафикси- рованной. Согласно тебреме о неявной функции [16], существует окрест- ность U(0) и непрерывно дифференцируемая (на Щ0)) функция ¥2=Г(У1) такие, что Г(0) = 0, F(Vlt Г(У1))=-/(У(х; Yi. Г(У1)))—/==0 для всех Yie£7(0), (9.57) Г(0)_______ V W FTi(0,0) »/(Л2) (9.58) Рассмотрим семейство функций вида у—у(х; у(, Г(уО) при до- статочно близких к нулю значениях уь Согласно равенству (9.57), все эти функции принадлежат множеству {9.54) (равенства у(хг, Yi. K(Yi))= gi можно проверить непосредственно, учитывая равен- ства (9.56)). Более того, верно равенство у{х\ 0, 0)=р(х) и по- этому при всех уь достаточно близких к нулю, эти функции при- надлежат окрестности первого порядка из определения слабого ло- 267
кального минимума для у. Следовательно, числовая функция ‘°(Yi)=j /(л, у (л), у' (х)) dx, где у(х) =у(х) Ч-у1Л1 (ж) + Г(у1)йг(х), в точке yi=0 достигает ло- кального минимума, а значит, по теореме Ферма, имеет место ра- венство и'(0)=0. Дифференцируя функцию v под знаком интегра- ла, получаем о' (0)=6/ (ЙО 4- Г' (0)»/ (йз)=В/ (ЙО+W (ЙО=0, (9.59) где , =r(0)»(M = ..«/W, . (960 М(Л1) »/(*,) Заметим, что функция hi не была зафиксирована, поэтому равен- ство (9.59) имеет место для любой функции hi вида (9.56). Введем функционал /*(*f) = J [/(*, У&), y'(x))+\g(xt y(x)t x/'(x))[dx, определенный на множестве D. Очевидно, В/*(ЙО=8/(ЙО+МЛА1>» где функция hi имеет вид (9.56). Поэтому равенство (9.59) равно- сильно тождественному равенству нулю первой вариации функцио- нала /*: 6/*(hi)s0. Таким образом, функция у является решением уравнения Эйлера — Лагранжа (9.55) при Хо= 1 и К, вида (9.60). Уравнение (9.55) из теоремы 9.6 можно умножать на любое число, отличное от нуля. Поэтому при его решении достаточно огра- ничиться рассмотрением следующих двух случаев: 1) Хо=О, 7Ч = 1 и 2) Хо=1, Числа Хо и Xi часто называют множителями Лагранжа, а метод решения изопериметрической задачи на основании теоремы 9.6 — методом Лагранжа. Существует аналогия между способом учета ограничений в нелинейном программировании и вариационном ис- числении: в обоих случаях фигурирует функция (функционал) Лагранжа. Понятие функционала Лагранжа неявно было исполь- зовано при доказательстве теоремы 9.6 (см. функционал /*). Утверждение теоремы 9.6 Можно распространить на более ши- рокий класс изопер и метрических задач, в которых имеется несколь- ко функциональных ограничений-равенств J,(y)—h» J=h 2....k [15]. В этом случае функция L из (9.55) имеет вид к z=z0/(x, уЮ* £'(-*)). /-1 где gj — подынтегральная функция для функционала //, /==1, 2, k. 268
Пример (задача Дидоны *). Рассмотрим следующую вариацион- ную задачу с неподвижными концами: соединить кривой у—у{х)^ >0» —х0^х^х0, имеющей длину Z, две точки (—Хо, 0) и (х0, 0) таким образом, чтобы плоская область, которая ограничена осью абсцисс и этой кривой, имела наибольшую возможную площадь. Математическая формулировка данной задачи приводит к мини- мизации функционала /(Ю=—J У{х)6х при ограничении K1+^‘<JC><U=Z- При этом 1^2xq (в противном случае задача заведомо не имеет решения) и выполняются краевые условия у(—хо)=у(хо}=0. За- пишем для данной задачи уравнение Эйлера — Лагранжа: (9.61) Если 7^=0, то отсюда следует, что p'=const, а значит, что у= =0— единственное решение уравнения (9.61), удовлетворяющее краевым условиям. Это возможно только при /=2х0. Пусть 1о=1, Xi=XeR. В этом случае, интегрируя уравнение (9.61), найдем где Ci — const. Решая полученное уравнение относительно гД по- лучаем У'= _ х — Ci /Х2 —(х—Ct)2 откуда после интегрирования имеем У _ с2= ±-|/Х2—(х — Q)2, •или (х-С1)2+(^-С2)2=Х2. В результате получено уравнение семейства окружно- стей. Используя краевые условия и ограничение-равенство (эапи- •-* Исторический комментарий к этой задаче см., в [2]. 269
санное для функций найденного семейства), запишем систему урав- нений: (-Xo-Ctf+Cl—K, откуда находим С,=0, arcsin^-=-^-. <9.62) Последнее уравнение относительно X имеет (н притом единствен- ное с точностью до знака) решение только при /^лх0. Таким образом, при 2х0</^лх0 существует единственное ре- шение уравнения Эйлера — Лагранжа. Это дуга окружности ра- диуса |Х| с центром в точке (0, —|Сг|), где С2 и X определяются из уравнений (9.62). Из геометрических соображений следует, что решение рассматриваемой задачи существует, поэтому можно сде- лать вывод, что найденные дуги являются решениями задачи Ди- доны. При 1>лх0 уравнение Эйлера — Лагранжа гладкого реше- ния не имеет. § 9.6. БОЛЕЕ ОБЩИЕ ВАРИАЦИОННЫЕ ЗАДАЧИ 1. Классификация задач вариационного исчисления. Задачи ва- риационного исчисления классифицируются на основе выделения различных классов и типов целевых функционалов, граничных ус- ловий и ограничений, которые фигурируют в постановке любой ва- риационной задачи. По типу целевого функционала вариационные задачи можно подразделить на: задачи с интегральным функционалном (задачи Лагранжа) / (У) « [ / (х, У (х), у' (х)) dx; (9.63) задачи с терминальным функционалом (задачи Майера) 0(х2)1; (9-64) задачи со смешанным функционалом (задачи Больца) #(£/)=/(tfJ+’FQO. <9.65) Во всех рассмотренных ранее вариационных задачах допусти- мые функции у=у(х) считались числовыми. В задачах (9.63) — (9.65) функция у=у(х) может быть векторной: у(х) = (yi(x), 270
у2(х)...^я(х)), п>1- При п>1 говорят о пространственной (век- торной) задаче, а при л— 1 — о плоской задаче. Заметим, что при л>1 в формуле (9.63) / — функция 2л+1 переменной, а у'(х) означает набор функций yi'(x), у/(х), Уп'(х). Граничные (краевые) условия в вариационных задачах в обшем случае л^1 можно задать указанием множества из пространства R2't+2, которому должны принадлежать концы графиков допустимых функций у=у(х), т. е. «обобщенная» точка (xj, #(xi), *2, </(х2))- Если это множество состоит из единственного элемента (xi, Уь х2, у2). то соответствующую вариационную задачу называют задачей с неподвижными (закрепленными) концами y(xi)=yi, у(хй)=у2\ причем отрезок [хь х2] фиксирован. В задачах с подвижными кон- цами отрезок [Xi, xj (только его левый или правый конец) может быть как фиксированным, так н нефиксированным; при этом под- множество, которому должна принадлежать пара точек (y(xi), у(х2)), обычно задают в виде множества решений уравнения Ф(У(х,), у(х2))=05, где Ф — s-мерная вектор-функция 2 л переменных. Например, в за- даче с подвижными концами, рассмотренной в п. 2 § 9.5, Ф — дву- мерная вектор-функция двух переменных вида Ф(^(Х|), у(х2)) = = (^(xi) — q>i(xt), у(х2) — Ф2(х2)). Ограничения в вариационных задачах, как правило, имеют вид функциональных равенств * 4 (У)=0- 7s 2.......*• (9.66) где // и Z/, /=1, 2, .... А,— заданные функционалы и числа, или дифференциальных равенств DjC*. У(х), у'(х))=О, / = 1,2,.,.,р; хе[хн х2|. (9.67) где Di, jD2, ..., Dp — заданные функции 2 д+1 переменной. В част- ности, равенства (9.67) могут иметь вид х/у=<р^(х, у), А, где ф/ — функция л+1 переменной. Вариационные задачи с огра- ничениями вида (9.66) называют изопериметрическими задачами. В общем случае в вариационной задаче могут присутствовать как функциональные, так и дифференциальные ограничения. В послед- нее время объектом изучения вариационного исчисления стали так- же задачи, содержащие кроме указанных ограничений еще и функ- циональные неравенства. Все перечисленные вариационные задачи относятся к задачам первого порядка в том смысле, что в их формулировках фигуриру- ет только производная первого порядка. В целевые функционалы и ограничения задач высшего порядка могут входить производные yf, у",.... до некоторого порядка m включительно. * Равенства (9.66) по аналогии с задачей нелинейного программирования мож- но записать в виде 7(у)=0, где =/>((/)—ij. 271
В задачах первого порядка допустимые функции у=у(х], как правило, считают гладкими (непрерывно дифференцируемыми), В некоторых случаях удобно рассматривать более широкие классы допустимых функций (например, кусочно-гладкие функции), В за* дачах высшего порядка требования к допустимым функциям еле* дует усилить, чтобы постановка таких задач была корректной. 2. Пространственная вариационная задача. Рассмотрим про- странственную задачу Лагранжа с неподвижными концами (без ограничений) и сформулируем необходимое условие оптимально- сти. Целевой функционал, подлежащий минимизации, здесь имеет вид (9.63), где yW^Wilx}, У7(х),..., уя(х))\ y'(x)=(y'iW, У2(х),.,., y„(x))t а f— функция 2п4-1 переменной, определенная на некоторой об- ласти Z)cR2/,+1. Положим £)= [(лс, у) е R"+11 (х, у, у') е D при некотором у е Rrt } и зафиксируем пару точек Л(Х1, yi), B{xzt уг) множества D, где у*л). k=\, 2, причем xi<x2. Линейное пространство л-мерных вектор-функций, каждая ком- понента которых принадлежит С|[хь х2], будем обозначать через х2] * Используя это пространство, множество допустимых вектор-функций в пространственной задаче определим с помощью равенства r = х2||у{хл)=ук, А=1,2, (х, у(х), у'(х))еб при всех хе(хн х2]}. Решением пространственной задачи (реализующим глобальный безусловный минимум целевого функционала) является вектор- функция у^У, для которой неравенство 1(у)^.!(у) имеет место при всех У. Для того чтобы ввести понятие локального решения, простран- ство Crf*], х2] необходимо превратить в нормированное простран- ство. Норму в Cin[xi, х2] можно ввести согласно любой из следую- щих формул: Мо=шах |у(хЦ, Х6(Х„ Jt9J fe|=max |y(x)[+max Х€[Х>, Ж») х,| где через |]...|| обозначена обычная евклидова норма в простран- стве R®: * В пространстве C^fx^, х2] сумма элементов н произведение элемента на чис- ло определяются в виде покомпонентной суммы и покомпонентного произве- дения на число- 272
Определим с помощь*> pH?rrihiux в;»рм ^-окрестности и°(у)=[у<=С?[хъ x2]l|y-^|o<M. и1(Й=|«/С1 ejxn х2] I || у-у || !<гJ нулевого и первого порядка соответственно. Говорят, что функционал / вида (9.63) достигает слабого (силь- ного) локального минимума на вектор-функции если найдет- ся такое число е>0, что неравенство 1(у)^1(у) выполняется при всех ye ypUe1 (у) (соответственно уеУПЧе°(у))- Необходимое условие слабого локального (сильного и глобаль- ного) минимума для рассматриваемой пространственной задачи сформулировано -в следующем утверждении. Теорема 9.7. Предположим, что функция f из (9.63) непрерывна вместе со своими частными производными f У[, fy, i=l, 2, п, на множестве D. Для того чтобы вектор-функция y^Y реализовала слабый локальный минимум функционала (9.63), необходимо, что- бы она удовлетворяла следующей системе дифференциальных урав- нений Эйлера — Дагранжа: /уДх> У> У, У'Ъ 1 dx */ i— 1, 2,.., л. (9.68) □ Доказательство проведем сведением пространственного слу чая к плоскому. Введем множества —|(х, у^ удs R31(х, i> уУ1+ъ**‘*Уп1 fZi»***» У/—1> Ун У/+Ь"ч Уп) i 2,..., л» на которых определим функционалы _ _ _ f f Ос» Уъ-"у У1—I» Уь У/+11*-ч •*> Уи..", yt-u Уь yl+i......yi)dx и зададим граничные условия УДх1) — Ум* ('= 1, 2,..., д; *= 1, 2. Вектор-функция у реализует слабый локальный минимум функ- ционала (9.63), поэтому функция yt реализует слабый локальный минимум функционала //, i=l, 2, ...» п. Таким образом, имеем п простейших вариационных задач, к каждой из которых применима теорема 9.1. В результате получаем, что функция yi удовлетворяет уравнению (9.68), i=l, 2, ..., п. Для нахождения экстремалей в пространственной задаче необ- ходи мо-решить-систему гг дифференциальных уравнений (9.68) (об- 273
шее решение которой в общем случае зависит от 2и произвольных постоянных) при 2п краевых условиях t/Дхл) =J/a;, i= 1, 2.п; 6= 1, 2. Нередко сделать это трудно (а подчас и невозможно), так как система (9.68) может быть очень сложной. 3. Задача высшего порядка. Получим необходимое условие оптимальности для следующей задачи Лагранжа высшего порядка с неподвижными концами (без ограничений). Требуется минимизи- ровать функционал /(У) =J /(х, у(х), у'(х).......(х)) dx (9.69) на следующем множестве допустимых функций: Г = {уеСм[хь xj[£/<*’(хД=ул, 6=0,1 т — 1; i=l,2; (9.70) (х, у(х), у'(х).ff(m>(x))eD при всех xe[xlt x2|J. Функция т+2 переменных f считается заданной и по крайней мере непрерывной на некоторой области ЛсзК'"4®; Cm[xh х2] — ли- нейное пространство числовых функций, имеющих на отрезке [ль х2] непрерывные производные до порядка т включительно; xit у,*, 6=0, 1.... т — 1; х=1, 2,—заданные числа, определяющие гра- ничные условия. Функцию y^Y, реализующую минимум функционала (9.69) на множестве У вида (9.70), называют решением (глобальным и без- условным) сформулированной задачи высшего порядка. Введем по обычным правилам понятие локального решения. Превратим пространство Cm[xj, х2] в нормированное пространство, определив на нем норму следующим образом: Л1 В частных случаях т=0 и m= 1 из CJxi, ха] получаем введенные ранее нормированные пространства С[хь х2] (т. е. Cofxj, х2]) и Cj[xi, х2]. Далее определяем ^-окрестность порядка m элемента у: < /r(i()=(secJ.[x1. х2ц в y-jr । .<•). Если можно указать такое число е>0, что неравенство 1(у)^ ^1(у) имеет место для всех УрС/г"1 (у), то говорят, что функ- ционал (9.69) достигает на элементе у слабого локального мини- мума. При выводе необходимого условия оптимальности потребуется вспомогательное утверждение, которое в частном случае /л = 1 сов- падает с леммой Дюбуа — Реймона (см. § 9.2). 274
Лемма 9.5 (обобщенная лемма Дюбуа— Реймона). Пусть зада- на функция ugQa], л2] и. равенство j w(x)fttm)(x)dх=0 (9.71) имеет место для всех функций h, удовлетворяющих условиям * ЛеСт1хь х2]; Л^(х1)=Л(А)(х2)=0, А=0, (9.72) Тогда существует такой многочлен pm~i, степень которого не больше чем tn — 1, что равенство a>(x)=pm-i(x) верно при всех хе[хь х2]. . □ Рассмотрим многочлен вида Pm—1 <•*) = Q + Q (/ — Х2) + .. • 4" ^m-1 (t — x^m~1 и подберем константы Со, Ci... Cm_i таким образом, чтобы вы- полнялись равенства У ’(/-*4)*(Р„1-1 (/)-«(/))d/=O,f А=0. l,...,m-l. (9.73) jr 1 Интегрируя, получаем следующую систему m линейных урав- нений относительно Со. Сь .... Cm-t: — (/ — x2)*<i)(t)df, А=0, —1. X Можно проверить, что определитель этой системы уравнений не равен нулю: —Xj (х3—Х1Я . (Х2 — Х1)" 12 m (Х2-Х1Р (х2—Jft)3 ... (x2-Xi)CT+l 2 3 fit -j- 1 m ,2m—1 =(x2-x1)m* 1/2 1/2 1/3 2m — 1 1/m /0. m 1/m l/(/n4-l) ... l/(2m—1) поэтому, согласно теореме Крамера, она имеет (н притом единст- венное) решение. Пусть Со, С(........ COT_i— решение этой системы. • В этих условиях использовано стандартное обозначение Л(6, = Л, 275
Функция —и(0 на отрезке [хь Х2] непрерывна, поэто- му для доказательства леммы достаточно убедиться в справедли- вости равенства *1 Распишем это равенство более подробно: X, xt Последовательно умножим равенства (9.73) на Со, Ci, , Cm-t, а затем полученные равенства почленно сложим. В результате имеем р^ (/) (рт-г (0 - О> (Л) d t=0. Следовательно, хж /*=- f<*(0(Аг-1 (*)-<>(/))&. (9.74) Введем функцию ЛоеСт[хь хг] с помощью формулы 1 (m-I)t Ao(Jf)== *1 Ее производные имеют вид (А=0, 1, ..., т — 1) *t>>U)= ( , f <t-xy‘-*-'(P„r-i(О-<•«))<«. (Л1 — К — 1} I J Очевидно, Л?,(х1)=0.Более того, в силу (9.73) выполняются ра- венства Я(*}(х2) =0г А=0, 1, ..., m—1. ... Таким образом, функция ho удовлетворяет условиям леммы и ее можно подставить в равенство (9.71) вместо/г. Поскольку = (—l)m_|(Pm-i—to), выполнив эту подстановку, на основании (9.74) получаем требуемое равенство /*=0. Теорема 9.8. Предположим, что функция f непрерывна на мно- жестве Dc2Rm+2 вместе с частными производными fy, fy„ fy too. Для того чтобы функция yeY реализовала слабый локальный ми- нимум в задаче высшего порядка, необходимо, чтобы она удовлет- воряла дифференциальному уравнению fv(xtyt y't...ty<m>)—Г/И*. У* ••• dx L 276
1/„(m-i)U, У, У'^-,У1ту) — Ax L v -^-ГА(га)(х, у, ^,.»,У1Я,))11--.1=О, (9.75) ox 1 k J J которое при дополнительном предположении tf(x), у*(х).xj, *=1, 2,...,/Tt — l, после выполнения операции дифференцирования принимает вид -дифференциального уравнения fy(xt yt у'.!/<“>)—у, уг............^ffl>)4- jj j/И + тч^(дг- У’ » У’’- OJC-* U-* 9 ,..,y№)=0, (9.76) .называемого уравнением Эйлера — Пуассона. □ Пусть функция y^Y реализует слабый локальный минимум. Зафиксируем произвольную функцию h, удовлетворяющую услови- ям (9.72), и рассмотрим семейство функций у-У Mi, зависящее от параметра X^R. Если X достаточно близко к нулю, то функции этого семейства принадлежат окрестности U»m(y) порядка т, ко- торая существует согласно начальному допущению о том, что у реализует слабый локальный минимум. Функция у реализует так- же наименьшее значение целевого функционала -на указанном мно- жестве рассматриваемого семейства функций. Значит, числовая функция <р, определяемая равенством ф(1) =/(р+ЛЛ), достигает в точке 1=0 локального минимума. По теореме Ферма, в результа- те дифференцирования *под знаком интеграла получаем f'(O)=j у'(х)...уСт>(л:))(лс) dx=0. ZL*-o (9.77) Проинтегрируем по частям слагаемое с номером А т —А раз, k = =0, 1, .... пг — 1. Учитывая граничные условия (9.72), придем к равенству •ч <р'(0)= I ш(х) A(m>(x)dx=0, (9.78) где г f, *«1—1 „ _ w(x)=(— Ir j у... у fs(xt у(х), у’(х)...^(xwdxd/!-.. 277
J-'i - - ...d4-....4- J " (xf уUK y'U)„„fГ (л)।-itd/t — *4 Xj — J /₽(Я-ц{^ ^Wi-..(/CTjU))dk+ Jr* ‘ +Ли) (X. Jokjf4 Cx)r.M7m>(x)X Равенстве f9.7B) верно ня .любой, функции Л вада (9.72); кроме того, weCifjti, rj. Поэтому, используя обобщенную лемму Дюбуа — Реймока, получаем ад (л) — Pm -tG*), xs[xt, jsJ. где много- член, степень когорта о не больше чем m— L В результате m-крат- ного .дифференцирования равенства «о (xj — pm=i (х) получим, что леи ан часть равенства (9.75) при. ^=f(x)1» *£&• Лг] равна нулю. Это овна чает, что функции £ удовлетворяет'уравнению (9.75). Если f„*(x, у (я), y'UX F'mJ (х))eCfc[Xj, xaJ, ^-0f 1, „,, /и — E„ то в (9.75) при $—уДО возможно дифференцирова- ние. Дифференцнруя, получаем, что функция удовлетворя- ет уравнению' Эйлера —.Пуассона (9.76). Теорема &.& при m —I совладает с уже- доказанной теоремой 9.1 Решения уравнения (9.76) называют экстрелныллш задачи высше- го порядка. Для отыскания экстрем а лей задачи, высшего порядка следует решить дифференциальное уравнение Эйлера-—Пуассона (9.76), которое имеет порядок 2m. Его общее решение в общем, случае за- висит от 2m произвольных постоянных; для их определения исполь- зуют краевые условия #“*ЧхЛ ®Уй> ^—0.1...,да—1; 1₽1, .2, число ко- торых также равна Чм В этом смысле система необходимых ус- ловий является полной, что., однако, не гарантирует ее разреши- мости (тем более однозначной, разрешимости). 4, Задача определения формы прогиба ба л кн. Цилиндрическая упругая балка. ЛВ длины 2J расположена горизонтально, Об.а ее конца жес-'ко' ззкреплены,- Тре- О буется установить форму про- ^7^ гиба осевой линии балки. — р Свяжем с балкой прямо- — ' . ^ угольную декартову систему координат (рис. 9J.2) и будем считать, что параметры т и ф имеют тот же смысл, что и в Рн*- задаче определения критиче- ской нагрузки балки из § 9.4. Обозначим через £г=,^(х) уравнение оси балки. Потенциальная энергия б.?.лкн складывается из потенциально® .энергии, созданной силами упругости, ^1=4’* 27В
я потенциальной энергии, созданной полем тяготения, 2! №а=Р£ ff/ds, б где р— линейная плотность балки. Перейдем от перемен- ной $ к переменной х. Для этого воспользуемся равенством <1 s~y^l +y'*(x)dx. Учитывая, что d<p/ds — это кривизна кривой У=у{х), имеем [16]: d<p/dj=jr/(l+F’’)^. Следовательно, полная потенциальная энергия —I + ЖУ (*)^ 1 + У’' (*)1 dx. Будем считать, что прогиб балки невелик, и упростим полученное выражение, полагая y'(x)«0, —/, /]: i U^n(y)=J ~P/'*(JC)-]-pgF(x)|dx. (9.79) Положению равновесия балки соответствует минимум потенциаль- ной энергии. Поэтому задача сводится к отысканию функции у^ /], реализующей наименьшее возможное значение функ- ционала (9.76) и удовлетворяющей граничным условиям 4/(-О=4/(О=У'(— /)=</'(/)=0. Эта задача второго порядка. Запишем для нее уравнение Эйлера — Пуассона (9.76). Поскольку fv=pg, fv'—O, fv — iiy", уравнение (9.76) принимает вид dx2 “Pg. Отсюда, интегрируя, получаем общее решение уравнения Эйлера — Пуассона: У=—^-^+С^+С.х’+С3х+С6, «Г1 где Ci, С2, ..., Се — произвольные постоянные. В силу симметрии 279
С3 = СБ=О. Значения остальных постоянных находятся из условий 0(-Z)=»(Z) =—^-Z’+C4Z*-|-Ce=0, j,-(-Z)=y'(Z)= - -^-Z34-2C<Z=0. 6ц А именно, C4=pg/2/(12p), Св——pg/2/(24ц). Окончательно получаем: единственную экстремаль F= —^-(-x<4-2Px’-Z<)= —^-(x*-Z=)’, 24ц 24ц которая определяет решение исходной задачи. 5. Задача Лагранжа с дифференциальными ограничениями. Рас - сматриваемую в этом пункте задачу будем называть задачей Ла- гранжа в понтрягинской форме. Эта форма записи вариационной задачи близка к формулировке задачи оптимального управления, которая изучается в последующих главах. Ее основная особенность заключается в «отделении* функции у от производной / с помощью замены у' на новую функцию и. В результате получается задача, в которой минимизация целевого функционала осуществляется не- только подбором функции у, но также выбором функции и, назы- ваемой управлением. Минимизируемый функционал типа Лагранжа л* /(у, И)= J f и» У 00, Я00)dх (9.80> JT, S определен на парах векторных функций вида у. (xh x2J-^-Rn„ и: [хь x2]->Rm, причем geC^Xj, х2), weOfXi, х2]. Другими словами, функционал (9.80) определен на декартовом произведении Cilxi, x2]XCm[xi, х2]. Отрезок [х1э х2] будем считать фиксированным, а функцию /(л+'т+1 переменных)—непрерывно дифференцируемой на неко- торой области Z)czRn+m+1. Множество допустимых функций ¥ в рассматриваемой задаче образуют пары (у, и) векторных функций, для которых уеС^Хь x2J 1£еС"^Х|, х2] и, кроме того, y' = y(x, у(х), м.(х)) при всех хе[хь х2], в(|/(х2))=0Л1. Здесь y/=(y/iI у'ъ .... угп)\ векторная функция <р: ZJ-^R" предпола- гается покомпонентно непрерывно дифференцируемой на множест- ве Д причем включение (х, g(x), u(x))s£ имеет место при всех хе[Х|, хг]. Векторные функции Ф и 0 (размерности гц и п2 соответст- венно) в граничных условиях будем считать непрерывно диффе- ренцируемыми на некоторых областях пространства R", содержа- щих соответственно точки у (xt) и g(x2). Допустимую пару функций (у, й) называют решением задачи Лагранжа в понтрягинской форме, если неравенство /(у, й)=^ 280
^.1 (у, и) имеет место для всех (у, u)eY. Говорят, что допустимая пара функций (у, й) является слабым локальным решением, если найдется такое число е>0, что неравенство 1(у, и) вы- полняется для всех (у, u)eYniUe’(у)XU.°(u)J. Здесь (у) —ок- рестность п-мерной вектор-функции у, а О.0(«) —окрестность /п-мерной вектор-функции й. Ограничения в виде дифференциальной связи у'=ф(х, у. и) (а также граничные условия) учитывают, вводя функцию (функци- онал) Лагранжа вида L(y, а; ь 1о. Ц. f Мх, И*)» -$<<*>. «(*)> Н<х). ~|- ’Г (*/; ^2)» где я у, у\ и, р, *<>)=У. + У’ “>> * Ц, Ч)=<\, Ф(1УС^1>» + <Х2< 6(у(л2))). Здесь peC"lxt, х2], XoeR, ^eR®*, X2eR"«— множители Лаг- ранжа, а нижний индекс k означает А-ю компоненту соответствую- щего вектора. Множитель ц* представляет собой функцию, задан- ную на [хь х2]; с его помощью учитывают ограничение у/—<рл(лс, у, и)=0, которое представимо в виде 6л(у, и)=0, где — опера- тор, действующий из множества Y в пространство С[Х(, х?] (см. п. 1, § 8.4). Функция Лагранжа содержит терминальный член. Следую- щая ниже теорема показывает, что решение сформулированной ус- ловной задачи Лагранжа в понтрягинской форме можно свести к решению безусловной задачи Больца с целевым функционалом L. В этом смысле ее формулировку полезно сравнить с формулиров- кой теоремы 9.4. Теорема 9.9. Для того чтобы пара функций (у, й) реализовала слабый локальный минимум в задаче Лагранжа в понтрягинской форме, необходимо! чтобы существовали такие не равные одновре- менно нулю* множители Лагранжа *2], Xq^R, MeR®', R"1, что: 1) пара функций (у, и) являлась решением уравнения Эйлера — Лагранжа по у, т. е. для всех xe[xh х2] (9.81) a-а (jt) • Т. е. либо средн То и компоненту векторов Х]( Zj есть хотя бы одно число, от- личное of нуля, либо функция р(х), не равна тождественно нулю на отрезке 1хь ха]. 281
2) пара функций (у, и) являлась решением уравнения Эйле- ра— Лагранжа по и, т, е. для всех х2] 3) Ly' Ly> и)"- «-й(х) выполнялись условия трансверсальности и=ц (х) и>= - Л- 9* (F (•««)»• а-й(х) (9.82) (9.83) (9.84) Теорему 9.9 можно получить как следствие теоремы 8.4 [2]. Запишем подробно уравнения Эйлера — Лагранжа и условия трансверсальности, которым должна удовлетворять оптимальная пара функций (у, й): Л a)— yt и), Z=l, 2t.„, n; (9.8F) ЧЛ/*. У. «)=*2и»^(л. yt и), у=1, 2......от; (9.82') /=1* 2...А15 0.83') Л-1 Н (*2) = “ 2 =1 • 2 rt2. (9.84') Предположим, что из системы функциональных (не дифферен- циальных) уравнений (9.82х) удалось однозначно выразить функ- цию й через у и р. Подставляя найденное выражение для и в (9.81') и в уравнение у'=<р(х, у, и), получим систему 2п диффе- ренциальных уравнений первого порядка относительно у и р. Эту систему следует решать совместно с уравнениями (9.83') и (9.84'), а также с уравнениями Ф(у(*1)) =0п„ 0(у(х2) =0^. Всего имеем 4п4-Л[4-П2 уравнений. Неизвестными являются функции р]( ц2, У и Уъ —> Уп и числовые множители Лагранжа, средн которых «1+«2 независимых. Следовательно, учитывая, что при интегриро- вании системы дифференциальных уравнении возникнут 2п произ- вольных постоянных, получаем 4л4-П]+л2 неизвестных. Таким об- разом, система необходимых условий полная (однако не всегда имеет, и тем более единственное, решение). В простых задачах рассмотренный способ решения приводит к единственной экстремали, и если оптимальное решение существу г ет, то найденная экстремаль и является решением. д 6. Сводимость вариационных задач одного класса к задачам другого класса. Приведенная в п. 1 классификация вариационных 282
задач в значительной степени условная. Это подтверждают следую- щие рассуждения. Рассмотрим пространственную изопер иметрическую задачу Ла- гранжа, предполагая для простоты, что имеется только одно ог- раничение: J /(х, у(х), У(х))с1х— mln, -п j y/(x))dx=/. х» Введем дополнительную функцию t/n+i и п-мерное управление и с помощью формул Ул+1<*)=|eV* УЧО. «(*))'&; ut(x)—yi(x)9 Z —1» ft, x^EjX], х2]. Тогда исходная задача эквивалентна следующей задаче Лагран- жа в понтрягинской форме: j /(х, y(x)t a(x))dx —min; JT, ji/=W((x), I = 1, 2,..., n\ Jfn+l = g(X, t/(X), »(X)) с дополнительными граничными условиями ^л-н(Х1) =0, #л+1(хг) =1. С помощью рассмотренного способа всегда можно «избавиться» от функциональных ограничений-равенств, перейдя к задаче Лаг- ранжа в понтрягинской форме. Теперь рассмотрим задачу Лагранжа высшего порядка с закреп- ленными концами: л* J / (X, у(х), у' (х),..., у™ (х)) dx min; i/(ft)(xl) = |/u; ь/<*’(х2)=!/2*, А=0, 1. Не уменьшая общности, ограничимся плоской задачей, т. е. считаем, что у — скалярная функция. Вводим функции у\у .... ут и скалярное управление и с помощью равенств й(х)=1/(х), у;(х)=у;_1(х), /=2, 3,...,т; «(х)=^(х), хе|хь х2|. 283
Тогда исходная задача высшего порядка равносильна задаче Лаг- ранжа в понтрягинской форме j / (*. yv (х), (x).ym (x), и (x)) dx -* min; Z=l, 2...m — 1, Ут—& с граничными условиями ^+1(^2)=Уи. *=0, 1. Следовательно, переходя к задаче Лагранжа в понтрягинской фор- ме, можно «избавиться» также от производных более высокого по- рядка. Выясним, как вариационную задачу с интегральным целевым функционалом можно свести к задаче с терминальным функциона- лом и дополнительным дифференциальным ограничением-равенст- вом. Для простоты рассмотрим простейшую вариационную задачу. Введем функции у\, у2 с помощью равенств «(/), хеЦхь x2J. В этом случае простейшая вариационная задача эквивалентна зада- че с терминальным функционалом т . ’5,= У2(х2) —min, дифференциальным ограничением у2 — f(x, уi, у С) и дополнитель- ным граничным условием =0- § 9.7. ПРИКЛАДНЫЕ ЗАДАЧИ 1. Задача выбора оптимального режима работы термоэлектри- ческого генератора*. Принцип работы термоэлектрического гене- ратора основан на эффекте See бека. В термопаре, составленной из двух последовательно соединенных разнородных металлических проводников, контакты между которыми имеют различную темпе- ратуру, возникает электродвижущая сила, называемая термо-э.д.с. Значение ее пропорционально разности температур горячего и хо- лодного контактов. Если температуры контактов поддерживаются постоянными с помощью специальных источника и поглотителя теп- лоты, то термо-э.д.с. имеет постоянное значение. В термопаре часть теплоты, полученной от источника, превра- щается в электрическую энергию, а остальная теплота отдается ох- * См.: Шехтер Р. С. Вариационный метод в инженерных расчетах. — М.: Мир, 1971. 284
лидмтедю. Если означить через dCJ количество теплоты, полу- ченной термопарой от источника. то количество вы-работай ной п.ри этом электрической энергии rttt* можно вычислить по формуле dr-= 8(ГГ - Гж> dQ^ <9.85> Лдееь Гг и Г*— температуры горячего и холодного конгакто i термопары соотяететавино; 0 коэффициент, характеризующий. эф- фективность преобразования тепловой энергия ь электрическую и имеющий размерность К--. Дли. практической реализации термоэлектрического .эффект а была предложена следующая конструкции (рис, 313). Генератор* представляет-собой помещенную в кожух трубу длины £, кото- рая составлена из. чередующихся колец, сделанных из двух раз- Рис. 9.13 .личных металлов. Кольца и зол кров? вы друг от друга, и имеют электрический контакт (спай) поперементо только с внутренней или внешней стороны трубы. Каждые два соседних кольца можно рассматривать как термопару. Внутри трубы проходит горячий газ, служащий источником теплоты. Между тс у Вой и внешние ко- жухом .протекает охлаждающая жидкость Сия пример, вода), погло- щающая теплоту. Тем пера гура жидкое'! и посте ян.н е,, а температура газа максимальна на входе в генератор и уменьшается при дсиже- ини газа вдоль трубы. Теплота,, отдаваемая газом, преобразуется, я электрическую энергию, и на коммах трубы возникает э.д.с. Вы- работанная электрическая энергия, как видно из формулы (9'ВБ)^ тем больше, чем больше количество теплоты dQ, отдаваемой газом внутренней поверхности б тс конечно малого цилиндрического эле- мента трубы и чем больше разность температур АГ между горячи- ми и холодными контактами. Эти величины — dQ и АГ (теплота и отдаваемая газом, и разность температур) зависят от коэфф], лги- еитов теплоотдачи а,- и определяющих скорость рас прост ране- ния теплоты от газа к стенке трубы и от нее к жидкости со* тветст- венмо, а также от удельной теплопроводности А и: а i ер и а лов., из которых состоит труба, и от толщины стенки Длф При фиксированных значениях длины £ трубы,, внутреннего диа- метра Ц массового расхода М газа, начальной температуры Гд га- за и температуры охлаждающей жидкости распределение темпе- S8S*
ратуры 'Гл- вдс1дь трубы зависит только от толщины Цх) стенки тру бы как функции координаты х.. Изменение вида функции Г (я) вы* зывает изменение количества выработанной генератором электри- ческой энергии, поэтому возникает задача выбора такой функции Цх), чтобы выработлинад генератором электрическая энергия TF была максимальной.. Это типична® вариационная задача, В самим деле; так как а выражении (9.85) величины. Гг и dQ зависят только от коорд^аты к од эта зависимость* как 5ыло уста- новлено, определяется функцией f(xj, то полная энергии У, выра- ботанная в генераторе» равна № = [F(x, ZU), ruHx. (ЭЛб) Задача максим МЭШИ и выработанной электрической энергии эк- вивалентна следующей вариационной задаче: найти непрерывную функцию .Цх), для которой функционал (9,86) принимает макси- малыное значение, Очевидно1, на краях интервала. [О, Z" значения функции Цх) могут быть произвольными, поэтому дам идя вариаци- онная задача является задачей си свободными концами, Отметим, что выражать все величины в уравнении (9.86) через функцию 1(х) неудобно', поэтому будем решать другую; эквивалент- ную данной задачу: найти такое рас пре делён,не температуры газа Г(х), чтобы величина W' была макси- мальной, При этом необходимо предета* |дй вить НИ в: следующем ладе; н L £ /'% \ ffr Ж = Г^и, 7"рс), Г'(х)М*. (Э-Ъ'/j | I | J Значение функции Г(х) на левом кон- у'К/ / интервала [G, £.) фиксировано, по* стольку начальная температура газа х Л"'1¥ поддерживается постоянной: Рис. ш ru> II z-o=r9. (9.88) Таким образом, вариационная задача с функционалом (9,87) является комбннносванной: левый конец фа* зоной траектории закреплен, а правый — свободен, Чтобы определить вад функции Ft в выражении (9.87)1, выве- дем уравнение. теплохого бглаися для бесконечно малого цилин- дрического .элемента трубы (рис. 9/14), Предполагая, что диаметр трубы' велик по сравнению с толщиной стенки, используем для они-' сання процесса распространения “еплоты внутри трубы закон Фурье.. Согласно этому закону, количество теплоты, которое перв- лоснтся от внутренней поверхности dS элемента трубы длины dx к еТО внешней поверхности, определяется выражением <КЭ=Л ^~Z1CS. (9.89)
где dS = jtDdx —площадь внутренней поверхности цилиндрическо- го элемента трубы. Формула (9.89) справедлива в том случае, когда теплота не поглощается стенкой. В рассматриваемом же случае именно за счет поглощенной теплоты и вырабатывается электрическая энер- гия. Однако эффективность 9 такого преобразования очень мала, поэтому в первом приближении можно считать, что количество теп- лоты, отданной газом, равно количеству теплоты, полученному ох- лаждающей жидкостью. Тогда значения теплоты в формулах (9.85) и (9.89) равны. Выразив разность Тг—Тт из (9.89) и подставляя в (9.85), полу- чаем dU7 = -!^-(dQ)2. (9.90> Ado Теплота dQ, уходящая из газа при прохождении рассматрива- емого цилиндрического элемента трубы, определяется выраже- нием dQ =-7Wc_-^dx, р dx (9.91) где ср — удельная теплоемкость газа при постоянном давлении, Т=Т(х) — температура газа в точке х. Уравнение, описывающее теплопередачу во всей системе газ — стенка трубы — жидкость, имеет вид ё(?=А(Г-Гж)б5, (9.92) где Тж — температура охлаждающей жидкости, k — коэффициент теплопередачи всей системы, зависящий от коэффициентов теплоот- дачи аг и а», а также от удельной теплопроводности стенок. Ко- эффициент k можно вычислить по формуле *=—------J. (9.93) —’ —Г" — аг Л аж Подставляя (9.93) в (9.92), а (9.92) в (9.90), получаем выражение для (9.94> Выразим в этой формуле 1(х) через Т(х). Сравнив уравнения (9.91) и (9.92) и учтя (9.93), запишем: 1 I 1 -----+----------- аг А аж лО(Ьс= — Мсо -^-djc. р de
Решим это уравнение относительно I: Цх)= — АяО(7^~Гж?--а/-!-4-—) . (9.95) dT К «ж) dr Подставляя (9.95) в формулу (9.94) и интегрируя получившееся выражение по х от 0 до L, найдем UZ = С 6 [ - Мср (Г-TJ-----+—1 (Мср— У1 dx. J L р dx * л© ( аг «ж Д pdx/ J (9.96) Это выражение соответствует (9.87). Чтобы найти1 функцию Т(х), которая максимизирует IF, выпишем уравнение Эйлера, ко- торое для данного случая имеет вид (9.97) dx2 На левом конце отрёзка [0, 2] значение Т фиксировано условием (9.88), на правом получаем естественное граничное условие [с,(Г-Гж)4-2С,4^1 =0. (9.98) L dxj x—l где С,= -«Ж,. С,=—М—+— р л£) \аг аж/ р Общее решение уравнения (9.97), очевидно, имеет вид Т (x)=a14-a2x. (9.99) Постоянные О| и ог определяются из граничных условий (9.88) и (9.98). Из (9.88) следует =7'0. (9.100) Подставив (9.99) в условие (9.98), получаем уравнение для as Ci (7* о ж)4~=0 из которого находим ,, д — С1<Г<>— Гж) ^0 — Т’ж _ 2 C\L + 2Cs Сд Q ------- (9ЛО1> 2Afcp / j 1 \ —гГ-1-----4" I яи \ ar ам / Определим теперь количество выработанной электрической энергии, которое соответствует оптимальному режиму, задаваемо- 268
му распределением (9.99). Подставляя (9.99) в (9.96) и интегри- руя, получаем L UZOTT= J6 [ — Mc^TqН-ЛзЛ — Гж) — -L-(J-<Ьс = Используя выражение (9.101), окончательно находим ^опт=-А 1 (Го — Гж)* СМср 2 2Мср / 1 1 \ i _ ( *4- I л£) \аг а* / <Г0-ГжР£Мср eMcp(To-rw)a (9.102) Видно, что количество выработанной в оптимальном режиме электрической энергии увеличивается с увеличением значения ко- эффициентов теплоотдачи аг и аж и разности температур То—Тж и с увеличением эффективности преобразования энергии. Подставив Т(х) в формулу (9.95), получим искомую зависи- мость толщины стенки трубы от координаты: (9.103) Таким образом, /(х) — убывающая линейная функция, т. е. на входе стенки трубы должна иметь наибольшую толщину, а на вы- ходе— наименьшую толщину (в рамках допущения Чтобы проверить, действительно ли при этом имеет место мак- симум, а не минимум функционала (9.86), используем необходимое условие Лагранжа. В рассматриваемом случае 2 ии nD ОИСрЖО. Распределение толщины стенки трубы (9.103) действительно дает максимальное количество выработанной электрической энер- гии, которое определяется выражением (9.102). В рассмотренной вариационной задаче необходимые условия эк- стремума позволили найти решение, поскольку из простых физи- 10—339 289
ческих соображений следует существование единственного экстре- мума. Однако такая ситуация встречается далеко не во всех тех- нических задачах. Возьмем, например, вариационную задачу с тем же функционалом №, определяемым равенством (9.96), но пред- положим, что коэффициенты теплоотдачи аг и аж велики по срав- нению с коэффициентом Mc^juD. Тогда вторым слагаемым в инте- грале (9.96) можно пренебречь: L W----Шс„ (4^- <-т-Т^йх. J dx о (9.104) Уравнение Эйлера для такого функционала обращается в тож- дество dr dr dx [dx В данном случае это означает, что функционал не имеет экстре- мума. Этот факт можно установить непосредственно из рассмот- рения выражения (9.104). Производя интегрирование по частям, получаем №= — Шсо Т{Т-ТЖ)\ г Tdx =емсо(ттж—-г2 х\ - 2 Для всех функций Г(х), имеющих одинаковые граничные усло- вия, функционал W(T) имеет одно и то же значение. 2. Задача выбора оптимального профиля ребер радиатора, пред- назначенного для охлаждения нагретой стенки *. Рассматриваемый радиатор применяется для увеличения потока теплоты от нагретой стенки в окружающую среду (воздух). При конструировании та- кого радиатора возникают задачи об оптимальном выборе числа ребер, материала, из которого они изготовлены, и др. Рассмотрим простейшую задачу оптимизации профиля ребра радиатора, счи- тая заданным материал ребра и его массу. На рис. 9.15 изображено сечение ребра радиатора. Будем счи- тать, что перенос теплоты в направлении, перпендикулярном плос- кости сечения, отсутствует. Выберем такую шкалу температур, в которой температура стенки равна единице, а температура возду- ха — нулю. Выведем уравнение теплового баланса. Для этого рассмотрим бесконечно малый элемент ребра (рис. 9.16). Количество теплоты, * См.: Шехтер Р. С. Вариационный метод в инженерных расчетах. — И.: Мир, 1971. 290
распространяющейся и направлении. оси Ох (вследствие тег.л о п ро- нодности внутри ребреЬ описывается формулой q_-a2du)-£-. РХ где Л — коэффициент теплопроводности материала,, из которого сделано ребро, D(х) — функция, иписызающая профиль ребра, Т(х)—распределение температуры ь ребре- Изменение ксличсст- ва теплоты d.Q на промежутке dx может быть выражено следую- щим с б разом: dq=J2- <JX= -2Д 'jit. <9.105) dx dx V dx J Согласно закону сохранения энергии, иодное изменение коли- чества теплоты и а промежутке dx должно быть равно нулю, т. е. dQ + 2dQ' = 0. (9.106) где d<2*—количество теплоты, отдаваемое поверхностью d/ ребра; это количество теплоты выразим соотношением dQ'= с<1ЛГ (*)=оу' нТ^ТйжГСЛ, (9.107) где а — коэффициент теплоотдачи от ребра к воздуху.. Подстав- ляя (9.105) и (9.107) в (9ДС6), получим уравнение теплового' бя- лаиса == [ ^ W ~1=-Г У1+ЖТ Т (х). dx L dx JI A " ( dx / Предположим, что величина | -а— / мала по еря злению с едн- 1 Ах / НицеД, т. е.. поверхность ребра является достаточно покатой. Тогда •£f9wirl=Jrr<XJ- <9ЛО83 3.x ц_ ox j л Ю* 291
К этому уравнению необходимо добавить два граничных условия: 1) температура нагретой стенки фиксирована: Г(л)| f,o=7’(0)=l; (9.109) 2) поперечные размеры ребра конечны: О(х) | je_I=0. (9.110) Здесь величина I является искомой. Полное количество тепло- ты, отдаваемое поверхностью ребра, равно г I Q(T)=-2[—<lx=2(ar(xi<ix. (9.111) J dx J о о Таким образом, количество отдаваемой теплоты Q можно рас- сматривать как интегральный функционал, заданный на множест- ве функций T(x)t удовлетворяющих уравнению (9.108) к условию (9.109). Условие постоянства массы ребра радиатора запишем в виде I Af = 2р [ £)(x)dx=const, (9.112) где р — плотность материала, из которого сделано ребро. Необходимо найти максимум функционала (9.111) при условии (9.112). Применяя метод множителей Лагранжа, можно свести эту задачу к задаче отыскания максимума функционала г /(Г, D)=J[2ar(x)+2XpD(jc)]dx. (9.113) Однако в данном случае введение множителя Лагранжа Л не све- ло условную вариационную задачу к безусловной, поскольку кро- ме условия (9.112) имеется еще ограничение в виде дифференци- ального уравнения (9.108). Задача (9.113) с ограничением (9.108) по-прежнему является вариационной задачей на условный экстре- мум. Поскольку уравнение (9.108) определяет явную связь между функциями Т(х) и О(х), выразим в функционале (9.113) D(x) че- рез Г(х) с помощью (9.108) и получим безусловную вариацион- ную задачу с функционалом, заданным на функциях Т (х). Интегрируя уравнение теплового баланса (9.108), найдем I -D(x)— = — fru'XU*. (9.114 dx Л J Здесь предполагается, что количество теплоты в точке х=1 (край ребра) равно нулю, т. е. использовано граничное условие (9.110). 292
Выразим из (9.114) функцию D(x) и подставим ее в (9.113). В ре- зультате получим функционал /.(Т')=2 [ГаГ ——) 1 Crdjc* J A I dx / J О L X dx. (9.115) Отметим, что в выражениях (9.113) и (9.115) величина I не яв- ляется, вообще говоря, фиксированной она может изменяться при изменении функции D(x), определяющей профиль ребра. Но так как функция D(x) исключена из (9.115), можно считать I фиксирован- ным и искать оптимальное распределение Т(х) при данном I. После решения такой задачи можно будет, кроме того, выбрать оптималь- ное ! (из всех I, удовлетворяющих условию постоянства массы реб- ра). Итак, будем решать безусловную вариационную задачу с функ- ционалом (9.115). Единственным ограничением на функции Г(х) является граничное условие (9.109): 7(0) ==1 (граничное условие (9.110) было использовано при выводе соотношения (9.114)). От- личие этой задачи от простейшей вариационной задачи (см. п. 1 §9.1) состоит в том, что функционал (9.115) содержит первообраз- ную от функции Т(х): /((/)=]’ Fix, У, У, j</(x')dx' dx. (9.116) Хв \ X / Однако для функционала такого вида процедура вывода урав- нения Эйлера совершенно аналогична той, что была применена для функционала, включающего производные функции у{х). Уравне- ние Эйлера имеет вид я (9.117) где г=j £/(xz)dx', X т. е. Fz(x, у, у, г} обозначает частную произ- водную функции F по четвертой переменной К уравнению (9.117) необходимо добавить естественное гранич- ное условие на правом конце Fy I х-х,=0* Для вариационной задачи с функционалом (9.115) (9.117) будет иметь вид Л d2Z 2 а*г ' dT V (9.118) уравнение Ара dx' dr =0 (9.119) dx 293
(в рассматриваемом случае Хо=О, *i = J). Естественное граничное условие (9.118) примет вид Оно выполнено для любой функции 7(х), поэтому нет необходи- мости учитывать его в дальнейшем. Общее решение уравнения (9.119) найти трудно, но можно ука- зать простое частное решение: Г(х) = 1- (9.120) Поскольку в данном случае линейное распределение темпера- туры по длине ребра наиболее естественно с физической точки зре- ния, это распределение является оптимальным. Соответствующую оптимальную форму ребра можно найти с помощью соотношения (9.114): £>(л) = Т (х') d xf (9.121) где использовано обозначение а= —у/Тр/Л. Неопределенный множитель X находится из условия (9.112) по- стоянства массы ребра: Л<=2? f DM4x------+ J \ ЗА хАа Отсюда находим величину а: Л / Л1А и ’ р \ paZ2 ’ 3 ) Из (9.122) легко получить значение множителя Лагранжа: д / AfA . 2Z \-s р \ раЛ ‘ 3 J (9.122) (9.123) Для завершения решения задачи осталось определить оптималь- ное значение параметра Z. Из всех физически осмысленных 7 (та- ких, что D(x)>0 при 0<х<7) надо найти то значение, которое соответствует максимуму рассеиваемой энергии. Энергия, рассеи- ваемая в среду, определяется формулой (9.111): i Q=2a j Т (д) dx. о 294
Используя выражения (9.120) и (9.123), получаем после интегри- рования Q=2tJl----L - \ 2 ЗМА 4- 2раР Максимум Q получится при значении I, удовлетворяющем уравне- нию 30_=2а Г j _ 6раР . 9раЦ« д1 [ ЗМЛ+2ра/з '(З/ИЛ+2раР)2 откуда / = ^3/ИЛДра). (9.124) 3. Оптимизация режима работы электродвигателя постоянного тока. Рассмотрим работу электродвигателя, обеспечивающего по- ворот платформы экскаватора на заданный' угол. Режим переме- щения должен быть выбран таким образом, чтобы в начальный и конечный моменты времени угловая скорость вращения платфор- мы была равна нулю; кроме того, необходимо наложить ограниче- ние на значение тока в двигателе, которое исключало бы возмож- ность перегрева двигателя. При этих ограничениях требуется най- ти зависимости силы тока и угловой скорости вращения двигателя от времени, обеспечивающие оптимальный режим движения плат- формы экскаватора в смысле минимальных потерь энергии в элек- тродвигателе. Уравнение моментов для двигателя постоянного тока имеет вид С<,1Ф„=7-^+М„ . (9.125) dr где I — сила тока якоря электродвигателя, Фдв — результирующий магнитный лоток, пронизывающий контур якоря; Сф— коэффици- ент пропорциональности; 1 — суммарный момент инерции элек- тродвигателя и исполнительного механизма по отношению к валу электродвигателя; со — угловая частота вращения якоря; Мс — момент сил сопротивления (будем считать Мс=const). Для упрощения уравнения (9.125) перейдем к относительным единицам, приняв за единицы силы тока якоря, магнитного пото- ка, скорости и моменты соответствующие номинальные значения этих физических величин: где в качестве единицы времени введена постоянная времени, чис- ленно равная времени разгона двигателя до номинальной частоты вращения ы1Г под действием номинального вращающего момента Л1П.' 295
Положим, кроме того, для простоты Сф=1, запишем уравнение (9.125) в виде /Ф = —4-р. (9.126) dr Для электродвигателей независимого возбуждения можно считать с .хорошей степенью точности Ф = 1, тогда (9.126) примет вид Z=-^--|-p,, const. (9.127) За единицу угла поворота возьмем угол, на который поворачи- вается вал электродвигателя за время ЛМТц при частоте враще- ния, равной «н- В этих относительных единицах угол поворота плат- формы г а = |ч(т)йг. (9.128) D Значение этого интеграла является фиксированным по условию задачи. Введем функционал, задающий величину потерь энергии в яко- ре электродвигателя. За единицу этой величины примем потери энергии за время (=ТЫ при силе тока / = /н- Тогда в относительных единицах полная энергия Q, которая теряется в якоре, будет выра- жаться интегралом г Q=p2(t)dr. (9.129) б Таким образом, строгая формулировка вариационной задачи оп- тимизации режима работы электропривода имеет следующий вид: требуется определить функции т(т) и г(т), удовлетворяющие урав- нению (9.127) и обеспечивающие минимум интегралу (9.129) при фиксированном значении интеграла (9.128) и заданных граничных условиях v(0) =v(T) =0 (выражающих тот факт, что скорость плат- формы в начальный и конечный моменты времени должна быть равна нулю). Возможна и другая постановка вариационной задачи. Найти функции г(т), v(t), удовлетворяющие тем же граничным условиям и уравнению (9.127) и обеспечивающие максимум интегралу (9.128) прм заданном значении интеграла (9.129). Решение такой задачи оп- ределяет режим, соответствующий максимальному углу перемеще- ния платформы при заданной величине потерь в якоре. Подставим выражение (9.127) для i в интеграл (9.129). Первая задача на условный экстремум сведется к простой изопер иметри- ческой задаче: найти функцию v(r), обеспечивающую минимум ин- тегралу 296
при заданном значении интеграла J vdt=a и заданных гранич- ных условиях v(0) =v(T)=0. С помощью метода множителей Лаг- ранжа (см. § 9.5) эта задача сводится к безусловной вариацион- ной задаче с функционалом М[(£+‘‘М<,г- о Уравнение Эйлера для такой задачи имеет следующий вид: 2——Х=0. (9.130) d/2 Общее решение уравнения (9.130) записывается так: v=c1+c2t+3.T2. Произвольные постоянные Cj, С2, X определяются из условий г v(0)=0, v(T)=0, Jndt=a. Из первого условия следует Ci = 0. Ос- тальные два условия образуют систему уравнений относительно С2 и X: q=c2t +— л, 2 1 4 С2П , 1Г» ci — — т • 2 1 12 Находим q __ 6a ____ 24a 2 7-2 * 73 Т? 12a 73 В результате получаем решение рассматриваемой вариационной задачи: ',(Т)=7Г '«=•*+< Величину потерь энергии в найденном оптимальном режиме мож- но найти, подставив i в (9.129): Q=J|L+!J-2r- Для проверки того факта, что мы получили именно минимум функционала, используем условие Лежандра Лш = 2>0. 297
Более подробно с задачами оптимизации электрических приво- дов можно познакомиться в кн.: Чистов В. П., Бондаренко В. И., Святоелавский В. Л. Оптимальное управление электрическими при- водами.— М.: Энергия, 1968. Глава 10 ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ Истоки теории оптимального управления лежат в вариацион- ном исчислении. Поэтому между задачами оптимального управле- ния и вариационного исчисления имеется тесная связь, но есть и существенные различия. Задача оптимального управления заключается в оптимизации функционала при дифференциальных ограничениях специального вида. Одним из важнейших методов исследования и решения этой задачи основан на необходимом условии оптимальности в форме принципа максимума Л. С. Понтрягина. Формулировка, вывод и обсуждение принципа максимума и составляют основное содержа- ние этой главы. Рассмотрены различные классы задач оптималь- ного управления автономными и неавтономными системами, задачи с закрепленными и подвижными концами, с фиксированным и не- фиксированным временем управления. Отмечена связь задачи оп- тимального управления с соответствующей задачей для дискретной системы. Подробно изучена задача оптимального быстродействия. § 10.1. НАЧАЛЬНЫЕ ПОНЯТИЯ ТЕОРИИ УПРАВЛЯЕМЫХ СИСТЕМ 1. Задача о мягкой посадке ракеты на Луну. Пусть в началь- ный момент времени £—0 ракета, которую мы отождествим с мате- риальной точкой массы ш, находится на высоте Н над поверх- ностью Луны и имеет скорость V, направленную вертикально вниз. Задача заключается в выборе* такого режима работы двигателя, чтобы в некоторый (не заданный заранее) момент времени t = T ракета достигла поверхности Луны и при этом ее скорость была равна нулю (мягкая посадка). В системе координат, связанной с поверхностью Луны (ось Ох направлена вертикально вверх), урав- нение движения ракеты имеет следующий вид: 4-^(0. (ЮЛ) где х—х(/)—высота ракеты над поверхностью Луны; — уско- рение свободного падения на Луне, У7(0—переменная сила дви- гателя. Очевидно, значение силы F(t) не может быть сколь угод- но большим; оно ограничено техническими возможностями двига- теля, т. е. „.^const, Ze 10. Г|. (Ю.2) 298
При этих условиях возможны несколько различных режимов работы двигателя, обеспечивающих мягкую посадку. Нужно выб- рать тот, который с определенной точки зрения является наиболее выгодным. Примем в качестве критерия такой выгодности минимум расходуемого при посадке топлива. Обозначим расход топлива в единицу времени через ?(0. Учитывая, что сила F(t) пропорци- ональна расходу топлива в единицу времени, можно записать: q (О = aF (0, где а — коэффициент пропорциональности. Общий рас- ход топлива за время Т выражается интегралом му критерий выгодности (оптимальности) режима работы двигате- ля можно задать с помощью, следующего функционала: т /(F)t=a j F(t)di. (10.3) Теперь сформулируем задачу о мягкой посадке: найти кусоч- но-непрерывную функцию F(t), подчиненную неравенствам (10.2), при которой решение х(0 уравнения (10.1) удовлетворяет при /=О заданным начальным условиям ^(/)df, поэто- х(0)=Я, =1/, М i-Q а при некотором i=T — условиям х«)|(_г=0, 4г1 =°- d/ р.7* причем такое, что функционал (10.3) принимает минимальное воз- можное значение на множестве таких функций F (считаем, что класс кусочно-непрерывных функций является наиболее широким клас- сом технически реализуемых функций F(t}). Сформулированная задача является простейшей задачей опти- мального управления. Управлением служит функция F. 2. Основные понятия. Предположим, что поведение некоторого объекта может описать системой обыкновенных дифференциальных уравнений первого порядка -77-=/ДУ1.->Уя. «!.•••*"«). 0</<Г, г = (10.4) at Пусть момент времени /&=0 является начальным, а момент t\ = T — конечным. Правая часть системы (10.4) не зависит явно от f, поэтому, считая f0=0 начальным моментом, мы не ограничи- ваем общности дальнейших рассуждений. Функции fi, и'= 1, 2, л, от n-f-m переменных, входящих в урав- нения (10.4), предполагаются непрерывными на Ня+/Л и непрерывно дифференцируемыми по первым л переменным. Функции i/i, y2t .... уп в (10.4) называют фазовыми координата- ми объекта. Они в совокупности образуют вектор-функцию у(1) = 299
= (Уi (О, !/л(0)т. которая при каждом /е[0, 7] задает в простран- стве R" (фазовом пространстве) точку, соответствующую состоянию объекта в момент t. Функции «2......заданные на отрезке [О, Г], называют уп- равляющими переменными. В совокупности они образуют вектор- функцию = .... um(f))TeRm при /е[0, Т]. В дальнейшем вектор-функцию и будем называть просто управлением. Предпо- ложим, что вектор-функция и может принимать произвольные зна- чения из некоторого множества U, которое назовем об- ластью управления, т. е. u(t)^,U для всех /е[0,7]. Функции uit 7=1, nt, в дальнейшем будем считать кусочно-непрерывными. Произвольное управление и с кусочно-непрерывными компонен- тами, удовлетворяющее условию ц(/)е// при всех Ц будем называть допустимым управлением. Рассмотрим произвольное допустимое управление и и зафикси- руем начальное условие #(0)=j/0), или в координатной форме i=l,2....п. (10.5) После того как выбрано и = и(1), подставляя вектор-функцию u(t) в правую часть системы (10.4), получаем задачу Коши для системы дифференциальных уравнений -^Г=/1<Ух....M0,-,«m(0), /=“1,2...........л, (10.6) at с начальным условием (10.5). Функции щ, ит кусочно-непрерыв- ные, поэтому функции, входящие в правую часть равенства (10.6), вообще говоря, не являются непрерывными, а значит, нельзя вос- пользоваться теоремой о существовании и единственности реше- ния задачи Коши, известной из курса дифференциальных уравне- ний. Укажем, каким образом понимать решение системы (10.4) при выбранном управлении и. Кусочно-непрерывно дифференци- руемая * на отрезке [0, 7] векгор-функция у является решением системы (10.6) с начальным условием у^ если при подстановке ее в равенства (10.6) они превращаются в тождества для всех точек te[0, 7], в которых все функции ..., ит непрерывны и, кроме того, верно начальное условие (10.5). В дальнейшем будем считать, что каждое допустимое управление и однозначно определяет решение у системы (10.4) с начальным условием (10.5) **. Это решение на- зывают фазовой траекторией, соответствующей управлению и; при этом управление и определяет поведение системы во времени от /=0 до t=T. Значение управления в точках разрыва и, в опреде- лении решения системы уравнений не играет роли, поэтому будем далее предполагать, что все функции и, непрерывны слева в точках разрыва. * См. с. 237. ** Согласно теореме о существовании и единствен кости решения задачи Коши, при сделанных выше предположениях существует, и притом единственное, ре- шение только в малой окрестности каждой точки ^[0, Г], в которой все функции U|. ..., Цщ непрерывны (но не на всем отрезке [0, /)- 300
Будем считать, что управление u(t), заданное на отрезке [О, Т], переводит систему из состояния г/(°>= (У1°\ j40>,..., 4/л0>)т в состоя- ние —(t/Д 02°»..-, tfnIJ)T. если соответствующее этому управле- нию решение у удовлетворяет начальным условиям (10.5), и в мо- мент t=T имеет значение у(Т) = (у\1\.... т. е. удовлетворяет условиям 3. Постановка задачи оптимального управления с закрепленны- ми концами. .Сформулируем две вспомогательные задачи, которые' условимся называть задачами управления (в отличие от задач оп- тимального управления). /. Задача с фиксированной продолжительностью управления. В -фазовом пространстве заданы две точки 4 = (</i0>, Й и Й11»—. У{п Т* Среди всех допустимых управлений найти та- кое управление, которое переводит систему (10.4), находящуюся в начальный момент /™0 в состоянии А, к заданному моменту t = T В состояние В. II. Задача с нефиксированной продолжительностью управления. ’Среди всех допустимых управлений, заданных на [0, т] при т>0, найти такое управление, которое переводит систему (10.4), нахо- дящуюся в начальный момент / = 0 в состоянии А, в состояние В к некоторому заранее не заданному моменту времени Г, О^Г^т. Лрн этом момент времени Т также подлежит определению. Возникает важный вопрос о том, существует ли управление и, переводящие систему из состояния А в состояние В. Если установлено, что такого управления не существует, то решать за- дачу управления бессмысленно. В общем случае установить су- ществование решения задачи управления трудно. Однако если ог- раничиться рассмотрением линейных систем, то можно дать ответ на поставленный вопрос. Введем необходимые определения. Сис- тему дифференциальных уравнений вида ^-=Ау+Ви, (10.7) тде d«//d/= (dyi/M.dj/n/dO’j А и В — числовые матрицы разме- ра пХ« и пХ/п соответственно, называют линейной системой уп- равления. Эта система полностью управляема, если для любой па- ры точек ^(*)eRn существует кусочно-непрерывная вектор-функ- ция u(t) — (ui(t)\ .... um(t))TeRm, переводящая систему (10.7) из состояния у<® в состояние у№ за некоторое время Т. Имеет место следующее утверждение (см.: Ли 3. Б., Маркус Л. Основы теории оптимального управления. — М.: Наука, 1972). Система вида (10.7) полностью управляема тогда и только тог- да, когда ранг (п'^пт)-матрицы, составленной из матриц В, АВ. .А2 В, ...,Ап~} В, равен п. .301
Если ранг указанной матрицы меньше п, то существуют лары точек и £/**>, для которых невозможно подобрать управление и, переводящее систему из одной точки в другую за конечный проме- жуток времени. Говоря о системе (10.4) как об управляемой системе, обычно считают, что допустимая кусочно-непрерывная управляющая век- тор-функция, переводящая систему из заданного начального состоя- ния в конечное, существует. Для большинства прикладных задач управления, соответствую- щих реальным объектам, существует не единственный набор функ- ций ui, .... ит, являющихся решением задачи 1 или задачи II. По- этому возникает возможность выбора из всех решений задачи управ- ления такого решения, которое является в каком-то смысле наибо- ле выгодным (оптимальным). В этом случае приходим к задаче оптимального управления. В ней требуется, чтобы искомое управление не только решало задачу I или II, но, кроме того, ми- нимизировало (максимизировало) некоторый интегральный функ- ционал, который называется критерием оптимальности (критерием качества) и определяется равенством г • /<»)=(/е(й«>....У„(‘), МО....(10.8) где fo(Vi, .... Уп, «I. —> Um)'—фиксированная непрерывная на Rn+'r* функция, непрерывно дифференцируемая по первым п переменным. Верхний предел интегрирования в зависимости от типа задачи мо- жет быть заранее фиксированным (задача I) или нефиксированным (задача II). Во втором случае целевой функционал зависит не только от и, но и от Г, и поэтому было бы естественно писать /(«, Т). Однако для краткости Т будем опускать, специально ого- варивая, что имеется в виду задача с нефиксированным временем управления. Таким образом, задача оптимального управления заключается в минимизации функционала (10.8) на подмножестве множества допустимых управлений, переводящих систему (10.4) из заданной точки А в заданную точку В. Управление u*=(u*f(O. «*т (*))’» являющееся решением этой задачи, называют оптимальным управ- лением, а соответствующую ему согласно (10.4) траекторию у* = = (y*t (/), ..., у*п (f) )т — оптимальной траекторией. Отметим важный частный случай поставленной задачи опти- мального управления. В задаче оптимального быстродействия функ- ция fo тождественно равна единице. В этом случае функционал (10.8) имеет вид Ци) = Т и оптимизация состоит в нахождении до- пустимого управления и, минимизирующего время перехода систе- мы из состояния Л в состояние В (это случай задачи II). Как правило, на искомое оптимальное управление накладыва- ют ограничения, связанные с его технической реализацией, напри- мер < = при/еГО.Г]. 302
В общем случае значения вектор-функции u(Z) = (uj(O. .... «п»(/))т должны принадлежать замкнутой (незамкнутой) области управления i/trR"*. Замкнутость области управления является причиной того, что задачи оптимального управления часто назы- вают неклассическими вариационными задачами. Отличие сформу- лированных задач оптимального управления от задачи Лагранжа в понтрягинской форме (см. п. 5 § 9.6) главным образом состоит в дополнительном ограничении вида при всех /е[0, Т]. Ес- ли множество U замкнутое (что имеет место в большинстве прик- ладных задач управления), то методы вариационного исчисления «не работают» (в частности, неприменима теорема 9.9). Для задач оптимального управления приходится разрабатывать новые мето- ды решения. Один из таких методов основан на применении прин- ципа максимума Понтрягина, который можно рассматривать как обобщение метода множителей Лагранжа в классическом вариа- ционном исчислении. Используют и другие методы, например ме- тод динамического программирования. 4. Простейшие свойства допустимых управлений и соответству- щих траекторий. Пусть допустимое управление u(/>) = (U|(0» ...» um(/))T переводит систему (10.4) из начального состояния, соот- ветствующего фазовой точке А в момент времени /=0, в конечное состояние, соответствующее фазовой точке В в момент времени и функционал (10.8) принимает на этом управлении значе- ние /о. Функция f из (10.4) и функция fo из (10.8) явно не зависят от /, поэтому имеет место следующее утверждение. При любом управление вида (иД/Д-й) , .... ит (/Д-й) )т, —h^.t^T—й, является допустимым, переводит систему из состоя- ния.+соотаетсгвующгго фазовой точке А в момент i=—h, в состояние, соответствующее фазовой точке В в момент t = T—h, и функционал (10.8) принимает на нем значение /о- Таким образом в рассматри- ваемой задаче возможно «смещение» начального момента времени в любую точку временной оси. Справедливо следующее свойство. Пусть имеется набор точек Аи Да. .... Да фазового пространства и для каждого i=l. 2, ...,й—1 существует допустимое управление uW(t), которое переводит систе- му (.10.4) из состояния, соответствующего точке At, в состояние, со- ответствующее точке Д,+ь за время At,, A/j=T, и функционал i ”1 (10.8) принимает на нем значение Ц. Тогда существует допусти- мое управление u(t}, 0^/^Т, переводящее систему (10.4) из сос- тояния, соответствующего точке Аь в состояние, соответствующее точке Ал, причем на этом управлении целевой функционал прини- мает значение, равное /|Д-/2Д-...Д-У*. В самом деле, поскольку уп- равление -можно «сдвигать» по оси времени, будем считать, что от- резки, на которых заданы управления ио>(/), «(2>(0» u(ft'l)(0. «примыкают» друг к другу, т. е. функции заданы на отрезках 1Л*. Zf+il. где 0 = 6<6<.-<^ = Т. Обозначим через u(i) управление, заданное на отрезке [0, Т] и совпадающее на каждом частичном 303
Промежутке с управлением (рис. ЮЛ). Тогда уп- равление и (f) является допустимым .и переводи г систему из точки Л> j точку Дй. Кроме того, значение целевого фунвнйонаяа на этом Рис. PO..J управлении ъ силу аадитпнности интеграла (10.8) равно Д+ /?+..* //дшяцьп олг^люьмосга Бедл- лшна является обобщением соот- ветствующего свойства для диск- ретных систем управления. (см_ гл. 4). Это свойство состоит и ом, ЧТО' всякий «кусок» опти- мальною управлений, рассматри- ваемого на частичном отрезке, также является оптимальным! уп- равлением на 3ix>m частичном от* резке, Лугть оптожц^ачое довдмгиие оцре^елтное да огреэ- ле !“€. Ц пфеао^нт сао ему ьз наияледоао состоядая л а конечное состо^йж Й и ^ (.?)=-coorseTOra'4/ющ.-ая еж$ оптмжйльдая тддехто- дня ЛдоБереж д/та^^плй'МбкС гочда да осп f\ i"^ ^(0, jt’j F<F. Ун^далемж ы(Й. Дй^^лаг^авасжое мд отрез- ке [»', <"], додается слтилсдьмвш дод двдеммод ляребошвднм. едсте- жу ьд слскмодя с состнлнье ^{£П» с еоглетста^ющаД кку- сол» датмдал&дай грдешоддо дадаггсд олтмшльым! граехго^сеи йлд этого переходи. Для доказательства еправедд мости этого ут- верждения предположим протинмое. Пусть управление п(/)„ рас* гм а.р ид немое на. отрезке [?. "Ч не является оптамальиы^' Тогда существует управление «'(?), переводящее: систему нт положения в положение. го траектории. отличной от соответствующей части траектории #(/), kotoiich соёднняет то", к и Л и В (рис. 10,2) н доставляет целевому функционалу значеШе меньшее, чем значение 4 этого же функционала на управлении 4(f) в пре* делах от ff до fff. В протнв'ном случае' «новое* управление, тереводящее ено тему из Абй, можно составить из трех «кусков*: исходного упрамеиж,, серееодящёго систему из состоя- ния Л в TO4L y(F), управденкя a'(f), осуществляющего переход из у (Г) з £г( и управления рассматриваемого на. отрезке 7] и переводащего систему из в/ (F) в точку В, На этом «новом* управлении фумкцмонал (.10.8) принимает значение Л + //+/,1 меньшее чем Jr+^a+^t противоречит условию' оптимальное гм доходного управления м(/),
$ 10.2. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА ДЛЯ ЗАДАЧ С ЗАКРЕПЛЕННЫМИ КОНЦАМИ 1. Принцип максимума для задачи с нефиксированным време- нем управления. Рассмотрим задачу оптимального управления сис- темой (в векторной форме) £=/«•»). (10.9> где dy/d/»(dPi/<l/v». <Wdf)T> /=(/1.—»/я)т. с нефиксированным временем управления Т, начальным состоянием у&\ конечным состоянием критерием качества т /00= ( /о(У (/)), «(/))<V—min (10.10) S и областью управления I/cRm. При этом для функций у, и, f бу- дем считать выполненными все предположения предыдущего пара- графа. Введем функцию Я(#, ф, и) типа R2n+1Xt/-*-R, называемую функцией Понтрягина, которая играете теории оптимального управ- ления роль, аналогичную роли функции (функционала) Лагранжа в вариационном исчислении: Н (У, Ф, «) = 2 и) ’ 00.1 /-о где ф= (ф0( .. фп)т. Обозначим ф= (фь фа,.... фл)т. Справедлива [20] следующая теорема. Теорема 10.1. Пусть вектор-функция u*(t) является оптималь- ным управлением, а вектор-функция y*(f)— соответствующей опти- мальной траекторией в сформулированной задаче оптимального управления. Тогда существуют непрерывная вектор-функция Ф*(0 = (Ф>*(<)..фп*(0)т и число фо*^0 такие, что: 1) вектор-функция вида ф“=(фо\ ф* (/))’, является ненулевой; 2) вектор-функция ф*(/) является решением системы дифферен- циальных уравнений d-h =-V 0 d/ йу, ;-.ЭД > oyi Z = 1, 2,..., n; (10.12) 3) при каждом /е(0, 7] функция H(y*{t), ф‘(0. и) векторной переменной и = (ub ц2, —. Нт)т достигает максимума на множестве U при u-u*(t), т. е. Н (£*(/) ,ф*(О, «*(О)=тахН(у*(П,ф*(О, и), 0<Z<T; (10.13) ЗС5
4) при каждом /е[0, Т\ выполняется равенство Я(У*(О. ф*(0, «*(П)=0. (10.14) В формулировке теоремы 10.1 главным является условие макси- мума (10.13). Именно поэтому теорему и называют принципом мак- симума. Условие 1) теоремы исключает случай HsO н делает ра- венство (10.13) содержательным. С помощью функции Понтрягина правую часть системы (10.9) можно представить в виде ft (у. и)=дН(у, ф, u)/dtyi, i=l. 2, .... п. Следовательно, исходную систему (10.9) вместе с линейной систе- мой (10.12), которую называют сопряженной системой, часто запи- сывают в симметричном виде: _<W(y, 4,ц) d/ ’ /=1,2 п. d6j ф,ц) di дщ * Если в конкретной задаче удается показать, что фо*^О, то всегда можно положить фо* =—1. так как равенства (10.12)— (10.14) не изменяются при умножении их на произвольное положительное число. В общем случае возможен и случай, когда фо* = 0. Тогда функция Понтрягина не включает fo, а значит, необходимые усло- вия теоремы 10.1 не содержат информации о целевом функционале /(и). Следовательно, заменяя исходный функционал другим, полу- чаем для новой задачи те же самые условия оптимальности в фор- ме принципа максимума, что и для исходной. Задачи оптимального управления подобного типа называют особыми (или вырожденны- ми). Равенство (10.14) служит в основном для определения конечно- го момента времени Т и включено в число необходимых условий оптимальности потому, что здесь рассматривается задача с нефик- сированным временем управления. Если функции «•(() и ф*(0 удовлетворяют равенствам (10.12), (10.13), то #(у*(0> Ф*(0, w*(/)) = const и поэтому при решении конкретной задачи равенство (10.14) достаточно проверить [20] только для одного произвольного фиксированного момента /е[0, Т]. Принцип максимума дает только необходимые условия оптимальности. Поэтому если некоторое допустимое управление удовлетворяет этому принципу, то оно не обязательно является оп- тимальным. Нередко, желая подчеркнуть это обстоятельство, функ- цию «*(/). удовлетворяющую всем условиям теоремы 10.1, называ- ют экстремалью Понтрягина. Лишь для некоторых классов задач (например, линейных задач оптимального быстродействия) прин- цип максимума является как необходимым, так и достаточным ус- ловием оптимальности (см. § 10.4). В прикладных задачах принцип максимума нередко позволяет однозначно определить оптимальное управление. Так, если заранее известно, что оптимальное управление существует и, кроме того, 306
найдено единственное допустимое управление, удовлетворяю- щее этому принципу, то это единственное управление является оп- тимальным. 2. Принцип максимума для задачи с фиксированным временем управления. Обратимся к задаче оптимального управления, отли- чающейся от задачи, рассмотренной в предыдущем пункте, только тем, что здесь время управления Т будем считать фиксированным, т. е. заданным с самого начала. Принцип максимума для этой за- дачи нетрудно вывести из теоремы 10.1. Для этого введем допол- нительную переменную уп-н по правилу -4&±!—I, ^(Ф-О. (10.15) at Очевидно, что Уп+i (О = С т. е. включение дополнительного уравне- ния с начальным условием (10.15) в систему (10.9) эквивалентно введению t в число фазовых координат управляемой системы. Учитывая дополнительную переменную, переформируем задачу с фиксированным временем управления (в новой формулировке время управления уже не фиксировано). В фазовом пространстве Rn+1 имеется <расширенная» система управления -^-=/(9.«). (10.16) de 1. <10.17) it Задача состоит в выборе такого допустимого управления, при кото- ром система (10.16)—(10.17) из точки (у*®, 0)eRrt+1 перешла бы в точку (*/(,\ T)eRn+I и при этом был бы минимизирован критерий качества (10.10). Время управления здесь можно считать нефикси- рованным, так как переход системы в фазовую точку Т) уже обеспечивает заданное значение Т времени управления. Запишем функцию Понтрягина для сформулированной задачи Ф, «)4-фл+1, /-0 где Н{у, ф, и) имеет вид (10.11), и применим теорему 10.1. Равен- ства (10.13) и (10.14) принимают соответственно вид Н(^*(Л,ф*(О. а*(0)+Кн(/)= =тах[Н(г/*(/),Ф*(О, и)4-^+1(О|, (10.18) u~U W(!/• (П, Ф*(О. и*(/))+ф:+1(/)=0> 0</<Г. (10.19) где фо‘^0 и (ф*(0- Ф%+>(0)’— решение сопряженной системы = (=1,2 „ + 1. (10.20) d/ dyi 7-0 307
Если все величины фо*. Ф1*(0, ф«*(0» Ф*п+1(0 тождественно равны нулю, то из (10.19) получим тождество ^*п+1 (I) s0. Но это невозможно, так как, согласно теореме 10.1, вектор-функция (фо*, ф1*. .... фп*, ф*я+1)т является ненулевой. Следовательно, (фо*, ф(() )т — ненулевая вектор-функция. Слагаемое ф*„+1(0 в равенстве (10.18) сокращается, а значит, функция Ф*п-н(0 при формулировке необходимого условия опти- мальности не нужна. При этом как бессодержательные следует от- бросить (п+1)-е уравнение системы (10.20) и условие (10.19). В результате имеем следующее утверждение. Теорема 10.2. Пусть вектор-функция u*(t) является оптималь- ным управлением, a y*(t) — соответствующая ему оптимальная тра- ектория в задаче оптимального управления с фиксированным вре- менем управления Т. Тогда существует непрерывная вектор-функ- ция ф*(/) = (ф(* (f).фп*(0)т и число фо‘^0 такие, что выполня- ются условия 1)—3) теоремы 10.1. Единственное отличие условий оптимальности теоремы 10.2 от условий оптимальности теоремы 10.1 состоит в отсутствии равенст- ва (10.14). В рассматриваемой здесь задаче время Т задано, поэто- му становится лишним условие для его определения. 3. Схема применения принципа максимума. Сначала рассмот- рим задачу оптимального управления с фиксированным временем управления. Обычно нахождение экстремали Понтрягина начинают с цент- рального условия принципа максимума Н{у, ф, я)—» шах, (10.21) u=U из которого при каждом фиксированном наборе у, ф определяют управление и, являющееся функцией параметров у и ф, т. е. и = к($/, ф). (10.22) В общем случае это сделать трудно, однако для некоторых классов задач управления функцию (10.22) удается записать в явном виде. Пусть, например, Л (У. «)=Л(0) + 2 f»®*» /=0’ 1.. U — {u е Rra | а* < я* < ЬЛ, Л=1, 2,..., т}, где а* и Ьц — заданные числа. В этом случае функция Понтрягина имеет вид п я» н=2 Ф/Л(у>+2 /-0 (л 2 308
и достигает максимума (благодаря линейности по и) только в граничных точках множества Ut а именно при t», если V Ф,/» W > 0. “* = { ал, если 2 t* < о* /-о Предположим, что функция (10.22) найдена. Подставим ее в ис- ходную и сопряженную ей системы. Имеем u(y,W. (К Дф ___ дН (у* 4* ц(з> ♦)) 0 < / < Г, (10.23) <М ду 1 \ \ ’ где d4i/df=«4>,/dt d<h/d/.d4>fl/dOr( дН'[ду=(дН!;дуъ дН;ду2...dHjdyJV Получена система 2п дифференциальных уравнений относительно неизвестных функций уь уъ .... уп, фь Фг.фп, общее решение ко- торой содержит 2л произвольные постоянные. После нахождения общего решения эти произвольные постоянные определяют из 2л краевых условий: у(О)^у(% у(Г)=у^К (10.24) В результате получают некоторые функции &(t) и ф(/). Для опре- деления фо достаточно, как отмечено выше, рассмотреть два случая фо = О и фо= — 1 и установить, какой из них имеет место в дейст- вительности. При этом следует учитывать, что вектор-функция (фо, ф(/))т должна быть ненулевой. Пусть, наконец, функции ^(0, Ф(0 найдены. Подставим их в .(10.22): u=u(y(t), Ф(О), о</<7, и предположим, что функция й оказалась кусочно-непрерывной, причем й=и(у(1), при каждом ^[0, 7]. Тогда эта функ- ция является экстремалью Понтрягина, а значит, входит в число управлений, «подозрительных» на оптимальные. Если известно, что решение задачи оптимального управления существует и доказана единственность экстремали Понтрягина й, то она является искомым оптимальным управлением. Итак, применение принципа максимума сводится к задаче ис- пользования условия максимума (10.21) и решения системы диф- 309
ференцмальных уравнений (10.23) с краевыми условиями (10.24). Это краевая задача принципа максимума. В тех случаях, когда ана- литически решить ее не удается, используют различные численные методы [8]. Схема применения принципа максимума для решения задачи оптимального управления с нефиксированным временем управле- ния Т та же, что и в задаче с фиксированным временем. При этом время Г определяют из равенства (10.14) при t=T. 4. Решение задачи о мягкой посадке на Луну. Полагая x=ijt dx/ck=i/2( F(/)=u(0, Fmai = r, gn=g> задачу о мягкой посадке, сформулированную в § 10.1, запишем в следующем виде: найти ку- сочно-непрерывную функцию и(/), удовлетворяющую неравенствам 0^и(/)^г, для которой решение у— (yj(/), yz(t})T сис- темы dyi d( =У2. <1У2 _ „I «(О dr ® ' m (10.25) удовлетворяет краевым условиям У1(0)==//< У1(Г)=0; у2(0)=И, у2(Г)=0. (10.26) причем функционал г /(«)—-а С u(t)dt достигает своего наименьшего значения. Конечный момент времени Т заранее не задан и также подлежит определению. Составим функцию Понтрягина для этой задачи: «)=афо« +№2-Н2(10.27) \ m / и запишем сопряженную систему (10.12): — dr * dr Общее решение этой системы имеет вид Ф* =const, ф2 = С,/-|-Са1 (?! = — фГ, где С), С2— постоянные. Функция Н (10.27) линейная по и, поэто- му условие максимума (10.13) для нее выполняется только при «*(О= 0, если аф5-|—— <0, Л1 ., л г, если афо-]-— m (10-28) 310
Это, в частности, означает, что оптимальным управлением может <5ыть только кусочно-постоянная функция, принимающая значение О или л Исследуем уравнения движения ракеты в каждом из этих случаев. Если п*(/)=0 при /е(т, Ti]cz[0, 7] (что соответствует режиму свободного падения) система уравнений (10.25) имеет решение У 2 (О=у 2 (П - g (* - *)• (10.29) Если же при te[x, tj] (что соответствует режиму макси- мального торможения), то аналогично получаем й(0=й«Ж-в+'/яМ- Й- (10.30) Из физических соображений ясно, что на каком-то завершаю- щем участке полета, соответствующем отрезку времени [т И. т<Г, двигатель должен работать, причем, согласно (10.28), в режиме максимального торможения. Этот факт можно установить и ана- литически. Действительно, предположим обратное и, подставив 1 = —xi = T в (10.29), с учетом (10.26) найдем 0=!/1(г)+у2(г)(7'-т)--g(7~~T)a , 0=у2<Й—g(7'—т). Если исключить из этой системы Т, то получим уравнение i/i(t)4- +4/22(т) =g=0, что возможно лишь при (т) <0. Полученное нера- венство соответствует положению ракеты в момент времени t=z под поверхностью Луны, что невозможно. Учитывая установленный факт, а также то обстоятельство, что в силу линейности функции по t управление и* (10.28) не может иметь более одной точки разрыва (точки переключения), имеем B»(0=J °, если/е|0, t], (10.31) [• г, если /е(т, 7>, при некотором те[0, 7]. Здесь и далее т —это момент переключе- ния управления на режим максимального торможения. Рассмотрим движение ракеты на завершающем участке, соот- ветствующем отрезку времени [т, Т]. Подставляя t=xi — T в (10.30) и учитывая (10.26), найдем O=!/,(T)-H,aWs+ , Л* o=y2(n+(-g4-r/m)5, где s=T—т—продолжительность режима максимального тор- 311
можения. Исключая из полученной системы равенств параметр sp придем к соотношению y?(t) У1(г)= 2 \ . (10.32> к —rim где /л(т)—высота, у2(т)—скорость в момент переключения управ- ления. Если H=V2!{g—г/m), то мягкая посадка может быть обес- печена только управлением u*(/)=r, т. е. в режиме мак- симального торможения с 1=0 до t—T. В случае H<Vil(g—г/т) мягкая посадка невозможна, так как добиться нулевой скорости на поверхности Луны не удастся даже с помощью режима максималь- ного торможения в пределах Если же H>V2/{g—<r/m), то при 0^1 осуществляется режим свободного падения (i?(/)“0), а затем при x<t-^zT — режим максимального торможения (ц*(/)езе г г). Заметим, что момент переключения т может быть найден из: (10.29) при т=0, 1=т и (10.32). Обозначим через у* (1) решение системы (10.25), соответствую- щее управлению (10.31) и удовлетворяющее граничным условиям (10.26). Запишем применительно к функции Понтрягина (10.27) ра- венство (10.14) при (=0 и /=т: Л/(^,Ф*. я*)|/-о='1>;1/-’й(О)^=О( (10,33> Я(г/*,ф*, t*(t)£=O. (10.34> Согласно (10.28), в момент переключения т выполняется равен- ство афЗ+-^-=О. (10.35> АП Предполагая, что фо*=0, из (10.35) получим, что ф2*(т) = 0. С другой стороны, при фо*=0 из равенства Н(у*, ф*. и*)|/—т=0г следует, что ф2*(Г)=0. Так как фа*(0 = ^)^+^2* имеем ф2*(0=0- Тогда из (10.33) получаем фГ = 0. Окончательно (фо*, ф>*, ф2*(/))т=0, что, согласно условию 1) теоремы 10.1, невозможно^ Следовательно, Фо*<О и можно положить фо‘ =—1. Используя обозначение ф2* = С|14-С2 и равенства (10.35), равен- ства (10.33) и (10.34) запишем в виде c2g=о, Ф1(^—gx)—amg—0. Отсюда находим ,* a mg . /-< a mV Ф1 ------=—; с2=---------. 11 V-<r 2 Поскольку 01=—ф)*, окончательно получаем т V—gv 1 312
Как отмечалось ранее, проиерн® равенство Ф*(0. ж*(П)—0 ДЛЯ одного'значения /г|0, 7], нет необходимости убеж- даться в его справедливости при остальных значениях tefO, Тр Значит, равенство (Ю.14) для функций ф*(0> й*(0 в Д ад ном служак* выполнено. Подведем итог проведенному исследованию. Найдено едикствци- ное управление (10.31),, удовлетворяющее всем условиям принципа максимума. Из физического смысла задачи ясно, что он я должна иметь решение. Значит, найденное управление является оптималь- ным. Искомое время управления Г можно определить из условия >{У. Ф*. w*)U=r=(k ' & 10 3. ЗАДАЧА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ с: подвижными концами I. Постановка задачи. На практике нередко возникают задачи., s которых один или оба конца траекторий, отвечающих допустимым управлениям» не являются кжестко закрепленными», а .могут иахо- днться е пределах заданных мио- жесте,. содержащих белее чем один элемент.. Такне задачи управления на- зывают зада ЯШ И с подвижными кон- цами.. Рассмотрим задачу оптимального управления с подвижным -правым кон- цом. В этой задаче целевой фуихцяо- нал иод лежит минимизации на мно- жеств всех допустимых управлений, переводящих управляемую систему из заданной точки фазового пространст- ва па заданное множество Scr.R" рнс. 10,J). Возможен к случай, когда $ = йя; тогда имеет место задача дордол со свободлед лрют&ш к/ад^м. Далее будем считать, что S — множество! решений сит ем ы у рав- ней ргц т,. е, $={!/(= Й*|?.(¥) = 0, £ = 1,2.....а;. (10.36 где фа, q?2, фд« заданные фуккцин, непрерывно дифференцируе- мые на пространстве Кп. В частном: случае «=1, 2, -s. из равенства (10.36) следует,, что S-R’’. Зй$йча олгцж^льжэго' рлдпвлекця с лосЬшяэдыж дравэдм концом формулируется следующим образом. Дана управляемая система ,£10.9) и задано множество 5 вила ОС..&6), Требуется найти такое допу- стимое управление н(#)} чтобы точка, описывающая со- стояние •системы, из заданного начального' состояния к коиечко- 313
му моменту времени t—T «попала на множество S», т. е. чтобы вы- полнялись равенства ?,(У<П)=О. /=1,2......Л, (10.37> и при этом был достигнут минимум функционала (10.10) т Ни) = J /o(ir(0, «(О)бЛ о Время управления Т может быть фиксированным или нефиксиро- ванным. Пусть пара функций и*, у* является решением сформулирован- ной задачи, причем траектория y*(t) начинается в точке f/(0) и за- канчивается в точке Очевидно, управление и* и соответству- щая ему траектория у* оптимальны и в задаче с системой (10.9) и функционалом (10.10), но с закрепленными концами у®> и//1’, поскольку все траектории, соединяющие точки у<0> и уР\ входят в множество траекторий, которые соединяют точку с множест- вом S. Отсюда следует, что для пары функций и“, у*, представляю- щей собой решение задачи с подвижным правым конном, также выполнен принцип 'максимума в форме теоремы 10.1 или теоремы 10.2 в зависимости от того, не фиксировано или фиксировано время управления Т. 2. Условия трансверсальности. Изменение формулировки необ- ходимых условий оптимальности в задаче с подвижным правым концом заключается в замене граничных условий на правом конце оптимальной траектории на граничные условия для вспомогатель- ных функций ф,- на том же конце. Последние называют условиями трансверсальности. Они заключаются в требовании ортогонально- сти вектора ф*(Т) множеству S в точке у*(Т) (8, 20]. Рассмотрим эти условия подробно. Уравнение гиперплоскости Р», касательной в точке у*(Т) к поверхности, которая задана урав- нением ф<(1/) =0, имеет вид <¥?,(!/* (Г)). у~— $/*(Г))=0. л Пересечение представляет собой линейное множество, касательное к S в точке у*(Т), и условие трансверсальности за- ключается в ортогональности вектора ф*(Г) этому линейному множеству, т. е. <Ф*(Г), У—у* (7'» = 0 для всех у^Р. Иначе говоря, в точке у=У*{Т) (как и в любой другой точке мно- жества Р) достигает минимума линейная функция с(гО=<Ф*(7'), — <Ф*(7'), р*(Т)> при линейных ограничениях-равенствах (V<Pf(y*(r)), у) - (?%-(!/*(Г)), у*(ТУ)=0, /=1, 2,.., k. 314
Последнее, согласно теоремам 2.5 и 2.7, имеет место тогда и только тогда, когда найдутся такие числа Xi, Х2, —> X*. что Г(Т)+2Х,7Т/(л»(Г))-0,. Полагая а.=—X/, /=1, 2, k, условие трансверсальности оконча- тельно сформулируем следующим образом: существуют числа си, «а...ал такие, что Ф* (Г) == 2 (у* (Г)). (10.38) При ф/ (у) =0, i=l, 2, ... k, отсюда вытекает условие трансверсаль- ности для задачи со свободным правым концом: ф*(Т)=Оя. (10.39) Условие трансверсальности принимает простой вид в случае, когда S— линейное множество, параллельное некоторым коорди- натным осям Oyi t Oyi*..;, Oyipt Напомним, что линейное множество 5 параллельно координатной оси Оу^ если вместе с каж- дой своей точкой (yi, .... yi-i, yi, yt+ь ...» yn)eS оно содержит всю прямую (у...... У1, у<+ъ .... Уп), —*»<£*<«>, проходящую через эту точку. Очевидно, что вектор ф*(Т) ортогонален линейному множеству, параллельному оси Оу, тогда и только тогда, когда ра- венство (Г(П. (th...£-1. Ун Ум.....£)т-у*(Л)=о выполняется для всех Это имеет место в том и только в том случае, если ф/(Г) =0. Поэтому условие трансверсальности для ли- нейного множества 5, параллельного нескольким координатным осям Оуц, Oyiat...t OyipI принимает вид (Г) =0, i= 1, 2,.... р. Для задачи с подвижным левым концом i/*(0)g5, где S имеет вид (10.36), условие трансверсальности формулируется аналогично: существуют такие числа си, аз. ..., ал, что а Ф*(0)=2 VMS'* (°))* <p/0f*(0))=0, х = 1,2.А. Если в задаче подвижными являются оба конца, то условия трансверсальности нужно аналогично записать как для левого, так и для правого концов. Теорема 10.3. Пусть вектор-функция u*(t) является оптималь- ным управлением, а вектор-функция y*(t)—соответствующей опти- мальной траекторией в сформулированной выше задаче с подвиж- ным правым концом, где S имеет вид (10.36). Тогда существуют 315
непрерывная вектор-функция ф*(0 — (фГ(*), фг*(О, Ф«*(0)т и число фо*^О такие, что выполняются условия 1)—3) теоремы 10.1 и условие трансверсальности (10.38) вместе с равенствами (10.37) при у—у*. Для задачи с нефиксированным временем управления, кроме того, имеет место условие 4) теоремы 10.1. Аналогично можно сформулировать необходимые условия опти- мальности в виде принципа максимума для задачи с левым под- вижным концом, а также для задачи с обоими подвижными кон- цами. Схема применения принципа максимума остается прежней. Для задачи с подвижным правым концом отличие состоит в том, что 2л произвольные постоянные, возникающие при решении системы (10.23), вместе с неизвестными числами щ, аз, аь (всего 2л+& неизвестных) необходимо определять, исходя из выполнения на- чального условия у{6)=у®> и условий трансверсальности (10.37) — (10.38) (всего 2п4-А равенств). Система перечисленных условий является полной в том смысле, что число уравнений совладает с числом неизвестных,'а значит, все неизвестные в принципе могут быть найдены. 3. Доказательство принципа максимума для задачи со свободным правым концом. Установим справедливость теоремы 10.3 у случае S«Rn при фиксиро- ванном Т. Пусть вектор-функция и* является оптимальным управлением, а век- тор-функция у’ — соответствующей оптимальной траекторией. Как отмечено в п. 2, условие трансверсальности для задачи со свободным правым концом имеет вид ('10.39) и теорема 10.3 утверждает, что существует ненулевая непрерывная вектор-функция (фо*, Ф*(0)т, удовлетворяющая уравнениям (10.12), условиям фо*’С 0, (10.39) н такая, что для нее выполняется условие максимума (10.13). Если предположить, что фо*=0, то (10.12) превращается в однородную си- стему линейных дифференциальных уравнений, имеющую единственное решение ф’(^) = 0п, удовлетворяющее граничному условию 10.39. Требуется установить существование ненулевой вектор-функции (фо*, ф‘(/))г. поэтому случай фо*=О следует исключить и можно положить фь*=—1. Тогда сопряженную систему (10.12) можно записать в виде ....(104в> Это линейная система дифференциальных уравнений, я для нее задача Кош я с граничным условием ф(Т) =0„ всегда имеет, н притом единственное, решение. Та- кны образом, для доказательства теоремы 10.3 в случае S = Rn достаточно убе- диться в том, что для решения указанной задача Коши, которое мы обозначим через ф* (/), выполняется равенство (10.13) для всех fe[0, Т]. Сначала установим справедливость равенства (10.13) для любой точки те(0, Г), в которой функция и* непрерывна. Рассмотрим произвольный вектор veU н семейство допустимых управлений вида (V при /е(г- X, т), и* (О при /^Цт — X, т), где параметр X положителен и мал настолько, что [т—X, т)с=[0, Т]. Каждому допустимому управлению щ(1) отвечает определенное решение системы (10.9) при u=uk[t) с начальным условием y(O)=jf<°>. Обозначим это решение через %(0- 316
Так как и* — оптимальное управление, то /(ах)—/(и*) ^0 для всех доста- точно малых положительных X. Следовательно, Используя конкретный вид функционала /, а также равенства #х(О=0*(Ог и1(0=и*(0| 0^/<т—X, перепишем полученное неравенство в виде И®-J- J I/o&Ji), v)-fo(y*(t), «•(О)|«‘+ •»—х т • +>!!зЛт1Л‘*‘(0- «•(О) —/о (у* (О» u*(O)]di >0. (10.41> Функция [о (у, и) непрерывна по у я и, поэтому первый предел, согласно след* ствию первой интегральной теоремы о среднем [16], равен [г»(р*(т), v)—Л>(У*(Т)- м"(т)). Функция fo(y, и) дифференцируема по первым п аргументам, поэтому можно записать -j'lMMO. «‘(О)—Л(я*(О. «,(О)| = = «'», -LIM0-<01 >+о ю. X су А * / где dfo/dy=(dfo/djfi, df<Jdyny. Таким образом, неравенство (10.41) в ре- зультате осуществления предельного перехода принимает вид /о (У* (т). V) - /о (у* СО» в* СО) + + ‘«д«>». <«>•«> J X оу / где гЦ)= lien -т-[ук(О —У*(О[. И- >-►+0 А 1 Рассмотрим этот предел. Так как т — точка непрерывности управления «*, то можно указать достаточно малое положительное Л, при котором функция и* непрерывна и в некоторой Х-окрестностн этой точки. Следовательно, при сделан- ных предположениях относительно fo (см. § 10.1) функция у* дифференцируема в окрестности точки т и, учитывая (10.9), можно записать У* (О = У* (т — X) + X —— 4- О! (X) = у* (т — X) + ат + Х/(|/*(с-Х), где через dy*(x—A)/df обозначен л-мерный вектор из соответствующих произ- 317
водных. Аналогично, для достаточно малых положительных к выполняется ра- венство ч , dyx(T —X) Ух(т)=Ух('в—х) + х-------------4-оа(Х) = у*(т —X) 4- 4-Х/(у*(т— X), v)+o2(X). Здесь использован тот факт, что У\^—^)=У*(л—X), вытекающий из непрерыв- ности функция yi(t) и условия у^ (t)=y(t)r 0^/<т—к Таким образом, верно равенство Уг (т) - У* (г) = X [/ (у* (т — X), v) - f (у* (т - X), и* (т — X))] 4-о(X), а значит, z(t)= Hm-J-kfx(r)-0*(T)] = /(y*(T), о) —/(у*(т), иф(т)). Х-М-0 А * д (10.43) Выразим вектор производных dz/d/ через производные dftldyj. Из уравне- ния dy/dt=f(y, и*), которому удовлетворяют на отрезке (т, Т] вектор-функции У*(0 и 4Ц(0. следует t (О = * х (т) + J f (Ух <*)» «• (*>)ds' ч / У* (/) У* (Т) + у / (р* (а), u* (a)) ds - t Здесь интеграл от вектор-функции означает вектор из интегралов соответствую- щих компонент. Имеем [Ух (О - У* (CJ —J" [Ух - У* (т>| + / + у J[/(yx<£)- «*(«)) —/(У*(£). (10.44) Перейдем в этом равенстве к пределу при Х-+- + 0. Предел первого слагаемого в правой части выражения равен z(t). Для второго слагаемого получаем t 4" J[/ (Ух<£>* “* (£>) “ / (У* (£)» «• О»)d£ = t - У / (»х W- “• W) <>s I Х-+0 - "I 1 _ Га/(</♦(»), n*(s)) d»x<5> I . J dy dX |x-+o где dffdy — матрица n-го порядка из частных производных вида dfi/dyj. Так как dyx(s) I I —5Г- х_+0 = хЧТо Т (s) - ('>1 ’ г (1>’ 318
то второе слагаемое принимает вид f «*(5)) ' \------------------z (S) ds - J дУ В соответствии с полученным из (10.44) следует равенство (у*О). «’(S)) ... ------ --------z (s) as которое означает, что функция z(t) иа [т, Т] удовлетворяет дифференциальному уравнению dz ц*(р) df ду (10.45) с начальным условием (10.43). Теперь, принимая во внимание равенства (10.45) и (10.40), находим где ф‘(0 = (ф*1(0. Ф*а(0. ♦*»(<))*• Отсюда, интегрируя и учитывая при этом, что ф,(Т)=0п, получаем <^со. »со> = - '“>>• Полагая /=т, на основания (10:43) имеем r/d/o(y*(s). »*(*)) г (>)\ dj= «•(*))- J \ дУ / ж — /(У*СО. V)). Перепишем неравенство (10.42), учитывая последнее равенство, в виде /о (У* (*). <0— /о (У* (т). и* (т)) + (ф* (т), / (у* (т), «•(*))—/<У*СО. v)> >0, или (ф*(О. /(У*(О. “*СО)> — /о(у*СО. »*(О)> > <Ф*(О. /(у*(О. «))“/о(у*СО» ^)- Так как ф«*->—1, то последнее неравенство представляет собой неравенство ^(У‘(О. Ф*(О. и‘(О)>Я(|Г(О» Ф‘(О. v)- В СИЛУ произвольности выбора 319
'veU это означает справедливость равенства (10.13) в каждой точке непрерыв- ности функции и*. Теперь предположим, что t— произвольная точка разрыва функции и*. Оче- видно, существует последовательность точек {та}^ вида та-Н—0, тхе[0. Г], k — i, 2...причем в каждой точке та функция и* непрерывна. На основании доказанного выше, можно записать W(Sf*(’*), Ф*(т*), и*(т*)) >Н(^*(т*). Ф*(тй), о) для каждого v^U. Переходя в этом неравенстве к пределу при оо и учи- тывая непрерывность функций Ht а также непрерывность слева функции и* (см. § 10.1), получаем требуемое: Ф*(О. «• (О) > Н (У* (О. 4* <0» v) для всех v <=U. Замечание. В приведенном доказательстве имеется «пробел» — сущест- вование предела для z(l) установлено не было. Обычно существование этого предела доказывают с помощью теоремы о непрерывной дифференцируемости решения дифференциального уравнения по начальным данным [2]. 4. Принцип максимума для неавтономных систем. Рассмотрим задачу оптимального управления системой у, и) , (10.46) ас на временном промежутке [1о> “П с заданным начальным у(°> и ко- нечным состояниями: У(Т)=у™. (10.47) В качестве критерия оптимальности, подлежащего минимизации, возьмем функционал г /(и) = f fB(t, y(t), (10.48) Система (10.46) отличается от рассмотренной ранее системы (10.9) тем, что правая ее часть, т. е. вектор-функция f, явно зависит от /. Такую систему называют неавтономной системой в отличие от ав- тономной системы (10.9). Заметим, что в функционале (10.48) под- ынтегральная функция также явно зависит от t. В частном случае, когда указанные функции не зависят от /, получаем задачу опти- мального управления, рассмотренную в § 10.2. Начальный момент считаем заранее заданным и зафиксирован- ным, а конечный — нефиксированным и подлежащим определению. Предполагаем, что для функций у, и, f, fo выполнены допущения, аналогичные сделанным при формулировке задачи управления ав- тономной системой и, кроме того, считаем, что функции fo, А, А.... fn непрерывно дифференцируемы по / при Область управле- ния представляет собой фиксированное множество; ее, как и рань- ше, будем обозначать через LAzRm. Принцип максимума для сформулированной задачи можно вы- вести из принципа максимума для автономных систем с подвижным правым концом. Для этого введем дополнительную фазовую пере- 320
менную х/я+1 с помощью равенств d*/n+j/df=l, #л+1 (Лэ) из кото- рых следует, что yn+i(t) !, В соответствии с этим исходную задачу запишем в виде У, «). ДУл+1_ । at (10.49) г /(«)=[ fQ(y„+1(0. У (О, И <0) d/-» rnln. D Это уже задача управления автономной системой с фиксированным начальным состоянием №\/0)eRn+1 и подвижным ко- нечным состоянием, принадлежащим прямой из Rn+I вида L = \yf= R"+l|yf=!/!l), *=1,2..д; — оо<ув+1<оо|. Пусть «* и у* — оптимальное управление и соответствующая ему оптимальная траектория в исходной задаче оптимального управле- ния неавтономной системой с закрепленными концами. Тогда эта пара функций является оптимальной в автономной задаче (10.49) с подвижным правым концом. Согласно теореме 10.3, существуют непрерывная вектор-функция (4>i*(0..фя*(0, Ф*я+<(0)т п число фо*^О такие, что указанная вектор-функция является решением системы Дф/ __ VI ф у*»ц*) di Н 1 д1" . *=’.2.....«• (10.50) _____V 4 »*•“•) di 2^! dt и выполняется условие максимума Я (Л $*(/). Ф*(0, и*(Л)+Ф;+1(О= = max [//(/, £»(/), Ф*(0.к))+Ф^+1(0Ь (10.51) ие£/ где Н(Л у, ф, и)=2 Ф//ДЛ У* и>- (10.52) /-о В равенстве (10.51) функция ф*л+|(0 сокращается, и оно оконча- тельно имеет вид H(t, У*(П, ф»(0,а*(0)=шахН((, у»(/), Ф*(О, «), (10.53) 11—339 321
Условие 4) теоремы 10.1 записывается в форме Н(Л !/*(/>, Ф*(О. «*(0)+1>л+1(П~О, i0<t<7, (10.54) а условие трансверсальности на правом конце означает ортогональ- ность вектора (ф1*(7), фп*(Т), ф%+1(7) )т прямой L, т. е. <р“п+1(Т) =0, так как прямая L параллельна оси Oi/n+i. Используя последнее равенство, из второго соотношения (10.50) при ф(=фЛ i=0, 1...л, получаем / п а значит, (10.54) можно записать в виде А/(Л Ф*(О, «*(/)) = = \ >Л(|)--------------X--------ds, (10.55) Г где фо*($)эфо\ Предположение о том, что (ф<Л ipi*(/), ..., фп*(0)т^0, из (10.54) влечет ф*п+1(/)=0. Но в силу теоремы 10.3 это невозмож- но; следовательно, вектор-функция (-фо*, ф1*((), —, фл*(0)т нену- левая. Теорема 10.4. Пусть и* оптимальное управление, а у* — соот- ветствующая оптимальная траектория в задаче оптимального уп- равления неавтономной системой (10.46) с граничными условиями (10.47) и критерием оптимальности (10.48) на временном проме- жутке [fo, 7], где конечный момент времени не фиксирован. Тогда существуют непрерывная вектор-функция ф*(1) = (ф1*(0, фг‘(0. Фл*(0)т и число фо*<;О такие, что: 1) вектор-функция вида (фо*, Ф*(0)т. является ненуле- вой; 2) ф*(0 — решение системы дифференциальных уравнений __ V Ф dt Z4Ъ dyt t— 1, 2,..., n. 3) выполняется условие максимума (10.53), где Н имеет вид (10.52); 4) выполняется равенство (10.55). Как и в автономном случае, из справедливости равенства (10.55) в фиксированный момент времени ie[/o, 7] следует его выполнение для всех Т] [20]. Поэтому справедливость этого равенства можно проверять, например, при i = T\ в этом случае оно принима- ет вид Н(Т, у*(Т), ф*(Т), и*(7‘))т=0. Отсюда обычно определяют искомое время Т. 322
Для задачи оптимального управления неавтономной системой с фиксированным временем Т также справедливы условия оптималь- ности в форме принципа максимума, приведенные в теореме 10.4. В этом случае отпадает необходимость определения момента време- ни Г и поэтому условие 4) лишнее. Для неавтономных систем возможна постановка задачи опти- мального управления с подвижными концами. Для таких задач имеет место теорема 10.4 и, кроме того, выполняются условия трансверсальности, которые записываются точно так же, как и для автономных систем (см. п. 2). 5. Задача терминального управления. Пусть дана неавтономная система (10.46) при Рассмотрим задачу оптимального управления этой системой с закрепленным левым концом {y(to) = =^°>), свободным правым концом и нефиксированным временем Т. При этом в качестве критерия оптимальности, подлежащего мини- мизации, возьмем терминальный функционал вида Г(и)=Ф(у(Т)\ где Ф: R"-*-R— заданная непрерывно дифференцируемая функция. Этот функционал задан на множестве всех допустимых управлений (т. е. кусочно-непрерывных функций и вида при всех TJ), для которых —начальная точка соответствующих им траекторий. В частном случае, когда Ф (У(Г»=2 /-1 (10.56) где ci — постоянная, рассматриваемую задачу можно свести к за- даче с интегральным функционалом. В самом деле, из (10.46) сле- дует равенство г Поэтому /(«)=Ф(У(Г))=[ У cJilt, y(t), 4 /=» i-i Так как второе слагаемое в правой части равенства — константа, то задача оптимального управления с терминальным функционалом вида (10.56) равносильна задаче с интегральным функционалом г л [ 2 «(/))d/. г0 i-l н 323
В общем случае необходимые условия оптимальности в форме принципа максимума для задачи терминального управления полно- стью аналогичны условиям теоремы 10.4 (см. [8]), где у, ф, «)=2 У* «X Если конечный момент Т фиксирован, то условие 4) следует иск- лючить. Изменяется условие трансверсальности; оно принимает вид Г(Г)=^(у*(Г)), где ®y=(dQ/dylt дф/дуъ...>дФ/дуяу. Более общие постановки задач терминального управления и со- ответствующие им версии принципа максимума можно найти в [2, 8]. 6. Сведение задачи оптимального управления к дискретной за- даче. Будем считать, что момент времени Т фиксирован, левый ко- нец закреплен (у (/0) - у<0))), а правый — свободен. Разделим временной отрезок [/о. Г] на AZ равных частей точками h—kh, й—0, 1, 2, .... N; Nh~*T. В каждой точке t промежутка [/*, G+i) заменим вектор производных dy/dt вектор-функцию y(i)t u(t)) и функцию fo(/t y(i), u(t)) приближенными выражениями: dy di Л / (*. У (О. «(О) « / (4> У (6), а (4», Ч < t < ^+1. /о(*. У(О. УН& «(U). В результате вместо системы Дифференциальных уравнений (10.46) получаем векторное равенство И^+1)= У ('*)+*/(/*, у (/*), и (/*». А=0, 1,..., N, которое после введения обозначений »(**)₽«<*+», /а*, </(/*), U (/*))=/<*><У(Ч принимает вид -j-«(*>), 1, 2.TV, (10.57) и задает дискретную систему управления. Критерий оптимальности, используя обозначение fo(f*, y(i*)t u(/h)) = и<*+1,),запишем в виде Т N—\ /=f /о«. !/«). U(О)d/^2 !/«*)•“ «»»* = 4 Л-о =л 2 *-1 324
В результате приходим к задаче оптимального управления дне- кретнои системой (10.57) с критерием оптимальности w Л V /{*-” ({/<*-<•, „<*)), А-1 заданным начальным состоянием у(t0) и условием fe= = 1, 2, N. Решая эту задачу, например, с помошыо метода, опи- санного в гл. 4, или же используя алгоритмы нелинейного програм- мирования, определяем последовательность управлений й(1], й&\ .... й(Л'\ С помошью найденной последовательности приближенное оп- тимальное управление для исходной задачи (10.46), (10.48) можно записать в виде если в'«. если/,<<<<,, и^, если Обозначим через траекторию, соответствующую управлению iih(i). Можно доказать (см. кн.: Ермольев Ю. М. и др. Математиче- ские методы исследования операций.— Киев: Вища школа, 1979), что, выбирая шаг разбиения h достаточно малым положительным, нор- му разности Пул—у*Но> где у*(0~оптимальная траектория исход- ной задачи, можно также сделать сколь угодно малой. Это означа- ет, что полученное указанным «конечномерным» способом прибли- женное решение с уменьшением шага h будет все точнее аппрокси- мировать оптимальное решение исходной бесконечномерной задачи оптимального управления. 7. Принцип максимума и условия оптимальности вариационно- го исчисления. Принцип максимума применим и для решения ва- риационных задач. Из него, как следствия, вытекают уравнения Эй- лера — Лагранжа, условие Лежандра, а также условия трансвер- сальности, рассмотренные в предыдущей главе. Это означает, что принцип максимума как бы «объемлет» все перечисленные усло- вия оптимальности вариационного исчисления. Рассмотрим простейшую задачу вариационного исчисления с подвижным правым концом: / = J / (х, у (л), f (х)) dx — min; У Uo)='/<0\ У (*t)=£ G*i)- Считаем, что функция f определена на пространстве R3 и обладает всеми необходимыми в дальнейшем свойствами, ag— заданная гладкая функция. Пусть непрерывно дифференцируемая функция у* представляет собой решение сформулированной задачи. Согласно следствию 9.1 325
из леммы о скруглении углов, эта функция также является реше- нием расширенной задачи, в которой операция минимизации осуще- ствляется в пространстве кусочно-непрерывно дифференцируемых функций. Заменим х на t и сформулируем расширенную задачу в виде следующей задачи оптимального управления с подвижным правым концом: " Г / («) = f f V, У (Л, «(/)) d/ — min: tZ=R, d/ !/(/o)=0(&)> ?(Л y(DM(D-«(T)=O, где конечный момент времени Т считаем нефиксированным. Здесь и х1 также заменены соответственно на и Т. Мы перешли к рас- ширенной задаче, поэтому управление и принадлежит классу ку- сочно-непрерывных функций, а значит, можно воспользоваться тео- ремой 1Ф.4. Составим функцию Понтрягина: Н(/, у, Фо, Ф/. У* w)+'h«- Очевидно, управление вида u*(t) = dt/*(Z)/d/ является оптимальным для сформулированной выше задачи оптимального управления. По теореме 10.4, существует1 число фо*^О и функция ipi*(Q такие, что имеет место условие максимума на. у* a). $'$(?). «*(/»= . = max Н а. У* (/). <5. (О, «), t, < t < Т. (10.58) Отсюда .следует, что производная функции Понтрягина по и при и— = и* должна обращаться в нуль: Яа|«-«-=ф;/ви, !/*(/), «*(0)+ФНП=0, (Ю-59) Если предположить, что фо*=0, то из равенства (10.59) имеем ф|*(/)^0, чтЬ невозможно. Следовательно, ф<Г<;0 и можно поло- жить фо* = — 1. Функция ф1*, согласно теореме 10.4, удовлетворяет сопряженной системе, т. е. db? , -rr=-W,«. У*(О. «*(О)=Д (Л у* a), a* an- ОС Поэтому t ФНЛ= J y*(s), «*(з»б$+ф?(/0), 326
а значит, равенство (10.59) можно записать в виде ~Л(Л «*(Л)+ f fy(s, 0*(s), «*($)) d$-Hi tfo)=O- Дифференцируя это равенство no t, получаем —У*ОТ. e*OT)+/,OT y*W. В*<0)=0. dr ИЛИ /,(/. «*(О. у*(Г>, в’ОТ)=0. di Таким образом, функция у* вместе со своей производной и* удовле- творяет уравнению Эйлера — Лагранжа из § 9.2. Из условия максимума (10.58) следует неположительность вто- рой производной функции И по и, т. е. ««.!«-«•= V, У* ОТ, «• ОТ) < 0, «о < t < Т, ИЛН.^ии (£, «*(0)^0. Итак, условие Лежандра из § 9.3 также выполняется. Выведем условие трансверсальности. Функция <р=ф(Л у)> фигу- рирующая в условии на правом конце траектории, имеет более об- щий вид, чем рассмотренная в п. 2, так как зависит еще и от /: <р(Л У)=У—g(t)- Поэтому непосредственно использовать условия трансверсальности из п. 2 нельзя. Одиако если воспользоваться приемом включения времени в список фазовых координат (см. п. 4), то на основе условий трансверсальности из и. 2 можно вывести ана- логичные условия для более общего случая: * ф*(Г)=^ a^t(Tt у* (Г)), /-1 я Н(Г, irawtrt. «•(П)=-2о1?«(Г. У*(Г». 1-1 В данной задаче эти условия имеют вид 4£(Г)=ар А/(7, у* (7), фЗ, ф1(Г), и*(Г))== — а^ЧГ). Отсюда, принимая во внимание конкретный вид функции Н и ис- пользуя равенство ipi*(/) =fu(/, у*(0. и‘(0) при f=T, получаем -/(Г, у’(7), и*(Тп+/а(Тл у* (Г), и*(7))«*(7)= = -/»(Л £/* (Г), «* (7))^' (Г), или /(Г, ^*(7), «*(7))=Д(7, у*(7), 11*(7))(И*(7)-£'(П), что с точностью до обозначений совпадает с условием трансверсаль- ности на правом конце из теоремы 9.5. 327
В рассмотренной задаче U=R. В вариационных задачах более общего вида множеством U может быть произвольное открытое множество. Принцип максимума применим как для открытого, так н замкнутого множества U. В реальных задачах множество U не- редко замкнуто, значит, методы вариационного исчисления исполь- зовать нельзя. В таких случаях принцип максимума оказывается незаменимым. § 10.4. линейная задача ОПТИМАЛЬНОГО БЫСТРОДЕЙСТВИЯ 1. Постановка задачи и формулировка принципа максимума. В векторной форме линейная автономная управляемая система за- дается дифференциальным уравнением вида (10.60) at где dy/di=(dyt/di, dy^dt^dyjdiy, У=({/ь Jfa Ул)т> Uj,..., «т)т, (Ди д12 ... Д|„\ /Ьп bi2 \ а22 ••• а2а | В=| ^21 '** I Лл1 ая2 * • • алл \^л! ^л2 • ‘ • ^л.л/ а ац и Ьц — заданные числовые коэффициенты. Допустимыми уп- равлениями здесь являются кусочно-непрерывные функции и(0 оп- ределенные на различных промежутках вида [0, У], где (т — фиксированное положительное число), и удовлетворяющие вклю- чению u(t)^UczRm для всех fe[0, Т]. Начальным состоянием си- стемы является точка а конечным —точка #0)eRn. Каж- дому допустимому управлению и(1), согласно (10.60), отвечает со- ответствующая кусочно-непрерывно дифференцируемая траектория y(t) (см. § 10.1). Линейная задача оптимального быстродействия состоит в опре- делении среди всех допустимых управлений, переводящих систему (10.60) из начального состояния в состояние такого управ- ления, которое осуществляет этот переход за наименьшее возмож- ное время, т. е. управления, которое минимизирует функционал I (и)= f dt=T. i Минимальное время управления также подлежит определению. Эта задача представляет собой частный случай задачи оптималь- ного управления с закрепленными концами и нефиксированным временем (см. § 10.1), когда система управления является линей- ной п в формуле (10.8) f0(t/, u) = l. 326
Согласно теореме ЮЛ, запишем принцип максимума для сфор- мулированной задачи. Составим функцию Понтрягина: ^=Фо + <Ф> Ау + Ви}. Пусть пара функций и*, у* является оптимальным решением линей- ной задачи оптимального быстродействия. Сопряженная система (ЮЛ2) в данном случае принимает вид ~j /=1> 2,...,й, или в векторной форме —л’Ф. (Ю.61) где Дт— транспонированная матрица А. Равенство (10.14) приобретает соответственно вид <Л4-<Ф*а). л^(о+Яй*со>=о, о</<г. (Ю.62) Если ф*(/) = 0п, то из равенства (10.62) следует, что фо*=О, т. е. ф*(/)кОп+ь Согласно условию 1) теоремы 10.1, это не должно иметь места и поэтому ф*(/)^0п> Учитывая, что фо‘^0, равенство (10.62) запишем в виде <Ф*(О. Др*(0+5«*(/)) >0, 0<7<Г. Условие максимума (10.13) принимает вид ф!+ <Ф*Ю. № <0> 4- (ф*(0. (0) = =тах[фо+(<|>*(0. Ау*«)> + (♦*«). Ли>]. aeU (10.63) что равносильно равенству (Ф*(О, Вй*(/)}= шах (<!»♦(/), Ви). (10.64) Сформулируем принцип максимума применительно к рассмат- риваемой линейной задаче оптимального быстродействия. Если и* и у* — оптимальное решение линейной задачи оптимального быст- родействия, то существует ненулевое решение ф*(0 = (фГ(0> фа*(/), Мм*(0)т линейной однородной системы дифференциаль- ных уравнений (10.61) такое, что выполняется условие максимума (10.64), а также имеет место неравенство (10.63). 2. Принцип максимума — достаточное условие оптимальности. Рассмотрим задачу наискорейшего перевода линейной системы (10.60) из точки в положение равновесия системы dy/dt=Ay, т. е. будем считать, что у<1)=оп. В качестве области управления U возьмем многомерный параллелепипед L/' = {weR,n | i = l, 2,...,m}, (10.65) где tu, pi — заданные числа. Будем считать, что начало координат 329
Отп принадлежит параллелепипеду (10.65), но не является его вер- шиной, т. е. существует отрезок в U, параллельный какой-нибудь координатной оси пространства Rm, внутри которого содержится начало координат. Теорема 10.5. Дополнительно к сделанным предположениям бу- дем считать выполненным условие общности положения, согласно которому для каждого i=l, 2, ..., пг является линейно независимой система векторов вида Bt^f АВе<"....(10.66) где el’1—вектор с нулевыми компонентами, среди которых только i-я отлична от нуля и равна единице. Если допустимое управление и* переводит систему (10.60) из состояния в состояние yil)=G^ и вместе с соответствующей ему траекторией у* и некоторой вектор- функцией ф* удовлетворяет принципу максимума, то и* — опти- мальной управление, а у* — оптимальная траектория в линейной задаче оптимального быстродействия. □ Предположим противное: допустимое управление и* вместе с соответствующей траекторией у* и ненулевой вектор-функцией Ф* удовлетворяют всем условиям принципа максимума, но и* не явля- ется оптимальным управлением. Это означает, что существует до- пустимое управление й, которое переводит систему (10.60) из со- стояния у&> в начало координат 0п за время Т меньшее, чем время 7, соответствующее управлению и*: Т<Т. Обозначим через у тра- екторию, отвечающую управлению й. Поскольку и* и у* удовлетворяют уравнению (10.60), а функ- ция ф* имеет вид (10.61), находим df ' ' \ df У /' V d/ / = -(А’ф*. + Л«/* + Ва*) = (Г. £«*)• (Ю.67) Отсюда, интегрируя в пределах от 0 до Т, получаем т Г (Г)»*(?)-|>*(О)0*(О)=[ B«*(O>d/. Аналогично можно найти —(0)=[ <Ф*(О. BuWit. 6 Следовательно, учитывая равенство ^(Т)—0п, можно записать 4* (7) (/* (7)=IГ (7) у* (7) - ф* (0) у* (0)1 - 1Ф* (7) у (7) - f -НО)0(0)1= В«*(0) - <+•(/). Be(O>]dA (10.68) 330
Так как для функции и* выполняется условие максимума, то 0*(О. >(!*(/), Поэтому подынтегральная функция в (10.68) не отрицательна, а значит, не отрицателен и сам интеграл, т. е. - (10.69) С другой стороны, интегрируя (10.67) в пределах от Т до Г, полу- чаем г +*(/)»*(Г)=ф*(7:)!/*(Г)-ф*(Г)!/*(Г)=- f (|*(О,.&!»(/)) <1/. Г (10.70) Из выполнения для функции и* условия максимума (10.64) при u=0me V следует ф*(0, ><ф*(0, В-0,ч}=0, 0</<7\ ... .. (10.71) Поэтому равенство (10.70) влечет неравенство ф* (Т)у*(Т) ^0, ко- торое вместе с (10.69) дает т V(f)y*(T)= f <Ф*(П. В«*(О> <И=0. Здесь подынтегральная функция согласно неравенству (10.71) не отрицательна, а значит, равенство интеграла нулю влечет (Ф*(/), Bu*(O)=0, t Отсюда и из равенства (10.64) следует, что линейная функция <Ф*(/), Ви} переменного и в точке н=0та достигает на множестве U своего наибольшего значения, равного нулю. Согласно предположениям теоремы, существует отрезок, при- надлежащий U, который параллелен некоторой координатной оси и содержит 0ffl внутри себя. Обозначим концы этого отрезка через и' и «" и будем считать, что он параллелен Лй координатной оси. В силу доказанного линейная функция с(н)=<ф*(0. Ви> в точке и=0м достигает максимума, равного нулю, В этом слу- чае с(и)=?0 для всех точек отрезка, соединяющего точки и' и п", в частности для и=и\ и=и": <<?*(/), Ви,) = «(П, Г </<Г. Отсюда S(«'-u"))=0, Так как у вектора и'—и" только f-я компонента отлична от нуля, то нз последнего равенства получаем <Ф*(О. Ве6))=0, t <i<T. (10.72) 331
Дифференцируя последнее равенство по t, находим / , Ве<'»\ = -<^*(0. Ве«1)=0, \ d ✓ ИЛИ <!*(/), ДВе<О}=0, Г <7<Г. (10.73) Аналогично, последовательно дифференцируя, получаем равенства <Ф*(О, A2£et'))=O, Г<7<7\ (ф*(0, Ая-1Яе<'»)=01 Г</<7\ (10.74) Равенства (10.72) — (10.74) означают, что вектор ф*(0 ортогона- лен каждому вектору системы векторов (10.66) при всех 7]. Но данная система векторов образует базис в пространстве Rn; следовательно, ф* (/) =0п,Т^/^Т. Это противоречит тому, что ф* -г- ненулевое решение системы (10.61). Замечание. При доказательстве теоремы не было использо- вано условие (10.63), поскольку это неравенство в рассматрива- емой задаче выполняется автоматически. Действительно, из (10.71) при 1=Т, так как </(1>=#*(Г)=0я, получаем ('^(Т1), Ау*(Т)-|-В«*(7)) >0, т. е. неравенство (10.63) выполняется в конечный момент времени t=T. Но выполнение условия 4) теоремы 10.1 при t=T влечет его справедливость для всех /^[0, 7] (см. п. 1, § 10.2). Поэтому из по- лученного вытекает неравенство (10.63). Таким образом, для рас- сматриваемой задачи условие (10.63) из формулировки принципа максимума можно исключить, так как оно является следствием ос- тальных условий. 3. Существование, единственность и структура оптимального уп- равления. При решении задач оптимального управления важно за- ранее знать, что найденная с помощью принципа максимума экс- тремаль Понтрягина (т. е. управление, удовлетворяющее всем ус- ловиям принципа максимума) единственна и, кроме того, что оп- тимальное управление существует. В таком случае процедура по- иска оптимального управления упрощается: нужно найти какую- нибудь экстремаль Понтрягина; она и будет оптимальным уп- равлением. В следующем ниже утверждении [5, 20] сформулирова- ны условия, гарантирующие единственность экстремали Понтряги- на и существование оптимального управления в линейной задаче оптимального быстродействия; кроме того, раскрывается структура оптимального управления. Теорема 10.6. Будем считать, что выполнены все предположе- ния теоремы 10.5 и, кроме того, начало координат 0т является внут- ренней точкой параллелепипеда U вида (10.65) (последнее заведо- мо выполняется, если ц,<0, 0х>О, (=1, 2..т). 332
I. Пусть для 0<«eRn существует некоторое допустимое управле- ние, переводящее систему (10.60) из этой точки в начало коорди- нат On* Тогда существует единственное допустимое управление и*, которое переводит систему из в 0» и удовлетворяет условиям принципа максимума; это управление и* является оптимальным. Каждая компонента вектор-функции и* представляет собой кусоч- но-постоянную функцию, принимающую значения а, или р, (см. равенство (10.65)). При этом если все собственные числа матрицы А оказываются вещественными, то компоненты вектор-функции и* имеют не более чем п промежутков постоянства. II. Пусть вещественные части всех собственных чисел матрицы А отрицательны. Тогда для каждого начального состояния y^eR11 существует единственное допустимое управление и*, обладающее всеми свойствами, указанными в первой части теоремы. В первой части теоремы утверждается, что если систему (10.60) из точки у^ можно перевести в начало координат 0п, то из yfo воз- можен и оптимальный в смысле быстродействия переход в начало координат. При этом оптимальное управление может быть найдено с помощью принципа максимума: отыскав какую-нибудь экстре- маль Понтрягина и*, переводящую систему из у& в 0Л, можно быть уверенным в том, что других, отличных от и* экстремалей нет н, кроме того, что эта экстремаль является оптимальным управлени- ем. Более того, в теореме описана структура оптимального управ- ления— это вектор-функция с кусочно-постоянными компонентами, имеющими конечное число точек разрыва. Эти точки разрыва назы- вают точками переключения управления. В них происходит скач- кообразное изменение какой-нибудь компоненты управления от наименьшего возможного до наибольшего возможного значения или наоборот. Например, Ля компонента может изменять свое значение с а/ на р, или же с р( на л,-. Далее, если все собственные числа мат- рицы А вещественны, то, как утверждает теорема, у каждой ком- поненты вектор-функции и* точек переключения не может быть больше чем п—1. При выполнении всех предположений первой части теоремы в фазовом пространстве Rn могут быть точки, из которых перевес- ти систему (10.60) в начало координат невозможно. Однако если вещественные части всех собственных чисел матрицы А отрица- тельны, то в силу второй части теоремы из любой точки фазового пространства система может быть переведена в начало координат оптимальным в смысле быстродействия образом. При этом опти- мальное управление находят также с помощью принципа максиму- ма и оно имеет указанную выше структуру. § 10.Б. ПРИКЛАДНЫЕ ЗАДАЧИ 1. Задача на минимум критических размеров ядерного реактора на тепловых нейтронах. Схематически представим ядерный реак- тор в виде пространственной области Q, которая заполнена замед- лителем. Распределение замедлителя считаем однородным. В обла- 333
сти Q произвольным образом распределены атомы урана (ядерное горючее), которые при ядер них превращениях испускают нейтроны. Одни из этих нейтронов сталкиваются с ядрами урана, вызывая их расщепление, другие же при движении в замедлителе теряют зна- чительную часть своей энергии и в дальнейшем либо поглощаются ядрами урайа (не вызывая нх расщепления), либо продолжают пе- ремещаться в замедлителе. Нейтроны последнего типа называются тепловыми. Установившийся процесс диффузии тепловых нейтронов в ядер- ном реакторе описывается уравнением Дл (Л1)-|-а2п(Л1)=0, (10.75) где MeQ, л (Л!) —плотность тепловых нейтронов в точке М внут- ри реактора. Согласно физическому смыслу, п(М)^0 при AfeQ и п(М) должна быть ограничена. Величину а2 называют лапласиа- ном или материальным параметром. Рассмотрим задачу на мини- мум критических размеров простейшего реактора, имеющего фор- му шара. Учитывая сферическую симметрию задачи, поместим нача- ло координат в центр шара. Уравнение (10.75) в сферических ко- ординатах имеет вид — \ а2П=о. (10.76> dr \ dr / Предположим, что за пределами области Q, занимаемой реакто- ром, находится вакуум, т. е. тепловые нейтроны беспрепятственно уходят с границы 5 области О. Поэтому граничное условие для уравнения (10.76) имеет вид я(/?)=0, (10.77) где R — радиус шарового реактора. Условие (10.77) является вы- ражением непрерывности функция п(М) во всем пространстве. Параметр а2 в уравнениях (10.75) и (10.76) зависит от коэф- фициента размножения нейтронов. Этот коэффициент, в свою оче- редь, пропорционален концентрации источников нейтронов (горю- чего в реакторе), поэтому можно положить a2su(r), где функция и (г) пропорциональна концентрации горючего в точке г. Концентра- ция горючего в реакторе — положительная ограниченная величина, поэтому на функцию и (г) необходимо наложить ограничение О<0(г><в1Я|К. (10.78) Теперь можно сформулировать задачу оптимизации. Она состо- ит в отыскании такого распределения горючего в реакторе, т. е. та- кой функции и (г), удовлетворяющей условию (10.78), чтобы при наличии нетривиального решения уравнения (10.76) реактор имел минимально возможный размер, т. е. функционал л 1 (u)= j* dr=/?(«) (10.79) 6 334
имел минимальное значение. Формально это задача на «быстро- действие», поскольку функционал имеет вид /=Г, где /=г, T=R. Уравнение (10.75), описывающее распределение нейтронов, не яв- ляется линейным, так как содержит произведение a2n^u(/)n(r). Для нелинейных систем в общем случае нет универсального метода решения задачи оптимального быстродействия, подобного методу, изложенному в § 10.4. Однако рассматриваемая задача имеет про- стой вид и ее можно решить с помощью тех же рассуждений, кото- рые привели к общему алгоритму в линейном случае. При этом «управляющая» (в данном случае нет процесса, развивающегося во времени, поэтому этот термин можно использовать только услов- но) функция и (г), как и в линейном случае, является кусочно-посто- янной СО значениями 0 ИЛИ Umax. Введем замену гп=х, тогда (10.76) принимает вид ^^-+«(г)х(г)=0. (10.80) Полагая x=Xi и -^-=хг, получаем систему уравнений dr -^-= ~««1- (Ю-81) dr dr Граничные условия для этой системы имеют вид х1(/?)=0, ^(0=0. (10.82) Первое из этих условий следует из (10.77), а второе — из условия ограниченности и (г) при г=0. Таким образом, получена стандартная задача оптимального уп- равления по быстродействию для уравнений (10.81) с граничными условиями (10.82). Составим функцию, участвующую в равенстве (10.64): /7= <ф(П, £к(/))=^-ахЛ. (10.83) где и ф2 удовлетворяют соответственно уравнениям -2*=^, -2Ь.= -ф,. , (10.84) dr d г Граничные условия (10.82) относятся только к одной фазовой переменной хь поэтому задача имеет подвижные концы (х2 в на- чальной и конечной точке произвольно). Условия трансверсально- сти в этом случае определяют граничные условия для функции ’pat'') о2(/?)^0, ф2(0)=0. (10.85) Из уравнений (10.84) следует, что функция ф2 удовлетворяет уравнению d^^'a dr* 335
Такому же уравнению удовлетворяет и функция Xi(r). Учитывая, что и функции Х((г) и фз (г) имеют нулевые граничные условия, ус- танавливаем, что они отличаются только множителем фа(г) = = Cxi(r), где С=const. При этом функция /? принимает вид //=jf2<h —Сил?. Поскольку величина CxL2 положительна при всех ге[О, £], для то- го чтобы функция Я принимала максимальные значения при каж- дом г, необходимо положить и(г)=0, если С>»0, и u(r)sumax, если С<0. Случай и (г) s0 приводит к тривиальному решению х(г) =0, которое означает отсутствие распада ядер урана в реакто- ре. Рассмотрим случай u(r)=umaT) Из (10.81) найдем X! (г)=С, sin /^г. С, > 0. Постоянная C( не может быть конкретизирована в рамках рас- смотренной простейшей стационарной модели реактора. Уточнить величину С} можно с помощью нестационарной модели, описыва- ющей процесс нарастания плотности нейтронов в реакторе от на- чального нулевого значения до значения, соответствующего стацио- нарному режиму. Величину R определяют из граничного условия Xi (/?) =0. Что- бы это условие было выполнено, необходимо положить /?=л/угй^’. (10.86) Величина R и является минимально возможной. Полученный результат (для обеспечения минимальности разме- ров реактора необходимо взять во всем объеме реактора макси- мально возможную плотность горючего) тривиален с физической точки зрения. 2. Задача на минимум критических размеров ядерного реактора при заданной общей загрузке топлива в реакторе. По физическому смыслу эта задача аналогична предыдущей. Необходимо найти вид распределения горючего в реакторе, при котором в реакторе идет ядерная реакция (п(г)=0) и радиус реактора минимален. Основ- ное отличие состоит в том, что общее количество топлива, загружа- емого в реактор, считают заданным. Этот факт можно выразить с помощью условия R Ctt(r)dr=/0=const. (10.87) i Кроме того, для придания задаче большей общности заменим огра- ничения (10.78) на следующие: «тю < « И < (10.88) Формально рассматриваемая задача по-прежнему является задачей на быстродействие с функционалом (10.79), ограничениями (10.88) на значения управляющей функции и интегральным ограниченней' 336
(10.87). Чтобы задача имела физический смысл, необходимо нало- жить ограничения на возможное значение величины /0 в (10.87). В предыдущей задаче общее количество топлива в реакторе опре- делялось величиной V **пш* ____ 1 = J ==*/“««• (10.89) Очевидно, ограничение (10.87) связано с необходимостью (для увеличения экономической эффективности работы реактора) умень- шить общее количество используемого топлива по сравнению со случаем, когда u(r)=umaz. Поэтому оптимизационная задача с ог- раничением (10.87) на величину общей загрузки реактора имеет смысл только если /о меньше, чем общая загрузка реактора в слу- чае u(r)sumax, т. е. если /0<лУ^ (10.90) Будем решать задачу с помощью принципа максимума. Чтобы привести ее к стандартному виду, введем дополнительную фазовую переменную хз(г) с помощью уравнения Тогда ограничение (10.87) можно учесть, вводя граничные условия для л'з(г) в виде х3(0) =0, л3(7?)=/0. (10.92) Фазовые переменные х} (г) и х2(г) те же, что и в первой задаче. Объединяя уравнения (10.81) и (10.91), получаем, что уравнения, описывающие распределение нейтронов в реакторе, имеют вид -^-=*2. ~=uxl, (10.93) dr dr dr В стандартной постановке задача оптимизации ядер кого реакто- ра выглядит следующим образом: требуется найти функцию и (г), 0^г^/?, удовлетворяющую условию (10.88), такую, что соответст- вующая траектория х(г) = (jcj (г), х2(г), х3(г)) в фазовом простран- стве Я3 проходит при г=0 через прямую, определяемую усло- виями Х1(0)=0, х3(0)=0, (10.94) а при r=R — через прямую, которая определяется условиями х1(/?) = 0, х3(7?)=/0. (10.95) При этом функционал я /(и)= f dr=/?(«) в должен, принять минимально возможное (среди таких функций и (г)) значение. 337
Это задача оптимального быстродействия с подвижными кон- цами, так как на обоих концах фазовой траектории системы коор* дината является произвольной. Поскольку второе из уравнений (10.93) нелинейно, в данном случае, вообще говоря, не справедли- вы теоремы, установленные для оптимальных быстродействий (см. § 10.4), однако метод решения оптимизационной задачи тот же, что и в линейном случае. Чтобы применить принцип максимума, введем функцию Я: Н — -J- «*3, (10.96) где функции ф1, ф2, фз удовлетворяют уравнениям -^-= -Ф1. -^-=0- (10.97) аг аг аг Из условий трансверсальности вытекают граничные условия для функций ф2: ♦»(0)=0, 1>,(/й=0. (10.98) Для нахождения оптимального управления и (г) преобразуем Я к более удобному виду. Сравнивая уравнения для х2 и фь ф2 и граничные условия для xi и ф2, получаем, что имеет место одно из соотношений ф2 (г) = — Xi (Г), (Г) = х2 (Г) или ф2(г)=Л1 (г), ф, (г) = —х2(г). В соответствии с этим из (10.96) имеем /?=♦№+«(—ФгХ1+Фз)=’М2+“1±*1+Фз] . (10.99) (10.100) (10.101) где знак плюс соответствует случаю (10.99), а знак минус — слу- чаю (10.100). Из (10.101) нетрудно получить, что Я будет при каждом г максимальным, если u(r)=umax при <p(xi, фз) = ±*124- +Фз>0 и w(r)=Umin при ф(хь ф3) >0. Функцию ф(хь фз) называ- ют функцией переключения, ее нули определяют точки, в которых и (г) испытывает скачок ОТ Umai к Umin или ОТ t/mln к Umax. ФуНКЦИЯ и(г) является кусочно-постоянной. Чтобы выяснить более конкрет- ный вид этой функции, необходимо исследовать функцию переклю- чения ф(хь фз). Количество точек, где функция ф изменяет знак, зависит от зна- ка xl и от значения постоянной ф3 (то, что фа=const, следует из третьего уравнения (10.97)). Учитывая, что график функций Л](г) имеет синусоидальный вид и Х1(0)=х(Я) — 0, получаем, что либо на интервале Q<.r<CR вообще нет точек, где функция ф(хь фз) из- меняет знак, либо имеются две такие точки. В первом случае получим такое же решение, как и в первой за- даче: u(r)=Umaxt Q^r^R. Однако в настоящей задаче такое и (г) 338
не является оптимальным, поскольку не удовлетворено граничное условие хэ (7?)== Действительно, из (10.89) и (10.91) следует, что при u (г) =uinax имеем x3(R)=л у //1Пвх > /0. Таким образом, функция переключения обязательно должна иметь две точки перемены знака. При этом возможны следующие два варианта: а) фз<0 и выполнено соотношение (10.99), т. е. в выражении (10.101) перед Xi2 стоит знак 4-. Учитывая граничные условия (10.94), получаем ф(хь фз)<0 при 0<г<п, далее ф>0 при ri<Zr<Zr^ и снова ф<0 при г2<г</?. Здесь гь г2— точки внутри отрезка [0, /?]. Из принципа максимума следует, что оптимальное управление u(r) имеет следующий вид: ц(г)=цт1п при 0<г<Г|, u(r) =«тат при г]<г<г2 и u(r)=urajn при r2<.r<R\ б) фз>0 и выполнено соотношение (10.100), т. е. в выражении (10.101) перед xia стоит знак «—». Здесь ф>0 при 0<г<гь далее <р<0 при Г|<г<га и снова ф>0 при r2<r<R (величины ri и г2 имеют другие значения по сравнению с первым случаем). Из прин- ципа максимума следует: и{г)=^итах при 0<г<г>, u(r)=umin при Г1<г<г2 и u(r)=Wmax ПрИ Г2<Г<Я. Остается определить точки rt и г2, в которых функция изменяет знак, и установить, когда каждый из вариантов является истинно оптимальным, т. е. позволяет получить наименьшее значение ради- уса реактора R. Для определения г> и г2 необходимо решить уравнения (10.93) для фазовых переменных х((г) и х2(г). Чтобы учесть сразу случаи а) н б), положим: и(г)=и( при 0<г<Л|, и(г)—и2 при r^rcrs л u—U] при r2<.r,<.R. В случае а) имеем u2=umax; в случае б) получаем Ui=umax, U2=Wmjn- Для простоты положим |фэ| = 1. Тогда из уравнения ---- = UX, dr? и граничных условий Х|(0)=0, x1(r1) = l, xi(r2) = l, Х1(Я)=0 мож- но найти вид Xi (г) в каждой области реактора: 1/2 (г)= Sm го Г при 0< г < гj; (ЮЛ02) sin и[- ’ri COS ву <г) -------------7 ПРИ Г1 < г < (10-103) • CDS <4 (r2—г1) sin л}'2(/? — г> п *1(П= . L-----------—при г2<г</?. (10.104) г2) Поскольку из (10.93) следует, что фазовая переменная х2(г) является производной по г от Х| (г), получаем: 1/2 1/2 х2(г) = tt-* С°.5 “* при 0 < г < Гр (10.105) Sinuj'V! 339
(10.106) (10.107) иУ2 sin <4^(г2 — г) ха(г) ==------------— при rt < cosuj^(r2 —и) вУ2 cosuj^(/? — г) Х2(г)=---------П5—-----— При г2 2 sin в}*3 (Л-г*) г 2 Теперь величины л. г2 и R можно определить из трех алгебраи- ческих уравнений: двух уравнений, определяющих непрерывность функции х2(г) в точках и и г2 (непрерывность функции Х((г) сле- дует из непрерывности функции хг(г)> а непрерывность функции Ха (г) следует из третьего уравнения (10.93)), и соотношения (10.87). Из условия непрерывности х2(г) в точках rt и г2 получаем (10.108) (10.109) Соотношение (10.87) для рассматриваемого трехфазного рас- пределения ядерного горючего реактора имеет вид 0=/ — i4'2ctg u^tR—r2). (10.110) Из (10.109) следует, что (10.111) Принимая во внимание (10.111), из соотношения (10.110) имеем г2-г1=-------------------. (10.112) Подставляя г2—rt в правую часть соотношения (10.108), получаем уравнение для определения г(: /0 — uifj — . (10.113) Из этого уравнения можно найти г< (с помощью численных ме- тодов). Затем из (10.112) получаем г2, а из (10.111) —оптимальное значение величины R. Условий, из которых можно было бы опре- делить, какой из вариантов является истинно оптимальным, нет. Поэтому в каждом конкретном случае необходимо непосредственно вычислять R как в случае а), так и в случае б) и сравнивать полу- ченные значения. Рассмотрим конкретный пример. Пусть wm[Q=— и /0= 4 =— nwJi- Вэтом случае нет необходимости вычислять значениеп. 340
Воспользуемся для варианта б) формулой (10.112): 1 1 ,-о 1 1/2 1 1/2 /о-щгу-ули;-2 — "“„„-«тмП --£-Л«т'ах "^“«тах 4 + г1= —Зг р Очевидно, что полученный результат не имеет смысла, и можно ут- верждать, что оптимальное решение дает-вариант а). Используя для этого варианта формулу (10.112), имеем -у ««Hi - 4" «т«г1 “ 4" Г* «max Из формулы (10.111) следует, что I 3,1 -1/2 hri—“7"г 1 ”1—~л~• 4 4 и1'2 “max Зл 4Л5" тетах где п находится из уравнения (10.113), которое принимает вид 3. Задача об оптимальном распределении температуры вдоль проходной печи, предназначенной для нагрева металла. Металл непрерывной лентой входит в печь и движется с постоянной ско- ростью о. На выходе из печи металл имеет постоянную температу- ру 0О. В общей постановке задача оптимизации состоит в выборе такого распределения температуры Т(х), стенок печи, чтобы на выходе металл был нагрет до заданной температуры 0l и при этом количество топлива, затраченного на нагрев, было мини- мальным. Прежде всего дадим строгую математическую постановку зада- чи оптимизации. Для этого выведем уравнение, описывающее про- цесс нагрева металла внутри печи, и установим вид функционала, который задает расход топлива. Распределение температуры Т(х) стенок печи будем считать стационарным. Входная температура металла;0О также неизменна во времени, поэтому распределение температуры 0 металла по длине печи будет стационарным: 0= = 6(х). Рассмотрим тепловой баланс малого элемента dV объема металла, движущегося со скоростью v внутри Печи. Согласно зако- ну сохранения энергии, dQ=du, где dQ— теплота, переданная от стенок печи к элементу металла за время d/, du — приращение внут- ренней энергии элемента металла. Эти приращения можно выра- зить следующим образом: dQ=[Т (х)—0 (х)| k d/ dm, du=cdO(x) dm, где k — коэффициент теплопередачи от стенки к металлу; с — теп- 341
лоемкость металла; dm — масса рассматриваемого элемента объ- ема металла; d0(x)—приращение температуры рассматриваемого элемента. Приравнивая правые части этих соотношений и исполь- ,. dx зуя равенство аг= —. получаем v d0dm —(Г—fl)k d/л, v откуда Л — = Г-б. (10.114) ,dx Здесь h=cu/k (h имеет размерность длины). Полученное уравне- ние описывает распределение 6(х) температуры металла в лечи. Для получения функционала, выражающего расход топлива, используем формулу для приращения энтальпии 1 (теплосодержа- ния единицы массы металла): d/ (x)=cdfl(jt)=T](jc)^dG(x), (10.115) где /(х) —энтальпия единицы массы металла в точке х; —кало- рийность расходуемого топлива; т] (х)—коэффициент полезного использования топлива; <7(х) — расход топлива на всей длине пе- чи от точки входа до точки х. Коэффициент полезного использова- ния топлива г] зависит от температуры 7(х), при которой идет на- грев, и определяется по формуле Ш)=хр—^1. (10.116) где х — температурный коэффициент полезного использования топ- лива; Т*— характерная температура, имеющая смысл максималь- но возможной для данного топлива температуры нагрева (т)(х) — = 0 при Г(х) = 7’*, т. е. использование топлива приводит к нулево- му тепловому эффекту). Таким образом, температура 7(х) должна удовлетворять следующему условию: 0<Г(х)<Г*. (10.117) Подставляя (10.116) в (10.115) н интегрируя по х от 0 до L, на- ходим, что общий расход топлива в печи G можно вычислить сле- дующим образом: L Q -_- [ с d 6 (х) о Ях[1--!£>] ’ Используя уравнение (10.114), преобразуем эту формулу к виду C=;r4r(x)-B(x)]d (10.118) J Т* — Т (х) где р=Т*с/(хЯ). 342
Теперь перейдем к строгой постановке задачи оптимизации. Не- обходимо найти функцию Т(х), удовлетворяющую условию (10.117) и такую, чтобы соответствующая фазовая траектория 9(х), О^х^ определяемая из уравнения (10.114), с граничным условием е(л)|Л-о=6о, (10.119) удовлетворяла также условию б(л) | (10.120) При этом необходимо, чтобы функционал (10.118) принял наимень- шее возможное значение. Решим эту задачу с помощью принципа максимума. Запишем уравнение (10.114) в следующем виде: -^-=—(7’-б). (10.121) dx h Это фазовое уравнение системы. В соответствии с формулой (2.3) имеем (10.122) Согласно принципу максимума, фо^О. а функция ф определяется из уравнения dip____дН ___ фр? ______4 dx Л ~ Г* —Г ‘ Л ' Если фо=0, то, как отмечалось в § 10.2, имеет место особая задача оптимального управления. В данной задаче случай ф0=0 не имеет физического смысла и его из дальнейшего рассмотрения можно ис- ключить. Полагая ф0=—1, получаем /М *'~^т +»-Ь(Г-»>, (10.123) где функция ф(х) удовлетворяет уравнению Дф = __Р [ _Ф_ d х Т*-ТГ h‘ (10.124) Теперь найдем функцию Т'(х), которая при каждом х максими- зирует функцию И. Это — сложная задача, поскольку учитывается условие (10.117). Однако можно внести некоторые естественные с физической точки зрения упрощающие предположения. В действи- тельности предельная температура Т», при которой тепловой эф- фект использования топлива сводится к нулю, велика. Поэтому ог- раничение Т(х) ^7* лишнее, так как все реальные режимы работы печи ему удовлетворяют. Ограничение Т(х)^0 также лишено со- держания, так как случай 7(х) <0 в данной задаче не имеет физи- ческого смысла (предполагаем, конечно, что 0o<0l). Таким обра- 343
зом, можно считать, что при каждом х значение Т(л), реализующее максимум функции Я, находится внутри отрезка [О, Т*]. В этом слу- чае величину Г(х), максимизирующую функцию Н, можно найти, приравнивая нулю частную производную от Я по 7: ЙГ Г(Т* -7)2 * h Решая это уравнение относительно 71, получаем у1—7** + 1/^__ -Г ф Согласно сделанному выше предположению, Г^Т*, поэтому Т=Т*- \/ . (10.125) “ ф Проверим, что Т реализует именно максимум (а не минимум) функции Н. Вычислим вторую производную от Н по Т: &W _ 2? (-7* 4-6) ЙГ2 ~~ {Т* — 7)3 ' ’ Так как Т‘^7 и 7*^'0, то dW/dP-cO, т. е. функция (10.125) дей- ствительно максимизирует функцию Н. С помощью (10.125) можно записать замкнутую систему урав- нений для определения функций 0(х) и ф(л), соответствующих оп- тимальному режиму. Подставив (10.125) в (10.121) и (10.124), по- лучим систему уравнений: (Г * - ») - ’ (10.126) dr Л г Лф * -^-= -1^ ------------Н— • (10.127) dx F Л(Т*-«) ' Л ' Граничными для этой системы являются условия (10.119), (10.120). Уравнения (10.126) и (10.127) нелинейные. Нелинейные уравнения редко удается решить аналитически, однако в данном случае это возможно, так как уравнение для функции 0(х) можно свести к ли- нейному. Умножим уравнение (10.126) на ф, а уравнение (10.127) — на Т*—0 и вычтем почленно второе уравнение из первого. Получим —(Г*-в)-^-=О, Ах dx или -г-К>(Г»-»)]=о. аг Отсюда непосредственно имеем (^^(Г* — e)=y==const. (10.128) 344
Из выражения (10.125) для функции Т следует, что функции ф и Г*—в имеют одинаковый знак во всех точках xe(0, L] (иначе под- коренное выражение будет отрицательным). Поэтому в (10.128) у>0. С помощью функции (10.128) уравнение (10.126) можно свести к линейному. Подставив ф=>у/(Г*-—0), получим Ч-IT»-е> /₽ЛЛу)? dx к или Запишем решение линейного уравнения: 6 (л)=Г* -f-Ct е“ (10.129) где С2= 1/у^у. Постоянные Ci и С2 определим из граничных ус- ловий (10.119) и (10.120), из которых следуют уравнения 7'*-|-С1=60, r*+c,e-^-c-/6s)£=et. Выразим из первого уравнения Ci=8o—Т* и подставим это выра- жение во второе уравнение: (вс - 7*) ~ с‘ £=в£ - Т*. Отсюда находим с==/-7в+т/т’пТ=^'- (10Л30) пр л, ' р 8q — / Подставив выражение (10.130) и С|=6—Т* в (10.129), получим в(X)=Т*+(во-7«)е1-Т•+(в0-Т*)( . \ up — Т* J (10.131) Выражение для оптимального распределения Т(х) можно полу- чить с помощью уравнения (10.114). Подставляя в это уравнение выражение (10.131) для функции Э(х), находим Т (^^+«(х)=А (во1- Г*) In I *£~^yzI+ dx L «0“ r* \ 9q—T* / +r*+(^-r.)(^r_f£ = \ 4) — • I =r»+(Oc-r»)(Ain^^+1^^ZLp. (10.132) 345
Из выражений (10.131) и (10.132) следует, что функции 0(х) и Т(х) удовлетворяют условиям 0^0 (х)^ Т* и О^Г(х) ^7*. В заключение определим минимальное значение функционала (10.118), соответствующее оптимальному распределению (10.132) температуры вдоль печи, т. е. минимальный расход топлива, обес- печивающий нагрев металла от температуры 0О до температуры 0l. Подставляя выражения (10.131), (10.132) в (10.118), вычислим ' (в0-?*)-£-In 2-1 OmIn = I P---------ту----------------dx= О (во “ Г*) ( — Q-l + 1) рл In 2-1 ---In Q— 1 4- 1 L pft In 2 1 — -Г" In 2 где ft =(0O—T-)/(0L—T*). Подчеркнем, что данную задачу удалось решить аналитически лишь потому, что ограничение (10.117) оказалось лишним. С другими задачам if оптимизации процессов нагрева металла в различных печах можно ознакомиться в кн.: А. Г. Бутковский, С. А. Малый, Ю. Н. Андреев. Оптимальное управление нагревом ме- талла.— М.: Металлургия, 1972. Глава 11 СИНТЕЗ ОПТИМАЛЬНЫХ УПРАВЛЕНИЯ Формализация повышенных требований к решению задачи оп- тимального управления, учитывающих дальнейшую техническую реализацию, приводит к постановке задачи синтеза оптимальных управлений и к понятию оптимального синтезирующего управле- ния. В настоящее время не существует эффективного метода реше- ния задач синтеза из-за их чрезвычайной сложности. В простых случаях это решение возможно на основе принципа максимума или метода динамического программирования, излагаемого в данной главе. Для изучения материала главы необходимо предварительно ознакомиться с основными понятиями теории оптимального управ- ления, изложенными в предыдущей главе. § 11.1. ПОНЯТИЕ СИНТЕЗИРУЮЩЕГО УПРАВЛЕНИЯ 1. Программные управления и функция Белл мана. Рассмотрим задачу оптимального управления неавтономной системой (в вектор- ной форме) У. «). (11.1) dr 346
где начальный to и конечный Т моменты времени фиксированы * с дополнительным условием уЮ(=5(0<= Rs (П.2) которое называют фазовым ограничением. Будем считать, что при t=tQ множество S (0 состоит из одной точки, т. е. Таким образом, задача управления заключается в переводе систе- мы из фазовой точки у& на множество $(7), причем траектория перехода в промежуточные моменты времени t0<t<T должна удовлетворять включению ^(/)eS(0c=R"- Допустимыми будем считать ’ (покомпонентно) кусочно-непре- рывные управления и, для которых выполнено условие Как и в предыдущей главе, предполагаем, что компоненты вектор- функции f из (11.1) непрерывны по совокупности переменных, при- чем каждое допустимое управление однозначно определяет (поком- понентно) кусочно-гладкое решение y=y(t)t to^t^T, системы (11.1) с начальным условием у (to) =у{0). .В качестве критерия оптимальности, подлежащего минимиза- ции, рассмотрим смешанный функционал г S(t). uawt+<b(y(r>), (И-3) содержащий интегральный й терминальный члены. Функции f0 иФ считаем непрерывными соответственно на Rn+m+1 и Rn. Сформулированную задачу оптимального управления будем на- зывать в дальнейшем исходной задачей. Она состоит в отыскании допустимого управления, минимизирующего функционал (11.3) на множестве тех допустимых управлений, у которых соответствующие нм (согласно (11.1)) траектории y=y(t) удовлетворяют фазовому ограничению (П-2). Как и в предыдущей главе, здесь целевой функционал минимизируется не на всем множестве допустимых управлений, а только на определенном его подмножестве. В част- ном случае, когда S(/) = Rn при всех te (to, 7), исходная задача превращается в задачу оптимального управления с подвижным правым концом (см. гл. 10). На основе исходной задачи введем в рассмотрение (/, у) -зада- чу, в которой начальным моментом является некоторое число t^ 7), а начальным состоянием — некоторый вектор y—y(t)^ Ц^=/(г. S(t). «(«)). <3т * Вводимые в этом разделе понятия сохраняют свою силу и в случае, когда Т не фиксировано, но лежит в пределах при некотором Л>^о- 347
!/(0=у; У(т)е5(т), в(т)е(/, с функционалом т I&\i> У)=^/о^ У(Ъ tt(t))dt+0(y(D), который следует минимизировать. Здесь во избежание путаницы для обозначения текущего времени использована буква т. Для каж- дой (f, у) -задачи считаем выполненными все предположения, ана- логичные соответствующим предположениям исходной задачи. Не- трудно видеть, что (/о, J/*0’) -задача точно совпадает с исходной за- дачей оптимального управления, сформулированный выше. При fe(/o, Т) и y^S(t) введенная (/, у) -задача аналогична исходной, но сформулирована применительно к некоторым начальным дан- ным у, являющимся как бы «промежуточными» для исходной за- дачи. Будем считать, что для каждой указанной выше пары точек (t, у) введенная (t, у)-задача обладает оптимальным управлением и*(-с) (точнее было бы писать у)). Такое управление назы- вают оптимальным программным управлением, поскольку функция и* задана на всем отрезке (/, Т] и заранее известны («запрограмми- рованы») значения управления во все моменты времени Одновременно «запрограммированными» оказываются все проме- жуточные состояния, через которые проходит система во время про- цесса управления. В силу сделанного выше предположения о существовании опти- мального программного управления каждой паре точек (/, у), где 7], y^S(t), можно поставить в соответствие определенное число, а именно минимальное значение функционала / на опти- мальном программном управлении, т. е. 7(u*|f, у). Тем самым на множестве указанных пар определена следующая функция: V (/, у)=min /(и | t, у), и Эту функцию называют функцией Беллмана. При t=T и y^S(T), согласно определению функционала 1 в виде равенства (11.3), ес- тественно положить V(T, у) =Ф (у]. Очевидно, V (t0, у<0)) — оптимальное значение функционала ис- ходной задачи: V(to, у<М) —I(и*). 2. Задача синтеза оптимальных управлений. Если найдены опти- мальное (программное) управление и* и соответствующая ему оп- тимальная траектория у* для исходной задачи оптимального управ- ления из п. 1, то эту задачу с математической точки зрения можно считать решенной. Однако это решение обладает существенным с точки зрения практики недостатком: оно не учитывает возможность появления внешних непредсказуемых возмущений, способных изме- нить «запрограммированный» ход управляемого процесса. Напри- 348
мер, если в некоторый момент времени tei[£o, Л систем а пол лей- стянем внешнего .возмущения скачкообразно перешла ы* Ji 1 в некоторое долгое состояние ite*S (*). р-Иф' (! L1 станем внешнего .возмущения скачкообпазно перешла из состояния, $• Ji) в некоторое другое состояние' (Лч У ’ (Л * то управление, ««•'у),, ЬС^Т уже, вообще говоря, не является оптимальным для паря (J, J), з значит, оно не будет оптимальным и при Болев' того,. может случиться и. там, что кару питон фазовое огряни- Значительно более удобным с практической точки зрения явля- ется такая управляющая функция, которая, указывает значение оптимального управления для каждой цари (£, «) вида te(£D, F,, p^S(O_. Это уже функция как времени, так и состояния, т, е «у)., С ее по- мощью, зная текущий момент времени и текущее состояв не системы, можно вычислить соответствующее оитималъ» ние управление. 3 таком случае тех- ническая реализация процесса управ- ления осуществляется без участия че- ловека по схеме с обратной связью (рис,.. 1L1). В момент времени £ изме- ряется и подается на ЭВМ информа- ция о текущем гостояани системы1 у(/} и по формуле #(£)=* = xj(f, y(i|J вычисляется оптимальное значение управления,. Затем полученное значение Ц£) реализуется непьян отельным механиз- мом управляемой системы1. Таким обратом, при любом внешнем возмущении будет автоматически устанавливаться оптимальный переходный режим. Функцию л—определенную для всех лар (/, $) вида £е[£ь Г], cg значениями из множества У, будем называть одгшш ламой садтезцррющей (одоздшльным оямтедарр'- юц'Дд ^рпв^нивм} Мая исходной задачи,, если для каждой пары (£» fepm, Г), (£), выполняются следующие требования: система дифференциальных уравнений имеет единственное (покомпонентно) кусочно-гладкое решен и,е, ко- торое обозначим через р(т)|, удовлетворяющее начальному усло- вна $(/) =£' и включению /СтС^; 6J функция виде (1(т) = ы j, ^(т)) (покомпонентно) куеочно*не- прерывна на отрезке У, И; в) функция й(т) является оптимальным программным управле- нием длй (£, -за дач и. Первые два требования обёепечмвают корректность определен мня гпнтезируЮ'Ще'й функции Требование в) гарантирует, что для каждой пары; (£„'.у) значение синтезирующей функции совпадает с соответствующим значением оптимального управления. При условии, что во иремя процесса ул р зелен ня не произойдет' 349
никаких «незапрограммированных» изменений состояния системы, оптимальное синтезирующее управление й, как видно из приведен- ного выше определения, совпадает с некоторым оптимальным про- граммным управлением и*: u*(t, для всех Т) Если же в некоторый момент Т) под действием внешнего воз- мущения система перейдет из состояния у{1) в другое состояние у, то использование оптимальной синтезирующей функции приве- дет к тому, что дальнейшее поведение системы определяет также оптимальное программное управление, ио уже относительно новой лары (I, у). Тем самым после изменения состояния системы про- изойдет перестройка управления на оптимальный режим. На практике измерение текущего состояния системы, вычисле- ние значения оптимального управления и его реализацию невоз- можно осуществить в один и тот же момент времени t. Как пра- вило, корректировка управления происходит с некоторым запазды- ванием. Однако для широкого класса практических задач указанные действия выполняются за короткий промежуток времени, и по- этому рассматриваемая здесь математическая модель довольно точ- но описывает реальные процессы. Решение задачи синтеза состоит в нахождении решения семей- ства (/, у) -задач при T)t y^S(t}. В результате будет получе- но оптимальное программное управление и—и(тр, у), как функ- ция текущего момента времени т и зависящая от параметров I, у. Оптимальную синтезирующую функцию получают из найденного управления, отождествляя текущее время т с начальным момен- том /, т. е. «=«(/, у)=и{х 1 /, у) | Если при этом функция й(С у) оказывается корректно определен- ной в смысле требовании а) и б) из определения оптимальной син- тезирующей функции, то задачу синтеза можно считать решенной. Однако реализовать эту схему на практике удается лишь в редких случаях. В настоящее время нет общих методов решения задач синтеза. В некоторых случаях оптимальное синтезирующее управ- ление удается получить с помощью принципа максимума или ме- тода динамического программирования. 3. Стационарная синтезирующая функция. Об оптимальной син- тезирующей функции говорят, что она является стационарной, ес- ли ее значения не зависят от текущего времени, т. е. для каждого состояния у верно равенство м(/, у)==м(?, у) при всех возможных различных моментах времени t и Ожидать, что для сформулированной в п. 1 исходной задачи оп- тимального управления существует именно стационарная синтези- рующая функция, не приходится, поскольку при разных t и V вве- денные выше {/, у)- и (/', у)-задачи (при одном н том же состоя- нии у) различны, так как функции f, fa, а также множество S(t) явно зависят от t. Однако даже если исходная система автономна и, кроме того /о=/о(</, «) и S(/)=S при fa<Zt<T, то оптимальная синтезирую- 350
щая функции, как правило, не является стационарной. Это объяс- няется тем, что, поскольку конечный момент времени Т фиксиро- ван, (/, у)- и (/', у)-задачи имеют различные временные промежут- ки управления (Т—а значит, и различные оптимальные программные управления, что приводит к неравенству u{tt у). § 11.2. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ 1. Уравнение Беллмана. Вновь рассмотрим сформулированную в п. 1 § 11.1 исходную задачу оптимального управления, заключа- ющуюся в минимизации функционала (11.3) на подмножестве тех допустимых управлений, которым (согласно (11.1)) отвечают тра- ектории, удовлетворяющие фазовому ограничению (11.2). При этом конечный момент времени Т может быть фиксированным или нефиксированным (см. подстрочное замечание в п. 1 § 11.1). Наря- ду с исходной задачей в дальнейшем рассмотрении участвуют (/, у)-задача и функция Беллмана У(/, у). Все предположения, сде- ланные в п. 1 § 11.1 относительно исходной и (/, у)-задач, здесь также считаем выполненными. Обозначим через ГсНп+* область определения функции Белл- мана: Г = {(/, j/)eRn+1 I /0</<Л Теорема 11.1. Пусть (t> у) — произвольная внутренняя точка множества Г, в которой функция Беллмана предполагается диффе- ренцируемой. Предположим также, что сложная функция V(t, у(t)) дифференцируема в точке t для каждой траектории y(t) системы (11.1), удовлетворяющей фазовому ограничению и проходящей в момент t через точку у. Тогда для всех векторов u^U функция У(/, у) удовлетворяет неравенству, УД/, y)+(Vv(it у), У, а))+/о(Л У. «)>0» (11.4) где Vt=dV/dt, V„= (dV/dylt дМду2,.... dV/dyny. Если и*(т) — оптимальное управление в (t, у)-задаче, то функ- ция V(t, у) необходимо удовлетворяет дифференциальному уравне- нию в частных производных min {УД/, </)-|- <Уу(/, 0, /(/, у. у. к)|=0. (11.5) При этом для каждого оптимального управления и*(х) минимум в левой части (11.5) достигается на правостороннем пределе и —н*+ вида и+~ 11m к*(т). □ Рассмотрим произвольную точку (/, у) из внутренности мно- жества Г и произвольный вектор неU. Допустимое управление й определим формулой И(Т) = Мд/(Т)== X /<;т</+д/, д(т), /-|-Д/<Ст 351
и введем соответствующую траекторию у(т), начинающуюся в момент времени t в точке у и удовлетворяющую фазовому ограничению Здесь й(т)—оптимальное про- граммное управление в (Н-Д/, £(/-|-Д0)-задаче, а положительное число Д/ мало настолько, что (/-J-Af, y(t+M) )еГ (такое Д£ суще- ствует, поскольку (/, у} — внутренняя точка множества Г). Таким образом, в течение достаточно малого временного промежутка АД система под действием постоянного управления ц(т)= и переводит- ся по траектории </(т), /^т^/-|-Д£, в некоторую точку £(/4-Д0, а затем при т>Н-Д^ применяется оптимальное программное управ- ление й(т), которое согласно сделанному ранее предположению, су- ществует. Вычислим значение функционала /(и|/, у) на управлении й: _ г _ _ /(я I /, 0= С/0(г, у (Г). и(т))(1г+Ф(у(7'))= г+дг _ _ Г _ = ( /о(^ Я*)» «(*))<!*+ У /о(т» У(*). « (t))dt+G (7 (Г)). t ' t+ы По определению функции Веллмана, последние два слагаемых представляют собой 1/(^4-ДС у(^+Д0) и, кроме того, У(/, у(0) = = V(Z, У) !/)• Поэтому можно записать неравенство И(^,у(/))< [ А (г, ?(t), й(т))<1т4-Р'(/-|-Д/, 4-ДО), 't или после деления на положительное Д/ /+ы гРч-«.,(/ч-м»-ир.,(0)+2 г М At J t При Д £--*-}-О первое слагаемое определяет производную <ЗУ(т, у(х) )/<1т [т=t, а второе слагаемое, согласно первой интегральной теореме о среднем [16], дает f0(t, у, и), т. е. I +Л(/,!/,«)>0. <11.6) <Jt 1 Учитывая, что функция у (т) удовлетворяет системе (11-1), запишем выражение для производной более подробно: ДИ(т, у(т» I у) dr |,e< at di “Г + V ^л’ ** йУлТ =V‘(i' »>’ У- “»• dy - d t Подставляя найденное выражение в (1L6), получаем требуемое неравенство (11.4). 352
Докажем вторую часть теоремы. Пусть и* — произвольное опти- мальное программное управление в (t, у) -задаче, а у* — соответ- ствующая оптимальная траектория. Возьмем достаточно малое по- ложительное Д/ и вычислим г /(»♦ I Л 0*(Т). tt*(T))dt+®(^*(r))= t+ы т = J /о(А #•(*)» «*(T»dT+f/0(r, tt*(r))dt+ » tiu 4-ф(Р*(П). <и.7) Для рассматриваемой исходной задачи справедлив принцип оптимальности, утверждающий, что любой «кусок». оптималь- ного управления (оптимальной траектории) также является опти- мальным управлением (оптимальной траекторией). Для задач более частного вида, чем исходная, принцип оптимальности сформу- лирован и доказан в § 10.1. Проверка выполнения принципа опти- мальности для исходной задачи по сути не отличается от доказа- тельства, приведенного в § 10.1. Согласно принципу оптимальности, часть оптимальной траекто- рии у, начинающаяся в момент времени <+Д^ в точке y*(f+Af)e eRn, также является оптимальной, а значит, последние два слага- емых в (11.7) представляет собой У(/Ч-Д^, y*(t-№i)). Поэтому, учи- тывая равенство /(u* | /, у) — V(f, у*(t)), из (11.7) получаем V(t,y*{t»= ( 9*(т). tt*(T))dt+V4/+Af. У*U+A/)). * Разделим обе части равенства на Д/: У(/+Ы, + г (О) I /+ЛГ +-П- f /о<*. У*Ы «*(r))dt==0. t В пределе при Д1-»-4-0 имеем -^77^-+/о(А У*«), «+)=0, a i где и\— Ит «♦ (г). Учитывая, что у* (/) =у, запишем «-►/+0 ^(/, 50+ОМ'. у). /(Л у, 4»+/о(Л у. 4)=о. Это равенство вместе с доказанным неравенством (11.4) означа- ют, что выполнено (11.5). Уравнение в частных производных (11.5) называют уравнени- ем. динамического программирования или уравнением Беллмана. 12—339 353
Эффективных методов решения таких уравнений в настоящее вре- мя не существует. В теореме ПЛ сформулировано необходимое условие оптималь- ности, и его можно использовать для отыскания решения исходной задачи оптимального управления. Более того, как будет показано в следующем пункте, с помощью уравнения Белл мана в некоторых случаях удается построить оптимальное синтезирующее управле- ние. 2. Достаточные условия оптимального синтеза. Теорема 11.2. Пусть некоторая гладкая функция V(t, у), определенная на мно- жестве rczRn+1, представляет собой решение уравнения Веллмана (11.5) с граничным условием V(Tt у)=Ф(у) для y(=S(T). (11.8) Предположим, что минимум в (11.5) реализуется на функции u(t, У) вида u(l, y)^U для всех (t, у)еГ, причем эта функция удовлетворяет требованиям а) и б) из определения оптимальной синтезирующей функции. Тогда u(t, у) — оптимальная синтезиру- ющая функция для исходной задачи, a V(i, у) — функция Велл- мана. Рассмотрим произвольную точку (/, у)еГ. Согласно требова- нию а) из определения оптимальной синтезирующей функции, си- стема дифференциальных уравнений У, и(х, у)), ат имеет единственное кусочно-гладкое решение $(т), которое удов- летворяет следующим условиям: ^(0=У; В силу требования б) того же определения функция вида Й(т) = =н(т, #(т)) кусочно-непрерывная на отрезке [1, Т], причем ц(т)е(/ при t^x^T. Для доказательства теоремы достаточно убедиться в выполнении требования в). Введем обозначение Я(А у» Ц)=У,(А у)+(У/А у), /(А У, я))+Го(А У, л). (11.9) Выберем произвольное допустимое в (/, у)-задаче управление u(t) с соответствующей ему траекторией у(т). Так как функция У(т, у(т)) является композицией гладкой и кусочно-гладкой функ- ций, то она представляет собой кусочно-гладкую на [/, Г] функцию. Поэтому на основании (11.9) и (11.1) имеем SEfo /?(«, У(Х), «(г))-/о (г, уЮ, а(т)) dl для всех точек т отрезка [/, 7], за исключением, быть может, неко- торого их конечного числа. Отсюда, интегрируя по т в пределах от t до Т и учитывая (11.8), получаем Ф(У(Г))-У(А у(/))= [/?(г, у(т), й(т))бг- i г —JVofti У 03. «(t))dr. 354
что эквивалентно равенству /(« I /, !/)=J₽(t, w (х)) d x-|-lZ (Л у). (11.10) (Это представление целевого функционала (/, у) -задачи будет ис- пользовано ниже.) В терминах обозначения (11.9) уравнение Беллмана (11.5) мож- но записать в виде min Ж*, у, и)=0. Так как функция u(t, у), по условию, реализует минимум, то для всех векторов u^U и ^eS(x), t^x^T, имеем Ж*. У, «<т. y))=0=min/?(t, yt у, «), uet/ (11.11) Для произвольного допустимого в (/, у) -задаче управления ц(т) и соответствующей ему траектории у(т), удовлетворяющей фазово- му ограничению, выполняется включение u(x)^U при t^Zx^T. Поэтому из (11.11) следует, что ₽ (t. У (*)» «(f. У (т)))=R (г, у (т), и (т))=0 <Ж*> у(х), я(г)), (11.12) где й и £ —функции, введенные в начале доказательства. Вспоми- ная, что $(t):=y(t)=yt на основании (11.10) и (11.12) можно запи- сать неравенство /(a I Л У)—/(к I Л У)= f Ж*. 0(г), и(т))<1т—. —^'Ж*. у(т), «(r))dT y(x)t «(t))dt>0, (11.13) которое в силу произвольности управления и означает оптималь- ность управления й в (/, у) -задаче. Таким образом, u(f, у) —опти- мальная синтезирующая функция. Проверим, что функция V (/, у) действительно является функци- ей Беллмана для исходной задачи. В самом деле, из (11.13) сле- дует равенство /(« It У)—/ б I Л У)= J Ж*, £/«). «(t))dr,l которое вместе с (11.10) дает И (Л у)=/(а | Л t/)=min/(« | Л «). Последнее и означает, что V(t, у) — функция Беллмана. 12* 355
В соответствии с теоремой 11.2 решение задачи синтеза опти- мального управления при определенных условиях сводится к реше- нию уравнения Веллмана с граничным условием (11.8). Одним из существенных недостатков, связанных с применением теоремы 11.2, заключается в априорном требовании дифференцируемости функ- ции Веллмана. Еще не решая уравнения Веллмана, нужно быть уверенным в дифференцируемости его решения. Это требование слишком «жесткое», поскольку даже в несложных линейных зада- чах оптимального управления функция Веллмана, как правило, не является всюду дифференцируемой [5]. Далее, при решении уравне- ния Веллмана следует отыскивать не только функцию У(/, у), но и функцию «(/, у), реализующую минимум в (11.5), причем функ- ция u(t, у) должна удовлетворять требованиям а) и б) из опреде- ления оптимальной синтезирующей функции. Минимум в (11.5) мо- жет достигаться не на одном, а сразу на нескольких векторах мно- жества (У, поэтому построение требуемой функции u(t, у) нередко оказывается крайне сложной задачей. Несмотря на указанные трудности, существуют задачи, для ко- торых удается синтезировать оптимальное управление с помощью метода динамического программирования. Одним из наиболее ин- тересных с этой точки зрения является класс линейных задач опти- мального управления с квадратичным целевым функционалом. 3. Оптимальный синтез в линейных системах с квадратичным критерием качества. Пусть управляемая система линейная и в век- торной форме имеет вид о t где dt//d/= (di/i/df, di/2/d/, .... dyn/dt)Tt 4(f)—матрица размера «Хп; В (0 — матрица размера пХт, причем компоненты этих мат- риц являются непрерывными функциями. Начальный и конечный Т моменты времени считаем заданными. Задано также начальное состояние у^К а фазовые ограничения при t>t0 отсутствуют, т. е. S(0=R«, Л><^7\ Согласно терминологии, принятой в предыду- щей главе, это задача оптимального управления линейной системой со свободным правым концом и фиксированным временем управле- ния. Целевой функционал имеет следующий квадратичный вид: т /(«)«f[<m Р(О;Р(О) + Й)> Q(Oa(O)]d/+ + <у(Г), Ry(h}. Здесь матрицы Р(/), и R размера пХя считаются симметрич- ными, причем компоненты матриц P(t) и Q(/) составлены из не- прерывных функций. Кроме того, предполагаем, что матрицы Р (О и /? неотрицательно определены, a Q(t) —положительно-определен- ная матрица при всех Л* Допустимыми управлениями явля- 356
ются кусочно-непрерывные на Ко, 7] функции u(t), принимающие произвольные значения из Rm (г. е. C/=Rm). Сформулированная задача представляет собой частный случай исходной задачи оптимального управления, и поэтому для построе- ния оптимальной синтезирующей функции можно использовать тео- рему 11.2. Предположим, что функция Беллмана в рассматривае- мой задаче имеет вид 1/(А Ю=<». С«)У). (И.14) где —симметричная матрица размера «Хл с глад- кими элементами, причем C(T)=R. Вычислим частные производные функции вида (11.14). Имеем v,а, </)=А, х С * / где dC(O/d/ — матрица размера пХ«. составленная из соответст- вующих производных Далее находим {/)=С(Л^+ГСГ(/)(/. Функция (11.14) удовлетворяет уравнению Беллмана, поэтому в данном случае равенство 9/+ <С<«»4-СГ(/)!/, Д(0(/4-В(0в) .+ -Ну* ^(0у> + <«. Q(O«))=o (11.15) выполняется для любого и всех yeRn. При каждом t вы- ражение в фигурных скобках является квадратичной функцией от- носительно и с положительно-определенной матрицей Q(0- Следо- вательно, на Rm минимум этой квадратичной функции существует и достигается в единственной точке, которую можно найти, прирав- нивая градиент квадратичной функции нулю, т. е. из условия Вг (О К? (О У+Ст (П ^1+2Q (О и = 0„. Отсюда, учитывая симметричность матрицы C(t), находим точку минимума: а « - Q"1 (?) BT(i) С (/) у. (11.16) Теперь найдем матрицу С(/). Подставим выражение (11.16) в уравнение (11.15). В результате получим уравнение для определе- ния матрицы С(/): А+<С(/)!/+СГ(Л1/. АЩу- \ ас / + (Q->(О£(/)<?(/)у, B(t)C(t)y)=O. 357
Преобразуем это уравнение, опуская для краткости аргумент I. Используя равенства. {Су, Ay} —{у, СтАу} = {у, САу}. {Сгу, Ау} = {АтСту, у) = (У, АтСу), {Су, BQ~xBTCy}— {у, CBQ-Wy}, {Q~lBTCy, BrCy} = {y, CTB(.Q~l)T BTCy} = {y, CBQ-^Cy}, имеем ~у\+(У. CAy)+(y, ATCy)—{y, CBQ~'B'Cy') + \ de / + (У. Ру} =0. Это равенство заведомо выполняется для всех векторов yeRn, ес- ли выполнено условие —+СЛ+АГС-СВ<2->В’,С4-Р=О, (11.17) dt * где в правой части равенства находится нулевая матрица размера лХп. Полученное дифференциальное уравнение относительно С на- зывают матричным уравнением Риккати. Это уравнение представ- ляет собой систему п2 нелинейных дифференциальных уравнений первого порядка типа Риккати. Оказывается (см. кн.: Флеминг У., Ршиел Р. Оптимальное управление детерминированными и стоха- стическими системами. — М.: Мир, 1978), при сделанных в начале пункта предположениях, матричное уравнение Риккати (П-17) всегда имеет решение С(Й, определенное для — <x><zt^T и удов- летворяющее условию C(T)=R. Следовательно, поиск решения уравнения Беллмана в виде квадратичной функции (11.14) имеет полное основание и можно положить u(t, y)=—Q~4t)BT(t)C(,t)y, (11.18) где C(t) —решение уравнения (11.17) с условием C(T} — R. Функ- ция (11.18) удовлетворяет требованиям а) и б) определения опти- мальной синтезирующей функции, причем, как следует из ее по- строения, она реализует минимум в уравнении Беллмана. По тео- реме 112, это искомая оптимальная синтезирующая функция рас- сматриваемой задачи. Если матрицы А, В, Р и Q не зависят от t т. е. являются ста- ционарными, то решением задачи синтеза также является стацио- нарная оптимальная синтезирующая функция, линейная по фазо- вым переменным.
$ 11.3. ПРИКЛАДНЫЕ ЗАДАЧИ 1. Управление движением материальной точки. Пусть управ- ляемая система описывается уравнением (11.19) dx* где u(t) —управляющая функция, на которую наложено ограниче- ние (11.20) Запишем фазовые уравнения системы (11.19) в следующем виде: (11.21) di dr Пусть требуется за минимальное время перевести систему из неко- торого начального состояния в начало координат фазового про- странства (т, е. конечным положением системы является точка = (0,0)). Найдем программное управление, соответствующее фиксирован- ному начальному условию. Воспользуемся принципом максимума. Функция Й в данном случае (см. § 10.4) имеет вид (11.22) где ф( (0 и ФИО —вспомогательные функции, определяемые из си- стемы уравнений d44s=_dW_ d'h дЙ dl dyi * di ду2 т. е. «Ь«0,-5Ь— di it T1 Общее решение этой системы таково: Ф: =Q, где Ci, Сг — постоянные. Функция Й принимает вид И=С1у2-|“(с2—Ci/) и. Максимум по переменной и достигается при и (С2—Q). (11.23) Функция Сз—Cit на отрезке.управления [0, 7] может менять знак не более одного раза, поэтому u(i) — кусочно-постоянная функция, принимающая значения +1 и —1 и имеющая не более двух интервалов постоянства. При фиксированном начальном фа- 359
зовом положении уиа) точку, в которой функция «(7) из- меняет знак (точку переключения), можно определить, подставляя (ЮЗ) в систему (11,21) н решая эту систему совместно с началь- ным и. и 'конечным® условиям в р i (0) р« i, R (01 =/с э । (Г) = 0, Ыэ(Г)=»О, В результате подучаем' программное управление я (А). Определим вид фазовых траекторий системы при возможных зна- чениях управляющей функция» Пусть на некотором отрезке времени «(0^1; тогда, решал си- стем:/ (1.1.21), получаем, что фазовая траектория системы имеет вид 1М*>= f-TV+Oa-^ + AM И)* . Исключая время, запишем фазовую траекторию в переменных В, Я- и=4-а1+д > (11.24) Mr (здесь A Ds, D==A—J-Ds( — постоянные). Из (11.2'4) следует, “то в фазовом прост панстве R2 фазовая траектории системы на промежутке времени, где ^(f)-- = 1, йредетаздяег гобой дугу па- Р а болы. Сем ейс гво па р &б о л, определяемШуравнением (ИЛИ) при различных значениях кон- станты D изображено на рис* 11*2, На тех интервалах времени, где ^(t)-=—1„ решение системы Р ис. 111 (И ,21) имеет над p2<D=—“F A)" ’ h <№ № H переменных: фа зонам траектория: залнсывается следующим образом; ?i=—1-Д+е. (П.25) d£' где £=£а.+-^-'Й Семейство парабол, !ю которым система дви- жется при —1, нзоб'ражеио на рис. Ю. Отметим,, что по па- раболам (11.24) система, движется снизу вверх, так как при u(0Q зад
вывэлльно условие 1^>0Р т, е* с ростом 1 координата £Г увеличивается.. По параболам (11J5) система движется сверх/ вниз, так как ^—=₽= — 1<<Х О* Пусть задано начальное' фазовое положен ие Если точка /(|И?==(у,й1, pa,2j лежит на параболе вида (11,24) или вида (lL25)t проходящей черея начало координат, то управление в этом случае имеет вид н(Г) = 1 или й(0и—1 на всем интервале управления [С; Т]. а фазовая траектория представлент собой часть вара б оды от точки pw до начала координат. Если точка находится выше осн D^i и правее л а раб злы, про- ходящей через начало' координат, то фазовая траектория состоит из двух частей. Сначала система движется вниз по параболе» про- ходящей через точку .И®'1 и соответствующей 1, Достигнув jO4KH. пересечения данной .параболы с параболой, соответствующей и проходящей через начало координат, система далее дви- жется по этой параболе; („рис.. 11.4), В точке А значение функции iu(f меняется, с—1 на + 1, Если из ходится ниже оси O# а и левее параболы, проходящей через начало координат, то система сначала движется вверх по па- раболе, проходящей через точку а затем вниз по параболе, ко- торая проходит через начало, координат (рис. 11.4),. Точка В, п ко* торой происходит переход от одной параболы к другой, является точкой переключения управления со значения »=1 на «я~1. Случаи, когда точка |^ej лежит выше осн Оу3 и левее параболы, проходящей через начало координат, и когда лежит ниже осн О?Л и правее параболы, .проходящей через начало координат, ис- следуют аналогично. Семейство фазовых траекторий, по которым система переходит на произвольной начальной фазовой точки в начало координат, изо- бражено на рис, 11.5. На этом, рисунке ЛОЙ— линия переключения управлений. Если система находится в фазовой точке выше этой линии, то управление имеет значение Цэ—1, если ниже, то значе- 361
вне u—1. Часть Л?7 линнн переключения представляет собой дугу параболы а часть СШ-^ дугу параболы При произвольном начальном состоянии система сначала движется по параболе, проходящей через начальную точку, а затем (после, достижения линии переключения) по линии переключения в начало координат, F случае если у10* не лежит на линии переклю- чав ня, управляющая функция к (f) обязательно^ имеет одну точ- ку переключения с — 1 на +1 иля с +1 на —1. На рис, 11,5 изображено графиквской реше- ние задачи синтеза оптимальных по быстродействию уйравледиЙ... Для практической реализации Май денного оптимального управ- ления необходимо ввести в си- стему реле, изменяющее значе- ние управляющего' параметра в зависимости от «фазового поло- расположенную на рис. 1L5 выше ли- можио з-адату, с помощью условия ^г-(- Pat ILS 2 жеиня системы. Область, нич переключении, г ^~ +“^h^gn'^>'Os 'Область ниже линии переключения—с по- мощью условия 0i. + % ^lsign£s<(}. Таким образом, управляющее устройство должно измерять величину </, -|—1- р" sl^n придавать управ ляющему параметру значения ц=_ = |, (если эта величина положительна) и w=l (если эта величина отрицательна). Если в ытолнеио у слон не й += s Ign ®11 то Уи Р а эл я ющее у стр ойст- во должно придавать управляющему параметру значение №—1 При ^а>-0 И значение us 1 при ^-‘СО, 2 Синтез оптимадьнфто по быстродействию управления электро* двигателем при заданном значат выполняемой работы, Уравне* еж электродвигателя постояв нот о тока а безразмерных единицах пмеет рид (см, пример 3 из | 9.7) ^=<ГО-^ где у(т) угловая скорость вращения якоря, Цт) —сила тока в якоре, дс< 1~ момент сопротивления нагрузки, т— время, рабо- ту Д выполняемую двигателем на интервале временя 'О1, Г], мож но вычислить (в относительных единицах) по формуле (11.26) (11.27) Э62
Ток i(r) в якоре выбирают в качестве управляющего парамет- ра. Требуется подобрать такую функцию i(x), О^т^Т, чтобы за минимальное время Т электродвигатель выполнил заданную рабо- ту Ао, т. е. функционал (11.27) при оптимальном управлении *(т) должен иметь заданное значение До*. Потребуем, чтобы угловая скорость вращения якоря в начальный и конечный моменты време- ни была равна нулю: v(0) =.v(T)=0. На управляющее воздействие i (т) наложим естественное ограничение |i(t)l<Z. (11.28) Так как j(t)=-^-, /а(т) где I и /н — соответственно текущее и номи- нальное значения тока в якоре, условие (11.28) означает, что ток в якоре не должен превышать номинального значения. Наконец, предположим, что нагрузка может подключаться к электродвигателю в любой из моментов времени /е [О, Т]. В этом случае значение момента сопротивления нагрузки в уравнении (11.26) необходимо считать функцией времени: ц(т) = gox(ri), где Т] — момент подключения нагрузки. Фактически ц(т) (как и i(r))—управляющее воздействие, поскольку от выбора момента подключения нагрузки Т| зависит время выполнения заданной ра- боты. При этом кажущийся наиболее естественным режим, в кото- ром нагрузка подключена к электродвигателю с самого начала (tj=0), на самом деле не является оптимальным. Как будет пока- зано, минимум времени, затрачиваемого на выполнения заданной работы Ао, соответствует режиму, в котором ti>0. В этом режиме сначала разгоняют якорь электродвигателя на холостом ходу, а уже затем подключают нагрузку. Чтобы учесть условие выполнения электродвигателем заданной работы, введем новую переменную у(х) с помощью уравнения -^^-=p(t)v(t) и граничного условия у(Т)=Л0. Величина t/(x) Oil определяет работу, совершенную электродвигателем на интервале времени [0, т]. Таким образом, система фазовых уравнений, опи- сывающих электродвигатель, имеет вид du (11.29) (11.30) Здесь -v(t) и //(т)—фазовые координаты процесса, »(т), ц(т)— управляющие воздействия. На первое из них наложено ограничение (II.8), а второе должно иметь вид ц(т) = цох(*ч). Задача опти- мального управления электродвигателя состоит в выборе таких функций i(x) и ц(т), чтобы система за минимальное время из на- чального состояния' с фазовыми координатами *(0)=0, р(0)=0 (11.31) 363
reocuira i состояние с фазовым н координатами ЧГ)^0. f<n=^ (11..32) Злпишез функцию Я (см. С Ж4) для сформулкровавной задачи оптимального б ыстр одейств ия: Н Ml 0 —ft) (П .33) Функции Vi (т) 'ИШ(Т) удовлетворяют у равней и ям *_=_^-=_4г11> J*L=_^.=o. Дт tjhj ' dr <j у Решение этих уравнений имеет вид фй(г)—=ccn^tL фц(т)^ вфИЭД—Посиодьиу при -т=0 выполнено- *(0) =-0, li(0)=0t можно записать /7₽%(0)i(0). Ь спответствии с приник- пом максимума на. оптимальной траектории Л=cons 1^0. Уняты пая. что г(0)>0 (так как для совершений работы необходимо при- вести якорв двигатели но ©ращение),,получаем, что ф|(О)^(Е Из выражения для фг (г/ следует, что ф) акция. Фа либо не имеет ни о Д’ ной точки перемены знака (если фг(Сч*С0)„ либо- имеет одну такую точку (если фа(0)>0). Соответственно' функция C(i) либо не. име- ет нм одного' переключен ня, т. в, £(т)^]л, либо имеет одну точку пе- реключения на. интервале управления. В- первом из этих случаев мы не получили решения поставленной задачи, поскольку решение v(t) фазового уравнения (11.29) нрн fnj является линейно возрас- тающей функцией (так как 1“|ре>0) й условие ¥(Г) = 0 не может бить выполнено ип при катам Г. Таяим образом, в оптимальном режиме функ- ция Цт) имеет одну точку пе- реключения T"t3, и которой, она изменяется с +1 и а —L И? физических соображений оедует,. что нагрузка должна подключаться к электрод в нга- телю во время ею разгона, а ке во время тормеженля,. т. е. должно, быть выполнено усло- вие 0<т1«й-сГ. Графики функций Дт)» ji(r)r v(t) м у(т) в опти- мальном режиме и^обр&жъны на рис. 11.6. Чтобы найти программ- ное управление /(т), jlfi),, осталось определить значеянн величий т( н та (точек лереклмнений упрьдлений). ^тс можно сделать, под- ставляя общее решение системы уравнений (1L2&)., (11.30) (содер- жащее четыре неизвестных: вели^йиы: tj, та и две произвольные по- стоя иные) в гра ничные уело вия. (11.31) „ (11.32) * Рассмотрим более сложную задачу синтеза оптимальных по быстродействию управлений. Исследуем вид фазовых траекторий зы
скстемы лри различных чозможннх значениях увравляадшнг Jtos- жйствнЛ Кт). ц(г). Как было установлено, на интервале управле- ния необходимо р осмотреть три участка. На участке (0. Tjj выпол- зем £{t)eL |1(г|^3, из участке [ть т-а' имеем Цт) ^1, |1(т)ззро, на участка [т3, 7] справедливо Установи и вид фазовых траекторий на «1 лоске icrw ^Ov- На последнем участке фя- зовые уравнения (11,29), (11.30) имеют вад. (1+jM, JL==^v, ОТ QT З^'азжлин второе из этик уравнений на первое, получнм _^¥ „__ _ц й« I + Аэ Далеа находим вад фазовых траекторий и коор диад так (p, v): ; -tE—A (1LB1J. По параболам оттого семейства фазовая точка системы движется при 1®=й,, |лар®. Н конечную точку (Лд, 0) на плоскости ^Ov фа* Рис. 11.7 зовая точка системы пой»дает по траектории зида (11 34), соответ- ствукжей С\=Лс (жирная линия ад рнс. 1L7), При tel, ptepfli фазовые уравнения соответственно принимает вид dv - dtf -г’№ ПЧ ’И Рследив итприё уравнение на. первое, получны йу ?О f_ div 1 — Bfl Фазовые траектории в &tof случае таковы: У=С’+^ГА <IL3S> Напомним, что ра<1 (спрвделешие р0 приведено в § 9.7), поэтому йа параболах вада (Н,35) косрдниата у возрастает с ростом у. На Э65
рис. 11.7 траектории из семейства (11.35) изображены пунктирны- ми линиями. При is 1, ц=0 (начальный участок управления) фазовые урав- нения имеют вид ^-=1. **-=0. du du Отсюда, учитывая начальные условия (11.31), получаем v(t)=t. y(tj=Q. В плоскости yQv траектория системы на участке О^т^тч представляет собой часть оси Ov. Таким образом, оптимальная траектория системы имеет сле- дующий вид. Сначала (до момента Ti) фазовая точка системы дви- жется по отрезку ОК оси Ov (рис. 11.7) под действием управления т^1, ц=0. В момент Ti происходит переключение значения функ- ции р,(т) и фазовая точка системы движется под действием управ- ления i=l, ц=ро по отрезку KL параболы семейства (11.35). В момент ?2 происходит переключение значения функции i (т) и фа- зовая точка системы движется под действием управления is—1. ц= цо по параболе У=Ао- ____&____ 2(1 4-Цо) V2 (11.36> и достигает точки (Ло, 0) за минимальное время Т. Отрезок 1VP" параболы (11.36) представляет собой линию переключения управ- ляющего воздействия i(r). Таким образом, для завершения реше- ния задачи синтеза осталось найти аналитическое выражение для линии переключения управляющего воздействия ц(т). В соответствии с теоремой 10.1 на оптимальной траектории вы- полнено следующее условие: f/=const. При т=0 из (11.33) полу- чаем /7=Ф1(0), (11.37> так как i(0) = l, ц(0)=0. В точке т=т2 происходит переключение функции i(t), т. е. ф( (та) =0, поэтому имеем (учитывая, что ф2(т) = ф2(0) = const) Я(т2) =i|?2(0)v(t2)p(t2). Учитывая (11.37),. получаем Ф2(0Л(г2)ц(т2)=<М0). (П.38> Поскольку в точке t=Ti происходит переключение функции ц(т), выполнено равенство ih(0)v(tt)—ф1(т()=0. Так как р(т) = =0 на участке [0, п], то фс(т) =ф1 (0) на этом участке и из преды- дущего соотношения следует, что i|>i(0)=i|?2(0)v(ti). Подставляя выражение для ipi(0) в (11.38), найдем Р (t2) * (Гз)=* (А). (11 -39>* Отсюда следует, что линия переключения управляющего воздейст- вия ц(т) состоит из тех точек (yt v) на параболах (11.35), для ко- торых выполнено условие v= ц (тз)v (т2) = gov (tj) (рис. 11.7). Оче- 356
видно, что эта линия представляет собой параболу, переходящую через точку (Ао, 0), т. е. ее уравнение имеет вид у—Ао—Dy2. Для нахождения коэффициента Ь рассмотрим некоторую параболу се- мейства (11.35). Предположим она пересекается с параболой (11.36) в точке с координатой vo. Тогда с искомой параболой =/о—Dv* она пересекается в точке с координатой povo (рис. 11.7). Запишем условия пересечения в этих двух точках: J*2(l -Но) 2(1+и0) G+ 2(1-Ио) А)— ° (IVo)2- Почленно вычитая второе уравнение из первого, получаем соотно- шение из которого находим 2 + Но 2^о О + Но) Линия переключения управляющего воздействия ц(т) в плоско- сти yOv задается уравнением 2+Ио 2но (I +Но) (11.40) Итак, оптимальная фазовая траектория рассматриваемой зада* чи с заданными начальными и конечными условиями (11.31), (11.32) построена. Фактически осуществлен синтез оптимальных по быстродействию управлений для задачи с произвольным началь- ным значением скорости вращения якоря и произвольным значени- ем выполняемой работы. Пусть, например, в начальный момент времени скорость вращения якоря отличная от нуля и равна vt и требуется построить управление, обеспечивающее выполнение за минимальное время работы А, причем Л>Ао- Чтобы свести эту за- дачу к рассмотренной ранее, достаточно формально сместить точ- ку отсчета выполняемой электродвигателем работы и положить, что в момент времени т=0 «выполненная» работа равна А о—А (т. е. отрицательна). В этом случае начальному состоянию управ- ляемой системы соответствует точка (Ао—A, Vi) в фазовой плоско- сти yOv. Оптимальная фазовая траектория состоит по-прежнему из трех участков. Сначала фазовая точка системы движется по отрез- ку прямой, параллельной оси Ov, под действием управления 1, р^О. В тот момент, когда точка достигает линии переключения (11.40), происходит изменение управления: is 1, Дальней- шее движение происходит по отрезку параболы из семейства (11.35). При достижении линии (11.36) происходит переключение 367
управляющего воздействия i(x) и управление принимает следую- щий вид: да—1, Пп отрезку параболы (IU6) фазовая точ- ка системы переходит в конечную точку (До, 0), которая в данной: .случае соответствует моменту выполнения работы Л. Таким образом, окончательно решение задачи синтеза может быть записано в виде (рис. 1L8) U(U pW)= L (1,0? ниже линии ДМ, (1„ Ро) между линиями ./’Ж и PN к на линии Р/И^ (—1, |10) иэ линии РЛ\ Ръс. 116 Отметим, что постановка задачи оптимального быстродействия с произвольными значениями v(0) и Л имеет смысл только если начальная фазовая точка системы лежит ниже линии .FjVs Если на* чальная точка находится выше этой линии, задача теряет смысл; тан как .невозможно подобрать допустимое управление, кото- рое переводило бы систему в точку 64и, 0)- В этом случае электродвигатель имеет в на- чальный момент времени1 слишком большую скорость и совершаемая им до полной ос- тановки работа будет обяза- тельно больше заданного зна- чения Л. Я Синтез оптимальных по быстродействию управлений ядерным реактором. В § 10.5 были решены задачи оптимального распределения горючего в вдернем реакторе в случае стационар- ного режима работы реактора. Рассмотрим теперь более слож- ную задачу управления нестационарными режимами работы ядер- него реактора. Составим математическую модель нестационарного процесса диффузии нейтронов в реакторе. Будем считать, что активная зона реактора занимает пространственную область Ь, границу которой: обозначим через S. СтацшжарньзЙ процесс диффузии в реакторе М сж но описать ур а внен нем - ^(Ж)=0, Ж е= а < 11.41 > т й с граничным, условием (ПА2> Здесь До —эффективный коэффициент диффузии, То — время жизни теплового нейтрона, Днр — критический коэффициент размно- жения нейтронов, зависящий от Д©, Та и геометрических размеров, реактора.. Если реальный коэффициент размножения нейтрон од в реакто- ре А и отличен'от А№ плотность нейтронов в каждой точке внутри SB
реактора изменяется. Математическая модель этого процесса мо- жет учитывать или не учитывать запаздывающие нейтроны, кото- рые излучаются из осколков ядер не в момент распада, а с некото- рым запаздыванием по времени. В первом случае уравнение неста- ционарного процесса диффузии нейтронов можно записать в виде — (11.43) di Tq где k0— коэффициент размножения, не учитывающий запаздываю- щие нейтроны, Л/(7, М) — плотность нейтронов в точке М в момент времени t. Оба члена в правой части уравнения имеют простой фи- зический смысл. Первое слагаемое определяет изменение плотно- сти нейтронов, вызванное их движением через поверхность, котог рая ограничивает произвольный бесконечно малый объем внутри реактора; второе слагаемое определяет изменение плотности ней- тронов вследствие рождения их при распаде ядер внутри указан- ного объема. В том случае, когда учитываются и запаздывающие нейтроны, необходимо в правую часть уравнения (11.43) добавить слагаемое, описывающее изменение плотности запаздывающих ней- тронов внутри рассматриваемого бесконечно малого объема. При этом все запаздывающие нейтроны разбивают на т группы (как правило т^б) и вводят коэффициенты размножения kt для каж- дой из этих групп. Общий коэффициент размножения является суммой коэффициентов размножения мгновенных н запаздываю- щих нейтронов: f-l Учитывая запаздывающие нейтроны каждой группы, получим [11] уравнение m ш —=£>0AW4—*°~-1 W+V — С ЛЧМ, t-r)e-i<’dt, Л Tq -Л го /-1 о (11.44) где X/—величина, обратная времени жизни запаздывающих ней- тронов m-й группы. В дальнейшем будем предполагать, что плотность нейтронов в каждый момент времени по всему объему реактора одинакова, т. е. Кроме того, будем учитывать только одну группу запаздывающих нейтронов (m—1). Уравнение (11.44) принимает вид * —f ЛГ(/—т)е_1Мт. (11.45) « То То J (Здесь X=Xj.) Это интегродифференциальное уравнение можно свести к системе двух обыкновенных дифференциальных уравне- 369
ний. Введем функцию r(t) по формуле е» Г ATO-r)e-Hdt. (11.46) °S) Тогда вместо уравнения (11.45) можно записать следующую систе- му уравнений: -^_=*1^12ЛГ+ХГ> (11.47) [dt Го ^=4!_ЛГ_Хг. (11.48) о* То Будем считать, что до момента времени /=0 в реакторе протекал стационарный процесс диффузии нейтронов, причем значение No плотности постоянно. Поэтому одно из начальных условий для си- стемы (11.47), (1 ] .48) имеет вид .ЛГ (Ok-о=Af0= const >0- (11-49) Второе начальное условий получим из уравнения (11.48). В ста- ционарном режиме -^-=0, г=го=const. Следовательно, из dt (11.48) получаем -^-Af0=V0. Отсюда имеем Л, Г (О I г-о=г0=4илго’ (11.50) • о В стационарном режиме общий коэффициент размножения ра- вен критическому коэффициенту размножения, т. е. при КО вы- полнено равенство £=Ло-Ь&1=якр. Предположим теперь, что начи- ная с момента времени t=0 происходит произвольное изменение во времени коэффициента размножения: А(/)=^кр+бА(О- Поскольку А(0=М0+М0> можно записать МО =Акр- (/)+8А (/). (11.51) Коэффициенты размножения k и k\ считаем пропорциональными в каждый момент времени: ki(f)=pk(t)t причем коэффициент про- порциональности р имеет смысл доли запаздывающих нейтронов в их общем потоке. Подставляя М0МРжР+8*^! <П*52> в выражение (11.51), получаем МО=1*ч>+« (01 (1 - ?). (11-53) Если рассматривается только одна группа запаздывающих ней- тронов, М=1- Действительно, полагая в (11.47), (11.48), что про- изводные равны нулю, и складывая эти уравнения, находим для стационарного режима 370
*о-*1 -1 ЛГо=О. В стационарном режиме £о4-£1=&кр, отсюда Ацр=1. Учитывая этот факт и подставляя (11.52) и (11.53) в уравнения (11.47), (11.48), получаем систему уравнений, описывающих нестационар- ный процесс диффузии нейтронов в реакторе: =—|-^«)+^Ц«>ЛГ«)4-Хг(О; (11.54) о* * О 'О (11.55) Ш / о i о Для этих уравнений начальными являются условия (11.49), (11.50). Функцию r(i) в уравнениях (11.54), (11.55) надо понимать по- другому, чем в определении (11.46). Теперь величина М является переменной во времени, поэтому необходимо положить Перейдем к постановке задачи оптимального управления, а именно задачи о наиболее быстром переводе реактора из одного стационарного режима работы в другой. Пусть до момента t—0 в реакторе протекал стационарный процесс диффузии с постоянным значением JVo>0 плотности нейтронов в реакторе. При этом k= =АКР=1. Начиная с момента /=0 коэффициент размножения на- чинает изменяться и в реакторе протекает нестационарный процесс, описываемый уравнениями (11.54), (11.55) с начальными условия- ми (11.44), (11.50). Задача оптимального быстродействия состоит в выборе такой функции №(t), чтобы за минимальное - время Т плотность нейтронов в реакторе достигла заданного значения N W\t-T=NX. (11.56) Затем начиная с момента i = Г необходимо обеспечить выполнение условия А=йкр=1, т. е. чтобы в реакторе опять протекал стацио- нарный процесс диффузии с постоянной плотностью нейтронов Ni- Условие, накладываемое на функцию r(t) в момент времени t=T (и во все моменты t>T)t аналогично условию (11.50) и имеет вид г(П|<-г=^-ЛГ,. (11.57) Значение коэффициента размножения нейтронов изменяется в результате изменения расположения поглотителя внутри реактора, поэтому варьировать величину k(t) можно только в пределах, оп- ределяемых конструкцией реактора. В связи с этим необходимо на- ложить ограничения на функцию 6k(t) (11.58) 371
Вообще говоря, необходимо наложить ограничение и на функ- цию №(t), получающуюся при решении системы уравнений (11.54), (11.55), так как, согласно физическому смыслу, Лг(7)^0. Однако можно строго доказать [11], что на самом деле эта система при любых N(t) и Wq>0 имеет неотрицательное решение V(7), т. е. вводить специальное ограничение на N(t) не нужно. Таким образом, задача оптимального быстродействия состоит в выборе такой кусочно-непрерывной функции Gk(t), удовлетворяю- щей условию (11.58), чтобы фазовая траектория системы N(t), r(i), проходящая в момент времени /=0 через точку рУо, —*> ЛГ0) • за минимальное время достигла точки Это задача оптимального управления с закрепленными концами. Функция л(/У, rt фь фа, 6А) для системы уравнений (11.54), (11.55) имеет вид Функции ф1 (0 нфгО) удовлетворяют уравнениям dft дН - dt &N * dfo дН dt дг т. е. -7^=(/--ЦЛф|-/-(1+Ь*)'Ь. (П.59) dt \гq i о / /0 at В соответствии с принципом максимума оптимальное управле- ние &k(t) следует выбирать так, чтобы функция И при каждом t имела максимум, т. е. чтобы достигала максимума функция Л/7 * Я—~ Функция JV (?) при всех 6k удовлетворяет ус- X Л) Г) / ловию IV О, поэтому максимум реализуется при WW==»««slgn(1^h+-^'h). (11-60) Воспользовавшись общей схемой решения задачи синтеза опти- мальных по быстродействию управлений, установим вид фазовых траекторий системы, соответствующих случаям 6k(t)=6km„ и 6k(t)^—б£тжх. При 6k=6kmT уравнения (11.54), (11.55) прини- мают соответственно вид %------f Л^+irJM^+Ir. (11.61) dt то iо (11.62) dt I о 7 о Найдем общее решение этой системы. Определяя из первого 372
уравнения r(t) и подставляя полученное выражение во второе, по- лучаем уравнение вторго порядка относительно (/): —+(х+“—— Л^О. (11.63) df2 Ц ТГ0 То mnJ df Tq Запишем характеристическое уравнение: Т2+(х+^—8Л„„) v-^=2=0. (11.64) Результат решения системы (11.61), (11.62) зависит оттого, ка- кие корни, вещественные или комплексные, имеет уравнение (11.64). Для того чтобы дальнейшее исследование было более кон- кретным, предположим, что параметры рассматриваемого реактора имеют следующие значения: Х«0,1; 0~6,5-1О~3, Zo^lO-3, 6Am>x< <рС1. В этом случае уравнение (11.64) имеет два вещественных корня: у( и у2. причем yi >0. У2<0. Общее решение уравнения (11.63) представляет собой линей- ную комбинацию экспонент eTi* и Решение системы (11.61), (11.62) с начальными условиями (11.49), (11.50) имеет вид W(/)—Qe7*'4-С2ет< г(О=СэрЬ*Ц-С4ет< (11.65) Постоянные С], Сг, Сз, С 4 можно выразить через коэффициенты уравнений и величины yi, No. Однако при решении задачи син- теза необходимо перейти от параметрического задания фазовой траектории к явному выражению в координатах N, г. Осуществить такой переход, используя выражения для N(t) и r(t), сложно, поэ- тому получим уравнение фазовой траектории в координатах М г с помощью уравнений (11.61), (11.62). Преобразуем эти условия, вводя новые функции Ух =а+ъ) N -I- Хг, у2=(Х-|- у2) ЛГ+V. (11.66) Вычислим производные и , используя уравнения (11.61) и (11.62). Имеем dr dr dr г о Тq + -^-Мт«ЛГ-11.М1п1^+Т1Хг, (11.67) '0 • о ^?=()1+у2) = A at 1 2 df 1 df То m“ То 1 +^*™.Ar-£h*Be^+v2lr. (11.68) *0 'о С помощью уравнения (11.64) сумму второго, третьего и четвертого слагаемых в (11.67), (11.68) можно записать следующим образом: zo ‘а т0 373
Тогда соотношения (П-67), (11,68) принимают соответственно виц ^*=YiW+*v,W + V1V=V1y„ (11.69) JJr ^=Т^+1¥^+¥^ = у^г. {U.7O) й£ Почленно разделим первое да этих уравнений на второе: — . d</3 УШ Подученное, дифференциальное уравнение легко интегрируется по* еле. разделения переменных ;прн этом, надо решать уравнение от* дельно в каждой четверти плоскости у»0'^), Общее решение можно записать в виде (Pl)11*'—С (ifaF'i (П.Я> где С — произвольная постоянная, Эта запись является условной.,, тан кук я случае, когда vi и уг—дробные числа, величины (rP‘ и (уа)ъ могут нй иметь смысла, DpH ^<10, у» > 0 решение {11-71} нм еет ьид j =s С J.-/4 "л,. при । > О, < 0 —' — ’ г — уj, п р.и Ш < 0; ^<0Ну>И*-£Шъ При различных значениях кон- станты С уравнение (11,71) они* сывает различные кривые да се- ти ействл фазовых тра ектор и й, со- ответствующих случаю Bis Это семейство! д ксордп- нзтах lyj, изображено на рис, Ц.& С помощью уравнений (11,67), (11,70) нетрудно устано- вить направ^ечне двни&ення фа- эсвой -тонки системы на каждой из кривой указанного семейства. При ^1^0, выполнены не* равенства — >□, ^< 0 (так ИР ’ с г как Yu^Oj, уз’С’О'])., г, е. с тече* Рис., ЦЛ аием времени координата у увеличивается, а координата уменьшается. .Поэтому фазовая точка движется в I четверти пло скости J/1 слеза направо. Аналогично рассматриваются случаи, когда фазовая точка системы находится в других четвертях "ё л о- скости Направления движения фазовой точки указаны на рис, 1L9 строками. Перейдем к системе координат М г. Уравнения осей и Оу» Я координатах Д г .; пек г ,знд ' (отв (1LT2) г= _:х VI ^оеь (11.73) 37*
Покажем, что ось Оу\ находится в I четверти плоскости NOr. Для этого достаточно доказать, что коэффициент (Л+у2)/Л, в урав- нении (11.72) отрицателен, т. е. А+уа<0. Поскольку у2 является меньшим корнем уравнения (11.64), можно записать +1/ Г \ /о ‘о 1 о 11 В 1 - Р Следовательно, ^4"Т2<С—— Н-------Для рассматриваемого го 7 о реактора на тепловых нейтронах выполнено неравенство Мтах<р. Тогда из полученного неравенства следует, что К+у2<0- Аналогично можно доказать, что ось Оу$ находится во II четверти плоскости NOr. Угол а, который образует ось Оу} и ось ON, в соответствии с {11.72) определяется соотношением tga=-----. Угол cto, обра- зованный ON и лучом OL, на котором лежат все начальные и ко- нечные условия, в соответствии с (11.50) и (11.57) определяется соотношением tg а0=-^-=-Ц- . При заданных параметрах реак- Nq ГцА тора величины tga и tgao удовлетворяют неравенству tgao>tga, т. е. ось Oyi лежит ниже луча OL, поэтому каждая фазовая траек- тория семейства (11.71) пересекает луч OL (рис. 11.10). Аналогично можно установить вид фазовых траекторий системы при §k(t)^—бАтах. В этом случае уравнение (11.64) имеет отри- цательные корни у2<У1<0. Семейство фазовых траекторий (11.71) изображено -иа рис. 11.11. В I четверти плоскости у'гОу^ фазовые траектории представляют собой степенные функции а в остальных четвертях получаются симметричным отражением относительно осей координат. Стрелками показаны направления движения фазовой точки системы с ростом t. На рис. 11.12 изобра- жено то же семейство фазовых траекторий, но в плоскости NOr. Ось Оу\ в этой плоскости лежит в I четверти, причем проходит выше луча OL, на котором находятся начальная (jV0, го) и конечная .(*ь и) точки задачи оптимального управления. Этот факт следу- ет из того, что при заданных числовых параметрах реактора выпол- нено соотношение tga=—^>-?-=tga0. A / qA Таким образом, получены семейства фазовых траекторий, соот- 37$
ветствующия постоянным значе- ниям Ora»® и управляюще- го параметра $&(£). Из рис,. НЛО и рис. IL12 видно, что все фазсн вне траектории обоих рассматри* ваемых сем ейств, выходящие из луча ОД обязательно лежат внут- рн угла, который сбразуют оси О^и и 0^'ъ Поэтом уз дальне йшем будем рассматривать только тра- ектории, лежащие внутри этого угла. Для кратности обозначим нэ- рис_ |цдд чальную и конечную точки задачи 'Оптимального управления через Р0 и Р|. Поскольку фазовые траек- торим каждого из семейств, (при бЛиМгавЖ и $&=—пересе- кают луч Of,, только один раз, управление Й(7Д нс имеющее течек переключения и тождественно равное M^is или —'Мтмц не может являться решением задачи оптимального быстродействия. Функция' имеющая одну точку перехлюченяя, может быть решением поставленной задачи, Таким решением могут быть и функции fAff) имеющие белье одной точки переключения.. Чтобы установить. сколе ко точек перек л юления имеет оптимальное управление, надо надроби© все ледов.а ть вид функция f (f) — - "zr^ Фс И+W Ю» KQ“ г0 Го тора я сходит н выражение '(11,60), Используя уравнения (1LE9J, можно доказать [Щ что функция q?(f) нмее^ на ингернале учран- лення гольто одну точку перемены знака, поэтому оптимальное уг= ран летне имеет только одну точку переключения. Оптимальная фазовая траектория, по которой систем ё за мини- мальное а рем в переходит из точки Ра в точку Ра, имеет следующий влд. Есди Точка Ре лежи г на луче 01 ближе к началу координату чем jPj, то сначала фазовая точка системы движется по фазовой
трлеггорки первого семейства. до пересечения с гой траекторией ь горою семейства* которая проходит через точку А (рис, 11ЛЗ)« Момент времени h;> и который фазовая точка системы достигает ука- ванной граскторкн второго семейства* является моментом пере ключения управления со значения fifem« на значение —fifema*. При />/в фазовая точка системы движется по, траектории агорою се- мейства и достигает А- Если точка А'®. лежит дальше от начала координат, чем А то сначала фазовая точка системы движется по траектории из второ гс семейства .под действием, управления, fife в—-М „щ. В момент когда фазовая' точка системы достигает траектории первого сем ей - стеа* проходящей через точку А, происходит переключение управ- ления со значении —fifemis на значение б&т* При £>7Я фазовая точка системы движется по указанной траектории первого ©емеЙсТ* ва и достигает А. Дадим геометркиескум: интерпретацию решения задачи синтеза оптимальных по быстро । действию управлений Пусть зафиксирова- на конечная точка Pi на луче ОД в которую должна попасть фазо- вая точка системы. Тогда при любом начальном положении на за- ключительном отрезке времени (после переключения управления) фазовая точка системы достигает А, двигаясь либо по линии А А—-части траектории те второго семейства, лнбе по линии АА — части траектории второго семейства (рис. 11.141,. Вся линия ААА является линией переключения управления fifefl). Во веет фазовых точтах выше чтой линии управление имеет’ значение —б^таж» а во всех' фазовых тачках ниже згой, линии — значение Айлы». На части А А линии переключения управление имеет значе- ние Mirsx. - на части А А “значение —fifemaa- Окончательно реше- ние задачи синтеза запишем в следующем видщ M(f)=l П₽И « W* W* OsAA» I -^ти при (АГ, r)'^Q2 и при (Ж, г)е АА- Здесь Qa — часть угла выше линии P»?iA> Qi — часть этого утла ниже этой линии. 377
ЗАКЛЮЧЕНИЕ Процесс решения любой прикладной оптимизационной задачи состоит из двух этапов: сначала задачу формализуют, а затем с по- мощью соответствующего аналитического или численного метода решают. На этапе формализации строят математическую модель, т. е. конкретные технические, физические и экономические условия и требования воплощают в виде задачи оптимизации с конкретной целевой функцией и определенным допустимым множеством. Ма- тематическая модель должна быть адекватна исходной приклад- ной задаче, т. е. наиболее полно и точно соответствовать ей. Для этого необходимо учитывать все факторы, участвующие в задаче, что может привести к слишком сложной задаче оптимизации, на решение которой потребуется неоправданно много сил и средств. Поэтому этап формализации оказывается тесно связанным с после- дующим этапом. Нужно построить такую математическую модель, которая, с одной стороны, по возможности точно соответствует ис- ходной прикладной задаче, а с другой—достаточно проста и за приемлемое время поддается решению доступными методами и средствами. В связи с эТим, на этапе формализации исключительно вахсную роль играют интуиция, опыт и кругозор исследователя. В принципиальном отношении второй этап проще первого; в дан- ной книге приведены методы, способствующие реализации именно второго этапа решения. В книге представлен довольно широкий круг современных раз- делов теории оптимизации. Хотелось бы отметить те направления теории оптимизации, которые здесь не получили отражения. Вне поля зрения читателя осталась та часть теории, которая занимает- ся исследованием экстремальных задач с учетом случайных фак- торов. Она носит название стохастического программирования. Особое место занимает теория оптимального управления недетер- минированными (стохастическими) системами. ' Если же говорить о детерминированных задачах, то в книге отражено большинство важнейших разделов современной теории оптимизации. Отсутствуют разделы, посвященные дискретному программированию и теории оптимального управления системами с распределенными параметрами. Предмет дискретного програм- мирования составляют задачи минимизации и максимизации функ- ции многих переменных на дискретном множестве, в частности, на множестве, состоящем из конечного числа элементов. Эти задачи имеют свою специфику, нередко носят ярко выраженный комбина- торный характер и требуют для решения специальных методов, су- щественно отличающихся, например, от методов линейного и нели- нейного программирования. Теория оптимального управления си- стемами с распределенными параметрами посвящена изучению за- дач оптимального управления объектами, поведение которых опи- сывается дифференциальными уравнениями в частных производ- ных [9]. Эта область теории оптимизации во многом еще находится на пути окончательного становления. Кроме того, здесь не рассмот- 378
рены весьма важные с практической точки зрения методы регуля- ризации экстремальных задач. Об этом разделе теории оптимиза- ции можно получить представление из [9]. Необходимо отметить, что вторая часть книги, в которой рас- сматриваются задачи оптимизации в функциональных пространст- вах, включает, в основном, вопросы, связанные с необходимыми ус- ловиями оптимальности и почти не содержит описания соответст- ствующих численных методов. В особенности это относится к гла- ве по теории оптимального управления. Не следует думать, что та- кие методы вообще отсутствуют [12]. Описание этих методов чрез- мерно увеличило и усложнило бы главы второй части в сравнении с главами первой части. При написании книги авторы ставили перед собой две цели: оз- накомить читателей с основами теории оптимизации и помочь им в применении этой теории на практике. Хочется верить, что эти цели хотя бы частично достигнуты. ЛИТЕРАТУРА * 1. Алексеев В. М., Галеев 3. М.. Тихомиров В. М. Сборник задач по опти- мизации.— М.: Наука, 1984. 2. Алексеев В. AL, Тихомиров В, M.t Фомин С. В. Оптимальное управле- ние.— М.: Наука, 1979. 3. Ашманов С. А. Линейное программирование. — М,: Наука. 1981. 4. Веллман Р. Динамическое программирование. — М.: ИЛ, I960. 5. Болтянский В. Г. Математические методы оптимального управления.— М.: Наука, 1969. 6. Болтянский В. Г. Оптимальное управление дискретными системами. — М.: Наука, 1973. ' 7. Бояринов А. И., Кафаров В. В. Методы оптимизации в химической тех- нологии.— М.: Наука, 1969. 8. Васильев Ф. П. Численные методы решения экстремальных задач. — М.: Наука, I960. ' 9. Васильев Ф. П. Методы решения экстремальных задач. — М.: Наука, 1981. 10. Даффин Р., Питерсон 3., Зенер К. Геометрическое программирование.— М.: Мир, 1972. 11. Егоров А. И. Оптимальное управление тепловыми и диффузионными про- цессами.— М.: Наука, 1978. 12. Зубов В. И. Лекции по теории управления. М.: Наука. 1975. 13. Кини Р. Л., Райфа X. Принятие решений при многих критериях: пред- почтения и замещения. — М.: Радио и связь, 1981. 14. Колмогоров А. Н., Фомин С. В. Элементы теории функций н функцио- нального анализа. — М.: Наука, 1982. 15. Коша А. Вариационное исчисление. —М.: Высшая школа, 1983. 16. Кудрявцев Л. Д. Курс математического анализа.—М.: Высшая школа, 1981, т. 1—2. 17. Моисеев Н. Н., Иванилов Ю. П., Столярова Е. М. Методы оптимиза- ции.— М.: Наука, 1978. 18. Подиновский В. В.. Ногин В. Д. Парето-оптимальные решения много- критериальных задач. — М.: Наука, 1982. 19. Поляк Б. Т. Введение в оптимизацию. — М.: Наука, 1983. 20. Понтрягин Л. С., Болтянский В. Г.„ Гамкрелиозе Р. В., Мищенко Е. Ф. Математическая теория оптимальных процессов. — М.: Наука, 1984. 21. Пшеничный Б. И., Данилин Ю. М. Численные методы в экстремальных задачах. — М.: Наука, 1975. 379
ОСНОВНЫЕ ОБОЗНАЧЕНИЯ {хеХ|Р(х)} —совокупность элементов х множества Л, для которых имеет мес- то Р(х); 0 — пустое множество; х— (xi, Х2,.... хп) — вектор-строка с компонентами xit xs, .... х„; f: X-*-Y — функция, отображающая X в У; Rn — n-мерное евклидово пространство; 0„— (0, 0, 0) —нулевой вектор пространства R*; л <х, У ) *= 2 —скалярное произведение векторов х, jjeR"; Hl Пх|[ = У < х, х > — норма вектора xeR"; t/e(x)—е-окресткость точки xeR"; Лт— транспонированная матрица А; , к d/(x) d/(x)V V /(x) = I—---, —-1— ..... —-----1 —градиент функции f, вычисленный \ 0X1 0X2 0ХЯ / в точке xeR”; Vf(x) —градиент функционала f, вычисленный на элементе х; М2/ (х) \ V 2/ (х) = । Т—1 — гессиан функции f, вычисленный в точке xeR; \dxfixl>nxn < ?0[а, i] — линейное пространство непрерывных функций на отрезке [о, 6]; Сп{ц ь) — линейное пространство л раз непрерывно дифференцируемых функций на отрезке [а, &]; С” 1а, — линейное пространство т-мерных вектор-функций, компоненты кото- рых л раз непрерывно дифференцируемы на {а Л]; Цх||0 — норма элемента ХЕС0[а, 6J; |!х||, — норма элемента хеС([ц, 6]; * -окрестность нулевого порядка элемента хгС^а. &]; U\ (х) — е-окресткость первого порядка элемента хеС( [а, Ь].
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Аксиома Парето 178 Антиграднент 34 Вариация функционала — первая 216. 241 ----вторая 249 Гессиан 14 Гиперплоскость 9 Градиент 13, 213 Задача безусловной минимизации 26, 215 — Больца 260, 270 — вариационная пространственная 271, 272 ----высшего порядка 271, 274 ----нзопериметрическая 266, 271 ----простейшая 217, 234 — выпуклого программирования 27, 45 ------двойственная 49 — геометрического программирования 27, 145 ------двойственная 147 ------ преобразованная 148 — Лагранжа 270, 280 ----в понтрягинской форме 280 — линейного программирования 27, 59 ------двойственная 51 ------каноническая 27, 61 ------стандартная 27, 51 — математического программирования 27 ------общая 220 — минимаксная 40 — минимизации 21, 215 ----без ограничений 26. 216 ----с ограничениями 26, 215 — нелинейного программирования 27 — оптимального быстродействия 302 —----->линейная 328 ----управления 221, 302 ------исходная 347 ------с закрепленными концами 302 ------со свободным концом 313 ------с подвижными концами 313 — оптимизации 21, 22 ----многокритериальная 170, 178 — синтеза оптимальных управлений 348 — терминального управления 88, 323 — условной минимизации 26, 215 Значение оптимальное 22 Критерий качества 21, 302 — оптимальности 29, 87, 302 Лемма Дюбуа — Ренмона 242 ----обобщенная 275 — Лагранжа 218 — о скруглении углов 238 Лицо, принимающее решение 169 Матрица Гессе 14 Метод барьерных функций 131 — второго порядка "116 — градиентный 120 — динамического программирования 100 — золотого сечения 110 — классический 109 — Лагранжа 268 — линеаризации 136 — нанскорейшего спуска 120 — пулевого порядка 116 — Ньютона 122 — первого Порядка 116 — покоординатного спуска 118 — равномерного перебора 114 — Ритца 226 — сопряженных направлений 125 — условного градиента 129 — Фибоначчи 113 — штрафных функций 133 Минимизирующая последовательность 26 Минимум слабый локальный 235, 260, 263. 266, 273, 274. 281 — сильный локальный 236. 273 Множество выпуклое 11, 208 — допустимое 21 — допустимых управлений 28, 300 — замкнутое 10, 210 — компактное 10, 210 — линейное 9 — ограниченное 10 — оптимальных решений 179 — оценок 179 Норма вектора 8 — элемента 209 Область управления 300 Ограничения фазовые 30, 347 Оператор 212 Отношение 171 — лексико-графическое 189 — неразличимости 174 — предпочтения 174 Оценка 170 — сверху для множества оптимальных решений 178 Парето-оптимальность 178 Принцип максимума 305, 307. 320, 329 — оптимальности 99, 304, 353 381
Произведение множеств декартово 6 — векторов скалярное 8 Пространство банахово 210 — бесконечномерное 208 — евклидово 8 — линейное 207 ----нормированное 209 — конечномерное 208 — сопряженное 213 — фазовое 300 — функциональное 207, 208 Решение 21 — задачи оптимизации 22 — базисное 64, 65 Симплекс-метод 66 — двойственный 80 — двухфазный 72 — модифицированный 75 Система автономная 299, 320 — неавтономная 320 — полностью управляемая 301 — сопряженная 306 — управляемая 302 ----линейная 301 Теорема Вейерштрасса 24, 224 Точка глобального минимума 22 — локального минимума 22 — оптимальная 21 — седловая 46 — стационарная 36 Точная нижняя грань 25 Траектория системы 300 ----оптимальная 302 Уравнение Веллмана 353 —Эйлера —Лагранжа 219, 243 — Якоби 252 Условие граничное 271 — Лежандра 250 — регулярности 38, 223 ---- Слейтера 48 — трансверсальности 261, 263, 282, 314 — Якоби 253 Функционал 211 — векторный 2)2 —дифференцируемый 213 — нтегральный 212, 213, 220 — линейный 211 — смешанный 220 — терминальный 220, 323, 347 Функция выпуклая 15 — дважды дифференцируемая 14 — дифференцируемая 13 — квадратичная 12 — квазивыпуклая 19 — кусочно-непрерывная 238 — кусочно-непрерывно дифференциру- емая 237 — Лагранжа 38, 46, 222, 281 — линейная 12 — Непрерывная 12 — непрерывно дифференцируемая 13 — позиномиалъная 28, 144 — Понтрягина 305 — псевдовыпукла я 18 — строго выпуклая 17 — унимодальная 109 — целевая 21 Экстремаль 243, 273, 278 — Понтрягина 306 (/. у)-задача 347 е-окрестность нулевого порядка 235 е-окрестность первого порядка 235
ОГЛАВЛЕНИЕ Предисловие.......................................................... 3 Глава 1. Основные математические понятия............................. 5 $ 1.1. Евклидово пространство...................................... 5 § 1.2. Множества в евклидовом пространстве........................ 10 § 1.3. Функции многих переменных.................................. 11 Глава 2. Теоретические основы оптимизации в евклидовом пространстве 20 §2.1. Математическая постановка задачи оптимизации............... 21 § 2.2 Разрешимость задачи оптимизации............................. 24 § 2.3. Классификация задач оптимизации............................ 26 § 2.4. Сводимость одного класса задач к задачам другого класса .... 30 § 2.6. Необходимые и достаточные условия оптимальности в случае диф- ференцируемых функций............................................ 34 $ 2.6. Выпуклое программирование. Двойственные задачи............. 45 § 2.7. Прикладные задачи........................................ 53 Глава 3. Линейное программирование.................................. S3 § 3.1. Симплекс-метод............................................. 59 § 3.2. Модифицированный симплекс-метод............................ 75 § 3.3. Двойственный симплекс-метод................................ 79 § 3.4. Прикладные задачи.......................................... 61 Глава 4. Динамическое программирование.............................. 66 § 4.1. Задача оптимального управления и ее разновидности.......... 87 § 4.2. Метод (цинамнческого программирования...................... 91 § 4.3. Вычислительные аспекты динамического программирования ... 100 § 4.4. Прикладные задачи......................................... 103 Глава 5. Нелинейное программирование...............................,108 §5.1. Минимизация функции одной переменной..................... 109 § 5.2. Численные методы в задачах без ограничений................ 116 § 5.3. Численные методы в задачах с ограничениями................ 128 $ 5.4. Прикладные задачи......................................... 138 Глава 6. Геометрическое программирование.......................... 144 § 6.1. Задача геометрического программирования, преобразованная н двойственная задачи............................................• 144 § 6.2. Основная лемма геометрического программирования.......... 151 § 6.3. Теорема двойственности геометрического программирования ... 157 § 6.4. Прикладные задачи ....................................... 163 Глава 7. Элементы многокритериальной оптимизации.................. 169 § 7.1. Начальное представление о многокритериальной задаче оптими- зации ......................................................... 169 § 7.2, Отношения................................................ 171 § 7.3. Отношения предпочтения и неразличимости. Множество опти- мальных решений........................................... 173 § 7.4. Многокритериальные задачи оптимизации. Парето-оптимальные опенки и решения.......................................... 177 § 7.5. Выбор решения при наличии дополнительных сведений об отно- шении предпочтения ............................................ 186 $ 7.6. Оценка сверху для множества оптимальных решений в условиях отношения предпочтения, инвариантного относительно положи- тельного линейного преобразования......................... 195 § 7.7. Прикладные задачи........................................ 203 383
Глава 8. Теоретические основы оптимизации в функциональных прост- ранствах ......................................................... § 8.1. Вспомогательные сведения из функционального анализа..... 20. § 8.2. Необходимые условия оптимальности в задачах без ограничений 2! § 8.3. Понятие о вариационном исчислении......................... 21 § 8.4. Необходимые условия оптимальности в задачах с ограничениями 21 § 8.5. Разрешимость задачи оптимизации........................... 22 § 8.6. О численных методах оптимизации в функциональных пространст- вах ......................................................... 22. § 8.7. Прикладные задачи.....................^. . . ............ 221 Глава 9. Вариационное исчисление................................... 23! к §9.1. Постановка простейшей задачи вариационного исчисления .... 23! $ 9.2. Первая вариация. Уравнение Эйлера — Лагранжа..............' 24< § 9.3. Вторая вариация. Условие Лежандра......................... 24' § 9.4. Условие Якоби.............................................. 2& § 9.5. Некоторые модификации простейшей вариационной задачи ... 28 § 9.6. Более общие вариационные задачи ...........................274 $ 9.7. Прикладные задачи......................................... 284 Глава 10. Оптимальное управление.................................... 29^ § 10.1 Начальные понятия теории управляемых систем............. 29$ § 10.2. Принцип максимума . Понтрягина для задач с закрепленными концами......................................................... 305 § 10.3. Задача оптимального управления с подвижными концами .... 313 § 10.4. Линейная задача оптимального быстродействия............. 326 § 10.5. Прикладные задачи ..................................... 335 Глава 11. Синтез оптимальных управлений.......................... 34^ § 11.1. Понятие синтезирюущего управления..................... 34С § 11.2. Динамическое программирование......................... 351 § 11.3. Прикладные задачи...................................... 35J Заключение........................................................ 375 Литература........................................................ 37< Основные обозначения...............................................38С Предметный указатель.............................................. 381
ББК 22.11 Н72 УДК 51 Рецензенты: кафедра исследования операций фа- культета вычислительной математики и кибернетики Москов- ского государственного университета нм. М. В. Ломоносова и д-р фнз.-мат, наук А. А. Петров. Ногнн В. Д., Протодьяконов И. О., Евлампиев И. И. Н72 Основы теории оптимизации: Учеб, пособие для студентов втузов/под ред. И. О. Протодьяконов а. — М.: Высш, шк.» 1986. — 384 с., ил. В пособия излагаются основные понятия и методы теорем опти- мизации. Рассматриваются задаче оптимизации в евклидовом и функ- циональных пространствах. Изучаются методы линейного, динамиче- ского. геометрического, нелинейного и многокритериального програм- мирования. а также метбды вариационного исчисления и оптимально- го управления системами. 1502000000-543 001(01)—86 КБ—28—10—86 ББК 22.1В 517 Учебное издание Владимир Дмитриевич Ногин Игорь Орестович Протодьяконов Игорь Иванович Евлампиев ОСНОВЫ ТЕОРИИ ОПТИМИЗАЦИИ Зав. редакцией Е. С. Трндасова. Редактор Ж- И. Яковлева. Мл. ре- дакторы С. А. Досовских, Н. П. Майкова. Художественный редактор. В. И. Пономаренко. Технический редактор 3. А. Муслимова. Корректор Г. И. Кострикова ИБ № 4763 Изд. № ФМ—817. Сдано D набор 27.05.86. Подл, в печать 10.10.86. Т-18781. Формат бОХЭО'^в. Буы. ки.-журв, Гарнитура литературная. Пе- чать высокая. Объем 24 усл.'печ. л. 24 усл. кр.-отт. 23,74 уч.-нзд. л. Тираж 4000 экз. Зак. Nt 339. Цена 1 р. 10 к. Издательство «Высшая школа». 101430, Москва, ГСП-4. Неглинная ул., Д. 29/14. Московская типография № 8 Союзполнграфпрома при Государственном комитете СССР по делам издательств, полиграфии и книжной торговав. 101898. Москва, Центр, Хохловский лер., 7. © Издательство «Высшая школа», 1986