/
Текст
ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ
МОСКОВСКИЙ АВИАЦИОННЫЙ ИНСТИТУТ
(государственный технический университет)
В.В. МАЛЫШЕВ
МЕТОДЫ ОПТИМИЗАЦИИ
в задачах системного анализа
и управления
Допущено Учебно-методическим объединением
высших учебных заведений Российской Федерации по
образованию в области авиации, ракетостроения и
космоса в качестве учебного пособия для студентов
высших учебных заведений РФ, обучающихся по
специальности 160703 «Динамика полета
и управление движением летательных аппаратов»
направления подготовки дипломированных
специалистов 160700
«Гидроаэродинамика и динамика полета»
и специальности 230301 «Моделирование
и исследование операций в организационно-
технических системах» направления
подготовки дипломированных специалистов 230300
«Организационно-технические системы»
Москва
Издательство МАИ-ПРИНТ
2010
ББК 22.18
М 20
М 20 Малышев В.В. Методы оптимизации в задачах системного ана-
лиза и управления: Учебное пособие. М.: Изд-во МАИ-ПРИ НТ,
2010. — 440 с.: ил.
ISBN 978-5-7035-2179-3
Рассматриваются методы решения задач практической оптимизации в
области управления динамическими системами и исследования операций.
Основной акцент сделан на прикладном характере и сущности методов, кото-
рым в книге дается по возможности простое обоснование.
Для студентов, аспирантов, преподавателей вузов, научных сотрудников
и инженеров — специалистов в области системного анализа, навигации и уп-
равления движением.
Рецензенты:
кафедра динамики и управления полетом ракет и космических аппара-
тов МГТУ им. Н.Э. Баумана;
д-р техн, наук, проф. Л.В. Вишнякова
Тем. план 2010, поз. 13
Малышев Вениамин Васильевич
МЕТОДЫ ОПТИМИЗАЦИИ
В ЗАДАЧАХ СИСТЕМНОГО АНАЛИЗА И УПРАВЛЕНИЯ
Редактор М. С. Винниченко
Компьютерная верстка О. Г. Лавровой
Сдано в набор 15.03.10. Подписано в печать 14.04.10.
Бумага офсетная. Формат 60x84 1/16. Печать офсетная.
Усл. печ. л. 25,57. Уч.-изд. л. 27,50. Тираж 1000 чк».
Зак. 4448/368.
Издательство МАИ ПРИНТ
(МАИ), Волоколамское ш., л. 4, MOCNM, А*10, ГСП-3 125993
Типография Иишгалмтва МАИ
(МАИ), Волоколамское ш.. л 4, МовММ, А-ИО, ГСП-3 125993
ISBN 978-5-7035-2179-3 С МоСМОЙОМИЙ ЙНИЙЦИОННЫЙ ИНСТИТУТ
(государственный Тйиничоский университет), 2010
с> Малышев Н Н . 2010
ВВЕДЕНИЕ
С задачами оптимизации в той или иной мере сталкивается
практически каждый человек. Существует огромное многообразие
задач оптимизации и соответственно методов их решения. Различ-
ными авторами опубликовано огромное количество монографий и
учебников по методам оптимизации. Поэтому, приступая к реше-
нию той или иной задачи оптимизации, в первую очередь важно
правильно сориентироваться, с какой задачей имеем дело, каковы
основные особенности этой задачи, какие методы решения подоб-
ных задач существуют, наконец, какому методу отдать предпочте-
ние для успешного решения конкретной задачи. Оказать помощь в
ответах на поставленные вопросы поможет данная книга. По сути
дела в этом автор видит основную цель книги.
Книга написана для инженеров, интересующихся методами ре-
шения различных задач оптимизации. Практически это — введение
в теорию оптимизации. В ней отсутствуют обременяющие многих
инженеров математические доказательства. Излагается лишь сущ-
ность методов, дается простое их обоснование. Приводятся алгорит-
мы решений различных задач оптимизации.
Арсенал методов оптимизации настолько обширен, а сами ал-
горитмы в большинстве своем настолько сложны, что приходится
потратить немало усилий, чтобы, с одной стороны, найти подходя-
щий алгоритм решения своей оптимизационной задачи, а с другой
Стороны, грамотно реализовать его с использованием современной
вычислительной техники. Успешному выбору наиболее рациональ-
ного метода решения конкретной задачи оптимизации в значитель-
ной степени может способствовать классификация встречаемых за-
дач оптимизации и, соответственно, методов решения. Поэтому
данному вопросу в книге уделяется значительное внимание.
3
Прежде всего, следует отметить, что любая задача оптимизации
начинается с ее постановки. Постановка задачи оптимизации пред-
полагает наличие следующих обязательных компонентов.
Математическая модель объекта оптимизации. Это может быть
совокупность обычных или дифференциальных уравнений, связы-
вающих параметры объекта оптимизации, логических или иных свя-
зей и ограничений, накладываемых на параметры объекта оптими-
зации.
Критерий оптимальности (или целевая функция), подлежащий
минимизации или максимизации. В общем случае это некоторый
функционал (в простейшем случае, просто функция), зависящий от
параметров объекта оптимизации и определяющий эффективность
процесса оптимизации.
Наконец, собственно постановка задачи оптимизации, предпола-
гающая четкую формулировку того, что дано и что требуется найти.
По типу объекта оптимизации следует различать статические и
динамические задачи оптимизации.
К первой группе относятся задачи оптимизации так называемых
статических объектов, математические модели которых могут быть
представлены в виде некоторой зависимости целевой функции от
искомых параметров. Такие задачи обычно называют задачами ма-
тематического программирования. Следует подчеркнуть, что боль-
шинство задач оптимизации сложных технических систем относит-
ся к задачам математического программирования. Сущность их сво-
дится к отысканию такой совокупности характерных параметров
рассматриваемой сложной системы, которая доставляет экстремум
(минимум или максимум) некоторой целевой функции от показате-
лей эффективности.
Вторую группу составляют задачи оптимизации управления
объектами, эволюционирующими во времени, т.е. динамическими
объектами. Как правило, математические модели таких объектов
представляют собой систему дифференциальных уравнений. Крите-
рием оптимальности в таких задачах служит некоторый функцио-
нал, устанавливающий связь искомого управления (зависящего в
общем случае также от времени) с целевой функцией опосредован-
но, через систему дифференциальных уравнений. В современной те-
ории управления эти задачи принято называть задачами оптималь-
4
ного управления. К задачам оптимального управления, в частности,
hi носятся задачи выбора оптимальных траекторий движения под-
вижных объектов, задачи выбора оптимальных алгоритмов управ-
ления и формирования наиболее эффективной структуры бортовых
систем управления подвижными объектами. В связи с возможным
многообразием задач оптимального управления важным является
четкое определение того, в каком виде требуется найти управление
( в виде зависимости от времени, в виде зависимости от других те-
кущих параметров объекта управления и т.д.).
Следует заметить, что не всегда удается провести четкую грань
между статическими и динамическими задачами оптимизации. Так,
например, при оптимизации динамического объекта с целью выбо-
ра ограниченного количества каких-либо параметров этого объекта
естественно задачу оптимизации трактовать как задачу математичес-
кого программирования, т.е. как статическую.
Книга состоит из двух частей.
Первая часть посвящена задачам математического программи-
рования и соответствующим методам их решения. Дается класси-
фикация существующих задач математического программирования.
Обсуждаются их особенности. Для удобства изучения материала
приводятся самые необходимые математические сведения, широко
используемые в дальнейшем. Формулируются необходимые и дос-
таточные условия оптимальности в общих задачах математического
программирования. Рассматриваются классические задачи оптими-
зации без ограничений, с ограничениями типа равенств. Приводит-
ся их обобщение на случай неравенств.
Основное внимание в первой части уделяется численным мето-
дам оптимизации. Обсуждение начинается с рассмотрения особен-
ностей различных методов поиска безусловного экстремума, вклю-
чая методы первого порядка, методы второго порядка, методы ну-
левого порядка. Отдельно рассматриваются методы одномерного
поиска и методы случайного поиска. Далее обсуждаются численные
методы оптимизации при наличии ограничений, сначала методы
линейного программирования, а затем — нелинейного программи-
рования. Отдельный раздел посвящен задачам целочисленного про-
граммирования. Заканчивается первая часть обсуждением методов
оптимизации при действии случайных и неопределенных факторов.
5
Вторая часть книги посвящена задачам оптимального управле-
ния динамическими объектами. Типичным примером такого объекта
является летательный аппарат. Для того чтобы летательный аппа-
рат, как объект управления, эффективно выполнял свои функции,
необходимо, по-крайней мере, решить две задачи. Первая задача
заключается в определении траектории движения летательного ап-
парата. С математической точки зрения эта задача состоит в отыс-
кании некоторой программы управления, представляющей собой
зависимость величины управляющего воздействия от времени. Эту
задачу будем называть задачей программирования управления.
Вторая задача заключается в формировании закона управления
летательным аппаратом. Под законом управления понимается зави-
симость управляющего воздействия от тех координат, которые дос-
тупны измерению в процессе движения в любой (текущий) момент
времени. Решение этой задачи позволяет сформировать (синтезиро-
вать) структуру системы управления летательным аппаратом, рабо-
тающей по принципу обратной связи. Эту задачу будем называть
задачей синтеза управления.
При решении как задачи программирования управления, так и
задачи синтеза необходимо иметь в виду, что на любой летательный
аппарат в процессе полета действуют различные возмущения (слу-
чайные и неопределенные), без учета которых зачастую просто нельзя
обойтись. Характерным примером может служить задача управле-
ния конечным (терминальным) состоянием летательного аппарата,
когда требуется осуществить выведение аппарата в требуемый рай-
он назначения с высокой точностью. При этом возможны случаи,
когда решение той или иной задачи без учета возмущений вообще
не может обеспечить требуемой точности управления. Поэтому при
формировании как программы, так и закона управления летатель-
ными аппаратами следует учитывать действие случайных и неопре-
деленных факторов.
Сначала обсуждаются задачи оптимального управления для слу-
чаев дискретного и непрерывного управления в детерминированной
постановке. С этой целью формулируются необходимые и доста-
точные условия оптимальности. Приводятся конкретные примеры
решения задач оптимального управления летательными аппаратами
различного назначения. Затем рассматриваются более сложные за-
6
дачи оптимального управления *в стохастической и минимаксной
постановках, позволяющие учитывать действие случайных возмуще-
ний и неопределенных факторов. Приводятся численные методы
решения задач программирования и синтеза оптимального управле-
ния.
Книга написана на основе курсов лекций, которые автор читал
на протяжении многих лет студентам аэрокосмического факультета
МАИ по дисциплине «Оптимальное управление летательными ап-
паратами и системами» для двух специальностей [18—22]. Одна из
специальностей связана с исследованием баллистики, динамики и
систем управления полетом летательных аппаратов, где выбор оп-
тимальных траекторий движения и формирование оптимальных ал-
горитмов управления являются приоритетными. Другая специаль-
ность связана с анализом и синтезом сложных технических систем
различного назначения, элементами которых являются сами лета-
тельные аппараты. В этом случае задачи оптимизации, как правило,
сводятся в выбору таких параметров сложной технической системы,
которые обеспечивают наибольшую эффективность ее функциони-
рования.
Книга может быть полезна студентам, аспирантам, преподава-
телям вузов, научным сотрудникам и инженерам — специалистам
в области системного анализа, навигации и управления движением,
а также широкому кругу специалистов, интересующихся различны-
ми задачами оптимизации.
7
ЧАСТЬ 1
ЗАДАЧИ МАТЕМАТИЧЕСКОГО
ПРОГРАММИРОВАНИЯ
1. КЛАССИФИКАЦИЯ ЗАДАЧ МАТЕМАТИЧЕСКОГО
ПРОГРАММИРОВАНИЯ
Существует огромное количество задач оптимизации, относя-
щихся к задачам математического программирования. К настояще-
му времени накоплен также обширный арсенал методов решения
таких задач, каждый из которых, обладая своими преимуществами
и недостатками, имеет определенную сферу наиболее эффективно-
го применения. Как уже отмечалось во введении, успешному выбо-
ру наиболее рационального метода решения конкретной задачи оп-
тимизации в значительной степени может способствовать класси-
фикация встречаемых задач.
Прежде чем перейти к обсуждению самой классификации, сфор-
мулируем сначала задачу математического программирования. В
достаточно общем виде эта задача сводится к определению такого
вектора х* из допустимого множества X, который обеспечивает ми-
нимум некоторой функции
z = /(x) = /(x,,..., хи), (1.1)
называемой целевой (критериальной) функцией.
Как правило, допустимое множество ^задается совокупностью
неравенств (или равенств, или неравенств и равенств одновремен-
но) вида
g(x) < О {g,.(x) <0, i = bm; g/x) = 0, j = TJ}, (1.2)
где g(x) — в общем случае вектор-функция, называемая функцией
ограничений.
8
Одним из основных признаков, который может быть положен в
основу классификации задач математического программирования,
является тип целевой (критериальной) функции/(х) и функции ог-
раничений g(x). Именно тип функций Дх), g(x) является часто оп-
ределяющим при выборе соответствующего метода решения задачи
оптимизации.
Наиболее распространенными типами как целевой функции Дх),
гак и функции ограничений g(x) являются следующие: линейная,
квадратичная, дифференцируемая нелинейная, аддитивная, недиф-
ференцируемая нелинейная функции. Что касается функции огра-
ничений, то здесь целесообразным является выделение дополнитель-
ных случаев, когда ограничения либо вообще отсутствуют, либо
имеют место ограничения на отдельные компоненты вектора вида
ху < aj (так называемые простые ограничения).
В соответствии со сказанным можно выделить такие задачи
оптимизации, как задачи оптимизации дифференцируемой целевой
функции при отсутствии ограничений (классическая задача опти-
мизации); дифференцируемой целевой функции при наличии про-
стых ограничений; дифференцируемой целевой функции при нали-
чии линейных ограничений; недифференцируемой целевой функ-
ции и т.д.
Среди огромного многообразия получаемых при этом задач особо
выделяют несколько классов задач оптимизации, для каждого из
которых развиты свои специальные достаточно эффективные мето-
ды решения.
1. Классические задачи безусловной оптимизации. Это задачи, в
которых требуется найти минимум дифференцируемой целевой
функции при отсутствии каких-либо ограничений, накладываемых
на вектор искомых параметров:
x*=argmin/(x). (1.3)
X
Для классических задач оптимизации характерным является
возможность использования при получении решения, с одной сто-
роны, классического аппарата дифференциального исчисления (на-
пример, в виде необходимых и достаточных условий оптимальнос-
ти), а с другой стороны, богатейшего арсенала численных методов
9
безусловной оптимизации, лежащих в основе решения и более слож-
ных задач оптимизации.
2. Задачи линейного программирования. В этих задачах как целе-
вая функция Дх), так и функция ограничений g(x) являются линей-
ными:
fix) - с1х, g(x) - Ах-b. (1.4)
Здесь векторы с, b и матрица Л считаются заданными.
Поэтому задача линейного программирования в общем случае
имеет следующий вид:
х* = argmincTx. (15)
Обычно среди прочих ограничений принято выделять простые
ограничения на отдельные компоненты векторах Так, например, в
случае неотрицательности всех компонент вектора задача принима-
ет более привычную форму:
x*=arg min стх. (1.6)
Ax£b,x2ti
Следует особо подчеркнуть, что для решения задач линейного
программирования разработаны весьма эффективные численные
алгоритмы. В основе их лежит симплекс-метод и его многочислен-
ные модификации.
3. Задачи квадратичного программирования. Это задачи, в кото-
рых целевая функция Дх) является квадратичной, а функция огра-
ничений g(x) — линейной. В достаточно общем случае задача имеет
вид
х* = arg min(crx+хТИх), (1 7)
где матрица Н считается заданной и, как правило, положительно
полуопределенной. Именно использование линейности ограничений,
с одной стороны, и свойства выпуклости квадратичной целевой
функции — с другой позволяет на основе теории двойственности в
данном случае сформировать достаточно эффективные методы ре-
шения задач оптимизации такого класса.
4. Задачи оптимизации с аддитивными (сепарабельными) целе-
выми функциями и линейными ограничениями. Аддитивной целе-
10
ной функциейДх) принято называть такую функцию многих пере-
менных, которая может быть представлена в виде суммы отдельных
функций, каждая из которых является функцией одной переменной:
/(х) = £//х,.). (1.8)
>1
Типичной постановкой задачи оптимизации рассматриваемого
класса является следующая:
п
х'd-9)
х>0
Заметим, что к задачам этого класса сводятся многие распреде-
лительные задачи исследования операций. Они могут быть успешно
решены методами последовательной оптимизации, основанными
либо на идеях динамического программирования в общем случае,
либо на идеях теории двойственности в случае выпуклых (квазивы-
пуклых) целевых функций.
До сих пор при обсуждении различных задач оптимизации мы
предполагали, что целевая функция Дх) и функция ограничений g(x)
однозначно определялись в зависимости от вектора параметров х.
Однако в действительности, как правило, наряду с вектором инте-
ресующих нас параметров х приходится учитывать целый ряд допол-
нительных возмущающих (неопределенных) факторов, влияющих на
обе эти функции. Учитывая это и обозначая вектор возмущающих
(неопределенных) факторов через £, , в общем случае можно запи-
сать
/ = /(хД), g=g{x, у.
Задача оптимизации в первоначальном виде с целью достиже-
ния минимума функции /(х,£) при условии g{x, £) < 0 теперь ста-
новится некорректной, так как не оговорен способ учета возмуща-
ющих (неопределенных) факторов при выборе оптимального ре-
шения.
Поэтому в качестве второго признака классификации задач оп-
тимизации целесообразно выбрать способ учета возмущающих (нео-
пределенных) факторов. Существуют три таких способа (подхода):
детерминированный, стохастический (вероятностный) и минимак-
сный. Аналогично называются и соответствующие задачи оптими-
зации.
При детерминированном подходе возмущающие факторы прини-
маются просто равными некоторым заранее заданным (из тех или
иных соображений) значениям . Тем самым устраняется пер-
воначальная неопределенность, и задача оптимизации становится
обычной детерминированной с целевой функцией Дх, £, = ) и фун-
кцией ограничений g(x, £ = £зад).
Заметим, что задачи оптимизации при отсутствии возмущений,
которые рассматривались ранее, естественно могут трактоваться как
частный случай при £ = 0.
При стохастическом подходе все возмущающие факторы трак-
туются как случайные (-случайный вектор) с заданными статис-
тическими характеристиками. Так как в этом случае целевая функ-
ция Дх, £) является случайной величиной, то имеющая место нео-
пределенность по отношению к ней может быть устранена путем пе-
рехода от исходной (первичной) целевой функции Дх, £) к какой-
либо ее статистической характеристике, которая теперь будет трак-
товаться в качестве вторичной целевой функции /(х). В простей-
шем случае такой характеристикой может быть математическое ожи-
дание
7(х)=Л/[/(хД)], (1.10)
здесь символ Л/означает операцию статистического осреднения по
совокупности всех случайных факторов £ .
При этом, конечно, следует иметь в виду, что использование
математического ожидания в качестве целевой (вторичной) функ-
ции обеспечит оптимальность искомому решению х* лишь в сред-
нем, по совокупности всех реализаций. В отдельных же реализаци-
ях это решение может оказаться далеким от оптимального или даже
12
просто неприемлемым. Учитывая это и стремясь контролировать не
только среднее значение целевой (первичной) функции, но и воз-
можные ее отклонения от этого значения, часто рассматривают ее
дополнительные статистические характеристики, например диспер-
сию
7доп(х) = М/(хЛ)-7«]2, (1.11)
вводя последнее либо в число дополнительных ограничений, либо в
число дополнительных целевых функций.
Сказанное в отношении целевой функции может быть полнос-
тью отнесено и к каждой из функций ограничений g(x, £). Правда,
здесь необходимо подчеркнуть, что часть ограничений может и не
носить стохастический характер, т.е. быть детерминированными.
Из сказанного следует, что при наличии случайных факторов
для исходной постановки задачи (в терминах первичных целевой
функции и функции ограничений) можно предложить различные
постановки задач оптимизации (в терминах вторичных целевых
функций и функции ограничений). Таким образом, постановка окон-
чательной стохастической задачи оптимизации является неформаль-
ным актом. В каждом конкретном случае вопрос об окончательном
способе учета случайных факторов должен решаться по-своему.
В простейшем случае, когда допускается использование в каче-
стве вторичных целевой функции и функции ограничений их мате-
матических ожиданий, постановка стохастической задачи оптими-
зации принимает следующий вид:
x*=arg minA/[/(x,£)],
хеХ
(1-12)
В данном случае условием хе X подчеркнут лишь факт нали-
чия дополнительного жесткого (детерминированного) ограничения
на вектор х.
Нетрудно заметить, что использование отдельных статистичес-
ких характеристик в окончательной постановке задачи оптимизации
не может гарантировать (в вероятностном смысле) приемлемого
13
результата во всех реализациях. Это становится возможным, если в
самой постановке стохастической задачи потребовать выполнение
всех ограничений, в том числе и непревышение (в данном случае
по вероятности) целевой функцией своего наименьшего значения.
Итак, рассмотрим событие, заключающееся в том, что первич-
ная целевая функция f(x,^) не превысит некоторого своего гаран-
тированного уровня fB и одновременно все ограничения будут вы-
полнены. Потребуем, чтобы вероятность этого события была не менее
заданной Р*, т.е.
Р{/(хЛ)<Д, g(x,y<0}>P\ (1.13)
Очевидно, что для каждого фиксированного хе X можно най-
ти свой (наименьший) уровень fB(x), при котором вероятностное
условие будет еще выполнено. Задача оптимизации теперь может
быть сформулирована как задача поиска такого вектора х*, который
обращает в минимум /в(х):
x*=argmin/B(x), (1.14)
естественно, при условии
Р{/(хЛ)</в,^(хЛ)<0}>Р*.
Таким образом, функция /в(х) в данном случае играет роль вто-
ричной целевой функции. По сути дела, задача сводится к поиску
такого вектора параметров х*, который обращает в минимум ниж-
ний уровень целевой функции /(х,^) и одновременно гарантирует
выполнение всех исходных ограничений с вероятностью Р*.
При минимаксном подходе все возмущающие факторы тракту-
ются как неопределенные факторы, для которых никакой статисти-
ческой информации нет, а известны лишь пределы их изменений,
, где Q — заданное множество допустимых векторов £. Как и
при стохастическом подходе, неопределённость первичной целевой
14
Функции устраняется путем перехода ко вторичной целевой функ-
ции. Однако ввиду того, что о векторе ничего теперь не известно,
кроме допустимого множества О, то естественно в качестве вторич-
ной целевой функции /м(х) принять наихудшее по всем допусти-
мым неопределенным факторам значение первичной целевой фун-
кции, т.е. функцию максимума
/м(х) = тах/(х,£). (1.15)
Тогда задача поиска оптимального решения х* в простейшем
случае принимает вид следующей минимаксной задачи:
x*=arg min max/(x,£). (1.16)
хеХ
Если неопределенные факторы содержатся и в функции огра-
ничений g(x,£), формирующих допустимое множество для х, то сами
ограничения теперь принимают вид
maxg(x,^)<0. (1.17)
Таким образом, при минимаксном подходе задача оптимизации
формулируется как задача поиска такого наилучшего решения, ко-
торое гарантирует достижение результата при любых наборах нео-
пределенных факторов из числа допустимых. Поэтому само опти-
мальное решение в этом случае принято называть гарантирующим,
а достигаемый при этом результат, определяемый, в свою очередь,
величиной первичной целевой функции — гарантированным.
В качестве третьего признака классификации может быть исполь-
зован класс допустимого множества X. Так, следует различать зада-
чи непрерывного и задачи дискретного (целочисленного) програм-
мирования.
В отличие от непрерывных задач математического программиро-
вания, в которых множество Xпредполагается непрерывным, в за-
дачах целочисленного программирования наряду с ограничениями,
15
определяемыми функцией g (х), дополнительно содержатся усло-
вия целочисленности, накладываемые либо на отдельные перемен-
ные, либо на все переменные одновременно. Для решения этих за-
дач требуются специальные методы. В настоящее время наиболее
успешно могут быть решены задачи линейного целочисленного програм-
мирования, а также задачи целочисленного программирования с адди-
тивными целевыми функциями.
Следующим признаком классификации оптимизационных задач
может служить количество целевых функций. По этому признаку
различают однокритериальные и многокритериальные задачи опти-
мизации.
К задачам однокритериальной оптимизации относят такие, в
которых целевая функция единственная, т.е./(х) является скаляр-
ной функцией. Все рассмотренные до этого задачи были однокри-
териальные.
К задачам многокритериальной оптимизации относят задачи, в
которых существует несколько целевых функций, или, другими сло-
вами,/^) является вектор-функцией. Формально постановка зада-
чи состоит в поиске
х* =argmin/(x), (1-18)
гдеДх) — вектор функция с компонентами
С математической точки зрения задача является некорректной.
Основные подходы по преодолению такого типа неопределённостей
состоят либо в сокращении множества вариантов решения путём
неформального анализа этих вариантов, использующего метод Па-
рето, либо во введении дополнительных гипотез, позволяющих све-
сти задачу многокритериальной оптимизации к задаче однокрите-
риальной оптимизации.
Иногда в качестве одного из признаков классификации предла-
гают использовать размерность задачи, которая оказывает существен-
ное влияние на процесс поиска оптимального решения. Однако
применение этого признака является малоконструктивным, так как
на его основе практически можно выделить лишь один своеобраз-
ный класс задач оптимизации, а именно задачи одномерной опти-
мизации, для которых удается создать высокоэффективные алгорит-
16
мы поиска. Что касается задач 6ojjee высокой размерности (начиная
с двух), то, как правило, простота (или сложность) решения их за-
висит не только от размерности задачи, но и от многих других фак-
। оров одновременно, к числу которых, как уже указывалось, отно-
ся гея и свойства целевой функции, и свойства ограничений и мно-
। ос другое.
2. НЕОБХОДИМЫЙ МАТЕМАТИЧЕСКИЙ АППАРАТ
Для удобства изучения дальнейшего материала ниже приводят-
ся некоторые математические сведения, широко используемые в
данном учебном пособии.
2.J. Матрицы и векторы
Под матрицей А размерности (мхи) понимается прямоугольная
таблица, состоящая из элементов и записанная в виде т строк и
и столбцов:
<flrn ai2 а\пУ
Л=Ы=а- а- _ а- •
@тп j
Если т = и, то матрица А — квадратичная матрица порядка и.
Две матрицы считаются равными, если = byj = \,m, j = 1,и.
Суммой матриц А и Я размерности (мхи) называется матрица С
размерности (мх и) с элементами с~ = а.. + Ьу.
Сложение матриц подчиняется ассоциативному и коммутатив-
ному законам:
Л + Я + С = (/1 + В) + С = Л + (Я + С);
А+В=В+ А.
Произведением матрицы А на число X называется матрица
17
Вычитание матриц определяется так:
Л-Я=Я + (-1)Я
Произведением матриц А(т* г) и В(г*п) называется матрица
С(тхп) с элементами
Cij = aik^ki3 С ~ = r# = aik^ki '
Л=1 || А-1
Произведение матриц ассоциативно:
АВС= (АВ)С = А(ВС),
но не коммутативно:
АВ* ВА.
Матрица Л называется нулевой, если все её элементы равны нулю:
а- = 0.
и
Очевидно, что имеют место равенства
А + 0 = 0 + А; Л0 = 0; 0Л = 0.
Замечание. Если произведение матриц равно нулю, то это еще
не значит, что одна из них или обе нулевые.
Квадратная матрица называется диагональной, если atj = 0 при
Квадратная матрица 1П порядка п называется единичной, если
4 ~ II §y II’ где §у ~ символ Кронекера.
ГО, если i * j;
ij [1, если i - j.
Матрица AT называется транспонированной по отношению к Л,
если 4=оу/.
Очевидно, имеют место соотношения'
(А + В)г= АТ+ ВТ,
18
(AV = А,
(AB)r = ВТАТ.
Квадратная матрица называется симметричной, если А = АТ.
Иногда матрицу удобно разбить на подматрицы, проведя услов-
ные прямые между строками и столбцами:
<Л11 Й12 Л13 । й14
°21 й22 а23 । fl24 ^41
Й31 fl32 fl33 । Л34
^41 о42 л43 |
I Аг
+ —
I А22)
где
<011 °12 «13
^«21 а22 «23
Ai -
Г°31
1^41
Аг “
(«14
(Л24
^32 а33
fl42 а43 J
Если мы имеем две матрицы, разбитые на подматрицы
fAi
и, если произведения определены, то
АВ =
( 41А1+42^21+Аз^31
АгА1 + ^2^21 + Аз^З!
19
Если матрица состоит из одного столбца, то это — вектор-столбец:
хТ = (хрх2,...,хи) — вектор-строка.
Вектор €j называется единичным, если все элементы его равны
нулю, кромеу-го, который равен единице:
Скалярное произведение двух л-мерных векторов определяется так:
S V = (х,у) = хту = утх.
1=1
Говорят, что квадратная матрица имеет обратную матрицу А~1,
если
= 4-
Если обратная матрица существует, то матрица А называется
неособенной, в противном случае — особенной.
Если А и В — неособенные матрицы, то имеют место равенства
(ЛВ)"1 = В~1А~\
(А1)-1 = (Л-1)7, (Л"1)"1 = Л.
Следом квадратной матрицы называют сумму её диагональных
элементов
/=1
20
2.2. Квадратичные формы
Квадратичной формой п переменных Х], х2,...,хп называется фун-
кция z, равная
1=1 >=1
Квадратичную форму можно представить в виде
Z = хТ Ах,
или
Z = Sp(AxxT) = Sp(xxT А),
где матрица А = ||а~||, а вектор х = Jx, ||, (i.j = 1, л).
В квадратичной форме матрицу А принято считать симметрич-
ной.
Квадратичная форма z = хтАх, а вместе с ней матрица А называ-
ется положительно-определённой, если 'z > 0 для любых х, не равных
нулю.
Квадратичная форма z — хтАх, а вместе с ней матрица А, назы-
вается отрицательно-определённой, если z < 0 для любых х, не рав-
ных нулю.
Квадратичная форма z = хТАх, а .вместе с ней матрица А, назы-
вается положительно-полуопределенной, если z>0 для любых х, и
существует х* 0, для которого z = 0.
Квадратичная форма z = хТАх, а вместе с ней матрица А, назы-
вается отрицателъно-полуопределенной, если z<0 для любых х, и су-
ществует х* 0, для которого z = 0.
Нетрудно видеть, что в случае двух переменных для положитель-
ной определенности квадратичной формы
Z - хТАх = al jXj2 + 2а12х1 + о22х^ = а1 1 X]
21
необходимо и достаточно выполнение условий
«„>0,
Яц
°21
°’2 >0
а22
В случае и переменных справедлива следующая теорема (кри-
терий Сильвестра).
А. Квадратичная форма z - хТАх положительно-определенна
тогда и только тогда, когда все определители Dk , к=Л,п, матриц
^=IKII’ = положительны, т.е.
Dk>Q, k = \,n, Dk=\ |ау| |, i,j = \,k.
Б. Квадратичная форма z = xTAx отрицательно-определенна тогда
и только тогда, когда
Dk < 0, если к — нечётное,
Dk > 0, если к — чётное.
2.3. Частные производные и ряд Тейлора
Градиентом функции fix) в точке х называется вектор-столбец
(их 1), составленный из первых частных производных
у.и <21)
дх dXj а-*0 а 1|
здесь ej — единичный вектор.
Гессианом функции Дх) в точке х называется матрица (лхм),
составленная из вторых частных производных функции
у = /(х1>...,хл):
Hf (х) = = V2/(x) =
7 dx2 || dxpXj
(2.2)
22
Гессиан — симметричная матрица, так как
ЭУ(Х) _ э2/ ,
dXjdXj dXjdX! ’
//; = wz.
Ряд Тейлора для функции у - Дх), где у — скаляр, ах— вектор
при разложении относительно точки х* с точностью до второго по-
рядка малости, можно представить в следующем виде:
„ ^Э/(х*Ь 1 " « э2/(х*)/
= fix') + ) (х - х‘)+1 (х - х')т - > (х - х*) (2.3)
Эх 2 Эх2
или
У = fix' ) + VfT (х' )(х - X*) + | (х - х* )г Hf (х*) (х - X* ).
Производной скалярной функции у — fix) по направлению г, где г
— ненулевой вектор размерности п, называется предел
D /(x) = lim^ t «C).-/W.
г а—>0 а
Используя ряд Тейлора для функции /(х+аг), можно получить
Df(x) = lim /WtV/U)w-/W = Vyr (л)г
г а->0 а
Якобианом вектор-функции у = g(x) размерности m векторного
аргумента х размерности п называется матрица размером (их т), со-
ставленная из первых частных производных:
Л = ? = |М '=^ / = (2.4)
х Эх Эх,-
23
Ряд Тейлора для функции у - g(x) может быть представлен в
следующем виде:
У; = g(x') + Ёу^(Х - Х’)\
i - \,пт,
или более компактно
y=g(x*) + ffi* > (х-х‘). (2.5)
dx
Если функция z=Л^(х)], где z — скаляр, g — вектор размерно-
сти /и, х — вектор размерности я, то
Эг = А = у У-^lL yjfcJL
р*у ь1^Эху|| рЭхуЭ^.
или в векторном виде
Эх Эх dg
Если z - хтАх — квадратичная форма, причем Ат= Л, то
dz
Эх
= Атх+Ах = 2Ах,
3. ТЕОРЕТИЧЕСКИЕ ОСНОВЫ
МАТЕМАТИЧЕСКОГО ПРОГРАММИРОВАНИЯ
В данном разделе приводятся минимальные сведения по теоре-
тическому обоснованию методов оптимизации, излагаемых в учеб-
24
ном пособии. По существу речь идет о необходимых и достаточных
условиях оптимальности.
3.1. Определения минимума и максимума
Говорят, что функция /(х), определённая на множестве X, до-
сгигает в точке х абсолютного (глобального) минимума, если
/ (х*) < /(х) для любого хе X.
Функция /(х) достигает в точке х относительного (локального)
минимума, если неравенство /(х*)< /(х) имеет место для любого
допустимого х из е-окрестности точки х*, то есть для х, удовлетво-
ряющего
|х-х* |<£, хе X, £>0.
Аналогичные определения можно дать для абсолютного и отно-
сительного максимума. Отличие состоит лишь в знаке неравенства,
которое для максимума имеет вид f(x*)> f(x).
Минимум и максимум называются экстремумами функции.
Различают сильные и слабые экстремумы. Если в соответствии с
определением соответствующее неравенство определяется строго
f(x*)<f(x) или f(x*)>f(x),
то экстремум называют сильным (строгим), в противном случае —
слабым (нестрогим).
Если в точке х функция f(x) достигает минимума, то функция
—f(x) в этой точке х* достигает максимума. Учитывая это обстоя-
тельство, в дальнейшем всюду за основу принимается рассмотрение
задачи минимизации функции.
Иллюстрация приведенных определений представлена на рис.
3.1, где показано, что функция f(x) имеет следующие экстремумы:
— сильный относительный минимум в точке 1;
— сильные относительные максимумы в точках 2 и 4;
— абсолютный минимум в точке 3;
25
Рис. 3.1. Экстремумы функции
— слабый относительный
минимум в точке 5;
— точка 6 является точкой
перегиба.
Упражнение 1. Показать, что ряд
Тейлора функции/(х), полученный
разложением в окрестности точки х
с точностью до членов второго по-
рядка малости, имеет вид
/ (х) = / (х*)+V/r (х*) (х - х*)+
+^{х-х')т Hf(x")[x-xy
Упражнение 2. Показать, что
^) = 7Л(х)г.
3.2. Необходимые условия оптимальности
Под необходимыми условиями оптимальности понимаются ус-
ловия, которым удовлетворяет функция /(х) в точке своего отно-
сительного минимума.
Пусть х* •— точка относительного минимума. Будем полагать,
что f (х) имеет непрерывные частные производные первого поряд-
ка по всем компонентам вектора х. Тогда из определения относи-
тельного минимума следует
/(х*)</(х), хеХ, |х-х*|<е.
Зададим х в виде
х = х* + аг, хеХ, а>0.
Здесь вектор г определяет допустимое (возможное) направле-
ние, т.е. такое направление, при котором вектор х = х* +w не вы-
ходит за пределы допустимого множества X.
26
По определению,
/(х* + аг)-/(х*) > о
а
(3.1)
Раскладывая числитель выражения (3.1) в ряд Тейлора в окрес-
тности точки х* и переходя к пределу при а—>0, получим
^£2 = V/r(/)r>0. (3.2)
Эг
Таким образом, для точки х* относительного минимума функ-
ции /(х) на множестве X производная по любому возможному на-
правлению г неотрицательна.
Условие (3.2) является необходимым условием оптимальности в
задаче минимизации функции /(х) на множестве X.
Точка х*, удовлетворяющая необходимым условиям оптималь-
ности, называется стационарной. Появление этого термина связано
с тем, что необходимые условия оптимальности в общем случае лишь
выделяют точки, подозреваемые как точки минимума, но не опре-
деляют их окончательно. Для окончательного решения задачи необ-
ходимо воспользоваться дополнительными условиями, например,
достаточными условиями оптимальности.
Если /(х) имеет абсолютный минимум в точке х*, то эта фун-
кция в этой точке имеет и относительный минимум.
Поэтому для определения точки, в которой /(х) достигает аб-
солютного минимума, необходимо вычислить /(х) во всех стацио-
нарных точках и выбрать ту из них, в которой функция достигает
наименьшего из полученных значений.
Упражнение. Показать, что необходимые условия оптимальности в
задаче максимизации функции /(х) на множестве X имеют вид
^Ll = VfT(x)r<0, (3.3)
Эг
где г — допустимое направление.
27
3.3. Достаточные условия оптимальности
Достаточные условия оптимальности в задачах математическо-
го программирования тесно связаны с понятием выпуклых множеств
и выпуклых функций.
Множество Xназывается выпуклым, если отрезок, соединяющий
две его любые точки, полностью принадлежит этому множеству
(рис. 3.2).
xleX, х2сХ, х = х* + a(x2-xl)e X, 0<а< 1. (3.4)
Выпуклое
Невыпуклое
множество
Рис. 3.2. Выпуклое и невыпуклое множества
Функция называется выпуклой на выпуклом множестве X
(рис. 3.3), если для любых точек х1 е X, х2 е X имеет место следу-
ющее неравенство:
/(х) = Дх1 +а(х2 -х^^Дх^ + ^Дх^-Дх1)], 0<а<1. (3.5)
Пример выпуклой функции представлен на рис. 3.3. Определе-
ние вогнутой (выпуклой вверх) функции аналогично. Достаточно в
неравенстве (3.5) изменить знак на противоположный.
Чтобы точка х* удовлетворяющая необходимым условиям оп-
тимальности, была точкой минимума на выпуклом множестве, дос-
таточно потребовать вылуоос/им функции^ f(x) на множестве X.
Для доказательства этого утверждения предположим противное.
Пусть существует точка х*еХ, такая, что f(x})<Дх*). Тогда, в
силу выпуклости функции Дх), имеем
28
f(x)
ffa)
\/fr9
f(x)
X/ X
X2 X
Рис. 3.3. Выпуклая функция
/(x) = Дх1 + a(x2 -x*)]</(x’J + aftx^ + aLAx2)-/(х1)], 0<а<1.
Введем обозначения:
а = f(x*)-f(xl)9 г = х*-х*.
Очевидно, что а > 0, а г — допустимое в силу выпуклости мно-
жества Xнаправление. Поэтому
/(x-t-ar)-/(x)^_a<0
При а-»0 получим
^2<0,
что противоречит условию (3.1). Таким образом, необходимое усло-
вие оптимальности (3.1) в случае выпуклости функции f(x) явля-
ется достаточным условием достижения в точке х* минимума.
Упражнение 7. Показать, что определение выпуклого множества
(3.4) эквивалентно следующему: множество Xвыпукло, если из ус-
ловий х1 е X, х2 е X для любых а>0,р> 0 , таких, что a+p-1, сле-
дует Рх1 + ах2 е X .
Упражнение 2. Показать, что определение выпуклой функции
(3.5) эквивалентно следующему: функция /(х) выпукла на выпук-
лом множестве X, если из условий х1 е %, х2еХ для любых
a > 0, р > 0, таких, что a+p = 1, следует /(Рх1 + ах2) <p/(xJ) + с/(х2).
29
Упражнение 3. Показать, что для дифференцируемой функции f(x) оп-
ределение выпуклости эквивалентно следующему: функция f(x) выпукла
в том и только в том случае, если для любых х1 е X, х1 е X имеет место
условие /(х2)> /(№) + VfT(xx)(x2 -х1).
Упражнение 4. Показать, что условие (3.3) является достаточным ус-
ловием достижения вогнутой функции /(х) в точке х* своего максималь-
ного значения.
Упражнение 5. Показать, что если g(x) — выпуклая функция, то мно-
жество, определенное условием g(x) < b, где b — константа, будет выпук-
лым.
4. КЛАССИЧЕСКИЕ ЗАДАЧИ МАТЕМАТИЧЕСКОГО
ПРОГРАММИРОВАНИЯ
В данном разделе рассматриваются необходимые и достаточные
условия оптимальности в классических задачах оптимизации, т.е. в
задачах минимизации (максимизации) функции /(х), когда нах либо
не накладывается никаких ограничений (задачи на безусловный
экстремум), либо ограничения имеют вид равенств, накладываемых
на вектор х (задачи на условный экстремум). В конце раздела дается
обобщение на случай задачи нелинейного программирования, ког-
да имеют место ограничения как в виде равенств, так и в виде нера-
венств.
4.1. Задачи на безусловный экстремум
Необходимые условия оптимальности. Рассмотрим сначала клас-
сическую задачу минимизации функции /(х), когда на х не накла-
дывается никаких ограничений:
х* = arg min /(х).
Л
Так как в данном случае любое направление г, исходящее из
точки х*, является допустимым, в том числе и —г одновременно,
необходимое условие оптимальности принимает более простой вид:
30
V/(x') = O.
Действительно, пусть f(x) в точке х* имеет относительный
минимум. Тогда существует е > О, такое, что для всех х из е -окре-
стности точки х* выполняется условие /(х)>/(х*).
Рассмотрим точку х из е -окрестности:
х = х*+аеу-, |а|<Е, — единичный вектор.
Тогда /(х* + аеу) > Дх*), для всех j = 1,л, п — размерность
вектора х.
Так как а может быть и положительным, и отрицательным, по-
лучаем
/(х*+ау)-/(х*)
а
>0, а>0;
/(х*+ау.)-/(х*)
а
а<0,
или, при переходе к пределу при а—>0
М>о, ^2<о.
Ъх. Ъх.
Эти равенства выполнимы одновременно, когда —- - 0 , что
Эх.
и означает
v/(X-)=^L>=o.
Другими словами, градиент функции /(х) в точке минимума
при отсутствии ограничений равен нулю.
31
Упражнение. Показать, что равенство нулю градиента функции /(х)
имеет место и в точке относительного максимума.
Достаточные условия оптимальности. Получим теперь доста-
точные условия оптимальности в данной задаче, связав понятие вы-
пуклости функции с понятием гессиана.
Так как необходимые условия оптимальности в точке х пред-
полагаются выполненными, то описание /(х) в е-окрестности точ-
ки х с помощью ряда Тейлора можно представить в следующем виде:
/(x) = /(x*) + ^AxrHz(x*)Ax, Ах = х-х*.
Отсюда получаем следующие выводы.
А. Чтобы точка х была точкой слабого минимума, достаточно
положительной полуопределённости гессиана ЯДх*), т.е. выпол-
нения условия
ДхгЯу(х*)Дх>0 для любого х*0.
Б. Чтобы точка х* была точкой сильного минимума, достаточно
положительной определённости гессиана Я^(х*), т.е.
ДхгЯ/(х*)Ах>0.
Аналогично можно показать, что в задаче на безусловный мак-
симум функции /(х) достаточное условие слабого (сильного) мак-
симума сводится к требованию отрицательной полуопределённости
(определённости) гессиана в подозреваемой точке х*.
В свою очередь, необходимым и достаточным условием поло-
жительной (отрицательной) определённости матрицы Hj согласно
критерию Сильвестра является выполнение условий:
а) для положительной определенности
Я* > 0; для всех £ = 1,л;
32
б) для отрицательной определённости
Я* < О, если к — нечётное, М > О, если к — чётное,
где М определитель матрицы ЦЯ^-И, /,j = l,fc.
Пример, Требуется исследовать на экстремум функцию
f(x) = xf +Х2+Х3 + XjX2 - 2х3 + 2.
Последовательность действий следующая. Прежде всего найдем
градиент функции /(х). Из необходимых условий оптимальности,
приравнивая градиент нулю, найдем стационарную точку х*.
Далее для проверки достаточных условий оптимальности вычис-
лим гессиан функции Hf(x*), проверим его на положительную (или
отрицательную определенность) с помощью критерия Сильвестра
<2х1 + Х?
Vf(x*)= 2x2+Xj =0; х
2х3 - 2 ,
2 1
1 2
(2 1 0А
<0А р 1 0
0 ; Н = 1 2 0
1 0 0 2
0 0 2
Я’=2>0; Я2 =
= 3>0; Я3=|Я| = 6>0.
Нетрудно видеть, что в данном случае стационарная точка един-
ственная, гессиан не зависит от х* и является положительно-опре-
делённой матрицей. Это значит, что точка х* является точкой ми-
нимума функции /(х).
Упражнение 1. Получить условия положительной и отрицательной
определенности для случая трех переменных.
Упражнение 2. Показать, что дифференцируемая функция /(х) вы-
пукла, если ее гессиан является положительно-полуопределенным.
Упражнение 3. Исследовать на экстремум функции:
а) /(х) = х3 + х3 + х3 - х2х3 - 3xj + 6x2 + 2;
б) f (х) = 2х3 + 2х? + х2 + х2х3 + 4xjX2 + 3.
33
4,2. Задачи на условный экстремум.
Необходимые условия оптимальности
Рассмотрим теперь задачу на условный экстремум, состоящую
в минимизации функции /(х) при наличии ограничения g(x) = 0:
x*=argmin /(х).
g(x)=0 '
(4.1)
Здесь g — вектор-функция размерности т; х — вектор размерности
п. Предполагается, что п> т.
Частный случай. Получим сначала необходимые условия опти-
мальности для частного случая, рассматривая задачу с двумя пере-
менными и одним ограничением:
x* = arg min /(х.,х,).
<(Х1Л2)=0 1 1
(4.2)
Пусть условный экстремум достигается в точке х*(хр х*г}, Пред-
положим, что в этой точке существуют частные производные пер-
вого порядка для функций /(х) и £(х).Тогдав е-окрестностиог-
раничение может быть заменено его линейным приближением:
g(x) = g(x') + Sg(x ?(Xj - х’) + ^1(х2 -xj) = 0.
Эх, 11 Эх2 2
Предположим, что хотя бы одна из производных (например,
dg(x*)
—— ) не равна нулю. Тогда можно записать
x =_ dg(£) 1 5g(x‘)
1 dX| 3x2
где c =
9g(x’) 1 dg(x)
3Xj 3x2
x2'-g(x’) +X,’.
34
Теперь целевую функцию ffy, Xj) можно представить в виде
с ложной функции xj одного аргумента х2, по которому и
необходимо минимизировать, но уже без учёта ограничения. Таким
образом, задача на условный экстремум функции двух переменных
свелась к задаче на безусловный экстремум функции одного пере-
менного. Необходимые условия оптимальности при этом примут вид
э/(х )Эх,(х>) tэ/(х)^0
Эх, дх2 Эх2
Учитывая, что в данном случае имеет место соотношение
Эх,(х')
Oxj
ag(x’)
^g(jc*)
получим
_э/(х-)Гэг(х )Г' ag(x') + э/(х*) = 0
Эх, Эх, Эх2 Эх2
V
Введём обозначение
? ♦ _ Э/(х') 3g(x*)
Эх, Эх,
Тогда условия оптимальности можно представить в виде
Э/(х)1ГЭ^(х)^0;
Эх, Эх,
a/(/)irW)=Q>
Эх2 Эх2
где одно из условий определяет собственно X*. Таким образом, если
точка (х,*, хр является точкой условного экстремума, то она долж-
на удовлетворять соотношениям
35
dXj dXj
W)+V^)=O;
dx2 dx2
(4.3)
g(xt*,x2) = O.
Полученные необходимые условия экстремума могут быть за-
писаны более компактно, если ввести в рассмотрение так называе-
мую, функцию Лагранжа
F(Xj, х2, Х) = /(Хр x2)+Xg(x1, Xj), (4.4)
где X — множитель Лагранжа.
Рассмотрим частные производные функции Лагранжа по хр %
и X:
(Ц dXj dxt ’
=
Эх2 Эх2 Эх2
С учетом этого необходимые условия оптимальности (4.3) мо-
гут быть представлены в виде
9F(x‘,X‘) ЭГ(х’,Г)_
дх} ’ 7’ ’ ЭХ ’
или в векторной форме:
WX) . ЭГ(х-,Г)
Эх ’ЭХ v ’
36
Точку х*, удовлетворяющую необходимым условиям оптималь-
ности, будем называть стационарной точкой в задаче на условный
жстремум.
Рассмотрим геометрическую интерпретацию задачи на условный
жстремум для функции двух переменных X] и х2. На рис. 4.1 пред-
ставлены линии уровня /(х) = С, причем Ц < С2 < С3 < С4.
Рис. 4.1. Геометрическая интерпретация задачи на условный экстремум
Из рисунка видно, что точки касания кривой g(x1, хр с лини-
ями уровня, а именно точки 1, 2, 3, 4являются стационарными, то
есть удовлетворяют необходимым условиям оптимальности. При
этом точка 1 является точкой абсолютного минимума; точка 2 не
является ни минимумом, ни максимумом — это точка перегиба; в
точке 3 функция достигает относительного максимума , а точка 4
является точкой относительного минимума. Для отыскания точки
абсолютного условного минимума необходимо вычислить значения
функции во всех стационарных точках и выбрать наименьшее из них.
Общий случай. Рассмотрим теперь задачу в общем случае п пе-
ременных и т ограничений, полагая п> т:
x*=argmin Дх). (4.6)
g(x)=O
37
Здесь х — вектор размерности л; g — вектор-функция размерности
т. Пусть условный экстремум достигается в точке х*, а функции /(х)
и £(х) в точке х* имеют частные производные первого порядка. В
е-окрестности точки х* ограничение может быть заменено его пер-
вым приближением
g(x) + ^p4x-x‘) = 0.
Эх
Эх п Эху. II
/ = 1,л?, у = 1, п — якобиан функции g(x) в
точке х*, матрица размерности п* т.
гт 3g _
Представим вектор х и матрицу — в блочном виде:
дх
Здесь через Xj обозначен вектор, составленный из т компонент
вектора х, т.е. вектор размерности л/, а через х2 — вектор, состав-
ленный из оставшихся п—т компонент вектора х, т.е. вектор раз-
мерности п—/и;
Эу Jdg/x')
Э%! Эху.
i,j = l,m — якобиан функции g по хр квадратная
матрица размерности /их т;
Эя |Эя(х*) . 1. ---------=—
—2- = п—-----, / = 1,л!, / = т + 1,л — якобиан функции g по х2,
Эх2 | Эх,- ||
матрица размерности (л—т) х т.
Перепишем выражение для ограничения в следующем виде:
38
g(x*) + - xj) + ^рЧх2 - x2) = 0.
dXj 1 1 dX2 z z
Полагая, что — неособенная матрица, получим выраже-
ние ДЛЯ Хр
Эх,
g(x‘) + a^x) (Хд-Х*) .
Эх2
Подставляя Xj в выражение для целевой функции, мы сводим
задачу на условный экстремум функции п переменных (по вектору
х) к задаче на безусловный экстремум функции /[х^(х^), xj п—т
переменных (по вектору х2).
Воспользуемся необходимым условием оптимальности
Э/(х) |рх|Уэ/(х,),0
Эх2 [9xj J Эх,
__ Эх.(х*) Гдх.(х*Й . 1— . ----—
Матрицу —5-----= —г----- , / = 1,т, у = /и + 1,л
Эх2 Эху J
определим,
дифференцируя полученное выражение для х(:
fo* dg(x*)pg(x‘)
дх2 Эх2 I ЭХ|
Учитывая это, необходимое условие оптимальности примет вид
Э/(х)
Эх2
' dg
Эх2 I
'э/ у'1э/(х‘)
Эх, I 3xj
= 0.
39
Введём в рассмотрение вектор X* размерности т :
г=||х;||
Эх, Эх ’
i = 1,/и.
Можно считать, что вектор X* определяется как решение урав-
нения
W+^L)V=O.
Эх, Эх,
Само условие оптимальности при этом примет вид
Эх2 Эх2
Формально последние два соотношения можно объединить в
одно:
^V)+^L)V=0.
Эх Эх
Именно оно совместно с условием g(x*) = 0 и представляет со-
бой необходимое условие оптимальности в задаче на условный экст-
ремум.
Аналогично двумерному случаю, введем в рассмотрение функ-
цию Лагранжа следующего вида:
Л*Х) = f(x) + Xrg(x) = f(x) + , (4.7)
(=1
где X — вектор множителей Лагранжа размерности т.
Так как имеют место соотношения
Эх Эх Эх L ‘
40
i<> необходимые условия оптимальности могут быть представлены в
следующей компактной форме:
9F(Z,V)_ ЭЛ/,Г)
Эх ’ ЭХ
(4.8)
или в развернутом виде
ЭЛ/,Г) Э/(/),^. 9g,.(/)
Эху Эху £ ' Эху
= 0;
ЭЛ/Л’) , .4 а .7- .7—
—------i = g,(x) = 0, у = 1,л, 1 = 1,т.
0Л-
(4.9)
Упражнение 1. Показать, что необходимые условия оптимальности (4.8)
имеют силу и при = 0, правда, теперь при условии ^х-- * 0.
Эх2
Упражнение 2. Вывести необходимое условие оптимальности (4.8) для
задачи на условный экстремум в общем случае.
Упражнение 3. Показать, используя условия (4.9), что имеют место
равенства
г_ Э/(х)
где через хп+/ обозначена компонента, численно равная /-му ограни-
чению xn+i = g,(x*), т.е. каждый множитель Лагранжа Л- характери-
зует скорость изменения целевой функции на оптимальном реше-
нии при изменении соответствующего ограничения.
4.3. Седловая точка функции Лагранжа. Достаточные
условия оптимальности в задаче на условный экстремум
В теории оптимального управления важное место занимают так
называемые прямая и двойственная задачи.
Прямой задачей принято называть минимаксную задачу по от-
ношению к функции Лагранжа
Лх,Х) = /(х) + Х^(х)
41
следующего вида:
p(x*) = ininmaxF(x,X). (4.10)
Здесь введено обозначение для функции максимума
р(х) = тахГ(хД). (4H)
Таким образом, решение прямой задачи состоит в определении
минимума функции максимума:
р(х*) = пппр(х). (4.12)
Нетрудно убедиться, что решение прямой задачи совпадает с
решением исходной задачи на условный экстремум по минимиза-
ции функции f(x) при условии g(x) = 0.
Действительно,
р(х) = max /"(хД) =
X ©о
g(x) = 0;
g(x)*0,
и, следовательно,
p(x') = minp(x)= min Дх). (4.13)
X g(x>0
Именно поэтому минимаксная задача по отношению к функ-
ции Лагранжа называется прямой задачей.
Двойственной задачей будем называть максиминную задачу по
отношению к функции Лагранжа:
Л(Х*) = тахттГ(хД), (4.14)
где введено обозначение для функции минимума
A(X) = min £(хД).
(4.15)
Двойственная задача имеет большое значение, так как во мно-
гих случаях её решение также совпадает с решением прямой задачи.
42
I Io в отличие от прямой задачи, которая по существу является ис-
ходной задачей на условный экстремум, двойственная задача сво-
дится к решению двух задач на безусловный экстремум. А это озна-
чает, что практически получить решение двойственной задачи про-
ще, чем решить прямую задачу.
Рассмотрим важный случай, когда решения прямой и двойствен-
ной задач совпадают. Предположим, что функция Лагранжа Г(х,Х)
и меет единственный (безусловный) минимум по х при любом X.
Тогда в силу необходимого условия такого минимума имеем
ЭГ(х,Х)_Э/ , Э$, 0
Эх Эх Эх
Обозначим решение этого уравнения через х = х(Х). Другими
словами,
minF(x,X) = F(x,X) = A(X).
Если X = X* — вектор множителей Лагранжа, который соответ-
ствует задаче на условный экстремум, то х = х*, g(x*)=0 и получа-
ем
Л(Х*) = Г(х,Х*) = /(х*).
Для произвольного X
/*(х*,Х) = /(х*).
Поэтому
Л(Х)</(х*) = А(Х*),
что означает
й(Х*) = тахЛ(Х),
или
Л(Х*) = /(х*) - F(x*,X*) = max min F(x,X).
X x
43
Таким образом, решение задачи на условный экстремум функ-
ции /(х) при ограничении g(x) = 0 свелось к решению задачи на
максимин функции Лагранжа.
В этом случае
р(х) = А(Х*),
или в развёрнутом виде
min maxF(x,X) = max min F(x,X). (4 16)
Это равенство эквивалентно следующему условию:
F(x*X<F(x^X)<F(xXl (4.17)
Точка (х*, X*), удовлетворяющая последнему условию, называ-
ется седловой точкой функции Лагранжа.
Наличие седловой точки является достаточным условием опти-
мальности в задаче на условный экстремум функции /(х) при ог-
раничении g(x) = 0. Покажем это. Пусть (х*, X*) — седловая точка
функции Лагранжа F(x*, X*). Тогда для любого X
/(х‘)+M’gtx') < F(x‘Д‘) = /(х’)+ (k')Tg(x‘).
Отсюда следует
(X*-X)rg(x*)>0.
Для любых X это будет выполняться только тогда, когда g(x*) = 0.
С другой стороны, для любого X
ЛхХ) = /(х,)+(Г)7’5(х) = /(х’)<Г(хЛ,)=/(х)+(%,)^(х),
и если g(x) — 0, то /(х*) < /(х). Следовательно, точка х* является ре-
шением задачи на условный экстремум.
Таким образом, наличие седловой точки (х*, X*) функции Лаг-
ранжа F(x, X) вида (4.17) является достаточным условием оптималь-
44
пости х* в задаче на условный минимум функции /(х) при ограни-
чении g(x) = 0.
В качестве примера использования достаточного условия опти-
мальности рассмотрим пример по исследованию функцию
/(х) = х2 + х^ на экстремум при условии xt + х2 =1.
Составим функцию Лагранжа:
Г(хД) = Xj2 + xj + Х,(1 - х, - х2).
Из необходимых условий оптимальности следует:
ЭГ(х*,Х‘) 0 п. ЭГ(х*,Х*) • , .
— = 2х. - X =0; —2—- = х. + х7 -1;
1 Эх2 1 1
dXj
♦ X * X * *'1*1
х, =—, х2=у; х, +^=Х =1,
. . 1
откуда xt =х2 =-.
Обратимся теперь к достаточным условиям оптимальности, для
чего исследуем функцию F(x, X) на безусловный экстремум по х
для любого X. Необходимое условие оптимальности в этом случае
примет вид
ЭГ(х,Х) . п ЭГ(х,Х) n ~ X _ X
—i-i-Z = 2х. -X = 0; £• = 2хэ -Х = 0; х,=-; хэ=~.
1 Эх2 2 2 2 2 2
Вычислим гессиан функции F:
„ 3^ 2 0
f Ох2 0 2’
Я} = 2, Я2 =4.
Видим, что Hj — положительно-определенная матрица. Поэто-
му в точке Xj =
2
функция Лагранжа имеет единственный ми-
45
нимум при любом X. А это, в свою очередь, означает, что функция
Лагранжа F(x, X) имеет седловую точку. В соответствии с доста-
• * X
точными условиями оптимальности точка Xj = х2 = ~ является точ-
кой минимума в задаче на условный экстремум.
К решению задачи можно подойти иначе. Если допустить зара-
нее наличие седловой точки функции Лагранжа, то можно сразу
перейти к решению двойственной задачи.
На первом этапе ее решения нужно найти безусловный мини-
мум функции Лагранжа по х:
А(Х) = min F(x,X).
X
Нетрудно получить
»A £V - ~ 1 \ 'l Г1 'l
h(k) = F(x} =xvx2=x2,X) = — + — + X\ 1---- = А.-~.
1 * z z 4 4 I 2 2 J 2
На втором этапе решения двойственной задачи необходимо най-
ти безусловный максимум функции А (X) по X:
А(Х*) = тахА(Х).
Из необходимых условий оптимальности получим
^р = 1-Г=0, Г = 1. § = -1.
оХ оХ
На основе достаточных условий оптимальности устанавливаем,
что точка X* = 1 является точкой максимума функции h (X). Таким
образом, решение двойственной задачи имеет вид
x1*=x,(X = V) = |; х£=хД=Х,’)=|
и совпадает с решением прямой (исходной) задачи.
46
Упражнение 1. Показать, что соотношения
min max F(x,X) = maxmin Г(х,Х) и F(x* ,Х) < F(x*,X*) < F(x,X*)
х Л X X
»квивалентны. Наличие ограничений вида хе А', Хе А не изменяет дан-
ного результата.
Упражнение 2. Показать, что F(x, X) имеет седловую точку, если для
любого X существует единственный минимум функции F(x, X) по х.
Упражнение 3. Показать, что в задаче на отыскание максимума f (х) при
условии g (х) = 0 прямая задача имеет вид
Р(х*) = max mm F(x,X),
а двойственная — вид
й(Х) = min max F(x,X).
Упражнение 4. Показать, что если имеют место условия
F(x ,X)>F(x*,X’)>F(x,X’),
то функция /(х) достигает в точке х* максимума при условии g (х)=0.
4.4. Направление наибольшего изменения функции
Рассмотрим задачу определения направления наибольшего убы-
вания функции /(х) в заданной точке х. Задача имеет важное при-
кладное значение, так как ее решение используется во многих чис-
ленных методах поиска оптимального решения. В данном случае
целевой функцией является не сама функция /(х) , а ее производ-
ная по направлению в точке х:
z = O/(x) = ^^ = V/(x)rr, |г|=1, ггг = 1. (4.18)
г дг
Задача заключается в нахождении такого вектора г*, который
обращает целевую функцию в минимум.
Как уже указывалось, для решения задачи можно применить два
похода: первый основан на использовании необходимых условий
47
оптимальности с последующей проверкой достаточных условий оп-
тимальности. Второй подход базируется на сведении прямой задачи
к двойственной и решении последней.
Функция Лагранжа в данном случае имеет вид
F(r,X) = V/rr + X(rrr-l).
Первый подход. Согласно необходимым условиям оптимально-
сти вектор г* должен быть решением следующей системы уравне-
ний:
Э/?(г ) = V/(x) + 2Х*г* = 0;
dr
эх 1 1
Отсюда находим
r*=--JvV/(x);
4(Х*)2 =|V/(x)|2, X*=±||V/(x)|,
Чтобы ответить на вопрос, достигает ли целевая функция в ста-
ционарной точке минимума или максимума, исследуем функцию
Лагранжа на безусловный экстремум. Из необходимых условий оп-
тимальности получаем
Так как гессиан
"/ = 1^=2Ч
является положительно-определённым при X > 0, а при X < 0 —
отрицательно-определенным, то при X > 0 функция Лагранжа имеет
48
ио г единственный минимум, а ири X < 0 — единственный макси-
мум. Таким образом, при X > 0 функция Лагранжа имеет седловую
гонку вида
ЛАХ)<£(ЛХ*)<Г(г,Х*),
и в соответствии с достаточными условиями оптимальности вектор
(4.19)
совпадающий с направлением антиградиента функции /(х) в точке
х, определяет направление наибольшего убывания функции /(х) в
этой точке.
Второй подход. Рассмотрим сразу двойственную задачу. Так как
функция Лагранжа при X > 0 имеет по г единственный минимум,
то решение двойственной задачи совпадает с решением прямой (ис-
ходной) задачи.
При X > 0 двойственная задача сводится к следующей:
/(г*) = Л(Х*) = шахЛ(Х), Л(Х) = min Г(г,Х).
X г
Так как из условия минимума Тпо г получаем
то, подставляя последнее в выражение для функции Лагранжа, на-
ходим
й(х)=-!^--х.
Из необходимых условий оптимальности для h получаем
ЭЙ(Г)_ |v/|2
ЭХ 4(Х*)2
49
Отсюда находим стационарную точку
Г-И
х 2 '
На основе достаточных условий оптимальности для h
Ж). М2 _ 4
ЭХ2 2(Х’)3 |V/|
получаем, что h (X) в точке X* достигает своего максимума. Отсю-
да
/=г(Х = Х’)
V/
|V/|‘
Полученное значение г и определяет направление наибольше-
го убывания функции /(х) в точке х.
Упражнение 1. Показать, что направление наибольшего возрастания
функции f(x) в точке х определяется вектором г - т е- совпадает с
направлением ее градиента в этой точке.
Упражнение 2. Показать, что в задаче определения направления наи-
большего возрастания функции /(х) двойственная задача сводится к сле-
дующей:
Л(Х*) = min ЛД), ЛД) = max F(r Д).
При этом минимум функции Л (1) достигается в точке
и
Г--12±1
2
V/
j^i определяет направление наибольшего возрастания функции /(х).
4.5. Интерпретация множителей Лагранжа
Пусть скалярная функция z — f(x) в точке х* достигает услов-
ного экстремума при ограничении g(x) = Ь, где b — вектор. Пусть
50
Л* — множитель Лагранжа, соответствующий значению х*. Очевид-
но, что х*, X* зависят от вектора параметров Ь. Предположим, что
ла зависимость является непрерывной дифференцируемой функцией
по Ь.
Вычислим градиент функции г* = /(х*) = /[x*(Z>)] по вектору b :
ЪЬ ЪЬ Эх'
Продифференцируем векторную функцию g[x*(Z>)] по вектору
Ь. Получим
^£-/=о,
дЬ дх
где I — единичная матрица.
Умножим это выражение на X* и сложим с выражением для
градиента:
Эг*
Эд
= д/ Э/- bg\. .
bb Ьх Эл
В силу необходимых условий оптимальности имеем
Эх Эх
отсюда
= (4.20)
до
Таким образом, антиградиент экстремума целевой функции по
вектору b равен вектору множителей Лагранжа X*, вычисленному
при заданном Ь. Если под z понимать стоимость, а под b — затраты
некоторых ресурсов, то /-я компонента вектора X* характеризует
скорость изменения минимальной стоимости z при изменении /-го
вида ресурсов.
51
4.6. Условия оптимальности Куна и Таккера
Рассмотрим некоторое обобщение классических условий опти-
мальности на случай задачи нелинейного программирования, в ко-
торой имеют место ограничения типа неравенств.
Итак, рассмотрим задачу минимизации функции f(x) при ус-
ловиях
g(x)<0 {g((x)<0; ; = йй}.
Покажем, что необходимые условия оптимальности и в этом
случае могут быть сформированы с помощью функции и множите-
лей Лагранжа. С этой целью введём дополнительные переменные
*л+, =-£/(*); ' = 1^-
Тогда исходная задача формально принимает вид задачи на
условный экстремум при условиях неотрицательности дополнитель-
ных компонент
xn+i+8iM = ^ i =
Введем в рассмотрение два множества:
Л={':^+, =°};
Рассмотрим функцию Лагранжа следующего вида:
F(x,X,a) = f(x)+[хи+1. + g,.(x)] + £ а,х„+1.
1=1 ieJi
Тогда необходимое условие для искомого оптимального векто-
ра х* можно представить в виде
ЭДх\Г,а) = Э/(х) + А Э^(х) = 0.
Эх Эх ‘ Эх
52
dF(x'X,a) .. . а
—Чг------- = X., +af=O, leJ,;
°Xn+i
ЭЙх ,X .a.)=x« = 0> ie j
dx„+i
Согласно интерпретации множителей Лагранжа
Так как, по определению оптимальности,
££)>о,
Ч+/
получаем
для i е J\ X* = -az > 0;
для ieJ2 Х* = 0.
Введём в рассмотрение функцию Лагранжа в привычном для
классических задач виде:
F(xX) = fix)+Xgix) = fix) + '£klgi(x).
/•=1
v dF dF dF -
Учитывая, что — = — и — = g,, необходимые условия on-
дх дх д\
тимальности для рассматриваемой задачи представим в виде
dF(x*,X*) n 3F(x*,V) л a* n w Пч
—Ч-2—- = 0> —--------= 0 при X. >0 (случаи g. =0);
дх ЭХ
Э£(х А ) <Q ПрИ _q (СЛуцай g. <0).
53
Полученные условия оптимальности называются условиями
Куна— Таккера. Смысл этих условий заключается в том, что для оп-
тимального решения рассматриваемой задачи существуют такие
множители Лагранжа X*, которые удовлетворяют соотношениям
9FU А )=0. ЭА(х А )х 0. х >0, (4.21)
Эх ЭХ.
или, в развёрнутом виде,
+ X<g(x«) = o. (4.22)
дх ' дх 1
Можно показать, что если целевая функция и множество допу-
стимых значений Xвыпуклы, то выполнение необходимых условий
оптимальности является достаточным. Следовательно, условия
Куна—Таккера являются необходимыми и достаточными в этом
случае.
Упражнение 1. Показать, что в задаче минимизации функции f (х) при
ограничении g,(x) < 0, х7 > 0, i - 1,/и, j - 1,л необходимые условия опти-
мальности принимают вид
Э£(х ,Х )х. =0. ЭЦхД_)х. =0. х. г0. j. а0. y = i = j-^ (4 23)
dXj ЭЛ/
Упражнение 2. Показать, что множество допустимых х, задаваемое
системой неравенств &(х)<0/ = 1,/и, выпукло, если функции g.(x) — вы-
пуклы.
Упражнение 3. Показать, что наличие седловой точки у функции Лаг-
ранжа Г(х,Х) = /(х) + Хгg(x), т.е. выполнение соотношений
F(x*,X) < F(x*,X*) < Г(х,Х*)
для всех х > 0, X > 0, или, что то же самое, пцп max F(х, X) - max min F(x,X)
хго хго Хао хго
является, как и в задачах на условный экстремум, достаточным условием
достижения функцией /(х) в точке х* минимального значения при усло-
вии g(x)<0, х>0.
54
Упражнение 4. Показать, что в ббшем случае при любых хе X, Хе Л
имеет место неравенство max min F(x,X) < min max F(x, X).
X x • x X
Упражнение 5. Показать, что для задачи минимизации функции /(х)
при условиях g(x)<0, х>0 прямая задача состоит в отыскании
/’(х*) = min Р(х), где Р(х) = тахГ(хЛ) •
' 7 хгО 4 7 хао
Упражнение 6. Показать, что решение двойственной задачи, заключа-
ющейся в отыскании А(Х*) = тахЛ(Х), где А(Х) = minF(x,X), в общем слу-
' 7 Х>0 ' х>0
час дает лишь оценку снизу для решения задачи минимизации /(х) при
условии g(x)<0, х>0, т.е. Л(Х*) = maxminF(x,X)</(х*)= min /(х).
4 7 Х>о х>0 ' g(x)>0, хгО
Упражнение 7. Показать, что в случае выпуклых функций f (х) и gf. (х)
решения прямой и двойственной задач (если они существуют) совпадают,
5. ЧИСЛЕННЫЕ МЕТОДЫ БЕЗУСЛОВНОЙ
ОПТИМИЗАЦИИ
Анализ возможных численных методов оптимизации целесооб-
разно начать с методов, предназначенных для решения однокрите-
риальных детерминированных задач оптимизации при отсутствии
ограничений. Такие задачи часто называют задачами безусловной
оптимизации. Следует сразу подчеркнуть, что владение этими мето-
дами имеет принципиальное значение, ибо методы решения более
сложных задач при наличии ограничений в большинстве случаев либо
базируются на этих методах, либо практически сводятся к ним с
использованием специальных приемов. Прежде всего отметим, что
сущность всех численных методов оптимизации состоит в построе-
нии такой последовательности векторов {х*}, к = 1, 2,..., которая, по
крайней мере, удовлетворяет условию
f(xk=')<f(xk).
Все методы могут быть разделены на классы в зависимости от
максимального порядка производных минимизируемой функции,
вычисление которых предполагается в процессе поиска. Так, мето-
55
ды, использующие только значения самой функции, называют ме-
тодами нулевого порядка. Если, кроме того, в процессе поиска тре-
буется вычисление первых производных, то мы имеем дело с мето-
дами первого порядка. Методы второго порядка требуют для своей
реализации вычисления вторых производных.
5.7. Методы первого порядка
С методической точки зрения, анализ методов целесообразно
начать с методов первого порядка. Основу этих методов составляют
так называемые градиентные методы, сущность которых заключа-
ется в том, что каждое новое приближение х*+1 к минимуму функ-
ции f (х) формируется на основе текущего приближения х* по схеме
xk+l =xk -hkVf(xk),
(5.1)
где через hk обозначен шаг поиска в направлении антиградиента
-V/(x*) на к-й итерации. По существу, данная схема основана на
линейной аппроксимации функции f (х) в окрестности точки хК Обо-
снованием схемы может служить тот факт, что направление анти-
градиента -Vf(xk) в точке х* определяет (задает) локально наи-
лучшее направление спуска, так как оно совпадает с направлением
наискорейшего уменьшения значения функцииДх).
В зависимости от способа задания шага поиска различают раз-
личные градиентные методы. Некоторые из них рассматриваются
ниже.
5.1.1. Метод градиентного спуска
Сущность градиентного метода спуска заключается в задании
шага поиска hk на каждой итерации достаточно малым. Если пред-
положить, что шаг поиска бесконечно мал, то траектория поиска
описывается дифференциальным уравнением
§ = -W).
ЭЛ
56
Метод является локально-оптимальным, так как в каждой точ-
ке траектории поиска используется наилучшее направление спуска,
определяемое антиградиентом (рис. 5.1). Реализовать такую траек-
юрию можно лишь приближённо, полагая шаг поиска достаточно
малым, но конечным.
х2
f(x/, х 2)—const
Траектория градиентного спуска
Рис. 5.1. Метод градиентного спуска
Реализация метода требует большого количества шагов или ите-
раций, что может привести к неприемлемым затратам машинного
времени. Поэтому на практике стремятся использовать простейшую
модификацию метода, используя постоянный достаточно большой
(по сравнению С градиентным методом) шаг поиска.
5.1.2. Градиентный метод с переменным шагом поиска
Увеличение постоянного шага поиска может привести на отдель-
ных итерациях к увеличению значения минимизируемой функции
/(х), т.е. невыполнению условия f(xk+i)< f(xk). Поэтому более
практичным оказывается градиентный метод с переменным шагом. Из-
57
менение шага может осуществляться, например, по следующей схе-
ме. Задается некоторая величина Л°. На каждой итерации, полагая
hk = Л°, проверяют условие f{xk+x}< f(xk). Если оно выполняется,
то принимается hk = и осуществляется переход к новому при-
ближению:
хк+х ~хк -hkVf(xk).
Если нет, то Л° дробится до тех пор, пока условие /(x*+1) < f(xk)
не будет выполнено.
Здесь следует заметить, что даже условие f(xk+i)< f(xk) в об-
щем случае не гарантирует сходимости метода. Для обеспечения
сходимости необходимо выполнение более сильных условий, напри-
мер, выполнение неравенства [32]
f(xk -MV/(x*))-/(x*)<-eM /V/(x*)/, где ее (0,1);
F(xk -hkVf(xk)) = f(xk)-Vf(xk)ThkVf(xk).
Градиентные методы с переменным шагом поиска являются
более экономными как по количеству итераций, так и по затратам
машинного времени.
5.1.3. Метод наискорейшего спуска
К числу методов с переменным шагом относится и метод наи-
скорейшего спуска. Однако теперь шаг поиска hk определяется наи-
лучшим образом на каждой итерации из условия обращения в ми-
нимум функции f(x) в направлении антиградиента (рис. 5.2):
hk =arg mm/(x*-hMf(xk)). (5 2)
Таким образом, реализация метода предполагает на каждой ите-
рации решение вспомогательной задачи одномерной оптимизации.
Несмотря на это, как правило, метод наискорейшего спуска оказы-
58
кается более экономным не только по числу машинных операций,
но и по затратам машинного времени.
При практической реализации градиентных методов процесс
поиска заканчивается, если для всех компонент вектора градиента
выполняются условия
£6,
Эх?
7 = 1. п,
где 5 — некоторое заданное число, характеризующее точность на-
хождения минимума.
5.1.4. Преодоление овражных эффектов
Основной недостаток всех градиентных методов состоит в их
слабой скорости сходимости к искомому минимуму, особенно при
появлении так называемого эффекта овражности. Этот эффект свя-
зан с тем, что линии уровня целевой (минимизируемой) функции
/(х) часто оказываются сильно вытянутыми, что, в свою очередь,
59
объясняется резким возрастанием функции f (х) по одним Направ-4
лениям и слабым изменением — по другим. Этот эффект хорошей
интерпретируется геометрически и означает, что топография повер*
хностей уровня целевой функции /(х) = const имеет овражную!
структуру.
Траектория градиентных методов в таких случаях характеризуй
ется достаточно быстрым продвижением на дно оврага, а затем мед-*
ленным зигзагообразным движением вдоль дна к точке минимуму
(рис. 5.3). Это связано с тем, что основой градиентных методов яв-*
ляется идея использования линейной аппроксимации минимизируй
емой функции f (х). Если же эта функция дважды дифференцируй
ема, то естественно попытаться использовать ее квадратичную апп-
роксимацию в окрестности точки х*
хк+] = arg min /*(х);
fk(x) = f(xk)+Nf(xk)T(x-xk)^x-xk)T^f(xk)(x-xk), (5.3)
‘дно” оврага
Рис. 5.3. Эффект овражности целевой функции
60
ко горая учитывает кривизну функции Дх). Этот путь приводит нас
к методам второго порядка, о которых подробно речь пойдет в сле-
дующем разделе. А пока рассмотрим некоторые приемы, позволяю-
щие преодолеть, по крайней мере частично, овражность целевой
функции, используя методы поиска первого порядка.
Одним из простейших приемов является изменение масштаба
не зависимых переменных. Такая замена переменных во многих слу-
чаях позволяет исправить топографию функции /(х), уменьшить
вытянутость линий уровня, иногда приблизив их даже к сферам.
В общем случае масштабирование переменных приводит к итераци-
онному процессу следующего вида:
х*+1 =хк -hkBkVf(xk), (5.4)
где 5* — некоторая матрица, зависящая в общем случае от номера
итерации.
При № — 1(1— единичная матрица) имеем обычную схему гра-
диентных методов. Методы, использующие схему (5.4), иногда на-
зывают релаксационными.
Другой прием состоит в следующем. Первоначально из двух
близлежащих точек с помощью метода наискорейшего спуска осу-
ществляется спуск на дно оврага (рис. 5.4). Получаем две точки:
х1 и х1. С определенной долей уверенности можно полагать, что на-
правление дна оврага определяется с точностью до знака направле-
нием вектора х1 -х1. Поэтому можно сделать достаточно большой,
по крайней мере по сравнению с шагом градиентного поиска, рабо-
чий шаг поиска А. В результате получим новую точку х2:
х2-х} +h(xl -х1), если f(x})< /(х1);
х2 = х1 + А(х’ - х1), если /(х1) < f (х1).
В окрестности полученной точки х2 выбираем близко лежа-
щую точку х2 , и процедура поиска повторяется.
Существуют и другие способы преодоления овражных эффек-
тов.
61
Рис. 5.4. Схема реализации овражного метода
Упражнение 1. Построить линии уровня для целевых функций:
а) /(x) = x|!+16xf;
б) /(х) = (х2-х2)2+(1-х1)2;
в) /(х)=100(х2-х2)2+(1-х,)2;
г) /(х) = (х2-Х[2)2+ 100(1-Х|)2.
Упражнение 2. Осуществить по отношению к функции f (х) = xf + 16xJ
переход к новым переменным таким образом, чтобы сходимость градиен-
тных методов увеличилась.
5.2. Методы второго порядка
5.2.1. Метод Ньютона и его модификации
Основой методов второго порядка является метод Ньютона,
сущность которого состоит в отыскании на каждой итерации мини-
62
xiума квадратичной аппроксимации fk(x) функции /(х) в точке х*
(см. (5.3)). Это решение и предполагается принять в качестве ново-
к> приближениях*+| :
x*+1 = arg min fk(x).
X
Если предположить, что гессиан функции /(х) в точке хк, т.е.
матрица V2/(x*), является положительно определенной, то указан-
ное решение будет единственным и иметь вид
хк+х =хк_ [у2дхк jj-1 у/*(хА ).
Из сказанного ясно, что в случае строго квадратичной функции
,/'(х) метод Ньютона дает решение задачи минимизации за один шаг.
В общем же случае этот метод приводит к итерационному процессу
поиска на каждом шаге минимума квадратичных аппроксимаций
fk(x) функции /(х).
Основное преимущество метода Ньютона перед градиентными
методами состоит в том, что при выполнении некоторых условий
метод обладает большей скоростью сходимости при минимизации
овражных функций. Геометрически это объясняется тем, что век-
тор sk = -[V2f(xk)]~}Vf(xk) имеет большую составляющую вдоль
«дна» оврага, чем просто антиградиент -V/(x*). В результате для
решения задачи требуется меньшее количество итераций, чем при
использовании градиентных методов.
К числу недостатков метода Ньютона следует отнести необхо-
димость вычисления вторых производных функции Дх) и обраще-
ния гессиана на каждой итерации в процессе поиска, а самое глав-
ное, зависимость сходимости метода от начального приближения. Если
начальное приближение выбрано неудачно (например, находится
далеко от точки минимума), то метод может даже расходиться.
Для устранения отмеченных недостатков применяют различные
модификации метода Ньютона. В частности, вектор s* можно ис-
пользовать лишь как направление поиска, в котором предполагает-
63
ся сделать очередной шаг. Возможны различные способы выбора
этого шага поиска. Один из них, как и в методе наискорейшегс
i
спуска, состоит в минимизации функции f(xk -hsk) в выбранной
направлении поиска:
hk = arg min f(xk-hsk). (55^
Для уменьшения трудностей, связанных с вычислением вторых!
производных, могут быть применены различные модификации ме J
тода, использующие не точные значения, а приближенные аналогй|
гессиана. Одна из простейших модификаций такого рода имеет вид
xk+i — хк ~ hk[V2/(х)]"1 V/(x*). (5.6)
Как видно из алгоритма, вычисление гессиана предполагается
здесь производить лишь один раз в некоторой заранее выбранной
точке х. Другая модификация метода Ньютона предполагает обнов-
ление гессиана через определенное количество итераций.
В тех случаях, когда гессиан минимизируемой функции не яв-
ляется положительно определенным, метод Ньютона, как уже от-
мечалось, не может гарантировать сходимость к некоторому мини-
муму. В этих случаях может быть использована следующая модифи-
кация метода:
хк+х = хк-hk[V2f(xk) + akI]~lVf(xk). (5.7)
Здесь I — единичная матрица; ак — некоторый дополнительный
параметр на к-и итерации. Параметр ак и шаг поиска hk должны
подбираться эмпирически. Желательно при этом, чтобы метод вда-
ли от минимума работал в основном как градиентный, а по мере
приближения к минимуму переходил в обычный метод Ньютона.
5.2.2. Метод сопряженных градиентов
В рассмотренных методах на каждой итерации никак не исполь-
зовалась информация, полученная на предыдущих итерациях. Оче-
64
видно, используя эту информацию, т.е. учитывая «предысторию»
процесса поиска, можно рассчитывать на ускорение его сходимос-
1И. Методы поиска, в которых новое приближение формируется на
основе нескольких предыдущих, называются многошаговыми. Одним
и । многошаговых методов является двухшаговый метод сопряжен-
ных градиентов. Идея метода заключается в построении нового при-
ближения х*+| по следующей схеме:
х**1 =х* -A*V/(x*)+P*(x*
|де параметры й* и р* подбираются на каждой итерации оптималь-
пым образом, т.е. из условия
(M,p*) = arg min f[xk -AV/(x*)+p(x* -x*"1)].
В общем случае найти решение данной задачи в явном виде не
удается. Однако для случая квадратичной функции методу можно
придать следующий вид [40]
x*+l=x* + Ms*, s*=-V/(x*)+pM“I; (5.8)
РО=°’ A*'=arg tSon/(x*+fo*)- <5.9)
Характерной особенностью метода является тот факт, что ме-
тод приводит к точке минимума квадратичной целевой функции за
конечное число итераций, не превышающее размерность задачи.
Несмотря на то, что последний алгоритм расписан для квадра-
тичной функции /(х), он успешно может применяться и для не-
квадратичных функций. Правда, теперь метод уже не будет конеч-
ным. При этом оказывается целесообразным через каждые п шагов
производить обновление метода, т.е. полагать р* = 0 при к ~ 0, я,
2л, ... Метод сопряженных градиентов, являясь по форме методом
первого порядка и поэтому простым в реализации, выгодно отлича-
е тся от обычных градиентных методов тем, что он обладает, по су-
65
ществу, всеми достоинствами метода второго порядка (в том числф
квадратичной сходимостью).
Существуют и другие схемы реализации метода сопряженных
градиентов [19, 32, 39, 40].
Упражнение /. Получить выражения (5.8), (5.9) для определения пара-
метров р*~1, hk.
Упражнение 2. Решить задачу минимизации функции f(x) = xf +4xj -1
методом сопряженных градиентов, приняв в качестве начальной точку х° с
координатами хр = xj = 1. Построить траекторию поиска.
5.2.3. Квазиньютоновские методы
Рассмотрим теперь группу методов, называемых квазиньютонов-
скими, сущность которых состоит в воспроизведении квадратичной
аппроксимации функции f(x) по значениям ее градиентов в ряде
точек. Тем самым эти методы объединяют достоинства градиентных
методов (т.е. не требуется вычисление вторых производных) и ме-
тодов Ньютона (быстрая сходимость вследствие использования квад-
ратичной аппроксимации). Структура методов этой группы такова:
x*+1 = xk-hkHkVf(xk).
Здесь, как и ранее, шаг поиска предполагается выбирать из ус-
ловия
hk =arg min f[xk -hHkVf(xk)],
h>0
а матрица Я* формируется и пересчитывается на основе k-и итера-
ции так, чтобы в пределе она переходила в матрицу, обратную гес-
сиану Нк -»[V2/(x*)]-1. Тем самым в пределе методы этой группы
переходят в ньютоновские методы.
Обсудим возможные способы формирования матриц /?*, аппрок-
симирующих матрицу [V2/(x*)]_I. Можно, конечно, воспользоваться
обычной конечно-разностной аппроксимацией гессиана с последу-
66
ющим обращением этой матрица. Однако такой подход не всегда
является наилучшим и требует больших вычислительных затрат. Идея
квазиньютоновских методов заключается в построении аппроксима-
ции для обратной матрицы [^/(х*)]'1 непосредственно, без спе-
циальных пробных шагов, с использованием найденных градиентов
на предыдущих итерациях. Поясним эту идею для квадратичной фун-
кции
/(х) = ^хгЛх + сгх.
После введения обозначения
sk =-HkVf(xk), ук =Vf(xk+x)-Vf(xk)
нетрудно установить, что в этом случае имеет место равенство
ук = Л(х*+1 - хк) = hkAsk,
или
A~xyk=hkSk.
Учитывая последнее равенство, потребуем, чтобы оно выполня-
лось и для нового приближения Нк+Х, т.е.
Я*+,у*
Последнее условие принято называть квазиньютоновским. Кро-
ме того, потребуем, чтобы Я" = Л-1. Оказывается, можно предло-
жить различные алгоритмы пересчета матриц Я*, удовлетворяющих
сформулированным условиям. Приведем лишь некоторые из них [32]:
а) алгоритм Давидона—Флетчера—Пауэлла
Нк*\=нк +
Hkyk(yk)T Hk
+ hk
(sk)T sk ’
Я°>0;
б) алгоритм Бройдена
нМ _ Hk ifO > o-
67
в) алгоритм Бройдена—Флетчера—Шенно
(ук)т sk
н°>о.
(ук у sk
Можно показать, что все представленные алгоритмы для квад-
ратичных функций Дх) совпадают. Для неквадратичных функций
эффективность этих алгоритмов зависит от вида минимизируемых
функций.
5.5. Методы одномерного поиска
Как мы видели, большинство методов оптимизации предусмат-
ривает поиск минимума функции одной переменной — шага поис-
ка. Этот поиск является составной частью общей процедуры мини-
мизации. От того, насколько хорошо организован такой одномер-
ный поиск, существенно зависит эффективность метода в целом.
Рассмотрим этот вопрос подробнее, сравнив между собой различ-
ные методы одномерного поиска.
Ограничимся рассмотрением так называемых унимодальных
функций, т.е. функций, имеющих на исследуемом интервале [а, Ь]
единственный локальный минимум. Унимодальные функции не
обязательно должны быть гладкими или непрерывными (рис. 5.5).
Выпуклые функции являются частным случаем унимодальных.
Величину интервала [а, b ], называемого также начальным ин-
тервалом неопределенности, обозначим через £0. Будем по-прежне-
му для минимизируемой функции использовать обозначение /(х),
считая, однако, теперь, что х — скаляр. В частном случае под х по-
нимается шаг поиска А, который должен быть выбран в рассмотрен-
ных выше алгоритмах.
5.3.1. Обычный перебор
Простейшим методом одномерного поиска является обычный
перебор значений /(ху.) минимизируемой функции /(х) в конеч-
68
ном числе точек j - 1,л переменной х, равномерно распределенных
на интервале [а, Ь], с последующим выбором наименьшего значе-
ния /(х*) = min/(x;). Значение х* в силу свойства унимодальнос-
ти может быть приближенно принято за искомое оптимальное зна-
чение. Очевидно, точность такого процесса определяется количе-
ством экспериментов, связанных с вычислением функции /(х) , и
характеризуется интервалом неопределенности после проведения
всех экспериментов, равным Ln = Таким образом, эффектив-
ность процесса поиска можно оценить отношением
Совершенно очевидно, что равномерное распределение всех
экспериментов на интервале поиска [a, £?] не является наилучшим.
5.5.2 Метод дихотомии
Эффективность поиска можно существенно повысить, если эк-
сперименты проводить попарно, анализируя результаты после каж-
дой пары экспериментов. Наиболее эффективным проведением эк-
спериментов каждой пары является такое, при котором интервал
неопределенности сокращается практически вдвое. Лучшего резуль-
69
тата при проведении двух экспериментов добиться просто невозмож*
но. Для этого оба эксперимента должны быть расположены симмет*
рично в районе середины интервала настолько близко друг к другу
чтобы можно было отличить значения функции в этих точках дру1
от друга. Такой метод поиска получил название метода дихотомии^
Если перед проведением первой пары экспериментов величина
интервала неопределённости, на которой находится искомый мини|
мум, равна £0, то интервал неопределённости L2 после проведение
г 4
двух экспериментов практически будет равен £2 = -~.
Если требуется провести ещё пару экспериментов, то наилуч-
шее распределение их будет также симметричным, но теперь уже
внутри интервала, величина которого равняется £2. Следовательно^
после проведения четырёх экспериментов величина интервала нео*
пределённости будет равна £4 = . Общая схема алгоритма метода
дихотомии представлена на рис. 5.6.
Нетрудно сообразить, что при использовании метода дихотомии
интервал неопределенности после проведения п/2 пар эксперимен-
тов практически будет равен £я = . Следовательно, эффек-
тивность метода характеризуется величиной
А>/^=2"/2-
Отсюда видно, что с ростом п эффективность метода дихотомии
растет по сравнению с простым перебором. Даже при п = 12 эффек-
Х5 Хб
Рис. 5.6. Схема реализации метода дихотомии
70
। ивность метода дихотомии примерно в 10 раз выше метода перебо-
ра. Тем не менее, метод дихотомии в целом не является наилучшим
методом одномерного поиска, так как в нем каждая пара экспери-
ментов проводится независимо друг от друга и поэтому часть ин-
формации, связанная с проведенными ранее экспериментами, про-
с го не используется.
5.3.3. Метод Фибоначчи
Оптимальную стратегию последовательного поиска дает метод
Фибоначчи. Суть его состоит в том, что каждые два соседних экспе-
римента, кроме двух последних, располагаются на текущем интер-
вале неопределенности на одинаковом расстоянии от левого и пра-
вого концов, т.е. симметрично.
Что касается двух последних экспериментов, то они проводятся
в соответствии с методом дихотомии.
Схема алгоритма представлена на рис. 5.7. Из симметричности
расположения любых двух соседних экспериментов следует равен-
ство
Lk = At+l + ^к+2-
Для последних двух экспериментов согласно методу дихотомии
имеем
Рис. 5.7. Схема реализации метода Фибоначчи
71
или
L„ !=2L„.
Л-1 W
Поэтому получаем:
Аи-2 — A-i + А — з А»
А-з ~ ^п~2+А-i= ^А’
А-4 = А-З + А-2 “8 А
и Т.Д.
Введем в рассмотрение последовательность чисел Фибоначчи:
А = А-1 + А-2> ^ = 2Д...
Нетрудно установить, что для любого (л—/с)-го эксперимента
интервал неопределенности определяется формулой
^п-к “ ^к+Х^п'
При к=п—\ получаем Lx = FnLn.
Так как проведение первого эксперимента не изменяет интер-
вала неопределенности, т.е. А = А» получаем оценку эффективно-
сти метода
LJLn=Fn.
Метод имеет наивысшую оценку среди рассмотренных ранее.
Так, например, при п = 12 она превышает эффективность метода
дихотомии более чем в 3,5 раза. С ростом л преимущество метода
еще более возрастает.
Недостаток метода Фибоначчи состоит в том, что методом нельзя
пользоваться, не зная заранее общего числа экспериментов л. Если
же поиск методом Фибоначчи начат, то на любом шаге действия
определяются просто — каждый последующий эксперимент распо-
72
нпается симметрично относительно предыдущего эксперимента,
попавшего в этот же интервал неопределенности. Однако для опре-
деления места приложения первых двух экспериментов необходимо
предварительно найти величину Л2. Сами эксперименты должны
быть в соответствии со свойством симметрии проведены на рассто-
яниях L2 от левого и правого концов.
Указанного недостатка лишен метод золотого сечения, который,
уступая несколько методу Фибоначчи, все же существенно превос-
ходит по эффективности метод дихотомии.
5.3.4. Метод золотого сечения
Метод золотого сечения, как и метод Фибоначчи, требует вы-
полнения условия симметрии. Однако, в отличие от последнего, он
предполагает еще и постоянство отношений длин последовательных
интервалов неопределенности Lj/Lj+{ ~ с для всех у.
Последнее соотношение и обусловило название метода. «Золо-
тым сечением» принято называть деление отрезка на две части так,
чтобы отношение всего отрезка к большей части равнялось отноше-
нию большей части к меньшей:
Разделим первое соотношение на получим
с = 1 +—; с2-с-1 = 0,
откуда находим единственное положительное решение для параметра
г = (1 + л/5)/2« 1,618. Поиск по методу золотого сечения (рис. 5.8)
производится так же, как и по методу Фибоначчи. Разница лишь в
проведении двух первых экспериментов. В данном случае они рас-
полагаются симметрично на интервале [а, 6] и на расстоянии LQ/c
от его концов. После проведения п экспериментов интервал неопре-
деленности будет равным
£„ = £0/c"-'-
73
Рис. 5.8. Схема реализации метода золотого сечения
Эффективность метода характеризуется величиной
L0/L„ = c"-'.
Сравнивая величины Fn и с"”1, можно установить, что при боль«|
ших п эффективность метода золотого сечения приближается к эф-
фективности метода Фибоначчи. Это обстоятельство и обусловилс
широкое распространение метода «золотого сечения».
Упражнение. Сравнить эффективность методов одномерного поиска,
построив зависимости L(}/Ln от числа п для каждого из рассмотренные
методов.
5.4. Методы нулевого порядка
Перейдем теперь к рассмотрению методов нулевого порядка, тре-
бующих для своей реализации лишь значения целевой функции f (х)
и не использующих никаких частных производных. Эти методы
иногда называют также прямыми. В тех случаях, когда градиенты И
гессианы могут быть легко вычислены, прямые методы могут, ко-
нечно, оказаться менее эффективными, чем методы первого или
второго порядка. Однако иногда прямые методы оказываются един-
74
v । венными практически применимыми методами. Это относится, в
частности, к случаям, когда целевая функция имеет разрывы или це-
левая функция задана не в явном виде, а косвенно через какие-либо
уравнения, относящиеся к различным подсистемам некоторой слож-
ной системы и т.д.
Предложено много различных прямых методов поиска. Харак-
1срным для этих методов является их эвристичность. В связи с этим
сходимость и эффективность методов может быть подтверждена лишь
же периментально на примерах решения конкретных задач.
5.4.1. Метод покоординатного спуска
Метод покоординатного спуска (метод Гаусса—Зейделя) явля-
ется одним из простейших методов этой группы. Сущность метода
состоит в последовательной минимизации целевой функции по от-
дельным переменным. Сначала отыскивается минимум по первой
компоненте, при этом считается, что остальные фиксированы; за-
гс м — по второй (при этом первая компонента принимается равной
найденной) и т.д. Метод в общем случае не обеспечивает отыскания
минимума функции за один цикл поиска, т. е. после изменения всех
переменных. Необходимо многократное повторение таких циклов.
Метод обладает рядом существенных недостатков. Сходимость
метода существенно зависит от выбора системы координат, что на-
1лядно отображено на рис. 5.9 и 5.10. Допустим, что линии уровня
минимизируемой функции построены в системе координат Оххх2.
В этой системе координат с помощью метода покоординатного спус-
ка требуется проведение нескольких циклов поиска для определе-
ния искомого минимума. Однако, если повернуть исходные коор-
динатные оси, как показано на рис. 5.10, получим новую систему
координат OxjXj, в которой метод обеспечивает сходимость за один
никл поиска.
Забегая вперед, следует отметить, что метод может оказаться во-
обще непригодным при наличии ограничений (рис. 5.11).
Метод оказывается слабоэффективным или не работает в слу-
чае минимизации овражных целевых функций, он практически ос-
танавливается на дне явно выраженного оврага (рис. 5.12). Поэтому
метод обычно применяют в комбинации с другими методами.
75
Рис. 5.9. Сходимость метода
при неудачном выборе системы координат
Рис. 5.10. Сходимость метода
при удачном выборе системы координат
76
Рис. 5.11. Неработоспособность метода
при наличии ограничений
Рис. 5.12. Влияние эффекта овражности на сходимость метод
5.4.2. Метод конфигураций
Метод конфигураций является более перспективным для задач
большой размерности. В соответствии с этим методом вначале про-
исходит обследование окрестности некоторой точки х° (например,
путем изменения значений одной или нескольких компонент век-
77
тора х°). После отыскания приемлемого направления производятся
вычисления целевой функции при постепенно увеличивающемся
шаге (тем самым устанавливается конфигурация поиска). Увеличе-я
ние шага продолжается до тех пор, пока поиск в этом направлений
приводит к уменьшению функции. Если уменьшения функции н®
происходит, то шаг уменьшают. После нескольких неудач при со-
кращении шага от принятой конфигурации отказываются и перехо-
дят к новому обследованию окрестности. Таким образом, согласно»
этому методу делаются попытки найти наилучшее направление по-
иска, с тем чтобы двигаться вдоль него. Но и для этого метода ха-
рактерна возможность (хотя и в меньшей степени) заедания вблизи
локального минимума или явно выраженного оврага. По своей сути
метод конфигураций является достаточно общим методом прямого
поиска. Большинство методов этой группы может рассматриваться
как его конкретизация.
5.4.3. Метод линейной аппроксимации
Общий вид алгоритма поиска имеет вид
х*+1 = xk - hksk,
где / — вектор, определяющий направления поиска; hk — рабочий
шаг поиска.
Возможны различные способа определения направления поис-
ка. Наиболее часто для этого используются формулы
? = у/(х*+а*у,.)-/(х*)у,
; ак
либо при симметричной аппроксимации
к V f(xk + a*vi) ~ f(xk ~ аку1^
5 =?-----------W-----------V'-
Здесь ак — длина пробного шага; v, — вектор направления проб-
ного шага.
В зависимости от способа задания вектора направления проб-
ного шага и величины пробного шага можно получить различные
78
варианты методов поиска. Так, задавая v. = е., где е, — единичный
орт, и считая ак достаточно малым, получаем разностную аппрок-
симацию градиентных методов, например в симметричном виде:
к _ v f(xk + a*ez) - f(xk - akef)
5 2a‘ e<-
Рабочий шаг поиска hk целесообразно выбирать оптимальным в
направлении поиска:
hk = arg min f(xk + hsk).
Л>0
5.4.4. Метод деформируемого многогранника
Этот метод является частным случаем метода конфигурации. В
)том методе целевая функция «переменных f(x) минимизируется
с использованием л+1 вершин некоторого деформируемого много-
гранника в пространстве этих переменных. Вершина, в которой зна-
чение /(х) стремится к максимуму, проектируется через «центр тя-
жести» оставшихся вершин. Улучшенное значение целевой функции
находится последовательной заменой точки с максимальным значе-
нием f(x) на более «хорошие» точки, пока не будет найден мини-
мум функции f(x). Алгоритм этого метода может быть представ-
лен в виде следующих основных операций.
1) Формирование в «-мерном пространстве многогранника
путём задания я+1 вершины:
{х'},у = 1,«+1.
2) Определение среди вершин «наихудшей» Xй и «наилучшей» х/,
соответствующих максимальному и минимальному значению целе-
вой функции:
/(х*)= max f(xJ); f(xl)= min f(xJ).
_/=1,л+1 y=l, л+1
79
3) Определение «центра тяжести» многогранника:
хп+2 = -У xj.
4) Отражение «наихудшей» вершины:
ХИ+3 _ хп+2 + а(х«+2 _ ), а > 0.
5) Растяжение. Если выполняется условие f(xn+3) < fix1), тогд^
вычисляется точка
у>1.
Далее точка х*1 заменяется либо на точку хп+41 если /(хл+4) < /(х7) j
либо на точку хп+3 — в противном случае.
6) Операция сжатия. Если выполняются условия
/(хл+3)>/(х7), Vj*h,
то точка Xй заменяется на точку х"+5 = хп+2 + р(хА - х”+2), где 0< р < L
7) Если выполняется хотя бы одно условие f(xn+3) < f(xJ), j * !,
то точка Xй заменяется на хп+3.
8) Редукция. Если выполняется условие f(xn+3)>f(xh)> то
формируется новый многогранник с уменьшенными вдвое сторонами
с вершинами xj = х7 -0,5(х7-х/), j = 1,л + 1.
После формирования нового многогранника в соответствии с
позициями 5, 6, 7 или 8 процесс поиска повторяется, начиная с
позиции 2.
Упражнение. Изобразить на плоскости xt, Xj траектории поиска мини-
мума функции f(x) = 4(xj -5)2 + (х2 -6)2 различными методами поиска.
80
5.5. Методы случайного поиска
Большую группу методов прямого поиска, требующих знания
лишь значений целевой функции, составляют так называемые ме-
тоды случайного поиска. В отличие от детерминированных методов
поиска, рассмотренных нами ранее, методы случайного поиска пред-
полагают использование элемента случайности (например, при оп-
ределении направления поиска или величины шага поиска), что
приводит к качественно новой картине процесса поиска — траекто-
рия движения (спуска) к минимуму становится случайной. Именно
это использование элемента случайности позволяет строить алгоритм
поиска глобального экстремума. Для алгоритмов случайного поис-
ка характерны простота, универсальность, большая эффективность
поиска при оптимизации сложных систем. Ниже рассматриваются
лишь некоторые, наиболее простые, методы случайного поиска.
Более подробно с методами этой группы можно познакомиться в
книге [34].
5.5.1. Метод ненаправленного случайного поиска
Пусть требуется на множестве хе Xнайти абсолютный мини-
мум функции /(х):
x*=arg min/(x).
леХ
Ненаправленный случайный поиск заключается в построении
последовательности ^2,...,£л независимых случайных точек, рав-
номерно распределённых в области Л, и определении минимально-
го значения целевой функции в этих точках: /(£*) = mjn . Чем
у=1
больше точек, тем ближе значение к х. Очевидно, метод не-
направленного поиска обеспечивает решение задачи отыскания гло-
бального минимума с вероятностью, сколь угодно близкой к едини-
це, при достаточно большом количестве экспериментов
-х*|<е}-> 1. В сложных задачах большой размерности коли-
81
чество таких экспериментов может быть настолько великим, что
реализовать метод не представится возможным. Поэтому на прак-
тике этот метод не находит широкого применения.
5.5.2. Метод простой случайной оптимизации
Простейший вариант случайного направленного поиска заклю-
чается в следующем. В точке х* формируется направление с по-
мощью датчика единичных случайных векторов, равномерно распре-;
деленных по всем направлениям.
Делается пробный шаг в этом направлении Лпр .
Новое приближение х*+1 формируется следующим образом:
Х*+1 -хк + Дх*,
где рабочее смещение Дх* определяется по правилу
Лраб^*’ если/(х* + йпр^)</(х*);
[ 0 - в противном случае.
Величина рабочего шага Лраб определяется (подбирается) экспе-
риментально. Метод оказывается эффективным в случае крутых
целевых функций, вдали от точки экстремума. В районе экстремума
эффективность его падает.
5.5.5. Метод наилучшей пробы
Смысл данного метода заключается в следующем. Из точки х*
делается т реализаций единичных случайных независимых век-
торов, равномерно распределенных по всем направлениям (рис. 5.13).
С их помощью формируется т проб: {Лпр^*у}, у = 1,/я, где Лпр — ве-
личина пробного шага.
Выбирается наилучшее направление из условия
= arg min f(xk + htf).
J=\,m
82
Х2
hme‘
Рис. 5.13. Метод наилучшей пробы
Именно в этом направлении производится рабочий шаг поиска
Дх* = ^pa6^f, = хк + Ахк.
В данном алгоритме в отличие от предыдущего алгоритма вы-
бору подлежат два параметра Лраб и т.
Очевидно, что с увеличением числа проб т наилучшее направ-
ление приближается к направлению, обратному градиенту, и в пре-
деле при т -> оо совпадает с ним. Преимущество метода по сравне-
нию с градиентными методами состоит в том, что здесь может иметь
место неравенство т < п, где п — размерность вектора х. Другими
словами, количество проб может быть существенно меньше размер-
ности задачи. А это важно, особенно при больших размерностях
задачи . Кроме того, алгоритм, как и другие методы случайного
поиска, обладает возможностью определения глобального экстрему-
ма.
К недостаткам метода следует отнести возможность неудачного
шага, т.е. шага в направлении возрастания целевой функции, и ма-
лую эффективность накопления информации.
Первый недостаток можно устранить, если использовать, напри-
мер, следующую модификацию алгоритма:
Араб^’ если/(х*+йпрУ)</(х‘);
[ 0 - в противном случае.
83
Однако следует иметь в виду, что выигрыш, полученный за счет
исключения возможности неудачного шага, может и не покрыть
дополнительных потерь, необходимых для этого исключения, а не-
удачные шаги как раз являются теми шагами, которые позволяют
отыскивать глобальный экстремум (точнее, преодолевать локальные
экстремумы).
Малую эффективность накопления информации следует пони-
мать так. Из всех пробных шагов выбирается лишь лучший, все ос-
тальные отбрасываются, несмотря на то, что в них содержится ин-
формация о поведении целевой функции в районе текущей точки.
Очевидно, алгоритм можно улучшить, если принимать решение о
направлении рабочего шага не только по результату наилучшей про-
бы. В простейшем варианте, кроме наилучшей, можно учесть и наи-
худшую пробу для которой
/(** + АЛ) = max /(х* + Л .
“г J
Если окажется, что модуль приращения целевой функции при
наихудшей пробе больше модуля приращения целевой функции при
наилучшей пробе, то рабочий шаг целесообразно сделать в направ-
лении , т.е.
Гй если /(х*+йпр^)-/(х*)| > ^ + йпр^)-/(х*)|
Дх* =
— в противном случае.
5.5.4. Метод статистического градиента
Как и прежде, из точки хк сделаем т независимых проб
{Лпр^}, J = l>m. Вычислим соответствующие приращения целевой
функции
и образуем вектор
V/(x*) = £^Д/АЛ
7=1
84
Вектор Vf(xk) называется статистическим градиентом функ-
ции /(х) в точке х*. Дело в том, что математическое ожидание на-
правления V/(x*) для линейной целевой функции совпадает с на-
правлением градиента. Следовательно, при конечном числе т на-
правление этого вектора является статистической оценкой градиен-
тного направления. Учитывая сказанное, рабочее смещение целесо-
образно выбрать так:
* л и Vf(xk)
- Ч?/(?)Г
Данный метод, как и метод наилучшей пробы, может работать
при любом т, в том числе, и при т < и, в то время как численная
реализация градиентных методов требует проведения п проб для
вычисления всех составляющих вектора градиента.
Метод статистического градиента, таким образом, может быть
интерпретирован как статистический аналог детерминированного
градиентного метода. По отношению к методу наилучшей пробы
рассматриваемый метод обладает большой эффективностью накоп-
ления информации, что приводит, в частности, к большой стабиль-
ности траектории поиска при равном количестве проб.
5.5.5. Метод случайного поиска с направляющей сферой
Эффективность методов поиска часто можно повысить, если
наряду с новой информацией, получаемой на каждом шаге, исполь-
зовать предыдущий опыт. Примером построения такого алгоритма
может служить алгоритм поиска с направляющей сферой. Он вклю-
чает в себя три этапа.
Этап анализа. В точке х* делается т независимых проб
{Лпрц*7}, j = 1,/л, причем вектор проб рЛ формируется согласно вы-
ражению
ЦЬ _
I W* + C^kj I ’
85
где иА — единичный вектор памяти, определяющий среднее направ-
ление поиска;
— j-я реализация единичного случайного вектора с равно-
мерно распределенной по всем направлениям плотностью вероят-
ности;
с — константа, характеризующая долю участия случайного на-
правления в формировании вектора проб.
При с < 1 все пробные шаги укладываются внутри гиперконуса
с осью мА и углом раскрытия 2arcsin с.
Этап принятия решения. Определяется новое приближение лА+1
согласно соотношению
Х*+1 =хк +
где смещение Ахк находится одним из рассмотренных выше мето-
дов. Так, для метода наилучшей пробы
Ax*=Apa6Ht
где р* = arg min f (хк + АпрцАу);
для метода статистического градиента
^-_h УШ
где V7(*‘) = j>l/(x‘ +Лпр^)-7(х‘)1-
7=1
Этап обучения. Так как выбранное направление смещения Дхк
в общем случае не совпадает с направлением вектора памяти мА, то,
естественно, мА необходимо поправить. Это можно сделать различ-
ными способами, один из которых имеет вид
| wk + 8Дх* | ’
86
где 5 > 0 — параметр, характеризующий долю участия новой ин-
формации при корректировке вектора памяти. В начальный момент
при к = 0 можно принять w = 0.
Основным недостатком алгоритма является необходимость вы-
бора четырех параметров (с, б , Лраб , т), от которых и зависит эф-
фективность алгоритма. Учитывая, что эти параметры должны под-
бираться экспериментально, представляют интерес упрощенные
модификации рассмотренного метода. Рассмотрим одну из таких
модификаций.
5.5.6. Метод случайного поиска с направляющим конусом
Как и раньше, из точки х* де-
лается т проб {Аир^7}, у = 1,т, на
основе использования случайных
векторов с равномерно распределен-
ной плотностью внутри гиперкону-
са с вершиной в точке х* и осью, на-
правленной вдоль вектора памяти
и с углом полного раствора 4х
(рис. 5.14).
Направление рабочего смеще-
ния Дх* определим в соответствии
с методом наилучшей пробы:
Рис. 5.14. Метод случайного
поиска с направляющим
конусом
где ^ = arg min/(x*+Апр£*7).
В качестве обновленного вектора w*+1 примем вектор наилуч-
шей пробы wA+1 = Таким образом, в данном алгоритме выбору
подлежат не четыре, а три параметра: ¥, Лраб , т.
Характерной особенностью двух последних алгоритмов являет-
ся их инерционность. Действительно, направление поиска, задава-
емое в среднем вектором памяти w* не может резко измениться за
87
один шаг. Эта инерционность определяется в одном алгоритме па-
раметрами Лраб и 5, в другом — параметрами Лраб и Т. Наличие инер-
ционности придает глобальный характер процессу поиска, позволяя
преодолевать локальные минимумы и осуществлять поиск вдоль
оврагов и хребтов целевой функции. С другой стороны, процесс
поиска должен быть достаточно мобильным. Поэтому при выборе
параметров алгоритмов приходится прибегать к компромиссному
решению. При рациональном назначении этих параметров алгоритм
стимулирует поиск вдоль оврагов целевой функции независимо от
того, поднимаются они или опускаются, позволяя преодолевать хреб-
ты по перевалам и отыскивать новые районы ее локальных мини-
мумов. Эти алгоритмы, хотя и не находят самого глобального ми-
нимума, но позволяют выделить те области пространства, где этот
минимум может находиться.
5,5.7. Комбинированные методы
Эти методы применяются для улучшения сходимости методов
случайного поиска, а также для ликвидации ряда недостатков де-
терминированных методов.
Стохастический вариант метода Гаусса—Зейделя. Основной не-
достаток метода Гаусса—Зейделя состоит в слабой эффективности
при оптимизации овражных функций и при наличии ограничений.
Этот недостаток может быть устранён, если движение вдоль коор-
динатной оси заменить движением в случайном направлении.
Метод оврагов. В случае многомерных оврагов полезно в начале
поиска взять несколько случайных точек х01, х02, ..., х°л и произве-
сти спуск на дно оврага в точки х11, х12,..., х,л. Далее по этим точкам
выбрать направление оврага, например, с помощью метода статис-
тического градиента.
Алгоритм случайного перебора локальных экстремумов. Для по-
иска глобального экстремума можно использовать любой детерми-
нированный метод поиска локального экстремума, комбинируя его
со случайным подбором начальных условий поиска. Такой алгоритм
поиска является по сути дела алгоритмом случайного перебора ло-
кальных экстремумов и применим при большом их числе.
88
Блуждающий глобальный поиск. Этот метод является статисти-
ческим обобщением метода градиентного спуска. Чтобы придать
поиску глобальный характер, на траекторию градиентного спуска
накладываются случайные отклонения £ (7), которые создают режим
случайного блуждания. Движение точки х (/) в процессе поиска опи-
сывается уравнением
at
где h — параметр, играющий роль шага поиска при численной реа-
лизации данного уравнения; ^ (/) —«-мерный случайный процесс
типа белого шума с нулевым математическим ожиданием и спект-
ральной плотностью о2.
Процесс, описываемый этим выражением, является марковским
случайным процессом диффузионного типа. Плотность распределе-
ния вероятности р (x,t) удовлетворяет уравнению Фоккера—План-
ка—Колмогорова:
У этого уравнения есть стационарное решение
( ч 1 Г-2Л/(х)
р(х) = -ехр —
с о2
ПрИ7->оо,
где с — формирующий множитель.
Максимальное значение р (х) соответствует точке глобального
минимума функции Дх), следовательно, наиболее вероятное по-
ложение точки х в результате достаточно длительного поиска — это
положение глобального минимума.
Упражнение 7. Сравнить качественно траектории поиска минимума
функции Дх) = 4(xj -5)2 +(х2 -6)2 различными методами случайного по-
иска, задавая различные параметры соответствующих алгоритмов.
89
Упражнение 2. Показать, каким образом происходит изменение тра-
екторий поиска минимума функции /(х) = xf +х% -coslSxj -cos!8x2 мето-
дом случайного поиска с направляющим конусом при изменении парамет-
ров V, считая, что т достаточно велико.
6. МЕТОДЫ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ
Обсуждение методов решения задач при наличии ограничений
целесообразно начать с простейшей задачи этого класса — задачи
линейного программирования.
Задачи линейного программирования возникают во многих сфе-
рах деятельности человека, связанных с наиболее эффективным
планированием, распределением и использованием средств и ресур-
сов. К этим задачам сводится большинство экономических задач,
задачи теории игр, занимающие важное место в исследовании опе-
раций, и многие другие задачи.
В общем виде задача линейного программирования заключает-
ся в определении такого вектора х*, который доставляет минимум
линейной целевой функции f (х) = стх при ограничении вида Ах< b
и ограничении х> 0:
х* =arg mincrx. (6 1)
Ax<b v '
x>0
Хотя условия неотрицательности компонент вектора х являют-
ся частным случаем условия общего вида, их обычно выделяют от-
дельно. Важным свойством задач линейного программирования яв-
ляется выпуклость целевой функции и допустимого множества.
Поэтому, если задача линейного программирования не вырождена,
то для её решения достаточно применить необходимые условия оп-
тимальности.
6.7. Сущность симплекс-метода
Сущность основного метода решения задач линейного програм-
мирования поясним сначала на конкретном примере.
90
Пусть на некотором предприятии, выпускающем продукцию
видов Я,, П2, П3, ..., Пп, используется сырьё различных видов
52, 53,..., Sm. Запасы каждого вида сырья ограничены и составляют
Лр Ь2, Ь3,..., Ьт условных единиц соответственно. Пусть а.. означает
количество единиц сырья вида 5;, необходимое для изготовления
единицы продукции вида IJj. Известно, что доход от сбыта продук-
ции /^оценивается величиной су, Требуется составить такой план
выпуска продукции /7р П2, П3,Пп, при котором доход в резуль-
тате сбыта всей этой продукции будет наибольшим.
Для наглядности представим все исходные данные в виде таб-
лицы (табл. 6.1).
Таблица 6.1
Виды сырья Запасы сырья Виды продукции
Пг ... П,
51 bi «и «12 ... «1л
52 Ьг «21 «22 ... «2л
... ... ... ... ... ...
5„ Ьа «m2 ...
Доход от реализации единицы продукции с2 ...
Обозначим через количество единиц продукции П-. Тогда доход
от сбыта всей продукции будет равен
f(x) = ^CjXj (6.2)
/=1
Так как имеется всего единиц сырья вида то должны вы-
полняться следующие неравенства:
Z = l,m; (6.3)
>1
кроме того,
Xj >0, j = Xn. (6.4)
91
Таким образом, мы получили типичную задачу линейного про-
граммирования: среди неотрицательных решений системы (6.3) не*
обходимо выбрать такое, которое обращает функцию (6.2) в макси^
мум.
Для простоты рассмотрим численный пример задачи об опти*
мальном использовании сырья при исходных данных, представлен*
ных в табл. 6.2.
Таблица 6..
Виды сырья Запасы сырья Виды продукции
Пг
$ 19 2 3
•$2 13 2 1
•$3 15 0 3
18 3 0
Доход от реализации продукции 7 5
В данном случае соотношения (6.3), (6.4) имеют вид
2х, + Зх2 < 19,
2х, +х2 <13,
Зх2 < 15,
Зх, < 18,
(6.5)
х, > О,
х2 >0.
Геометрически указанные неравенства образуют многогранное
множество (рис. 6.1).
Целевая функция, подлежащая минимизации,
f(x) = -7Xj -5%2 —»,min.
(6.6)
Задача может быть сформулирована следующим образом: среди
точек, принадлежащих заштрихованному многограннику, найти та-
92
Рис. 6.1. Геометрическая интерпретация задачи линейного
программирования
кую, для которой функция (6.6) принимает минимальное значение.
Из рис. 6.1 видно, что решением задачи является вершина много-
гранника с координатами
Xj=5, %2=3, г=-50.
Теперь рассмотрим алгоритм аналитического решения задачи.
Решение задачи проведём в несколько этапов.
Сначала сведём задачу к канонической форме. Для этого вве-
дём дополнительные переменные:
Xj = 19-2xt -З^;
х4 =13-2х, -х^;
х5 = 15-3x2;
дс6 = 18-Зх,.
(6.7)
Получим
Xj>0, х2>0, х3>0, х4>0, х5>0, х6>0; (6.8)
93
f(x) = -1x} -5Xj.
(6.9)
Особенность канонического вида задачи состоит в том, что все
ограничения типа неравенств представлены в виде условий неотри-
цательности отдельных или всех компонентов. Наряду с этим в за-
даче присутствуют ограничения типа равенств. Ввиду того, что ко-
личество этих равенств меньше числа переменных, образованную
систему уравнений можно решить относительно части переменных.
Число этих решений должно равняться числу уравнений. Такое ре-
шение при нулевых значениях оставшихся переменных принято
называть базисным. Нас будут интересовать только допустимые ба-
зисные решения, то есть решения из неотрицательных значений пе-
ременных.
1. Выберем начальное допустимое базисное решение.
Для этого разобьем все переменные на две группы. К первой
группе (группе базисных) переменных отнесем переменные х3, х4,
х5, х6 — ровно столько компонент, сколько равенств в задаче. Ко
второй группе (группе свободных) переменных — остальные пере-
менные X], х2.
Выразим базисные переменные и целевую функцию через сво-
бодные переменные. В данном случае это уже сделано.
Полагая свободные переменные равными нулю: Xj = 0, х2 = О,
найдём допустимое базисное решение: х3 = 19, х4 = 13, х5 = 15, х6 = 18
и соответствующее значение целевой функции f— 0. На рис. 6.1 дан-
ное решение соответствует началу координат.
2. Перейдём к новому допустимому базисному решению, при
котором целевая функция будет иметь меньшее значение.
Выберем такую свободную переменную (например, Х|), за счёт
увеличения которой можно уменьшить целевую функцию, не меняя
остальных переменных.
Определим максимально возможное значение выбранной ком-
поненты Xj, при котором все переменные будут удовлетворять усло-
виям неотрицательности. Таким значением будет Xj = 6, при этом
х6 = 0.
Выберем новые базисные переменные х3, х4, х5, хг В качестве
свободных принимаются Xj, х4.
94
Выразим базисные переменные через новые свободные:
х3 = 19-2(6-(1/3)х6)=7-(2/3)х6-Зх2;
х4 = 13- 2(6-(1 /3)х6 ) = 1 + (2/3)х6 - х2;
х5 = 15 — Зх2;
х|=6-(1/3)х6;
f = -7(б-|х, "1-5х, = -42 +-^х, -5х,.
* о 2 Э о 2
(6.10)
(6.11)
Полагая свободные переменные равными нулю: х6 = 0, х2 = 0,
найдём новое допустимое базисное решение: х3 - 7, х4 - 1, х5 = 15,
Xj = 6. При этом значение целевой функции составляет f- -42. На
рис. 6.1 данное решение соответствует вершине допустимого много-
гранника, лежащей на горизонтальной оси системы координат хр х2.
3. Перейдем к новому базисному решению, при котором целе-
вая функция примет еще меньшее значение.
Выберем свободную переменную х2, за счёт увеличения кото-
рой можно уменьшить целевую функцию.
Определим предельное значение этой переменной: х2 = 1, х4 = 0.
Формируем новые базисные переменные х3, х5, хр х2 и новые
свободные переменные х6, х4.
Выразим новые базисные переменные через новые свободные:
х3 = 7+(2/3)х6-3(1+(2/3)х6-х4) = 4-(4/3)х6 + х4;
x5 = 15-3(1+(2/3)x6-x4) = 12-2x6 + 3x4;
х,=6-(1/3)х6; (6.12)
хг =1 + (2/3)х6-х4;
1(2 3
/ = -42 + -х6-5 1 + -х6-х4 =-47-х6 +5х4.
(6.13)
Полагая новые базисные переменные равными нулю, получаем
новые решения: х4 — х6 = 0, х3 = 4, х5 = 12, х} = 6, х2 = 1,/= — 42.
95
4. Попытаемся снова улучшить полученное базисное решение.
Функция f может быть увеличена за счёт х6.
Предельное значение этой переменной х6 = 3 при х3 = 0.
Новыми базисными переменными являются х6, х5, хр х2, новы-
ми свободными переменными х3, х4.
Выразим новые базисные переменные через новые свободные
переменные:
х5=6+(3/2)х3-(3/2)х4;
х6 =3-(3/4)х3+(3/4)х4;
х, =5 + (1/4)х3-(3/4х)4;
х2=3-(1/2)х3-(1/2)х4;
3 11
/ = -50+—х3+—х4. (6.14)
Полагаем свободные переменные равными нулю, получим: х3 = х4 =
— 0. Новое допустимое базисное решение
х5 - 6, х6 = 3, xj = 5, Х2 = 3.
При этом значение целевой функции равно f = —50.
Из выражения (6.14) для целевой функции заключаем, что даль-
нейшее уменьшение её значения невозможно, так как обе свобод-^
ные переменные входят в выражение с положительными коэффи-
циентами. Это также означает, что в этой точке выполнены необхо-
димые условия оптимальности. Поэтому полученное базисное ре-
шение является искомым оптимальным.
Таким образом, метод решения задачи заключается в переходе
от одного базисного решения к другому с уменьшением целевой,
функции. Рассмотренный метод решения называется симплекс-ме-
тодом. Этот метод находит широкое применение при решении раз-
личных задач линейного программирования.
Упражнение 1. Показать, что оптимальный вектор х* в любой задаче
линейного программирования лежит на границе допустимой области X.
Упражнение 2. Полагая, что некоторое допустимое базисное решение;
известно, а связь базисных переменных {хД и целевой функции f со сво-
96
Водными переменными Ц.} задается соотношениями ,
J
f = То ” осуществить переход к новому базисному решению. Уста-
j
повить зависимости новых базисных переменных и целевой функции с
новыми свободными переменными.
6.2. Алгоритм симплекс-метода
Рассмотрим общую задачу линейного программирования в ка-
нонической форме, которая состоит в минимизации целевой функ-
ции
/(х) = сгх
при ограничениях Ах - Ь, х>0.
Будем считать, что векторы х и b имеют размерности пи т со-
ответственно, п > m, b > 0. Матрицу А( тх п ) называют матрицей
условий.
Изложим алгоритм применения симплекс-метода в общем виде.
Разделим все компоненты вектора на две группы: базисные и
свободные, обозначая их соответственно через хв и хг Не нарушая
общности, можно считать, что базисными компонентами являются
первые т компонент вектора х, а свободными — оставшиеся (т — п)
компонент. Тогда вектор х можно представить в блочном виде:
х7 =(xj,xj). Аналогично разобьём матрицу Л и вектор с на следу-
ющие блоки:
A = (B-.R), с = -
В — матрица размера тхт, R — матрица размера (тх (л — т)); св —
вектор размерности (тх 1); cR — вектор размерности ((л — т)х 1).
Матрицу В обычно называют базисом.
Полагая, что матрица Л неособенная, выразим базисный вектор
хв и целевую функцию /через свободный вектор xR:
97
Вхв + Rkr = b,
откуда
xB~B~[b-B~]RxR.
Введем новые переменные
а = В-’Л и р = ^-’д.
Тогда можно записать
хв=Р-ахл-
Аналогично получим выражение для целевой функции
/ = С^хв + cTRxR = cJ(P + axR)+cTRxR = у0 - yTxR,
где y0 = c^ = c^B~lb; ут = -ctr+ctrB-'R.
Полагая xR = 0, получаем опорные базисные переменные
хр =Р» xr ~ О’
при этом
/=То-
Соотношения для хв и f в скалярной форме имеют вид
*<=₽/“ X ацхр i=Vm, (6.15)
j-m+\
/ = Го- 1 ljxp (6.16)
J=m+\
По полученным соотношениям можно составить следующую
таблицу, называемую симплекс-таблицей (табл. 6.3).
В столбце свободных членов стоит значение целевой функции
у0 в точке =Рр х} = 0. Элементы в столбцах, соответствующие ба-
98
Таблица 6.3
Базисные переменнные Свободные члены Базисные и свободные переменные
... Xi ... Хщ -Чн+1 х/
*i р, 1 0 ... 0 аи «1.
... ... ... ... ...
0 0 0
... ... ... ... ... ... ... ...
Хт 0 ... 0 ... 1 о»мп-н ...
f Yo 0 ... 0 0 YWTi Y, Yn
зисным переменным, составляют единичную подматрицу симплекс-
таблицы. Характерной особенностью симплекс-таблицы является то,
что в столбце свободных членов содержится базисное решение и со-
ответствующее значение целевой функции. Далее происходит пере-
ход к новому базисному решению с целью уменьшения значения
целевой функции. При анализе симплекс-таблицы могут встретиться
следующие случаи.
Случай 1. Все коэффициенты в выражении (6.16) для целевой
функции уу. < 0 . В этом случае базисное решение является решени-
ем исходной задачи, так как в соответствии с необходимыми усло-
виями оптимальности производная по любому допустимому (нео-
трицательному) направлению будет неотрицательной.
Случай 2. Существует уу >0, но среди коэффициентов aip
j- hm, нет ни одного положительного. Этот случай соответствует
неограниченному решению задачи, так как неограниченное увели-
чение свободной компоненты Xj не приводит к нарушению исход-
ных условий неотрицательности.
Случай 3. Среди коэффициентов уу. существуют положитель-
ные, и для каждого у. > 0 существует а у > 0. В этом случае нетрудно
найти новое допустимое базисное решение со значением критерия,
меньшим чем у0. В качестве такого решения можно взять следую-
щее:
99
хк “Рл ~аА/Р’ = хк =0, к = т + \,п, k*j\
|Ч 1
х. = р = min — .
J i, «у>о^а/у
Метод решения задачи с использованием симплекс-таблиц|
сводится к последовательному проведению следующих операций п|
переходу от одной симплекс-таблицы к другой, или, что то же ей
мое, от одного допустимого базисного решения к другому и вклю
чает в себя:
— выбор индекса у, для которого > 0 (выбор ведущего стол-
бца);
— выбор индекса /, для которого отношение Р, /^ при ау >(
является минимальным по всем i = l,zn (выбор ведущей строки).
При этом элемент а у называется ведущим (генеральным).
Теперь необходимо перейти к новым базисным и новым сво-
бодным переменным путем перенесения компоненты Xj из разряду
базисных в свободные, а компоненты х.— из разряда свободных в
базисные переменные. Пересчет элементов симплекс-таблицы 1
новые осуществляются на основе соотношений(6.15), (6.16). Резуль*
таты представлены в табл. 6.4.
Расчетные формулы для элементов а1к новой симплекс-табли-
цы могут быть представлены в виде
<4 =
X /=/;
аи
/ = 0,/и, Л = 0,л,
(6.17)
где I = 0 означает первую строку в симпдекс-таблице, соответству-
ющую целевой функции, т.е. «0*=ул. Нетрудно установить, что
новая /-я строка определяется из старой путем деления последней
100
Таблица о. 4
X® в5|/ о 1 8 •S| -р» «з| а : л. а«У“ Оу
j>^*
1 I 1
J
: • • : :
X" о : W*- : О О
• • : : : :
+ J ! 1 г к 3 1 Е 3 : Jk • +| «1 С 1 С a” ₽ 3 t E 5 01 -ю fl _ 1+“Л
х6 о : о : —* o
: ; : • : •
Х~ f к 1 : -|г • | I? 1 1/ 1
:
X — : о о о
Свободные члены <4<? (? 1 <i|«? • Pm ” ami “ Hm mj afj <£ 1/ 1 О
Базисные переменные х" X' • XE
101
на ведущий элемент ау, а любая 7-я строка при 7# i вычисляется как
разность старой и результата умножения элемента ау на новую 7-ю
строку. В результате можно сформулировать следующее мнемоничес-
кое правило преобразования симплекс-таблицы.
а) Базисные переменные xi и х- меняются местами.
б) В клетку, соответствующую пересечению 7-й строки и у-го
столбца, заносится элемент Х = 1/ ау.
в) В оставшиеся клеткиу-го столбца заносятся произведения у-го
столбца исходной таблицы на — X.
г) В оставшиеся клетки 7-й строки заносятся произведения эле-
ментов 7-й строки на X.
д) В оставшиеся клетки заносятся элементы исходной матри-
цы, из которых вычитаются произведения новых элементов 7-й стро-
ки соответствующего столбца на старые элементыу-го столбца со-
ответствующей строки.
Сходимость данного алгоритма решения невырожденной зада-
чи гарантируется тем, что при сменах допустимых базисов значение
критерия уменьшается. Алгоритм применим и в вырожденных за-
дачах. Однако при этом возможно так называемое зацикливание —
бесконечное повторение набора допустимых базисов, отвечающих
одной вершине симплекса. Выход из зацикливания может быть осу-
ществлен путем перехода к другому ведущему столбцу симплекс-
таблицы.
6.3. Пример применения симплекс-таблицы
Рассмотрим в качестве примера ту же задачу об использовании
сырья, которая рассматривалась выше. Но теперь применим фор-
мальный алгоритм симплекс-метода.
Согласно (6.7), (6.9) в качестве исходной симплекс-таблицы
можно принять табл. 6.5.
Этой таблице соответствует следующее базисное решение:
х3 — 19, х4 = 13, х5 = 15, х6 = 18, Х|.= 0, х2 — 0.
Так как в последней строке имеются положительные коэффи-
циенты, решение может быть улучшено.
102
Таблица 6.5
Базисные переменные Свободные члены Свободные переменные
х. х2
х3 19 2 3
х4 13 2 1
х5 15 0 3
х6 18 3 0
f 0 7 5
Введём в число базисных свободную переменную хг В состав
же свободных переменных введем х6, так как
*6=Р =
min
i, а£>0
= 18/3.
Ведущим элементом является а61 = 3. Поэтому X = 1/3.
Применяя сформулированное выше мнемоническое правило,
получаем новую симплекс-таблицу (табл. 6.6).
Базисное решение не является оптимальным, так как в после-
дней строке имеются положительные элементы. Введём в состав
базисных переменных компоненту х2, а в состав свободныхъ компо-
ненту х4, ведущим элементом является а42 =3, Х = 1 (табл. 6.7).
Базисное решение снова не оптимально. Введём в состав базис-
ных переменных компоненту х6, а в состав свободных компоненту
х3, ведущим элементом является а63 = 3/4, Х= 4/3 (табл. 6.8).
Таблица 6.6
Базисные переменные Свободные члены Свободные переменные
Хб х2
19-6 2 = 7 -1/3-2 = -2/3 3-02=3
*4 13-6 -2= 1 -1/3 2=-2/3 1-0-2 = 1
*5 15-6 -0= 15 -1/3 0 = 0 3-00=3
Х| 1/3 18 = 6 1/3 1/3 0 = 0
0 — 6 7 = -42 -1/3-7 = -7/3 5-0-7 = 5
103
Таблица 6.7
Базисные переменные Свободные члены Свободные переменные
хь х4
х3 7- 1 -3 = 4 -2/3 - (-2/3) 3 = 4/3 -1 - 3 = -3
х2 1 1= 1 1 • (-2/3) = -2/3 1
Х5 15- I -3= 12 0-(-2/3)-3 = 2 -1 3= -3
X} 6-10=6 1/3 - (-2/3) 0=1/3 -1-0 = 0
f - 42 - 1 5 = -47 -7/3 - (-2/3) 5=1 -1 -5 = -5
Таблица 6.8
Базисные переменные Свободные члены Свободные переменные
Хз х4
хь 3/4 4 = 3 3/4 Ъ/4 (-3) = -9/4
х2 1 - 3 (-2/3) = 3 -3/4 (-2/3) = 1/2 1 - (9/4)- (-2/3) = = 5/2
*5 12-3-2 = 6 -3/4 • 2 = -3/2 -3 - (-9/4) (2) = = 3/2
*1 6 - 3 • 1/3 = 5 -3/4- 1/3= -1/4 0- (-9/4) (1/3) = = 3/4
f - 47 - 3 • 1 = -50 -3/4 • 1 = -3/4 -5 — (9/4) - (1) = = - 29/4
Полученное базисное решение является оптимальным, так как
все коэффициенты уу. < 0.
Упражнение 1. Решить задачу минимизации целевой функции
f = -3xj - х2 при ограничениях 3xt + х2 < 300, Xj +х2 < 150, х, > 0, х2 > 0.
Убедиться, что решение задачи не единственно. Почему?
Упражнение 2. Получить формулы для коэффициентов Р,» «у, Уо» У/ в
соотношениях (6.15), (6.16).
6.4. Выбор начального допустимого решения
Как уже указывалось, начальное допустимое решение общей
задачи линейного программирования в канонической форме может
быть получено путем разложения вектора х на две составляющие хл,
xR (базисный и свободный вектора), такие, что уравнение Ах = b
104
может быть решено относительнр хв. Разбивая матрицу Л на блоки
В и R, где базис В — не особенная матрица, базисный вектор пред-
ставим в виде:
xR = B~xb-B'RxR.
D К
Полагая хя - 0, получаем базисное решение
xR = B~[b,
которое может быть принято за начальное для использования сим-
плекс-метода, если окажется, что хя>0.
К сожалению, в общем случае на выполнение этого условия
рассчитывать не приходится. Выбор начального допустимого бази-
са В представляет собой самостоятельную задачу. Существует не-
сколько подходов для её решения. Наиболее простой подход состо-
ит в решении вспомогательной задачи линейного программирова-
ния, которая заключается в минимизации суммы неотрицательных
компонент вектора £ - Ь —Ах, т.е. в минимизации вспомогатель-
ной целевой функции
minC7^ где Ст =(1,1,...Д) (6.18)
при условиях
Ax+t^b', (6.19)
х>0, ^>0. (6.20)
В отличие от исходной задачи, для вспомогательной задачи мож-
но сразу указать начальное допустимое базисное решение: — Ь,
х = 0.
Начиная с этого решения, с помощью симплекс-метода мы мо-
жем решить вспомогательную задачу. Если допустимое множество
исходной задачи — не пусто, то в полученном решении целевая
функция (6.18), а вместе с ней каждая компонента вектора S, ока-
жутся равными нулю.
105
Соответствующее базисное решение определит начальное допу-
стимое решение для исходной задачи, исходя из которого она мо-
жет быть решена снова симплекс-методом.
6.5. Двойственная задача линейного программирования
Обсудим еще один метод решения задач линейного программи-
рования, который широко используется в настоящее время. Это —
так называемый двойственный симплекс-метод. Для пояснения его
сущности обратимся к задаче линейного программирования в об-
щем виде:
x*=arg min(c0 +сТх). (6.21)
х>0
Составим двойственную задачу по отношению к задаче (6.21)
Л(Х*) = max min F&M, (6.22)
Х>0 лйО
где Г(хД) — функция Лагранжа
F(xM = с0 + стх + )J\Ax - b). (6.23)
Раскрывая операцию минимизации (6.21) с учётом (6.23), полу-
чаем
A(V) = max (с0-&Д).
АТ\>-С, JL>0 и
В силу выпуклости целевой функции и допустимого множества
в задаче (6.21) функция Лагранжа (6.23) Имеет седловую точку, а
следовательно, решение двойственной задачи совпадает с решени-
ем прямой (исходной) задачи:
min (с0+сгх)= max (cQ-bT,k). /к 241
Ах<Ь, х>0 0 АтХ^-с, Х20 0
Это означает, что для решения прямой задачи достаточно ре-
шить двойственную ей. Из соотношения (6.24) следует, что если одна
из задач разрешима, то разрешима и другая.
106
Любая из задач может рассматриваться как прямая, тогда вто-
рая задача будет являться двойственной по отношению к ней. Каж-
дому ограничению прямой задачи соответствует переменная двой-
ственной задачи, и наоборот, каждая переменная прямой задачи
соответствует ограничению двойственной задачи. Решение двой-
ственной задачи может быть получено также с помощью симплекс-
метода.
Алгоритм решения задачи линейного программирования, состо-
ящий в применении симплекс-метода к эквивалентной двойствен-
ной задаче, принято называть двойственным симплекс-методом.
Применение двойственного симплекс-метода в некоторых слу-
чаях может оказаться более удобным или более эффективным, чем
в прямом симплекс-методе. Поясним сказанное, рассмотрев особен-
ности двойственной задачи. Представим обе задачи (прямую и двой-
ственную) в канонической форме. Для этого введем обозначения:
x' = b-Ax; х"=х;
Х' = ЛгХ+с; Х" = Х
Тогда прямая задача примет вид
min(/np =с0 + сгх"), х'+Ах"=Ь, х'>0, х">0, (6.25)
а двойственная задача вид
тт(/дв=-^+6гГ), Х'-ЛХ" = £, Х'^0, Х">. (6.26)
Размерности задач (6.25) и (6.26) одинаковы, так как в каждой
из них содержится (п + т) переменных, однако количество равенств
в них различно. Это приводит к тому, что в случаях, когда число
переменных исходной системы существенно больше числа ограни-
чений, применение двойственного симплекс-метода оказывается
более эффективным, чем прямого.
Выберем в качестве базисных векторов х в системе (6.25), X' в
системе (6.26) и выразим их через оставшиеся свободные перемен-
ные:
107
x=b-Ax";
K = c+ATX"
(6.27)
Согласно соотношениям (6.25)—(6.27) можно составить соответ-
ствующие симплекс-таблицы для прямой и двойственной задач со-
ответственно (табл. 6.9).
Таблица 6.9
х" А”
х' ь А А' с -Ат
•/lip сй -ст А. “С0 -Ьт
Элементы любой строки симплекс-таблицы двойственной зада-
чи отличаются от элементов соответствующего столбца симплекс-
таблицы прямой задачи лишь знаком. Можно показать, что это свой-
ство сохраняется не только при рассматриваемом наборе базисных
и свободных переменных, но и при любых других наборах.
А теперь представим себе, что в одной из рассматриваемых за-
дач, например в прямой, выбрано допустимое базисное решение,
которое не является оптимальным. Нетрудно установить, что базис-
ное решение соответствующей двойственной задачи не будет допу-
стимым, так как по крайней мере одна из компонент последней
строки прямой таблицы будет положительной, а следовательно, одна
из компонент первого столбца двойственной таблицы будет отри-
цательной. Справедливо и обратное утверждение: если в двойствен-
ной (или прямой) задаче базисное решение не является допустимым,
но все элементы первой строки ее симплекс-таблицы отрицательны
(неположительны), соответствующее базисное решение прямой (или
двойственной) задачи будет допустимым. Это свойство широко ис-
пользуется в практике, в частности при решении целочисленных
задач линейного программирования.
Предположим теперь, что при решении симплекс-методом двой-
ственной задачи достигнуто оптимальное решение. Это означает, что
все элементы последней строки полученной симплекс-таблицы бу-
дут отрицательны (неположительны), а элементы первого столбца
положительны (неотрицательны). Тогда, с одной стороны, базисное
108
решение исходной задачи будет,оптимальным, так как элементы
первого столбца прямой симплекс-таблицы будут положительны
(неотрицательны), с другой стороны, элементы первой строки этой
таблицы будут отрицательны (неположительны). А это и означает,
что в симплекс-таблице исходной задачи записано также оптималь-
ное решение.
Для иллюстрации возможности применения двойственного сим-
плекс-метода рассмотрим пример, связанный с минимизацией фун-
кции f = -2jq - 2xj при ограничениях
3xL + Х2 < 300; Xj + < 150; Xj + 2xj < 240.
Для сведения задачи к каноническому виду введем дополнитель-
ные переменные:
х3 = ЗОО-Зх, -х2;
х4 = 150 -Xj -х2;
х5 = 240-Xj -2xr
Решение задачи можно получить прямым симплекс-методом,
используя в качестве начальной симплекс-таблицы (табл. 6.10).
Таблица 6.10
*1 *2
*3 300 3 1
х4 150 1 1
Xj 240 1 2
f 0 2 1
Упражнение. Получить решение сформулированной задачи прямым
симплекс-методом, используя в качестве начальной симплекс-таблицы
табл. 6.10.
А мы для решения используем двойственный симплекс-метод.
В данном примере двойственная задача имеет вид
min(300A.j + 150Х2 + 240Х3)
109
при ограничениях
ЗХ| + Х2 + Х3 ^2,
Х| + Х2 + 2Х3 1
или в новых переменных
Х4 = ЗХ1+Х2+Х3-2, \>0
Х3 = X] + Х2 + 2Х3 — 1, i = 1,5.
Соответствие между переменными прямой и двойственной за-
дач следующее:
X] ** Х4, Xj Х|, ~ Х3, %2 Х^, х4 Х2.
Выберем в качестве базисных переменных X, и Х2 :
Х4-Х5=2Х1-Х3-1;
\=|+^3+^4-^5;
15 1 3
Х4 -ЗХ5 =-2Х2 -5Х3 -1 =>Х2 =4"1Хз + Г5
Получим выражение для целевой функции
f = 3Oof 1+1X, + |х. -11, V150f-1 - X, -1X, + X, 1+ 240Х„
^2 2 3 2 4 2 5J 2 2 3 2 4 2 5J 3
или
/ = 225 + 15Х3 + 75Х4 + 75Хг
Составим симплекс-таблицу для двойственной задачи (табл. 6.11)
Из таблицы видно, что решение, содержащееся в двойственной
симплекс-таблице, оптимально, так как все элементы последней
строки, соответствующие свободным переменным, отрицательны.
Согласно сформулированному ранее правилу табл. 6.11 соответ-
ствует прямая симплекс-таблица (табл. 6.12) для исходной задачи.
ПО
Таблица 6.1 1
Х3 *5
^>1 1/2 -1/2 -1/2 1/2
1/2 5/2 1/2 -3/2
/ 225 -15 -75 -75
Таблица 6.12
х4
*5 15 1/2 -5/2
75 1/2 -1/2
75 -1/2 3/2
f -225 -1/2 -1/2
Из табл. 6.12 также следует, что решение, содержащееся теперь
в прямой симплекс-таблице, оптимально, так как все элементы пос-
ледней строки, соответствующие свободным переменным, отрица-
тельны.
Упражнение 1. Показать, что для задачи max стх при условиях Ах<Ь\
х> 0 двойственная задача имеет вид min Ьт>к при условиях Атх> ct X > 0.
Упражнение 2. Показать, что имеет место следующая связь между дву-
мя задачами линейного программирования:
max стх = min дгХ
Ах = Ь, х>0 АТХ >с.
6,6, Задачи большой размерности с блочной структурой
матрицы условий. Метод декомпозиций
Для задач большой размерности характерной особенностью яв-
ляется специфичность структуры матрицы условий. Часто значитель-
ную часть элементов матрицы условий составляют нулевые, а нену-
левые элементы располагаются в матрице особым образом, напри-
мер, вдоль главной диагонали. Учёт специфики структуры матрицы
условий позволяет разработать эффективные методы решения задач
большой размерности.
111
Познакомимся с одним из таких методов — методом разложе-
ния (декомпозиции) Данцига—Вульфа.
Чтобы лучше понять сущность метода, обратимся сначала к
следующей задаче линейного программирования. Пусть требуется
найти минимум целевой функции
f = стх при условии Ах = Ь, х>0. (6.28)
Пусть матрица А имеет следующую блочную структуру:
. (Л1 (Н
А [о л2;
Тогда задача (6.28) распадается на две самостоятельные задачи:
minc,7*xl, Лх1 =£1, х! >0,
min х2, Л2х2 = Ь2, х2 > 0,
где х1, х2, с1, с2, Ь\ Ь2 — соответствующие блоки векторов х, с, Ь.
Фактически решение исходной задачи в данном случае сводит-
ся к решению независимых между собой задач меньшей размерно-
сти.
В общем случае, когда компоненты вектора х взаимосвязаны,
решение нельзя получить в результате изолированного решения за-
дач такого рода. Тем не менее, применение метода разложения ис-
ходной задачи на ряд подзадач оказывается возможным во многих
случаях, правда, эти задачи должны быть между собой скоордини-
рованы.
Рассмотрим задачу, у которой матрица условий имеет частично
блочно-диагональную структуру вида
Л °, Л1 — блоки матрицы Л,
причем блок Л°, называемый блоком-связкой, в общем случае свя-
зывает все компоненты вектора х, а блок Л1 — диагональный, он
определяет взаимосвязь лишь части компонентов.
112
Итак, пусть требуется найти минимум целевой функции
f = стх при условиях AQx-bQ, Ахх-Ьх, х>0, (6.29)
Л>°, Ьх — векторы размерности Л° и к1.
Обозначим через X множество допустимых решений задачи
(6.29), через А0 — множество решений системы-связки {х: Л°х = Z>0},
через X — множество неотрицательных решений диагонального
блока:
Xх = {х:Л’х = ^, х>0}.
Очевидно, множество допустимых решений задачи (6.29) пред-
ставляет собой объединение множеств X® и X,1 X = Х° П А4. Мож-
но показать, что если А"1 — ограниченное множество (выпуклый мно-
гогранник), то любое хе Xх можно представить в виде линейной ком-
бинации вершин этого множества:
x=^ctjxj, = a7-0’ У = 1,ЛГ, (6.30)
j=i j=i
где W — число вершин этого многогранника.
С учётом представления (6.30) задача (6.29) теперь формулиру-
ется следующим образом:
требуется найти
min У стх а. при условии У А°х .а. = д°
J J J J
j j
£ау = 1, ау >0, j = l,7V. (6.31)
j
Введём обозначения:
°=1Н=еч|’ л=лч- М?)
\ 7
*0=(Т} а=Ы1-
113
Тогда задача (6.31) сводится к следующей задаче линейного
программирования:
найти минимум функции
/ = стга при условии Ра=Ь\ а>0. (6.32)
Таким образом, исходная задача (6.29) свелась к эквивалентной
ей задаче (6.32), которую будем называть главной или координирую-
щей задачей.
Преимущество данной задачи по сравнению с исходной заклю-
чается в том, что количество ограничений в ней равно размерности
вектора Z>°, увеличенной на единицу (fc° +1), в то время как размер-
ность исходной задачи (Л° + Л1).
Заметим, что приведенные рассуждения справедливы и по от-
ношению к неканоническому виду исходной задачи. В этом случае
и главная задача получается в неканоническом виде.
На первый взгляд, может показаться, что для решения главной
задачи необходимо знание всех вершин многогранника . Однако
задачу (6.32) можно решить, не зная ни всех вершин многогранни-
ка J1, ни даже числа этих вершин.
Представим вектор а в виде совокупности базисных и свобод-
ных переменных:
ат =(aTB,aTR).
Вектор ст и матрицу Р соответственно разложим:
ог=(а£,а£), P=(PB,PR).
Учитывая это, связи базисных переменных и целевой функции
(6.32) со свободными переменными можно представить в виде
PRaR + PRaR = F°;
D D Л Л 7
aB = PBW-P^RaR, (6.33)
f = <sTBaB +<sTRa.R = <sTBPBl(b°-PRaR)+oTRaR,
114
или в более компактном виде
/ = KTtf> - <kTPR - <sTR = Yo + yTaR,
7o = W, (634)
где введено обозначение =
На основе (6.34) можно записать следующие формулы для эле-
ментов вектора Y:
Ъ = \Тр. + _ о. = (Хг ло _ ст)х. + .
<635>
Таким образом, мы выразили базовые переменные и целевую
функцию через свободные переменные. Условием оптимальности
базового решения является неположительность всех элементов Ту ,
которые можно представить следующим образом: гпаху^. <0. Мак-
симум может рассматриваться по всем вершинам множества Л1.
Таким образом, проверка базиса главной задачи на оптимальность
сводится к решению задачи минимизации линейной целевой функ-
ции
где ~ст -КтЛ°.
Эта минимизация должна рассматриваться на множестве всех
вершин Ху, но это равносильно тому, что мы можем рассматривать
минимизацию этой линейной целевой функции на всём множестве
А1. Таким образом, мы получим следующую задачу линейного про-
граммирования:
найти минимум функции
fx = c[x при условии х>0. (6.36)
115
Задачу (6.36) называют подзадачей, соответствующей диагональ-
ному блоку. Если оптимум подзадачи (6.36) удовлетворяет условию
mincfx>Xt0+|, (6.37)
то базис в главной задаче оптимален. Если рассматриваемый базис
в главной задаче оказался неоптимальным, то его необходимо изме-
нить в соответствии с симплекс-методом. Поскольку полученные ре-
шения подзадачи являются одной из вершин множества А1 и соот-
ветствующее значение коэффициента Уу > 0, в новый базис следует
ввести компоненту вектора а, соответствующую вектору Pf = (Л°х*).
Выводимая из базиса компонента определяется в соответствии
с симплекс-методом. Новый базис можно снова проверить на опти-
мальность, построив и решив свою подзадачу, ^ерез конечное чис-
ло итераций получим оптимальный базис и оптимальное решение
задачи. А с его помощью получим оптимальное решение для всей
задачи.
Случай, когда матрица условий имеет несколько диагональных
блоков, принципиально не отличается от рассмотренного.
Действительно, рассмотрим задачу минимизации целевой фун-
кции
/ = с1Гх,+с2г (6.38)
при условиях
Л0,х’ + Л02х2 — £>°,
Л1х1=^>1, А2х2-Ь2.
Введем обозначения
ЛМЧЛхМ, х1 >0},
X2 ={х2: А2х2 = Ь2, х2 >0}.
Каждое из этих множеств можно представить в виде линейной
комбинации множеств
116
*‘=5X. Ea}=1> °;
x2=£a2, £a2 = l, a2 2 0. (6.39)
j J
Подставляя эти выражения в уравнения связей и целевую фун-
кцию, получим главную задачу, эквивалентную исходной, в следу-
ющем виде:
min(G17al + о27a2); PW + Р2а2 = F0; а1 >0; а1 >0.
Здесь введены обозначения:
Если решена главная задача, то легко найти решение и исход-
ной задачи. Для проверки базиса главной задачи на оптимальность
можно использовать, как и ранее, подзадачи, определяемые диаго-
нальными блоками. Однако теперь таких подзадач будет две:
т
minc£ х1 при условии Аххх = #, х*>0;
minc^x2 при условии Л2х2 =Z>2, х2>0.
Здесь использованы обозначения
cf=c|7'-X^01) cf=C'r-V4','> X = 0ph-'.
Если оптимумы задач удовлетворяют условиям
minefx1 >Х^+1>
min «^х2 21^,
то базис основной задачи оптимален.
117
6.7. Пример использования метода декомпозиции
Для иллюстрации метода декомпозиции рассмотрим решение
следующей задачи линейного программирования:
найти минимум целевой функции
/= -Xj - 2х2 - х3
при условиях
Xj +X2+Xj+X4 <1,
Xj-Х2 <1,
Xj + Х2 < 3, Xj >0, j = 1,4,
Xj <1,
X4^1-
Сформируем главную задачу. В данном случае имеем
х|Г=(х1,х!), х*Т =(х3,х4);
л01 =(1,1), л02=(1,1), л'=р Ч Л2 =
й° = 1, *'
После подстановки (6.39) в исходную задачу получим главную
задачу в следующем виде:
minfo^a1 +о2Га2);
Р1а1 + Р2а2 = Л°;
Ъ а' - а2 - °;
J j
pi =|р; = л01х)|; Р2=|Ру2=ЛО2х2|.
118
Для сведения главной задачи, к каноническому виду введём до-
полнительные переменные:
а = д°-Р1а1 -Р2а2, а>0;
Р°= О
О
Приведём задачу к следующему виду:
minuet, Pa=Z>°, а>0.
Построим исходный базис главной задачи. Нужно выбрать три
базисные переменные. К числу базисных переменных отнесём ком-
поненту а и те компоненты векторов а1 и а2, которые соответ-
ствуют нулевым вершинам диагональных блоков:
х>Г=(0, 0), х2Т=(0, 0);
р
0
о
0
1
0
В “
0>
0 = /3 - базисный вектор;
1
119
о
1
о
СП гп
О = 1
1 1
7 к 7
Выбранный базис является допустимым:
<5ТВ = (o,drx},c2rx2lj = (O, О, О),
=О^в-> =(^ЛКо+1Лх0+2)=(0, О, 0).
Для проверки этого базиса на оптимальность обратимся к пер-
вой подзадаче:
minfc^x1), Л1*1 < Z»1, х1 > 0, cf = с'Т -ХтЛ01 = с'Т.
Нетрудно видеть, что minfcj^x1) =-6 и х’г =(0, 3) = xJr.
Так как рассматриваемый базис не оптимален, то вторую под-
задачу рассматривать не требуется, а следует перейти к новому ба-
зису. Введём в базис Д1, который соответствует вершине xj. Полу-
чим
a -p-lpl =
J В Rj
<1
о
о
<1
о
о
(Г
о
о
(1,1)
(0V|
1 1
I3 J
1
О
<1
о
о
min
(1
mm <-
1)1
1J 3’
о
1
о
о
1
1
о
о
1
1
Л
“и
1
1
о
1
о
0
0
1
1
1
1
1
120
Составим новый базисный вектор:
r/l0lx’ 0 0>
1 1 О
О 0 1
\ 7
=(1,1)
р
1
о
\
О (П
1 0 =3;
О 1
о
3
г 1/3
0>
о .
1
О
1
О
Pj'= -1/3
о
к
Получим
а5 = (с’^,с1Гх},с2\2) = Г(-1, -2)Р1 О, 01= (-6,0,0);
Г1/3
X7’=arp-i=(.6jo,O) -1/3
О
°1
О =(-2,0,0).
1
О
1
О
Для проверки базиса на оптимальность обратимся к первой
подзадаче:
min(c}rxl), А}х1 < Ь1, х1 > 0;
4Г=^-ХгЛ01=(-1,-2)-(-2)(1, 1)=(4, 0).
Задача тривиальна: штЦ), Л!х* < Ь}, х1 > 0.
Ее решение: Х| = 0, 0 < Xj < 3.
Переходим ко второй подзадаче:
min(c£rx2), А2х2 < Ь2, х2 > 0;
cf =с2-\тАт =(1, 0)-(-2)(1, 1)=(3, 2).
121
Задача свелась к решению тоже тривиальной задачи
min(3x3 + 2х4 ) = 0, х3 = О, х4 = 0.
Итак, рассматриваемый базис оптимален. Таким образом, мы
Окончательное решение задачи
х* =0, х*2 = 1, х3 =0, х4 = 0, min стх = -2.
Упражнение. Решить методом декомпозиции задачу минимизации
функции f - —Х| - х2 - 2х3 -х4 при условиях
X] + 2х2 + 2х3 + х4 < 40;
X! + Зх2 < 30;
2xt + х2 < 20;
х3 < 10;
х4 < 10;
х3 + х4 < 15; Xj >0, j - 1,4.
7. МЕТОДЫ НЕЛИНЕЙНОГО
ПРОГРАММИРОВАНИЯ
Перейдем теперь к рассмотрению наиболее распространенных
численных методов оптимизации при наличии ограничений в об-
щем случае, когда целевая функция нелинейная. Существует два
основных подхода к построению алгоритмов такого рода. Первый
122
состоит в непосредственнохМ учет? ограничений задачи (хотя, может
быть, и приближенно). Этот подход реализован, например, в мето-
дах аппроксимирующего линейного программирования, возможных
направлений, проективного градиента. Второй подход состоит в
сведении исходной задачи при наличии ограничений к последова-
тельности задач безусловной оптимизации путем использования
функций штрафов. Методы, реализующие данный подход, называ-
ются методами штрафных функций.
7.1. Методы аппроксимирующего
линейного программирования
Сущность всех методов данной группы заключается в том, что
нелинейная целевая функция и функции ограничений заменяются
последовательностью аппроксимирующих линейных функций и тем
самым сводят исходную задачу к задаче линейного программирова-
ния.
Один из алгоритмов аппроксимирующего линейного програм-
мирования состоит в следующем. Пусть требуется найти
min f(x) по х при условии g(x) <0.
Произведем замену нелинейных функций f(x) и g(x) их линей-
ными аппроксимациями путем разложения в ряд Тейлора в окрес-
тности точки х*. В результате получим задачу линейного програм-
мирования
f(xk) + V/( xk )г (х - xk) -> min;
g(x*) + (x - x*) < 0.
Эх
Так как решение указанной задачи может вывести вектор х за
пределы допустимой области исходной задачи, то необходимо вве-
сти дополнительные ограничения на компоненты вектора х, напри-
мер, в виде
123
I*,"*/ I"8?’
где > 0 ограничивают длину шага при перемещении в том или
ином направлении. Решение полученной таким образом задачи и
предполагается принять в качестве нового (£+1)-го приближения
х*+|. Для ее решения следует воспользоваться соответствующими
методами линейного программирования. Основным недостатком рас-
смотренного метода является слабая сходимость в районе существен-
но нелинейных ограничений.
Другой метод аппроксимирующего линейного программирова-
ния предполагает использование кусочно-линейной интерполяции
нелинейных функций /(х) и g(x) в следующем виде:
/(х) = £ц//(х/);
/=|
/=1
и.
где У — задаваемые точки сетки; Ц, — весовые неизвестные коэф-
фициенты.
В итоге вместо исходной нелинейной задачи получаем снова
задачу линейного программирования
min^/XxO
/=1
124
при ограничениях
£^ = 1; ц, £0; / = !,/>.
/=1 /=1
В отличие от исходной задачи здесь искомыми являются весо-
вые коэффициенты ц,. Эффективность метода в значительной сте-
пени определяется выбором точек сетки х* и их количеством. Эта
процедура в методе наиболее трудоёмкая.
7.2. Метод возможных направлений
Сущность данного метода сводится к следующему. Поиск на-
чинается в допустимой точке и реализуется при линеаризованных
ограничениях по траектории, обеспечивающей наибольшее улучше-
ние значений целевой функции и вместе с тем не выходящей за
пределы допустимой области.
Если через s* обозначить возможное (допустимое) направление
поиска из точки х* то новая точка x*+l определится соотношением
X*fl _ хк + ^к ,
где hk — шага поиска.
Подставляя в линеаризованные выражения для /(х) и g(x)
вместо вектора х значения х*+|, приходим к задаче
f(xk) + hkVf(xk )т sk min;
g(x*)+M sk s0
oX
Очевидно, что точка x*+1 будет допустимой, а следовательно, и
направление будет допустимым, если выполняется условие
Эх
125
Поэтому, решая задачу
Д f(xk)Tsk ->min
при условии
Эх
мы определим вектор допустимых направлений /, вдоль которого
целевая функция f(x) имеет наибольшую скорость убывания.
Что касается величины шага поиска вдоль выбранного направ-
ления, то ее можно определить, как и в методе наискорейшего спуска,
из решения одномерной задачи минимизации:
hk =arg min f(xk + hsk);
h
A>0, g(xk +hsk)<Q.
Основное достоинство представленного метода состоит в его
универсальности. К недостаткам следует отнести большой объем
вычислений на каждой итерации и невозможность учета ограниче-
ний типа равенств.
7,3. Проективный градиентный метод
Одной из модификаций метода возможных направлений явля-
ется проективный градиентный метод, который отличается от ме-
тода возможных направлений лишь тем, что при попадании точки
х* на границу (или при приближении к границе) допустимого мно-
жества направление поиска sk определяется путем проектирования
антиградиента -V f(xk) на эту границу, являющуюся линейной ап-
проксимацией допустимого множества вблизи точки хк. Тем самым
метод позволяет учитывать ограничения как типа неравенств, так и
строгих равенств.
Сущность метода поясним на примере задачи нелинейного про-
граммирования с линейными ограничениями
126
f (x) -» min при условиях Ax < b.
Пусть x* — некоторая допустимая граничная точка, для кото-
рой выполняется условие Ак хк — Ьк. Здесь через Ак , № обозначены
части матрицы А и вектора Ь, соответствующие активным ограни-
чениям в точке х* . Будем искать новую точку x*+I = х* +hk sk так,
чтобы, помимо условия Ах < Ь, по-прежнему имело место #х*+1 —
= М. Очевидно, для этого необходимо выполнение условия Ак st = 0.
Как и в методе возможных направлений, поставим задачу по
определению наилучшего допустимого направления поиска. Таким
направлением будет считать направление, задаваемое единичным
вектором st, вдоль которого функция /(х) имеет наибольшую ско-
рость убывания. Получаем следующую задачу на условный экстре-
мум:
Vf(xk)Tsk -> min
при условиях
Aksk = 0, sTs = 1.
Задача может быть решена аналитически с использованием ме-
тода множителей Лагранжа. Составим функцию Лагранжа и восполь-
зуемся необходимыми условиями оптимальности:
F(sk Aj Д2) = VfT(xk )sk + + X2[l - (sk)Tsk ];
|^=7/(х*) + Хх1-2А./=0;
dsK
^L = Aksk=0;
Решая полученную систему уравнений, получим искомое направ-
ление поиска
127
k= W(**)
I
где
БА = /-(^)Г(ЛА(ЛЛ)7')-М<
При этом предполагается, что матрица [ЛА(Ак )г]-1 существует.
Геометрически вектор BkVf(xk) означает проекцию антиградиента
на границу, задаваемую условием Акх = Ьк. Этим и объясняется на-
звание метода. Величину шага hk можно определить, как и прежде,
из условия
hk = arg min f (xk +hsk);
h
A>0, A(xk + hsk)<b.
Метод проективного градиента достаточно трудоемок, так как
требует проведения анализа на каждом шаге активных ограничений
задачи и соответствующей корректировки матриц Ак и Вк. При ис-
пользовании метода в общем случае при наличии нелинейных огра-
ничений g(x) <0 трудности еще более возрастают.
Во-первых, необходимо вычисление частных производных ак-
тивных ограничений g(x*) = 0 по вектору х, которые играют роль
матрицы Ак. Во-вторых, ввиду нелинейности ограничений теперь
движение вдоль проекции антиградиента уже не может гарантйро-
вать пребывание новой точки хк в допустимой области. Поэтому в
общем случае приходится несколько корректировать алгоритм по-
иска, вводя в него с целью невыхода из допустимой области соот-
ветствующую компенсационную составляющую.
7.4. Методы штрафных функций
Осуществление минимизации без ограничений представляет
собой более лёгкую задачу, чем минимизация с ограничениями,
поэтому существуют попытки преобразования задач с ограничения-
ми в задачи без ограничений. Для этого имеются различные подхо-
128
ды. Один из них связан с заменой переменных. Например, если ска-
лярная переменная удовлетворяет ограничениям | х|< 1, можно ис-
пользовать замену переменной х на величину 6, задаваемую усло-
вием х = sinO или х = cose.
Более широкое применение получили методы штрафных функ-
ций. Они выгодно отличаются от других методов условной опти-
мизации простотой реализации. Сводя решение задач условной оп-
тимизации к последовательности решения задачи безусловной оп-
тимизации, методы штрафных функций, по существу, дают в рас-
поряжение исследователя весь тот богатый аппарат, который име-
ется для решения задач безусловной оптимизации.
Общую схему построения алгоритмов поиска поясним на зада-
че минимизации функции /(х) на некотором множестве X. Фор-
мально эта задача эквивалентна задаче безусловной минимизации
суммы /(х) + 5(х), где
5(х) =
О, хеХ;
©о, хе %.
По сути дела, функция 5(х) является функцией штрафов
(рис. 7.1).
Но так как функция 3(х) неприемлема для проведения расче-
тов, то вместо нее предполагается использовать такие штрафные
функции 5(х,а), которые удовлетворяют условию lim 3(х,а) = 5(х)
для всех х. В этом случае исход-
ная задача оказывается эквива-
лентной задаче
(/ (х) + Ит б(х,а)] -> min.
Если при этом операции
минимума и предела окажутся
перестановочными, то мы полу-
чим последовательность задач
Рис. 7.1. Штрафная функция 5(х)
129
безусловной минимизации по отношению к преобразованной целе-
вой функции
f(x,a) = /(x) + 5(x,a),
пределом которых при a -»«> будет точка минимума функции /(х)
на множестве X.
Существуют два основных подхода к построению штрафов
5(х,а). В соответствии с этими подходами различают и два метода
штрафных функций — метод внутренней точки (метод барьерный
функций) и метод внешней точки.
7.4.1. Метод внутренней точки
Метод внутренней точки предполагает построение штрафов та-
ким образом, чтобы при приближении вектора хе X к границе обла-
сти X величина 5(х,а) неограниченно возрастала. В этом случае тра-
ектория поиска минимума (если, конечно, поиск начат с внутрен-
ней точки множества X) полностью будет лежать внутри множества
X. Отсюда и название метода.
Если рассматривается задача минимизации функции /(х) при
ограничениях gz(x)>0, / = 1,т, то в качестве штрафов могут быть
использованы, например, такие функции:
8U<x) = -£—1—, 5(x,a) = --£lng,.(x).
Для иллюстрации работы метода внутренней точки рассмотрим
следующую задачу. Найти min(Xj + х2) при условиях х2 > xf , Xj > 0.
Из геометрических соображений ясно, что решением является точ-
ка с нулевыми координатами. Посмотрим теперь, как будет проис-
ходить движение к минимуму в рассмотренном методе с использо-
ванием логарифмической функции штрафов. В данном случае пре-
образованная целевая функция имеет вид
130
F(x,a) = x1 + x9 ~ —ln(x7 -x?)-~lnxr (7.1)
a v 1' a
Воспользовавшись необходимыми и достаточными условиями
оптимальности, можно показать, что безусловный минимум функ-
ции F(x,a) достигается в точке с координатами Xj (a) =-,
(-1 + 71 + 8/a)2 j _ /чп
х2 (а) = + — - Отсюда видно, что при a -> , х,(а) -> 0,
х2(а) -э 0, т.е. решения последовательности задач безусловной ми-
нимизации функции F(x,a) сходятся к решению поставленной за-
дачи.
Основные достоинства метода внутренней точки заключаются в
следующем. В процессе поиска целевая функция уменьшается без
нарушения ограничений. Поэтому нет необходимости отдельно учи-
тывать границу допустимой области (например, пытаться двигаться
по границе). Преобразованная целевая функция сохраняет в общем
свойства исходных функций /(х) и g(x) (например, непрерывность,
дифференцируемость). К недостаткам метода следует отнести необ-
ходимость иметь в качестве начальной точки поиска допустимую
точку, а также неприменимость метода при наличии ограничений
типа равенств.
7.4.2 Метод внешней точки
Метод внешней точки предполагает построение штрафов таким
образом, чтобы значения преобразованной целевой функции F(x,a)
в допустимой области точно или приближенно равнялись значени-
ям исходной целевой функции /(х), а вне допустимой области су-
щественно превосходили значения /(х) . Для задачи отыскания ми-
нимума функции /(х) при ограничениях
gz(x)<0, i = l,m; g((x) = 0, /=т + 1,/,
131
наиболее распространены следующие функции штрафов:
/ ml
8(х,а) = a£g(x)2; 6(х,а) = а£к,+(х)2 +а £ g,W2;
/=1 t=l i=m+\
т /
5(x,a) = a£gt(x)2 +а X 1яДх)21>
/=1 /=т+1
где g,+(x) = max{0,g.(x)}.
Преимущества метода внешней точки заключаются в большей
его универсальности: метод применим при наличии различных ог-
раничений (равенств и неравенств), процесс поиска может быть на-
чат из любой точки (допустимой и недопустимой). К недостаткам
метода следует отнести тот факт, что элементы последовательности
х* (а) при а -> ое могут не принадлежать допустимой области, а так-
же невозможность при некоторых функциях штрафа применения ме-
тодов поиска с использованием вторых производных.
С учетом сказанного на практике может оказаться наиболее
эффективным применение комбинированного метода штрафных фун-
кций: для части ограничений (типа неравенств) применяется метод
внутренней точки, а для другой части ограничений (типа равенств)
— метод внешней точки. Преобразованная целевая функция в этом
случае может быть представлена, например, в виде
Г(х,а) = /(х)--£1п £,.(%) +a £ g,(x)2.
a /=1 /=т+1
Завершая рассмотрение методов штрафных функций, обратим
внимание на одно важное обстоятельство, свойственное всем мето-
дам этой группы. Как мы убедились, решение задачи, полученное с
помощью того или иного метода штрафных функций, будет тем
точнее, чем больше параметр штрафа a. Однако нетрудно убедить-
ся, что с увеличением а задача безусловной минимизации функ-
ции F(x,a) усложняется из-за того, что последняя приобретает все
более выраженную овражную структуру. Кроме того, при больших
132
а возрастает роль ошибок счета (округления). В силу этого найти
минимум Г(х,а) по х при больших а с высокой точностью оказы-
вается практически невозможным. Поэтому методы штрафных фун-
кций обычно используются для получения приближенного решения,
при этом целесообразно, по крайней мере в начале процесса поис-
ка, задавать небольшие значения параметра штрафов.
Упражнение 1. Найти минимум функции (7.1).
Упражнение 2. Решить задачу минимизации функции f (х) = х2 при
условии х2 -sinxt >0 с использованием метода штрафных функций.
8. ЦЕЛОЧИСЛЕННОЕ ПРОГРАММИРОВАНИЕ
Среди практически важных задач математического программи-
рования важное место занимают задачи с требованием целочислен-
ности всех или части переменных. Эти задачи получили название
задач целочисленного программирования.
В задачах целочисленного программирования область допусти-
мых решений является невыпуклой и несвязанной. Это существен-
но затрудняет получение их решения привычными (непрерывными)
методами с последующим округлением найденного решения. Необ-
ходимы специальные методы. Такими методами являются методы
отсечения (или отсекающих плоскостей), ветвей и границ, последо-
вательного анализа вариантов, а также различные приближенные
методы.
8.1. Методы отсечения
Сущность методов отсечения заключается во временном отбра-
сывании условий целочисленности путем погружений исходной
области допустимых решений в некоторую выпуклую область, со-
держащую искомое целочисленное решение. К полученной задаче
применяются известные методы оптимизации. Если найденное ре-
шение удовлетворяет условиям целочисленности, то исходная зада-
ча решена. В противном случае производится корректировка полу-
ченного решения путем погружения исходной области допустимых
133
решений в новую выпуклую область и т.д. Поясним метод на при-
мере задачи линейного целочисленного программирования.
Пусть требуется найти
min стх при условиях Ах > Ь, х > О,
все компоненты ху. вектора х - целые числа.
Предположим, что все компоненты векторов си Ь — целые числа.
Отбросим на время условие целочисленности. Пусть хнц — решение
задачи (8.1) без учета условия целочисленности. Его можно найти с
помощью симплекс-метода. Если окажется, что хнц удовлетворяет и
условиям целочисленности, то данное решение является оптималь-
ным и для исходной целочисленной задачи. В противном случае
сформируем дополнительное ограничение, которому заведомо удов-
летворяет любое целочисленное решение задачи, но не удовлетво-
ряет найденное решение хнц. Такое ограничение принято называть
отсечением. Отсюда и название метода. Геометрически отсечение
означает гиперплоскость, отсекающую от выпуклого многогранни-
ка соответствующей задачи линейного программирования многогран-
ник, содержащий все целочисленные решения. Таким образом, ис-
ходную систему ограничений без учета условий целочисленности
дополняют отсечением, после чего рассматривают новую нецелочис-
ленную задачу линейного программирования.
Простейшим методом отсечения является метод Данцига. Он
состоит в следующем. Пусть для задачи (8.1) без учета целочислен-
ности найдено оптимальное решение хнц. Соответствующая связь
базисных переменных ху и целевой функции f — сТх со свободными
переменными ху согласно (6.15) и (6.16) определяется соотношени-
ями
х =₽ / = ТО-ХЬЛ- (8-2)
ЛЯ ЛЯ
Здесь R — множество индексов у, соответствующих всем свобод-
ным переменным.
Напомним, что для оптимального решения все . > 0 . Если ока-
зывается, что все компоненты 0, одновременно не являются нео-
134
трицательными целыми числами, т.е. базисное решение xi = ₽z,
Xj — 0, не является целочисленным решением задачи (8.1), то в оп-
тимальном целочисленном решении по крайней мере одна из пере-
менных Xj должна быть положительной и, по условиям целочис-
ленности, не меньше единицы. Другими словами, должно иметь
место следующее неравенство:
(8.3)
УеЛ
Рассмотрим теперь расширенную задачу линейного программи-
рования
minстх при условиях Ах > b, X > 1, х > 0. (8.4)
jeR
Очевидно, что множество допустимых решений этой задачи
будет уже, чем соответствующее без условий целочисленности мно-
жество задачи (8.1). Тем не менее оно содержит все допустимые
решения задачи (8.1). Если окажется, что оптимальное решение за-
дачи (8.4) удовлетворяет условиям целочисленности, то оно являет-
ся оптимальным и для задачи (8.1). В противном случае для нового
множества свободных переменных вводится новое ограничение вида
(8.3) и процесс повторяется. Основным недостатком рассматривае-
мого метода является отсутствие гарантии сходимости. В связи с этим
были предложены и другие методы построения отсечения.
Наиболее эффективным из них является метод Гомори, который
в большинстве случаев за конечное число итераций приводит к оп-
тимальному решению задачи (8.1). Метод состоит в следующем. Как
и ранее, будем полагать, что мы уже решили задачу (8.1) без учета
условий целочисленности и это решение не является целочислен-
ным. Предположим, что Р, — не целое. Представим р,- и соответ-
ствующие им ау в виде
Р(=[р,.]+Д,, а#=[ай.]+Д₽., (8.5)
135
где через [pj, [о^] соответственно обозначены целые части, а че-
рез ДД.. — дробные части чисел Р7, а.., так что 0 < Д,. < 1,0 < Д/у < 1.
Подставим (8.5) в (8.2), получим
xt =[₽,]- Х[«#Ь+д,-Едл-
(8.6)
щего (8.2), величина
ла
Так как для любого целочисленного решения хр удовлетворяю-
Xj должна быть целой, то в соот-
ветствии с (8.6) величина Д;. - У А^х. также должна быть целой.
JeJ?
Величина У А^х. не может быть отрицательной. Поэтому величи-
Л А
на д, - У Д/?.Ху не может быть положительным целым числом. Итак,
ЛА
любое допустимое (целочисленное) решение задачи (8.1) должно
удовлетворять неравенству
£д,..ху. >Д,.. (8.7)
ЛА
Очевидно, что оптимальное нецелочисленное решение задачи
(8.1) не удовлетворяет условию (8.7). Поэтому, присоединив к огра-
ничениям нецелочисленной задачи (8.1) условие (8.7), мы получим
новую задачу с более узким множеством допустимых решений, ко-
торое тем не менее будет содержать все допустимые решения исход-
ной целочисленной задачи (8.1). Соотношение (8.7) и представляет
собой отсечение, введенное Гомори. В остальном метод ничем не
отличается от предыдущего.
Покажем теперь, что для получения решения расширенной за-
дачи линейного программирования нет необходимости решать ее
заново. Действительно, вводя дополнительную базисную перемен-
ную
хлоп=-Д. + £д..Ху., (8.8)
jeR
136
мы не изменяем связей остальных базисных переменных и целевой
функции со свободными переменными. Другими словами, мы про-
сто расширяем симплекс-таблицу строкой, соответствующей выра-
жению (8.8). Однако нетрудно видеть, что базисное решение рас-
ширенной задачи не является допустимым (хдоп - -А,- < 0, при Xj ~ 0).
В то же время все коэффициенты < 0 . Поэтому для получения
решения расширенной задачи целесообразно использовать двой-
ственный симплекс-метод.
Проиллюстрируем работу метода Гомори на примере решения
задачи минимизации функции/= — х} —х2 при условиях
3xj + 2х2 < 5, х2 < 2, Xj > 0, х2 > 0, х,, ху. — целые числа.
В канонической форме задача состоит в определении min(—х, — x^
при условиях Зх, + 2х2 + х3 - 5, х2 + х4 = 2, ху > 0, ху. — целые числа,
У = М.
Решая задачу без учета целочисленности симплекс-методом, при-
ходим к следующей симплекс-таблице:
хг *3 х4
f -7/3 0 0 -1/3 -1/3
Xl 1/3 1 0 1/3 -2/3
Х2 2 0 1 0 1
Так как соответствующее базисное (оптимальное) решение не
является целочисленным (по компоненте), перейдем с помощью
выражения (8.8) к расширенной задаче. Ей будет соответствовать
симплекс-таблица
*1 *2 *3 х4 Х5
/ -7/3 0 0 -1/3 -1/3 0
1/3 1 0 1/3 -2/3 0
х2 2 0 1 0 1 0
*5 -1/3 0 0 -1/3 -1/3 1
137
Здесь учтено, что Д} = |, д13 = д14 = |. Перейдем к двойствен-
ной симплекс-таблице:
Х| х2 Х3 х4 Xj
Ли 7/3 -1/3 -2 0 0 1/3
Х3 1/3 -1/3 0 1 0 1/3
Х4 1/3 2/3 - 1 0 1 1/3
Введем в число базисных компоненту Х5. Получим новую таб-
лицу:
Xi ^2 3 X 4 ^5
л- 2 -1 -1 0 -1 0
х3 0 -1 - 1 1 ’ 1 0
х5 1 2 -3 0 3 1
Нетрудно видеть, что базисное решение, соответствующее дан-
ной двойственной симплекс-таблице, является оптимальным и це-
лочисленным. Для получения решения исходной целочисленной
задачи остается перейти к прямой симплекс-таблице. В результате
получим
*1 *2 х3 х* *5
f -2 0 0 0 0 -1
*1 1 1 0 1 0 -2
*2 1 0 1 1 0 3
1 0 0 1 1 3
Отсюда находим оптимальное (целочисленное) решение jq — 1, = 1,
х3 = 0, х4 = 1, х5 = 0, /= -2.
Упражнение 7. Показать, что найденное оптимальное решение в рас-
смотренной выше задаче не является единственным. Найти другое опти-
мальное решение.
138
Упражнение 2. Решить задачу целочисленного линейного программи-
рования по определению min(—3Xj — х2) при условиях 4х, + х2<5, х2 < 3,
где хр х2 — неотрицательны е целые числа.
Упражнение 3. Найти min(—Xj + Зх2 — Зх3) при условиях 2х, + Xj — х3 < 4,
4х( — Зх2< 2, —Зх, + 2х2 + х3< 3, хр х2, х3 — целые неотрицательные числа.
8.2. Метод ветвей и границ
Метод ветвей и границ относится к группе комбинаторных ме-
тодов дискретного (целочисленного) программирования, является
достаточно общим и позволяет решать как линейные, так и нели-
нейные задачи дискретного программирования, представляющие
собой обобщение целочисленных задач.
Сущность метода поясним сначала на задаче общего вида. Пусть
требуется найти минимум функции /(х) при условии хе X, где X—
конечное множество.
В основе метода ветвей и границ лежит разбиение по опреде-
ленному правилу множества X на подмножества Xt (ветвление) так,
чтобы X— UXj, и определение нижних оценок (границ) £ (X) целе-
вой функции /(х) на этих подмножествах, удовлетворяющих усло-
вию ^(Х^< f(x) для всех хе Хг Если при этом окажется, что для
некоторого вектора х*е Xv будут иметь место условия
f(x*) = ^(Xv)<^(Xi) для всех /, то в силу определения оценок х* —
оптимальное решение исходной задачи.
Алгоритм решения задачи сводится к следующему.
1. Определяется оценка ^(%°) = ^(Х). Если удается найти такое
х*е X, что /(х*) = ^(Jf0), то х* — оптимальное решение.
2. В противном случае множество А0 разбивается на конечное
число непересекающихся подмножеств X/, Х° = UX].
3. Вычисляются оценки ЦХ}). Если удается найти такое х* е X1,
что /(x*) = ^(ArJ)<^(Ar?) для всех /, то х* — оптимальное решение
задачи.
139
4. В противном случае наиболее перспективное множество Х]р ,
удовлетворяющее условию ^(Х^) = min£(X/), разбивается, в свою
очередь, на несколько подмножеств. Образовавшиеся при этом под-
множества вместе с неподвергавшимися разбиению подмножества-
ми обозначают через Xj, Х° = UXj ,
5. Далее процесс повторяется.
Основная трудность в реализации метода ветвей и границ со-
стоит в разработке конкретных правил ветвления и способов эффек-
тивного вычисления оценок.
Рассмотрим возможность применения метода ветвей и границ
для решения задачи целочисленного линейного программирования:
сгх-+ min, хеХ={х: Ax-b, х>0, х-целый}.
Рассмотрим сначала задачу без учета условия целочисленности:
стх-> min, хеХнц={х: Ах = Ь, х>0}.
Если полученное при этом оптимальное решение х° оказывает-
ся целочисленным, то оно является искомым решением. В против-
ном случае х° дает нижнюю оценку для искомого решения
£(Х°) = сгх°. Пусть в этом решении некоторая компонента х. оказа-
лась нецелочисленной. Разобьем множество Хна два подмножества:
X’ = {х: Ах = b, х>0, xz<[x9], х-целый};
X}={x:Ax = b, х>0, Xf^lxPj + l, х-целый}.
Здесь через [х9] обозначена наименьшая целая часть значения xz9.
Оценки ^(Х/), ^(Xj) можно снова найти в результате решения со-
ответствующих нецелочисленных задач линейного программирова-
ния:
140
^(Х{) = minстх, хе Х^ц =*{х: Ах =b, х>0, xz<[x?]};
£(Xj) = mincrx, хе Х2нц ={х: Ах = Ь, х>0, х.>[х?]+1}.
Если при этом окажется, что одно из полученных решений х
целочисленно и соответствует минимальной оценке из ^(Х^), ^(Xj) »
то х — искомое решение. В противном случае выбирается наибо-
лее перспективное подмножество из X/, Xj и производится даль-
нейшее его ветвление. Нетрудно заметить, что применение метода
ветвей и границ к задачам целочисленного линейного программи-
рования сводится к решению ряда нецелочисленных задач линей-
ного программирования на соответствующих подмножествах
«исходного» нецелочисленного множества Хнц .
Из описания алгоритма следует, что применение метода ветвей
и границ одинаково справед ливо как для полностью целочисленных,
так и для частично целочисленных задач.
Вводимые на каждой итерации новые ограничения вида х. < [х?]
или х. >[х?]+ 1 играют, по сути, роль отсечений. Как и в методах
отсечения, при вводе нового ограничения нет необходимости решать
задачу линейного программирования заново. Достаточно ее расши-
рить в соответствии с вводимым ограничением.
Работу метода ветвей и границ проиллюстрируем на следующем
примере:
пппЦ -Xj) при условиях 3xj +2х2 <5, х2 <2,
х, >0, >0, хр х2 - целые числа.
Оценка £(Х°) = £>(Х), как указывалось, определяется решением
исходной задачи без учета условий целочисленности и равна
£(Х°) = -7/3. Соответствующее решение Xj° = 1 / 3, xj = 2 не являет-
ся целочисленным. Поэтому на первой итерации разобьем множе-
ство А^ц = Хнц = {х: 3xj + 2хз < 5, х2 < 2, Xj > 0, х2 > 0} на два подмно-
жества:
141
Л?нц = {*;3.X] + 2x2 <5, X2 <2, x1 = 0, X2 >0};
^hu = + 2x2 - 5, x2 <2, Xj > 1, X| >0,x2 >0}.
Найдем оценки £(2^), ^(%2). В данном случае ) = min (-х2)
при условиях 2х2<5,хг<2,х2>0. Отсюда заключаем, что
£(Л7)=-2, при этом (xj)J =0, (x2)J =2 . Для определения оценки
^(%2) необходимо решить следующую задачу линейного програм-
мирования:
^(%2) = min(-x1-х^) при условии (хрХ2)е У2нц.
Ее решение может быть получено так же, как и в случае приме-
нения методов отсечения, т.е. переходом к расширенной задаче ли-
нейного программирования и применением двойственного симп-
лекс-метода. В результате получим £(А^) = -2, при этом
Ввиду того, что обе оценки оказались равными, и следователь-
но, и минимальными, а соответствующие решения — целочислен-
ными, оба эти решения являются решениями исходной целочислен-
ной задачи линейного программирования.
Упражнение. Найти min(—X] — х2) при условиях 2xt.+ 11х2<38; Xj +
х2 < 7, 4х, - 5х2<5; хр х2 — неотрицательные целые числа.
8,3, Динамическое программирование
Динамическое программирование — это достаточно общий вы-
числительный метод решения задач математического программиро-
вания, предложенный Р. Веллманом. Метод основан на использо-
вании приема поэтапной оптимизации, который состоит в сведении
задачи минимизации функции многих переменных к последователь-
142
ному (поэтапному) решению задач минимизации функции лишь
одной переменной согласно схеме
min /(х.,х2,...,х) = min{min...[min/(x, ,х2,...,х )]}. (8.9)
ХрХ2-Хп *1 *2
Реализация метода в общем случае связана с огромными вычис-
лительными трудностями, состоящими в необходимости запомина-
ния на каждом этапе функции многих переменных. Именно это
обстоятельство затрудняет применение метода в явном виде для за-
дач с размерностью выше трех. Однако при определенной структуре
целевой функции и ограничений эти трудности устраняются, и мы
получаем эффективный метод решения целочисленных задач матема-
тического программирования. Сказанное относится, в частности, к
П
задачам с аддитивными целевыми функциями, когда f(x) = ^fj(Xj),
y=i
и линейными ограничениями
Поясним сущность метода динамического программирования на
примере следующей целочисленной задачи математического про-
граммирования: требуется найти минимум аддитивной целевой фун-
кции
п
у=|
п
при условии а все компоненты ху. — неотрицательные
7=1
целые числа. Будем считать, что все о,, j = 1,л, и b — также целые
числа.
В соответствии с приемом поэтапной оптимизации имеем
min = тш[/Ц) + КД2)],
Al *i
0<X)
143
где введены обозначения
Л л
ЯД2) = тт£/}(ху); l>yxy<S2;
2=2 2=2
i>2 = b-alxl;
[b/ax] — целая часть отношения b/av
Аналогично получаем, что
^(^2^ ~ ^3^3^’ ^3 ~ ^2 — ^2^2’
х2
0<х2<[^2/д2],
где ftj(^) = min^/,(xy) при условии <^3.
2=3 2=3
По индукции можно записать следующее соотношение:
Я* ) = mint/* (хк) + Rk+i (^+1)], (8.10)
хк
где 0<.xki[t,k/ak], ^k+i=^k-afik.
Соотношение (8.10) принято называть основным рекуррентным
соотношением метода динамического программирования. Функцию
, равную по ее определению, выражению
«№) = min£/y(xy) при условии YajXj <^к. (8 И)
j=k j=k
обычно называют функцией Беллмана. При Л = 1 и = b она совпа-
дает с минимальным значением исходной целевой функции и по-
этому дает решение задачи. При к = п имеем граничное условие
144
A„(^) = min/,(x„),
0<хл<[^/а„].
(8.12)
Основное рекуррентное соотношение (8.11) совместно с гранич-
ным условием (8.12) и является алгоритмической основой метода
динамического программирования для решения задачи. Для полу-
чения решения необходимо:
— в соответствии с основным рекуррентным соотношением ме-
тода определить последовательно, начиная к - п и до к - 1, значе-
ния зависимости для всех допустимых ^к = 0,1,...,/) и соот-
ветствующие значения хк(£к), обеспечивающие минимум в правой
части;
— последовательно, начиная с к = 1 и до к = л, найти оптималь-
ные значения и соответствующие значения хк.
Так как на каждом этапе оптимизации необходимо запоминать
только функции ЛА(^) и ^е+](^+1), каждая из которых зависит
лишь от одной переменной, реализация метода с помощью компь-
ютеров не вызывает затруднений. Таким образом, метод динамичес-
кого программирования представляет собой направленный после-
довательный перебор вариантов, обязательно приводящий к глобаль-
ному минимуму. Нетрудно заметить, что условие целочисленности
не является обязательным для применения метода.
При применении метода динамического программирования за-
дача фактически интерпретируется как некоторый л-шаговый мар-
ковский процесс принятия решения, текущее состояние которого
характеризуется параметром £>к.
Марковское свойство процесса заключается в том, что управле-
ние этим процессом не зависит от предыстории процесса, а опреде-
ляется только текущим состоянием %к и «управлением» хк. Отме-
ченное обстоятельство имеет большое значение, так как именно воз-
можность интерпретации задачи как л-шаговой марковской и явля-
145
ется необходимым условием возможности применения метода ди-
намического программирования.
Сказанное можно проиллюстрировать на примере задачи о раз-
биении некоторого отрезка величиной b на п частей таким образом,
чтобы произведение их величин было максимальным.
Обозначая через ху величину у-й части, математически задачу
можно представить так:
найти maxjjxy при условиях ^х.= Ь, >0, у = 1,л. (8.13)
Условия целочисленности в данном случае для простоты учи-
тывать не будем. Несмотря на то, что целевая функция теперь не
является аддитивной, задача по-прежнему может быть интерпрети-
рована как некоторый многошаговый марковский процесс. Действи-
тельно, применяя прием поэтапной оптимизации, приходим к сле-
дующему рекуррентному соотношению:
At _ max {хл At+i CU+i )}•
Здесь “ функция будущих потерь. По определению,
ЯД^) = тахП*/
п
Xх/
J=k
(8.14)
(8.15)
где ~ параметр, характеризующий текущее состояние марковс-
кого процесса и удовлетворяющий соотношению
^t+1 “ хк’
(8.16)
Пусть требуется разбить отрезок на две части так, чтобы произ-
ведение их величин было максимальным. В данном случае п = 2.
146
Согласно (8.15) имеем R2 fo)= *2 = ^2 • Соотношение (8.14) при
к = п - 1 = 1 принимает вид
Л1(^1) = ^/1(^-х1) = ^1> х1 = у- (8.17)
Так как Т^(^) = b согласно (8.15) дает искомое решение задачи,
т.е. ^|=6, получаем х,* = Xj (^) = Z>/2 и, соответственно, х\-Ь/2.
Упражнение 1. Доказать справедливость соотношения
min /(х,у) = min{min/(x,yв.
хеХ.^У k 7 xeXljgy V 7J
Упражнение 2 Используя метод динамического программирования,
Л
показать, что алгоритм решения задачи min£/}(xy) при условиях
7=1
^ayXj < b, , i - T~mt Xj > 0, Xj — целые числа, j = \,n сводится к следую-
7=1
щему рекуррентному соотношению:
Ш’ & = + &>. > <&>)}’
8*=nunKi/fl,t].
Упражнение 3. Решить задачу о разбиении отрезка величиной b = 4 на
три части так, чтобы произведение их величин было максимальным.
9. МЕТОДЫ ОПТИМИЗАЦИИ ПРИ ДЕЙСТВИИ
НЕОПРЕДЕЛЕННЫХ И СЛУЧАЙНЫХ ФАКТОРОВ
9.1. Основные типы неопределенностей
До сих пор при обсуждении различных задач оптимизации мы
предполагали, что целевая функция /(х), подлежащая (для опреде-
ленности) минимизации, и допустимое множество Xискомых пара-
147
метров х однозначно определены. В общем виде задача поиска оп-
тимального решения х* имела вид
x”=argmin/(x). (9.1)
Однако в действительности, как правило, наряду с вектором
интересующих нас параметров приходится учитывать целый ряд до-
полнительных неопределенных или возмущающих факторов. В дан-
ном разделе обсуждаются некоторые специальные методы оптими-
зации, связанные с учетом различного рода неопределенностей,
присущих сложным системам.
В первую очередь речь идет о неопределенности целей, характе-
ризуемой наличием не одного, а сразу многих критериев. Это так
называемая проблема многокритериальной оптимизации. Формально
постановка задачи (9.1) в этом случае может быть сохранена. Одна-
ко теперь под /(х) следует понимать вектор-функции с компонен-
тами fx (х), /2 (х)fm (х), где т — общее количество критериев.
Основные подходы к решению такого рода задач рассматриваются в
разд. 9.2.
Второй тип неопределенности (называемый также природной
неопределенностью) связан с неопределенностью самой целевой фун-
кцией. Имеется в виду случай выбора оптимального решения в ус-
ловиях, когда целевая функция, помимо искомого вектора х, содер-
жит также некоторые неопределенные параметры, характеризуемые
вектором £ , т.е. /(х) = /(х,£). Решая задачу минимизации функ-
ции f (х,£) по х, мы можем найти решение лишь в виде зависимо-
сти х(£). Если при этом о векторе нет никакой информации, то
результат оптимизации, естественно, будет неопределенным. Но, как
правило, информация о векторе £, обычно имеется. Правда, она мо-
жет носить различный характер.
Часто эта информация задается в виде некоторого множества
неопределенных факторов Q или в частном случае — диапазонов
их изменений. При этом считается, что IjeQ . В общем случае ин-
148
формация о векторе также не позволяет получить однозначное ре-
шение задачи оптимизации, так как зависимость х(^) определяет
лишь некоторое отображение множества неопределенных факторов
£2 на множество искомых параметров X. В результате можно полу-
чить так называемое множество неопределенности результата Х^ е X.
Построение множества неопределенности результата Х^, как пра-
вило, связано с большим объемом вычислений. Поэтому на практи-
ке часто используется подход, предполагающий вместо построения
всего множества Х^ отыскание лишь односторонней (гарантирован-
ной) оценки и получение соответствующего гарантирующего резуль-
тата:
**=argminmax/(x, 4). (9,2)
Другими словами, в качестве оптимального решения задачи в
данном случае принимается такое решение х*, которое обращает в
минимум наихудшее (наибольшее) по всем допустимым неопреде-
ленным факторам значение целевой функции (минимаксноерешение).
Решение (9.2) является гарантирующим в том смысле, что, ка-
ковы бы ни были значения неопределенных параметров £, , выбор
х = х* согласно (9.1) гарантирует, что при любом значение целе-
вой функции будет не больше, чем величина
(9-3)
называемая поэтому гарантированной оценкой. Действительно, для
любого хе X справедливо неравенство
тах/(х, ^)>/(х, у.
Поэтому при х = х* получаем
max/(%',!;) = min max/(х,
хел qe£2
149
Основной недостаток данного подхода заключается в том, что
гарантированная оценка, как правило, оказывается достаточно пес-
симистической. В определенном смысле она является перестрахо-
вочной, так как соответствует решению при самом неблагоприят-
ном в смысле значений целевой функции сочетании неопределен-
ных факторов £.
Гарантированную оценку можно улучшить, если использовать
дополнительную информацию о неопределенных факторах. В част-
ности, если оказывается возможным к моменту реализации опти-
мального решения измерить (узнать) вектор £, , то само оптималь-
ное управление следует искать в виде зависимости х(£) из условия
x(^) = argmin/(x, £). (9.4)
Новая гарантированная оценка целевой функции при этом бу-
дет иметь следующий вид:
7’=«*“/(*> $)• <9-5>
Так как в общем случае имеет место неравенство
max min f (х, Е)< min max f (х, Е),
т.е. /* < f* (а речь идет о минимизации целевой функции по х), то
оценку /* следует признать более совершенной. Правда, не следует
забывать, что получение такой оценки обусловлено знанием неопре-
деленных факторов в момент принятия решения.
С математической точки зрения, как видно, получение гаран-
тированной оценки сводится к решению минимаксной (или макси-
минной) задачи оптимизации. Некоторые численные методы тако-
го рода задач рассматриваются в разд. 9.3.
Гарантированная оценка/* может быть также улучшена, если о
неопределенных факторах известна какая-либо статическая (пусть
даже неполная) информация. Обсудим подробнее данный вопрос.
150
Сначала предположим, что £полностью случайный вектор с
заданными статистическими характеристиками (законом распреде-
ления или функцией распределения). В этом случае исходная целе-
вая функция /(%Л) будет случайной величиной и вопрос о получе-
нии гарантированной оценки можно ставить и решать лишь в веро-
ятностном смысле. В частности, можно потребовать, чтобы вероят-
ность непревышения целевой функцией /(х,^) своего некоторого
заданного уровня fQ была не менее заданной величины а:
/>{/(хД)</0}>а • (9.6)
Очевидно, что для каждого фиксированного вектора хе X мож-
но найти свой наименьший уровень fa (х), называемый квантилем,
при котором вероятность еще будет выполнена:
/а(х)=тт{/о:Р[/(лЛ)2/о]га}. (9.7)
Поэтому задача оптимизации, связанная с выбором гарантиру-
ющего решения, может быть сформулирована теперь как задача
поиска такого вектора х*, который обращает в минимум квантиль
x*=argmin/a(x). (9.8)
По сути задача сводится к поиску вектора х*, который обращает
в минимум нижний уровень целевой функции /(х,£) при условии,
что непревышение этого уровня гарантируется с вероятностью не
менее чем a. Сама гарантированная (теперь по вероятности) оцен-
ка целевой функции будет
= (9-9)
Сформулированная задача относится к классу так называемых
стохастических задач оптимизации с вероятностными ограничениями.
151
Мы обсудили случай, когда £ является полностью случайным
вектором с заданными статистическими характеристиками. Однако,
как правило, либо сами статистические характеристики являются
неопределенными, либо наряду с полностью случайными парамет-
рами присутствуют также и неопределенные параметры, для кото-
рых известно лишь множество неопределенности (или диапазон из-
менения). В обоих случаях возникающая дополнительная неопреде-
ленность может быть охарактеризована дополнительным вектором
неопределенных параметров 5'g Формируя в этом случае зада-
чу оптимизации с целью отыскания гарантирующего решения, мы
приходим к минимаксно-стохастической постановке:
х* =argminmax/a(x, §'). (9.Ю)
хел деП
Здесь через /а (х, V) по-прежнему обозначен квантиль целевой фун-
кции, который теперь зависит также от дополнительных неопреде-
ленных факторов .
Таким образом, задача (9.10) как бы обобщает задачи (9.2) и (9.8).
Решение задачи (9.10) реализует принцип наилучшего гарантирован-
ного результата, с одной стороны, по вероятности, сопутствующей
всем случайным факторам, а с другой — по всем неопределенным
факторам. Получаемая при этом гарантированная оценка целевой
функции
/,=™да4(х> ?)• <911>
Некоторые методы решения поставленных задач обсуждаются в
разд. 9.4.
Так как методы решения стохастических задач оптимизации в
вероятностной постановке достаточно сложны в реализации, часто
на практике используются более простые статистические характе-
ристики целевой функции. Простейшей такой характеристикой яв-
ляется математическое ожидание
7(х)=м[/(х, $)].
152
Здесь символ Л/ обозначает операцию статистического осредне-
ния по совокупности всех случайных факторов . Постановка зада-
чи оптимизации в этом случае принимает вид
х* =argminM[/(x, У]. (9.12)
При этом следует иметь в виду, что использование математи-
ческого ожидания в качестве новой целевой (вторичной) функции
обеспечит оптимальность искомому решению лишь в среднем, по
совокупности всех реализаций. В отдельных же реализациях это
решение может оказаться просто неприемлемым. Учитывая это и
стремясь контролировать не только среднее значение исходной це-
левой функции, но и возможные ее отклонения от этого значения,
часто рассматривают ее дополнительные статистические характери-
стики, например дисперсию:
7ДЯ1(х)=м[/(х) «-7«f,
вводя последние либо в число дополнительных ограничений, либо
в число дополнительных целевых функций.
Из сказанного следует, что при наличии случайных факторов в
исходной задаче можно предложить различные постановки задач
оптимизации в терминах новых вторичных целевых функций. Та-
ким образом, постановка окончательной стохастической задачи оп-
тимизации является неформальным актом.
Нетрудно заметить, что использование отдельных статистичес-
ких характеристик в окончательной постановке задачи оптимизации
не может гарантировать (в вероятностном смысле) приемлемого
результата во всех реализациях. Это становится возможным, если в
самой постановке стохастической задачи потребовать выполнения
исходных ограничений, в том числе и непревышение целевой фун-
кцией своего наименьшего значения, по вероятности.
Тем не менее, использование отдельных статистических харак-
теристик в качестве вспомогательных (вторичных) целевых функ-
ций находит широкое применение при получении приближенных
решений. Поэтому в разд. 9.4 обсуждаются и эти методы.
153
9.2. Методы многокритериальной оптимизации
Все чаще возникают задачи оптимизации, в которых присутству-
ет не один критерий оптимальности, а несколько. Типичным, хотя
и упрощенным, примером может служить задача составления плана
выпуска продукции некоторым предприятием с целью достижения
максимальной прибыли от реализации продукции при минимиза-
ции расходуемых средств (достижение максимума производства с
минимумом затрат). Другим примером может служить задача выбо-
ра проектных параметров сложной технической системы при усло-
вии, чтобы эта система была самой надежной, самой дешевой, са-
мой эффективной.
В общем случае задача многокритериальной оптимизации фор-
мулируется как задача одновременной минимизации некоторой со-
вокупности критериев j\ (х), /2 (х),..., fm (х). Следует сразу заме-
тить, что строго математически задача в такой постановке смысла
не имеет, так как минимумы отдельных критериев оптимальности в
общем случае достигаются при разных значениях вектора .
Вместе с тем математические методы принятия решений совме-
стно с методами оптимизации помогают принять правильное (ра-
зумное) решение и в этом случае, т.е. принять решение в условиях
неопределенности целей.
Существующие способы преодоления неопределенностей целей
можно разбить условно на две группы. Первая группа предполагает
введение дополнительных гипотез, позволяющих свести задачу мно-
гокритериальной оптимизации к задаче однокритериальной опти-
мизации. Этот прием иногда называют скаляризацией или сверты-
ванием критериев. Вторая группа способов предполагает сокраще-
ние множества исходных вариантов решений путем неформального
анализа этих вариантов.
9.2.1. Свертывание критериев
Ограничимся обсуждением лишь наиболее употребительных
способов свертывания критериев [5].
1. Простейший способ сведения многокритериальной задачи оп-
тимизации к задаче однокритериальной оптимизации состоит в
154
выделении одного основного критерия, например fx (х), и перево-
де остальных (вспомогательных) критериев в разряд ограничений.
Задача принимает следующий привычный вид:
х* = arg min f} (х)
при условиях
Данный способ является наиболее распространенным в инже-
нерной практике. Для его использования достаточно лишь разумно
назначить допустимые границы f* для вспомогательных критери-
ев.
2. Линейная свертка состоит в переходе от т критериев f. (х),
/ = 1,/я, к одному критерию /(х) вида
/=1
где а, — некоторые весовые коэффициенты, характеризующие зна-
чимость соответствующего критерия и устанавливающие определен-
ный компромисс между ними за счет ранжирования целей по их важ-
ности. Обычно весовые коэффициенты выбираются положительными
и нормированными тем или иным способом, например,
£<х,. = 1, а, > 0.
/=1
Следует подчеркнуть, что назначение коэффициентов а,- и яв-
ляется той дополнительной гипотезой, которая сводит исходную за-
дачу с многими критериями к задаче с одним критерием. Сам про-
цесс назначения а. является неформальным актом. Он требует про-
ведения тщательного анализа самой задачи. Коэффициенты az ча-
сто назначаются путем последовательных приближений после пред-
варительного решения задачи при различных значениях а,-.
155
Строго говоря, оба рассмотренных способа редукции к однокри-
териальной задаче взаимно связаны, так как взаимно связаны на-
значения допустимых границ для критериев f* в первом способе и
выбор коэффициентов а, — во втором способе. Практически же та-
кое соответствие установить не всегда удается. Поэтому к назначе-
нию а, часто приходится прибегать с помощью экспертов.
3. Минимаксная свертка. Часто в задачах с многими критерия-
ми удается сформировать некоторую систему контрольных показа-
телей f*t i = являющихся по сути оценками сверху для состав-
ляющих критериев оптимальности
i = £m.
Если теперь в качестве меры близости к своим контрольным
показателям f* использовать функцию максимума
/(х) = тах
/=1,т
то задачу скалярной оптимизации можно представить в виде
Г/М
х = arg min max - .
X i=\,m f.
Таким образом, неопределенность целей исходной задачи в ре-
дуцированной (минимаксной) задаче раскрывается путем отыскания
гарантирующего решения в смысле близости к контрольным значе-
ниям исходных критериев оптимальности.
Следует подчеркнуть, что принцип «минимакса» является дос-
таточно распространенным при учете (преодолении) неопределен-
ности разной природы.
4. Квадратичная свертка. С целью получения более простых
способов решения редуцированной задачи часто вместо минимакс-
ной свертки используют квадратичную свертку. В простейшем слу-
чае она имеет следующий вид:
156
5. Использование «абсолютного минимума». Одним из способов
формирования контрольных значений для исходных критериев оп-
тимальности f* может служить получение решений следующих од-
нокритериальных задач:
xi = arg min (х), i = 1, т.
В этом случае совокупность величин f* = min /J (х) = f. (xi) в
пространстве исходных критериев определяет некоторую точку, ко-
торую можно назвать точкой абсолютного минимума. Эта точка до-
стижима лишь когда все решения х{ совпадают. В остальных же слу-
чаях можно говорить только о близости к этой точке. Если теперь
ввести в рассмотрение некоторую скалярную функцию, характери-
зующую степень этой близости, то ее можно использовать в каче-
стве нового скалярного критерия оптимальности. В простейшем
случае такой функцией может быть квадратичная форма вида
Л/=1
где Ху — элементы некоторой положительно-определенной матрицы.
9.2.2. Использование принципа Парето
Как указывалось, наряду со свертыванием многих критериев
оптимальности к одному возможны и иные пути решения проблемы
многокритериальности. Ограничимся обсуждением одного из них,
связанного с использованием так называемого принципа Парето.
Сущность данного подхода состоит в исключении из неформаль-
ного анализа таких вариантов решения, которые заведомо являются
плохими.
157
Предположим, что х' и х" — два возможных (допустимых) ва-
рианта решения задачи, такие, что справедливы неравенства
причем хотя бы одно из них выполняется строго. В этом случае
очевидно, что решение х' предпочтительнее решения х". Значит,
все векторы х", удовлетворяющие этому условию, могут быть сразу
исключены из рассмотрения. Поэтому неформальному анализу дол-
жны быть подвергнуты лишь векторы, для которых не существует
предпочтительных векторов. Такие векторы называют неулучшаемы-
ми.
Множество всех неулучшаемых векторов принято называть мно-
жеством Парето. Следовательно, множество Парето Р состоит из
таких векторов х", для которых из условий / (х) < /• (х*) для любо-
го i следует условие / (х) = /;.(х*). Обратимся к простейшему при-
меру, когда имеются всего две целевые однозначные функции
/1 (х), /2 (х). В этом случае каждому значению х будет соответство-
вать одна точка на плоскости (/р /2). Равенства
fi ~ fi (х) определяют параметрически некоторую кривую на этой
плоскости (рис. 9.1). Пусть такой кривой будет кривая
q, Z>, с, d, е, g,h . Однако множеству Парето соответствует не вся
кривая, а лишь ее часть. Действительно, участок cd не может соот-
ветствовать множеству Парето, так как для каждой точки этого уча-
стка А найдется точка А' участка Ьс, в которой значение целевой
функции/] будет меньше, чем в точке А.
Аналогично должны быть исключены из рассмотрения участки
de и gh. К множеству Парето в данном случае относятся лишь уча-
стки ас и eg, причем точка е также должна быть устранена.
Таким образом, принцип Парето заключается в том, что в каче-
стве оптимального решения х* должно быть выбрано только такое,
158
fl
Рис. 9.1. К определению множества Парето
которое принадлежит множеству Парето, х* е Р. Как видим, прин-
цип Парето не выделяет единственное решение, он лишь сужает мно-
жество возможных альтернатив. Часто такое сужение оказывается
весьма существенным. Окончательный выбор остается за лицом, при-
нимающим решение. Если же, помимо критериев (х), i = l,m, в
нашем распоряжении будет некоторый формализованный скалярный
критерий для принятия решения / (х), то задача выбора оконча-
тельного решения может быть осуществлена из условия
x*=ar8m«?/npW>
где через Р обозначено множество Парето для функций / (х),
/ = 1,т, на допустимом множестве векторов хе X .
Коротко остановимся на вопросе построения множеств Парето.
Ограничимся для простоты случаем двух критериев оптимальности
f\ (*)> Л (х) > которые должны быть минимизированы с учетом ог-
раничений хе X.
Каждой точке хе X можно поставить в соответствие некото-
рую точку f с компонентами f} (х), /2 (х) на плоскости критериев
159
(рис. 9.2). Таким образом, множество Xотображается в некоторое
множество F, которое обычно называют множеством достижимос-
ти. Множествам Парето на плоскости критериев Р^ будет соответ-
ствовать лишь часть множества достижимости F. Нетрудно видеть,
что в данном случае (см. рис. 9.2) это будет дуга а, Ь.
Рис. 9.2. Множество достижимости
Обратим внимание на следующую особенность. Любая коорди-
ната точки, принадлежащей множеству /у, f е Pj, представляет
собой не что иное, как минимальное значение одного из критериев
оптимальности при фиксированном значении другого. Поэтому при-
ближенно построить множество Pf можно путем последовательно-
го решения ряда задач оптимизации на условный экстремум. Одна
из возможных схем расчета сводится к следующему:
а) зафиксируем значение критериев = q , /2 = с2 так, чтобы
/Р f2^F;
б) решим две задачи оптимизации
= min F(x) и /?= min f(x);
2 xeX,/](xH 2V ’ 71 X€X,/2(x)=c/ k h
в) найдем две точки множества Р1, Р2 (рис. 9.3) с координата-
ми
p'(/i=ci> Л=Л) и =Лг, f2=<\);
160
Рис. 9.3. Аппроксимация множества Парето
г) проведя через р1, р1 прямую, получим простейшую аппрок-
симацию множества Парето.
Для дальнейшего уточнения аппроксимации могут быть найде-
ны еще две точки р3, р4 путем решения дополнительных двух задач
оптимизации:
Х€Л , /| (X)—C-j j
и р4 : /. = min /,(х) .
1 леХ,/2(л)=<<П J
Через точки р1, р1, р*> р4 теперь можно провести ломаную,
которая будет следующим кусочно-линейным приближением мно-
жества Pf. Процесс уточнения можно продолжить.
Возможны и другие способы приближенного построения мно-
жества Парето.
9.2.3. Метод ПРИНН
Одной из важных задач системного анализа и проектирования
сложных организационно-технических комплексов является обеспе-
чение принятия наиболее рациональных решений с учетом обшир-
ной разнокачественной информации, а также множественности за-
дач и возможных условий функционирования объекта анализа и
161
проектирования. Особенно это характерно для авиационно-косми-
ческой отрасли, где принимаемые решения связаны с расходовани-
ем огромных материальных и финансовых ресурсов и в течение де-
сятилетий оказывают воздействие не только на экономику, но и на
социально-политическую жизнь общества. С методологической точ-
ки зрения, специфика этих задач принятия решений заключается в
их принципиальной математической незамкнутости. Она определя-
ется тем, что цели принятия решения и, соответственно, критерии
его рациональности могут носить многообразный, зачастую проти-
воречивый и даже расплывчатый характер. Таким образом, возни-
кает задача многокритериальной оптимизации. Кроме того, необ-
ходимо учитывать наличие существенных неопределенностей в про-
гнозировании технико-экономической и социально-политической
ситуации, а также неточностей в используемых математических мо-
делях.
Описанная ситуация привела к появлению и интенсивному
развитию отдельного раздела науки, который называется теорией
принятия решений и является частью системного анализа как науч-
ного направления, а с другой стороны, тесно связан с методами
оптимизации, оптимального управления и математического моде-
лирования.
Одним из главных прикладных результатов теории принятия
решений следует признать тот факт, что выбор конкретного реше-
ния в качестве наиболее рационального невозможен без включения
субъективного фактора, отражающего свободу воли лица, принима-
ющего решение (ЛПР). Этот субъективизм может проявиться по-
разному. В предельном случае ЛПР может выбрать окончательное
решение из числа Парето-оптимальных альтернатив случайным обра-
зом. В полярном предельном случае он может заказать дорогостоя-
щее исследование, пригласить высококвалифицированных экспер-
тов и положиться на их согласованное мнение. Но и в этом случае
ЛПР должен сознавать, что выбор рекомендованного ему решения
(если экспертам удастся прийти к согласованному мнению) тоже
субъективен. В данном случае субъективизм ЛПР проявился в при-
глашении именно этих экспертов и финансировании именно тако-
го объема исследований.
162
Эта особенность принятия сложных решений ставит вопрос о
качествах, которыми должен обладать математический метод, под-
держивающий процедуру принятия решения ЛПР. Во-первых, та-
кой метод должен быть корректным, т.е. изначально отсеивать Па-
рето-неоптимальные альтернативы. Во-вторых, он должен быть ре-
алистичным, т.е. не требовать от Л ПР исходной информации, кото-
рая не может быть получена с достаточной достоверностью. С этих
позиций не являются реалистичными методы, предполагающие за-
дание ЛПР числовых значений весовых коэффициентов, якобы от-
ражающих его предпочтения, поскольку человек не мыслит количе-
ственными оценками своих предпочтений, а в лучшем случае оце-
нивает ситуации в терминах «лучше-хуже», «намного лучше — на-
много хуже». Заметим, что замена непосредственного задания чис-
ловых значений весовых коэффициентов процедурой их расчета
осреднением результатов экспертного опроса лишь маскирует недо-
стоверность оценок. В-третьих, метод должен быть логически при-
емлемым для ЛПР, т.е. допускать интерпретации, которые может оце-
нить и сознательно с ними согласиться разумный и квалифициро-
ванный в некоторой области деятельности человек, не являющийся
в то же время специалистом в математических методах и системном
анализе.
Одним из таких перспективных методов принятия решений в
условиях неопределенности является метод ПРИНН, предложенный
С.А. Пиявским [36].
Прежде всего отметим, что существуют различные типы неопре-
деленностей. Одним из основных ее видов является неопределен-
ность критериев. Она проявляется в том, что эффективность вари-
анта решения не может быть достаточно полно охарактеризована
одним числом, а требует задания целого набора чисел. Каждое из
них измеряет какой-то один аспект эффективности, и лишь в сово-
купности они всесторонне оценивают вариант. Так, вместо един-
ственного критерия оптимальности возникает вектор критериев оп-
тимальности. Следующим видом является неопределенность исход-
ных данных. Она проявляется в том, что на значение вектора кри-
териев влияют, помимо выбираемого варианта и в точности извес-
тных исходных данных, еще и такие исходные данные, точные зна-
чения которых в момент выбора варианта неизвестны. Для этих нео-
163
пределенных исходных данных может быть указан лишь диапазон
значений — некоторое множество, которому принадлежит вектор
этих данных.
Отметим, что математически любая из этих неопределеннос-
тей может быть представлена в виде другой. Так, если воспользо-
ваться теоремой о линейной свертке, представляющей комплексный
критерий как средневзвешенную сумму частных критериев, то не-
известные значения весовых коэффициентов этих критериев можно
рассматривать как неопределенные исходные данные. С другой сто-
роны, если неопределенные исходные данные принимают конечное
число значений, можно считать значения критериев для каждой
реализации исходных данных за новые критерии. В этом случае мы
получаем задачу, в которой нет неопределенности исходных данных,
но число частных критериев соответственно возросло.
Третьим видом неопределенности является неопределенность
модели, состоящая в том, что само правило вычисления значений
критериев оптимальности является неточным. С помощью введения
поправочных коэффициентов, значения которых лежат в пределах,
определяемых точностью модели, ее можно также свести к неопре-
деленности исходных данных.
Основная идея подавляющего большинства методов, использу-
емых в задачах принятия решений, состоит в задании способа учета
неопределенности.
Если задан способ учета неопределенности, то задача принятия
решения становится обычной задачей оптимизации. Однако на ста-
дии постановки задачи принятия решения способ учета неопреде-
ленностей неизвестен. Можно лишь представлять, что имеется не-
которое множество допустимых способов учета неопределенности,
из которых Л ПР должен выбрать способ, адекватный решаемой за-
даче. С принципиальной точки зрения неважно, как описано это
множество: перечислением его элементов (например, стандартных
способов учета неопределенности), перечнем их свойств или про-
сто интуитивными представлениями ЛПР. Важно, что выбор реше-
ния сводится к поиску ЛПР способа учета неопределенности.
Способ учета неопределенности позволяет концентрированно
выразить в нем человеческий фактор принятия решений, возложив
остальную работу на компьютер.
164
Идею метода ПРИНН поясним на примере использования ли-
нейной свертки частных критериев. Напомним, что в традицион-
ных методах коэффициенты линейной свертки задаются тем или
иным способом, отражая относительный вклад отдельных частных
критериев в общую эффективность решения, например, по мнению
ЛПР, и во всех случаях непосредственное применение этих методов
ставит перед ЛПР проблему обоснованного определения весовых
коэффициентов, что по сложности эквивалентно непосредственно-
му выбору решения на основе анализа множества Парето.
В отличие от известных методов, в методе ПРИНН весовые ко-
эффициенты считаются неопределенными. Сущность метода сводит-
ся к формированию множества допустимых способов учета неопре-
деленности, выделению в нем наиболее представительного набора
способов учета неопределенности и построению на его основе ите-
ративной процедуры формирования комплексной оценки решений
в условиях неопределенности.
Такой подход, в силу его универсальности, не возлагает на ЛПР
никакой дополнительной нагрузки в процессе принятия решений,
предоставляя в то же время ему возможность отражать свои пред-
почтения, относя частные критерии к различным группам значимо-
сти.
Под способом учета неопределенности понимается алгоритм,
однозначно сопоставляющий любому подмножеству ХА множества
неопределенных факторов Xнекоторое число F(y,XA), характери-
зующее комплексную оценку варианта решения у на множестве ХА.
В случае конечномерного Евклидова пространства для получе-
ния комплексной оценки эффективности некоторого решения у в
работе [36] предложен следующий способ учета неопределенности:
F(X,y) = -±- J G(f(x,y))dx, (9.13)
хеХ
где Sx — мера области Xнеопределенных факторов х; <7(0 — неко-
торая порождающая функция, которая и формирует конкретный спо-
соб учета неопределенных факторов х;/(х,у) — принятая свертка ча-
стных критериев. В выражении (9.13) у выступает в качестве пара-
метра.
165
Поясним использование соотношения (9.13) на некоторых при-
мерах, имеющих важное практическое значение.
1. Пусть порождающая функция имеет простейший вид
(9.14)
В этом случае
JU,y) = 4- J f(x,y)dx. (9.15)
^Х хеХ
Получим комплексную оценку решений, оцениваемых двумя
частными критериямиДля простоты используем линей-
ную свертку этих критериев с неопределенными весовыми коэффи-
циентами Хр х2
/(х1, X2, y) = xif{(y)+x2f2(y)i (9.16)
удовлетворяющими известным условиям нормировки
х1 +х2 = 1, х1 >0, х2 >0. (9.17)
Тем самым мы сформировали оценку эффективности решения
у на множестве неопределенностей X, показанном на рис. 9.4. Ис-
пользуя (9.15), получим простую формулу комплексной оценки
Рис. 9.4. Множество неопределенностей при использовании двух равно-
значных критериев
166
/r(X,y)=})(x,/(j') + (l-xl)/2(j))rfx1 =ЩУ1^У1. (9 lg)
*0 2
2. Рассмотрим теперь другой случай двухкритериальной оценки
эффективности решения у, при котором критерий fx является более
значимым, чем /2. Необходимость такой размытой оценки, когда
невозможно точно указать, «насколько более», как раз и составляет
особенность оценки исходных данных при использования качествен-
ных шкал, например, при использовании экспертных оценок. С
позиций использования в задаче ПР понятия внешнего множества,
это просто добавляет неопределенность в задачу в виде условия,
накладываемого на значения весовых коэффициентов: х1 > х2.
Множество неопределенностей X тогда будет иметь вид, пока-
занный на рис. 9.5, а соотношение (9.15) принимает вид
ЛАГ,л>) = у|(х1/'(у)+(1-х')/2(у))«6с' (9.19)
25
Таким образом, показано, что при использовании данного спо-
соба учета неопределенности «более значимый» критерий имеет в
t
Рис. 9.5. Множество неопределенностей при использовании
двух неравнозначных критериев
167
линейной свертке весовой коэффициент, в три раза больший, чем
менее значимый, т.е. является «более важным» ровно в три раза.
3. Рассмотрим теперь качественный критерий, т.е. переменную,
принимающую не континуальное множество числовых значений, а
конечный набор упорядоченных значений, например: «плохо», «сред-
не», «хорошо», «отлично». Обозначим через к число уровней значи-
мости этого критерия, и пронумеруем их в порядке возрастания зна-
чимости номерами $ = 1,При том же способе учета неопреде-
ленности G(t) = t осуществим переход к его адекватной количествен-
ной оценке, т.е. к некоторому количественному критерию, прини-
мающему числовое значение Fs, когда исходный критерий находит-
ся на уровне 5. Для этого представим количественный критерий как
комплексную оценку в задаче принятия решений с к вспомогатель-
ными вариантами решений и к вспомогательными критериями эф-
фективности. 5-й вариант вспомогательного решения отвечает 5-
му уровню исходного критерия. Вспомогательные критерии
/=1,...,Л представляют собой оценки значимости вспомогательных
вариантов решений, причем вспомогательный критерий с большим
номером является «более важным», чем предшествующий. В соот-
ветствии с предыдущим примером это означает, что при вычисле-
нии комплексной оценки соответствующий ему весовой коэффици-
ент будет в три раза больше, чем соответствующий предыдущему.
Если обозначить через х1 весовой коэффициент, отвечающий/1, то
из условия нормировки весовых коэффициентов получим
х1 + 3х1+32х1 + ... + 3*х’ = 1,
3^ — 1 2
откуда х1 —— = 1, или х1 = -г—-.
3-1 3*-1
Установим значения вспомогательных критериев на вариантах
решения следующим естественным образом:
/| (у5) = 1 при /<д;
/' <У5) =0 при i > 5.
168
Тогда комплексную оценку уюжно представить в виде
Л 5 5 П 5 05 _ 1
= = =—£з'-’ = у-р (9.20)
Соотношение (9.20) позволяет обоснованно переходить от ка-
чественных fc-уровневых критериев к количественным при способе
учета неопределенности (9.15).
Итак, в рамках метода ПРИНН множество допустимых спосо-
бов учета неопределенности описывается всевозможными порожда-
ющими функциями G(t).
Что касается формирования типовых наборов способов учета
неопределенности, то в методе ПРИНН предлагается ограничиться
набором из семи типовых способов учета неопределенности, приве-
денным в табл. 9.1, где различным порождающим функциям для
удобства применения присвоены индивидуальные наименования и
подобраны достаточно простые аналитические выражения.
В ряде задач для получения комплексной оценки удается полу-
чить конечные формулы, минуя вычисление многомерных интег-
ралов. В общем случае необходимо применять непосредственное
численное интегрирование.
Общая процедура оценки решений в методе ПРИНН, в соот-
ветствии с изложенной выше основной идеей, достаточно простая.
Таблица 9.1
Номер типового набора способов учета неопределенности Название Порождающая функция
1 Наилучший tk, к —> -оо
2 Наихудший
3 Средний t
4 Осторожный t4
5 Оптимистический
6 Релейный 0,5(1+ ^2Z-1)
7 Нивелирующий 0,5(1+ (2Z-I)5)
169
Поясним ее с помощью аналогии. Представим себе, что каждый
способ учета неопределенности, входящий в типовой набор, явля-
ется математической моделью некоторого эксперта привлеченно-
го для оценки решений из множества К Этот эксперт по-своему (по
формуле (9.13) при соответствующей ему порождающей функции)
учитывает неопределенность хе X ив результате строит собствен-
ную оценку F$J (у) для каждого решения у из К Типовой набор спо-
собов учета неопределенности описывает гармонически подобранную
группу экспертов. Ее гармоничность определяется тем, что эта груп-
па с наименьшей возможной при данном количестве экспертов по-
грешностью отражает все разумные способы учета неопределеннос-
ти. Каждый эксперт группы обладает еще и тем достоинством, что
его отношение к учету неопределенности стабильно и не может быть
изменено.
Организуем теперь работу этой группы экспертов следующим
образом. После того, как все эксперты дали решениям у из Yсоб-
ственные оценки Fsj(y), j- где £ — число экспертов, пред-
ложим им согласовать эти оценки. Для этого каждому эксперту сле-
дует, не меняя собственного подхода к неопределенности, постро-
ить оценку эффективности решения у в условиях неопределенности
критериев, а именно, оценок, данных ему всеми другими эксперта-
ми. Иначе говоря, если первоначально исходной базой для постро-
ения экспертом своей оценки являлось множество чисел
/(х,у), хе X , то на этом этапе такой базой является множество к
чисел Fsj(y), J= 1,...Л.
Таким образом, каждый эксперт косвенно учитывает мнения
других экспертов. Можно показать, что их оценки сближаются, если
оценки «экстремистских экспертов» (наилучший и наихудший) учи-
тываются с меньшей значимостью. Повторная оценка ведется до тех
пор, пока мнения экспертов не совпадут с заданной точностью.
Практика показывает, что при семи экспертах для этого требуется
три-пять повторений.
Предложенный алгоритм хорошо отражает общепринятые ме-
тоды согласования экспертных оценок.
170
9,3. Минимаксные задачи и методы их решения
9.3.1. Постановка задачи и основные особенности
Как отмечалось, минимаксные (максиминные) задачи возника-
ют там, где для раскрытия различного рода неопределенностей ис-
пользуется гарантированный подход. Это относится в равной степе-
ни и к неопределенности целей в случае нескольких равноценных
критериев оптимальности, и к природной неопределенности в слу-
чае неопределенности задания самого критерия целевой функции.
Это относится, наконец, и к любой игровой задаче, когда предпола-
гается наличие некоторого партнера, который выбором своей стра-
тегии может противодействовать достижению основного результа-
та.
С математической точки зрения, все эти задачи сводятся в про-
стейшем случае к следующей двухэтапной задаче оптимизации
х’ = arg min max f(x, §). (9.21)
хел qeQ
На первом этапе должна быть найдена функция максимума
<р(х) = тах/(х, £), (9.22)
а на втором этапе осуществлена ее минимизация по х:
х* =argmin<p(x). (9.23)
Один из подходов к численному решению задачи (9.21) состоит
именно в таком поэтапном ее решении. Однако функция максиму-
ма ф(х), задаваемая соотношением (9.22), имеет ряд особенностей,
которые нельзя не учитывать при решении задачи на втором этапе,
т.е. при минимизации <р(х).
Прежде всего следует подчеркнуть, что функция максимума <р(х)
в общем случае является недифференцируемой функцией даже при
дифференцируемости исходной функции /(х,£>).
171
Поясним это на простейшем примере. Пусть f (х, £) = (х - £)2,
xg X , П = {^:|^| < 1}. Функция максимума в данном случае равна
<PW = max(x-^)2
(х —I)2, х>0;
(х+1)2, х<0.
Из рис. 9.6, на котором представлена эта функция, видно, что в
точке х = 0 эта функция оказывается недифференцируемой. Заме-
тим, что именно в этой точке <р(х) достигает своего минимального
значения. Поэтому обычное условие оптимальности, справедливое
для гладких функций, V/(x*) = 0, в данном случае неприменимо.
В связи с этим, если на первом этапе (при максимизации фун-
кции /(х,£) по 5) в принципе можно использовать различные ме-
тоды поиска, применимые для гладких функций (градиентные, ме-
тоды второго порядка в зависимости от свойств функции и
т.д.), то на втором этапе (при минимизации функции ф(х) в силу
ее недифференцируемости) возможно использование либо методов
нулевого порядка, изложенных ранее, либо специальных методов оп-
тимизации, разработанных для недифференцируемых функций.
Рис. 9.6. Функция максимума
Другой подход к решению
минимаксных задач связан с ис-
пользованием условий опти-
мальности для недифференци-
руемых функций путем постро-
ения итерационного процесса,
обеспечивающего сходимость к
решению, удовлетворяющему
именно этим условиям. Так как
в общем случае эта задача дос-
таточно сложна, мы ограничим-
ся обсуждением лишь одного
172
частного, но очень важного случая, когда целевая функция являет-
ся выпуклой. Отметим, что функция максимума при этом оказыва-
ется также выпуклой функцией (хотя и недифференцируемой).
9.3.2. Некоторые сведения из выпуклого анализа
Напомним, что множество X в Rn называется выпуклым, если
оно содержит всякий отрезок, концы которого принадлежат X, т.е.
если для любых х1, х2 е X , 0 < а < 1 имеет место отношение
ах'+(1-а)х2€ X.
Из определения следует, в частности, что такие множества, как
шар, линейное многообразие, многогранное множество, выпуклы,
а сфера, конечный набор точек — невыпуклы (рис. 9.7).
Рис. 9.7. Выпуклые и невыпуклые множества
Если множество X невыпукло, то его можно «овыпуклить».
Выпуклой оболочкой cQX множества X называется наименьшее вы-
пуклое множество, содержащее X. Выпуклую оболочку можно оп-
ределить и иначе, а именно как выпуклую комбинацию конечного
числа точек из X:
173
I m ___ m I
c0X = 4 x = ^tyx', x' € X, a, > 0, i - l,m, £a- = 1, к (9.24)
[ Ml Ml J
причем т<л + 1.
Скалярная функция ф(х), заданная на всем пространстве Rn,
называется выпуклой, если для любых х1, х2 е Rn и любых 0 < a < 1
выполняется неравенство
ф(ах1 + (1-а)х2)<аф(х1)+(1-а)ф(х2).
Можно показать, что операции сложения, умножения на нео-
трицательное число и взятия максимума не выводят нас из класса
выпуклых функций. Всякая выпуклая функция на Rn непрерывна.
В общем случае выпуклая функция необязательно является диф-
ференцируемой (см. рис. 9.6). Однако для нее можно ввести поня-
тие, обобщающее понятие градиента.
Вектор ае R", для которого выполняется неравенство
ф(х+у)2ф(х)+л7> (9.25)
для всех у е R" , называется субградиентом функции ф(х) в точке х и
обозначается Эф(х). Из определения ясно, что субградиент опреде-
ляется в общем случае неоднозначно (рис. 9.8, 9.9).
Однако, если ф(х) дифференцируема в точке х (рис. 9.10), то
субградиент совпадает с градиентом:
Эф(х) = -Уф(х).
В общем случае множество субградиентов в любой точке непу-
сто, выпукло, замкнуто и ограниченно.
Например, если ф(х) = |х| (рис. 9.11), то субградиент будет равен
Эф(х) =
X Л
п>
W
а, |«|<1,х = 0.
174
Рис. 9.8. К определению
субградиента в случае
скалярной функции
Рис. 9.9. К определению
субградиента в случае функции
двух переменных
дифференцируемой функции недифференцируемой функции
Знание субградиента позволяет вычислять производную по на-
правлению. Так, имеет место равенство
Эф(х)
Эу
max ат
оеЭч>(х)
У»
(9.26)
где Э<р(х) — множество субградиентов. Так как в случае дифферен-
цируемости функции ф(х) субградиент единствен и совпадает с гра-
диентом, то отсюда получаем хорошо известную формулу для про-
изводной по направлению дифференцируемой функции:
175
Эф(х) _ z хт
-^ = V<p(x) у.
Приведем некоторые свойства субградиентов, которые могут
оказаться полезными при их вычислении:
а) если (p(x)-a](Pj(х) + а2ф2(х), где apa2>0, ф^х), ф2(х) —
выпуклы, то
Эф(х) = а1Эф1(х) + а2Эф2(х); (9.27)
б) если ф(х) = шах f. (х), где f.(x) — выпуклы, то
/=1^и '
Ых)=со.и^Ах)’ (9.28)
где /(х)={/:/((х)=ф(х)};
в) если ф(х) = #(Лх), где g(y) — выпуклая функция на Rm,
хе Rn , А — матрица (/их л), то
Эф(х) = ЛгЭ^(Ах). (9.29)
В терминах субградиентов легко могут быть сформулированы
условия оптимальности недифференцируемой выпуклой функции
ф(х) на Rn. В частности, для того чтобы точка х* являлась решени-
ем задачи
x=argrmn<p(x), (9.30)
необходимо и достаточно выполнение условия
ОеЭф(х*).- (931)
Это условие является обобщением известного условия для глад-
ких функций: 7ф(х*) = 0. Только новое условие не требует обяза-
176
тельного равенства нулю субградиента в точке минимума. В точке
минимума могут быть и ненулевые субградиенты. Обязательным
является лишь принадлежность нулевого вектора множеству субгра-
диентов в точке минимума. Например, для функции ф(х) = |х|, как
мы видели, в точке минимума х* = О множество субградиентов пред-
ставляет собой отрезок Эф(0) = {а:|д| <1}, включающий в себя нуль.
Следует подчеркнуть, что сами по себе необходимые условия
оптимальности (даже в случае гладких функций) редко дают конст-
руктивный способ отыскания минимума. Поэтому необходимы иные
приемы. Один из них состоит в использовании понятия е-субгра-
диента и формировании на его основе необходимых и достаточных
условий е -оптимальности.
Вектор а, для которого выполняется неравенство
ф(х + у)>ф(х)+огу-Е, (9.32)
для всех ye Rn , где £ — некоторое неотрицательное число: в>0,
называется в-субградиентом выпуклой функции ф(х) в точке хи
обозначается Эеф(х).
Из определения следует, что Эоф(х) = Эф(х), т.е. е-субградиент
при е— О совпадает с субградиентом. Геометрически в-субградиент
соответствует гиперплоскостям в Rn+l, разделяющим надграфик
ф(х) и точку{ф(х)-в, х} (рис. 9.12, с). Из определения и геометри-
ческой интерпретации следует, что в -субградиент не единствен даже
для дифференцируемых функций (рис. 9.12, б).
При произвольной недифференцируемой функции вычисление
£-субградиентов является, очевидно, более трудоемким, чем субгра-
диентов. Однако в случае функции максимума, о которой в конеч-
ном счете здесь и идет речь, определение £ -субградиента может по-
требовать меньших вычислений. Действительно, пусть
<р(х) = тах/(х, у,
177
где хе Rn , £2 — компактное множество; /(хЛ) — непрерывна по
£ и выпукла по х. Как подчеркивалось, функция ф(х) в данном
случае определена Rn и выпукла. Допустим, что в некоторой точке
ё с точностью до е достигается максимум /(х,£) по £е £2 , т.е.
/(•*. |)^ф(х)-&
Тогда можно записать следующую цепочку неравенств:
<p(x+z)=max/(x+z,^>/(x+z, ^)>/(хД)+Э/(хД)Г z >
>ф(х)+Э/(хД)Г z-e,
откуда следует, что субградиент Э/ (х, функции /(х, по х яв-
ляется одновременно £-субградиентом функции максимума <р(х):
Э/(хД)сЭ£ф(х). (9.33)
178
Таким образом, для отыскания по крайней мере одного из е-
субградиентов функции максимума ф(х) достаточно приближенно
найти максимум исходной функции /(%,£) по £ и взять ее субгра-
диент. Отметим, что вычисление субградиента функции <р(х) тре-
бует точной максимизации функции /(%Л) по £ .
С помощью понятия £-субградиента могут быть сформулиро-
ваны необходимые и достаточные условия того, что некоторая точ-
ка хе является приближенным решением задачи
x* = argmin<p(x). (9.34)
xeRn v '
В частности, можно показать, что условие
ОсЭ£<р(х) (9.35)
выполняется тогда и только тогда, когда /(хе) < пмп<р(х) + е.
9.3.3. Численные методы решения
Основные методы минимизации гладких функций (методы пер-
вого и второго порядка), как известно, основаны на использовании
линейной или квадратичной аппроксимации целевой функции.
Поэтому для недифференцируемой функции, какой и является фун-
кция максимума, эти методы оказываются неприменимыми. Теря-
ют свою работоспособность и другие методы минимизации гладких
функций. Так, например, метод покоординатного спуска, широко
используемый в практике при оптимизации гладких функций, прак-
тически сразу перестает работать при минимизации недифференци-
руемых функций. Рассмотрим в качестве иллюстрации следующий
простейший пример функции максимума
<р(х) = max {| jq - х21, |2х, - х2 -1|}.
Одна из линий уровня этой функции представлена на рис. 9.13.
179
Рис. 9.13. Пример недифференцируемой
функции двух переменных
Из рисунка видно, что в точке х° значение функции вдоль лю-
бого из компонентов в отдельности возрастает. Поэтому метод по-
координатного спуска в этой точке сразу «остановится». Однако эта
точка не является точкой минимума. Сказанное полностью относится
и к точке х'. Что же касается других точек, то нетрудно заметить,
что через одну итерацию из любой точки мы попадем в одну из уг-
ловых точек, подобных х°, х1.
Для создания работоспособных методов поиска в случае недиф-
ференцируемых функций могут быть использованы понятия субгра-
диента и £ -субградиента. Рассмотрим некоторые из методов. При
этом будем следовать в основном работе [32].
Субградиентный метод. Алгоритм данного метода, впервые пред-
ложенный Н.З. Шором и развитый Ю.М. Ермольевым, Б.Т. Поля-
ком и др., формально выражается следующей основной формулой:
180
X*+l хк -j. ftkd(p(xk),
которая может расцениваться как прямой аналог обычного гради-
ентного метода с заменой градиента произвольным субградиентом
функции. Характерная особенность метода заключается в том, что
направление антисубградиента -Эф(х*) в общем случае не является
направлением убывания функции <р(х), как это бывает при опти-
мизации гладких функций. Действительно, на примере той же фун-
кции
<p(x) = max{]x1 -x2|,|2xj-хг-1|}
видно, что вдоль направлений антисубградиента -ЭфС*0), показан-
ных на рис. 9.13, функция <р(х) не убывает при любом выборе ша-
гая hk. Тем не менее при соответствующем выборе длины шага hk
можно обеспечить сходимость метода. Это возможно за счет обес-
печения монотонного уменьшения расстояния до точки минимума.
В этом и состоит основная идея метода. Ясно, что шаг поиска hk
нельзя брать постоянным, как, например, в простейшем градиент-
ном методе, ибо метод не будет сходиться. Нельзя выбирать шаг hk,
как и в методе наискорейшего спуска, поскольку функция <р(х) нео-
бязательно убывает в направлении -Э<р(х*).
Рассмотрим два варианта формирования последовательности {hk}
к = 0, 1, 2,..., обеспечивающих сходимость метода.
Вариант 1 предполагает стремление шага hk к нулю (hk -» 0 при
&->«>) при условии, что суммарная длина шагов бесконечна,
X hk = 00 • Рабочий алгоритм поиска при этом удобно представить в
к=Ъ
виде
<’3‘)
181
Примерами последовательностей, удовлетворяющих условиям
(9.36), могут служить:
Л
Л*=£.О<р<1;
h
*к к\пк'
h^-r-
к + с
Вариант 2 предполагает знание самого минимального значения
критерия <p = min<p(x). Задача, таким образом, состоит в отыскании
вектора х*, обеспечивающего это значение. В этом случае шаг поис-
ка hk можно рассчитывать по формуле
hk=
ф(х‘)-<Р*
|Э<рО*)|
и потому сам алгоритм поиска можно представить в следующем виде:
|Э<р(х*)|
(9.37)
Геометрический смысл данного алгоритма показан на рис. 9.14.
В том случае, когда величина <р* неизвестна, может быть примене-
на следующая модификация алгоритма (9.37):
|Эф(х*)|
(9.38)
где <р обозначена некоторая оценка для <р*, уточняемая в процессе
поиска,
182
Рис. 9.14. Геометрический смысл субградиентного метода
е -субградиентный метод. Как отмечалось, в ряде задач вычис-
ление е -субградиента может оказаться проще, чем субградиента. По-
этому представляет интерес предложенное В.Ф. Демьяновым обоб-
щение алгоритма типа (9.36) на случай использования е-субгради-
ента
= xk-hk
Э^<р(х*)
|э£Лф(х4)|'
(9.39)
Однако, если ек выбирать постоянным гк = е, то метод может
не сходиться. Для обеспечения сходимости нужно изменять еА , ус-
тремляя его к нулю в процессе поиска. Таким образом, условия схо-
димости алгоритма принимают теперь вид
hk -»0, гк -40 при =«>.
*=о
Рассмотренные методы довольно просты по форме и сходятся
при минимальных предположениях о функции. Однако скорость
сходимости их может быть очень мала, особенно для плохо обус-
ловленных функций.
183
В гладком случае более эффективные методы строились на ос-
нове квадратичной аппроксимации минимизируемой функции. Для
негладких задач, о которых здесь идет речь, подобный подход не-
применим. Нужны иные подходы. Один из них связан с использо-
ванием информации, полученной на предыдущих итерациях. В ре-
зультате приходим к так называемым многошаговым методам поис-
ка. Общая идея этих методов состоит в следующем.
Пусть уже найдены точки х°, х1,,..., х* ив них вычислены суб-
градиенты ЭсрСх0), ЭфС*1)ЭсрСлА). Так как, по определению, име-
ют место соотношения
Эср(х*) > дсрСх*) + Э<р(х' )г(х* - х/),
то можно утверждать, что точка минимума х функции ср(х) лежит в
области, задаваемой системой линейных неравенств
Qk = {х:Э<р(х/)7'(х-х/)<(р* -<р(х')}, / = 0,1,...,&. (9.40)
Здесь предполагается, что величина <р* = <р(**) известна. Если же
величина <р* неизвестна, то область Qk можно расширить следую-
щим образом:
0*={х:Эф(х')г(х-х')<0}>/ = 0,1,...Л (9.41)
Рис. 9.15. Общая схема метода
отсечения
Естественно новую точку х*+1
выбрать так, чтобы в том или ином
смысле максимально сократить эту
область (рис. 9.15). Это может быть
сделано различными способами. Рас-
смотрим некоторые из них.
При этом будем полагать, что
многогранник Qo, содержащий точ-
ку минимума х*, задан. Им, в част-
ности, может быть параллелепипед
со сторонами, соответствующими
184
возможным изменениям каждой переменной. Метод отсекающей ги-
перплоскости, предложенный Дж. Келли еще до появления суб гра-
диентного метода, предполагает в качестве точки x*+l выбирать точку
минимума кусочно-линейной аппроксимации функции <р(х), опре-
деляемой значениями фСЙ и Э<р(-^),при /==0,1,... Л на множестве
00-
Другими словами, x*+l является решением задачи линейного
программирования
x‘+'=argminz (9.42)
при дополнительных условиях
ф(х/) + Эф(х/)г(х-х,)<г, / = 0,1,...Л.
Здесь z — вспомогательная переменная, аппроксимирующая факти-
чески целевую функцию <р(х).
Геометрическая интерпретация метода представлена на рис. 9.16.
Недостатком метода является необходимость решать задачу ли-
нейного программирования, в которой число ограничений возрас-
Рис. 9.16. Метод отсечения гиперплоскости
185
тает с ростом количества итераций. Устранить этот недостаток можно
путем модификации метода, в которой остаются лишь те ограниче-
ния, которые удовлетворяются как равенства.
Метод чебышевских центров, развитый С.И. Зуховицким и
М.Е. Примаком, предполагает в качестве точки х*+1 выбирать чебы-
шевский центр многогранника Qk, т.е. точку, максимум расстояния
которой от граней многогранника минимален. Другими словами, x*+i
является решением задачи
xA+1 = arg max z
xeQQ
(9.43)
при дополнительных условиях
d<p(xz)r(-X-**) . • Л1 /
^>Г| ...
Модификация данного метода, предложенная Б.Т. Поляком,
предполагает построение точки x*+I путем проектирования точки х*
на многогранник Qf, задаваемый следующим образом:
Qz = {х:ф(х/)+Эф(х|)г(х-х/)<ф*,/е /}.
Здесь /обозначено произвольное множество из набора 0,1,...Л.
Тогда х*+| может быть найдено как решение следующей задачи
квадратического программирования:
xk+i = arg min lx - xk I2.
xeQ) [ 1
Несомненным достоинством метода является то, что в нем мно-
жество /может содержать не все предыдущие индексы, что суще-
ственно упрощает решение вспомогательных задач на каждом шаге.
Недостатком является необходимость знания величины ф*.
Метод центров тяжести, предложенный одновременно А.Д. Ле-
виным и Д. Ньюменом, предполагает выбирать центр тяжести мно-
гогранника
186
Qk = {х:Эф(х/)7'(х-х'7<0 xg(?0, / = 0,1,..., A:}. (9.44)
Суть такого выбора объясняется тем, что для объема любой ча-
сти, отсекаемой от Qk, гиперплоскостью, проходящей через центр
тяжести, удается получить гарантированную оценку. В частности,
этот объем составляет не менее 1/е части от объема Qk. Для других
точек объем отсекаемой части может оказаться меньше.
Метод центров тяжести представляет значительный интерес. Во-
первых, для него удается получить оценку скорости сходимости,
зависящую только от размерности пространства и «начальной нео-
пределенности» в виде величины
max<p(x) = min<p(x)
и не зависящую от конкретных характеристик выпуклой функции
ф(х), что обычно имеет место. При этом для задач небольшой раз-
мерности скорость сходимости оказывается достаточно высокой. Во-
вторых, в определенном смысле метод центров тяжести является
оптимальным. Его скорость сходимости по порядку не может быть
превзойдена никаким другим методом оптимизации, использующим
туже информацию, т.е. значения ф(х) и Эср(х).
Основной трудностью метода, безусловно, является необходи-
мость вычисления на каждой итерации центра тяжести многогран-
ника.
Кроме того, требуется запоминание значений Эф(х') на всех пре-
дыдущих шагах. Поэтому естественна попытка модифицировать
метод, устранив его основные недостатки и сохранив скорость схо-
димости.
Метод эллипсоидов. Сущность данного метода, развитого А.С. Неми-
ровским и Д.Б. Юдиным, состоит в следующем. Если многогран-
ник Qk поместить внутрь шара, то его центр тяжести находится
просто: он совпадает с центром шара. Выбирая эту точку в качестве
точки х*+) и вычисляя Эф(х*+1), отсекаем половину шара. Оставшу-
187
Рис. 9.17. Метод эллипсоидов
юся половину шара вписываем в
эллипсоид минимального объе-
ма (рис. 9.17). Далее, производя
линейное преобразование про-
странства, превращаем этот эл-
липсоид снова в шар, после чего
процедура повторяется. При та-
ком подходе не требуется запо-
минать сам многогранник Qk и
задающие его ограничения, т.е.
величины Эф(х'), i - 0,1,..., к. Достаточно лишь запомнить точку х*
и матрицу Нк, с помощью которой осуществляется линейное пре-
образование пространства. Алгоритм метода имеет следующий вид:
хк+} =хк - ЛЛЯЛд<р(х*);
Й Р ( А V
‘ Л + 1[>/й2-1 ;
(9.45)
2 Я,Э<р(х*)Эф(х*)гЯ,
*+| к й + 1 Э<р(х*)гHk&f(xk) ’ 0 '
Здесь р —• радиус исходного шара с центром в точке х°; I — еди-
ничная матрица.
Субградиентный метод с растяжением пространства, предло-
женный Н.З. Шором, по форме достаточно близок к методу (9.45),
а по существу представляет собой объединение субградиентного
метода с процедурой растяжения пространства, которая проводится
либо в направлении последнего субградиента, либо в направлении
разности двух последних субградиентов. В результате получается ал-
горитм вида
х*+1=х*-ЛЛЯЛЭф(хА);
2 )Я,Эф(х*)Эф(х*)гЯ, н , (9.46)
агк J Э<р(х‘)гЯх.Э<р(х*:) 0
188
где hk — шаг поиска; аА — коэффициент растяжения пространства
на к -й итерации.
Возможны различные способы выбора параметра hk. Например,
_ 2(<р(х* )-<?*) „
к Ъ^УН^х*)’ к~
hk =argmin<p(x* -ЛЯ4Э<р(л*)),ак =а.
Л
9.4. Методы оптимизации при наличии помех
В предыдущих разделах были рассмотрены методы решения
различных задач оптимизации в предположении, что случайные
возмущения отсутствуют. В реальных задачах ситуация усложняет-
ся наличием разного рода помех. Даже в тех простейших случаях,
когда целевая функция является однозначной функцией своего ар-
гумента /(х), т.е. неслучайной, ошибки возникают вследствие по-
грешностей реализации того или иного метода оптимизации. Так,
например, если целевая функция f(x) или ее градиент V/(x) полу-
чаются не с помощью вычислений, а путем измерений, то появля-
ются ошибки измерений, которые в общем случае носят случайный
характер. Исследования показывают , что ошибки такого рода мо-
гут оказывать существенное влияние на процесс сходимости. В бо-
лее сложных случаях и сама целевая функция зависит от случайных
параметров £ . Задача оптимизации при этом заключается в мини-
мизации некоторой вторичной целевой функции, представляющей
собой какую-либо статистическую характеристику (математическое
ожидание, квантиль и т.д.) исходной (первичной) целевой функции.
Рассмотрим некоторые характерные особенности задач оптими-
зации в условиях помех, а также основные подходы к их решению.
9.4.1. Влияние ошибок измерения
Самыми распространенными ошибками, с которыми приходится
сталкиваться в процессе оптимизации, являются ошибки измерения
189
(или вычисления). В зависимости от применяемого метода оптими-
зации такими ошибками могут быть ошибки измерения целевой
функции, ее градиента или субградиента и т.д. Рассмотрим влияние
некоторых из них на сходимость различных методов.
Градиентные методы при наличии помех. Представим, что речь
идет о минимизации дифференцируемой целевой функции /(х) с
помощью одного из градиентных методов в ситуации, когда гради-
ент вычисляется (измеряется) с ошибкой
х*+1 =х*sk - V/(xA ) + £;*. (9.47)
Оказывается, что в зависимости от свойств помех поведение
градиентных методов оказывается различным. Дадим лишь каче-
ственный анализ влияния различных помех. Будем различать поме-
хи систематические (неслучайные) и чисто случайные.
Можно показать, что в первом случае, когда все £>к неслучай-
ные, но ограниченные по абсолютному значению, градиентный метод
с постоянным шагом дает возможность лишь попасть в некоторую
окрестность минимума, размер которой тем меньше, чем меньше
уровень помех. Однако если предположить, что помехи зависят
от величины градиента (а это соответствует вычислению градиента
с относительной ошибкой), то можно показать, что сходимость ме-
тоду сохраняется при относительных ошибках по крайней мере ме-
неё|100%.
' Во втором случае, когда помехи %к являются независимыми цен-
трированными случайными величинами и имеют ограниченные
дисперсии
Л/[^] = 0, Л/[|^|2]<о2,
справедливы следующие выводы [32].
Во-первых, простой градиентный метод не сходится к точке
минимума, а приводит лишь в окрестность минимума, как и в слу-
чае неслучайной помехи. Размеры этой области тем меньше, чем
меньше шаг поиска. Во-вторых, выбирая шаг убывающим hk —> 0,
190
метод можно сделать сходящимся как в среднем квадратическом
смысле, так и по вероятности при условии, что имеет место нера-
венство X < оо. В-третьих, скорость сходимости при этом доволь-
а=о
но медленная.
Если же дисперсия помехи пропорциональна квадрату гра-
диента (и поэтому она убывает по мере приближения к точке мини-
мума), то сходимость градиентного метода не нарушается.
Метод Ньютона при наличии помех. Этот метод более сложный,
так как здесь имеется большее количество источников помех (при
вычислении /(х), V/(x), V2/(x), обращении V2/(x). Качествен-
ный анализ ситуации сводится к следующему.
Во-первых, наличие достаточно больших систематических (не-
случайных) помех может привести к развалу метода Ньютона. Это
свойство объясняется тем, что метод Ньютона в принципе обладает
лишь локальной сходимостью (сходимость гарантируется только в
некоторой области). Во-вторых, присутствие случайных ошибок, хотя
оказывается и не столь катастрофическим, однако может повлечь
существенное замедление скорости сходимости вплоть до скорости,
которой обладают более простые градиентные методы. В-третьих,
метод Ньютона сохраняет свои преимущества лишь при высокой
точности вычислений (измерений).
Прямые методы при наличии помех. Данная группа методов
нашла пожалуй, самое широкое применение при решении различ-
ных стохастических задач оптимизации. Именно эти методы состав-
ляют центральное место в так называемой теории стохастической ап-
проксимации, предназначенной для решения задач оптимизации в
условиях помех.
Простейшим из этой группы является метод, представляющий
собой разностную аппроксимацию градиентных методов (метод
Кифера—Вольфовица—Сакса). В случае использования симметрич-
ной аппроксимации алгоритм имеет следующий вид:
хк _хк _hs sk = у 7(x*4-a4)-7(x*-a*ef)
х -х nsk,s 2^ 2a* *' (У-48)
191
Здесь ez—координатные орты; f(xk) = f(xk) + ^k ; — случайные
ошибки измерения (вычисления) целевой функции.
Для унимодальных целевых функций при независимых, цент-
рированных ошибках измерений, имеющих ограниченные диспер-
сии, и некоторых дополнительных естественных ограничениях мож-
но показать, что для сходимости данной процедуры поиска как в
среднем, так и по вероятности необходимо стремить к нулю как
пробные, так и рабочие шаги, причем пробные шаги следует умень-
шать медленнее.
Одним из возможных способов выбора параметров hk, ак мо-
жет быть предложен следующий:
hk =~4р а* = , ' , ,0<р<0,5, (9.49)
a + bk (c + dk)p v 7
где a,b,c,d — некоторые положительные константы.
Характерной особенностью методов подобной группы является
достаточно слабая скорость сходимости. Для ее повышения суще-
ствуют специальные приемы.
Следует отметить, что в детерминированных (без помех) глад-
ких задачах оптимизации каждому методу присуща своя скорость
сходимости. Так, метод сопряженных градиентов сходится быстрее
градиентного, метод Ньютона — быстрее метода сопряженных гра-
диентов и т.д. Наличие помех в определенном смысле упрощает
ситуацию. В целом помехи, конечно, ограничивают возможности
любых методов оптимизации. Но более важно то, что наличие слу-
чайных помех уничтожает преимущества быстро сходящихся мето-
дов минимизации. Показано, что существует предельная скорость
сходимости, которая не может быть превзойдена. Во многих случа-
ях этой предельной скоростью обладают именно градиентные мето-
ды с соответствующим выбором шага поиска. Поэтому в указанном
смысле они могут считаться оптимальными. При этом, правда, не
следует забывать, что приведенные выводы носят чисто асимптоти-
ческий характер и предполагают точное знание закона распределе-
ния случайных помех. При отклонении истинного распределения от
192
предполагаемого (как правило, нррмального) соответствующие ал-
горитмы поиска могут оказаться неустойчивыми.
Методы недифференцируемой оптимизации при наличии помех.
Ограничимся рассмотрением субградиентного метода вида
xk+'=xk-hkSk, 5*=д<р(х*) + ^. (9.50)
Здесь <р(х) — любая недифференцируемая функция, подлежащая ми-
нимизации. В частности, это может быть функция максимума. Че-
рез ^к обозначена помеха любой природы (погрешность вычисле-
ния субградиента, ошибка измерения и т.д.). Если допустить, что
^к детерминирована и ограничена по абсолютному значению, то, в
отличие от гладкого случая (где градиентный метод сходился лишь
к некоторой окрестности минимума), при малом уровне помех ме-
тод может сохранить сходимость к точке минимума при специаль-
ном выборе шага поиска hk. Это объясняется тем, что теперь Эф(х*)
не стремится в общем случае к нулю при приближении к точке ми-
нимума.
Если помеха детерминирована, но зависит от величины суб-
градиента, то результат получается аналогичным результату для слу-
чая гладкой минимизации — сходимость метода в пределах некото-
рого допустимого уровня сохраняется. Правда, сам уровень этой
относительной допустимой помехи может оказаться существенно
ниже, причем он зависит теперь от обусловленности оптимизируе-
мой функции. Чем хуже обусловленность, тем чувствительнее ме-
тод к относительной помехе.
Что касается влияния случайных помех, имеющих ограничен-
ные дисперсии, то, как и для гладкого случая, при аддитивных по-
мехах любого уровня имеет место сходимость, если шаг поиска яв-
ляется убывающим: hk -»0. Различие гладкого и негладкого случа-
ев заключается лишь в том, что в первом случае именно наличие
помех приводит к необходимости регулировки шага поиска указан-
ным способом (hk -> 0), во втором же случае для обеспечения схо-
193
димости всегда (при наличии помех или без помех) следует шаг по-
иска выбирать убывающим: hk —> 0.
9.4.2. Основные подходы к решению
стохастических задач оптимизации
Рассмотрим теперь основные подходы к решению стохастичес-
ких задач оптимизации, полагая, что минимизации подлежит неко-
торая вторичная целевая функция, представляющая собой какую-
либо статистическую характеристику исходной (первичной) — це-
левой функции /(%Л). Обсудим лишь задачи безусловной оптими-
зации, полагая, что учет ограничений может быть осуществлен ме-
тодами, аналогичными тем, которые используются при решении
детерминированных задач оптимизации.
Сведение к детерминированной задаче. Первый совершенно оче-
видный подход заключается в попытке получить выражение для
вторичной целевой функции в явном виде. Если допустить, что та-
кой функцией является, например, математическое ожидание исход-
ной целевой функции, т.е.
7(х) = Л/[/(хЛ)], (9.51)
то для раскрытия операции математического ожидания в общем
случае необходимо взять многомерный интеграл типа
где р( £) — плотность распределения случайного вектора §. Если
эту операцию удается осуществить аналитически, то исходная сто-
хастическая задача оптимизации сводится к обычной детерминиро-
ванной задаче математического программирования
x* = argmm7(x), (9.52)
методы решения которой были изложены выше.
194
Использование метода статистического моделирования. Как пра-
вило, в сложных задачах в явном виде получить вторичную целевую
функцию практически не удается. Для ее приближенного определе-
ния часто приходится обращаться к методу Монте-Карло (статис-
тического моделирования), т.е. методу математического моделиро-
вания случайного вектора £ путем формирования тем или иным спо-
собом некоторой конечной выборки Д2,..., , с последующей ста-
тистической обработкой результатов моделирования.
Так, например, для целевой функции (9.51) в этом случае в ка-
честве приближенного ее значения, а также ее градиента V/(x) и
гессиана V2/(x) могут быть взяты следующие значения:
7(х)±£/(хЛ>). (9.53)
Ут у=] <7Л 7т иЛ
Так как в процессе решения задачи оптимизации численными
методами эти функции необходимо вычислять в различных точках
х*, то легко представить себе те вычислительные трудности, с кото-
рыми приходится сталкиваться. Ведь на каждой итерации поиска не-
обходимо проведение Nреализаций случайного вектора £ . Вычис-
ление градиента и гессиана еще труднее. Важно помнить, что схо-
димость процесса поиска при этом в значительной степени зависит,
с одной стороны, от статистических характеристик самого вектора
£, а с другой — от количества реализаций, имитирующих этот слу-
чайный вектор. С целью сокращения затрат машинного времени и
получения более устойчивого процесса поиска практически целесо-
образно использовать некоторый стандартный (квазислучайный) на-
бор реализаций случайного вектора, неизменяемый для различных
точек х*.
Применение методов стохастической аппроксимации. Во мно-
гих случаях методы стохастической аппроксимации, предназначен-
ные в первоначальном виде для минимизации функций при нали-
чии ошибок измерения, могут быть с успехом использованы для ре-
шения разнообразных задач стохастической оптимизации. Это воз-
можно потому, что использование приближенного значения целе-
вой функции и ее производных, полученных путем статистического
195
моделирования, практически может трактоваться как измерение их
с ошибками. Поэтому все рекомендации в отношении алгоритмов
стохастической аппроксимации практически переносятся и на дан-
ный, более общий, случай. Учитывая это, ограничимся изложением
лишь одного достаточно общего алгоритма стохастической аппрок-
симации вида
хк+1=хк-ГкУДхк£к).
(9.54)
Здесь матрица Г* (аналог шага поиска hk) должна быть подобрана
так, чтобы обеспечить сходимость процесса поиска. Важной особен-
ностью алгоритмов подобного рода является независимость их от
конкретных статистических характеристик случайного вектора £>к.
Поэтому они могут использоваться и в случае, когда эти статисти-
ческие характеристики просто неизвестны.
Сведения к минимаксным задачам. Часто исходную стохастичес-
кую задачу оптимизации целесообразно трансформировать в неко-
торую вспомогательную минимаксную задачу, решение которой
может быть получено более просто. Обычно такой прием использу-
ется в тех случаях, когда статистическая информация о векторе
является неполной. При этом задают некоторое «доверительное»
множество £1, которому принадлежит вектор £, ;е Q, и задача фор-
мируется следующим образом:
х* = arg min max /(х, £).
(9.55)
хеХ $60
Если статистическая информация о векторе все же имеется, то
множеству П приписывают некоторую доверительную вероят-
ность а.
Решение задачи (9.55) в этом случае может рассматриваться
лишь как оценочное (приближенное) для исходной стохастической
задачи.
Оказывается [24], что при некоторой модификации задачи (9.55)
можно добиться строгой эквивалентности ее исходной стохастичес-
кой задаче, сформулированной, правда, в терминах вероятности.
196
Обратимся к задаче отыскания гарантированного по вероятно-
сти результата, сформулированной во введении. Пусть требуется най-
ти такой вектор х*, который обращает в минимум квантиль fa(x)
целевой функции /(х,£):
x*=arg min/a(x), (9.56)
где квантиль fa(х), согласно определению, равен для каждого х наи-
меньшему уровню целевой функции fa(x£), при котором выпол-
няется вероятностное условие
Р[/(х,^)</0]>а, (9.57)
т.е.
/a(x) = min{/0: P[/(x^)</fl]>a}.
Можно показать, что справедливо следующее равенство:
/aW = minmax/(x,S), (9.58)
Qeea
где через ea обозначено семейство всех (любых) доверительных мно-
жеств реализаций случайных факторов , обладающих одной и той
же вероятностной мерой, равной a.
Геометрический смысл равенства (9.58) проиллюстрирован на
рис. 9.18 и сводится к следующему. Так как квантиль fa(x) — это
наименьший уровень функции /(х,£) в предположении х фиксиро-
ванным, при котором вероятность непревышения значения fa, равна
не менее а (в данном случае равна а), то задачу определения fa
легко решить графически. Нетрудно видеть, что этому решению со-
ответствует доверительное множество П (в данном случае отрезок
1Дх D вероятностной меры а. Это значит, что площадь под кри-
197
Рис. 9.18. Геометрический смысл определения квантили
вой р(£ ) на отрезке [ Д*, 1?а] равна точно а. А теперь образуем се-
мейство еа всевозможных отрезков О, обладающих той же вероят-
ностной мерой а. На рис. 9.18 для наглядности показаны лишь три
из них: [ В' ], [ А", Б" ] и [ Аа, Ва].
Нетрудно убедиться графически, что, если на каждом из отрез-
ков найти наибольшее значение функции, /(х,£) по £, и сравнить
эти значения между собой, то обнаружим, что наименьшее среди них
будет соответствовать именно множеству Qa — в данном случае от-
резку [ Aat Ва ]. Другими словами, для того чтобы при фиксирован-
ном х найти квантиль /а, достаточно решить минимаксную задачу
(9.58). Подчеркнем, что в результате решения этой задачи будет
найдено и само оптимальное доверительное множество Qa:
Q = arg min max/(х,^). (9.59)
Oe£a
Теперь вернемся к исходной оптимизационной задаче (9.56). С
учетом свойства квантиля (9.58) данная задача оказывается эквива-
лентной следующей обобщенной минимаксной задаче:
198
(х*, Q ) = aig’ftiin max /(x, ф. (9.60)
Qeea
xeX
Характерной отличительной особенностью этой задачи по срав-
нению с обычной минимаксной задачей типа (9.55) является нали-
чие дополнительной операции минимизации по доверительному
множеству П из семейства еа. Если в обычной минимаксной зада-
че множество П, как уже отмечалось, задается априори, то в обоб-
щенной минимаксной задаче оно выбирается в процессе решения
самой задачи наилучшим в указанном выше смысле.
Какие же возможности открывает использование сформулиро-
ванного выше принципа эквивалентности? Во-первых, так как обоб-
щенная минимаксная задача (9.60) эквивалентна исходной вероят-
ностной задаче (9.56), то для решения последней принципиально
может быть использован тот богатый математический аппарат, ко-
торым мы располагаем в области решения минимаксных задач. Воз-
можно и обратное, когда для решения минимаксных задач может
оказаться более предпочтительным использование вероятностных
методов, о которых шла речь выше. Во-вторых, принцип эквивален-
тности позволяет несколько иначе взглянуть на использование обыч-
ного гарантирующего подхода с целью получения приближенного
решения вероятностной задачи. Действительно, вернемся снова к
минимаксной задаче (9.55), в которой множество Q выбрано апри-
ори. Если даже множество Q обладает заданной вероятностной ме-
рой a, т.е. Фб еа, то, хотя решение (9.55) для вектора х и будет га-
рантирующим, но в общем случае оно не будет оптимальным для
вероятностной задачи (9.56). Это следует из самого определения обоб-
щенной минимаксной задачи (9.60), которое может быть, в частно-
сти, записано в виде
min шах /(x,Q < min max f(x,Q,
Oeea xeX ^e£2
x<=X
Таким образом, использование обычной минимаксной задачи
типа (9.55) с априори заданным доверительным множеством Q в
199
общем случае позволяет получить лишь оценку сверху (по величине
критерия для решения вероятностной задачи (9.56)). Причем следу-
ет иметь в виду, что эта оценка часто бывает чересчур завышенной
и поэтому само решение х* — очень осторожным.
Поясним сказанное на простейшем примере. Пусть требуется
вычислить квантиль fa для целевой функции, не зависящей от х и
равной /=|^2|,т.е.
/a = min{/o:^l
Случайные величины £2 будем считать независимыми цен-
трированными гауссовскими с дисперсией а2. Пусть а = 0,995. Со-
гласно равенству (9.58) имеем
f = min max|L L|.
OEEa |Ъ1 Ъ21
Решая эту задачу полностью, включая и определение оптималь-
ного доверительного множества Па, мы можем точно найти значе-
ние квантиля fa. Не будем этого делать, ограничимся лишь иллю-
страцией того факта, что, задавая доверительное множество априо-
ри и варьируя его, можно существенно улучшить получаемую при
этом оценку искомого решения.
Рассмотрим в качестве первого приближения традиционное
доверительное множество, сформированное по правилу «трех сигм»:
О.' = {£: | < Зо, |^21 < Зо}. На плоскости реализаций случайных фак-
торов множество Q' представляет собой квадрат со сторонами, па-
раллельными осям координат (рис. 9.19). Подчеркнем, что вероят-
ностная мера этого множества Р [ О' ] = 0,995.
Считая множество О' фиксированным, на основании (9.58) по-
лучаем следующую оценку для квантиля: •
/« = 4^1 ^| = 9«2-
200
Рис. 9.19. Влияние доверительного множества на решение
минимаксной задачи
Это решение соответствует одной из угловых точек множества,
например,точке Л'.
Теперь изменим доверительное множество, сохранив при этом
его вероятностную меру. Для этого развернем квадрат Q.' вокруг на-
чала координат на 45е и получим новое множество О.':
= £ : 1$, +^|53а>/2, -^|<ЗсЛ}
Из рис. 9.19 ясно, что максимальное значение величины | 1
на этом множестве достигается уже в точке касания типа Л" и оно
меньше, чем в точке А', в два раза:
/*=тах|Е,
Другими словами, оценка квантиля f" вдвое лучше оценки •
Из рисунка также ясно, что оценку можно еще улучшить, если до-
верительное множество приближать к оптимальному, в данном слу-
чае имеющему вид:
201
аа={^
Таким образом, варьируя доверительное множество и прибли-
жая его к оптимальному, можно рассчитывать с помощью минимак-
сного подхода на получение достаточно хорошего приближения к
решению вероятностной задачи. Если же доверительное множество
выбрать строго оптимальным, то получим точное решение исход-
ной вероятностной задачи. Во многих случаях, имеющих важное
прикладное значение, в частности при наличии непрерывной и стро-
го монотонной функции распределения случайной величины f(x,Q ,
структура оптимального множества может быть определена до ре-
шения самой задачи. В этом случае оптимальное доверительное
множество имеет следующий вид:
Пв={^/(х,У</о}.
Это значит, что границей множества Qa в пространстве реали-
заций случайных параметров является поверхность уровня функции
/(хЛ).
При больших требуемых вероятностях а, близких к единице, и
нормальном распределении случайных параметров достаточно хо-
рошим приближением к оптимальному доверительному множеству
может служить эллипсоид равной плотности вероятности, имеющий
заданную вероятностную меру а.
Более подробно с возможностями описанного доверительного
подхода к решению вероятностных задач оптимальности можно оз-
накомиться в работах [23,11].
В данном разделе были обсуждены некоторые специальные ме-
тоды оптимизации, связанные с учетом различного рода неопреде-
ленных и случайных факторов. Основное внимание было сосредо-
точено на трех направлениях, имеющих большое прикладное зна-
чение: многокритериальные задачи оптимизации, минимаксные за-
202
дачи и задачи оптимизации при раличйи помех. Эти направления
достаточно новы и активно развиваются, поэтому в пособии глав-
ным образом обсуждены основные идеи, подходы и методы к реше-
нию рассматриваемых задач. В значительно меньшей степени зат-
ронуты конкретные (рабочие) алгоритмы оптимизации. Это объяс-
няется тем, что таких алгоритмов, прошедших апробацию, на сегод-
няшний день достаточно мало, эффективность многих из них до
конца не выяснена. Короче говоря, данная проблема еще далека от
завершения и требует новых идей и дополнительных, по-видимо-
му, значительных усилий.
— ЧАСТЬ 2 . =
ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ
10. ПОСТАНОВКА ЗАДАЧИ ОПТИМАЛЬНОГО
УПРАВЛЕНИЯ
В первой части рассматривались задачи математического про-
граммирования, т.е. задачи оптимизации статических объектов, когда
целевая функция зависела от целого ряда параметров, не изменяю-
щихся во времени. Теперь перейдем к обсуждению более сложных
задач оптимального управления динамическими объектами, т.е.
объектами, состояние которых изменяется во времени. Типичным
примером такого объекта является летательный аппарат. Чтобы ле-
тательный аппарат, как объект управления, эффективно выполнял
свои функции, необходимо по крайней мере решить две задачи.
Первая задача заключается в определении траектории движения
летательного аппарата. С математической точки зрения эта задача
состоит в отыскании некоторой программы управления, представ-
ляющей собой зависимость величины управляющего воздействия от
времени. Эту задачу будем называть задачей программирования уп-
равления.
Вторая задача заключается в формировании закона управления
летательным аппаратом. Под законом управления в данном случае
понимается зависимость управляющего воздействия от тех коорди-
нат, которые доступны измерению в процессе движения в любой
(текущий) момент времени. Решение этой задачи позволяет сфор-
мировать (синтезировать) структуру системы управления летатель-
ным аппаратом, работающей по принципу обратной связи. Эту за-
дачу будем называть задачей синтеза управления.
В дальнейшем речь пойдет о задачах программирования и син-
теза оптимального управления. При решении как задачи програм-
мирования управления, так и задачи синтеза необходимо иметь в
204
виду, что на любой летательный аппарат в процессе полета действу-
ют различные возмущения (случайные и неопределенные), без уче-
та которых зачастую просто нельзя обойтись. Характерным приме-
ром может служить задача управления конечным (терминальным)
состоянием летательного аппарата, когда требуется осуществить
выведение аппарата в требуемый район назначения с высокой точ-
ностью. При этом возможны случаи, когда решение той или иной
задачи без учета возмущений вообще не может обеспечить требуе-
мой точности управления. Поэтому при формировании как програм-
мы, так и закона управления летательными аппаратами следует учи-
тывать действие случайных и неопределенных факторов.
Обсуждение начнем с детерминированной постановки задач
оптимального управления для случаев непрерывного и дискретного
управления.
10.1. Непрерывный случай
Математическая постановка задачи оптимального управления
любым динамическим объектом предполагает формирование мате-
матической модели с учетом всех требующих учета ограничений;
выбор критерия оптимальности и, наконец, определение той инфор-
мации, которая может быть использована при реализации искомого
управления.
В качестве математической модели летательного аппарата чаще
всего рассматривают систему обыкновенных дифференциальных
уравнений, которая в векторной форме имеет вид
х = /(х,м). (10.1)
Здесь х — л-мерный вектор состояния, или фазовый вектор, опре-
деляющий состояние системы в текущий момент времени /; и — т-
мерный вектор управления, или просто управление; /(%,«) — не-
прерывно дифференцируемая вектор-функция, характеризующая
вектор обобщенной силы, действующей на летательный аппарат;
(•) — символ дифференцирования по времени,
U dt
205
Систему (10.1), не зависящую явно от времени t, принято назы-
вать автономной.
В общем случае ограничения, которые следует учитывать и ко-
торые определяют область существования математической модели
(10.1), будем задавать с помощью условий
хеХ, ugU, Ге [0,7], (10.2)
где через X, U обозначены допустимые области изменений векто-
ров хи и соответственно; Т — время «существования» модели (10.1).
Время Т может быть либо фиксированным, либо свободным. Усло-
вие хе X принято называть фазовым ограничением, условие ueU —
ограничением на управление. Заметим, что X, U могут зависеть явно
от времени. Возможно также наличие и смешанных ограничений на
фазовый вектор и управление.
Частным случаем условий (10.2) является задание граничных
условий х(0), х(7). Будем полагать всюду, если специально не ого-
ворено, что вектор х (0) задан. Что касается вектора х (7), то в зави-
симости от условий задачи он может быть либо задан, либо быть сво-
бодным (частично или полностью), либо принадлежать допустимо-
му множеству х(Т)е Х(Т).
Не нарушая общности, в качестве критерия оптимальности,
подлежащего минимизации по управлению, можно рассматривать
функцию конечного состояния
7 = Г[х(7)]. (10.3)
Задача оптимизации состоит в определении такого управления
системой (10.1), которое с учетом (10.2) обеспечивает минимум кри-
терию (10.3).
Задача оптимизации, в которой используется критерий вида
(10.3), известна в литературе также под названием задачи Майера или
задачи управления конечным состоянием.
В зависимости от того, какую информацию предполагается ис-
пользовать при реализации искомого управления, различают два
основных типа задач управления.
206
Задача программирования оптимального управления — когда счи-
тается, что никакая текущая информация (кроме начальных усло-
вий) об объекте не используется. В этом случае управление опреде-
ляется как функция времени. Для его нахождения, как правило, ис-
пользуются либо необходимые условия оптимальности непосред-
ственно, либо косвенно, путем реализации различных численных
методов поиска.
Задача синтеза оптимального управления — когда считается, что
в любой текущий момент времени состояние объекта известно (пол-
ностью или частично, непосредственно или косвенно). В этом слу-
чае управление должно быть найдено как функция тех координат,
которые доступны измерению. Задача синтеза существенно сложнее
задачи программирования управления. Фундаментальной основой
для ее решения могут служить достаточные условия оптимальнос-
ти. Однако их непосредственное применение оказывается эффектив-
ным лишь в ограниченном классе задач, например, задач управле-
ния линейными объектами с квадратичным критерием оптимально-
сти. В общем случае для решения задач синтеза необходим творчес-
кий подход, использующий различные приемы, к числу которых от-
носятся, например, линеаризация моделей, декомпозиция исходной
задачи на более простые, параметризация законов управления с
последующим сведением задачи синтеза к задаче математического
программирования и многие другие.
Упражнение 1. Показать, что критерий оптимальности более общего
вида (задача Больца)
/ = {/0(х,«)Л+ф(Г)]
о
может быть сведен к функции конечного состояния
/ = ф(Т)] = х0(Г)+ф(Г)]
по отношению к расширенному вектору хТ = (х0,х7'), где компонента х0
определяется с помощью дифференциального уравнения (х,и) при
граничном условии д^(0) = 0.
207
Упражнение 2. Показать, что математическая модель неавтономной
системы
X- f(x,u,t),
т.е. системы, зависящей явно от времени, может быть сведена к автоном-
ной введением дополнительной переменной хя+1, удовлетворяющей урав-
нению хй+1 = 1 при граничном условии хй+1 (0) = 0.
Упражнение 3. Показать, что задача максимизации критерия J экви-
валентна задаче минимизации критерия —Z
10.2. Вертикальный спуск летательного аппарата
Рассмотрим движение летательного аппарата при вертикальном
спуске на безатмосферную планету. При формировании математи-
ческой модели будем считать, что планета плоская, на летательный
аппарат действует только сила тяжести G = mg, где т — масса аппа-
рата; g — ускорение свободного падения на данной планете, и сила
тяги Р = ср, где с = const; р — секундный расход топлива, или, что
то же самое, массы аппарата.
Тогда уравнения движения летательного аппарата могут быть
представлены в следующей форме:
т - ~Р, mh! = ср - mg,
где h — высота полета.
В качестве управления будем рассматривать секундный расход
топлива, удовлетворяющий естественным ограничениям:
В общем случае необходимо учитывать и фазовое ограничение
h > 0, что означает недопустимость столкновения с поверхностью.
Однако, как будет показано далее, при решении данной задачи это
условие выполняется автоматически, поэтому его можно не рассмат-
ривать.
Граничные условия имеют вид
/л(0) = ^, Л(0) = ^, А(0) = %, Л(Т) = А(П = 0.
208
Параметры считаются известными, время завершения
движения Тподлежит определению в процессе решения задачи оп-
тимизации. Задача заключается в выборе такого управления £(г), ко-
торое позволит осуществить посадку летательного аппарата с мини-
мальным расходом топлива. В терминах введенных фазовых коор-
динат критерий оптимальности, подлежащий минимизации, запи-
шется как
/ = -т(Т).
Вводя обозначения %! = -/и, х2 = А, х3 = А, и = Р, um = ртах, окон-
чательно математическую постановку задачи оптимизации можно
представить в следующем виде.
Математическая модель летательного аппарата
си
х2==х^, Хз = -—-g. (10.4)
Л1
. *
Ограничения на управление
0<w<wm. (10.5)
Граничные условия
х1(0) = -/И6, Х2(0) = ^, х3(0) = АЬ, ^(Т) = х3(Г) = 0, (10.6)
Т — свободно.
Критерий оптимальности
(10.7)
В случае задачи программирования оптимального управления
требуется найти такое управление в каждый момент времени и (/),
которое обеспечивает минимум критерию (10.7) с учетом (10.4) —
(10.6).
209
В случае задачи синтеза оптимального управления требуется
найти такое управление в функции текущих координат
u(xp Xj, х3,Г) для любого момента времени, которое обеспечивает
минимум критерию (10.7) с учетом (10.4) — (10.6).
10.3. Дискретный случай
Рассмотрение дискретных систем в последнее время приобрело
огромное значение в связи с широким применением цифровой вы-
числительной техники не только при решении задач, связанных с
исследованием вопросов динамики и управления летательного ап-
парата, но и непосредственно в процессе управления такими объек-
тами.
В качестве математической модели дискретной системы в об-
щем случае будем рассматривать векторное уравнение вида
xM=fi(xi,ul),i=VN, (10.8)
где х., и. — векторы состояния и управления в момент времени i
соответственно; / — вектор-функция, связывающая состояния си-
стемы в два соседних момента времени; 7V— количество временных
шагов управления.
В частном случае уравнение (10.8) может быть интерпретирова-
но как конечно-разностный аналог дифференциального уравнения
(10.1), полученный дискретизацией последнего по времени.
Область существования модели (10.8) по аналогии с (10.2) бу-
дем задавать системой условий
u.eUp х.еХр (10.9)
где Ut, Xi — допустимые области изменений векторов xz, uj соответ-
ственно. Количество шагов N может быть либо заданным, либо
подлежащим определению.
Как и в непрерывном случае, без нарушения общности в каче-
стве критерия оптимальности можно рассматривать функцию конеч-
ного состояния
210
J - F(xN+l).
(10.10)
Задача программирования оптимального управления состоит в
определении такой последовательности { uz}, i = l,N, которая осу-
ществляет перевод системы (10.8) из заданного начального состоя-
ния Xj в конечное xJV+1 с учетом (10.9) при минимальном значении
критерия (10.10).
В зависимости от условий задачи вектор конечного состояния
Хдг+1 может быть либо свободным (частично или полностью), либо
принадлежать допустимому множеству: xN+{ е XN+l.
Упражнение. Показать, что критерий оптимальности вида
ы
может быть сведен к функции конечного состояния
J ~F (xN+x) = x^+I + F (xN+x)
по отношению к расширенному вектору хт = (х°,хг), где х^+1, определя-
ется с помощью уравнения х?+1 = х? + ^°(х.,и() при граничном условии
xf = 0.
10.4. Коррекция траектории космического аппарата
В качестве примера дискретной задачи оптимизации рассмот-
рим задачу однопараметрической коррекции траектории космичес-
кого аппарата с целью минимизации конечной ошибки по какому-
либо параметру траектории.
Пусть х — величина конечной ошибки по этому параметру, на-
зываемая для краткости промахом. Обозначим через xz — промах,
прогнозируемый в момент i перед совершением коррекции; через
211
— величину /-го корректирующего воздействия; через Л, — фун-
кцию влияния /-го корректирующего воздействия на промах,
В. ~ (Очевидно, что параметр В.{ связан с моментом проведе-
ния /-й коррекции и зависит от него.) Тогда в качестве математи-
ческой модели процесса коррекции в первом приближении можно
принять скалярное уравнение
х/+1=х. + Д.«., / = IjV. (10.11)
Компонента хр определяющая прогнозируемый априори (до со-
вершения коррекций) промах, и число коррекций /Vсчитаются за-
данными.
Требуется найти такую последовательность корректирующих
воздействий {и,}, г = 1,7V , которая при имеющихся энергетических
возможностях обеспечивает минимум конечного промаха. Учиты-
вая сказанное, в качестве критерия оптимальности можно рассмот-
реть величину
/ = 4+1. (10.12)
Ограничение на энергетику в отдельных случаях может быть
учтено условием
(10.13)
/=1
где — заданная величина, характеризующая суммарные энерге-
тические возможности. В других случаях требуется использование
условия более сложного типа
N
. (10.14)
1=1
Заметим, что в рассмотренной задаче ограничения, накладыва-
емые непосредственно на фазовые переменные xi и управление ир
отсутствуют.
212
11. ПРОГРАММИРОВАНИЕ ОПТИМАЛЬНОГО
УПРАВЛЕНИЯ. НЕОБХОДИМЫЕ УСЛОВИЯ
ОПТИМАЛЬНОСТИ
Большинство методов решения задач программирования опти-
мального управления базируется на использовании необходимых
условий оптимальности. С методической точки зрения, изучение этих
условий целесообразно начать с дискретного случая.
ILL Необходимые условия оптимальности.
Дискретный случай
Рассмотрим задачу программирования оптимального управле-
ния дискретной системой
XM=fi(Xl>Ui)> > = ^ (П.1)
при ограничениях, накладываемых только на управление,
из условия обращения в минимум критерия
Z = F(^+1), (11.2)
считая, что вектор и число N заданы, а вектор xN+1' свободен.
Обозначим через и искомую (оптимальную) управляющую
последовательность и = {и,}, / = 1,...,N.
Наиболее простой подход к получению необходимых условий
оптимальности, которым должна удовлетворять последовательность
и, очевидно, состоит в интерпретации данной задачи как специаль-
ной задачи математического программирования с последующим
использованием известных результатов.
Итак, будем считать, что критерий (11.2) является некоторой
функцией управления
213
J = J(u).
Здесь и в дальнейшем для удобства под и будем понимать последо-
вательность {ц }, i = \,N , представленную в виде расширенного век-
тора
иТ=(иГ,ит,...,ит).
(11.3)
Зависимость / от и проявляется через уравнение (11.1).
Необходимые условия оптимальности в такой задаче заключа-
ются в неотрицательности вариации критерия 6/ (w) = /(£)-/(«),
где й — любое допустимое управление
5/(а) 2*0.
(Н.4)
В частности, полагая й. = при j * I, а uf *и., условие (11.4)
представим в виде совокупности условий
5/.(ы)>0, / = 1Л,
(Н.5)
где под 8/, понимается вариация критерия / за счет вариации уп-
равления только в момент времени i.
Вообще говоря, условие (11.4) или совокупность условий (11.5)
для моментов / - 1,N представляет собой необходимые условия оп-
тимальности в достаточно общем виде. Использование их непосред-
ственно затруднительно, так как они не дают конструктивного ал-
горитма определения искомого управления.
Преобразуем эти условия к более удобному виду. С этой целью
зададим допустимое управление й в виде
й = « + еб«е{/,
где в ~ сколь угодно малое неотрицательное число; — допусти-
мое направление изменения управления; e5w — допустимая вариа-
214
ция управления; U — допустимое, множество, представляющее со-
бой прямое произведение множеств Up i =
Из условия (11.4) следует, что
Переходя к пределу при е -> 0, получаем
Эй
гпр
где^Г
— вектор частных производных критерия по всем ком-
понентам вектора и.
Полагая, что duj = 0 для всех j * i и 5й. * 0, получаем сово-
купность необходимых условий оптимальности для различных мо-
ментов времени
. 5и >0, i = l,N,
Ьи,
(И.6)
е
справедливых при любых допустимых Ьи., т.е. удовлетворяющих ус-
ловиям ц + £5й, € U{.
Преобразуем условия (11.6), раскрыв производные
Э/(й) п ж
—. Диф-
ди(
ференцируя критерий (11.2) с учетом уравнений (11.1), можно за-
писать
Э/(й) _ ) dF(X;y+i)
э«,. Эи,. Эх/+| " dxN+i
215
или, вводя формально обозначения
V/ =
(H.7)
более компактно
Э/(»)_Э/(х,,и,.)
Эи,. Эи,. V,+1
(Н.8)
(11-9)
(11.10)
Если теперь ввести в рассмотрение понятие гамильтониана
Ht (v,+1,xpu,.) = уГ+1/ (Xpuj,
то выражение (11.8) может быть представлено в виде
Э/(и) _ ЭЯ,.(у|Ч[ х,.,и,.)
d«f. Эм.
а необходимые условия оптимальности (11.6) в виде
ЭЯДу x,,u,.f , = ^
Эм, '
С учетом обозначения (11.9) соотношения (11.7), определяющие
вектор V,, а также исходные уравнения (11.1), могут быть приведе-
ны к следующей канонической форме:
ЭЯ,(у/+1,х,м.)
х _—с ли х задано;
(П.Н)
(11.12)
Эх/ + 3xw+1
216
Вектор V/, удовлетворяющий системе (11.12), в дальнейшем бу-
дем называть сопряженным вектором.
Таким образом, необходимые условия оптимальности в задаче
управления системой (11.1) с целью достижения минимума крите-
рия (11.2) заключаются в выполнении системы неравенств (11.11) с
учетом уравнений (11.12).
В общем случае непосредственное использование этих условий
для решения задачи программирования оптимального управления
затруднительно. Однако нетрудно заметить, что соотношение (11.10)
справедливо для любого фиксированного (не обязательно оптималь-
ного) управления. Поэтому оно может быть успешно использовано
при получении оптимального решения с помощью численных ме-
тодов математического программирования, так как позволяет при
фиксированном управлении с помощью одного просчета по уравне-
ниям (11.12) определить сразу все компоненты вектора градиента
Само же условие (11.11) в этом случае целесообразно использовать
лишь для проверки решения, претендующего на оптимальность.
В некоторых частных случаях необходимые условия оптималь-
ности могут быть приведены к более конструктивной форме. Рас-
смотрим два таких широко распространенных случая.
1. Оптимальное управление является внутренней точкой обла-
сти Uv Это возможно, например, когда на и. никаких ограничений
не накладывается. В этом случае любые векторы Щ являются до-
пустимыми, в том числе и векторы, имеющие противоположные зна-
ки. Поэтому для выполнения условия (11.11) необходимо выполне-
ние строгого равенства
э«.
(11.13)
2. Множество Ц выпукло, и гамильтониан Н. — выпуклая по
Uj функция. В этом случае каждое условие (11.11) является факти-
чески необходимым и достаточным условием достижения гамиль-
тонианом своего минимума по wf:
217
Я,('И,+рЛ>"г) = ™пЯ,('1',+1,*,>И;), i = KN- (1114)
Необходимые условия оптимальности в форме (11.14) будем на-
зывать дискретным принципом минимума.
Заметим, что если бы вектор V>v+i в (11.7) определить следую-
щим образом
дхЛГ+1
(11.15)
то в силу изменения знака в соотношениях (11.10), (11.5), (11.11)
вместо (11.14) получим более известный принцип максимума:
тахЯ,(у,+|,х,' = (11.16)
Упражнение 1. Показать, что производная
Э/(м)
дг
функции J(u) по лю-
бому направлению г в точке и, определяемая соотношением
ЭЛи)_ИтДИ+£г)-/(^)^
дг е-»0 £
вычисляется по формуле
<Щи) = dJ(rf г
дг дг
(11.17)
Упражнение 2. Показать, что производная вектор-функции /(у(х))
векторных аргументов у и х по вектору х может быть в матричном виде
представлена следующим образом:
tf = dydf
дх дх ду ’
Э/ Эу df -
где через — обозначены матрицы соответствующих размерностей,
Эх Эх ду
сформированные по правилу
218
Упражнение 3. Показать, что производная скалярной функции
Н -у7" f (и), где у, f — векторы, по вектору и вычисляется по формуле
ЭЯ Э/
эГэ^
Упражнение 4. Показать, что в задаче управления системой (11.1) с
целью минимизации критерия (11.2) при дополнительном векторном ог-
раничении на конечное состояние вида
£(*jv+i) = O
(11.18)
полученные необходимые условия оптимальности — в общем случае это
соотношения (11.11)—(11.12) — сохраняются с точностью до определения
вектора > который теперь, в отличие от (11.12), запишется как
_ал(^+1) ъЫ
Vw.i —т-----+-Т-—А-
<"Qv+l ОХ//^
(11.19)
Здесь X — вектор множителей Лагранжа, подлежащий определению из ус-
ловия
g{xN+i) = 0.
Упражнение 5. Показать, что в задаче управления системой (11.1) с
целью минимизации критерия
^ = £/о/(*л)+^(*лм)
/=1
(11.20)
полученные необходимые условия оптимальности, например (11.11) и
(11.12), сохраняются с точностью до определения самого гамильтониана,
который теперь будет иметь вид
fii(WM.Xi,Ui) = f0l(xl,ul)+\VT+lfl(x,.,ul). (11.21)
219
Упражнение 6. Составить алгоритм численного решения задачи про-
граммирования оптимального управления системой (11.1) с использованием
одного из градиентных методов поиска, например метода наискорейшего
спуска.
11.2. Оптимизация однопараметрической коррекции
Для иллюстрации возможности применения полученных необ-
ходимых условий оптимальности рассмотрим решение задачи о
выборе оптимальной программы проведения коррекции космичес-
кого аппарата, постановка которой была дана выше. Задача состоит
в определении последовательности управлений {ц.}, i = \,N систе-
мой
xi+l=x,. + B,«,., 1=1Л-
обеспечивающей минимум критерию J = х^+1 при ограничении
Компонента jq считается заданной.
Учет ограничения в данной задаче проведем с помощью мно-
жителя Лагранжа, переходя к новому критерию
j = a^+x2r+1,
I
определяя впоследствии множитель а>0 из условия
Z“?=«x-
i
Составим гамильтониан для полученной задачи:
Я,.=ац?+у,+1(х,+Д.«,.).
Так как условия выпуклости выполнены, то с учетом (11.21) не-
обходимые условия оптимальности принимают форму принципа ми-
нимума (11.14):
220
Hi = min [au? + \xi + Biui)], / = 1,TV,
откуда находим и. - —.
za
Согласно (11.12) устанавливаем, что сопряженная переменная
V, = = Vf+i постоянна и находится как у, = у N+{ = 2%^ .
Поэтому оптимальное управление имеет вид
a
Установим связь конечного промаха xN+i с множителем a . С
учетом найденного управления нетрудно получить
хлм = xi X А2
или
a
Тогда оптимальное управление принимает вид
Д|Х|
“+ЕДГ
Это выражение с точностью до константы (множителя a) и дает
решение поставленной задачи по определению оптимальной про-
граммы проведения коррекций.
Как указывалось выше, множитель а должен быть определен
из условия = Mj., которое легко сводится к следующему уравне-
/
ниюотносительно а:
221
—‘—Y=«r
<х+5Х2
к J
Заметим, что при решении задачи неявно предполагалось, что
моменты проведения коррекций или, что то же самое, коэффици-
енты В. заданы. Получив решение при фиксированных В. и уста-
новив зависимость критерия оптимальности от этих коэффициен-
тов, можно поставить задачу и об определении оптимальных момен-
тов проведения коррекции. Эта задача является классической зада-
чей математического программирования и может быть решена с ис-
пользованием соответствующих методов.
Упражнение 1. Решить рассмотренную выше задачу оптимизации про-
граммы проведения однопараметрической коррекции без привлечения
принципа минимума, сведя ее предварительно к классической задаче ма-
тематического программирования. Показать, что решение задачи по ми-
нимизации нового критерия J с последующим выбором множителя а из
условия ^и} - их одновременно является и решением поставленной зада-
/
чи, т.е. задачи минимизации исходного критерия J при ограничении
Упражнение 2. Решить задачу программирования оптимального управ-
ления двумерной системой
х/ч=х,+2«,; __
Лн =Х-^+“Л < = UV
из условия обращения в минимум критерия J = -»+1 при ограничениях
|м,| <5 и граничном условии Х] = 3, и = 0 , полагая N = 2 .
Показать, что применение принципа минимума (максимума) в дан-
ной задаче приводит к неправильному результату. Почему?
11.3. Необходимые условия оптимальности.
Непрерывный случай
Перейдем теперь к рассмотрению задачи программирования
оптимального управления непрерывной системой. Начнем с задачи
управления системой
222
x = /(*,w)
(11-22)
на интервале te [О,Г] при наличии ограничения ugU , накладыва-
емого только на управление.
Заметим, что при рассмотрении непрерывных систем всюду
предполагается, что управление u(t) принадлежит к классу кусоч-
но-непрерывных функций. Другими словами, считается, что управ-
ление и(0 может иметь конечное число точек разрыва. Цель управ-
ления состоит в минимизации критерия конечного состояния
/ = Ф(Т)]. (11.23)
Как и прежде, начальное состояние х(0) = х0 считается извест-
ным. Момент окончания процесса управления Т пока тоже будем
считать заданным. Пусть u(t) — искомая оптимальная программа
управления. С целью получения необходимых условий оптимально-
сти дискретизируем задачу, перейдя к следующему конечно-разно-
стному аналогу системы (11.22):
хм = х.+Д/(х.,«.), / = 0Л. (11.24)
Здесь Д — шаг дискретизации, сколь угодно малая величин; хр uf —
вектор состояния и вектор управления в момент ; момент tN+l со-
впадает с моментом Т.
Критерий оптимальности (11.23) перепишем в виде
/ = Л^+1), (11.25)
а ограничение на управление u(/)e U — в виде u^U., i = О, N .
Формально для полученной задачи в соответствии с вышеска-
занным имеют место следующие необходимые условия оптималь-
ности:
223
ЭЯ‘(у,ч„х,.,Ч)Г8ц s0; , = —
du,
(1126)
где
Я'=уГ+|[х(+^(х/>Ч.)]; (11.27)
d/(x,u) ЭГ(хлг+|)
У,=%+1+А V,+i> ^' = Эх„", ’ (1L28)
х(+|=х,.+Д/(х,.,и,.);
и{ + e5w, е Ur
(11.29)
Прежде чем осуществить обратный предельный переход при
ДчО в соотношениях (11.26)—(11.29), установим связь между ва-
риацией управления eSw, =«, -w, в момент i и вариацией фазового
вектора Ьх. в последующие моменты времени j > I.
Согласно (11.24) можно записать следующее уравнение в откло-
нениях, описывающее эволюцию вариации :
s s a dfT
8ху+1=8ху + Д-2-Эх,.. (1130)
Граничное условие для этого уравнения имеет вид
Ц+1 =д[/(х,(11.31)
Нетрудно убедиться, что скалярное произведение вектора 5ху и
сопряженного вектора V7-, образуемого в соответствии с (11.28),
представляет собой постоянную величину при любых j>i. Действи-
тельно, согласно (11.30)) и (11.28)
224
г ~\Т
т- .Sf(Xl>Ui) с Т г
Vj4 = ул,+Д *Ч+| Ц=УУ+1Ч+Г
Но так как для момента j = N +1 это произведение определяет
вариацию критерия оптимальности (11.25) за счет вариации управ-
ления в момент /, т.е.
= Э**+1 = Ч’ (Н.32)
°XN+\
то в соответствии с необходимым условием оптимальности (11.32)
получаем
8Zy=vj5xy>0 (11.33)
при любом j>i. В частности, при j = i+1 соотношение (11.33) с
учетом (11.31) принимает вид
<i [/(*/>",) )] s °- (И-34)
Полученное соотношение справедливо для любого й, е Ui и
любого момента i = Q,N. Введя новое, в отличие от выражения
(11.27), обозначение для гамильтониана
(Н-35)
условию (11.34) можно придать следующий вид:
(ч+1> = Я, (v/+1.x,(11.36)
Таким образом, для системы (11.24) при малых значениях шага
с точностью до членов первого порядка малости дискретный прин-
цип минимума в отношении гамильтониана (11.35) справедлив не-
225
зависимо от свойств гамильтониана и допустимого множества Ui,
как это было в дискретных системах общего вида.
Осуществим теперь предельный переход во всех соотношениях,
определяющих необходимые условия оптимальности. Для этого ус-
тремим интервал дискретности Д к нулю. В результате уравнение
(11.24) примет вид исходного уравнения (11.22), которое при опти-
мальном управлении определит теперь оптимальную траектории*
движения
х = /(х,м) (11.37)
при условии
х(О) = хо. (11.38)
Конечно-разностное уравнение (11.28) перейдет в дифференци-
альное
(11.39)'
дх
с граничным условием
v(r).M („.«>
оХ
Необходимое условие оптимальности управления (11.36) имеет
вид принципа минимума
Я(у,х,«)=ттЯ(у,х,1/), (11.41)
где
Н (v,x,u) = \|/r f (x,w). (11.42)
Как и в дискретном случае, систему (11.37)—(11.40) можно пред-
ставить в каноническом виде:
226
ЭН (у,х,и)
*=-----*(°) = *0; (11.43)
дН(у,х,и) ЭЛ [х(Г)~] ..
у =----------z, v(F)= t < (11.44)
ОХ 0Х
Заметим, что если в граничном условии (11.40) изменить знак
на обратный, т.е. принять
<„.«>
' дх
то условие оптимальности (11.41) примет вид широко известного
принципа максимума:
H(y,x,u)=maxff (у,х,й), (11.46)
сформулированного впервые Л.С.Понтрягиным и носящего поэто-
му его имя.
Для отыскания оптимального управления и на основе принци-
па минимума (максимума) необходимо решить краевую задачу
(11.43)—(11.44) при управлении, удовлетворяющем в каждый момент
времени условию (11.41).
Упражнение 1. Показать, что в задаче оптимизации управления систе-
мой (11.22) из условия минимума критерия
/ = }/0(х,«)Л+ф(Т)]
о
(задача Больца) необходимые условия оптимальности (11.41)—(11.44) со-
храняются с точностью до определения гамильтониана, который теперь при-
нимает следующий вид:
Я(х|/,х,«) = /0(х,«)+уг/(х,1/). (11.47)
Упражнение 2. Показать, что в задаче оптимизации управления систе-
мой (11.22) из условия минимума критерия (11.23) при дополнительном
ограничении на вектор конечного состояния вида
227
4*(n]=o
(11.48)
необходимые условия оптимальности (11.41)—(11.44) сохраняются с точ-
ностью до определения вектора у(7), который имеет вид
(||4„
Эх Эх
Здесь X — вектор множителей Лагранжа, удовлетворяющий условию
(11.48).
Упражнение 3. Показать, что в задаче оптимизации системы (11.22) с
критерием
т
1 = jfo(x,u)dt (11.50)
о
(задача Лагранжа) краевые условия, связанные с компонентами сопряжен-
ного вектора w(T), имеют вид:
уу(7) = 0, если Xj(T) свободно;
\|/? (Т) — свободно, если Xj(T) задано.
Упражнение 4. Показать, что гамильтониан на оптимальной траекто-
рии постоянен, т.е. для всех te [0,7]
Я(у,х,м) = const. (11.51)
Упражнение 5. Показать, что если время окончания управления Тсво-
бодно, то гамильтониан на оптимальной траектории тождественно равен
нулю:
Я(у,х,«)-0 для всех/е [0,7]. (11.52)
11.4. Оптимальное управление при вертикальном спуске
Рассмотрим теперь применение необходимых условий оптималь-
ности к решению задачи программирования оптимального управле-
228
ния летательного аппарата при вертикальном спуске на безатмос-
ферную планету. Как указывалось выше, математически задача сво-
дится к определению такого управления и (/), которое обеспечивает
перевод системы
си
х}=и, х2=ху x^---g
п
из состояния {jq (О) = -я?о, x2(0) = Aq, х3(0)=/Ц в состояние
{%! (Г), х2(Г) = 0, д^(Т) = 0} с учетом ограничения 0<и<ит при ми-
нимальном значении критерия J = х1(Т).
Составим гамильтониан для данной задачи:
И = vtu + - v3 — - V3£ = Qu + VjX, - v3g,
X1
где G = Vi“Y3 —•
Из условия минимума Я по и находим, что оптимальное управ-
ление имеет вид
О, если Q>0;
и , если Q < 0;, . .
” г* '
любое из диапазона [0,wm], если 0=0 на
некотором конечном интервале времени.
Каноническая система уравнений (11.43)—(11.44) и соответству-
ющие краевые условия принимают вид:
х1(О) = -то;
х2=х3, х2(0) = Л^, х2(Т) = 0;
229
х3(О) = Ло> ^(T) = 0;
Л|
ЪН суки -
vi=“^7=“4“, ^(П=1;
axi Ai
ьн
y2 =---= о, т. е. у2 = const;
Уз = -т- = - V2. т- е' V3 = V3(0)-V2'-
°хз
Получили краевую задачу, для которой в начальный момент
времени t = 0 заданы компоненты хр х^ х3, а в конечный момент
t = Т — компоненты х,, V]. Для определения неизвестного заг
ранее времени спуска Гможет быть использовано условие (11.52),
которое в .данном случае принимает вид
Я(Г) = 0«(Т)-у3(Т)£ = 0.
Перейдем к анализу необходимых условий оптимальности.
Начнем с вопроса существования так называемого особого уп-
равления, т.е. случая, когда функция Q обращается в нуль на неко-
тором конечном интервале времени, и поэтому оптимальное управ-
ление не может быть найдено непосредственно с помощью принци-
па минимума.
Предположим, что Q = 0 на некотором конечном интервале вре-
мени [Zj,/2]€[O,T].Тогда для всех
0=ф)-^+^Л=0,
откуда у2 = 0 для всех ^[/j,/2]. Но у2= const для всех /е [0,Г],
следовательно, у2 = 0 для всех te [0,7]. Это приводит к условию
230
0=0 и 0 = 0 для всех te [0,Т] . Но из условия H(T) = -y3(T)g = 0
получаем 1|г3(Г) = 0 , что, в свою очередь, дает Q(T)=у1(Т) = 1 . А
это противоречит исходному предположению, что 0 = 0.
Таким образом, показано, что Q не может обращаться в нуль на
конечном интервале времени, а следовательно, особого управления
в данной задаче не существует. Поэтому оптимальное управление
принимает вид
[0 при 0>О,
и = <
при 0<О.
Момент изменения знака Q соответствует мгновенному пере-
ключению оптимального управления и с одного предельного значе-
ния на другое. Нетрудно убедиться в том, что функция 0(f) моно-
тонная. Действительно, 0 =—L, V2= const, а х1(/)<0. Поэтому
Xj
производная Q знака не меняет. Формально возможны четыре слу-
чая:
1) 0>О для всех /е [0,Т];
2) 0<О для всех /е[0,Т];
3) 0>О для всех Ге[(Ц]; 0<О для всех /е ;
4) 0<О для всех Ге[(Ц]; 0>О для всех te ррГ].
Здесь через tx обозначен момент изменения знака Q.
Из физических соображений ясно, что только во втором и тре-
тьем случаях возможно решение задачи, так как только в этих слу-
чаях моменту, непосредственно предшествующему соприкосновению
ЛА с поверхностью, соответствует ненулевое управление, 0(Т)< 0.
Поскольку третий случай включает в себя как частный второй слу-
чай, достаточно рассмотреть только третий. Таким образом, в об-
щем случае программа оптимального управления заключается в том,
что до некоторого момента времени Z, управление отсутствует, а на-
231
чиная с момента оно равно своему максимальному значению ит
(двигатель работает с максимальной мощностью). Это и есть опти-
мальный режим работы двигательной установки, обеспечивающий
минимум расхода топлива. Остается найти момент и общее время
движения Т. Для этого можно не решать полностью систему кано-
нических уравнений. Достаточно проинтегрировать уравнения дви-
жения ЛА при найденном оптимальном управлении. Нетрудно по-
казать, что в результате получим следующие соотношения для ком-
понент вектора конечного состояния [16]:
Х1 (^) = Х101) + ит (Т ~ h )’
ит L М'1Г И L J
^(7’)=xJ(/,)-g(T-r1)-dn 1 + 2^(Г-6)
причем
at2
*з ('1) = х3 (0) - gt,; Xj (г,) = х2 (0) + Хз (0),, --J-; х, (/,) = х, (0).
Приравнивая х2(Т’) = 0 и х3(Г) = 0, получаем два уравнения.
Таким образом, краевую задачу в данном случае удалось свести к
системе двух уравнений относительно г, и Г, решение которой мо-
жет быть получено известными методами.
77.5. Перевод космического аппарата в заданную точку.
Линейные системы, оптимизируемые
по квадратичному критерию
Рассмотрим задачу перевода космического аппарата, находяще-
гося вблизи круговой орбиты с известными параметрами, в некото-
рую заданную точку этой орбиты. Предполагается, что на аппарате
232
имеется двигательная установка, способная создавать управляющее
ускорение и вдоль трансверсали к траектории.
В качестве исходных уравнений движения рассмотрим уравне-
ния в полярной системе координат [18]:
г-г02 =-^-;
г <1153)
г0+2г0 = а,
где г, 0 — полярные координаты; к3 — гравитационная постоянная
Земли.
Принимая, что движение аппарата происходит вблизи круговой
ЛГ
орбиты с радиусом г0 = 31—у , где w0 — угловая скорость обращения,
Ywo
wo =V"’ Го — период обращения, линеаризуем уравнения (11.53)
'о
относительно параметров этой круговой орбиты. Получим следую-
щие уравнения относительного движения:
Дг = 3wq Дг + 2и>огоД0;
Дё=-2^Дг+1«. (И-54)
го го
Здесь Дг = г - г0, Д0 = 0 - 0О = 0 - wor. Предполагется, что отклонения
Дг, Д0 малые.
Введем новые обозначения:
= Дг > ' 0 1 0 0 > <° >
х2 = Дг 3wo 0 0 2woro 0
х = Xj =Д0 0 0 2wn 0 1 0 1 • (11.55)
0 о го 0 0
233
Тогда уравнения (11.54) могут быть представлены в виде
х = Ах + Ви.
(11.56)
Начальное состояние считается заданным, поэтому и вектор
х(О) = хо задан. Для простоты рассмотрим задачу выбора програм-
мы оптимального управления, обеспечивающей выполнение усло-
вия х(Т) = 0. В качестве критерия оптимальности примем интеграл
от квадрата управляющего ускорения
т
J = J u2dt,
о
(11.57)
характеризующего энергетические затраты, которые необходимы для
осуществления маневра перевода. Заметим, что при использовании
электрического реактивного двигателя минимизация критерия (11.57)
обеспечивает минимизацию расхода топлива.
Таким образом, математически ставится задача выбора такого
и (/), которое обеспечивает перевод системы (11.56) из заданного на-
чального состояния х0 в конечное состояние х(Т) = 0 при мини-
мальном значении критерия (11.57).
Для решения задачи вновь воспользуемся необходимыми усло-
виями оптимальности. Согласно (11.47) гамильтониан имеет вид
Н=и2 + ут(Ах + Ви). (11.58)
Минимизируя Я по ц, находим структуру оптимального управ-
ления
и = ~Вгуг.
(1159)
Нетрудно убедиться в том, что особого управления в данной
задаче не существует.
234
Каноническая система уравнений (11.43) и (11.44) принимает вид
х = Лх-^Мгу, х(О) = хо, х(Г) = 0, ф = -^ = -Лг\|/- (11-60)
2 дх
Получили краевую задачу для системы линейных дифференци-
альных уравнений. Ее можно решить до конца, если воспользовать-
ся понятием фундаментальной матрицы. Введем обозначения
'а\-^ввт '
2
0 \-Аг
Тогда систему (11.60) можно представить более компактно:
* = Ах. (11.61)
Пусть Ф(м0) — фундаментальная матрица этой системы, т.е.
ф(м0)=Лф(/,/0), ф(ц>/,
где I — единичная матрица.
Тогда общее решение системы (11.61) может быть представлено
в виде
х(О=Ф(<,/о)х(/о),
или в развернутой форме
х(0 = Ф|, (ЧМ'о)+Ф12 ('>'o)v('o);
*(О = Ф21(Мо)Х('о)+Фн(ЧМ4|)> (11'62)
где через Ф,,, Ф12, Ф21, Ф22 обозначены соответствующие блоки фун-
даментальной матрицы Ф (Мо). Полагая tQ = 0, t = Т и учитывая, что
х(О) = хо, х(Т)=.О, получаем Фп(Т,О)хо +Ф12(Т,0)у(0) = 0 ,откуда
235
у(0) = -Ф|2(Т,0)-1Ф11(7-)0)хо. (11.63)
Предполагается, что Фп (Г,О)'1 существует. Тогда в соответствии
с (11.62) находим
х(/) = [ф„ (ЛО)-Ф|2 (/,0)Ф12 (Т.0)-' Ф„ (Т.О)]^;
v(') = [ф21 ('.0)-фи (<>0)Ф|2 (Т.О)-' Ф„ (Г,О)]хо.
Искомая программа оптимального управления согласно (11.59)
окончательно принимает вид
« (')=-\вт [ф21 «>О)-Ф22 (6О)Ф12 (Г.О)-1 Ф„ (Т.О)]^.
Упражнение 1. Получить линеаризованные уравнения относительного
движения (11.54).
Упражнение 2. Найти оптимальную программу управления u(t), ко-
торая обеспечивает перевод системы общего вида
х = Ах+ Ви
из состояния х(0) в состояние х(Т) при минимальном значении крите-
рия
т
J = j(xTQx+uTWu)dt,
о
где х, и — векторы; А, В, Q,W— заданные матрицы, зависящие от времени.
Возможно ли существование особого управления в данной задаче? При
любой ли матрице Wсуществует оптимальное управление?
11.6. Спуск с максимальной боковой дальностью
В качестве еще одного, теперь уже более сложного, примера ис-
пользования необходимых условий оптимальности рассмотрим за-
236
дачу об управлении летательным аппаратом с целью достижения
максимальной боковой дальности на этапе спуска на Землю.
Уравнения движения запишем в виде [41]:
v = gsmO; т (11.64)
g=rcosY_r£_vYose. mv Rj (11.65)
h = vsinO; (11.66)
У sin у v w = 1 -cosOcosytgip; mvcos0 R (11.67)
v ф =—cos 0 sin v; (11.68)
x=2Lcose^. R совф (11.69)
Здесь v — скорость движения; 0 — угол наклона вектора скорости
к плоскости местного горизонта; V — угол курса; h — высота поле-
та; Ф — геоцентрическая широта; X — геоцентрическая долгота; X—
сила лобового сопротивления; Y — подъемная сила; g — ускорение
свободного падения; т — масса аппарата; Y — угол крена.
Для простоты будем считать, что диапазон высот, в котором
рассматривается спуск аппарата, мал по сравнению с радиусом Зем-
ли. Поэтому можно считать g « const, R « const.
С целью дальнейшего упрощения уравнений движения примем
так называемую гипотезу о квазистационарном режиме полета, при
котором предполагается 0 = 0. Кроме того, пренебрежем составля-
ющей gsinO в уравнении (11.64), считая силу лобового сопротивле-
ния определяющей в этом уравнении.
237
Тогда из уравнения (11.65) находим выражение для подъемной
силы:
(11.70)
Переходя к аэродинамическому качеству к = — и учитывая
(11.70), уравнения (11.64), (11.67) приводим к виду
v
xilcose-
kcosy
(11.71)
fl V2
V
I VCOS0A
tgy-----— tgcpcosy.
(11.72)
В качестве управляющих параметров примем угол крена у и
аэродинамическое качество к. Из физических соображений ясно, что
эти параметры должны удовлетворять следующим ограничениям:
0<кн<к<кв, 0<|т|:£ул^. (11.73)
Рассмотрим задачу о достижении максимальной боковой даль-
ности при начальном движении из плоскости экватора: решение этой
задачи позволяет оценить предельные маневренные возможности
такого аппарата. Итак, критерий оптимальности, полежащий мини-
мизации, имеет вид
У = -Ф(Т).
(11.74)
Будем считать, что в начальный момент времени t = 0 фазовые
переменные аппарата v(0), 6(0), Л(0), у(0), <р(0), 1(0) заданы.
238
В конечный момент времени t -Т задана лишь высота Л(Г). Вре-
мя Тсчитается свободным. Для решения задачи обратимся к необ-
ходимым условиям оптимальности. Гамильтониан в данном случае
имеет вид
где
(11-75)
(11.76)
. Л VCOS0^ VCOS0 . VCOS0COSW
с = v3vsin0-у4 —— tg<pcosy+у5 ——sin y+y6 —~“
Л A A COS (p
Здесь Vj - — сопряженные переменные, соответствующие фазо-
вым переменным v, 0, h, у, ср, Л..
Так как время Г свободно, то согласно (11.52) гамильтониан
вдоль всей оптимальной траектории равен нулю: Н— 0. Сопряжен-
ные переменные согласно (11.44) и с учетом Я= 0 удовлетворяют
следующей системе уравнений:
у1 =
ЭЯ
dv
Эе 1 dbt. с
— ~-------+ —- tgy + —
dv к cos у dv v
vAAcosy 1 V2 4
y3 = —— = 0, y3 = const,
oh
ЬН 1
= -V4<ptg<p - v5icos<p + v6<i>——;
o\|Z COS(p
дН 1 dZf
=-^=V4^-v‘Xtg<₽: '*'«=-эГ=0’ =const-
(11.78)
(11.79)
239
Специфика уравнений (11.78) и (11.79) с учетом v6 = const по-
зволяет получить два первых интеграла. С этой целью умножим
(11.78) на co%s<p, а (11.79) — на sinX, сложим их и перенесем
все в левую часть. В результате получим
1=0.
Следовательно,
cosX . Л
V4 + V5 sin X + cos Xtgcp = const = c4. (11 #80)
Если уравнение (11.78) умножить на s’n^coscp» а (П-79) на
-cosX , сложить их и перенести все в левую часть, получим анало-
гично
d (cosX . \
ЛI +Vs s,nI V(S cosx 8Ф
d (sinX .
----y-Xj/COSX
coscp 4 5
V6 sin Xtgcp =0,
откуда
- V5 cos X - у6 sin Xtgcp = const *=с5. (11.81)
Из уравнений (11.80) и (11.81) нетрудно получить выражения
непосредственно для сопряженных компонент V4, v5:
у4 = (с4 cos X+с5 sin X) coscp - у0 sin ср;
\|/5 =c4sinX-c5cosX.
Учитывая граничные условия у4 (7) ~ 0, у5 (7) = -.1, у6 (Т) = 0»
окончательно получаем
240
у6 =0, V4 =sin(X-X,r)cbs(p, \|/5 =-cos(X-A.r), (11.82)
где Хг — долгота аппарата в конечный момент времени.
Таким образом, сопряженные переменные у4, \|/5 полностью оп-
ределяются фазовыми переменными ср, X.
Для выявления структуры оптимального управления обратимся
к минимизации гамильтониана (11.75). Так как зависимость Нот к
при любых значениях у монотонна, то оптимальное значение аэро-
динамического качества (при а * 0) находится как
{кн, если л<0;
.в п (11.83)
кв, если л>0.
Характер зависимости Нот у определяется значениями коэф-
ЬН
фициентов а и Ь. Из анализа условия = 0 следует, что гамильто-
Эу
ниан Н может принимать экстремальное значение только в одной
точке, определяемой соотношением
• ^ykf , -. —. _
smy=—-. (11.84)
а
Анализируя возможные варианты сочетаний коэффициентов а
и Ь, приходим к следующему выражению для оптимального значе-
ния угла крена:
. Ьк Ьк
-arcsm— при а> -—„ ;
a sin у"
-y*sign/> - в остальных случаях.
(11.85)
Из выражений (11.83), (11.85) и с учетом (11.76) следует, что для
определения оптимальной программы управления формально необ-
241
ходимо знание всех сопряженных переменных. Однако использова-
ние равенства гамильтониана нулю на всей оптимальной траекто-
рии позволяет существенно упростить структуру найденного управ-
ления. В частности, из условия Н- 0 следует, что вместо неравен-
ства а > 0 (а < 0) можно рассматривать неравенство
Z>tgy+c<0 (Z>tgy+c>0),
вместо условия (11.84) можно рассматривать условие
, b
tgy=-.
с
Наконец, можно показать, что при Н= 0 условия
(11.86)
(11.87)
а> Ьк и И с<-7я tgr
sin у*
(11.88)
оказываются эквивалентными [41].
Удобнее пользоваться условиями (11.86)—(11.88), поскольку в
них отсутствует параметр а, а следовательно, и сопряженная пере-
менная Vj. Поэтому отпадает необходимость и в исследовании урав-
нения (11.77). С учетом (11.86)—(11.88) структура оптимального уп-
равления может быть представлена в следующем виде:
{кн при Zrtgy+oO;
кв при Zrtgy+c<0,
(11.89)
-y5signZ) при с>-
b
tg7e
arctg- при с<-
(11.90)
где параметры b и с согласно (11.76), (11.82) определяются соотно-
шениями
242
v cos 0 г п (11-91)
с = vy3 sin 0-----~— [sin cpcos \|/sin (X - Xr )- sin у cos (X - Xr )J.
В полученных выражениях неизвестными являются два парамет-
ра: и Хг. Таким образом, проведенное исследование позволило
в рассматриваемой задаче не только выявить структуру оптималь-
ного управления, но и свести ее к двухпараметрической краевой
задаче по отношению к параметрам V3 и , не прибегая вообще
к системе сопряженных уравнений. Подбор этих параметров необ-
ходимо осуществлять численно.
Упражнение 7. Показать, что в рассматриваемой задаче режим особого
управления, соответствующий случаю я = 0, отсутствует.
Упражнение 2. Показать, что минимизация гамильтониана (11.75) по
Y с учетом ограничения (11.73) приводит к выражению (11.85). Получить
выражение (11.87).
Упражнение 3. Показать эквивалентность неравенств в (11.88).
12. ВЫРОЖДЕННЫЕ ЗАДАЧИ.
ОСОБОЕ УПРАВЛЕНИЕ
В общем случае под вырожденной задачей понимают такую, в
которой минимизация (максимизация) гамильтониана по управле-
нию не позволяет получить определенного выражения для оптималь-
ного управления. Тем не менее, оптимальное управление, которое в
данном случае называется особым, может существовать. Покажем,
как можно получить необходимые условия для отыскания такого
управления. Начнем с рассмотрения конкретного примера.
12.1. Запуск метеорологической ракеты
Пусть требуется осуществить вертикальный запуск метеороло-
гической ракеты на заданную высоту при заданном запасе топлива с
243
наибольшей скоростью. Уравнения движения ракеты могут быть
записаны в следующем виде:
A = v, у = fP —-g(A), m = -p, 0<p<pOT,
m
где h — текущая высота; v — скорость полета; tn — масса ракеты;
р — секундный расход топлива; с — удельный импульс; ср — тяга;
g — ускорение свободного падения; X — сила аэродинамического со-
противления.
Граничными условиями задачи являются следующие:
А(0) = 0, v(0)=0, /и(0) = /по, й(Г) = Аг, т(Т) = тт,
Шр, тц, nip, hp — заданные величины; Гсвободны.
Критерий оптимальности имеет вид
J = -v(T).
Необходимо найти такую программу управления р(/), которая
обращает критерий в минимум. Составим гамильтониан для данной
задачи:
Я = v g+_
i tn
1+I£v2-v3 p=p+op.
i I tn J
где
n ( X Л
p=vv - g+_ v e=^._v
у m j tn
Оптимальное управление в соответствии с (11.41) имеет вид
р=
о, е>0;
₽m,e<o;
Рж, 0 = 0 при
244
Сопряженные переменные Ур у2, Уз удовлетворяют уравнени-
ям
Vi =-
ЭЯ
ЭЛ
ЭЯ Ху . ЭЯ <$-х
где введены следующие обозначения:
_Э$ у _Э% у Ж
g* ЭЛ’ * ЭЛ’ v 9v
Рассмотрим вопрос о возможности существования и определе-
ния особого управления р^. Поскольку для особого управления на
конечном интервале времени [^Д2]
Q=^V2-V3=0’
на этом интервале имеет место и равенство
^V(+^(cXv+X)V2=0.
Кроме того, в силу условия (11.52) получаем дополнительное
условие
? = VVI- g+— V2= 0.
I т )
Систему полученных линейных относительно компонент
, у2»Уз однородных уравнений можно представить в виде Су = 0.
Здесь
245
о
о
Нетривиальное решение этой системы существует, если опре-
делитель Д матрицы G обращается в нуль, т.е.
А = (v - с)Х - cmg + cvXv = 0.
Последнее равенство характеризует некоторое многообразие, на
котором должна находиться оптимальная траектория в случае осо-
бого управления. Дифференцируя его и принимая во внимание ис-
ходные уравнения движения, получаем
ЭД 3Af сВ- X
ЭЛ ЭуI т
-ЛВ₽=0-
) дм
Откуда
/ v \ эд ЭД
р~ ЭД Эу
с-—т—
Эу дт
Найденное управление может быть особым при условии выпол-
нения ограничения 0 < р £ рт.
Для окончательного решения вопроса о выборе оптимальной
программы управления необходимо провести тщательный анализ
возможных вариантов последовательностей управления, например,
таких, как
Р={М}> ₽={Рт.₽ос.О}. МРпЛРос}-
₽ = {Рое.Рга-0}> ₽ = {РоЛРт}-
246
и других, выбрав из них тот, который, с одной стороны, обеспечи-
вает выполнение граничных условий, а с другой — минимум крите-
рия оптимальности.
Особое управление войдет в окончательное решение лишь в
случаях, когда либо без него невозможно выполнение граничных
условий задачи, либо применение его даст выигрыш по величине
критерия оптимальности.
Предположим, что зависимость X(v,h) имеет вид X = схр—5,
где коэффициент сх не зависит от v и й. Тогда Xv = cxpvS и много-
образие, на котором должна находиться оптимальная траектория
движения при особом управлении, принимает вид
Д = (v - с) сх S - cmg+ссхр v2S = О
или в более компактной форме
avl+bv2=WW
р(Л)
где введены обозначения: а = •—-
2
В координатах —
и v это многообразие представляет собой
кубическую параболу. В зависимости от исходных данных и гранич-
ных условий расположение начальной и конечной точек движения
на плоскости I — ,v j относительно параболы может быть различ-
( Р J
ным. Различными по структуре могут быть и оптимальные реше-
ния.
247
' Упражнение. Показать на плоскости — ,v варианты расположения
I Р J
начальных и конечных точек движения, при которых оптимальной управ-
ляющей последовательностью является либо р = {рт ,0}, либо р = {рт ,0}.
12.2. Необходимые условия особого управления
Распространим рассмотренный подход определения особого
управления на задачу в общем виде, ограничившись наиболее ти-
пичным случаем вырожденной задачи, когда гамильтониан являет-
ся линейной функцией управления. Пусть математическая модель
системы имеет вид
x = /(x)+/>(x)w, х(О) = хо, Ге[0,Т], (12.1)
где х — вектор размерности л; и — скаляр.
Будем считать, что время Т свободно. Требуется найти среди
допустимых такое управление ueU , которое обеспечивает мини-
мум критерию
Z = F(x(r)). (12.2)
Составим гамильтониан
Я = уг/(х) + WTb(x)u. (12.3)
Если допустить, что на некотором конечном интервале време-
ни yrd(x) = 0, то гамильтониан Яна этом интервале не
будет зависеть от и, поэтому оптимальное управление не может быть
найдено из условия (11.41). Предположим, что оптимальное управ-
ление (теперь особое управление) все же существует. Получим до-
полнительные необходимые условия, которым оно должно удовлет-
ворять.
Введем обозначения:
Р = Р(х,у) = уг/(*), (2 = (2(х,у) = утЬ(х). (12.4)
248
Очевидно, для любого /е [/Р4] ПРИ оптимальном управлении
имеют место следующие соотношения:
^.0; £2,0...0.1.2....
dr dr
(12.5)
При v = l, согласно (12.3) и (11.43), (11.44), имеем
dQ
dt
yTb+yT^—x =\|/г
Эх Эх
(12.6)
(12.7)
Сравнивая (12.6) с (12.7), замечаем, что условия(12.5) при v = 1
выполняются автоматически при любом и, если имеет место равен-
ство
угФ! = 0,
(12.8)
где
*1
Эх 7 Эх J
(12.9)
Другими словами, в условиях (12.5) при v = 1 достаточно огра-
dQ п
ничиться лишь условием = 0.
Пусть теперь v = 2. С учетом принятого обозначения (12.9)
= ^ГФ1) = + уГ<1>2 = °’
(12.10)
ЭФ(. эь? . ЭФГ Э/Г
Эх Эх Эх Эх
(12.11)
где
249
Если окажется, что угГ2 не обращается в нуль автоматически,
то соотношение (12.10) позволяет найти управление
Vrr2 ’
(12.12)
которое может быть искомым особым управлением, если оно удов-
летворяет условию ueU.
Однако может оказаться, что угГ2 = 0. В этом случае особое уп-
равление по-прежнему не может быть найдено, так как (12.10) при-
нимает вид
угФ2 = 0.
(12.13)
a d2P Л
Анализируя условие = °» можно получить тот же результат.
Другими словами, при v = 2 достаточно рассмотреть условие
Аналогичный результат имеет место и при любом v. По индук-
ции устанавливаем, что при произвольном v - к должно быть вы-
полнено условие
^ = угГ1Ьи + угФ<. =0, (12.14)
где
г*=-^7д-а7ф*-'’ <1215>
ф‘=^/-^Гф‘-';фо = *- (1216)
ОХ ОХ
250
Если при этом оказывается, ч!о * 0, то из (12.14) находим
управление
которое может быть искомым, если оно является допустимым, т.е.
we U.
Теперь представим себе, что во всех производных, включая
v = л - 2, коэффициенты при и равны нулю. В этом случае составить
следующую систему уравнений относительно вектора:
/гу = 0;
= 0;
Ф.гу = 0;
(12.18)
Ф^2У = 0,
которую можно представить в матричном виде
(?у=0, (12.19)
где
GT =(f,b, Фр Ф2>...,Ф„_2). (12.20)
Система (12.19) может быть решена относительно вектора V,
если матрица G(X) является вырожденной, т.е. если ее определи-
тель обращается в нуль:
A = |G| = 0. (12.21)
Таким образом, если последовательное дифференцирование
функций Q(Jf,y) по времени приводит к системе (12.19), то необ-
ходимым условием существования особого управления является
251
равенство нулю определителя матрицы G. Равенство (12.21) задает в
пространстве X некоторое многообразие, на котором должна нахо-!
диться искомая траектория. Дифференцируя (12.21) по времени к
учитывая (12.1), получаем
= i = [/to+*(*)“]=°> (12.22)
откуда находим управление
(12.23)
которое может быть особым, если оно удовлетворяет условию u&U .
Существуют и другие способы определения особого управления.
С ними можно ознакомиться в работах А.М.Летова [16], В.Ф.Кро-
това и В.И.Гурмана [12], Р.Габасова и Ф.М.Кирилловой [4].
Упражнение 1. Получить соотношения (12.6) , (12.7), (12.10), (12.11).
Доказать справедливость соотношений (12.14)—(12.16).
Упражнение 2. Показать, что для получения необходимых условий су-
ществования особого управления достаточно ограничиться рассмотрени-
dvQ 3VР
ем соотношений -~“ = 0. Соотношения -^- = 0 ПРИ этом выполняются
автоматически.
13. ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ
С ОГРАНИЧЕНИЯМИ НА ФАЗОВЫЙ ВЕКТОР
До сих пор мы предполагали, что на фазовый вектор никаких
ограничений не накладывается. Мы учитывали лишь ограничения
на вектор управления. Теперь перейдем’к изучению более общего
случая, когда оба ограничения оказываются существенными. Будем
рассматривать систему
252
x = /(x,w), Ге [О,Г], (13.1)
полагая теперь, что xg X , u&U , причем множество Хзадано в виде
неравенства
g(x)<0, (13.2)
где g — некоторая заданная дифференцируемая вектор-функция.
В качестве критерия оптимальности, как и прежде, будем рас-
сматривать функцию конечного состояния
J = F[x(T)]. (13.3)
Рассмотрим сначала случай, когда оптимальная траектория пол-
ностью лежит на границе множества X:
g(x)=O. (13.4)
13.1. Оптимальные траектории, лежащие
на границе области
Требуется найти такое управление u(t), которое обеспечивает
перевод системы (13.1) из начального состояния х(О) = хо в конеч-
ное х(Г) вдоль ограничения (13.4) с минимумом критерия (13.3).
Конечно, предполагается, что g(-Xo) = O. Для того чтобы вся опти-
мальная траектория принадлежала границе, необходимо и достаточ-
но, чтобы выполнялись условия
^# = 0, fc = 0,l,...,v для всех Ге [О,Г]. (13.5)
dr
Здесь v — порядок производной функции g, которая содержит в яв-
ном виде управление и.
253
Разобьем систему (13.5) на две подсистемы
g(x) = 0, р(х,и) = 0, (13.6)
одна из которых явно содержит управление и. В общем случае раз-
мерности векторовg и р различны. Заметим, что условия (13.6) мо-
гут быть заданы и непосредственно в исходной задаче.
Получим необходимые условия оптимальности управления и (t)...
С этой целью рассмотрим так называемую «игольчатую» вариацию
управления в момент / = т.
Здесь
"(0=
u (г), 0</<т-е;
любое й(/)еС/, т-е</<т;
е — сколь угодно малая величина, £> 0.
Для определения вариации траектории 6х - x(t) - х(г) при t > т
воспользуемся уравнением в приращениях
8х=^8х+^8и (13.7)
с начальным условием
Поскольку оптимальная траектория полностью должна лежать
на границе g (х) = 0 , то к уравнению (13.7), в отличие от случая без
ограничений на фазовый вектор, необходимо добавить условия,
которыми связаны вариации бх и би. В соответствии с (13.6) име-
ем
« Ърт ~ Л
^-бх+^-би = 0.
Эх ди
(13.8)
254
Исключим 3w из уравнения (43.7) с помощью (13.8). С этой
целью умножим (13.8) слева на некоторую матрицу Х(г) и приба-
вим к (13.7):
Потребуем, чтобы матрица Х(/) обеспечивала для всех x<t<T
выполнение равенства
э/г , ? дрг
ди ди
>м = 0.
(13.10)
Тогда уравнение (13.9) принимает вид
6х =
Эх Эх
(13.11)
Теперь, как и в задаче без ограничений на фазовый вектор, вве-
дем вектор \|/(0 и потребуем для всех x<t<T выполнения равен-
ства
у(/)г8х(/) = &/. (13.12)
Отсюда, в частности, следует, что
v(T) = ^tO. (13.13)
Эх
Дифференцируя (13.12) и принимая во внимание (13.11), полу-
чаем следующее уравнение, которому должен удовлетворять вектор
y = _§^v+|P|X; (13.14)
255
где
ll = H(r) = -X(r)7'vW-
(13.15)
Определив вектор у(/) в соответствии с (13.12), для момента
t = т получим
Я[у(т),х(г),й(т)]-Я[у(т),х(т),«(т)]^О, (13.16)
где
Н (y,x,u) = уг/(*,«),
tf[v(t),x(t),M(t)]= min Я [v(t),x(t),«(t)].
UGU fP[X^UJ-U
Так как т может быть любым из t € [0,Т], окончательно можно
записать для всех /е [0,Т]
Я[ш,х,м1 = min# [ш,х,й]. 17\
L J ifet/,Xx^>0L J u.5.1/)
Каноническая система уравнений в данном случае принимает
вид
. ЪНЪр , (т. ЭГ[х(Т)]
(13.18)
Вернемся к определению матрицы Х(/) и, следовательно, век-
тора ц(/). Представим соотношение (13.10) в виде
э/г , Э/>г
Эи1 Эм1
[Эи2 Э«2
iu2 = 0,
(13.19)
256
где i? и и2 — составляющие вектора и, такие, что и1 имеет размер-
ность, равную размерности вектора р, а и2 включает остальные ком-
поненты вектора и. Так как вариации ди', ди2 связаны с вариацией
5х векторным соотношением, размерность которого совпадает с раз-
мерностью компоненты 5i?, то компоненту ди2 можно считать сво-
бодной. Зададим ди2 = 0.
Тогда (13.19) можно представить так:
Э/г , Эрг
Эй1 э«'
la1 = 0.
(13.20)
Для выполнения (13.20) при любых 5wl достаточно задать мат-
рицу X в виде
Ар Y' у
^dl? J Эи1 ’
(13.21)
Предполагается, конечно, что матрица имеет обратную. Су-
ществование матрицы
гэ₽ у*
к3"1)
является, по сути дела, условием воз-
можности движения вдоль границы при варьировании управления.
В соответствии с (13.15) вектор p(f) запишется как
и=(эр Т,^ш=Г3рТ1^..
^dw1 J Эн1 ) Эи1
Как и прежде, можно показать, что гамильтониан вдоль опти-
мальной траектории есть величина постоянная и равная нулю, если
Тсвободно.
Таким образом, для задачи управления системой
257
x = /(x,w),ueU, /€[0,Г], x(O) = xo
при дополнительном ограничении g (х) = 0 с минимумом критерия
J = F[x(Г)] необходимые условия оптимальности управления име-
ют вид
Н Гш,х, i/l = min Я Гш.х.й],
L J ife(/,p(x,fi)=0LY J
где
„ г,/ V . ЭЯ ЭрГЭрГ'эЯ ЭЯ(Г) „„„„
Я=^/(а«), v = -_+-^_j —; У(Т)=—, (13.22)
причем
{const, если Т фиксировано;
О, если Т свободно.
Упражнение 1. Сформулировать необходимые условия оптимальности
в задаче управления системой
х = /(х,«), ueU, Ге [0,7], х(О) = Хо
при дополнительном ограничении ^(x,w) = 0 из условия максимума кри-
терия / = 7[х(Т)].
Упражнение 2. Показать, что в задаче управления системой
х = /(х,«), ме(/, Ге [0,7], х(0) = Хо
при дополнительном ограничении g(x) = 0 с минимумом критерия
J = j/0(x,U)d- + F[x(7-)]
О
необходимые условия оптимальности (13.22) сохраняются с точностью
определения гамильтониана, который теперь принимает вид
258
Н = fQ(x,u)+yT (13.23)
Упражнение J. Показать, что наличие дополнительных ограничений на
фазовый вектор в момент /= Т вида <р[х(Г)] = 0 приводит к изменению в
необходимых условиях оптимальности лишь краевого условия на сопря-
женный вектор \и(Г), которое теперь принимает вид
v Эх Эх '
где А. — вектор множителей Лагранжа.
13,2, Оптимальный по быстродействию
разворот в пространстве
Рассмотрим задачу переориентации летательного аппарата в
пространстве за минимальное время. В качестве уравнений движе-
ния примем уравнения Эйлера:
+ (а ~ у =
Jy6>y+(Jx~Jz),ax^ = My'’ (13.25)
уЛ+(Л-/х)®л = Ч-
Здесь ©у, сог — проекции угловой скорости на связанные оси;
Мх, Му,Мг — компоненты управляющего момента вдоль этих осей;
/х, Jy, Jz — моменты инерции по связанным осям Jx*Jy*J*, На
компоненты управляющего момента накладываются ограничения
XIS*V|*,K’ (13.26)
Будем полагать, что разворот происходит с угловой скоростью
(о относительно некоторой неподвижной в пространстве оси. Дан-
ное предположение не нарушает общности рассмотрения задачи, так
259
как любой разворот твердого тела в пространстве можно предста-
вить как разворот его относительно неподвижной оси в простран-
стве, называемой осью Эйлера.
Обозначая через vx, v , vz направляющие косинусы этой оси в
связанной системе координат, можно записать
<dx = covx, = (wyf (az-(avz.
Если теперь через Ф обозначить угол разворота относительно
неподвижной оси, то ее математическую модель можно представить
в следующем виде:
ф=(О,
ЛМ +(<--/'JVA<b2=Wx>
Jy'fyto+(Jx-Jz)vxvz<^ = My, (13.27)
- Л)vxv/°2 = '
что эквивалентно двум дифференциальным уравнениям
<р = ш, ш=Ах<о‘ + ВхМх (13.28)
при двух конечных связях
z х . (13.29)
где
J -J J -J J -J
-L—£v v ; A v ; А = v ;
Jv yvz> У Jv Л’ z JV x y*
XX у у z z
В В : В =-^~
x Jv f Jv 1 Jv
XX У у z z
(13.30)
260
Требуется найти такое управление Mx(t), Mr(t), которое
с учетом условий (13.26) и (13.29) осуществит перевод системы (13.28)
из начального состояния {ф(0) = 0, со(0) = 0} в конеч-
ное{<р(Г)=0, о(Т)=0} за минимальное время.
Итак, критерий оптимальности имеет вид
т
= (13.31)
О
причем Т свободно.
Выявим с помощью необходимых условий оптимальности (13.22)
структуру оптимального управления. Составим гамильтониан для
данной задачи:
Н = 1 + ф2 (Л*®2 + ВХМХ).
(13.32)
Если через м1 обозначить вектор с компонентами Мх и Mz, то
матрица др/ди*, которая согласно (13.29) запишется как
Э«' О -fl,
V *
* (др'
будет иметь обратную -~
, что означает возмож-
ность движения вдоль границы p(x,w) = 0.
Уравнения для компонент Ф2 согласно (13.22) имеют вид
др п
Vi = const = q;
Оф
ЭЯ ..
V2=-^-=-q-2Axv2<a
(13.33)
261
Можно показать, что при неизменном знаке со функция у2 из-
меняет свой знак не более одного раза.
В соответствии с (13.22) оптимальное управление обращает в
минимум гамильтониан (13.32) при ограничениях (13.26) и (13.29).
По сути, имеем задачу минимизации линейной по управлению фор-
мы (13.32) на плоскости
4-4 " 4-4
при наличии ограничений
\м \<мх, \М \<М„ , \м \<мг .
f ’ А/п I у I Ут I < I т
(13.34)
(13.35)
Задача имеет наглядную геометрическую интерпретацию. В си-
стеме координат М , М , М , т.е. в связанной системе координат,
X У Z
плоскость (13.34) и параллелепипед (13.35) при пересечении в об-
щем случае образуют жестко связанный с ЛА многоугольник допу-
стимых элементов управления.
В силу линейности гамильтониана от управления минимум Н
достигается на границе этого многоугольника, т.е. в любой момент
времени одна из компонент момента управления обязательно при-
нимает свое максимальное значение, две другие определяются од-
нозначно таким образом, чтобы результирующий момент управле-
ния оказался на границе многоугольника.
Поскольку, по условию задачи, в начальный и конечный момен-
ты времени ® = 0, то согласно (13.29) векторы момента управления
для этих времен лежат на одной и той же хорде, проходящей через
начало координат. Однако направлены они в противоположные сто-
роны, что физически означает в одном случае разгон, а в другом —
торможение летательного аппарата.
В силу того, что компонента V2 может менять знак лишь один
раз, переключение момента управления с режима разгона на режим
торможения также возможно только один раз. Учитывая сказанное,
262
нетрудно построить годограф, описываемый концом вектора момента
оптимального управления.
Итак, структура оптимального управления определена с точно-
стью до знания момента переключения tn и момента окончания про-
цесса управления Т. Интегрируя уравнения движения (13.28) при
найденном управлении с момента t - 0 до момента t = Т, можно
получить систему из двух уравнений
ш(Т,Г„) = 0, <р(Г,/„) = О
относительно неизвестных tn и Т.
Упражнение 1. Построить для рассмотренной задачи многоугольник
допустимых моментов управления в общем случае. Показать годограф,
описываемый концом вектора момента оптимального управления. Какие
частные случаи возможны?
Упражнение 2. Решить задачу об оптимальной по быстродействию
переориентации летательного аппарата в случае полной симметрии, т.е. при
условии Jx-Jy-Jz.
Упражнение 3. Найти оптимальное управление в задаче управления
спуска, рассмотренной ранее, при движении вдоль изотермического огра-
ничения вида р*1 v*2 = const, полагая, что плотность атмосферы изменяет-
ся по экспоненциальному закону р = Рое~рл , где р0 — плотность у повер-
хности Земли; h — высота; к\,к2,$ — константы.
13.3. Учет ограничений в виде неравенств.
Условия скачка
Перейдем к рассмотрению случая управления системой
х = /(х,м), /е[0,Т], х(О) = хо (13.36)
при наличии ограничений на фазовый вектор в виде неравенства
#(х)<0. (13.37)
263
Критерий оптимальности по-прежнему будем рассматривать в
виде
/ = F[*(T)]. (13.38)
Ограничимся рассмотрением случая, когда оптимальная траек-
тория выходит на границу области (13.37) один раз, остается на ней
в течение интервала времени [fpf2], а затем снова входит внутрь
области.
Будем полагать, что множество допустимых управлений Uпред-
ставляет собой класс кусочно-непрерывных функций. Покажем, что
в этом случае имеет место следующее свойство оптимальных траек-
торий (принцип оптимальности): каждый участок оптимальной тра-
ектории является оптимальным в смысле того же самого критерия
оптимальности, рассматриваемого лишь на этом участке.
С точностью до постоянной составляющей критерий (13.38)
эквивалентен следующему интегралу:
Разобьем его на три части:
J = У|+У2-*'*^з»
где
А = 14-fdV> J2 = j > J3 = J ^-fdt-
1 J Эх 2 ; Эх 5 / Эх
о a t2
Обозначим через и оптимальное управление на всем интервале
[О, Г], а через uv и2, и3 — оптимальные управления на отдельных
интервалах [0,г,], [/р/2], |?2»П соответственно, т.е.
Л«)=™п/(й), J2(«2)=mmJ2(u),
264
/, (и,) = min У, («), /3 («, ) = min J} («).
Принцип оптимальности сводится к тому, что u={uvu2,u}}, т.е.
/|(“) = /|(“|)’ = Л(«) = А(«з) и ПОЭТОМУ
/(«) = J1(u1)+/2(u2)+/3(«3).
Действительно, если допустить, что оптимальное управление и на
одном из интервалов времени, например на втором [^^2]» не со-
впадает с управлением и2, то окажется /2 (и2) < /2 (и) и, следователь-
но, / (и) > (wt)+J2 (и2)+/3 («3), что противоречит определению и.
В соответствии с принципом оптимальности на каждом участке
оптимальной траектории должны выполняться соответствующие
необходимые условия оптимальности. В частности, для участка
выхода на ограничение при /е [<Ц] условия оптимальности име-
ют вид
н,(^в>х»>ив) = Нв(у„хв,йв), Яв = (*„,«„);
,, ч ,ЛЗ ЭЯ (13.39)
х„=Лхв’ив)> *.(о)=*о;
для участка движения по ограничению />(-\>г,мог) = 0 при /е[^,/2]
tfOr(Vor>XW.“or)= min^or (Vor^or^or);
«Ог^. P(XQr/lor)=0
#or=Vor/(V’uor); *ог=Жг’“Ог); (13.40)
265
xor('i)=^('i); Чк
эяог ( эр pp т'эя.
Эх Эхог l^dl? J dw1 ’
для участка схода с ограничения при Ze [z2,T]
Яг (\|Г. , ,и )=min Я (ш , х„,й); Я = \1Л/ (х „, и );
С\~С’ С’ С/ £ еу С\ТС’ С’ С/’ С ТС7 \ с5 с/’
*с=/(хс>«с); \М=хт(g); (1341)
Ч=-
эя.
Эх
ол
Возникает вопрос, каким образом связаны между собой сопря-
женные векторы ув, yor, vc при переходе от одного участка к дру-
гому, т.е. в момент zt и z2. Для получения ответа на этот вопрос
применим приведенный выше принцип оптимальности для двух уча-
стков оптимальной траектории бесконечно малой протяженности
[г, -е, Z, +е] и [t2 ~£’ h +е] > включающих в себя моменты Zj и Z2. В
результате можно получить следующие условия:
Vor(Zl) = VB(/l) + —VcfoWorfo)’ <13-42>
где v1 — вектор множитель Лагранжа, соответствующий моменту
времени Zr
Таким образом, в задачах с ограничениями на фазовый вектор в
виде неравенств (13.37) сопряженный вектор в общем случае пре-
терпевает разрыв в момент выхода на ограничение. Условия типа
(13.42) принято называть условиями скачка.
Упражнение 1. Показать, что для автономной системы (13.36) при на-
личии ограничения (13.37) гамильтониан на оптимальной траектории, как
и в задачах без ограничений на фазовый вектор, есть постоянная величина,
которая в случае нефиксированного времени Токазывается равной нулю.
266
Упражнение 2. Показать, что прю наличии смешанных ограничений
вида (х,ик+ъ...,ит)<и/ <gf(x,uk+b...,um), i = задача оптимизации
сводится к задаче при ограничениях, накладываемых лишь на управление.
Для этого достаточно перейти от управляющих воздействий и} ,...tuk к но-
вым управляющим воздействиям в соответствии с формулами
' 2 * 2 '
Упражнение 3. Получить условия (13.42).
13.4. Оптимальное торможение космического
летательного аппарата
Рассморим задачу торможения космического летательного ап-
парата при входе в атмосферу. В качестве математической модели
примем уравнения плоского движения центра масс летательного
аппарата в скоростной системе координат
pv2
v = -gsin;
a-L PV COS© VCOSG.
^2PX g~ ~RVh' (13.43)
h- vsin©.
Здесь v — скорость аппарата; в — угол наклона траектории; h —
высота полета; р — плотность атмосферы; g — ускорение свобод-
ного падения; R — радиус Земли; Px=m/CxS — приведенная на-
грузка на лобовую поверхность; т — масса аппарата; Сх — коэффи-
циент лобового сопротивления; 5 — площадь миделя; &эф — эффек-
тивное качество, = Jtcosy, где к — аэродинамическое качество,
к = const; Y — угол крена. Величина эффективного качества может
изменяться в пределах
-к<к^<к. (13.44)
267
Будем полагать, что поле тяготения центральное, т.е.
кщ
<13-45)
где км — гравитационная постоянная, а атмосфера — экспоненци-
альная, т.е.
Р = Рое’рЛ> (13.46)
где р0 — плотность у поверхности; р — константа.
При выборе траектории будем учитывать ограничение на ми-
нимально допустимую высоту пролета над поверхностью:
Л(0^ЛДоп- (13.47)
Ограничение (13.47) позволяет учесть возможные колебания
рельефа поверхности и исключает тем самым возможность столк-
новения летательного аппарата с поверхностью.
В качестве критерия оптимальности примем значение скорости
на заданной высоте h (Т) = (hj- > haon):
J = v(T). (13.48)
Задача состоит в выборе такой программы управления к^ (') си-
стемой (13.43), которая минимизирует критерий (13.48) при огра-
ничениях на управление (13.44) и на фазовые переменные (13.47)
при заданных начальных условиях
v(O) = vo, О(О) = ео, Л(0)=^ (13.49)
и заданной конечной высоте Л(Т) = hT .
Для выявления структуры оптимального управления восполь-
зуемся необходимыми условиями оптимальности (13.39)—(13.42).
268
Будем полагать, что оптимальная траектория содержит один интер-
вал движения ,/2] вдоль границы области (13.47), т.е. по ограни-
чению
Л-Ал =0.
доп
(13.50)
Согласно (13.39) и (13.41) для всех участков траектории гамиль-
тониан имеет следующий вид:
Я =
-V| ^- + ^sin0 +у2 к.
pv2 gcos0 VCOS0
*>2? 7~+ л+й
+ \y3vsin0. (13.51)
Уравнения для сопряженных переменных для всех участков
выхода на ограничения и схода с него, т.е. при h < Лдоп, имеют оди-
наковый вид:
ЭЯ _ Vipv [ *^Р COS0 cos0
Цу~~Рх V2[2PX + *~+Я + й
- у3 sin 0;
•, ЭЯ л Г g sin 0 vsin01
^2=-—= V|gcos9-V2|^----------^-I-V3vcose;(i3.52)
£^P +
•'“/ Я + Й
2g sin0
+ VJ *30 ) П P
д ЭЯ
pv2 2gcos0 vcos0
^2^/(A + ft)v + Л + Й ’
В соответствии с необходимыми условиями (13.39) и (13.41) на
участках движения внутри допустимой области фазовых координат,
т.е. при h < Л, оптимальное управление является граничным:
(13.53)
при условии, что у2 * 0 на конечном интервале времени.
269
Необходимые и достаточные условия прохождения оптималь-
ной траектории вдоль границы (13.50) имеют вид
Л = Лдоп’ ^ = vsin0 = 0,
или
£1 ^доп
g2 = vsinO
(13.54)
Р=h = vsinO+v0cosO =
= - ~^- + gsin0 sinO+vcos 7777 £
pv2 . gcosO vcos0
|_2Px v Я + Л
= 0. (13.55)
Так как условия (13.54) и (13.55) однозначно определяют опти-
мальное управление вдоль границы h = h
ДОП
_(е V2 Ч ГНЯ+Л)
эфЧ л+лх-рог(Л+Адоп)[
(13.56)
то минимизация гамильтониана в (13.40) при этом не требуется.
Уравнения для сопряженных переменных при й = Лдоп согласно
(13.40) запишутся следующим образом:
ЭЯ , ЭР ЭЯ
Эу Эу Э^эф
ЭР
Чф
ЭЯ ! ЭР ЭЯ
эе эе Ък.
’’Ф
'i*2or =
=v,or«-v2or^--v3orv; <13-57)
^гх
Л ’
270
*3ог =
дН ЭР дН
ЭЛ + ЭЛ дк.
Эф
ЭР
Эк*
PV2 Q
-V|Or2p Р-
”’Л-ЛдО|1
В момент входа на ограничение t = t} согласно (13.42) и (13.56)
сопряженные переменные скачком меняют свои величины:
4'lor('1) = V1('.)+^-v1+^-v2;
*2ог (6) = V2 (М + v! + v2;
'i'3or('i)=V3(A)+^-v1+^-v2>
где vpv2 — константы.
Так как в момент схода с ограничения для выполнения в даль-
нейшем условия h < Л и в соответствии с (13.53) управление дол-
жно быть Лдф = к > к^, то окончание горизонтального полета опре-
деляется условием у2ог (/2) = 0.
В соответствии с (13.41) краевые условия в момент t = Т для со-
пряженных констант имеют вид
у,(Г) = 1, у2(Т)=0.
В силу того, что конечный момент времени не задан для любо-
го момента времени, имеем дополнительное условие Н- 0.
Таким образом, исходная задача оптимизации сведена к следу-
ющей краевой задаче для систем обыкновенных дифференциальных
уравнений (13.43), (13.52), (13.57).
271
Заданы:
начальные условия v(O)=vo, 0(0) = 0О, Л(О) = Ло;
краевые условия у1(Г) = 1, у2(Т) = 0, Л(Г) = Лг;
условия выхода на границу h(/t) = Адол, h{ty) = vsin 0 = 0;
условие равенства нулю гамильтониана Н= 0.
Определению подлежат параметры Vi (0), V2 СО» Уз 00» vi»v2» •
Для определения этих шести параметров имеются все шесть усло-
вий. В общем виде задача достаточно сложная. Для ее решения не-
обходимо применять численные методы. Некоторые упрощения
могут быть достигнуты, если провести дополнительный анализ воз-
можных схем полета.
14. ЧИСЛЕННЫЕ МЕТОДЫ ПРОГРАММИРОВАНИЯ
ОПТИМАЛЬНОГО УПРАВЛЕНИЯ
14.1. Сведение к задаче
математического программирования
Задача программирования оптимального управления непрерыв-
ными системами формально может быть сведена к задаче матема-
тического программирования различными способами. Один из них
связан с дискретизацией исходной задачи и представлением иско-
мой программы управления и (/) в виде конечной последовательно-
сти управлений {«,},/ = 1,7V , для поиска которой могут быть исполь-
зованы различные методы нелинейного программирования, рассмот-
ренные в первой части данного пособия.
Возможны и другие подходы, основанные на использовании
необходимых условий оптимальности в явном виде. Рассмотрим
лишь некоторые из них.
Как уже указывалось, применение принципа минимума (мак-
симума) приводит к необходимости решать краевые задачи для си-
стемы нелинейных дифференциальных уравнений типа
272
(14.1)
при заданных начальных условиях х(О) = хо . Конечные условия за-
висят от конкретной постановки задачи. Так, для задачи управле-
ния конечным состоянием условия на правом конце имеют вид
v(T)=
дх
(14.2)
Трудность решения системы (14.1) заключается в необходимос-
ти подбора начального вектора \у(0) таким образом, чтобы на пра-
вом конце удовлетворялись условия (14.2).
Введем в рассмотрение вектор невязок
оХ
(14.3)
В силу (14.1) и (14.3) вектор £ зависит от у(0). Поэтому кра-
евая задача формально сводится к решению уравнения
ф)/(0)]=0.
(14.4)
Для решения этого уравнения можно использовать любые ме-
тоды решения системы нелинейных уравнений, например метод
Ньютона и его модификации. Отметим, что функциональная зави-
симость 5[v(0)] задана не явно, а через дифференциальные урав-
нения (14.1). Это значительно усложняет процесс получения реше-
ния. Так, для организации метода Ньютона необходимо знать мат-
рицу частных производных , элементы которой в общем слу-
чае приходится получать численными методами, интегрируя систе-
му (14.1) многократно. Данный метод целесообразно применять, если
известно достаточно хорошее начальное приближение решения.
273
Задачу отыскания решения уравнения (14.4) можно заменить
эквивалентной задачей математического программирования, если
ввести в рассмотрение целевую функцию z(£), характеризующую
меру отклонения вектора невязок от нуля. Такой функцией мо-
жет быть, например, квадратичная:
(14.5)
где X — некоторая положительно-определенная матрица.
Из (14.5) видно, что минимум сравняется нулю при £ - 0. По-
этому, минимизируя z по у(0), мы тем самым решаем краевую за-
дачу. Следует иметь в виду, что вид функции оказывает существен-
ное влияние на скорость сходимости при решении полученной за-
дачи математического программирования численными методами.
Поэтому в процессе решения вид этой функции часто приходится
уточнять (в простейшем случае изменением матрицы X). Иногда
вместо (14.5) рассматривают функцию z = •
14.2, Методы решения задач со свободным концом
Для решения задач со свободным правым концом разработаны
эффективные приближенные методы. Они используют замечатель-
ное свойство этого класса задач, которое заключается в том, что для
получения точного решения задачи оптимизации управления дина-
мической системой, если она линейна по фазовому вектору, а на пра-
вый конец траектории не наложено ограничения, достаточно решить
последоватьльно две задачи Коши.
Рассмотрим этот вопрос подробнее.
Случай линейной системы. Пусть требуется найти управление
ueU системой
x = Ax + (p(w), х(О) = хо
(14.6)
из условия минимума критерия
J = c*x(T), (14.7)
где с — заданный вектор.
Составим гамильтониан
Я = А}/г[>Ьс + ф(м)] (14.8)
и выпишем уравнения для сопряженного вектора
ф = (14.9)
Поскольку в соответствии с (14.2)
у(Т) = с, (14.10)
вектор V в данной задаче может быть определен независимо от х и
и, а это означает, что краевая задача распадается на две задачи Коши.
Сначала решается система (14.9) при условии (14.10) интегрирова-
нием справа налево и находится вектор у(/). Затем решается ис-
ходная система (14.6) слева направо с определением на каждом шаге
интегрирования оптимального управления из условия минимума га-
мильтониана (14.8). По существу, решая данную задачу, решаем за-
дачу синтеза оптимального управления.
При численном решении задачи вектор у(/) запоминать не
имеет смысла. Знание V необходимо лишь для определения опти-
мального управления. Поэтому, решая задачу (14.9) и (14.10), надо
одновременно определять и управление. Запоминать же следует толь-
ко управление.
Подобно линейным задачам с квадратичным критерием задачи
со свободным концом, линейные относительно фазового вектора,
играют роль основных элементов при построении итерационных схем
расчета оптимальных программ.
Общий случай. Рассмотрим теперь задачу отыскания оптималь-
ного управления ugV системой
x = /(x,w), х(О) = хо (14.11)
275
из условия минимума критерия
J = F(x(T)). (14.12)
Обозначим через (t) некоторое i-t допустимое управление,
через х‘ (/) и J' — соответствующие ему траекторию и значение кри-
терия J. Линеаризуем систему (14.11) и критерий (14.12) относительно
u'(t) и х'(г):
Дх = ЛДх + Bbu, u'+kueU, Дх(0) = 0; (14.13)
Д/ = сгДх(Г). (14.14)
Здесь
Л= 5 = (14.15)
Поставим задачу об определении такой вариации Ди, которая
обеспечивает минимум вариации Д/. Решение такой задачи может
быть получено согласно сказанному выше из условия
Н = |угЛДх+ minyr ВАи, (14.16)
и'+Ьиеи
где вектор V определяется согласно (14.9), (14.10), (14.15).
Заметим, что задача минимизации критерия J, вообще говоря,
не тождественна задаче минимизации Д/. В самом деле, определив
Ди из условия минимума Д/, мы найдем новые им +Ди и
x/+1 = х' + Ди. Однако из этого еще не следует, что
J (х1 + Ьх,и1 + Ди) < J (х1 ,и'). Поэтому возникает вспомогательная за-
дача о выборе такого Ди, чтобы одновременно выполнялись нера-
венства
276
AJ<0, J(x'+Дх,1?+Aw)</(x',w'). (14.17)
Формально эту задачу можно решить методом последователь-
ных приближений, например, по схеме
Л
(14.18)
принимая в качестве первого приближения Aw , найденное из усло-
вия (14.16). Однако иногда реализация такого метода оказывается
достаточно сложной. В этом случае можно предложить следующую
процедуру.
Выразим вариацию критерия AJ через сопряженный вектор V
и управление Aw . Для этого умножим уравнение (14.13) на вектор
V, а уравнение (14.9) — на Ах. Складывая их, получаем
А у7 Дх+Дх7 у = у7 ЛДх+у7 /?Ди - Лхт Ату
или
б?(у7Дх)
———- = утВ&и.
dt
Отсюда с учетом условий (14.10), (14.13), (14.14) находим
т
&J = (Т)Дл(Т)-]yTBAudt. (14.19)
о
Отметим, что выражение (14.19) справедливо для любого Aw .
Задавая, в частности, Aw в виде
Ди = -еВ7у, (14.20)
где е> 0, мы автоматически обеспечим выполнение одного из усло-
вий системы (14.17) AJ<0.
277
Для выполнения второго условия /(х'+Ax,u'+ Au)< J(u',x')
достаточно подобрать соответствующее значение параматра е.
Описанный метод широко используется в инженерной практи-
ке. Он прост для программирования и позволяет уточнять решения,
полученные эвристическим путем. Авторы данного метода —
Л.И.Шатровский, Т.М.Энеев, А.Брайсон — практически одновре-
менно стали его использовать при расчете оптимальных траекторий.
Основной недостаток метода в том, что с его помощью очень труд-
но получить точное решение задачи.
К рассмотренному методу очень близок метод решения задач со
свободным концом, предложенный И.А.Крыловым и ФЛ.Черноусь-
ко. Этот метод гораздо удобнее для машинной реализации, поскольку
не требует линеаризации исходной системы. Сущность метода зак-
лючается в следующем.
Зададим допустимое управление и1 (г) и найдем согласно (14.11)
соответствующую траекторию х' (г). Составим гамильтониан
Я = гиг/(х,и) (14.21)
и выпишем уравнения сопряженного вектора
ЭЯ Э/ Э£ /1jlw
v=-a7=-^v’ v(r)=a7- <1422)
Проинтегрируем систему (14.22) справа налево, полагая и = и' (/),
х = х' (/). Одновременно из условия минимума гамильтониана (14.21)
найдем новое управление им (/).
Легко видеть, что для линейной задачи оба метода совершенно
эквиваленты и дают точное решение на втором шаге. Основным
недостатком метода является плохая сходимость в общем случае.
Предложены различные способы улучшения его сходимости. Один
из них состоит в следующем. Если оказалось J(ui+I)>/(u'), то в
278
качестве нового управления вместо и‘+} предлагается брать
й'+1 = и1 +- - - t где к выбирается из условия J(ul+x
14.3. Методы, использующие функции штрафа
Как мы уже видели, усложнение структуры ограничений (на-
пример, учет ограничений на фазовый вектор) приводит к усложне-
нию необходимых условий оптимальности. Соответственно услож-
няются и методы расчета, использующие необходимые условия.
Поэтому предлагаются различные приемы преодоления трудностей,
вызванных существованием сложных ограничений. К их числу от-
носится введение функций штрафа, получивших широкое распрос-
транение в практических расчетах. Рассмотрим лишь некоторые
возможности применения функций штрафа.
Снятие ограничений на правом конце. Пусть требуется опреде-
лить управление системой
х = /(х,и), х(О)=Хо (14.23)
из условия минимума критерия J = F[x(r)] (14.24)
при ограничениях *[х(Т)]=0, /=Т,г- (14.25)
Введем вспомогательный критерий оптимальности ;=/[х(г)]+ф[х(п], (14.26)
где Ф[х(Т)] — функция штрафа, характеризующая отклонения от
заданных краевых условий.
Часто функция штрафа задается в виде
= Н/>0. (14.27)
/=1
279
При ц, -»°° задача минимизации критерия сводится к задаче
минимизации J при условиях (14.25). При конечных, но достаточ-
но больших получим приближенное решение задачи. Таким об-
разом, введением вспомогательного критерия (14.26) исходную за-
дачу удается свести к задаче со свободным концом, а следователь-
но, для ее решения можно воспользоваться методами, изложенны-
ми выше.
Снятие ограничений на фазовый вектор. Если в задаче имеются
ограничения, накладываемые на фазовый вектор в виде неравенств
gz(x)>0, / = г, (14.28)
то они могут быть учтены следующим образом. Построим функцию
штрафа
ф[х(/)] =
О, если (х)>0, / = 1,...,г
V Г / М2 • / ' п (14-29)
2Л/|/Л*)] тех для которых g. (х)<0,
k i
где р, > 0.
Вместо исходного критерия J рассмотрим вспомогательный
критерий
т
J = J + |ф[х(г)]Л.
о
(14.30)
К недостаткам метода следует отнести неопределенность в за-
дании множителей Ц,, слабую сходимость за счет введения функ-
ции штрафа. Метод целесообразно применять на начальной стадии
решения для получения грубого решения.
С другими численными методами оптимизации программы уп-
равления можно ознакомиться в работах [28, 43].
280
15. ПРОГРАММИРОВАНИЕ ОПТИМАЛЬНОГО
УПРАВЛЕНИЯ ПРИ ДЕЙСТВИИ
СЛУЧАЙНЫХ ВОЗМУЩЕНИЙ
В предыдущих разделах были рассмотрены методы программи-
рования оптимального управления летательными аппаратами с уче-
том того, что их матемамическое описание может быть произведено
с помощью детерминированных (дискретных или непрерывных)
моделей. В действительности на любой летательный аппарат действу-
ют случайные возмущения, неучет которых зачастую просто недо-
пустим. Возникает необходимость учета действия случайных фак-
торов на процесс формирования оптимального управления.
В данном разделе обсуждаются некоторые аспекты программи-
рования оптимального управления при действии случайных возму-
щений с заданными статистическими характеристиками. Формули-
руются необходимые условия оптимальности. Обсуждается возмож-
ность применения их при решении конкретных задач управления
летательными аппаратами.
15.1. Необходимые условия оптимальности
для дискретных систем
Рассмотрим сначала задачу управления дискретной стохастичес-
кой системой, описываемой нелинейным разностным уравнением
/=ТЛ, (15.1)
где х, и( — векторы состояния и управления соответственно; —
вектор возмущения в f-й момент времени; / — вектор-функция; N
— количество шагов (временных) управления.
Как и прежде, на вектор управления накладывается ограниче-
ние вида е U., где под Uj понимается допустимое множество век-
торов uf в /*-й момент времени.
Будем считать, что статистические характеристики случайных
векторов , i = \,N полностью известны.
281
Не нарушая общности, можно считать, что вектор состояния в
начальный момент времени х, известен. Возможные случайные раз-
бросы начальных условий могут быть отнесены к вектору .
Задача программирования оптимального управления заключа-
ется в определении последовательности {«.}, i = \,N , uf е U(, кото-
рая обеспечивает перевод системы (15.1) из начального состояния
, в конечное ху+1 с минимальным значением некоторого крите-
рия. В качестве такого критерия примем математическое ожидание
функции конечного состояния J = F(xN^ ). Таким образом, мини-
мизации подлежит величина
7 = Лф] = Л/[Г(х„+1)]. (15.2)
Здесь и далее символ «—» означает операцию математического ожи-
дания. В соответствии с определением математического ожидания в
развернутом виде выражение (15.2) имеет следующий вид:
XN+l
Здесь р(хдг+1) — плотность распределения вероятностей случайно-
го вектора хЛ,+1; XN+l — допустимое множество всех случайных век-
торов; dxN+{ — элементарный объем этого множества. Интеграл в
выражении следует понимать как многомерный.
Получим необходимые условия оптимальности для данной за-
дачи, следуя подходу, использованному ранее в детерминированном
случае.
Итак, будем считать, что критерий (15.2) является некоторой
функцией искомого управления
7=7(«)=л/[/(«л)]. (15.3)
282
Здесь под и, понимаются последовательности / = 1,7V,
представленные в виде расширенных векторов ит = ,
Задача оптимизации состоит в отыскании среди
допустимых такого вектора и, который обращает в минимум крите-
рий (15.3).
Необходимые условия оптимальности в такой задаче заключа-
ются в выполнении условия неотрицательности производной J (и)
в точке и по любому допустимому направлению 5w
д7(</)Гг _
—^-6w>0
dw
для всех удовлетворяющих условию м + ебме U, где под U по-
нимается прямое произведение множеств Ц., i = \tN , е — доста-
точно малое неотрицательное число.
Полагая = 0 для всех j*i, а 6иу *0, получаем
э7(«)г s .
dH~5Ul-° (l54)
для всех , удовлетворяющих условию ц +ебц. е Ц..
Соотношение (15.4) справедливо для любого момента времени
i-\,N. Для придания условиям оптимальности (15.4) более конст-
Э7(к)
руктивнои формы раскроем производные ——, связав их с урав-
нением (15.1). Полагая при этом, что операции математического
ожидания и дифференцирования перестановочны, можно записать
Эм.
(15.5)
283
Нетрудно убедиться, что вектор
как и в детермини-
/дЦ ’
рованном случае, связан с уравнением (15.1) следущим образом:
ди, ~ ди, ’ (|56)
Здесь (’5.7)
V, — сопряженный вектор, определяемый согласно уравнению
V'- Эх,. (15.8)
с граничным условием
^+1“ -С (15.9)
Подставляя выражение (15.6) в условие (15.4), окончательно
необходимые условия оптимальности управления можно представить
в виде системы неравенств
М
>0, / = 1Л ,
(15.10)
которые должны выполняться для всех допустимых .
Полученный результат является обобщением соответствующего
результата детерминированной теории оптимального управления,
рассмотренной ранее. Однако теперь гамильтониан и сопряженный
284
вектор, фигурирующие в (15.10), являются случайными и в каждом
соотношении (15.10) присутствует дополнительно операция матема-
тического ожидания (статистического осреднения) по всем случай-
ным факторам, что приводит к необходимости привлечения мето-
дов статистического моделирования. Последнее обстоятельство пред-
ставляет основную трудность при практическом использовании по-
лученных необходимых условий оптимальности.
Остановимся на некоторых частных случаях.
Ограничения на управление отсутствуют. В этом случае для вы-
полнения условий (15.10) необходимо выполнение строгих равенств
М
ЭЯДу,ч|,х,,И,Л;)Г
Эх,.
8и, =0, i = \,N,
(15.11)
Случайные возмущения отсутствуют, = 0, / = 1,7V. В данном
случае операция математического ожидания всюду опускается и не-
обходимые условия оптимальности принимают вид (11.13) и (11.14).
Множество допустимых управлений Ц — выпукло, и гамильтони-
ан Н. — является выпуклой по ut функцией. Поскольку при этом каж-
дое условие из (15.10) может быть интерпретировано как необходи-
мое и достаточное условие достижения функцией М[Я,.] своего ми-
нимального по w/ значения, можно утверждать, что в данном слу-
чае справедлив дискретный стохастический принцип минимума.
MlHi (у,+1>*р“/Л)]= “j” М[Н, (у/+1,х,,б(Л,.)]. (15.12)
Упражнение 1. Показать, что в задаче управления системой (15.1) с
целью минимизации критерия
~ N
./=1
(15.13)
необходимые условия оптимальности (15.8)—(15.10) сохраняются. Однако
теперь вместо соотношения (15.7) для гамильтониана следует использовать
зависимость
285
Hi (15.14)
Упражнение 2. Показать, как изменятся необходимые условия опти-
мальности в задаче управления системой (15.1) с критерием (15.2) при
дополнительном условии
)] = °-
Упражнение 3. Составить алгоритм численного решения задачи про-
граммирования оптимального управления системой (15.1) с использованием
градиентных методов поиска.
15.2. Оптимизация однопараметрической коррекции
Покажем на примере задачи однопараметрической коррекции
траектории движения космического аппарата, каким образом могут
быть использованы полученные необходимые условия оптимально-
сти.
Математическую модель процесса коррекции рассмотрим в виде
=Л/ +
где xi — прогнозируемый в момент i промах — задано; и(— коррек-
тирующее (управляющее) воздействие; Bi — функция влияния; £,• —
случайное возмущение, обусловленное ошибками измерения траек-
торных изменений и ошибками реализации корректирующего воз-
действия; Л/[^.] = 0, л/£д.,^.]=о,
Будем считать, что управляющее воздействие формируется сле-
дующим образом:
u^-L-x.. (15.15)
Задача состоит в определении таких коэффициентов L., при ко-
торых обращается в минимум критерий .
J = M
' N
«L“,?+4+i
L /=t
286
С учетом (15.15) модель процесса коррекции принимает вид
(15.16)
а критерий оптимальности
7 = М a£L?x?+x2N+i .
В соответствии с (15.14) стохастический гамильтониан
Я,. = аД?х? + V(+1 (1 - BtL, )х( + у/+Д.
Так как на управление в данном случае никаких ограничений
не накладывается, то необходимые условия оптимальности соглас-
но (15.11) принимают вид
= - В.М [у/+1х,.] = 0, (15.17)
М
ЭД
где Д = М[л^], а V/ определяется в соответствии с (15.8), (15.9),
т.е.
Ч “^осЛх. + V/+i О АА)’ Улм ~^xn+v (15.18)
Основная трудность использования условий оптимальности в
стохастических задачах состоит в раскрытии операции математичес-
кого ожидания: В данном случае необходимо найти , ко-
торое зависит от искомых коэффициентов £,. Раскрывая связь w/+J
с х, с помощью уравнений (15.16) и (15.18), можно установить, что
A/[V1+1x,.] = 2л/+1 (1 - B,.£, )D„ (15.19)
287
где параметр Л/+1 удовлетворяет рекуррентному соотношению
~ Л/+1 (1 , Ayv+l -1.
(15.20)
С учетом соотношения (15.19) условие (15.17) принимает вид
2aLjDi - 2ВД.+1 (1 - £.£.) = 0,
откуда находим искомые коэффициенты
А ~ (а + А?Л/+1) AA+i
(15.21)
Упражнение 7. Убедиться в справедливости соотношений (15.19) и
(15.20).
Упражнение 2. Обобщить полученное решение на случай управления
линейной стохастической системой общего вида
х/+1 = 4х/ + Дц+^,
полагая ut - -L^ , Л/[^ ] = 0, М] = 0, i * j и рассматривая в качестве
критерия оптимальности
j = m
J+I
где 4, Bh И<, \ — заданные матрицы. Определению подлежит последова-
тельность матриц {£,}, / = 1,7V.
15.3. Необходимые условия оптимальности
для непрерывных систем. Стохастический
принцип минимума
Решение задач, связанных с оптимизацией непрерывных стоха-
стических систем, как и в детерминированном случае, практически
всегда требует дискретизации. Можно указать два ее способа.
288
Первый состоит в переходе от исходной непрерывной задачи к
дискретной сразу. При этом дифференциальные уравнения, описы-
вающие поведение системы, заменяются на конечно-разностные.
Соответствующим образом преобразуется и критерий оптимальнос-
ти. Для решения полученной задачи могут быть применены либо
условия оптимальности для дискретных систем, либо соответству-
ющие численные методы.
Второй подход связан с использованием необходимых условий
оптимальности, полученных непосредственно для исходной непре-
рывной задачи. Эти условия в явном виде редко позволяют полу-
чить решение задачи оптимизации. Они обычно лишь трансформи-
руют исходную задачу в другую, например, связанную с краевой
задачей для системы дифференциальных (в данном случае стохас-
тических) уравнений, при решении которой в конечном счете и
приходится проводить дискретизацию.
Бывает заранее трудно отдать предпочтение какому-либо одно-
му из этих подходов. Первый подход, очевидно, более прост в реа-
лизации при получении численного решения задачи, обладает оп-
ределенной универсальностью, так как фактически исходную зада-
чу сводит к задаче математического программирования, в решении
которых в настоящее время накоплен богатый опыт. Однако приме-
нение второго подхода иногда позволяет более просто выявить струк-
туру оптимального управления, а в некоторых случаях и найти бо-
лее эффективный способ решения задачи в целом.
Учитывая это, ниже рассматривается получение необходимых
условий оптимальности в задаче программирования оптимального
управления непрерывной стохастической системой.
Пусть динамическая система на интервале времени [0,7] опи-
сывается следующим стохастическим дифференциальным уравнени-
ем:
х = /(х,иЛ,г), (15.22)
где х, и — векторы состояния и управления соответственно; х(0) за-
дано; ueU \f— вектор-функция, непрерывно дифференцируемая
по своим аргументам; — случайный процесс с известными стати-
стическими характеристиками.
289
Задача программирования оптимального управления заключа-
ется в отыскании такой временной зависимости которая обес-
печивает перевод системы (15.22) из заданного начального состоя-
ния х(0) в конечное х(Т) с минимальным значением критерия
J = M{F[x(T)]}. (15.23)
Рассмотрим упрощенный вывод необходимых условий оптималь-
ности, основанный на дискретизации системы (15.22) с точностью
до членов первого порядка малости, применении соответствующих
условий оптимальности для полученной дискретной задачи и пос-
ледующем обратном предельном переходе к непрерывному случаю.
Более строгое доказательство требует анализа влияния членов более
высокого порядка малости.
Предположим, что непрерывный случайный процесс £(/) мо-
жет быть представлен в виде дискретной последовательности слу-
чайных векторов {£,-}, i = 0,N, которая при стремлении интервала
дискретности Д к нулю стягивается к £(г). Тогда для малых Д с
точностью до членов первого порядка малости вместо уравнения
(15.22) и критерия (15.23) можно записать их конечно-мерные ана-
логи:
+ ' = 0Л- (15.24)
Стохастический гамильтониан в данном случае имеет вид
Сопряженный вектор у, описывается уравнением
3//(xpwi Л)
% = У/+1 + А —“------ Ум (15.25)
290
с граничным условием
d^(*/y+i)
^+1
(15.26)
Формально согласно (15.10) необходимые условия оптимальности
имеют вид
М
>0, /=О,ЛГ.
Однако, как и в детерминированном случае, их можно привес-
ти к более конструктивной форме
М ) - VmZ (*р“/Л)] 2 0-
Последнее соотношение справедливо для любого допустимого
управления й( е Ui и для любого момента i - 0,7V. Введя обозначе-
ния для гамильтониана
(15.27)
ему можно придать окончательно следующий вид:
= / = 1,ЛС (15.28)
Таким образом, для дискретной системы (15.24) при малых зна-
чениях интервала дискретности с точностью до малых первого по-
рядка оказывается справедливым дискретный стохастический прин-
цип минимума независимо от свойств гамильтониана и допустимо-
го множества Щ.
Осуществим теперь предельный переход во всех соотношениях,
определяющих необходимые условия оптимальности. Для этого ус-
тремим интервал дискретности Д к нулю. Уравнение (15.24) при-
291
мет вид исходного дифференциального уравнения (15.22), конечно-
разностное уравнение (15.25) для сопряженного вектора V перей-
дет в дифференциальное уравнение
у =
Э/
Эх
ЭН
Эх
(15.29)
с граничным условием
*0-^.
а необходимые условия оптимальности примут вид
М[Н(y,x,u,ty]= min М[Н(у,х,йЛ)],
(15.30)
(15.31)
где
Н (y,x,u,§,t)=yTf (x,u,§,t). (15.32)
Условия (15.20)—(15.32) представляют собой обобщение прин-
ципа минимума на случай непрерывных стохастических систем. Как
и в дискретном случае, отличительной особенностью его является
зависимость гамильтониана от случайных возмущений, что чрезвы-
чайно усложняет решение задачи стохастического программирова-
ния по сравнению с детерминированным случаем. Для отыскания
оптимального управления на основе условий (15.29)—(15.31) необ-
ходимо не только решить краевую задачу для систем (15.22) и (15.29),
но и совместно с этим решением раскрыть операции минимизации
и математического ожидания в (15.31).
Упражнение 1. Показать, что в задаче управления системой (15.22) с
целью минимизации критерия
J = m(J/0(x,«)^ + F[x(T)]
1о
(15.33)
необходимые условия оптимальности (15.29)—(15.31) сохраняются, а вме-
сто соотношения (15.32) для гамильтониана следует использовать теперь
следующее:
292
Н (ч/,х,«Л,0 = /о (*,«)+WTf (х,«,^).
(15.34)
Упражнение 2. Получить необходимые условия оптимальности управ-
ления системой (15.22) с целью минимизации критерия (15.23) при допол-
нительном условии
(15.35)
15.4. Оптимальное управление летательным аппаратом
в бессиловом поле. Линейная система
с квадратичным критерием качества
Пусть в бессиловом поле движется летательный аппарат под
действием силы тяги двигателя. Математическая модель такого ап-
парата может быть представлена в виде
Xj=w+£, х2=х1,
(15.36)
где X] —* скорость аппарата; х2 — путь, пройденный к текущему
моменту времени; и — программная, неслучайная составляющая уп-
равляющего ускорения; £ — случайное возмущение программной
составляющей. Будем полагать, что статистические характеристики
возмущения £ известны, причем Л/[£] = 0.
Поставим задачу определения такой программы управления и (t),
которая обеспечила бы перевод летательного аппарата из заданного
начального состояния {xj (0),х2 (0)} в конечное {xt (Г) = 0,х2 (Г) = 0}
с минимальным значением критерия
Г т
J-M aj«2tft + 'y1x12(T)+Y2xj(T)
(15.37)
Интегральное слагаемое в критерии (15.37) характеризует сред-
нее значение расхода топлива, затрачиваемого на процесс управле-
293
ния, а величина Л/fy^2 (Г) + y2xj (7)] является мерой близости ко-
нечного состояния ЛА к желаемому. Коэффициент а показывает
весовую долю этих составляющих в общем критерии оптимальнос-
ти.
Для решения задачи воспользуемся необходимыми условиями
оптимальности (15.29)—(15.31), (15.34).
Гамильтониан Я в данном случае имеет вид
Н = сш2 +Vi (И + У+V2xr
(15.38)
Сопряженная система
дН . дН п
V)=__=_V2, V2=__=o.
(15.39)
Граничные условия
¥|(Г)=27Л(Т), ¥2(Т)=27Л(Т).
(15.40)
Необходимое условие оптимальности
м
ГЭЯ1
= М [2аи + у1] = 2аи + ф1 =0,
(15.41)
где Vj
Отсюда искомое управление
(15.«>
Из уравнений (15.39) и (15.41) следует, что
¥2=2УЛ(Т), Vi =2Т,х1(7’)+2У?х2(7’)(7’-/), (15.43)
поэтому
ф1=271х|(Т) + 2у^(Т)(Т-/), (15.44)
294
В свою очередь, согласно (15.35) математические ожидания jq
и х2 удовлетворяют уравнениям
= (15.45)
при начальных условиях xt (0) = Xj (0), х2 (0) = х2 (0). Интегрируя
систему (15.45) с учетом (15.42) и (15.44), получаем
=х,(0)-Х[У1^(7’)+У2^(7’)7->-1з5^)£1;
(15.46)
*2 = ^ (°) + *! (°)'-Vi Ю+ ЧЛ (Г)Т]г2 - (у2х2 (Т)/3 /6а).
Полагая в (15.46) t = Т , получаем линейную систему алгебраи-
ческих уравнений относительно неизвестных величин Х| (Г), х2 (Г).
Определяя эти величины и подставляя их в (15.42) с учетом (15.44),
получаем окончательно искомую программу управления.
Упражнение. Обобщить полученное решение на случай управления
линейной стохастической системой вида
х= Ах+Ви+&
полагая и = -Lx, М[£] - 0 и рассматривая в качестве критерия оптималь-
ности
Т
/ = Л/ \uTWudt + x(T)T\x(T) ,
о
где А, В, W, \ — заданные матрицы. Определению подлежит матрица ко-
эффициентов обратной связи £(/).
75.5. Учет вероятностных ограничений
Во многих задачах управления летательными аппаратами при
действии случайных возмущений среди различных ограничений
295
особое место занимают вероятностные. Эти ограничения обычно свя-
заны с необходимостью выполнения некоторых условий с заданной
вероятностью. Так, например, в задаче коррекции с целью достиже-
ния заданной конечной точности достаточно потребовать выполне-
ния условия: вероятность того, что конечная ошибка xN+l (по мо-
дулю) не превысит некоторой величины , должна быть не ме-
нее заданной Р*:
'ЧЫ^+1}>г. <15-47)
Если при этом в качестве критерия рассмотреть энергетические зат-
раты, оцениваемые критерием
7 = (15.48)
i=l
где через ц, как и ранее, обозначены величины корректирующих
импульсов, то задача будет состоять в выборе такой управляющей
последовательности и = {и, }, которая с учетом (15.47) обращает (15.48)
в минимум.
Рассмотрим один из возможных подходов к решению подобно-
го рода задач. Сформулируем задачу в более общем виде. Пусть тре-
буется найти такое управление и из допустимой области U(ие U),
которое обращает в минимум критерий
/(«)-> mm (15.49)
с учетом вероятностного ограничения
Р{Ф(«Л)<0}^Р*. (15.50)
Здесь через 5 обозначен вектор случайных возмущений; Ф(«Л) ““
заданная функция; Р* — заданная величина. Введем в рассмотре-
296
ние область £2 в пространстве векторов £, для которой выполняет-
ся условие Ф (ы,£) < 0, т.е.
Я=^:Ф(иЛ)<0}. (15.51)
Если дополнительно потребовать, чтобы
(15.52)
то условие (15.50) оказывается выполненным автоматически. Поэто-
му в исходной задаче вместо (15.50) можно записать следующие два
условия:
тюсФ(«Л)20; (15 53)
Р^еП}=Р*.
(15.54)
Наконец, учитывая неоднозначность определения области £2, соглас-
но (15.54) исходную задачу можно представить в виде
J(u,£2)-> min
v ' ueUJl
(15.55)
с учетом условий (15.53) и (15.54).
В работе [23] строго математически доказывается эквивалент-
ность перехода от исходной задачи (15.49), (15.50) к вспомогатель-
ной задаче (15.53)~( 15.55). На первый взгляд, вспомогательная за-
дача нисколько не проще исходной. Однако ее особенности во мно-
гих случаях позволяют предложить более эффективные методы ре-
шения. Так, например, в случае выпуклости функции Ф(и,£) хотя
бы по одной компоненте операция тахФ(«,^) оказывается экви-
валетной операции тахФ(а,£), где через Э£2 обозначена граница
области £2. Если же функция Ф(ы,у выпукла по всем компонен-
297
там, а область Q является параллелепипедом, то операция
тахФ(мД) сводится к еще более простой операции отыскания мак-
симума Ф(«Л) среди всех вершин области П:
max Ф (w, 5) = max Ф (w, ).
Наиболее существенное упрощение вспомогательной задачи
достигается, если предположить, что выбор области Q из условия
(15.54) может быть осуществлен независимо от искомого управле-
ния w, т.е. заранее до решения самой задачи оптимизации. В этом
случае вспомогательная задача может быть сведена к так называе-
мой минимаксной задаче управления.
Поясним сказанное на примере, когда функция Ф(«Л) являет-
ся скалярной. Считая, что область П выбрана из условия (15.54),
вспомогательную задачу можно представить в виде
/(«)-» min; (15.56)
тахФ(«Л)50. (15.57)
Нетрудно показать, что для решения этой задачи достаточно
существования такого множителя X > 0, при котором управление и
обращает в минимум функцию
/(и)+ХтахФ(и,£) (15.58)
и одновременно выполняется условие
тахФ(«Л)=0. (15.59)
Так как по условию J (w) не зависит от £, то задача миними-
зации (15.58) эквивалентна следующей:
298
/(«) + №(«,§)-> min гш. (15.60)
Таким образом, исходная стохастическая задача (15.49), (15.50)
для рассмотренного случая сведена к минимаксной задаче (15.60) с
последующим подбором Х>0 из условия (15.59).
Учитывая данное обстоятельство, авторы работы [9] назвали
описанный подход минимаксно-стохастическим.
Упражнение. Доказать, что решение задачи (15.58), (15.59) является од-
новременно и решением задачи (15.56), (15.57).
16. МИНИМАКСНЫЕ ЗАДАЧИ УПРАВЛЕНИЯ.
ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ
В КОНФЛИКТНОЙ СИТУАЦИИ
Реальные физические процессы, протекающие в условиях кон-
фликтной ситуации или сводимые к ней, весьма разнообразны по
характеру и содержанию. В одних случаях — это процессы, описы-
вающие двусторонние операции между конфликтующими сторона-
ми, преследующими противоположные цели. Простейшим приме-
ром такой операции может служить задача преследования. В других
случаях — это процессы управления в условиях неопределенности,
например управление объектом, на который действует неизвестное
(в смысле знания статистических характеристик) возмущение.
Однако с математической точки зрения и в том и в другом слу-
чаях такие процессы управления могут быть описаны моделью, в
которую входят по крайней мере две функции управления, служа-
щие «противоположным» интересам. Решение задач оптимизации
процессов в конфликтной ситуации, называемых также минимакс-
ными (максиминными) задачами, имеет ряд специфических особен-
ностей. Рассмотрению этих особенностей и некоторых методов ре-
шения подобного рода задач и посвящается данный раздел. Как и
прежде, будем различать случаи управления дискретными и непре-
рывными системами. Часто (как правило, при наличии седловой
точки критерия качества) задачи управления в конфликтной ситуа-
ции дискретными системами называют многошаговыми играми, а
299
задачи управления непрерывными системами — дифференциальны-
ми играми.
16.1. Управление дискретными системами.
Необходимые условия оптимальности
Математическая модель процесса управления в дискретном слу-
чае имеет вид
-s+i=Z(x<-4>vi)> i=x>N> vieVi>
где Xj — вектор состояния; — векторы управления в f-й мо-
мент времени; Ц, V. — допустимые множества. Считается, что мно-
жества U{9 V. не связаны. В качестве критерия оптимальности, как
и прежде, рассмотрим функцию конечного состояния
(16.2)
Будем полагать, что управляющая последовательность « =
/ = l,N , выбирается из условия обращения критерия (16.2) в мини-
мум, а последовательность v = {v,}, г = 1,7V — из условия обраще-
ния его в максимум.
Данная задача может быть интерпретирована как задача сопер-
ничества двух противодействующих сторон со стратегиями и и v
соответственно. Именно поэтому подобные задачи называют много-
шаговыми играми.
Первая особенность, с которой приходится сталкиваться при
исследовании таких задач, связана с самой постановкой задачи. Дело
в том, что возможны различные постановки задач управления в
конфликтной ситуации, отличающиеся друг от друга и приводящие
к разным результатам. Речь идет прежде всего о том, в какой после-
довательности производят выбор управлений противодействующие
стороны. Если в детерминированных задачах с «односторонним»
300
управлением безразлично, как выбирать управление — сразу за весь
процесс или отдельно по шагам, зная на каждом шаге предыдущий
ход процесса, то в конфликтной ситуации в этих случаях получают-
ся разные результаты. Это различие объясняется тем, что при выбо-
ре управлений до начала процесса каждой из сторон не известны
действия противоположной стороны, и поэтому не может быть ис-
пользована информация о ходе процесса. При выборе управлений
по шагам предполагается, что такая информация может быть исполь-
зована перед очередным выбором управления.
Если управления выбираются до начала процесса, то минималь-
ный гарантированный для стороны результат определится из усло-
вия (минимаксная задача)
/' = min maxJ(w,v); (16.3)
и V
максимальный гарантированный для стороны v результат определит-
ся из условия (максиминная задача)
J* = max minJ(u,v). (16.4)
В общем случае между минимаксным и максиминным значе-
ниями критериев имеет место неравенство
max min J< min max Л (16.5)
Поэтому задачи (16.3) и (16.4) следует различать. Только в том
случае, когда критериальная функция имеет седловую точку, т.е. для
точки (и,v) выполняются условия
J(u,v)< J(w,v)^/(u,v) (16.6)
для любых допустимых йе U и vg V , решения обеих задач совпа-
дают:
min maxJ(i/,v) = max minJ(w,v). (16 7)
301
Седловая точка («, v) в данном случае и дает искомое решение
задачи. Оказывается [5], что при наличии седловой точки у крите-
риальной функции выбор управлений до начала процесса совпадает
с выбором управлений по шагам.
Для решения задач (16.3), (16.4) можно применять два подхода.
Первый подход основан на поэтапном решении исходной зада-
чи. Так, для минимаксной задачи (16.3) на первом этапе отыскива-
ется функция максимума
<p(w) = max/(u,v) (16.8)
многократным решением задачи максимизации J (и, v) По v при фик-
сированных и.
На втором этапе с использованием численных методов решает-
ся задача минимизации функции <р(м) по и. При численной реали-
зации данного подхода оба этапа, естественно, совмещаются. В ре-
зультате первый этап приводит к организации внутреннего цикла, а
второй — к организации внешнего цикла последовательного реше-
ния исходной задачи. Следует отметить, что при решении задач оп-
тимизации на указанных этапах приходится использовать в общем
различные методы. Если для первого этапа принципиально приме-
нимы любые методы математического программирования, то о вто-
ром этапе этого сказать нельзя. Дело в том, что функция максимума
<p(w) в общем случае даже при условии непрерывности и диффе-
ренцируемости функции J(u,v) по и и v является недифференци-
руемой по и, хотя и непрерывной. Именно недифференцируемость
функции максимума <p(w) приводит к значительному усложнению
процесса получения решения минимаксной задачи. Так как произ-
водные функции ф(ы) по и в отдельных точках могут не существо-
вать, то применение традиционных градиентных методов и методов
второго порядка становится невозможным. Приходится ограничи-
ваться методами нулевого порядка, не требующими вычисления ни
первых, ни вторых частных производных.
302
Второй подход к решению задачи заключается в использовании
условий оптимальности непосредственно для минимаксной (макси-
минной) задачи.
Для определенности ограничимся рассмотрением минимаксной
задачи (16.3). Представим ее в виде
J' = min(p(i/), (p(w) = maxJ(w,v).
uet/ veK
(16.9)
Необходимые условия оптимальности управления и для данной
задачи заключаются, как и для любой задачи математического про-
граммирования, в требовании неотрицательности производной фун-
кции ф(и) по любому допустимому направлению г:
j?>о, г = //+егб17, е>0. (16.10)
Однако в отличие от традиционных задач математического про-
Эф
граммирования теперь выражение для производной — в условии
дг
(16.10) не может быть выражено через частные производные функ-
ции ф(и), так как эта функция недифференцируема. Тем не менее
можно показать, что производная по любому направлению г функ-
ции максимума ф(ы) существует и определяется следующим обра-
зом (7]:
М»)
дг
- max
УбЯ(«)
Э/(и,у)Г
ди
Г,
(16.11)
где через R(u) обозначено множество таких v, для которых выпол-
няется равенство ф(м) = J (и,v), т.е.
Я(«) = {уе V: У(и,г) = ф(ц)}. (16.12)
303
С учетом (16.11) необходимые условия оптимальности для ис-
ходной минимаксной задачи (16.3) принимают вид
dJ(u,v)T
max——— r>0
*еЯ(и) Эм
(16.13)
для всех допустимых г.
Условия (16.13) достаточно сложны для практического исполь-
зования. Наиболее целесообразным представляется применение этих
условий для проверки подозреваемого на оптимальность решения. Сам
процесс поиска такого решения может осуществляться по схеме
uk+l = ик + hkrk,
где ик — к-е приближение; гк — направление поиска; hk — шаг
поиска на к-й итерации. Направление поиска гк следует подбирать
так, чтобы производная функции максимума по этому направлению,
вычисляемая согласно (16.11), была наименьшей или, но крайней
мере, отрицательной. Таким образом, на каждой итерации для вы-
бора направления поиска необходимо многократно получать реше-
ние своей оптимизационной задачи (16.11). При этом для вычисле*
Э/ „ 3J(«,v)
ния составляющих — производной —целесообразно ис-
пользовать соотношения (11.10) и (11.12)
3J(i/,v) ЭЯ. т z v
V/ =
ЭЯ,-
Эх.
v/v+1
dXN+l
С некоторыми специальными методами решения минимаксной
задачи (16.3), использующими необходимые условия оптимальнос-
ти (16.13), можно ознакомиться в работе [7].
304
Наиболее простой вид необходимые условия оптимальности
принимают в том случае, когда критериальная функция имеет сед-
ловую точку. В этом случае условия (16.6) можно представить в виде
J(w,v)-J(w,v)< 0< J(w,v)-J(w,v) (16.14)
для любых допустимых we U и ve V .
Зададим w, v в виде
w = w + e5weU, v = v + e6ve7, е>0, (16.15)
где допустимые направления 8w, 5v выберем так, чтобы
Swy. = 0, j * i, диj * 0, j ~ i, dvj = 0, j * i, 8vy. * 0, j = L (16.16)
Разделив (16.14) на e, выразив управления w, v с помощью со-
отношений (16.15), (16.16) и устремив е->0, получим
3J (w,v)r 3J(w,v)r
5“-- (16.17)
Г. э/ Ы
Поскольку производные — и — могут быть вычислены с по-
мощью гамильтониана Я, :
3J ЭЯ, Э/ ЭЯ.
—— .1 I. * —— I *
3w;. 3wz dvf. dvz
где
v.=
эя, .aFfaj
Эх, ЛГ+| ЭХд,+1
(16.18)
(16.19)
необходимые условия оптимальности (16.17) примут вид
305
ЪН]_
dvj
5v,<0<
ЭЯ/'.
ди. 1
(16.20)
Итак, если последовательности ы = {и,}и v = {v,}, < = 1,Я явля-
ются оптимальными для процесса, описываемого уравнением (16.1)
и оцениваемого критерием качества (16.2), то существует такой со-
пряженный вектор у,, определяемый уравнением (16.19), что на лю-
бом шаге процесса управления производная гамильтониана по лю-
бому допустимому направлению Щ неотрицательна, а производная
гамильтониана по любому допустимому направлению Sv, неполо-
жительна.
Условия оптимальности (16.20) можно записать иначе. Введем
в рассмотрение функцию
.. дН? дН? _
(16.21)
й. = ц + еб«р v,. = vz + e6v,, e > 0.
Tогда вместо неравенств (16.20) можно записать
ДЯ|- («pv,) < ДЯ,- (w-,vz.)< ДЯ( («р vf.) (16.22)
или
min тахДЯ/= тахпппДЯ/(й|.,у.). (16 23)
Следовательно, необходимые условия оптимальности (16.20)
эквивалентны существованию седловой точки функции ДЯу при оп-
тимальных управлениях u.,v.. При этом, как следует из (16.21), зна-
чение минимакса (максимина) функции ДЯ/ равно нулю:
306
&Н.(и^) = О.
Если предположить, что гамильтониан Н{ является выпуклой
по Uj и вогнутой по v;. функцией, то условия (16.20) можно рассмат-
ривать как условия существования у самого гамильтониана седло-
вой точки при оптимальных управлениях u^Vj:
ДЯ(. , V,) < ЛН. (u., v.) < Щ (й., v,), (16.24)
или
Я. (ЧЛ) = max min Н. = min max Я,. (й., v.).
14 1 11 vj й,- 1 й, v( ' v ' 1 ’
Необходимое условие (16.24) является аналогом принципа ми-
нимума в детерминированном случае и поэтому может быть назва-
но принципом минимакса. Непосредственная проверка справедливо-
сти принципа минимакса в общем случае затруднительна. Однако в
некоторых случаях она может быть обоснована анализом рассмат-
риваемой задачи.
Упражнение 1. Доказать неравенство (16.5).
Упражнение 2. Показать, что неравенства (16.6) и соотношение (16.7)
эквивалентны.
Упражнение 3. Показать, что в случае дискретного множества V про-
изводная функция максимума
ф(м) = max/(u,Vy) = max/у (и)
по направлению г вычисляется следующим образом:
д/у(«)Г
= тах—— —г,
JeR ди
дф(ц)
Эг
(16.25)
где Л = : Jy («) = J(w,Vy) = (p(w)}. Дать геометрическую интерпретацию
соотношения (16.25).
307
16.2. Управление линейной системой.
Пример двусторонней операции
Рассмотрим задачу управления системой, линейной относитель-
но переменных состояния
х.+1 =4(i//,v/)xp i = l,N, (16.26)
где через обозначена матрица, зависящая от управлений
е Ui , v. е V.. В качестве критерия оптимальности примем линей-
ную функцию конечного состояния
/ = с%+р (16.27)
где вектор с считается заданным.
Сторона, выбирающая управление и, стремится минимизировать
критерий (16.27), а сторона, выбирающая управление v, преследует
противоположную цель — максимизировать этот критерий.
Составим гамильтониан для данной задачи:
я/= ^14 ("/•”/)V (16.28)
Сопряженный вектор согласно (16.19) определится с помощью
уравнения
дН. лТ ( ч
(16.29)
при граничном условии V>v+i = с •
Нетрудно убедиться в том, что значение критерия (16.27), вы-
раженное через вектор текущего состояния, а вместе с этим и через
текущие управления, совпадает со значением гамильтониана для
соответствующего момента времени. Действительно,
J (xn )= cT^nxn ~ V^+1 Anxn ~ Нn>
308
J(xn-] )- и т.д.;
(16.30)
4xi) = vTAjc. = Hr
Если теперь выбор управлений WpV. производить из условия до-
стижения критериальной функцией своего минимаксного значения,
то согласно (16.30) минимаксного значения должен достигать и га-
мильтониан:
Hi - min max Н. (wP v.).
ui vi
(16.31)
Если при оптимальных управлениях критериальная функция
имеет седловую точку, то и гамильтониан при этом должен иметь
седловую точку. Другими словами, для линейного случая принцип
минимакса справедлив независимо от свойств гамильтониана по
управлениям UpV,..
Для иллюстрации применения принципа минимакса рассмот-
рим следующий пример. Пусть математическая модель операции
описывается следующими уравнениями:
Х4|Л1М1Р
*2 /+1 “ Х2 / ~ Х4 /Л 2U2 i >
(16.32)
Д3н.|~х3/ Х2/ЛзУ1/’
X4/+1=X4,”X2//2 4V2/’
где xi ।х4 i — фазовые переменные; — заданные параметры;
и\ г и2 i — управляющие параметры одной стороны; v, р v2, — уп-
равляющие параметры другой стороны в f-й момент времени. На уп-
равления ui,vi накладываются ограничения
. +U2j< 1, V] j + V2 . < 1, Wj> 0, U2 . > 0, V] . > 0, v2. > 0.
309
Считается также, что все переменные состояния х~ > 0 .
В качестве критерия примем
“ ^(X7V+1)“X17V+1 ХЗУ+Г
(16.33)
Требуется найти такое управление для обеих сторон, чтобы в
конце операции критерий принял минимаксное значение.
Для решения задачи обратимся к анализу необходимого усло-
вия оптимальности (16.31). Гамильтониан в данной задаче
Hi = Vim (*! / Л 1«|,) + V2(+l (*2i ~,Р4 2и2,) +
+V3M (*3 i - Х2 !P23V\ ,) + V4M (Х4 , - Х2 ЛЪ (1634)
Сопряженные переменные определяются согласно уравнениям
Vn = = Vlf+v V2i = = v2i+l - V3MP23Vl! - V41+IP24V2 !•
дН дН D D (16.35)
v3< = =V3(+1; V4i = 3^7=V4Z+| -
при граничных условиях
Viw+i Узам = ”^ Vzjv+i V4at+i =^-
Отсюда, в частности, следует, что = 1; у3/ =-1 для всех / = \tN.
Так как граничные условия для сопряженных переменных задаются
на правом конце (при i - N +1), определять оптимальные управле-
ния wpvz будем в обратном времени, начиная с / = .У . Для просто-
ты ограничимся рассмотрением лишь двух? последних шагов.
Итак, при 1-N согласно (16.34), (16.35) имеем
~XIN ~X^N^\U\N ~X3^ +X2AT^23VW
310
Из условия (1631) находим оптимальные управления i/iyv =1,
vIAr = 1. При этом очевидно, что U2N ~ ° > V2N ~ ° •
Перейдем теперь к моменту / = N -1. Согласно (1635) получим
=Р23, ||/4ЛГ = -Р4], и гамильтониан (1634) примет вид
^N~\ = Х1ГЛГ-1 “ Х4 ЛГ-Л 1М1 ЛМ + ^23 (Х2 N-1 ” Х4 ЛГ-1Л 2М2 /V-1 ) “
“(Х3 ЛГ-I “Х2 A'-1^23V1 Лм)“ (Х4 7V-1 “ Х2 Af-1^24^2 N-\ )’
Из условия (1631) находим
W] дг-! = 1, w2 N_i -0 при Р4 j > Р23Р4 2;
U\ N-\ = ^2 ЛМ = ПРИ Л 1 < Л зЛ 2’
Vi ЛМ = V2 tf-l = О ПРИ Р2 3 > Л 1^2 4’
V1 JV-1 = V2 tf-l ~ 1 ПРИ ^2 3 < Л 1Л 4-
Аналогично может быть осуществлен выбор оптимальных уп-
равлений WpVy и для других шагов.
Упражнение. Выявить структуру оптимального управления линейной
системой вида
xf+J = AjXf + B,Uj +CjVit i =
принимая в качестве критерия
J + VT Oivi) +
(=1
и считая, что управляющая последовательность {ц} стремится к его ми-
нимизации, а последовательность {v,} — к максимизации. Ограничения
311
на управления Uj и v, отсутствуют. Какими свойствами должны обладать
матрицы Х(. для существования оптимального решения?
16.3. Управление непрерывными системами.
Необходимые условия оптимальности
Рассмотрим теперь управление непрерывной на интервале [0,7]
системой, описываемой векторным дифференциальным уравнени-
ем
x = /(x,w,v),
(16.36)
где х — вектор состояния; и — вектор управления первой стороны,
стремящийся минимизировать критерий
/ = 7[х(Т)],
(16.37)
v — вектор управления второй стороны, стремящийся обратить кри-
терий (16.37) в максимум. Считаем, что ueU, v€ V .
Получим необходимые условия оптимальности управлений и, v
полагая, что критериальная функция (16.37) имеет седловую точку.
Для этого перейдем от модели системы (16.36) и критерия( 16.37)
к их конечно-дискретным аналогам
х.+1 =х. + 4Г(зд,У/)’ / = О,ЛГ,
J = F(xyv+i).
(16.38)
Для процесса (16.38) необходимым условием оптимальности
является выполнение неравенств (16.14). Как и при одностороннем
управлении, вариации критерия в (16.14) можно выразить с помо-
щью сопряженных переменных. Тогда условия (16.14) примут вид
или
312
Ht (v,+i>xiHI (V,,xi>”,) (vi+i >xi- "<> v,)> (16.40)
где
я, =V,4i/U,«f’v,)-
(16.41)
Сопряженный вектор у, согласно (11.28) удовлетворяет урав-
нению
v,=%+1 + <16-42>
с граничным условием
dF(x„+1)
= ♦ (16.43)
°XN+\
Переходя в соотношениях (16.40)—*(16.43) к пределу при Д —> 0,
необходимым условиям оптимальности можно придать вид
Я(у,х,и,у)< Н (y,x,w,v)< И(у,х,й,г), (16.44)
что эквивалентно равенству
#(w,x,w,v) = minmax#(v,x,u,v) = maxmin#(v,x,u,v)- (16 45)
й&и vgK veH Set/ v * '
В условиях (16.44), (16.45) гамильтониан Н (y,x,w,v) запишет-
ся как
Я(у,х,1/,у) = vr/(x,i/,v), (16.46)
а сопряженный вектор удовлетворяет уравнению
ЭЯ(у,х,И,у) 47)
Эх
313
с граничным условием
Z7n dF[x(r)]
v(r)=~i(T) • <16-48)
Упражнение I. Получить условия (16.40).
Упражнение 2. Показать, что гамильтониан (16.45) на оптимальной
траектории постоянен.
Упражнение 3. Показать, что для критерия общего вида
о
условия оптимальности (16.45) сохраняются с точностью до определения
гамильтониана, который теперь имеет вид
Н (y,x,w,v) = fQ (х,и, v)+wTf(x,u, v).
16.4, Простейшая задача преследования
Рассмотрим простейшую задачу преследования, когда уравне-
ния относительного движения преследователя и преследуемого мо-
гут быть записаны в следующем виде:
x = i/1~vJ, y = u2-v2, (16.49)
где х, у — относительные координаты участников; и2 — управля-
ющие воздействия преследователя; vp v2 — управляющие воздействия
преследуемого. Полагается, что начальные условия х(0), х(0),
у(0), у(0) заданы. На управляющие воздействия преследователя и
преследуемого накладываются ограничения
lvilsvn> Ы-v <16-50>
В качестве критерия оптимальности примем квадрат конечного
промаха
314
J = x(T)2 + y(T)2.
(16.51)
Для простоты время окончания процесса преследования будем
считать заданным. Преследователь стремится минимизировать кри-
терий (16.51), тогда как цель стремится его максимизировать.
Введя обозначения х1 = х, х2 = х, = у, у2 = У, перепишем урав-
нения (16.49) в нормальной форме
xl=x2, x2 = W1-V1;
Л =*2’ У2=и2~У2‘
(16.52)
Требуется выбрать такие управления w(wj,w2) и v(vpv2), кото-
рые с учетом ограничений (16.50) обеспечивают минимаксное зна-
чение критериев (16.51), т.е.
->min max.
и V
(16.53)
Составим гамильтониан для данной задачи:
Н = + у2 (и, - v,)+v3J2 + («2 - v2 )• (16.54)
Уравнения для сопряженных переменных согласно (16.47) име-
ют вид
ЭН п
v'=-aT0’v^'
дн
^=-— = -^.¥2=^2-^’
ЭЯ „
Vj = __ = 0)Уз = ^
ЭЯ
V4=-a^=-V3’ v4=^-cj'-
315
На основании граничных условий (16.48) устанавливаем
у,(Т) = С|=2х,(Г);
vj(D=c2-ci7'=°; с2=с1г; V2=ci(r-');
у3(Т)=с3 = 2у,(Т); (16.55)
V4 (Г) = с4 - С3Г = °; С4 = С3Г; Уз = С3 (г - ')•
В соответствии с необходимыми условиями (16.45) и с учетом
(16.54), (16.50), (16.55) находим оптимальные управления:
«1 = -«™si8nV2 = (Т), V| = -v,„signV2 = -vmsignJC, (Т);
“2 =-“msi8nV4 = -“msWi (Л- v2 = - V'8nV4 = "'’„signy, (T). (I6'56)
Подставляя найденные управления (16.56) в (16.52), получаем
простую систему дифференциальных уравнений
х,=х2, % = -(ип -vjsignx, (Г);
Л =Уг> У2=-(“т “VJsiW| (Г)>
решение которой имеет вид
x1(T) = a-teignx:1(r), (Т) = c-bsignyl (Г), (16.57)
где
а = х1(0)+^(0)Г; с = у^)+уг(р)Т. (16.58)
Отсюда находим х{(Т) и у, (Г):
*1(П=
а -Ь, если а>Ь;
а+b, если а<-Ь\
уЛТ)=
{с-b, если с>Ь',
с + Ь, если с < -Ь.
(16.59)
316
Таким образом, оптимальное управление полностью определя-
ется начальными условиями задачи и при выполнении условий
(16.59) заключается в использовании каждой стороной в течение всего
процесса преследования максимальных значений управляющих воз-
действий.
Если начальные условия таковы, что имеют место неравенства
-b< а < Ь , то решение первого уравнения (16.57) не существует. При
этом преследователь всегда может свести промах Xj (Г) к нулю не-
зависимо от стратегии, которую выберет преследуемый. Аналогич-
ный результат имеет место и для совокупности начальных условий,
при которой -Ь < с < b. Теперь преследуемый может свести к нулю
промах (Г). Поэтому для случаев, когда имеют место неравенства
-b<a<b , -b<c<b, рассматриваемая задача преследования теряет
смысл.
Упражнение. Проверить наличие седловой точки в рассмотренной за-
даче.
16.5. Линейные игры преследования
с квадратичным критерием качества
Пусть имеются две динамические системы, описываемые линей-
ными уравнениями
х_ = Ах_ + Ви, хп(0) = xJJ;
П ПП П ’ П\/ п’
. в /Л\ О (16.60)
xu=4a + buv’ *u(°)=4
где индексы «п» и «ц» обозначают соответственно преследователя и
преследуемую цель; Аг Ар Ар Ai “ заданные матрицы; и — вектор
управления преследователя; v — вектор управления цели; началь-
ные состояния систем х£, х° считаются заданными.
Рассмотрим обобщенный для систем (16.60) критерий качества
Т
J = J (urWu - vTQv)dt + (хп - хц )ГХ(хп - хц ), (16.61)
о
где W, Q, X —- заданные матрицы.
317
Поставим задачу отыскания минимакса (максимина) этого кри-
терия, считая, что преследователь стремится к минимизации крите-
рия, а преследуемая цель — к его максимизации.
Составим гамильтониан для данной задачи:
Н = uTWu - vTQy+vTB Ц,х„ + В„и)++ Вим) (16.62)
Сопряженная система уравнений для определения векторов
Yn, имеет вид
уп=-|^-=-ЛЧ> Vn(7’)=2x(xn-Xu);
ЭЯ .т ч (16.63)
Vu=-^-=-<Vu, VM(^) = -2X(xn-xu),
откуда, в частности, следует ¥п(^) = " Vu(^)-
Применяя условия оптимальности (16.45), получаем следующие
выражения для искомых программ управления:
*=|о-*вцЧ- (16.64)
Подставим (16.64) в (16.60):
I (16.65)
VA.VjV'I'A- хц(0)=4
Системы (16.65) и (16.63) образуют линейную краевую задачу,
которая может быть решена так, как показано в разд. 11.5. Для этого
введем обозначения:
318
- M (M T <2X 'I
lV) <Vu l~2X J
(16.66)
—l-B О-1ДГ
2 u
0
Тогда системы (16.65), (16.63) принимают компактный вид:
х = Лх, х(0) = х«-х2, у(Т)=Хх(Т). (16.67)
Используя обозначение Ф(г,0) для фундаментальной матрицы
системы (16.65), ее решение можно записать в общем виде:
х(г) = Ф(г,0)х(0)
(16.68)
или
х(0 = Фц (лО)х(О)+Ф|2 (z,0)v(0),
¥(/) = Ф21(ЛО)х(О)+Ф22(/,О)у(О),
где через Фу (г, 0) обозначены соответствующие блоки фундаменталь-
ной матрицы. Полагая в (16.66) /= Г и учитывая граничные усло-
вия системы (16.65), получаем уравнение относительно неизвестно-
го вектора \р(0) *
[ф22(Т>0)-ХФ12(Т,0)]а|/(0)=[ХФ11(Т.0)-Ф21(Г,0)]х(0). (16.69)
Если решение этого уравнения существует, то
^(0) = [Ф22(Т,0)-Хф12(Т,0)]-,[ХФ11(Г,0)-Ф21(Т>0)]х(0). (16.70)
319
Для получения окончательного решения задачи по выбору оп-
тимальных программ управления и и v достаточно подставить най-
денное выражение (16.68) с учетом (16.66) в соотношения (16.64).
В заключение сделаем следующее замечание. Поскольку необ-
ходимое условие оптимальности (16.45) предполагает существование
седловой точки у критерия качества, после получения решения за-
дачи необходимо в каждом конкретном случае (имеется ввиду для
конкретных исходных данных) убедиться в ее существовании.
17. ДЕТЕРМИНИРОВАННЫЕ ЗАДАЧИ СИНТЕЗА
ОПТИМАЛЬНОГО УПРАВЛЕНИЯ
Одной из основных задач, которые возникают при управлении
летательными аппаратами, является задача синтеза оптимального
управления, состоящая в определении наилучшего в том или ином
смысле алгоритма (закона) управления летательным аппаратом, т.е.
зависимости управляющего воздействия от текущих координат, до-
ступных измерительным приборам. Решение этой задачи имеет боль-<
шое значение на этапе формирования рациональной структуры зам-
кнутой системы управления летательным аппаратом. Для решения
задачи синтеза могут быть применены различные математически^
методы, которые можно разделить на две больше группы.
Методы первой группы предполагают использование необходи*1
мых условий оптимальности. Поскольку эти условия оптимальное^
ти непосредственно предназначены для решения задачи программи-
рования, то при решении задачи синтеза приходится использовать
дополнительные приемы, например метод фазовой плоскости или
параметрическую аппроксимацию искомого закона управления.
Методы второй группы базируются на использовании достаточ-
ных условий оптимальности, позволяющих определять искомый
закон управления в явном виде. Рассмотрению методов именно этой
группы и посвящен данный раздел.
Строго говоря, задачи синтеза возникают в тех случаях, когда
на объект управления действуют возмущения. Поясним сказанное
на примере управления летательным аппаратом. Предположим, что
целью управления является выведение аппарата в заданную конеч-
320
ную точку. Если допустить, что то^но известны начальное состоя-
ние аппарата и действующие на него в полете силы, то задача опре-
деления управления фактически сводится к задаче программирова-
ния движения. Однако реальное движение происходит в условиях,
существенно отличных от упомянутых. Начальное состояние, как
правило, известно лишь с некоторой точностью. В полете на лета-
тельный аппарат действуют различные возмущения. Если к этому
добавить, что и сама программная траектория может быть реализо-
вана лишь с ошибкой, то станет совершенно очевидно, что летатель-
ный аппарат никогда не будет двигаться вдоль выбранной заранее
программной траектории. Если летательный аппарат не снабдить спе-
циальной системой управления (коррекции), то реальное движение
может сколь угодно отличаться от расчётного и, следовательно, цель
управления не будет достигнута. Таким образом, возникает задача
синтеза управления, т.е. задача формирования закона управления,
который может быть положен в основу построения системы управ-
ления, обеспечивающей достижение цели управления с максималь-
ной точностью. Из сказанного ясно, что при решении задач синтеза
необходимо в общем случае учитывать действующие на летательный
аппарат возмущения. Такие задачи обычно достаточно сложны. Ос-
новным из упрощений, принимаемых при решении задач синтеза,
является неучет случайных возмущений. На первый взгляд может
показаться, что такое упрощение недопустимо, ибо оно связано с
пренебрежением именно теми факторами, которыми обусловлено
возникновение задачи синтеза. Тем не менее, рассмотрение задач
синтеза в детерминированной постановке очень часто является оп-
равданным. В одних случаях удается даже строго обосновать такой
подход. В других случаях это приводит к приближенному решению
задач и отысканию более простых законов управления, позволяю-
щих все же эффективно парировать возмущения (хотя и не опти-
мально).
Математической основой решения задач синтеза являются дос-
таточные условия оптимальности, к изучению которых мы и перей-
дем. По традиции сначала рассмотрим дискретный случай управле-
ния.
321
17.1. Достаточные условия оптимальности
при дискретном управлении
Рассмотрим задачу синтеза оптимального управления дискрет*
ной системой
х/+1=/Ц,Ч.),/ = 1Л, (17.1)
где xz — вектор состояния системы; и. — вектор управления в /-й
момент времени; Ц — допустимое множество; /(х^ц) —
вектор-функция, устанавливающая связь между векторами х., и( и
вектором хм ; N— количество шагов управления.
В качестве критерия оптимальности примем функцию конеч-
ного состояния
J = F(xx+1). (17.2)
Требуется найти такую последовательность законов управлений
Ц(х.)}, / = которая обеспечивает перевод системы (17.1) и|
начального состояния х1 в конечное xN+l с минимальным значат
нием критерия (17.2). Предполагается, что вектор текущего состоя-
ния системы xf. доступен измерению и все измерения производятся
точно.
Введем в рассмотрение функцию
= min F(xNl). (17.3)
{UJeuJ}J=l,N
По определению, ^(xz) есть минимальное значение критерий
(17.2), которое может быть достигнуто при оптимальном управле-
нии системой (17.1), если считать, что ее движение начинается ё?
момента / из состояния х.. Поскольку ^(х(.) характеризует прогно-
322
зируемое значение критерия, будем называть ее функцией будущих
потерь.
Применяя к выражению (173) метод поэтапной оптимизации,
можно записать
= (,7-4)
или
W = min RM [xw = /(х,,К/)]. (17 5)
Согласно определению (173) для момента i = N функция буду-
щих потерь находится так:
RN^ = (17.6)
Таким образом, функция будущих потерь ^(xf.) удовлетворяет
рекуррентному соотношению (17.5) с граничным условием (17.6). Ус-
ловие (17.6) может быть формально представлено также в виде
Я„+1=Г(х„+1). (17.7)
Нетрудно заметить, что последовательность управляющих воз-
действий Ц(х.)}, / = 1, N, найденная в соответствии с рекуррентным
соотношением (1.5), обеспечивает минимальное значение критерию
(17.2). Это следует из определения самой функции будущих потерь.
Действительно, согласно (17.3) для момента /= 1 имеем
Л (х) = min F.
1 1 {«,.€£/,.}
Следовательно, рекуррентное соотношение (17.5) с граничным
условием (17.7) может рассматриваться в качестве достаточных ус-
ловий оптимальности управляющей последовательности
{«.(х.)}, / = 1, W . Фактически рекуррентное соотношение (17.5) реа-
323
лизует метод динамического программирования, разработанный
Р. Веллманом на основе использования выдвинутого им принципа
оптимальности. В соответствии с этим принципом оптимальное уп-
равление в текущий момент времени не зависит от предыстории си-
стемы, а полностью определяется текущим состоянием и целью уп-
равления.
Применение достаточных условий оптимальности к решению
поставленной задачи сводится к последовательному ^шаговому
процессу использования соотношения (17.5), начиная с конечного
момента времени i~ Nn кончая моментом i = 1. В результате опре-
деляются зависимости оптимального управления от текущего состо-
яния системы м/хД т.е. решается задача синтеза оптимального уп-
равления. При этом на каждом шаге минимизация осуществляется
лишь по текущему вектору управления и.. Таким образом, метод ди-
намического программирования, реализующий достаточные условия
оптимальности, представляет собой, по сути дела, метод численно-
го решения задачи синтеза оптимального управления путем после-
довательной (поэтапной) минимизации функции многих перемен-
ных.
Основным препятствием для применения метода является так
называемое «проклятие размерности» — необходимость запомина-
ния на каждом шаге оптимизации функции будущих потерь, т.е. фун-
кции многих переменных. Запоминание таких функций требует ог-
ромного объема памяти ЦВМ. Практически приходится прибегать
к каким-либо аппроксимациям функции будущих потерь. В этом
случае ограничения, накладываемые на вектор управления и вектор
фазовых координат, могут существенно облегчить решение задачи.
Упражнение 1. Убедиться в справедливости метода поэтапной оптими*
зации:
а) показать, что для любых хе Х(х), ye Y(y) имеет место равенство
min <р(х,у) = minmin<p(x,j); (17 8)
x^X.yeY хеХ, yeY t V1'-0/
б) получить аналог соотношения (17.8) для случая, когда на х и у на-
кладывается смешанное ограничение вида (х,у)е Z(x,y);
в) получить соотношение (17.4).
324
Упражнение 2 Показать, что для задачи управления системой
Х/+1 = /Ц,ц), g £/., / = ijv (17.9)
с минимизацией критерия
/ = + (17.10)
достаточные условия оптимальности могут быть представлены в виде ре-
куррентного соотношения
«,(«;) = +Я,= //(*/.«,)]} (17.11)
при граничном условии
^+1=Г(хЛ+1). (17.12)
Выяснить физический смысл функции ЯД*,) в данном случае.
Упражнение 3. Убедиться, что ограничения, накладываемые на фазо-
вый вектор вида X/ g %,, не изменяют структуры достаточных условий оп-
тимальности.
/7.2. Алгоритм оптимальной коррекции.
Линейные дискретные системы, оптимизируемые
по квадратичному критерию
Применение достаточных условий оптимальности проиллюст-
рируем задачей синтеза оптимального алгоритма коррекции траек-
тории летательного аппарата.
В качестве математической модели процесса коррекции примем
систему линейных дискретных уравнений вида
х.+1=4х. + ^Л, (17.13)
где х, характеризует отклонение вектора состояния летательного ап-
парата от расчетного перед проведением /-й коррекции; и. — кор-
325
ректирующее воздействие (управление) в момент I; Д., Bf — матри-
цы, устанавливающие связь векторов xf. и и. с отклонением векто-
ра состояния перед совершением последующей коррекции.
Критерий оптимальности зададим в виде
N
7 = (17.14)
1=1
где — некоторые известные матрицы.
Первое слагаемое в критерии (17.9) характеризует энергетичес-
кие затраты, необходимые для совершения процесса коррекции,
второе — эффект управления конечным состоянием.
Задача состоит в выборе такого алгоритма управления «Дх,.) для
любого момента времени / = !,#, при котором критерий (17.9) об-
ращается в минимум.
Для решения задачи воспользуемся достаточными условиями
оптимальности. С учетом (17.13) и (17.14) рекуррентное соотноше-
ние (17.11) для функции будущих потерь Д(х,.) примет вид
= min[«f + Д+1(Дх. + Б.«.)], i (17.15)
Согласно (17.12) функция будущих потерь удовлетворяет гра-
ничному условию
^yv+i(xN+i^='^Jz+i^jv+r (17.16)
Полагая в соотношении (17.15) i — N, с учетом (17.16) находим
RN(xN) = min[u^WNuN +(ANxN + BNuN)Tk(ANxN + В^иN)]. (17.17)
UN
Оптимальное управление uN в соответствии с (17.17) должно
удовлетворять необходимому условию оптимальности
326
+ 2/^MyyXyv + 2B7NXBNuN - О,
оип
откуда
un ~-^n&n^Anxn =~^nxn’ (17.18)
где
+ 5^; Ln =-Г-^^. (17.19)
Предполагается, конечно, что матрица Г",1 существует. Если
матрица Г\ положительно определенная, то управление (17.18) удов-
летворяет и достаточному условию минимума в выражении (17.17).
В этом случае соотношение (17.19) определяет искомый алгоритм
оптимального управления uN(xN).
Подставив найденное управление в (17.17), получим явное вы-
ражение для функции будущих потерь:
(17.20)
где через AN обозначена матрица вида
С учетом обозначений (17.19) последнее выражение принимает вид
AN=Ajf'kAN ~^NrN^N'
Определив функцию будущих потерь R#(xN), можно перейти к
отысканию этой функции на предыдущем шаге R^tx^), полагая
в (17.15) / = ДГ-1. Поскольку вид функции RN(xN) не изменился
по сравнению с видом функции RN+x(xN+x), то, очевидно, что в ре-
327
зультате применения рекуррентного соотношения (1.15) при j = N -1
получим функцию Rn^(xn_{) в таком же виде. Другими словами,
функция Т^Ц) для любого / может быть представлена в виде
Я,.Ц.) = х/лЛ. (17.21)
В этом можно убедиться, если воспользоваться методом индук-
ции. Предположим, что выражение (17.21) справедливо для момен-
та / + 1, т.е.
= XT+\^i+\Xi+V
Тогда согласно (17.15) функция ДЦ) удовлетворяет соотношению
Я, Ц) = minfwf W.u. + (Aixi + Яд )гЛ/+1 (Aixi + Яд)],
откуда находим искомое управление
(17.22)
где
А = г,=^+я/л/+А (17.23)
Управление (17.23) является оптимальным, если матрица Г,. по-
ложительно определенная. С учетом (17.22) и (17.23) функция
принимает вид (17.21), причем матрица Af. определяется соотноше-
нием
Л,- = А[ АМА(-LTr.L.; Л„+1 =Х. (17.24)
Таким образом, алгоритм (закон) оптимального управления
линейной системой (17.13) при квадратичйом критерии (17.14) яв-
ляется линейным. Матрицу Т. называют матрицей коэффициентов
обратной связи, так как она характеризует взаимосвязь вектора фа-
328
зовых координат xi (выходного вектора замкнутой оптимальной си-
стемы) с вектором управления и,.
Мы уже отмечали, что для обеспечения минимума правой час-
ти рекуррентного соотношения (17.15) необходима положительная
определенность всех матриц Г. Можно показать, что для выполне-
ния этого достаточно потребовать положительной определенности
матриц X и И<, присутствующих в исходном критерии оптималь-
ности.
Упражнение 1. Решить задачу выбора оптимального алгоритма одно-
параметрической коррекции, принимая в качестве модели скалярное урав-
нение
Х/+1 = xi + fyUi > * = L W.
Рассмотреть следующие варианты критериев оптимальности:
1) J~x2n+x \
2) /=|^+11;
ж
3) J = a^|u,| + 4+1;
<=1
4) J = o£uf2+4+1.
/=1
Сравнить между собой получаемые алгоритмы управления.
Упражнение 2. Решить задачу выбора оптимального алгоритма управ-
ления линейной системой (17.13) из условия обращения в минимум кри-
терия
N
J = ^J<xTQixj+uTWiui) + х^+1Лхуу+1.
Г=1
17.3. Достаточные условия оптимальности
при непрерывном управлении. Уравнение Беллмана
Перейдем к задаче синтеза оптимального управления непрерыв-
ными системами, описываемыми дифференциальными уравнения-
ми вида
329
x = f(x,u,t), re [О,Г]. (17.25)
Здесь х — вектор текущего состояния системы; и — вектор управле-
ния, ugU; U — допустимое множество; /(х,м) -вектор-функ-
ция правых частей уравнения; [0,7] — заданный интервал времени
управления.
В качестве критерия оптимальности, как и прежде, рассмотрим
функцию конечного состояния
J = F[x(T)]. (17.26)
Требуется найти такой закон управления м(х,г), который обес-
печивает перевод системы (17.25) из начального состояния х(0) в
конечное х( 7) с минимальным значением критерия (17.26).
Для получения достаточных условий оптимальности в такой
задаче дискретизируем ее:
хм =x.+2V;.(xpW.), / = 1л, (17.27)
/ = Л^+1). (17.28)
Здесь через А обозначен шаг дискретизации.
Теперь воспользуемся достаточными условиями оптимальнос-
ти для дискретного случая. Применительно к рассматриваемой за-
даче рекуррентное соотношение (17.5) примет следующий вид:
^(x,.) = nun{^+|[xf + /(%,.,«,.)&]}. (17.29)
Предположим, что функция будущих потерь 7^(xz) является
дифференцируемой. Тогда, разлагая функцию 7^+1 в ряд Тейлора в
окрестности точки xz, получаем
Г ^dT ]
RjЦ) = min j RM (x,) +—-£±L ft(xt, u()Д + 0(Д) k
«,•€1/ I OX .1 I
(17.30)
330
где через 0( Д) обозначены члены более высокого порядка малости
по сравнению с Д. Перепишем (17.30) в виде
-Л+1(х) + Л(х) . [ЭЯГ. ln/AJ
———£---------i—!_ = mm < — (х;)Л(х,.,ц,) +—0(Д) к
Д «,е£/ Эх^ & J
Перейдем теперь в обеих частях уравнения к пределам при
д ->0, полагая, что они существуют. Получим уравнение
-ЭЯ(х,0
dr
= min
u(t)eU
рЛ(х,Г)
t Эх
/(x,w,r)
(17.31)
которое называется уравнением Веллмана. Оно представляет собой
дифференциальное уравнение в частных производных относитель-
но функции будущих потерь Я(х,г). Граничное условие для этого
уравнения согласно (17.7) имеет вид
Л(х,Т) = Их(Г)}.
(17.32)
Таким образом, функция будущих потерь Я(х,Г), равная по оп-
ределению наименьшему значению критерия Лх(Г)] при движении
системы с момента t из состояния х(г), т.е.
Я(х,Г)= min F[x(r)], (17 33}
может быть найдена как решение задачи Коши для дифференциаль-
ного уравнения в частных производных (17.31). Поскольку при ре-
шении уравнения Веллмана попутно определяется и алгоритм оп-
тимального управления w(x,r), это уравнение, как и в дискретном
случае, может рассматриваться в качестве достаточных условий оп-
тимальности.
Решить задачу синтеза в общем случае с помощью достаточных
условий оптимальности (17.31) и (17.32) можно лишь численно. При
этом рекуррентное соотношение (17.29) представляет собой один из
331
алгоритмов приближенного решения уравнения (17.31). Строго го-
воря, уравнение Веллмана (17.31) получено в предположении не-
прерывной дифференцируемости функции будущих потерь R(x,t)
по своим аргументам. Однако оно может быть использовано при со-
ответствующем обосновании и в случаях, когда функция R(x,t) не-
дифференцируема. При этом необходимо следить за тем, чтобы в
местах разрыва производных сама функция R(x,t) была непрерыв-
ной.
Упражнение 1. Показать, что для задачи управления системой (17.25)
с критерием оптимальности более общего вида
7 = }/»(адгИ + Г[х(Г)] (1734)
О
достаточные условия оптимальности в форме уравнения Веллмана прини-
мают вид
d/?(x,r) . z0/
-----L2-Z = mm/° (х, и, t) +
д/ net/ I
ЭЯ(х,01Г t. J
Эх J I
(17-35)
с прежним граничным условием (17.32).
Упражнение 2. Показать, что для задачи синтеза оптимального управ-
ления u{x,t), переводящего систему (17.25) в заданное (непосредственно
или косвенно) конечное состояние х(Т) за минимальное время Т, т.е. для
задачи синтеза оптимального по быстродействию управления системой
(17.25), уравнение Веллмана принимает вид
. . ЭТ(х)т f( А
-i = min
ueU Эх
(17.36)
где через Т(х) обозначено минимальное время перевода системы (17.25)
из текущего состояния х в состояние х(Т).
332
17.4. Оптимальное интегро-терминальное управление
летательным аппаратом. Аналитическое конструирование
оптимальных регуляторов
Рассмотрим задачу формирования оптимального алгоритма (за-
кона) управления летательным аппаратом, используя в качестве
математической модели линеаризованные относительно некоторой
опорной траектории уравнения движения
х = Ах+Ви, (17.37)
где вектор х характеризует отклонение текущего состояния летатель-
ного аппарата от опорного; и — вектор управляющего воздействия,
например компоненты ускорения, создаваемого двигательной уста-
новкой; А и В — матрицы частных производных правых частей ис-
ходных нелинейных уравнений движения, получаемые в процессе
линеаризации последних. Критерий оптимальности зададим в виде
J = jurWu dt + x(T)rlx(T)f (17.38)
о
где FF,X — заданные матрицы, причем W— положительно опреде-
ленная.
Первое слагаемое в критерии (17.38) характеризует энергетичес-
кие затраты, необходимые для процесса управления, второе — эф-
фект управления конечным состоянием.
Задача заключается в выборе закона управления u(xj), обраща-
ющего критерий (17.38) в минимум. Предполагается, конечно, что
в любой момент времени вектор состояния х может быть измерен.
Для решения задачи обратимся к достаточным условиям опти-
мальности в форме уравнения Веллмана (17.35), которое с учетом
(17.37) принимает вид
ЭЯ
— = mm
Эг «(О
( 2) р 1
— (Ах + Ви)\,
I Эх 1
(17.39)
333
причем согласно (17.32)
A(x,T) = xrU. (17.40)
Осуществляя операцию минимизации в (17.39), получаем зави-
симость оптимального управления от функции будущих потерь:
2 дх
(17.41)
С учетом (17.41) уравнение (17.39) для функции R(x,t) прини-
мает вид
Э/ 4 дх
BV-W — +
Эх
т
(17.42)
Решение этого уравнения для функции R(x,t), удовлетворяю-
щее граничному условию (17.40), будем искать в виде квадратичной
формы
Л(х,0 = хгЛх, (17.43)
где л — некоторая матрица, зависящая только от времени: Л = Л (/).
Подставляя (17.43) в (17.42), получаем
-хгЛх = -xTABW~'BTx + 2xtAj4x.
Отсюда следует, что матрица Л должна удовлетворять диффе-
ренциальному уравнению типа Риккати:
-K=ka+atk-kbw-ibt\.
(17.44)
Поскольку при /= Гдолжно иметь место условие (17.40), полу-
чаем
Л(Т) = Х.
(17.45)
С учетом выражения (17.43) для функции будущих потерь оп-
тимальное управление (17.41) окончательно принимает вид
м = -ГГ-1ВгЛх = -£х,
(17.46)
334
где введено обозначение
£ = 1У-‘5ГЛ. (17.47)
Таким образом, оптимальный закон управления в задаче управ-
ления линейной системой (17.37) с квадратичным критерием каче-
ства (17.38) является линейным.
Оптимальная система управления, соответствующая найденно-
му решению, представляет собой линейную систему с переменны-
ми по времени коэффициентами обратной связи, представленными
в виде матрицы L. Характерно, что элементы матрицы L зависят от
времени даже в случае, когда матрицы А, В, Wне зависят от време-
ни. Это следует непосредственно из уравнений (17.44), (17.45). Од-
нако если А, В, Wне зависят от времени, то при достаточно боль-
шом Т можно говорить об «установившемся» режиме. В этом слу-
чае, полагая Л = 0, получим следующее нелинейное матричное ал-
гебраическое уравнение относительно постоянной матрицы Л:
KA + ATK = KBW-'BTK. (17.48)
Решение уравнения (17.48) можно рассматривать как предел
решения системы (17.44) при Т -» «», если такой существует. В этом
случае можно говорить об оптимальной системе управления с по-
стоянными коэффициентами. Впервые задача синтеза оптимально-
го управления линейным объектом с квадратичным критерием ка-
чества под названием «Аналитическое конструирование оптималь-
ных регуляторов» была поставлена и решена А.М. Летовым. Эта за-
дача имеет достаточно широкую область применения и использует-
ся при проектировании оптимальных регуляторов для различных
систем автоматического управления.
Упражнение 1. Показать, что при использовании критерия вида
г
J = j (xTQx+uTWu)dt + х(Т)т Хх(Г)
О
алгоритм оптимального управления системой (17.37) имеет по-прежнему
структуру (17.46). Изменение претерпевает лишь уравнение (17.44) для
матрицы Л. Получить это уравнение.
335
Упражнение 2. Решить задачу синтеза оптимального по быстродействию
управления угловой скоростью летательного аппарата, принимая в каче-
стве математической модели скалярное уравнение
ш=и |м|<мтах
и считая, что <о(Т) = 0.
Упражнение 3. Исследовать задачу синтеза оптимального по быстро-
действию управления летательным аппаратом, принимая в качестве моде*
ли уравнения
<j> = ex 6> = u, |«|<umax,
где Ф — угол разворота; и — угловая скорость летательного аппарата.
Показать, что уравнению Веллмана (17.36) в данном случае удовлет-
воряет следующая функция будущих потерь:
7'(ф,со) =
2^(й2+ф + (О,
2^йГ+ф-<в,
ш|ш|
ф<-у~,
а следовательно, оптимальный закон управления имеет вид
и = -sign <р+
(01 ш|
2
Упражнение 4. Решить задачу синтеза оптимального управления лета-
тельным аппаратом, принимая в качестве математической модели уравне-
ния
А = х2;
х2=-ах2+£н, |«|<wmax,
(где параметры хх,х2 определяют угловое отклонение аппарата от задан-
ного направления и угловую скорость; и — управляющее воздействие;
о, b, wmax — заданные величины (для простоты можно принять
g = 1, b = 1, wmax = 1)), а в качестве критерия оптимальности — величину
J - J(x12 +х% +u2)dt.
о
336
18. СТОХАСТИЧЕСКИЕ ЗАДАЧИ СИНТЕЗА
ПО ПОЛНЫМ ДАННЫМ
Перейдем к рассмотрению задач синтеза оптимального управ-
ления при действии случайных факторов. Предполагается, что ап-
риорные стохастические характеристики действующих возмущений
известны, и поэтому они могут быть учтены при формировании
алгоритма управления. Именно такие задачи называются стохасти-
ческими задачами синтеза.
Будем различать два типа стохастических задач синтеза: задачи
управления по полным данным и задачи управления по неполным
данным.
В первом случае, при управлении по полным данным, предпола-
гается, что формирование управления и осуществляется при нали-
чии полной информации о текущем состоянии объекта х (рис. 18.1).
Другими словами, в любой момент времени может быть точно из-
мерен полный вектор состояния х. Вектор измерений у в этом слу-
чае просто совпадает с векторм состояния х.
Во втором случае, при управлении по неполным данным, считает-
ся, что измерению доступна лишь часть компонент вектора состоя-
ния либо другой вектор у, связанный с вектором состояния х, но не
совпадающий с ним.
Обсуждение начнем с более простого случая управления по пол-
ным данным. Как и в детерминированных задачах синтеза, исполь-
Рис. 18.1. Блок-схема системы управления
337
зуем достаточные условия оптимальности. Сначала рассмотрим слу-
чай дискретного, затем — непрерывного управления.
18.1. Достаточные условия оптимальности.
Дискретный случай
Рассмотрим задачу управления следующей дискретной стохас-
тической системой:
' = МЛ (18 1)
где х, — вектор текущего состояния; и{ — вектор управления в /-й
момент времени; — вектор случайных возмущений; /• — век-
тор-функция; ЛГ— количество шагов управления.
Будем считать, что случайные возмущения {} являются неза-
висимыми для разных моментов времени.
Поставим задачу определения такого алгоритма (закона) управ-
ления и.(х^ для любого момента времени, который обеспечил бы
перевод системы (18.1) из заданного начального состояния х, в ко-
нечное xN+{ с минимальным значением критерия
7 = М[Г(хх+|)]. (18.2)
Задание начального состояния xt не нарушает общности рас-
смотрения задачи, так как случайные разбросы вектора Xj (если такие
имеются) могут быть отнесены к вектору .
Как уже упоминалось, предполагается, что вектор текущего со-
стояния х( может быть точно измерен.
С учетом сказанного случайный процесс, описываемый систе-
мой (18.1), является марковским.
Покажем, что применение метода динамического программи-
рования в данной задаче, как и в детерминированном случае, обес-
338
печивает выполнение достаточных условий оптимальности. Для этого
введем в рассмотрение функцию будущих потерь
Я(Ц)= min_ A/[F(xw+1)/xzl, (18.3)
Uj^Uj J =i,N
представляющую собой минимальное значение критерия (18.2), ко-
торое может быть достигнуто при оптимальном управлении систе-
мой (18.1), начиная с момента времени i из состояния хг Символ
М [.../х(] означает условное математическое ожидание.
Раскрывая в (18.3) операцию математического ожидания, исполь-
зуя правило пересчета переходных плотностей вероятностей марков-
ского процесса и применяя поэтапную оптимизацию, можно запи-
сать:
(х/) = J f(~xn+\ I Xi >^+l =
/=1Л
= min min
U/cUj у
;=i+l ,N
= jF(xN+l)P(xN+l/xi+i)dxN+lP(.xM/Xi)dxM =
= J™J Ям )^,+i M • (18.4)
Здесь P(xN+} /х{) — переходная плотность вероятностей процесса
(18.1) при управлении «Дх,), т.е. условная плотность вероятностей
вектора xN+i при фиксированных xf , ц.. Интегралы в (18.4) следует
понимать как многомерные с областями интегрирования, совпада-
ющими с областями изменения векторов xN+l, хм соответственно.
339
Другими словами, функция будущих потерь /^.(х.), определяе-
мая согласно (18.3), удовлетворяет следующему рекуррентному со-
отношению:
Rl(xi) = min Л/[^.+1(х,.+| )/х,(18.5)
Поскольку для последнего момента управления i = N по опре-
делению имеем
^^) = итт М[F(xn^)/xn,Un},
граничное условие для рекуррентного соотношения (18.5) может быть
формально записано в виде
^У+1(ХУ+1) “ ^XN+\ )•
(18.6)
Применяя соотношение (18.5) последовательно, начиная с мо-
мента i = N, получаем при i = 1 значение , которое согласно
(18.3) представляет собой минимальное значение критерия (18.2):
Другими словами, последовательность управляющих воздействий
{w/Ц)}, / = 1,N, вычисленная в соответствии с рекуррентным соот-
ношением (18.5) с учетом граничного условия (18.6), оптимальна.
Таким образом, рекуррентное соотношение (18.5) совместно с
граничным условием (18.6) можно рассматривать как достаточные
условия оптимальности в задаче синтеза оптимального управления
системой (18.1) с критерием (18.2).
Упражнение 1. Получить рекуррентное соотношение (18.5).
Упражнение 2. Показать, что в задаче управления системой (18.1) с
критерием оптимальности вида
/ = Л/
’ N
./=1
)
(18.7)
340
достаточные условия оптимальности jMoryT быть представлены в виде ре-
куррентного соотношения
Я(х) = min М {[/«(х, W/. ,£,) + Л+1(х+] )]/х ,w.} (18.8)
с прежним граничным условием
(18.9)
18.2. Алгоритм оптимальной коррекции. Линейные
дискретные системы, оптимизируемые
по квадратичному критерию
Иллюстрацию применения достаточных условий оптимальнос-
ти начнем с задачи синтеза оптимального алгоритма коррекции тра-
ектории космического аппарата. Процесс коррекции будем описы-
вать следующей математической моделью:
х,.+1 = А.х. + 5.(1 + ц.)и. + ^., / = Ш (18.10)
Здесь вектор х, по-прежнему характеризует отклонение вектора
состояния аппарата от расчетного перед проведением /*-й коррекции;
и — корректирующее воздействие (управление) в момент z; Д , В. —
заданные матрицы; Ц, — центрированная случайная величина с за-
данной дисперсией D , которая характеризует ошибки реализации
управляющего (корректирующего) воздействия, пропорциональные
величине этого воздействия, так называемое мультипликативное воз-
мущение; — центрированный случайный вектор с корреляцион-
ной матрицей , характеризующий ошибки реализации управля-
ющего воздействия, не зависящие от величины самого воздействия,
другими словами — аддитивное возмущение.
В качестве критерия оптимальности примем ожидаемое значе-
ние обобщенной характеристики, равной по аналогии с детермини-
341
рованным случаем взвешенной сумме энергетических затрат, необ-
ходимых для проведения коррекции, и конечной точности
J-M
~ N
+xTNJxN^
(18.11)
где W(i X — заданные матрицы.
Будем полагать, что перед проведением каждой коррекции мо-
жет быть точно измерен вектор текущего состояния.
Для определения алгоритма оптимальной коррекции uz(xz) об-
ратимся к достаточным условиям (18.8) и (18.9). Применительно к
рассматриваемой задаче эти условия примут вид
/^.(х.) = + A/[/^+1(x.+1)/xz,wz]}, i = 1» ЛГ; (18.12)
^y+i^v+r (18.13)
Как и в детерминированном случае, по индукции нетрудно ус-
тановить, что функция будущих потерь Rfa) для любого момента
времени i может быть представлена в виде
ЛДх/) = х/'л.х. + сг (18.14)
Действительно, для момента i = 7V+ 1 выражение (18.14) спра-
ведливо, причем согласно (18.13)
Лл+1=х, с„+1=0. (18.15)
Допустим, что выражение (18.14) справедливо и для момента
/ + 1, т.е.
^+1Ц+1) = х/ч1Л1+1Х1+1 + с/+г (18.16)
Тогда рекуррентное соотношение (18.12) с учетом (18.16) и
(18.10) принимает вид
342
R{ (xz) = min {uT W.Uj + M [Ц.х. + B{(1 + pz )uz + £z]Г x
xA/+1 [ A.x. + B.(1 + ц.)и. + ] + cM }=
= min [uT W.u. + xT AT Км Aixi + 2xT AT Az+I Bjui +
ui
+(\ + DIXi)u}B]'AMBlul+Sp(KMD^+cM}. (18.17)
Здесь символ Sp означает след матрицы.
Отсюда находим, что алгоритм оптимального управления дол-
жен иметь вид
и^-Ь.хр (18.18)
где матрица коэффициентов обратной связи L, определяется выра-
жением
Lt = rfBfAMAp Г, = W. + (1 + )BfAMB.. (18.19)
Следует отметить, что управление (18.18) минимизирует правую
часть выражения (18.17), если матрица Г. оказывается положительно
определенной.
С учетом найденного алгоритма управления (18.18) выражение
для функции будущих потерь (18.17) принимает вид (18.14), причем
матрица Az и коэффициент cz оказываются связанными с А/+1 и cz+I
соотношениями
a,=44+14-W,.;
С,.=е/+1+5р(Л,.+1^). <18'20)
Таким образом, функция будущих потерь в рассматриваемой
задаче управления линейной стохастической системой (18.10) с квад-
343
ратичным критерием оптимальности (18.11) имеет квадратичную
структуру (18.14). Матрица А. и коэффициент ср входящие в нее,
определяются в соответствии с рекуррентными соотношениями
(18.20) при граничных условиях (18.15). Алгоритм оптимального уп-
равления при этом (18.18) является линейным. По форме он совпа-
дает с соответствующим алгоритмом управления детерминирован-
ной системой. Однако коэффициенты обратной связи, определяе-
мые матрицей £,, в общем случае будут иными, так как L. соглас-
но (18.19) теперь зависит от статистических свойств мультиплика-
тивного возмущения ц,. Если же Ц,- отсутствует, т.е. Р = 0, то
нетрудно видеть, что матрица Lt определяется точно так же, как и
в детерминированном случае.
Итак, при наличии только аддитивных возмущений алгоритм
оптимального управления линейной стохастической системой пол-
ностью совпадает с алгоритмом оптимального управления соответ-
ствующей детерминированной системой. Аддитивные возмущения
оказывают влияние лишь на величину критерия оптимальности че-
рез параметр с, в соответствии с соотношением (18.20). Наличие муль-
типликативного возмущения приводит к изменению самого опти-
мального управления (в данном случае не структуры, а лишь его
параметров).
Упражнение I. Получить выражение для функции будущих потерь
(18.14).
Упражнение 2. Используя полученное решение, найти алгоритм опти-
мальной однопараметрической коррекции космического аппарата, считая
xj и ui скалярными величинами. Показать, что при управлении только ко-
нечным состоянием (И< = 0) оптимальное управление в любой момент вре-
мени полностью определяется параметрами модели A.,Bi и дисперсией
— именно в этот момент времени.
Упражнение 3. Используя полученное решение, найти алгоритм опти-
мальной двухпараметрической коррекции, считая х( двухмерным вектором,
а — скаляром. Показать, что в случае управления конечным состоянием
(= 0) при наличии только аддитивного возмущения ( = 0) опта м ал ь-
344
ная стратегия управления сводится к проведению лишь двух последних кор-
рекций, так как проведение других коррекций не приводит к дальнейше-
му уменьшению критерия оптимальности.
Упражнение 4 Используя достаточные условия оптимальности, найти
алгоритм однопараметрической коррекции летательного аппарата, прини-
мая в качестве математической модели скалярное уравнение
х.+1 = х. + Bt{u. + ц,-), / = 1, /V,
где случайная ошибка реализации корректирующего воздействия ц, счи-
тается тождественно равной нулю, если w. - 0. При и * 0 она представля-
ет собой центрированную гауссовскую величину с единичной дисперсией.
В качестве критерия оптимальности рассмотреть следующие варианты:
J = M
•/ = Л/[Зи,1+4.1
1м
18.3. Учет дополнительных терминальных ограничений.
Дискретный случай
При решении практических задач синтеза оптимального управ-
ления часто приходится учитывать, кроме ограничений, наклады-
ваемых на вектор управления, дополнительные терминальные ог-
раничения вида
М[^(ху+1)]<ЛЛ ; =
где F-'(xAr+l) — известные функции вектора Л — некоторые
заданные величины; / — количество ограничений.
Задача формулируется следующим образом. Требуется найти
такой алгоритм управления системой (18.1), который, обращая в
минимум критерий (18.2), удовлетворял бы ограничениям
345
/>=л/[^(ху+1)]<лЛ
(18.21)
Для учета последних обратимся к методу множителей Лагран-
жа. Составим обобщенный критерий оптимальности
/
7 = £“/»> (18.22)
7=0
где а.. — множители Лагранжа; причем а0 = 1, 7° = M[F(xN+l)].
В соответствии с известными необходимыми условиями опти-
мальности (теорема Куна—Такера) условная минимизация критерия
(18.2) с учетом (18.21) может быть заменена безусловной миними-
зацией обобщенного критерия (18.22), если множители Лагранжа
ау, j = 1,/ определить как неотрицательные корни, ау > 0, системы
уравнений
ау[7'(а)-7/]==0, у = 1,(18.23)
I
Здесь под а понимается вектор с компонентами ау, у = 1,/. Урав-
нения (18.23) следует понимать таким образом, что либо ау ~ 0, если
JJ < Jj, либо ау > 0, если 7У = 7/. Если же при всех ау. > 0 имеет
место неравенство Jj >Jj, то решения задачи не существует, так
как ограничение 77 <7/ не может быть выполнено.
Следует заметить, что в случаях, когда ограничения (18.21) вы-
полняются в виде строгих равенств, то существование осу, при ко-
торых эти равенства имеют место и одновременно обеспечивается
минимум обобщенного критерия оптимальности, является достаточ-
ным условием того, чтобы основной критерий также достигал ми-
нимума.
346
Действительно, допустим, что существуют такие множители ау,
при которых управляющая последовательность «*={«*}, / = 1,7V об-
ращает критерий (18.22) в минимум
7(w*) = min7(w)
и
и имеют место равенства
Тогда для любых и имеет место неравенство
7°(и') + £s 7°(и) + £ ajJj(u),
J=' J=i
откуда
7°(«) < 7°(«)+5>,.[7Л«) - 7/].
J
Но последнее условие и означает, что управление и* обеспечи-
вает минимум критерия 7° при условии 7;(м) = 7/, J = l,
Общая последовательность решения задачи теперь сводится к
следующему. Из условия минимизации обобщенного критерия на-
ходим структуру оптимального управления. Для этого по-прежнему
используем основное рекуррентное соотношение (18.5), однако гра-
ничное условие (18.6) в соответствии с (18.21)—(18.22) принимает
теперь вид
i
^N+SXN+l )=YajFJ(<xN+i'>’ (18.24)
7=0
где «0 = 1, Г°(хЛ,+|) = Г(хЛ,+1).
Нетрудно видеть, что получаемый при этом алгоритм оптималь-
ного управления оказывается зависящим от вектора множителей
Лагранжа а, и, = и,(хра). Для определения компонент ау. необхо-
347
димо обратиться к условиям (18.23), раскрыв предварительно в них
зависимости J>(a). С этой целью, полагая, что структура оптималь-
ного управления u(x.,a) определена, введем в рассмотрение функ-
ции будущих потерь
^(х,.) = Л/[£Лхл,+|)/х/], у = и. (18.25)
В выражениях (18.25) отсутствует лишь операция минимизации
по управлению. Функция /^(х.) представляет собой фактически ве-
личину , вычисленную при условии, что движение системы (18.1)
начинается с момента i из состояния xt и происходит с выбранным
уже алгоритмом оптимального управления. Очевидно, функции
Ц(х.) через алгоритм управления также зависят от вектора a, т.е.
7^/(х.) = ^/(х.,а). Полагая в (18.25) / = 1, получаем
/^(х1.а) = М[Р(хЛГ+|)/х1] = 7>(а)> у=й
I
С учетом этих соотношений система (18.23) для определения а
может быть представлена теперь в виде
Выясним теперь, каким образом можно найти функции Я/Ц) •
Из выражения (18.25) следует, что
= J )P(xN+l /Xi^^XN+\ =
= j (xy+1) P(xN+x I x/+1 )P(xi+{ I xj )(ixN+ldxi+l =
= J%(x,.+i)P(xf+1 /x)dxM =M[RJ+l(xl+l /X,.)].
348
Следовательно, каждая функция Я/Ц) может быть определена
с помощью рекуррентного соотношения
^(х^М[В/+1(хм/х^ / = 1,/
(18.26)
с граничным условием
Rjn+\ (xn+\ ) ” Fj(xn<a
(18.27)
получаемым сразу из (18.25), если принять i = W+ 1.
Таким образом, определение оптимального управления в дан-
ной задаче сводится к применению основного рекуррентного соот-
ношения (18.5) с граничным условием (18.24) для выявления струк-
туры этого управления, к применению рекуррентных соотношений
(18.26) с граничными условиями (18.27) для установления зависи-
мостей 7у (а) при разных j и последующего решения системы (18.23)
относительно вектора а.
Упражнение. Показать, что в задаче управления системой (18.1) с кри-
терием оптимальности вида
~ N
J-M Х/иЦ^Л,)^/70^)
при дополнительных ограничениях
достаточные условия оптимальности при определении структуры оптималь-
ного управления могут быть представлены в виде рекуррентного соотно-
шения
(18.28)
349
а при раскрытии зависимостей /7(а) — в виде
Я/Ц) = Л/{[/>Ц.,И(Л,.) + ЛД,Ц+1)ух/}, ; = М (18.29)
с прежними граничными условиями
i
^У+1 X aj (XN+l)»
7=0
18.4. Оптимальное управление стационарным спутником
с использованием двигателя большой тяги
Для иллюстрации методики учета изопериметрических ограни-
чений рассмотрим задачу выбора алгоритма оптимального управле-
ния, обеспечивающего перевод стационарного спутника Земли из
одной точки орбиты в другую с требуемой точностью при минималь-
ных энергетических затратах.
Под стационарным спутником понимается спутник, двигающий-
ся в направлении вращения Земли по экваториальной круговой ор-
бите с периодом обращения, равным периоду собственного враще-
ния Земли. Для наблюдателя, находящегося на Земле, такой спут-
ник будет казаться неподвижным.
Перевод спутника предполагается осуществлять с использова-
нием корректирующей двигательной установки большой тяги, по-
зволяющей реализовать корректирующие импульсы скорости прак-
тически мгновенно. В начальный момент i = 0 к спутнику прикла-
дывается по касательной к траектории некоторый импульс скорос-
ти, в результате чего орбита движения становится эллиптической.
Возникшая разница в периодах обращения по эллиптической и пер-
воначальной круговой орбитам приводит к дрейфу, т. е. види-
мому для земного наблюдателя смещению. Дальнейшие корректи-
рующие импульсы прикладываются в моменты прохождения спут-
ником точек апогея (перигея) /= 1, 2,..., N и предназначаются для
постепенной ликвидации дрейфа к последнему моменту Х+ 1 при
условии обеспечения требуемой конечной точности перевода.
350
Введем обозначения: — текущее угловое расстояние между
У-м прохождением через апогей (перигей) и требуемым положени-
ем; х2. — угловая скорость дрейфа в У-й момент прохождения апо-
гея, измеряемая угловым смещением спутника за один оборот; м, —
величина У-го корректирующего импульса, пересчитанная в скорость
дрейфа; р, — случайный коэффициент с дисперсией о? , характе-
ризующий разброс У-го корректирующего импульса.
Тогда математическая модель процесса перевода может быть
представлена в виде следующей системы конечно-разностных урав-
нений:
%+1=% + Х2Р
Л2/+1=^ + (1 + и,)“,
или в матричном виде
х/+1 = ^ + ^(1+^.,
где
хи
kX2i
1
1
По условию задачи считается, что х^ - 0, х10 — некоторая из-
вестная величина.
В качестве характеристики конечной точности примем величи-
ну
Jx = M[J^M[xTN+}XxN+i],
где J1 — параметр эллипса
хт>кх = J1,
характеризующего область допустимых конечных разбросов в момент
N+ 1 в пространстве Если X — единичная матрица, то
351
хгКх = /1 является квадратом радиуса окружности рассеивания, а
величина 7* — соответственно вторым моментом этого радиуса.
Если допустить, что математическое ожидание вектора xN+l равно
нулю, то величина 71 будет характеризовать просто дисперсию ра-
диуса рассеивания.
В процессе перевода требуется обеспечить выполнение условия
71<7J,
где 7J — заданная величина.
Энергетические затраты, подлежащие минимизации, оценим
величиной
JQ = M
' N
./=0
В соответствии с изложенной методикой алгоритм оптимальной
коррекции ыДх,) может быть найден с помощью рекуррентного со-
отношения (18.28), которое в данном случае принимает вид
АЦ) = minW + M[Ri+l(xM)/xi,«,]}
ui
при условии
^JV+1 (*#+1 ) = XW+1^V+! •
В соответствии с выражениями (18.14)—(18.20) устанавливаем^
что для функции будущих потерь Rfa) имеет место формула
где матрица Л. определяется с помощью рекуррентного соотноше-
ния
352
Ai=ATAiA-LTriLi
при граничном условии
Ayv+1 = Л.
Здесь Г, = а+(1 + о?)5гЛ/+1 Д L. = Гг’/Нл.^Л.
Алгоритм оптимального управления имеет вид
ч=~Ал-
Полученные соотношения могут быть расписаны и в скалярном
виде:
Л =(А11)/х1у + 2(Л12)/х1/х2/ + (Л22)/х^.,
(Лц)| =(Лц)/+1 ~(Л12\+1 А/»
(A12)f- =(Л[1)/+1 +[а+а?(Л22).+1]Ли;
(Aji), =(Ан)/+1 +[а + o?(A22).+1](Lu + LjP,
где
Г/=а+(1+о?)(Л22)(+1
при граничных условиях
(ЛП^+1=\р (Л12^+1 =^12» (Л22^+1=^22-
Для определения множителя а установим зависимость 7!. С
этой целью обратимся к рекуррентному соотношению (18.26)
/?/(x.) = A/[/?4l(xz+l)/x.]
с граничным условием (18.27)
= ХЛГ+1^У+1 •
353
Нетрудно установить, что функция Л/(х.), как и функция
Rj (xz), в любой момент может быть представлена в виде квадратич-
ной формы
R}(x.) = xf А\х..
Действительно, полагая, что последнее справедливо для момента
/+ 1, т. е.
= хмЛыхн-1
из рекуррентного соотношения для Я/(х,) находим
R* Ц) = М {[Ах, - BL. (1 + н,) х- f Л|+| [Лх(. - (1+ц,. )х,]/ х(}=хГд'х..
При этом матрица Л?(х.) связана следующим рекуррентным соот-
ношением с матрицей Л}+|:
Л]. = ATls)MA + ЦП. - AtA'mBL. - ЦВтЛ}+1Л,
где Г} = ЯтЛ}+1Я(1 + о?).
Граничное условие для Л{ имеет вид
ллг+1 =
Полученные формулы в скалярном виде имеют вид:
=(A|1)/xj5f + 2(aJ2)/x1/x2/ ^-(A^J.xlp
(Aji)r- = (a}j)/+1 + Г}д^. - 2£ь(л}2)|+1;
(Aj2), = (a}j + л}2)/+1 + г1лу£2. - £jZ(A}2 + л^2)/+1 - ^2Z(a}2)/+|;
354
(Л2г\ “ (Л11 + 2л12 + Л22\+1 + Г/^2/ ~2^2/(Л12 + A22^+P
г;=(1 + а?)(Л^)м;
(Л11\+1 = ^ц’^12^+1 =^12’^Л22^+1 = ^22-
ТаК как начальное положение спутника известно, причем
х20 = 0, то полагая i = 0 в Л/, получаем оценку конечной точности:
^(а) = 7’(а) = (л;1)0х120.
Зависимость R$(a) проявляется через параметр (Л}j)0, который,
в свою очередь, зависит от множителя а. Проанализируем теперь
уравнение
определяющее неизвестный множитель a.
Можно выделить следующие случаи:
1) а = 0;
2) /$(а) = 7!, а>0;
3) /$(a)>7j, а>0.
Сразу отметим, что последний случай не представляет практи-
ческого интереса, так как свидетельствует о невозможности удов-
летворения конечным требованиям ни при каком a > 0.
Первый случай соответствует решению задачи, связанной с до-
стижением наилучшей конечной точности без учета энергетических
затрат. Если величина (а = 0), полученная в результате такого
решения, окажется более заданной, /^}(a = 0)> 7J , то решение ис-
ходной задачи не существует. В связи с этим данный случай имеет
важное значение. С одной стороны, он дает ответ на вопрос, суще-
355
ствуетли вообще решение исходной задачи. Если /^(а = 0)< Л1, то
решение существует, в протвном случае решение не существует. С
другой стороны, первый случай дает представление о предельно до-
стижимой конечной точности.
При условии существования решения можно перейти к рассмот-
рению второго случая, который будет основным. Искомое значение
множителя а теперь определяется как положительный корень урав-
нения
/?(а) = Л.
Это уравнение можно решить графически, построив зависимость
/?о(а) при а>0.
18.5. Методы приближенного синтеза
оптимального управления
Как уже указывалось, основной трудностью на пути примене-
ния достаточных условий оптимальности при решении задач синте-
за является так называемое «проклятие размерности», т. е. необхо-
димость запоминания на каждом шаге оптимизации функции буду-
щих потерь, являющейся в общем случае функцией п переменных.
Запоминание таких функций при больших п (начиная с л = 3) тре-
бует огромного объема памяти и оказывается непосильной задачей
даже для современных компьютеров. В связи с этим приходится при-
бегать к различным приближенным методам, основанным либо на
линеаризации (обычной и статистической), либо на аппроксимации
функции будущих потерь.
Метод линеаризации. Рассмотрим задачу синтеза оптимального
управления системой
xM=fSxi>ui’^
из условия обращения в минимум критерия
(18.30)
J = M[J\=M
(18.31)
356
полагая сначала, что ограничения, на вектор управления отсутству-
ют, а векторы образуют «белую» последовательность с корреля-
ционными матрицами Di. Предположим, что возмущенное движе-
ние системы (18.30) может быть описано уравнениями в отклоне-
ниях
4+i = 44+44 + 4) = 0
относительно некоторой программной траектории, определяемой
уравнением
Здесь введены обозначения:
Дх. = х. - х?р; Ди = и. - и"р\
1 дх. ’ 1 ди. ’ ' •
Разложим выражение (18.31) для критерия оптимальности в ряд
Тейлора с точностью до членов второго порядка малости
7=7^+д7,
где
n
7^ = Е4(хГ,^)+Л4’+1);
/=о
&J = М £ (Дх^Q.Дх. + 2ДхТУ.Ди. + ДиТИ^.Ди( + 2р^Дхг + 2sTuf) +
J=o
+ ^XN+\^N+l^XN+\
(18.32)
357
Здесь приняты также следующие обозначения:
п _ 1 . w _ 1 э70,(^,<).
Ц-2 Ъх] ' '“2 Э«2
' 2 Эх,Эи, ’ '2 Эх,
1Э/0,.(х^7). 1Э<Г(хХ,).
' 2 Эи,. ’ Л'+| 2 Эх2,+| ’
(18.33)
Vtf+I =
1
&XN+I
Так как зависит только от программной составляющей уп-
равления ипр , то для выбора последовательности {Ди,} следует ми-
нимизировать д7. С этой целью обратимся к основному рекуррен-
тному соотношению метода динамического программирования. Как
и прежде, можно показать, что функция будущих потерь при неко-
торых предположениях может быть представлена в виде
Ri (АХ;) = ЛхТ + 2yf Дх,. + Cj. (18.34)
Действительно, для момента i = N+ 1 соотношение (18.34) имеет ме-
сто, причем
А _ld2F(4'+1). 10F(x^+1) _п
Л#+1 “5 ч- » V/v+i - 9 Л » cw+i”0- (18.35)
2 0Xn+\ 2 0Хы+\
Предположим теперь, что (18.34) имеет место для (/ + 1)-го мо-
мента, т. е.
R. ,(Дх. .) = Дх.г,А. .Дх. ,+2шГ,Дх. , + с. ,.
/+lv <+1' i+Г /+1 i+l т/+1“л,+1 *>+!
358
Тогда на основании рекуррентного соотношения (18.28) полу-
чим
Л.(Дхг.) = Лх[ (Q. + А[ Л.+1Д.)Дх. + 2(р. + )т Дх +
+с.+1 + Sp(AMH ,DtHj) + min /р
где
J. = Ди/* Г. Ди. + 2((7.Дх. +g(.)r Дир
Gz = Vj + ВТ КМА.\ g. = 5f. + ВТy/+r
Полагая, что матрица Г, положительно определенная, нахо-
дим
Ди* = -Гг1((7.Дх/+^.) = --£.Дх.-Ди/0, (18.36)
где
£,. = ГГ1С,. = Г7|^ + В’-Л/+1Л,.);
Ди/0 = г71«( + гГ1^ + вГ%ч1)-
С учетом найденного управления выражение для функции
/^(Дх:.) принимает вид (18.34). При этом
A,.=0,. + ^A,.+14-£fr,.£(;
V,.=p,. + <V,.+l-£fr(AUO; (18.37)
Ci=cM +5р(ЛмНм01Н[)-(^)ТГ1Ли°.
Применяя рекуррентные соотношения (18.37) при граничных
условиях (18.35), можно последовательно определить все коэффи-
359
циенты обратной связи L. и систематические составляющие Дм? в
законе (18.36). Значение функции будущих потерь в момент i = 0 оп-
ределит минимальное значение д7.
Так как по условию =0, то получаем
шшд7 = с0.
До сих пор предполагалось, что программная траектория {х',р}
известна. Поэтому матрицы А., Н., Qp К, И<, Лд?+1 и векторы
Р/’ V/v+i считались также известными.
Нетрудно заметить, что величина с0, определяющая минималь-
ное значение составляющей Д/ и зависящая от указанных матриц,
оказывается в конечном счете зависящей от программной траекто-
рии. Стремясь в итоге к достижению минимума полного критерия
J =JnP + д/, выбор программной траектории следует подчинить
условию
7(нпр) = min[7np(wnp) + с0(ипр)].
Здесь под ипр понимается последовательность управлений
Цпр}, i = 0,1,...,ЛГ, определяющая программную траекторию.
Метод статистической линеаризации. Рассмотренный выше
метод применим в случаях, когда на вектор управления не накла-
дываются ограничения. Однако он может быть распространен и на
случай ограниченного управляющего воздействия, если воспользо-
ваться дополнительно методом статистической линеаризации.
Обратимся снова к задаче синтеза оптимального управления
системой (18.30) из условия обращения в минимум критерия (18.31).
Однако будем теперь считать, что на вектор управления ui накла-
дываются ограничения и. е i = 0,1,..., 2V. Для простоты считаем,
что множество Ui представляет собой w-мерный параллелепипед
360
где wj — заданное значение.
Как и раньше, через i/np={i/"p}, хпр=Цпр} обозначим про-
граммное управление, удовлетворяющее теперь ограничениям, и
соответствующую траекторию движения (без учета возмущения).
Уравнения в отклонениях и выражение для приращения крите-
рия оптимальности имеют прежний вид. Однако задачу минимиза-
ции составляющей Д/ теперь не удается решить так просто, ибо не-
обходимо учитывать ограничения u^U., i = 0,1,...,ЛГ., где множества
Д£А определяются неравенствами
Ди” = —и® — н'.1р Ли.к. < — w!Jp — .
ik ik ik ik ik ik ik
В силу этих ограничений закон оптимального управления
ДиДДх.) теперь уже не будет линейным. Однако, производя стати-
стическую линеаризацию зависимости Дц(Дх;) в каждый момент
времени, можно показать, что функция будущих потерь по-прежнему
будет иметь вид (18.34), т.е.
R. (Дх.) = ДхТ + 2у[ Дх(. + сг (18.38)
Действительно, полагая, что это соотношение справедливо для
(/ + 1)-го момента, получаем
ЛДДх.) = Axf (0. + Л.+1Д.)Дх. + 2(р. + А[\ум)т Ьх. +
+см +Sp(\MHiDiHT)+ min J,,
Ди^Ди j
где J. = дИ/Гr^w,. + (буДх, + g().
Здесь Г,. = W, + B,rA,.+1B,.; Gi = V? + KMA;, g, = s, + B[wM.
361
Осуществляя минимизацию по Дц-е ДЦ, получим следующий
закон управления:
Дмл =
Д“5>
Д"л- Д"а2Д"л*Д“л-
Ди>, д^>Ды£,
(18.39)
где через Дм,* обозначены компоненты вектора, определяемого со-
гласно (18.36):
Дм* = -£.Дх- - Дм?.
Здесь £ = Гг’С; Дм? = Гт1 Ц + ВТу.+1).
По-прежнему предполагается положительная определенность
матрицы Г,.
Произведем статистическую линеаризацию зависимости (18.39),
т. е. заменим ее следующей:
д«Л=^д^+^(д<-дф> <18.40)
где К]к — коэффициенты статистической линеаризации, зави-
сящие от математического ожидания Дм^ и среднеквадратичного от-
клонения о*Л величины и*к.
Введем в рассмотрение диагональные матрицы Kf и К} с эле-
ментами Кхк соответственно. Тогда соотношения (18.40) могут
быть переписаны в виде
Дму = К} Ли* + Дмр
где
Дм.=(*0-*/)Дм*.
362
Так как Дц линейно по Д\ /то, как и прежде, получаем для
Я/Дх,) выражение в виде (18.38), причем
Л,. = А1 \+\Ai+ Q “ £ГK}riKlLi ~ LIKiriLi ~ tfriK'LP
V, = Р/ + ЛТу/+1 LTKjr^K^uf - Ди®)- L? К^Ди® -
-L^K^ + Ц-Г^-, (18‘41)
ct=cM +Sp(A.MHiDiH[)+(K'^-дй^ГДАГ/Ди» -ДЙ,.)-
-2(АГ,!ди«-Дй,.)гГ(Д«9.
Граничные условия для этих рекуррентных соотношений по-
прежнему имеют вид (18.35). Чтобы воспользоваться этими соотно-
шениями, необходимо знать математические ожидания и среднеквад-
ратичные отклонения компонент вектора Ди*, так как последние оп-
ределяют матрицы К}к. С этой целью обратимся к уравнениям
для математического ожидания Дх, и корреляционной матрицы ЯГ,,
вектора Дх.. Эти уравнения могут быть представлены в следующем
виде:
Дх.+1 = Ц - В-К*Ь.)Дх. - В.К®Ди®; Дх0 = 0;
Км + (18.42)
ЯГо=О.
При этом
Ди* = М [Ди* ] = -£.Дх. - Ди9;
(18.43)
Л/[(Ди* - Ди/)(Ди* - Ди*)г] = .
363
Так как система (18.41) имеет граничные условия на правом
конце, а система (18.42) — на левом, то имеем краевую задачу. Ее
решение может быть получено с помощью методов последователь-
ных приближений. Один из простейших методов может состоять в
следующем:
1) Задается начальное приближение матрицы К?к, К}к.
2) Определяется алгоритм субоптимального управления (точнее,
его параметры £ Ди9, i = 0,l,...,N) согласно (18.39)—(18.41).
3) Производится уточнение матрицы К9к, К'к на основе стати-
стических характеристик (18.43), полученных в соответствии с (18.42)
при найденном алгоритме управления.
В качестве начального приближения матриц Af£, К'к можно ре-
комендовать единичные матрицы. Нетрудно заметить, что при этом
начальное приближение будет соответствовать случаю неограничен-
ного управления.
Для иллюстрации метода рассмотрим задачу одноимпульсной
однопараметрической коррекции. Математическая модель в этом
случае может быть записана в виде
х.+1=х/ + Д.ц.+^., / = 0,1.
Предположим, что хо=О, мо=О, |wj|<1, ?, =0, = Кри-
терий оптимальности имеет вид J = Л/[х^]. Применение достаточ-
ных условий оптимальности в данном случае позволяет найти точ-
ное решение задачи. Алгоритм коррекции имеет следующий вид:
-1, Х|>Лр
1, х^-Вр
364
Функция будущих потерь равна
(Xi -Д)2, X] >
/^(xp = cf+<0, |х,|<Вр
Ц-Я))2, х^-Лр
Величина критерия оптимальности при этом вычисляется по
формуле
/ = Л/[Л1(х1=^0)] = о2+(о2 + 51) 1-2Ф
-2ДФ
где через Ф, Ф' обозначены интеграл вероятностей и его производ-
ная.
Обратимся теперь к методу статистической линеаризации. Про-
изводя статистическую линеаризацию найденного алгоритма коррек-
ции, получаем
Вычисляя величину критерия оптимальности при данном управ-
лении, будем иметь
Сравнивая выражения для оценок J и JA , можно установить,
что максимально возможная ошибка оценки достигается при
/о0)« 0,85 и составляет ~6% от величины oj.
Таким образом, использование метода статистической линеари-
зации совместно с методом динамического программирования по-
зволяет получить приближенное решение задачи синтеза.
365
Область применения предложенного метода не ограничивается
рассмотренным случаем. Метод может быть применен и в более
общих случаях, например, когда вектор-функция правых частей
уравнений не является дифференцируемой функцией или когда
линеаризованная обычным способом система не описывает точно
возмущенное движение исходной системы. В этих случаях по-пре-
жнему можно прийти к линеаризованной системе путем ее статис-
тической линеаризации.
Метод параметров. Сущность метода состоит в отыскании наи-
лучших в том или ином смысле значений параметров и разложении
функции будущих потерь с помощью использования основного ре-
куррентного соотношения метода динамического программирования.
Ниже рассматривается одна из модификаций метода параметров
применительно к задаче синтеза оптимального управления системой
х,+1=/1(Х/,«/Л,), 1 = 0,1,...л
из условия минимума критерия
7 = М[Г(х„+1)].
Представим функцию потерь в виде
= £/>/ф/ Ц) = Р/ <Р/ (18.44)
J
где <р/Ц)=||ф/(х.)||, <р/(х.) — заданные функции; д. =||р/||, р/ —
параметры, подлежащие определению. Для их определения потре-
буем, чтобы ^(х.) как можно ближе было к действительной функ-
ции Rfa) в некоторой области хг В качестве критерия близости
рассмотрим интегральную квадратичную ошибку
Д, = J [Д.(х,.)-Я,.(х,.)]2й!х, = J [р^<р((Х;)-Я,.(х(.)]2<&,.
X, X,
366
Минимизируя это выражение? по pf, получаем
п-1
J Ф,(х,.)ф,(х,)га!>с,
Л
J Л,(х,.)фДх,.)й!х,..
Xi
Вообще говоря, полученным соотношением можно воспользо-
ваться, если функция 7^(xz) известна. Но для приближенного ре-
шения задачи вместо Д.(д0 можно рассмотреть функцию Д(х), по-
лучаемую с помощью основного рекуррентного соотношения с уче-
том представления (18.44)
Итак, подставляя ^(х.) в выражение для pf, получаем следую-
щее рекуррентное соотношение для определения вектора парамет-
ров:
р1 = л'7' j (18.45)
Xi ‘ 1
Здесь введены обозначения:
л, = J ф,.(х/)ф/(х()г<&,.; Ф,+|(хри(.) = Л/[ф/+1(хм)/х,,«,.].
х.
Граничные условия для вектора р, получаются из соотношения
Rn+Sxn+\) ~ = Pn+№n+\(xn+\>-
Последний метод является достаточно гибким. Он допускает
использование различных разложений (18.44) для различных момен-
тов времени. Так как точность метода при выбранных функциях
фДЛу) зависит от областей , на которых производится аппрокси-
мация, то их следует подбирать как можно уже, но так, чтобы они
367
содержали все возможные реализации векторов х,. В связи с этим
подбор областей Xt целесообразно производить последовательны-
ми приближениями, чередуя процедуру определения структуры уп-
равления при заданных областях Xf с процедурой уточнения самих
областей Х} путем определения статистических характеристик сис-
темы при найденном алгоритме.
Комбинированный метод оптимизации. Практически при реше-
нии сложной технической задачи, связанной с оптимизацией стоха-
стической системы при различных ограничениях, трудно рассчиты-
вать на успех, если заранее ориентироваться лишь на один из рас-
смотренных методов. Это объясняется тем, что каждый из методов,
обладая тем или иным преимуществом перед другими методами,
имеет и слабые стороны, с которыми на определенной стадии ре-
шения задачи приходится сталкиваться. В связи с этим, очевидно,
наиболее целесообразным является применение различных комби-
нированных методов.
Рассмотрим один из таких методов на примере задачи оптими-
зации процесса управления системой
х<+1=ЛЦ>“(>^)> '=0> 1>-Л,
из условия обращения в минимум критерия
и=о
(18.46)
при наличии ограничений
\uik |<м™х, Л = 1,...,/л, / = 0, 1,...,У,
(18.47)
Сущность метода сводится к следующему. Учет терминальных
ограничений произведем с помощью множителей Лагранжа, благо-
даря чему от исходной задачи перейдем к вспомогательной задаче
минимизации обобщенного критерия оптимальности
368
м
N I
YfoSXl’Ui'>+YajFJ(-XN+\
J=0 y=0
)
решаемой теперь уже без учета терминальных ограничений, но с
последующим выбором множителей ау. >0, у = 1,...,/ (а0 = 1) так,
чтобы для оптимального решения выполнялись условия
а,[7>(а)-7/]=0.
В искомом управлении, характеризуемом вектором и, выделим
две составляющие — программную ипр и синтезируемую ис. По от-
ношению к этим составляющим применим поэтапную оптимизацию,
согласно которой
min7(u) = min 7*(мпр),
ugU «пр6(ЛФ
где
J*(unp) = min /(unp,uc);
iFeUc
через £7C, t/np обозначены множества допустимых векторов ис , мпр
соответственно. В общем случае Uc зависит от ипр .
На первом этапе определяется функция 7*(«пр) путем миними-
зации обобщенного критерия оптимальности 7 по составляющей
ис. На втором этапе находится составляющая unp путем минимиза-
ции критерия 7*(wnp).
Компонентами синтезируемой составляющей могут являться
либо компоненты вектора приращения Ди относительно программ-
ной составляющей , либо просто отдельные компоненты векто-
ра и, в отношении которых желательно получить решение задачи син-
теза. Для определенности будем считать, что
369
ис = &и = и-ипр.
Для решения задачи первого этапа применим один из прибли-
женных методов синтеза, изложенных выше. В частности, при со-
вместном использовании метода динамического программирования
и метода статистической линеаризации получим алгоритм субопти-
мального управления в виде (18.39). Соответствующее значение кри-
терия оптимальности будет равно
7*(wnp) = 7np+^,
где 7пр определяется согласно (18.32), а с0 — с помощью системы
рекуррентных соотношений (18.41), (18.42).
Для решения задачи второго этапа в общем случае следует при-
менять численные методы.
Решение задачи заканчивается поиском вектора множителей
Лагранжа а. Для раскрытия зависимостей 7у(а) представим JJ в
виде
7> =7'пр +д7>,
где
7УПР = = ^N+l^N+i^N+l + 2УлГ+1 Axjv+|
Величины Jj пр могут быть вычислены одновременно с мини-
мизацией функции 7*(wnp) по wnp , а д7у — одновременно с опре-
делением закона ДиДДхД. При этом возможны два подхода.
Первый основан на использовании системы (18.42) для матема-
тического ожидания и корреляционной матрицы вектора Дх, при
найденном управлении. В этом случае имеем
= Дх£+1А-^+1 Дх^+1 + ДХд^+1 +’5р(Л^+1^+1).
Второй подход базируется на использовании рекуррентного со-
отношения для функции
370
M[(Ax^+iAjN+x^cN+x + 2у^+1Дхл+1)/х.].
Нетрудно убедиться, что функция Л/(2Ц ) имеет вид
R/ (Дх,) = ДхГ Л/ Дх. + 2 \|//Т Дх,- + с/,
где Л/, v/, с/ удовлетворяют рекуррентным соотношениям
л/ = Ц. -вл’А)гл/+1(4 -ВЛ'Д); л'„+1
Z axN+\
V/ = - B&LjA'+MK'bu? - Ьй,) -
^ = 2-^’
c{ “ cm + ” ДЧ')Г +
+5р(А^Н.П.Н[)-2(К1^-^)т4+1 =0.
Полагая i = 0 и учитывая Дх0 = 0 , получаем
д/> = ^(Дхо=О) = с>.
Возможны различные модификации изложенного метода. В ча-
стности, применение метода множителей Лагранжа может быть осу-
ществлено не перед поэтапной оптимизацией, а на первом этапе ее
при определении синтезируемой составляющей управления.
371
Применение метода поэтапной оптимизации проиллюстрируем
на примере задачи оптимизации процесса управления системой
xM=AiXi+BiUi+^
из условия обращения в минимум критерия
J = А^х^Хх^].
Пусть начальное состояние х0 считается известным. Для просто-
ты ограничимся случаем скалярного управления. Обозначим через
ипр = {u?₽},z = О, N последовательность программных значений управ-
ляющего воздействия, через хпр = {х"р}, i = 0,7V — соответствующую
траекторию xPJ] = А.х"р + Bfufp. Значение критерия при этом будет
равно
7"Р=(хХ,)гХхХ,.
Учитывая, что в данном случае Q = 0, Vt = О, = 0, sf = 0, соглас-
но (18.36)—(18.37) получим следующие расчетные формулы:
Ди* = -Z. Дх. - Ди?; Др(Ди*) = с0; L. = л/+1 ;
Г,. = В[лмВ,; дио = rr'^V;+1; Л,. = Ц - В,.£,)ГЛ,+1Ц -
л#+1=^» V/=(А“ АА^Ччр Vjv+i = х4чр (18.48)
ci = см + sP(^MDi) -гАи?> cn+i = °>
из которых видно, что конкретная программа управления влияет
лишь на компенсационную составляющую Ди? через вектор у/ й,
соответственно, на величину критерия Д/ . Коэффициенты обрат-
372
ной связи £, оказываются инвариантными относительно програм-
мы управления.
Для определения оптимальной программы управления зададим
начальное приближение wnp = {wjlp}, / = 0,W , обеспечивающее мини-
мум критерию 7пр . Нетрудно установить, что для всех i- 0, N
имеет место соотношение w"p = -£.х"р.
Э7пр - -
Вычислим составляющие градиента — . Так как J = Jnp +с0
Э7пр
и , /=0, 1,..., N, получим
д7 = <4
Оказывается, что все производные Эс0/Э«/ при этом также об-
ращаются в нуль. Действительно, из (18.48) с учетом u^-L-x. сле-
дует, что
V/=^ix"p
и
Д«° = Гг^/'Л^Ц - B.L.)x?p = Д.х"р - L.x^ = 0.
Поэтому для любого i
^=-25Ж^=°-
t/И- OWy
Таким образом, оптимальная программа управления в данной
задаче минимизирует составляющую 7пр и может рассматриваться
373
как результат применения оптимального закона управления к осред-
ненному процессу.
18.6. Оптимизация коррекции траектории
космического аппарата
Рассмотрим возможность применения комбинированного метода
к задаче оптимизации процесса однопараметрической коррекции
траектории космического аппарата.
По-прежнему через х, обозначим величину прогнозируемого ко-
нечного промаха в момент, непосредственно предшествующий /-му
корректирующему импульсу, отнесенному к среднему квадратичному
отклонению априорного промаха; через ц — расчетную величину
z-ro корректирующего импульса скорости, отнесенную к среднему
квадратичному отклонению ошибки, его реализации, через В. —
производную по направлению gradw х(.. Обычно убывает по мере
движения аппарата. Тогда после отработки z-ro импульса получим
xM=xi + BSut+^> (18.49)
где представляет собой ошибку реализации z-го корректирующе-
го импульса. Будем считать, что = 0 при и, = 0. При и, * 0 —
центрированная случайная гауссовская величина с единичной дис-
персией. Задача оптимизации процесса коррекции состоит в опре-
делении последовательности u = {ui(xi)}, z = 1,..., N, включая опре-
деление самих моментов коррекции, обеспечивающей достижение
требуемой конечной точности, характеризуемой условием
J'=M[x2N+i]<J} (18.50)
при минимальном расходе топлива, оцениваемом величиной
/° = Л/
(18.51)
374
Число коррекций ТУ и величин^ Л’ в соотношении (18.23) счи-
таются заданными. Так как от моментов коррекции зависят лишь
коэффициенты Bi, то задачу определения оптимальных моментов
коррекции, т. е. задачу оптимального распределения корректирую-
щих импульсов вдоль траектории наведения, будем трактовать как
задачу отыскания оптимальной последовательности В-{В.}У
/ = 1,2, ...,7V.
Для решения задачи обратимся к комбинированному методу
оптимизации.
Согласно поэтапной оптимизации решение задачи может быть
проведено в два этапа. На первом этапе при фиксированной после-
довательности В путем минимизации критерия (18.51) по последо-
вательности и = Ц}, /=1,2,...Л, с учетом (18.50) отыскивается ал-
горитм оптимальной коррекции и функция
7°(В) = тт7°(иЛ),
и
по сути представляющая собой зависимость потребного для дости-
жения заданной конечной точности расхода топлива от моментов
проведения коррекции.
На втором этапе находится оптимальное распределение коррек-
тирующих импульсов путем минимизации функции JQ(B) по пос-
ледовательности В-{В.}, / = 1,2,...Л-
Для решения задачи первого этапа воспользуемся методом мно-
жителей Лагранжа.
Введем в рассмотрение обобщенный критерий оптимальности
7 = а7° + 71.
Пусть м(а) управление, минимизирующее 7 при данном а.
Нетрудно показать, что если найдется такой множитель а > 0,
что будут одновременно выполнены условия
375
J(м(а), a) = min J(u, a);
7'(w(a),a) = 71,
то управление w(a) будет оптимальным в задаче первого этапа. Дей-
ствительно, из определения w(a) следует
a7°(u(a)) + 71 <a7°(w) + 7l(w),
откуда 7°(u(a))<7°(w) для всех и, если а>0. Таким
образом, для определения алгоритма оптимальной коррекции дос-
таточно минимизировать по последовательности и = {« } обобщен-
ный критерий оптимальности 7 последующим выбором множите-
ля а из условия 71 = J1.
Минимизация критерия 7 может быть проведена с помощью
основного рекуррентного соотношения метода динамического про-
граммирования
^(x,.) = min{a|u,. |+Л/[Я/+1(х/+1)/х/>И/]} (18 52)
при граничном условии
^N+l^XN+\^ = XN+V
Для определения множителя ( необходимо произвести анализ
конечной точности при найденном алгоритме коррекции, т. е. уста-
новить зависимость 71 от a. С этой целью может быть использова-
но рекуррентное соотношение
Л/Ц) = Л/[^1(х.+1)/х.1 (18.53)
при граничном условии
^V+l (•Xw+l) “ XN+\'
376
Искомая зависимость определится соотношением
Для решения задачи второго этапа необходимо установить за-
висимость JQ(B). Это может быть сделано с помощью рекуррент-
ного соотношения
(18.54)
при граничном условии
Так как функция АРЦ.) характеризует зависимость ожидаемо-
го расхода топлива при оптимальном корректировании от текущего
состояния xz, то, очевидно,
7°(^)=МД0Ц)].
Для окончательного решения задачи остается минимизировать
функцию JQ(B) по В.
Для простоты ограничимся рассмотрением случая одноимпуль-
сной коррекции. Предположим, что единственная коррекция про-
изводится в момент i - N. Воспользовавшись рекуррентным соот-
ношением (18.52), с учетом (18.49) получим
Jx(xN,uN), ^>0,
Ayv(xjv) = min
UN
J^(xN,uN), uN<0,
где
(XN >Un}~ + txN + aN + “aN ~ ^aNXN ’
377
JN (XN iUN ) “ + (XN aN + “ aN + ^aNXN ’
aN ~a/^^N'
Осуществляя операцию минимизации no uN для случая uN > О,
получаем
Минимальное значение функции J^(xN,uN) при этом оказы-
вается равным
rn (xn ) = min J+ (xN, uN) = ~2aNxN +
CN ~ R1N~q1N'
Аналогично для случая uN < О
rn(xn) ~ min - 2aNxN + cN.
uN
Объединяя полученные результаты, заключаем, что оптималь-
ный алгоритм коррекции в момент i = N имеет вид
О, | xN |< Ддг,
Ы>длг
(18.55)
378
Здесь Ду — величина, определяеная условием
•/у (Ду )= Лу(Ду ),
т.е. bN=BN+aN.
Таким образом, алгоритм оптимальной коррекции является су-
щественно нелинейным. Он имеет зону нечувствительности и явля-
ется линейным вне этой зоны.
Функция потерь RN(xN) при найденном алгоритме может быть
представлена в виде
В соответствии с изложенной выше методикой для определения
множителя а, входящего в алгоритм (18.55) через параметр aN , не-
обходимо установить зависимость 71 от а. Для этого, как уже го-
ворилось, воспользуемся рекуррентным соотношением (18.53), по-
лагая i = N. Будем иметь
“w=°>
(Хд, + Bnun)2 + B%, un *0,
или, принимая во внимание алгоритм (18.55),
где ciN = B2+a2N.
Так как рассматривается случай одноимпульсной коррекции, то
в соответствии с принятыми обозначениями xN = х^ представляет
собой величину нормированного априорного промаха, который имел
379
бы место без коррекции траектории. Полагая, что является цен-
трированной случайной величиной с нормальным законом распре-
деления и единичной дисперсией и производя осреднение выраже-
ния (18.48) по xN , получим искомую зависимость J1 от а:
_ 1 00 XN
=Л/[ЯЦх„)]=-2= J R^xN)e- 2 dxN.
Введем условные обозначения для следующих интегралов:
1 г
fo(AB) = -4=p ^dy-
1 г
= 2dy,
'/2к л
1 г
F1(A,B)=-f—\y2e 2dy.
Эти интегралы легко выражаются через табличные интегралы
вероятностей, а именно:
Г0(Я,В) = Ф(Я)-Ф(Л);
/,(Д5) = Ф'(Л)-Ф'(В);
(А, В) = Ф(5) - Ф( А) + АФ'(А)-ВФ'(В).
Здесь
1 А
380
С учетом принятых обозначений получаем
J1 = [1 - 2Ф(ДЛ,) I + 2Ф(Д„) - гд^Ф '(Д^),
или
71 = (Д2Л +2Д2 -2ДЛГ^)[1-2Ф(ДЛ)]+2Ф(ДЛ)-2ДЛГФ’(ДЛГ). (18.58)
Соотношение (18.58) и устанавливает зависимость У1 от мно-
жителя Лагранжа а, в данном случае через параметр Ддг, который
связан с ос следующим образом:
Каждому значению а или, что то же самое, Д^ соответствует
свое значение 71. Приравнивая 71 величине 7J , получаем уравне-
ние для определения а (или Ддг):
(д2/+2^-2Д/,^)[1-2Ф(ДАГ)] + 2Ф(Дд/)-2ДЛГФ’(Дуу) = 7‘. (18.59)
К сожалению, аналитически решить уравнение относительно &N
не удается. Решение можно получить численными методами или гра-
фически, построив зависимость 71 от . Характерно, что эта за-
висимость является монотонно возрастающей, в чем нетрудно убе-
диться, рассмотрев производную
= 2(6 N - BN )[1 - 2Ф(Д„) + 2В„Ф '(Д„)].
Это означает, что решение уравнения (18.59), если такое суще-
ствует, единственное. Это решение, естественно, зависит от пара-
381
метра BN, определяемого, в свою очередь, моментом проведения
коррекции. С целью определения оптимального момента коррекции
установим связь ожидаемого расхода топлива 7° от величины BN
В соответствии с рекуррентным соотношением (18.54) имеем
О, | xN |< ДЛ,
—— | Хд, | +с® , | xN |> Д N,
где
с0 _
” Р
Производя осреднение полученного выражения по xN , как и
выше, получаем
/°=сО[1-2Ф(Д„)]+-^-Ф'(Др
или
j° = i-А*
Вы
2
[1-2Ф(Д^)] +—Ф’(ДдД (18.60)
Из (18.60) видно, что ожидаемый расход топлива 7° однознач-
но определяется все теми же параметрами Ддг и BN. Минимизируя
(18.60) по BN с учетом (18.59) найдем оптимальное значение, а сле-
довательно, и оптимальный момент проведения коррекции, обес-
печивающие минимум ожидаемому расходу топлива при достиже-
нии требуемой конечной точности. Беря производную от (18.60) с
учетом (18.59) и приравнивая ее к нулю, получим
Э7°(1„) Э71(1„) _ Э7°(2?ЛГ) ЭЛ(^)
dBN ЭДдг дДд, dBN
382
причем
^ = ^Ы1-2Ф(ДЛ)]-2Ф'(ДЛ)};
|^ = --^[1-2Ф(Др + 2^ФХД„)1;
э71
^ = 2(25„-Д„)[1-2Ф(Д„)];
dllN
ff-=2(bN -В„)[1 -2Ф(ДЛ,)+25ЛГФ’(ДЛ,)|.
Учитывая это, нетрудно получить следующее алгебраическое
уравнение второй степени относительно BN:
[1 + 2^(ДЛ)]{[Д„ -2!;(Д„Л(Д„ -BN) + BN(2BN -Д„)}=0,
где через ^N) обозначено отношение
Уравнение имеет единственный положительный корень
BN=--------------2------------•
Последнее соотношение совместно с условием (18.59) и опре-
деляет оптимальное значение коэффициента BN , обеспечивающее
минимум ожидаемого расхода топлива при достижении требуемой
конечной точности. Уравнение (18.59) целесообразно решать графи -
383
чески. С этой целью достаточно построить зависимости ^(ДЛ),
и 7°(A/v). На основании зависимости по заданно-
му значению 7J определяется величина Д^, а по зависимостям
BN(&N), 7°(Д^) и найденной величине Ддг — оптимальное значе-
ние BN и соответствующее значение 7° . Указанные зависимости
можно перестроить, исключив вообще из рассмотрения параметр &N.
В результате получим явные зависимости оптимальных значений BN
и 7° от величины 7<! , определяющей заданную конечную точность.
18.7. Оптимальное управление стационарным спутником с
использованием двигателя малой тяги
В качестве еще одного примера решения прикладной задачи
рассмотрим задачу оптимизации процесса перевода стационарного
спутника из одной точки в другую с использованием корректирую-
щей двигательной установки малой тяги, развивающей постоянное
(в номинале) ускорение вдоль нормали к текущему радиус-вектору.
Перевод спутника должен быть осуществлен с требуемой точностью
при минимальных энергетических затратах. Ввиду малости управ-
ляющего ускорения будем теперь учитывать влияние длительности
коррекции, считая его существенным, на параметры текущей орби-
ты. Это требует использования более сложной модели процесса пе-
ревода. Такая модель может быть получена, в частности, если рас-
смотреть уравнения движения спутника, линеаризованные относи-
тельно стационарной орбиты
Дг - Зсо^Дг - 2госоьД0 = О,
(1S.61)
Зсв^Дг + гоД0 = f. ’
Здесь Дг,Д0 — отклонения радиуса орбиты и долготы от соответ-
ствующих значений на стационарной орбите: Дг = г - г0, Д0 = 0- со^;
384
/*0 — радиус стационарной орбиты? — угловая скорость собствен-
ного вращения Земли; /— управляющее ускорение, развиваемое дви-
гательной установкой; t— время.
Предположим, что каждое очередное включение двигателя воз-
можно лишь спустя некоторое время после предыдущего выключе-
ния. Обозначим через момент окончания (/—1)-й коррекции; tni —
длительность f-го пассивного участка; т. — длительность проведе-
ния /-й коррекции. Тогда будем иметь .+tn j + т., /= 0,1,..., ЛГ;
N — число коррекций; /0, tN+{ — начальный и конечный моменты
времени соответственно. Считается, что /п > t*., i - 0,1 ,...,/V; t*. —
заданные величины.
Полагая, что во время каждой коррекции управляющее ускоре-
ние/постоянно и равно /, решение системы (18.61) можно пред-
ставить в виде
гп 2
r/+i = —^xil+xii sin<₽,. - x4j cos<p; + - sin w,,?,)/,;
2
A>j.+I = <%(x3i coscp. +x4.sin<p.) +—(1 -cosco^t.)/.;
%
a0m =xi,+^*2i-|^,(1-cos<P,) + ^4,sin<Pf- (18.62)
4
z'o “VO
4+1
X2i ” (X3i S'n Ф/ - COS<P,) + -— + —— sin
2л r0 °Vo
385
где
•*!/ -до,-;
= -—Ггдг. + ^-Дв/);
г° I % J
X3i =
<
(18.63)
хл, = ЗДг. + —дё(.;
%
+х/)’ Л=Лн(1+пД
fiH — номинальное управляющее ускорение, численно равное
номинальному /н, но имеющее знак /, т. е. /• н =/Hsign/<; ц. —
центрированная случайная величина с дисперсией о?, учитываю-
щая разбросы ускорения ff относительно номинального значения.
Перейдем в уравнениях системы (18.62) от переменных
&гр Дг, Д8., Д0. к новым переменным х^-, х^, x4i. Нетрудно ус-
тановить на основе (18.63), что такой переход является взаимноод-
нозначным. Физический смысл новых переменных сводится к сле-
дующему: компонента xlz представляет собой текущее отклонение
СИСЗ по долготе от требуемой точки «висения»; компонента
численно равная смещению спутника по долготе в пассивном поле-
те за одни сутки (x2i = Д0/+1 при <pz = 2к;/у = 0), характеризует теку-
щую скорость дрейфа; наконец, компоненты хзр x4j связаны с экс-
центриситетом текущей орбиты соотношением
386
ei = ±y/$+4- <18-64)
ro
Действительно, в Z-й момент времени эксцентриситет можно
вычислить по формуле
Дг* - Дг"
е>=^Г’
где Дгв, Дг" — наибольшее и наименьшее отклонение радиуса ор-
биты от стационарного при / = 0, Так как согласно (18.62)
Д/'=_^+74+4;
^=-^-74+4
то сразу получаем (18.64).
В новых переменных уравнение движения СИСЗ можно пред-
ставить в следующем виде:
Ф.- 2Z1 ч 2х4. .
+--—sin<p,. -
2Я г0 г0
-5Z+4^COW/)Z:
Ъм = х2>~—Л'1/ =+0 + (18.65)
2
X3j+1 = Ху coscp,. + х4/. sin ф,. +—(1 - cos <^t0)/;
387
где
2Z •
X4i+1 = -X3i sm tp. + x4. cos <p. + —sin co0t0 ,
w/=~“-Ahx/- (18.66)
Величина wz, введенная во втором уравнении системы (18.65),
имеет важное значение для рассматриваемой задачи. Она характе-
ризует расчетное приращение скорости дрейфа в /-й коррекции и
однозначно связана с длительностью этой коррекции и направле-
нием приложения управляющего ускорения:
го°Ъ I ui I • г
slgnZ-=~sl8nM/-
ил //н
Будем считать и. одним из основных параметров управления в
/-й момент времени.
На основе соотношения (18.64) и уравнений (18.65) нетрудно
получить уравнение для эволюции эксцентриситета в процессе /-го
корректирования
1
е/+1=7х
Г0
x lr2e2 8 V °' ° ' sm— 2 sin + ^Lsin2^ (18.67) 1 “6 2
где
sin у,. =
X4I sign / sin^i
Xjj.’sign
/*3i+Х4;
COS\|/f. =
7^’ +Л:4/
388
Из уравнения (18.67) видно, ^то эксцентриситет после совер-
шения каждой коррекции в общем случае определяется величиной
и направлением управляющего ускорения, длительностью коррек-
ции Т/ и временем ее проведения (местом проведения), определяе-
мым параметром <р,, или, что то же самое, длительностью пассив-
ного участка tn {. Исключение составляет лишь случай, когда е, = 0.
Нетрудно убедиться, что эксцентриситет после коррекции в этом слу-
чае, равный
е/+1
<Wi, 2
зависит лишь от величины управляющего ускорения и длительнос-
ти коррекции т,-; время проведения коррекции может быть любым.
В связи с тем, что эксцентриситет в конечном счете — явление
нежелательное, время проведения каждой коррекции /п z выберем
так, чтобы эксцентриситет после коррекции был минимально воз-
можным. Согласно (18.67) минимальное значение е/+1 достигается
при значениях
ф(=2я*:(+^ + ^ + Ур
где к. — любое целое число, и равно
ем =I«M I.
ем
=ei
2
Угол vz может быть определен как
у. = arctg—1+sign I x3iuf sin
X3i пь v
2
389
В свою очередь, согласно (18.65), устанавливаем
хзм=гЬем sin
COLT. .. ( . ЦД.
х4/+| = гоем005 2 slgn "'Sln 2
откуда при i > 1
— = ctg^=L, signx3i. = sign(ey).
2.
Поэтому, считая cot)T/^2n для всех i, получаем окончательно
следующее выражение для оптимального значения параметра <Р,:
<p/=2n^+^-^tei1 (18.68)
где
jyy3*^'-^
Длительность пассивного участка tni связана согласно (18.63) с
величиной <р, соотношением
Ф/
Так как /п/ однозначно связано с Ф,- и, следовательно, с цело-
численным параметром , то последний может быть принят в ка-
честве второго управляющего параметра в момент Г, (наряду с ц).
390
С учетом выражений (18.66), (18.68) первое уравнение системы
(18.65) можно представить в виде
= *11 + *21+1 -^LjC2< +7^М -7*3/
‘♦Я 471 /q Fq
ИЛИ
*17+1 = *П + ^/Х2/»
где — новая обобщенная переменная, равная
XU=Xli~::j±Lx2i--X3r
/q
Так как в конце процесса перевода (при i N +1) переменные
становятся достаточно малыми, величина х1АМ - x1Af+l по-прежне-
му характеризует конечную ошибку по долготе.
Учитывая это, в качестве математической модели при оптими-
зации процесса перевода спутника примем следующие уравнения:
или, более компактно,
*M=4x/+e<I+H/)“p
(18.69)
где
Xi
(ЧД
47
в=
1
о 1
391
_ 4/н . W) . F - ^+sisn(ui,ui_iel)
«Фо 12л/н 4
Теперь сформулируем математически задачу оптимизации. Тре-
буется найти такие последовательности K = {Kf}, i~ 1, 2, ..., N и
« = {«,}, Z=0, 1, N, которые обеспечили бы перевод системы
(18.69) из начального состояния О^,^) в конечное (xN+l,eN+i) с
требуемой точностью (если это возможно) при минимальных энер-
гетических затратах. Энергетические затраты будем оценивать вели-
чиной
В качестве характеристики конечной точности примем матема-
тическое ожидание величины
-xn+\^xn+\ +Ре#+г
Итак, требуется минимизировать величину J0 при условии
где Jj — некоторая заданная величина, характеризующая допусти-
мые конечные ошибки.
Для решения сформулированной задачи обратимся к комбини-
рованному методу оптимизации.
Составим обобщенный критерий оптимальности
J = M[j] = M[oJa +JX} = M a£u? + xTN+xlxN+x + ре^+)
где а — множитель Лагранжа, подлежащий в последующем опре-
делению. Множитель а следует искать как неотрицательный корень
уравнения
392
71(а)*=7*1.
В искомом управлении выделим две составляющие — программ-
ную и синтезируемую. К программной отнесем целочисленную пос-
ледовательность К = {К'.}, i = 1, N, к синтезируемой — последо-
вательность и={ц}, i - 0, 1,N. В отношении этих составляющих
применим поэтапную оптимизацию.
На первом этапе найдем синтезируемую составляющую. С этой
целью обратимся к основному рекуррентному соотношению метода
динамического программирования. В данном случае оно принима-
ет вид
причем для момента i = N + 1
^У+1 (XJV+i ’ ^V+l) = XN+l^XN+l + Pejv+1
Трудность данной задачи связана с нелинейностью системы
(18.69): матрица Д (точнее, один ее элемент) зависит от управле-
ния и переменной ; в уравнение для ё} входит модуль | ^ | и три-
гонометрическая функция с аргументом, содержащим \и{ |. Для по-
лучения приближенного решения аппроксимируем функцию сину-
са, считая sin т| | wz. |= т| | |, и линеаризуем уравнение для х, «замо-
раживая» пока матрицу Д-, т. е. считая ее не зависящей от парамет-
ров и., ё. и обозначая через А..
Рассмотрим последнюю коррекцию / = N. С учетом сделанных
замечаний будем иметь
Rn = min {х2 A^XAnxn +$e2N + rN[uN + r~£(aN-bN&gnuN'j2]-
UN
-r^(aN -bN sign^)2},
393
где
=аЧЛгХВ + рИ2п2)а + ор;
aN — bN = р Ут\е^.
Отсюда находим, что оптимальное управляющее воздействие на
последней коррекции равно
UN = ~^N^aN ~ &N ЭД11 aN^~ ~^NXN “ ^NeN s^n(^xjv)»
где
~ rj = Гдг P ^Л»
а функция будущих потерь при этом
&N ~ XN^NXN + sign(IArXiV) + ^Nejf,
где
= ~ ’ P^ = ^TN^N^N’ = ₽“ ’
Для получения решения при других i < N воспользуемся мето-
дом параметров. Аппроксимируем функцию RN квадратичной. Наи-
более просто в данном случае это делается путем пренебрежения вто-
рым слагаемым в выражении для RN:
= XN^NXN + •
Так как вид функции RN по сравнению с RN+{ сохранился пре-
жним, то, повторяя изложенные рассуждения, получим аналогич-
ную структуру управления и для предыдущей (А—1)-й коррекции.
Поэтому, аппроксимируя функцию будущих потерь для любого /
квадратичной функцией вида
Ri=xT Л.х. +р,е?,
394
получим алгоритм субоптимального управления
= - £.х(. - (^sign (А-х-), (18.70)
где параметры £,, ( определяются формулами
А=г//-’5’-л/+1Д.; /,.=ггад.
Здесь
Г. = а + (1 + о2)(ЛгЛ /+1В+P/+/2n2L
а Л/, Р, удовлетворяют рекуррентным соотношениям
Л; = ДгЛ/+|А. - ; р. = р/+1 - Г,/2
при граничных условиях
ЛА+1=^’ Ру+1=Р-
Представленные формулы определяют алгоритм управления с
точностью до знания матриц А.. Уточнение последних может быть
произведено методом последовательных приближений для осреднен-
ной в статистическом смысле траектории процесса перевода
Х’+1 = 4х? + Ви/>ём = ео - Ksinil I «, I
с использованием найденного алгоритма управления (18.70). Эле-
менты К(, входящие в матрицы Я., в начальном приближении мо-
гут быть заданы, например, равными К. = Ki+1. В каждом после-
дующем приближении они уточняются на основе моделирования
осредненного процесса. Описанный метод можно трактовать как
простейшую разновидность метода статистической линеаризации.
При необходимости статистическая линеаризация величины <pzx2/
395
может быть проведена и обычным способом, который, однако, яв-
ляется более громоздким.
Определив структуру управления, а следовательно, синтезируе-
мую составляющую, можно перейти ко второму этапу оптимизации,
т. е. определению целочисленной последовательности K = {Kf}, i ~
= 1,..., N.
В первом приближении эту задачу можно решить, используя для
оценки критерия оптимальности квадратичную функцию будущих
потерь R. В этом случае последовательность {/Q} определится из
условия минимизации величины
= Х0 ^0Х0 + ?0е0
по всем К., с учетом ограничений /п f zt*.. Так как все К. — целые
числа, то для решения задачи следует использовать прямые методы
поиска.
Уточнение полученной таким образом последовательности
К = {Л'.} может быть проведено путем минимизации величины J ,
найденной более точными методами, например, методом статисти-
ческого моделирования процесса перевода с использованием моде-
ли (18.69) и алгоритма (18.70). В этом случае оценка обобщенного
критерия имеет вид
где J. — величина, характеризующая обобщенный критерий опти-
мальности ву-й реализации; п — число реализации.
При использовании метода статистического моделирования не-
трудно получить оценки и других характеристик процесса перево-
да, в частности, характеристики конечной точности
где — величина в у-й реализации.
396
Решение задачи завершается отыскиванием множителя Лагран-
жа а в обобщенном критерии оптимальности из условия J'(a) = .
18.8. Достаточные условия оптимальности.
Непрерывный случай. Стохастическое уравнение Беллмана
Теперь рассмотрим случай непрерывного управления системой,
описываемой следующим стохастическим дифференциальным урав-
нением:
x = /(x,w^,Z), (18.71)
где х — вектор состояния; и — вектор управления; £ — вектор слу-
чайных возмущений.
Будем рассматривать поведение системы (18.71) на конечном
интервале времени [0,7], полагая, что управление принадлежит до-
пустимому множеству «е U. Поскольку практически любое случай-
ное возмущение может быть представлено как результат прохожде-
ния белого шума через некоторую динамическую систему, называ-
емую формирующим фильтром, то, не нарушая общности, можно
считать белым шумом с характеристиками
Л/Щ = 0, A/^(zy] = ZXW-r), (18.72)
где 5(0 — функция Дирака; D(t) — матрица интенсивностей белого
шума.
Поставим задачу определения такого закона управления и(х,0,
который обеспечивает перевод системы (18.71) из начального состо-
яния х(0) в конечное х( 7) с минимальным значением критерия
7 = Af{F[x(T)]}. (18.73)
Для получения достаточных условий оптимальности в данной
задаче, как и в детерминированном случае, проведем дискретиза-
цию системы (18.71) с шагом А, представив непрерывный белый
397
шум его дискретным аналогом — дискретной последователь-
ностью случайных независимых векторов {£,}, / = 1,7V , с характе-
ристиками
Л/[^]=О, лф,.л;]=^.
(18.74)
В результате вместо (18.71) и (18.72) будем иметь
xM=xi+^fl(xi’ui^i')’
(18.75)
/ = М[Г(х„+1)]. (18.76)
Для полученной дискретной задачи достаточные условия опти-
мальности согласно (18.3) имеют вид
W = min Л/{Я,.+1 [xw = х,. + ^.(х,.,И,.Л,)]/хри,.} (18.77)
с граничным условием
= Л^+1). (18.78)
Полагая, что функция будущих потерь имеет частные производ-
ные первого и второго порядка для всех моментов времени, разло-
жим функции RM(xi+]) в соотношении (18.77) в ряд Тейлора в ок-
рестности точки а; с точностью до членов второго порядка мало-
сти. Разделив все на Д, получим
Л(х()-^,(х,.)=min рящ(х,7 Гд^ T
Д [ Эх,. Гд ' '
1 с ГлхГ Дх;ДхГ "II
(18.79)
398
где
Ч =*ы ~х,-
Переходя в соотношении (18.79) к пределу при Д->0, получа-
ем следующее уравнение в частных производных относительно фун-
кции будущих потерь:
ЭЛ(х,0 . [дЯ(х,Ог , л 1 с Гд2Я(х,0 Д1
-Ч-=^п1 <18-80)
где
а(х,и, О = lim — М {[х(/ + Д) - х(0]/ х, и, /};
N(x, и, t) = Нт М {[х(/ + Д) - х(О][х(/ + Д) - х(0]Г / х, и, /}. (18.81)
Вектор o(x,w,0 характеризует математическое ожидание смеще-
ния марковского процесса (18.71) из точки х в момент времени t за
время Д при оптимальном управлении u(t) и называется вектором
коэффициентов сноса марковского процесса. Аналогично матрица
N(x,u,t) характеризует ковариационную матрицу смещения из точ-
ки (х,и) в момент t за время Д и называется матрицей коэффициен-
тов диффузии марковского процесса (18.71).
Соотношение (18.80) называют часто стохастическим уравнени-
ем Беллмана в отличие от детерминированного случая. Это уравне-
ние и представляет собой достаточные условия оптимальности в рас-
сматриваемой задаче. Решая его, находим функцию будущих потерь
R(xtt) и параллельно с этим алгоритм оптимального управления
w(x,0.
Граничное условие для стохастического уравнения Беллмана
(18.80) следует из соотношения (18.78) и записывается в виде
399
A(x,D = F[x(T)].
(18.82)
Упражнение 1. Получить уравнение (18.80).
Упражнение 2. Показать, что для задачи управления системой (18.71)
с целью минимизации критерия оптимальности
(т
о
стохастическое уравнение Беллмана (достаточное условие оптимальности)
принимает вид
ЭЛ(х,г) . Г ЭЯ(хД)г 1 о ГЭ2Л(х,Г) 11
—57^=minj/°(х-“-0+—V2_e(x,“,')+2Jz’[ fa2 (18.83)
с прежним граничным условием (18.82).
18.9. Линейные непрерывные системы,
оптимизируемые по квадратичному критерию
Рассмотрим задачу синтеза оптимального управления u(x,t) ли-
нейной непрерывной системой
х=Ах+Ви + Ъ (18.84)
полагая, что ограничения на управление отсутствуют, а £ является
белым шумом с характеристиками (18.72). В качестве критерия,
подлежащего минимизации, примем интегро-терминальный крите-
рий
J=M \uTWudT+x(T)T\x(T) .
Lo
(18.85)
Будем считать матрицу W положительно определенной.
Для решения задачи обратимся к достаточным условиям опти-
мальности. В данном случае стохастическое уравнение Беллмана
(18.83) принимает вид
400
ЭА(х,Г)
Эг
• f Tuz ЭЯ(х,Г)г / 1 с ГЭ2/?(х,Г) _ч
= mmleWudt + —- -а(х,u,t) + -Sp ------------Ц2-2N(x,u,f)
ueU [ дх 2 L Эх2
(18.86)
с граничным условием
/?(х,/) = х(П7’МП.
(18.87)
Найдем характеристики a(x,u,t) и #(x,w,r) марковского про-
цесса (18.84). Раскрывая в выражениях (18.80) пределы с учетом
(18.84) и (18.74), получаем:
a(x,u,t) = Нт^Л/^Д-х, + + ^)Д]/Хр«.}= Лх+ Ви;
N(x,u,t) =
= Нт 1М |[4-Xj + Btu. + + ^iui+ д2 / *р w/}=
(18.88)
Таким образом, вектор сноса случайного процесса х(Г) представ-
ляет собой правую часть уравнения (18.84) при отсутствии возму-
щений, а матрица коэффициентов диффузии совпадает с матрицей
интенсивностей белого шума и не зависит ни от х, ни от и. С учетом
(18.88) уравнение Беллмана (18.86) принимает вид
ЭЯ . [ Ти/ dRT,A D4 1сГ^л11
— = miruw/H'w+——(Ax+ Bu)+-Sp k
Or « Эх 2 Эх2
(18.89)
Эх2
Отсюда находим связь оптимального управления с функцией
будущих потерь:
2 дх
(18.90)
401
С учетом (18.90) получаем окончательно следующее уравнение
для функции будущих потерь:
ЭЯ 1 ЭЯ7 DU/ . DT dR dRT . 1 „ (d2R
-э7=“41Г^ в э7+э7 <1891>
Покажем, что решение этого уравнения с учетом граничного
условия (18.87) имеет вид
R(x,t) = xTA(t)x+c(t). (18.92)
Подставляя это выражение в уравнение (18.91), получаем
-хт Ах - с = -хтАВ W~xBtАх + 2хтААх + Sp(AD). (18.93)
Уравнение (18.93) обращается в тождество при любых х, если
матрица Л и скаляр с удовлетворяют уравнениям
-Л = АА + АТА - ABW~'BTA\
. (18.94)
-С=5р(ЛЛ).
Граничные условия для этих уравнений следуют из сравнения
выражений (18.92) и (18.87) и имеют вид
A(T) = Z, С(Т) = 0. (18.95)
С учетом выражения (18.92) алгоритм оптимального управления
(18.90) окончательно принимает вид
u = -Lx, (18.96)
где матрица коэффициентов обратной связи
L = W~'BTA. (18-97)
Таким образом, как и в дискретном случае, закон оптимально-
го управления линейной стохастической системой является линей-
402
ным. Более того, он полностью совпадает с законом оптимального
управления соответствующей детерминированной системой. Итак,
аддитивное случайное возмущение типа белого шума ^(/) в линей-
ной системе не влияет на алгоритм оптимального управления при
использовании квадратичного критерия, а сказывается лишь на ве-
личине функции будущих потерь R(x,f) и, следовательно, на общем
значении критерия оптимальности. Другими словами, такие систе-
мы можно синтезировать, не учитывая аддитивных случайных воз-
мущений, влияние которых следует оценивать лишь при анализе точ-
ности работы замкнутой системы.
Упражнение 1. Убедиться в том, что функция будущих потерь (18.92) с
учетом соотношений (18.94) и (18.95) является решением уравнения (18.91).
Упражнение 2. Получить обобщение найденного решения на случай
управления системой (18.94) с использованием критерия оптимальности
7 = М j(xrQx + urH'u)dt + xT(T))ix(T) .
О
18.10. Оптимальное управление конечным состоянием
спускаемого аппарата
Рассмотрим задачу синтеза оптимального управления одномер-
ным конечным состоянием спускаемого в атмосфере Земли аппара-
та. Управляющей силой будем считать аэродинамическую силу, со-
здаваемую за счет изменения угла крена. Цель синтеза управления
состоит в обеспечении минимального рассеивания точек приземле-
ния аппарата, возникающего как за счет начальных ошибок, так и
за счет действия атмосферных случайных возмущений (порывы ветра,
вариации плотности воздуха).
Для простоты ограничимся случаем движения в вертикальной
плоскости. Принимая в качестве независимой переменной высоту
полета, уравнения движения спускаемого аппарата можно предста-
вить в виде
dh х/л И sin 9
403
dQ _ £
dh y m V sin 0
(18.98)
?У = .
dh ИsinG’
d(j\ _ M
dh JXV sin 0 ’
где V — скорость аппарата; 0 — угол наклона траектории; L — про-
дольная дальность; h — высота полета; у — угол крена; ш* — угло-
вая скорость аппарата; Сх, Су — коэффициенты лобового сопротив-
ления и подъемной силы соответственно; qw — воздушный скоро-
р у2
стной напор, q^ = ; Vw — воздушная скорость; S — площадь
миделя; т — масса аппарата; g — ускорение свободного падения;
R — радиус Земли; М— управляющий момент по крену, | М |< Л/тах;
Jx — момент инерции относительной оси симметрии.
Уравнения получены в предположении, что влияние порывов
ветра на движение аппарата сводится лишь к изменению аэродина-
мических сил заменой скорости Кна воздушную скорость Vw. Если
через W обозначить скорость горизонтальных порывов ветра, то
нетрудно установить связь между Vw и V:
vw =7и2+2ПГсой9+ил2.
(18.99)
Атмосферные возмущения могут быть представлены с помощью
линейных нестационарных формирующих фильтров. При этом для
404
ветра можно ограничиться фильтрдм первого порядка, а для вариа-
ции плотности атмосферы Др — фильтром второго порядка:
(18.100)
Здесь параметры а^,ар,ар, а также интенсивности Nw и N бе-
лых шумов и подбираются таким образом, чтобы статисти-
ческие характеристики (например, корреляционные функции) воз-
мущений (18.100) как можно точнее соответствовали действитель-
ным характеристикам. Вводя обобщенный вектор состояния
Хт = Гг,е,М,ч>И'',Др,—\
х sth
(18.101)
приходим к следующей математической модели управляемого про-
цесса:
(18.102)
где f(x9u) — вектор-функция, элементы которой легко получаются
из правых частей уравнений (18.98) и (18.100); и — управляющее
воздействие и = М; | и |< wmax = Л/тах; — вектор белых шумов;
=(0,0,0,0,0,^,0,^).
(18.103)
Задача синтеза оптимального управления заключается в опре-
делении такого закона w(x,A), который обеспечивает минимум дис-
персии координаты Xj = L в конечный момент времени, т.е. при
h = 0. Итак, критерий оптимальности можно записать в виде
J = Л/[х2(0)].
(18.104)
405
Предположим, что возмущенное движение с достаточной точ-
ностью описывается уравнениями в отклонениях относительно не-
которой номинальной траектории спуска. Тогда, проводя линеари-
зацию уравнений (18.98), получаем линеаризованную модель дви-
жения
^ = Abx+Bu+t, (18.105)
ап
Здесь под Дх понимается вектор, составленный из отклонений ком-
понент хот их значений на номинальной траектории при одинако-
вых h ; А — матрица; В — вектор частных производных правых ча-
стей (18.100) по компонентам вектора х и управлению и соответствен-
но. Естественно, что Ли В зависят от высоты полета h.
Для решения задачи обратимся к достаточным условиям опти-
мальности. Однако, учитывая скалярный вид критерия оптималь-
ности (18.104), предварительно произведем следующее преобразова-
ние задачи. Введем в рассмотрение новый вектор у, связанный с х
соотношением
у(А) = Ф(0,А)х(Л), (18.106)
где Ф(0,й) — фундаментальная матрица системы (18.106), удовлет-
воряющая уравнению
^^ = -Ф(0,Л)Л (18.107)
dh
при условии
Ф(0,0) = /. (18.108)
Из равенств (18.107) и (18.108) следует, что в момент h = 0 век-
торы х и у совпадают:
у(0) = х(0). (18.109)
Дифференцируя (18.106) по А и принимая во внимание уравне-
ния (18.105) и (18.107), получаем следующее уравнение для вектора у:
406
^ = Ф(0,Л)Йи + Ф(0,й)£г
ah
(18.110)
Поскольку с учетом (18.109) критерий оптимальности (18.104)
может быть представлен в виде
/=м[^(о>],
(18.111)
а компонента у3 согласно (18.110) не зависит от других компонент
вектора у, вместо векторного уравнения (18.110) можно ограничиться
лишь одним уравнением для этой компоненты:
dVi
~dh=^+x*
(18.112)
где через 03,т|з обозначены третьи компоненты векторов Ф(0,Л)Я
и Ф(0,Л)£ соответственно.
Таким образом, введение вектора у позволило рассматриваемую
задачу свести к скалярной. Теперь воспользуемся уравнением Бел-
лмана (18.80), которое в данном случае принимает вид
ЭЛ(у,Л) . [ЭЯ(у3,Л) 1 Э2Я(у3,Л) 1
----= mm —/3 р.ц + -—>
ЭЛ [ Эу3 нз 2 Эу2 3]
(18.113)
с граничным условием
Л(у3,0) = у2(0). (18.114)
Через N3 в уравнении (18.113) обозначена интенсивность бело-
го шума П3 •
Из уравнения (18.113) получаем структуру оптимального управ-
ления:
U = ~^maxSignp3Sign • (18.115)
Эу3
407
Таким образом, оптимальное управление является релейным. Из
физических соображений ясно, что функция будущих потерь R(y3,h)
является четной и возрастающей по | у31. Поэтому
ал(М>
sign——= signy
^3
(18.116)
С учетом (18.116) окончательно закон оптимального управления
(18.115) принимает вид
M = -«maxsignP3siSn3'3-
(18.117)
Итак, в данной задаче удалось найти закон оптимального уп-
равления без решения уравнения Веллмана в явном виде.
Таким образом, задача синтеза оптимального управления одно-
мерным конечным состоянием линейной системы решена полнос-
тью. Однако провести анализ точности, т. е. решить уравнение
(18.113) аналитически, и здесь не удастся.
Упражнение 1. Вывести уравнение (18.95). Получить выражение для
элементов матрицы А и вектора В.
Упражнение 2. Получить уравнение (18.97) для фундаментальной мат-
рицы Ф(0,Л).
Упражнение 3. Получить формулы для коэффициентов 03 и N3 в урав-
нении (18.103).
18.11. Учет дополнительных терминальных ограничений.
Непрерывный случай
Рассмотрим задачу синтеза оптимального управления системой
x = /(x,w,^), wet/
из условия обращения в минимум критерия
(18.118)
/° = Л/ J/0(x,«k* + F°(XT))
408
при дополнительных терминальны^ ограничениях
Jj J = U
Как и в дискретном случае, для учета этих ограничений приме-
ним метод множителей Лагранжа, сводя исходную задачу к задаче
минимизации обобщенного критерия
/ _ Гг /
J = ^Ujjj = м J/0(x,»)A+£a/>WD)
У=о |_о у=о
(18.119)
где ау. — множители Лагранжа (а0 = 1, ау > 0), удовлетворяющие при
оптимальном управлении системе уравнений
ay[J'-/'] = 0, / = !,/. (18.120)
В соответствии с этим для выявления структуры оптимального
управления следует воспользоваться уравнением Веллмана, соответ-
ствующим обобщенному критерию
ЭЛ(х,/)
8Z
= min (/0(х,ы) + - a(x,u,t) + - ^**^6(x,m,Z) 1 (18.121)
[ и Эх 2 Ц Эх2 JJ
с граничным условием, принимающим в данном случае вид
Л(х,Т)=£а/>(х(П).
у=0
Фактически уравнение (18.121) дает возможность определить
закон оптимального управления при различных значениях множи-
телей Лагранжа ау. Для отыскания окончательного решения следу-
409
ет решить систему уравнений (18.120) относительно ау. - При этом
сначала необходимо раскрыть зависимости характеристик JJ при
оптимальном управлении от множителей ау. J = 1,..., /. Это можно
сделать, вообще, различными способами. Один из них предполагает
отыскание в общем случае плотности распределения вектора состо-
яния в конечный момент времени с помощью уравнения Колмого-
рова и последующего раскрытия в соответствующей операции мате-
матического ожидания. Другой, более простой, способ заключается
в получении уравнения и последующем решении его непосредствен-
но для анализируемой характеристики JJ. С этой целью обратимся
к рекуррентному соотношению (18.29). Буквально повторяя рассуж-
дения, используемые при выводе уравнения Беллмана, нетрудно ус-
тановить, что при осуществлении предельного перехода при Д->0
из (18.29) получим следующее уравнение в частных производных:
ЭЛ>(х,Г) ЭЛ>(х,/)г А 1 с Гд2Я'(х,01*, /
эГ~а M+2Sp (х’° <18122>
относительно функции
#(х,/) = Л/{Г'[х(Т)/х,Г]}
с очевидным граничным условием
Rj(x,T) = Fj[x(T)].
Параметры a(x,t), b\x,t) представляют собой вектор сноса и
матрицы коэффициентов диффузии случайного процесса (18.118) при
оптимальном законе управления w(x,Z). Функция /?у(х,Г) представ-
ляет собой фактически величину JJ, вычисленную при условии, что
движение системы (18.118) начинается с момента Гиз состояния хи
происходит при действии оптимального управления w(x,r). Поэтому
7> = Л/[Я'(х(0),0)].
410
Так как закон управления u(x,t\, определяемый с помощью урав-
нения (18.121), параметрически зависит от набора а = {ау} J= 1,/,
то как Rj, так и JJ будут также зависеть от ос.
Таким образом, решение задачи синтеза при наличии дополни-
тельных терминальных ограничений сводится к решению уравнения
Беллмана (18.121) с целью выявления структуры оптимального уп-
равления, крещению уравнений вида (18.122) с использованием уже
найденного управления для установления зависимостей JJ от а и
последующему решению системы (18.120) относительно а.
Задача в общем случае является достаточно сложной. Основная
трудность состоит в необходимости совместного решения уравне-
ний (18.121), (18.122). Она легко преодолевается для линейных си-
стем при отсутствии ограничений на вектор управления, когда фун-
кции fQ, Fj являются квадратичными по своим аргументам. В этом
случае задача формулируется следующим образом.
Пусть динамическая система описывается линейным стохасти-
ческим уравнением
х = Ах + Ви +
где — по-прежнему белый шум с нулевым математическим ожи-
данием и матрицей интенсивностей D. Требуется найти оптималь-
ный закон управления системой из условия обращения в минимум
критерия
Ja = M ^(xTQx+uTWu)dt+xT(J")MT)
при дополнительных ограничениях
}' = М[хЦТ)Мх(Т)]</'.
Предполагается, что матрицы Q, Wположительно определен-
ные. В соответствии с этим уравнение Беллмана для данной задачи
имеет вид
411
= min xTQx+uT\¥u + ^— (Ax + Bu) + ±-Sp
и Эх 2
dR
dt
Эх2
с граничным условием
R(x,T) = YajXr(T)KJx(T).
;=о
Решение этого уравнения может быть записано в форме
Д(х,0 = хгЛ(/)х + с(/),
где Л(0,с(0 определяются с помощью системы обыкновенных диф-
ференциальных уравнений
~Л = 0 + ЛЛГ + ЛА - KBW~' Вт,
-c = Sp(AD)
при граничных условиях
А(Т) = ^а/Л с(Г) = 0.
J
Структура оптимального управления при этом получается ли-
нейной
w = -£x,
где матрица L определяется через матрицу Л:
L = W~'BTA.
Как видно из приведенных соотношений, параметры, форми-
рующие оптимальное уравнение, зависят от набора а = {ау.} ,j= 1,
..., Поэтому для окончательного решения необходимо определить
этот набор. Для этого обратимся к системе (18.120):
412
а//у(а)-Лу]=О, у = 1,/. (18.123)
Установим зависимости 7у (а). С этой целью раскроем сначала
выражение для параметров а*,Ь*. Получим
a={A-BL)x, b*=D.
Подставим в уравнение (18.122):
ЭЛ7 1„(Э2Л> )
= (A-BL)x+-Sp\—TD\
Э/ . Эх J 2 Эх2 J
(18.124)
Нетрудно установить, что решение этого уравнения с гранич-
ным условием RJ(x,T) = хг(7’)Хух(Т) имеет также вид квадратичной
формы
RJ(x,t) = xTAjx + с2(0,
где Л7,cJ зависят лишь от времени. Действительно, подставляя
Rj(x,t) в (18.124), получаем
-хгЛ7х - с7 = 2xTAJ(A - BL)x + Sp(A' D).
Это уравнение выполняется тождественно при любых х, если
Л7, с7 удовлетворяют системе
-Л> = AJ(A - BL) + (А - BL)TЛ>;
=5p(A'Z>)
с граничными условиями
A>(T) = V, c>(D = 0-
413
Представленные соотношения позволяют определить
RJ(х(0),0) = Jj и тем самым установить искомую зависимость 7у(а).
Остается решить систему уравнений (18.123) относительно а.
Таким образом, в задаче управления линейной системой с ад-
дитивным белым шумом при наличии изопериметрических ограни-
чений структура оптимального управления по-прежнему остается
линейной. Однако коэффициенты обратной связи теперь уже зави-
сят от статистических свойств возмущения. Эта зависимость прояв-
ляется через множители Лагранжа ау., которые являются корнями
системы (18.123).
18.12. О методах приближенного синтеза
оптимального управления
Основные трудности, с которыми приходится сталкиваться при
решении задач синтеза оптимального управления непрерывными
стохастическими системами, связаны с необходимостью отыскивать
решение уравнения в частных производных второго порядка. Так как
получение точного решения практически исключено, приходится
рассчитывать на получение приближенного решения. При этом могут
быть применены различные подходы.
Один из подходов базируется на приближенном решении урав-
нения Веллмана, соответствующего исходной задаче, с помощью
численных методов. К таким методам, в частности, относятся мето-
ды сеток. Разновидностью метода сеток является и метод, основан-
ный на использовании основного рекуррентного соотношения с
предварительной дискретизацией непрерывной задачи.
Другим подходом к получению приближенного решения задачи
синтеза может служить подход, базирующийся на использовании
комбинированного метода оптимизации. Сущность этого метода
была изложена при рассмотрении дискретных систем.
Практически все положения метода и последовательность реше-
ния задачи полностью переносятся на непрерывный случай. Поэто-
му не будем их заново здесь приводить. Отметим лишь, что отличие
будет состоять только в замене рекуррентных соотношений соответ-
ствующими дифференциальными уравнениями. Эти уравнения мо-
414
гут быть получены либо путем осуществления предельного перехо-
да от рекуррентных соотношений, либо путем решения уравнений в
частных производных вида (18.121), (18.124), составленных для ли-
неаризованной (обычно или статистически) системы (18.118).
19. СТОХАСТИЧЕСКИЕ ЗАДАЧИ СИНТЕЗА
ПО НЕПОЛНЫМ ДАННЫМ
В данном разделе рассматриваются задача синтеза оптимально-
го управления стохастическими системами при неполной информа-
ции о текущем состоянии объекта, когда считается, что вектор те-
кущего состояния непосредственно недоступен измерению и сами
измерения осуществляются с ошибками.
19Л, Достаточные координаты. Дискретный случай
Рассмотрим задачу синтеза оптимального управления системой
xM = fi{xi> ui> Ъ )> ' = (19.1)
полагая, что измеряется некоторый вектор yt, связанный с х. соот-
ношением
(19.2)
Здесь по-прежнему: xf — вектор состояния; Ц- — вектор управле-
ния («,е t/z) в /-й момент времени; yz — вектор измерения (наблю-
дения) в тот же момент времени; §z, vz — случайные векторы, кото-
рые характеризуют возмущения, действующие на систему (19.1), и
ошибки измерения соответственно. Предполагается, что статисти-
ческие свойства векторов £z, v. полностью известны.
В качестве критерия оптимальности, как и прежде, примем ха-
рактеристику конечной точности
415
Основная особенность задачи синтеза оптимального управления
при неполной статистической информации заключается в следую-
щем.
Поскольку вектор фазовых координат не измеряется, то синте-
зируемое оптимальное управление в Z-й момент времени и, должно
в общем случае зависеть от всех прошлых и настоящих измерений
{у7}, j -1,/, обозначаемых сокращенно через у1. Иными словами,
оптимальная стратегия управления является некоторой последова-
тельностью функций, ставящих в соответствие всем прошлым и те-
кущим наблюдениям векторы управления из условия минимума
критерия (19.3). Эта оптимальная стратегия может быть формально
найдена с помощью достаточных условий оптимальности методом
динамического программирования. Основное рекуррентное соотно-
шение при этом принимает вид
/$(у)=ттА/{4+1(У+1)/У, (19.4)
Здесь через ^(У) обозначена функция будущих потерь, представ-
ляющая собой минимальное значение критерия (19.3), которое мо-
жет быть достигнуто при оптимальном управлении системой (19.1),
начиная с момента времени i по наблюдениям (19.2), полученным в
моменты j = 1, /.
Граничным условием для (19.4), как и при управлении при пол-
ной информации, может служить следующее формальное равенство:
(19-5)
Соотношения (19.4) с учетом (19.5) определяют рекуррентную
процедуру последовательного синтеза оптимальных управлений в
следующем порядке: uN (улг), .
Синтез управления сводится к вычислению на каждом шаге
функции будущих потерь (/), раскрытию операции математичес-
кого ожидания и оптимизации по и. правой части в (19.4). Для рас-
крытия операции математического ожидания необходимо, в свою
очередь, вычисление условных плотностей вероятностей
«,), р(ум/у^ ц). В общем случае вычислить их очень
трудно, поскольку необходимо запоминать все прошлые и настоя-
щие измерения у'.
Задача значительно облегчается, если предположить существо-
вание некоторого вектора Z,-, называемого обычно вектором доста-
точных координат или статистик, который является функцией от у1
и удовлетворяет следующим условиям:
1) знание вектора Z, достаточно для определения оптимального
управления и. и функции будущих потерь , а это означает, что
плотности типа p(xz/y') могут быть представлены в виде Р (*,/£,•);
2) знание вектора Z/ в любой момент времени достаточно для
определения собственной будущей эволюции, т.е. для моментов j>i.
В этом случае рекуррентное соотношение (19.4) может быть
представлено в виде
^(z,.) = minA/{Ai+1(z,+l)/z,, «,}, (19,6)
причем согласно (19.5)
^+i=^(^+i)- (19-7)
Использование соотношения (19.6) вместо (19.4) упрощает ре-
шение задачи синтеза, поскольку функция будущих потерь теперь
зависит от вектора z, вполне определенной размерности для всех
417
моментов времени, в то время как размерность совокупности у‘ уве-
личивается с возрастанием номера i. С введением понятия достаточ-
ных координат исходная задача синтеза оптимального управления
при неполной информации может быть условно разделена на две:
определение достаточных координат и определение оптимального
управления как функции достаточных координат. Соответственно
оптимальный регулятор, получаемый в результате решения задачи,
состоит из двух блоков: обработки измерительной информации и
оптимального управления. Строго говоря, синтез обоих блоков не-
обходимо осуществить совместно. Однако в некоторых случаях,
например для линейной системы с аддитивным возмущением и квад-
ратичным критерием оптимальности, оказывается справедливой так
называемая теорема разделения, согласно которой задача определе-
ния достаточных координат отделяется от задачи синтеза собствен-
но оптимального управления. Эта теорема с успехом может быть
использована для приближенного решения задачи в общем случае.
Упражнение. Показать, что основное рекуррентное соотношение ме-
тода динамического программирования для задачи синтеза оптимального
управления системой (19.1) по наблюдениям (19.2) при критерии оптималь-
ности
/ = Л/
>1
(19.8)
с использованием понятия достаточных координат имеет вид
= «,-} (19.9)
при прежнем граничном условии (19.7).
19.2. Оптимальное управление линейной дискретной
системой при наличии аддитивных возмущений
Рассмотрим задачу синтеза оптимального управления линейной
дискретной стохастической системой, описываемой уравнением
х,+| = Aixl+ Biui+' = l>N-
(19.10)
418
В отличие от случая управления по полным данным теперь бу-
дем считать, что измерению доступен не сам вектор состояния х(, а
некоторый вектор у, связанный с х. соотношением
у. = Н.х. + v., i = 1, TV,
(19.11)
где через v. обозначена случайная ошибка /-го измерения. В каче-
стве критерия оптимальности по-прежнему примем критерий
J = M
" N
YUTWiUl +^1^JV+|
U=i
(19.12)
где И<, X — заданные матрицы.
Будем считать, что и vf — независимые гауссовские случай-
ные векторы с характеристиками
Л/[^.] = 0, M[^J]=0, (19.13)
Af[v(] = 0, = A/^vJ^O.
(19.14)
Прежде всего необходимо определить достаточные координаты
в данной задаче. С этой целью воспользуемся так называемым дис-
кретным фильтром Колмана, позволяющим определить байесовскую
(апостериорную) оценку текущего вектора состояния xi по всем
предшествующим и текущим измерениям (19.11), т.е. по измерени-
ям у.
Введем следующие обозначения: — соответственно апо-
стериорное математическое ожидание и апостериорная корреляци-
онная матрица вектора по измерениям у-1; — мате-
матическое ожидание и корреляционная матрица вектора х. по из-
419
мерениям . Другими словами, — прогнозируемое на один
шаг вперед значение , а j — его корреляционная матрица.
В силу (19.10) и (19.13) справедливы соотношения
= 4-t^-i + ^-Л-i ’ (19.15)
(19.16)
С учетом принятых обозначений фильтр Калмана можно пред-
ставить в виде [15]
(19.17)
(19.18)
Это значит, что вектор zz и матрица Pf, определяемые в соот-
ветствии с (19.17) и (19.18), являются соответственно апостериор-
ным математическим ожиданием и апостериорной корреляционной
матрицей вектора х. при заданных измерениях. Вектор zz дает оп-
тимальную в смысле максимума апостериорной плотности вероят-
ностей оценку вектора х. по всем прошлым и настоящим измере-
ниям, матрица Р{ характеризует ковариации ошибок этой оценки.
Из соотношений (19.17) и (19.16) следует, что корреляционная
матрица Р. не зависит от конкретных измерений и управлений. Она
полностью определяется свойствами системы и канала наблюдения
(через матрицы ), а также статистическими характеристика-
ми (Д, г.) возмущений £z, vz и может быть определена заранее. Имея
это в виду, можно считать, что условная плотность вероятностей типа
420
р(х, /у1) в любой момент временй полностью определяется векто-
ром Zf и может быть представлена в виде р(х. /z{). С другой сторо-
ны, знания Z/, согласно (19.17) и (19.15), достаточно и для опреде-
ления собственной будущей эволюция. Иными словами, вектор Z,
является вектором достаточных координат в данной задаче.
Теперь можно перейти к определению алгоритма оптимального
управления. С этой целью преобразуем соотношение (19.17) для
вектора z,, представив соотношение (19.18) в следующем виде:
pii}-\=pr'-HTriHr (19.19)
Подставим (19.19) в (19.17), учитывая при этом (19.15), и полу-
чим
Z; = (19.20)
где
E,-i = PiHi '•/* |> - н, (4-|Z(-i + )]• (19-21)
С учетом (19.10), (19.11) последнее соотношение может быть
приведено к виду
(19.22)
^1-1 “ Zi-V
Оно позволяет установить статистические свойства вектора £,_!.
В частности, согласно (19.13), (19.14), (19.16) можно записать, что
М[Е,._1/г,_1] = 0; (19.23)
w[em E,-i|^-i] = PiHlTX(HiPiH-\Hl + ri)’7'Hipi=ni-v (19.24)
421
Итак, эволюция достаточных координат описывается уравнением
ЭД =Alzi + Biui'+el, (19.25)
причем
Лф,] = 0, М[е.,, ef]=n(. (19.26)
Воспользуемся достаточным условием оптимальности в виде
рекуррентного соотношения (19.9) с учетом (19.7). Применительно
к данной задаче получаем
$ (Zi) = min М{[«,гW,ut + Л,.+1 (эд,)]/эд}. (]9 27)
Соотношение (19.27) с точностью до обозначений совпадает с
соотношениями (18.12),(18.13). Поэтому согласно (18.14)—(18.20)
можно записать следующие соотношения для функции будущих
потерь:
^(z,.)=zfA,z,.+c,., (19.28)
где
Л/=4гЛ,.+14-£’’Г/£/; (19.29)
ct=cM+sP{KM’ ni)'< (19.30)
£,. = ^5^4, Г,= Wl + B[AMBr (19.31)
Закон оптимального управления по-прежнему имеет линейную
структуру:
(19.32)
Начальные условия для рекуррентных соотношений (19.29) и
(19.30) получим, рассмотрев последний шаг управления. Поскольку
согласно (19.7)
422
^N+\{ZN+\)~ (19.33)
то, принимая во внимание, что
XN+1 = anzn + BNUN + ЕЛГ’ f <хУ+1 не измеряется) (19.34)
(19.35)
(19.36)
(19.37)
(19.38)
(19.39)
(19.40)
ZNz=^N+AN^Ni Л/[£лг]=О>
Пу = М [бу, Еу ] = Dn + An Pn A J = PN+1|y,
из (19.27) находим
&N (ZN ) = ZN^NZN + CN’
ГД£
kN = A^XAn + £уГу£у;
CN = *5p(^ ^y+l|y);
Гу = + В%/кВы, £у = Гу By Му;
Wy =-Lnzn.
Сравнивая (19.29)—(19.33) с (19.36)—(19.40), заключаем, что
последние соотношения могут быть представлены более компактно
в виде
CN+\ =®’ KN~^N+1\N- (19.41)
Ранее было показано, что при наличии аддитивных возмуще-
ний алгоритм оптимального в смысле квадратичного критерия уп-
равления линейной системой по полным данным совпадает с алго-
ритмом оптимального управления соответствующей детерминиро-
ванной системой. Полученное теперь решение формально также
423
совпадает с детерминированным. Разница лишь в том, что в алго-
ритме (19.32) вместо вектора фазовых координат х. выступает век-
тор достаточных координат z, (вектор оптимальной оценки), опре-
деляемый, в свою очередь, с помощью фильтра Кал мана (19.17),
(19.18).
Таким образом, в линейных системах с квадратичным критери-
ем оптимальности при аддитивных гауссовских возмущениях опти-
мальный стохастический регулятор представляет собой последова-
тельное соединение фильтра Калмана для получения вектора доста-
точных координат (оптимальной оценки) и устройства оптимального
детерминированного управления. Сформулированный результат,
известный в литературе также под названием теоремы разделения,
находит широкое применение при получении приближенного реше-
ния задачи синтеза оптимального управления нелинейных систем.
При этом задача синтеза оптимального управления по неполным
данным разбивается на две решаемые независимо (по аналогии с
линейным случаем): задачу определения оптимальных оценок век-
тора фазовых координат и задачу определения оптимального управ-
ления по полным данным. Основанием для этого служит тот факт,
что при формировании блока оптимальной оценки добиваются хо-
рошей сходимости оценки к истинному вектору фазовых координат.
Упражнение 1. Получить соотношения для фильтра Калмана (19.17),
(19.18).
Упражнение 2. Показать, что, используя известное матричное тожде-
ство
(А + ВСВТ ) 1 = А-' - А-'В(С-' + ВтА-' В)'1 ВтА-',
соотношение (19.18) фильтра Калмана можно представить в виде
р, = Р^-P^HJ [г,+Я,д-_1Я(Г]‘| Н,Р^.
Упражнение 3. Решить поставленную выше задачу, принимая в каче-
стве критерия оптимальности величину
(19.42)
424
19.3. Оптимальное управление линейной непрерывной
системой при наличии аддитивных возмущений
Изложенный выше метод синтеза оптимального управления с
использованием достаточных координат может быть обобщен и на
случай управления непрерывными системами. В качестве примера
рассмотрим задачу синтеза оптимального управления линейной си-
стемой
х = Ах+Ви + ^ (19.43)
Однако, в отличие от случая управления по полной информа-
ции, теперь будем полагать, что вектор х непосредственно измерен
быть не может. Измеряется некоторый вектор у, связанный с х ли-
нейным соотношением
y = #x+v, (19.44)
где v — вектор ошибок измерения.
В качестве критерия оптимальности примем математическое
ожидание взвешенной суммы энергетических затрат и характерис-
тики конечной точности
J = M
~Т
fuTWudt+xT(T)U(T) .
_о
(19.45)
Будем считать, что £ , v — белые гауссовские шумы с характе-
ристиками
М[г#)]=0, Л/^(/)^(т)] = Д5(/-т);
M[v(r)] = 0, М[у(г)гг(т)] = г8(г-т).
(19.46)
Возможны два подхода к решению задачи.
Первый подход заключается в дискретизации соотношений
(19.43)—(19.46) и применении полученного выше решения. В этом
случае дискретными аналогами являются следующие соотношения:
425
х/+1 = Aft + Вщ +
(19.47)
y^H.x. +v.;
(19.48)
J = M xTN+xUN^
(19.49)
Д=/ + Л(/,.)Д/, B,=5(r,)AZ, ^=^(/()д/;
(19.50)
^[Xo]-XO> лфо Xo]--®Ao’
л/^(/,.)]=о. м[^)
A/[v(r()] = 0, A/[v(/;) уГ(г,)]=~^Р = /г (19.51)
Применительно к данным соотношениям дискретный фильтр
Калмана (19.17),(19.18) принимает вид
г,- =[/ + Л(/,_,)дф;_, + )д/им| + ЫР1Н{г~' (/,)х
х{У/ -Я,.[(/ + Л(/,._,)дг)г,._1 +В(г,._1)дч_1]}; (19.52)
Vi = 17+А ('<-i М p‘-i ['+А ('/->) д']г+°('-1)"=
= PiA + A(t^ )Pl_lM + Pi_lAT (/,_])Д/ + D)Д/ + О(д/2 ); (19.53)
426
Р, = Р,^-Р^НТ\^Н^_ХНТ
HiP*-v (19.54)
откуда при Д/ —> 0 получаем дифференциальные уравнения для апо-
стериорного математического ожидания и корреляционной матри-
цы Р.
z = Az + Bu + РНтг~х (у - Яг); (19.55)
Р = АР + РАТ -PHTrHP+D. (19.56)
Уравнения (19.55) и (19.56) принято называть непрерывным филь-
тром Колмана. Эти уравнения являются непрерывными аналогами
соотношений (19.17), (19.18).
Как и в дискретном случае, апостериорная корреляционная
матрица Р может быть определена заранее, так как она не зависит
от конкретных значений управлений и измерений. Поэтому вектор
апостериорного математического ожидания z может рассматривать-
ся в качестве вектора достаточных координат.
Аналогично получим и алгоритм оптимального управления.
Подставим соотношения (19.50), (19.51) в (19.28)—(19.32):
^(z,.) = z/’A,.z,.+c,;
Л,.=[/ + Л(/,.)Д/]ГЛ,.+1
[/ + Л(/,.)дг]-4г,.£,.; (19.57)
с,= с,.+|+5/>(л,.+|Л,.);
Г, =И/(г,.)д/ + 0(д/2);
£,. = Г7>^(/,.)д^л,.+1[/ + /1(г,-)дг];
427
Я,-
",+1(^+о(д/))я4
дг
r-' (tM )ЫНМРМ.
Отсюда при А/—>0 получаем
R(z,t)=zTA.z + c, (19.58)
-А = АТЛ + ЛА - ЛВИ'-'ВГл; (19.59)
-с=5р(лРНтг-'НР); (19.60)
и = -№~'ВтЛг = -Lz- (19.61)
Причем согласно (19.38), (19.41)
Л(Г) = Х, c(T) = Sp(XP(T}). (19.62)
Алгоритм оптимального управления является линейным и по
структуре совпадает с оптимальным детерминированным управле-
нием. Иными словами, теорема разделения для линейных систем с
аддитивными возмущениями и квадратичным критерием справед-
лива как в дискретном, так и в непрерывном случае. Синтезирован-
ная оптимальная система управления включает в себя последователь-
ное соединение непрерывного фильтра Калмана, определяемого
уравнением (19.55) с учетом (19.56), и управляющего устройства, ре-
ализующего алгоритм (19.61) с учетом (19.59)—(19.62).
Второй подход к решению рассматриваемой задачи заключает-
ся в непосредственном применении стохастического уравнения Бел-
лмана (18.83). С этой целью задачу (19.43)—(19.45) сформулируем в
терминах достаточных координат:
Z = Az + Ви + е;
J = М ИuTWudt + zT (T)Xz (T)+Sp[M>(T)] .
.0 J
(19.63)
(19.64)
428
Здесь
е = РЯгг-’(у-Яг)=РН7'г-1(р + Я5), 8 = z-x (19.65)
С учетом (19.63) и (19.64) уравнение (ЮЗ) для функции буду-
щих потерь R(z,t) принимает вид
эл/
dz I
ЭА • Til/ (dR
— м+ —
Э/
a(z,u,t) + ^Sp
(19.66)
Граничное условие согласно (18.82) приобретает форму
Л(^,Г) = гг(Т)Хг(Г)+5р[ХР(Г)]. (19.67)
В соответствии с определением (18.81) и по аналогии с (18.88)
устанавливаем, что
a(z,w,r) = Az + Ви, N (г,u,t) = РНтг~'НР. (19.68)
Уравнение (19.66) с учетом (19.68) с точностью до обозначен-
ной совпадает с уравнением (18.89). Поэтому и его решение будет
иметь вид
R(z,t) = zTAz + c(t). (19.69)
Причем согласно (18.94), (18.95) с учетом (19.67), (19.68)
-Л = ЛЛ + >47'А-Л5И/-,5ГЛ, Л(Г) = Х; (19.70)
-с=5р(ЛРНтг-'НР), c(T)=Sp[M>(T)]. (19.71)
Алгоритм оптимального управления при этом принимает вид
u = -W-'BThz=-Lz, (19.72)
что полностью совпадает с алгоритмом (19.61).
429
Упражнение I. Получить соотношения (19.68).
Упражнение 2. Показать, как изменится решение рассмотренной за-
дачи, если в качестве критерия оптимальности принять величину.
“г 1
J = M J(xrQx + wrW^)^ + xr(r)2uc(r)L
.0 J
19.4. Синтез автономной системы управления конечным
состоянием спускаемого аппарата
Обратимся снова к задаче синтеза автономной системы управ-
ления конечным состоянием спускаемого аппарата. Целью управ-
ления по-прежнему является обеспечение минимального рассеива-
ния точек приземления, которое возникает за счет случайных воз-
мущений, действующих в полете (порывы ветра, отклонение плот-
ности атмосферы от стандартной, отклонения геометрических и
аэродинамических параметров от расчетных). Однако, в отличие от
случая управления по полной информации, теперь предположим, что
для управления доступна лишь информация от акселерометров, ори-
ентированных вдоль связанных осей аппарата.
Ограничимся рассмотрением плоского движения центра масс
спускаемого аппарата, полагая, что оно может быть достаточно точ-
но описано линеаризованными относительно расчетной траектории
спуска уравнениями движения типа
— = Ах + Ви +
ап
(19.73)
где £ — белый шум с характеристиками
V[W]=0,
Предполагается, что в состав вектора состояния х включены
параметры, описывающие как движение центра масс, так и дина-
мику движения аппарата относительно центра масс в продольной
плоскости.
430
В соответствии с постановкой задачи измерению доступен век-
тор перегрузки п с компонентами
/since-% cos a Kcosa + Xsina
«1 =-------------; «2=--------------:• (19.74)
mg mg v 1
Здесь У—сила лобового сопротивления; Y— подъемная сила; a —
угол атаки; т — масса аппарата; g — ускорение свободного падения.
Линеаризуя выражения (19.74) относительно расчетной траек-
тории, получаем
Дл = Hx+Vu + v (19.75)
или
у = Нх + v,
где введены обозначения
у = Дл-Ии; Ьпг = (Д/7рДл2);
ДЛ], Дй2 — отклонения соответствующих перегрузок от их расчет-
ных значений; Я, К— соответственно матрица и вектор частных про-
изводных правых частей (19.74) по компонентам вектора х и управ-
ления и, вычисленные на расчетной траектории; v — белый шум,
характеризующий случайные ошибки измерения, причем
Л/[у(й)]=0, Лф(й)гг(й|)] = г(й)5(Л-й1). (19.76)
В качестве характеристики рассеивания примем, как и прежде,
дисперсию координаты &L=x3 в момент h = 0. Тогда задача опти-
мизации математически может быть сформулирована так: требуется
синтезировать закон управления системой (19.73) на основе наблю-
дений (19.75), минимизирующий величину
7 = М[х32(й = 0)]. (19.77)
Имеем типичную задачу управления по неполным данным. Для
ее решения воспользуемся понятием достаточных координат. Соглас-
431
но вышесказанному в качестве вектора достаточных координат мо-
жет быть принят вектор апостериорного математического ожидания
г(Л), удовлетворяющий уравнению
= Az + Ви + е,
ап
(19.78)
где
7И[е(А)] = 0, М[г^)гтп = РНтг~{НР,
а матрица Р определяется из уравнения
— = АР + РАТ - PHTr^ HP + Л.
dh
(19.79)
Критерий (19.77) также можно представить через вектор доста-
точных координат
J = M[zl(h = 0)']+P}3(h = 0),
(19.80)
где через Р33 обозначен соответствующий элемент матрицы Р , пред-
ставляющий собой апостериорную дисперсию компоненты х3.
Итак, в терминах достаточных координат мы получили задачу
управления одномерным конечным состоянием линейной системы
(19.78). Но ее решение было получено выше. Согласно (18.117) ис-
комый закон управления в данном случае имеет вид
£фзу(°,А)г,
(19.81)
где Ф3у определяется, как и прежде.
Таким образом, оптимальный стохастический регулятор, обес-
печивающий минимальное рассеивание точек приземления спуска-
емого аппарата, представляет собой последовательное соединение
двух блоков: блока определения достаточных координат (в данном
случае фильтра Калмана) и блока управления, который служит для
формирования управляющего сигнала на основе достаточных коор-
432
динат и является в данном случае? релейным элементом. Для реали-
зации синтезированной системы управления необходимо использо-
вать бортовую ЦВМ.
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Доки М. Введение в методы оптимизации. — М.: Наука, 1977.
2. Беллман 3., Дрейфус С. Прикладные задачи динамического
программирования. — М.: Наука, 1965.
3. Брайсон А., Хо-Ю-ши. Прикладная теория оптимального уп-
равления. — М.: Мир, 1972.
4. Габасов Р., Кириллова Ф.М. Особые оптимальные управления.
- М.: Наука, 1973.
5. Гаврилов В.М. Оптимальные процессы в конфликтных ситуа-
циях. — М.: Советское радио, 1969.
6. Гермейер Ю.Б. Введение в теорию исследования операций. —
М.: Мир, 1971.
7. Демьянов В.Ф., Малоземов В.Н. Введение в минимакс. — М.:
Наука, 1972.
8. Ермольев Ю.М. Методы стохастического программирования.
- М.: Наука, 1976.
9. Зайченко Ю.П. Исследование операций. — Киев: Высшая шко-
ла, 1979.
10. Зангвилл У.И. Нелинейное программирование. — М.: Совет-
ское радио, 1973.
11. Кибзун А.И., Кан Ю.С. Задачи стохастического программи-
рования с вероятностными критериями. — М.: Физматлит, 2009.
12. Кротов В.Ф., Гурман В.И. Методы и задачи оптимального
управления. — М.: Наука, 1973.
13. Лебедев А. А. Введение в анализ и синтез систем. — М.: Изд-во
МАИ, 2001.
14. Лебедев А.А., Красильщиков М.Н., Малышев В.В. Оптималь-
ное управление движением космических летательных аппаратов. —
М.: Машиностроение, 1974.
15. Лебедев А.А., Бобронников В.Т., Красильщиков М.Н., Малы-
шев В.В. Статистическая динамика управляемого полета. — М.:
Машиностроение, 1978.
433
16. Летов А.М. Динамика полета и управление. — М.: Наука,
1969.
17. ЛэсдонЛ.С. Оптимизация больших систем. — М.: Наука, 1975.
18. Малышев В. В. Конспект лекций по курсу «Теория оптималь-
ных систем». — М.: МАИ, 1974.
19. Малышев В.В. Методы оптимизации сложных систем. — М.:
МАИ, 1981.
20. Малышев В. В. Программирование оптимального управления
летательными аппаратами. — М.: МАИ, 1982.
21. Малышев В. В. Синтез оптимального управления летательны-
ми аппаратами. — М.: МАИ, 1982.
22. Малышев В.В. Методы оптимизации ЛА при действии слу-
чайных и неопределенных факторов. — М.: МАИ, 1987.
23. Малышев В. В., Кибзун А.И. Анализ и синтез высокоточного
управления летательными аппаратами. — М.: Машиностроение, 1987.
24. Малышев В. В, Кибзун А. И. Метод решения стохастических
задач управления с вероятностными ограничениями // Труды Все-
союзного совещания по статистическим методам в процессах управ-
ления. — Алма-Ата, 1981.
25. Малышев В.В., Красильщиков М.Н., Карлов В.И. Оптимиза-
ция наблюдения и управления летательных аппаратов. — М.: Ма-
шиностроение, 1989.
26. Малышев В.В., Карп КА. Вероятностный анализ и управле-
ние. — М.: Изд-во МАИ, 2003.
27. Моисеев Н.Н. Математические задачи системного анализа.
- М.: Наука, 1981.
28. Моисеев Н.Н. Элементы теории оптимальных систем. — М.:
Наука, 1975.
29. Моисеев Н.Н. Иванов Ю.П., Столярова Е.М. Методы опти-
мизации. — М.: Наука, 1978.
30. Немировский А. С, Юдин Д. Б. Сложность задач и эффектив-
ность методов оптимизации. — М.: Наука, 1980.
31. Основы синтеза систем летательных аппаратов / Под ред.
А.А. Лебедева. — М.: Изд-во МАИ, 1996.
32. Поляк Б.Т. Введение в оптимизацию. — М.: Наука, 1983.
33. Пропой А.И. Элементы теории оптимальных дискретных
процессов. — М.: Наука, 1973.
434
34. Растригин Л.А. Статистические методы поиска. -М.: Наука,
1968.
35. Решетнев М.Ф., Лебедев А.А., Бартенев В.А. и др. Управле-
ние и навигация искусственных спутников Земли на околокруговых
орбитах. — М.: Машиностроение, 1988.
36. Смирнов О.Л., Падалко С.А., Пиявский С.А. САПР: форми-
рование и функционирование проектных модулей. — М.: Машино-
строение, 1987.
37. Федоров А.В. Программирование задач моделирования и
оптимизации на языке Object Pascal. — М.: Изд-во МАИ, 2001.
38. Фиакко А., Мак-Кормик Г. Нелинейное программирование.
Методы последовательной безусловной оптимизации. — М.: Мир,
1972.
39. Хедли Дж. Нелинейное и динамическое программирование.
- М.: Мир, 1967.
40. Химмелъблау Д. Прикладное нелинейное программирование.
- М.: Мир, 1975.
41. Шкадов Л.М. и др. Механика оптимального пространствен-
ного движения летательных аппаратов в атмосфере. — М.: Маши-
ностроение, 1972.
42. Шор Н.Э. Методы минимизации недифференцируемых фун-
кций и их приложения. — Киев: Наукова думка, 1979.
43. Черноусько Ф.Л., Боничук Н.В. Вариационные задачи меха-
ники и управления. — М.: Наука, 1973.
44. Юдин Д.Б., Гольштейн Е.Г. Линейное программирование. —
М.: Наука, 1969.
435
ОГЛАВЛЕНИЕ
ВВЕДЕНИЕ................................................3
ЧАСТЬ 1. ЗАДАЧИ МАТЕМАТИЧЕСКОГО
ПРОГРАММИРОВАНИЯ............................................8
1. КЛАССИФИКАЦИЯ ЗАДАЧ МАТЕМАТИЧЕСКОГО
ПРОГРАММИРОВАНИЯ........................................8
2. НЕОБХОДИМЫЙ МАТЕМАТИЧЕСКИЙ АППАРАТ..................17
2.1. Матрицы и векторы.............................. 17
2.2. Квадратичные формы..............................21
2.3. Частные производные и ряд Тейлора...............22
3. ТЕОРЕТИЧЕСКИЕ ОСНОВЫ
МАТЕМАТИЧЕСКОГО ПРОГРАММИРОВАНИЯ.......................24
3.1. Определения минимума и максимума................25
3.2. Необходимые условия оптимальности...............26
3.3. Достаточные условия оптимальности...............28
4. КЛАССИЧЕСКИЕ ЗАДАЧИ МАТЕМАТИЧЕСКОГО
ПРОГРАММИРОВАНИЯ..................................... 30
4.1. Задачи на безусловный экстремум............... 30
4.2. Задачи на условный экстремум.
Необходимые условия оптимальности....................34
4.3. Седловая точка функции Лагранжа. Достаточные условия
оптимальности в задаче на условный экстремум.........41
4.4. Направление наибольшего изменения функции.......47
4.5. Интерпретация множителей Лагранжа...............50
4.6. Условия оптимальности Куна и Таккера............52
5. ЧИСЛЕННЫЕ МЕТОДЫ БЕЗУСЛОВНОЙ ОПТИМИЗАЦИИ.. 55
5.1. Методы первого порядка..........................56
5.1.1. Метод градиентного спуска...................56
5.1.2. Градиентный метод с переменным шагом поиска.57
5.1.3. Метод наискорейшего спуска..................58
5.1.4. Преодоление овражных эффектов...............59
5.2. Методы второго порядка........................ 62
5.2.1. Метод Ньютона и его модификации.............62
5.2.2. Метод сопряженных градиентов................64
5.2.3. Квазиньютоновские методы....................66
5.3. Методы одномерного поиска.......................68
5.3.1. Обычный перебор.............................68
5.3.2. Метод дихотомии.............................69
5.3.3. Метод Фибоначчи.............................71
436
5.3.4. Метод золотого сечения.....................73
5.4. Методы нулевого порядка........................74
5.4.1. Метод покоординатного спуска...............75
5.4.2. Метод конфигураций.........................77
5.4.3. Метод линейной аппроксимации...............78
5.4.4. Метод деформируемого многогранника.........79
5.5. Методы случайного поиска.......................81
5.5.1. Метод ненаправленного случайного поиска....81
5.5.2. Метод простой случайной оптимизации........82
5.5.3. Метод наилучшей пробы......................82
5.5.4. Метод статистического градиента............84
5.5.5. Метод случайного поиска с направляющей сферой..85
5.5.6. Метод случайного поиска с направляющим конусом.87
5.5.7. Комбинированные методы.....................88
6. МЕТОДЫ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ..................90
6.1. Сущность симплекс-метода..................... 90
6.2. Алгоритм симплекс-метода.......................97
6.3. Пример применения симплекс-таблицы........... 102
6.4. Выбор начального допустимого решения......... 104
6.5. Двойственная задача линейного программирования..... 106
6.6. Задачи большой размерности с блочной структурой
матрицы условий. Метод декомпозиций..................... 111
6.7. Пример использования метода декомпозиции..... 118
7. МЕТОДЫ НЕЛИНЕЙНОГО
ПРОГРАММИРОВАНИЯ..................................... 122
7.1. Методы аппроксимирующего
линейного программирования.............................. 123
7.2. Метод возможных направлений.................. 125
7.3. Проективный градиентный метод............... 126
7.4. Методы штрафных функций ..................... 128
7.4.1. Метод внутренней точки................... 130
7.4.2. Метод внешней точки...................... 131
8. ЦЕЛОЧИСЛЕННОЕ ПРОГРАММИРОВАНИЕ................... 133
8.1. Методы отсечения............................. 133
8.2. Метод ветвей и границ ....................... 139
8.3. Динамическое программирование................ 142
9. МЕТОДЫ ОПТИМИЗАЦИИ ПРИ ДЕЙСТВИИ
НЕОПРЕДЕЛЕННЫХ И СЛУЧАЙНЫХ ФАКТОРОВ.................. 147
9.1. Основные типы неопределенностей.............. 147
9.2. Методы многокритериальной оптимизации........ 154
9.2.1. Свертывание критериев................... 154
9.2.2. Использование принципа Парето............ 157
437
9.2.3. Метод ПРИНН............................. 161
9.3. Минимаксные задачи и методы их решения.......171
9.3.1. Постановка задачи и основные особенности.171
9.3.2. Некоторые сведения из выпуклого анализа. 173
9.3.3. Численные методы решения................ 179
9.4. Методы оптимизации при наличии помех........ 189
9.4.1. Влияние ошибок измерения................ 189
9.4.2. Основные подходы к решению
стохастических задач оптимизации............... 194
ЧАСТЬ 2. ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ................204
10. ПОСТАНОВКА ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ 204
10.1. Непрерывный случай..........................205
10.2. Вертикальный спуск летательного аппарата....208
10.3. Дискретный случай...........................210
10.4. Коррекция траектории космического аппарата..211
И. ПРОГРАММИРОВАНИЕ ОПТИМАЛЬНОГО
УПРАВЛЕНИЯ. НЕОБХОДИМЫЕ УСЛОВИЯ
ОПТИМАЛЬНОСТИ........................................213
11.1 . Необходимые условия оптимальности.
Дискретный случай.................................213
11.2 . Оптимизация однопараметрической коррекции..220
11.3 . Необходимые условия оптимальности.
Непрерывный случай.............................. 222
11.4 . Оптимальное управление при вертикальном спуске.228
11.5 . Перевод космического аппарата в заданную точку.
Линейные системы, оптимизируемые
по квадратичному критерию....................... 232
11.6 . Спуск с максимальной боковой дальностью....236
12. ВЫРОЖДЕННЫЕ ЗАДАЧИ. ОСОБОЕ УПРАВЛЕНИЕ................243
12.1. Запуск метеорологической ракеты........... 243
12.2. Необходимые условия особого управления......248
13. ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ
С ОГРАНИЧЕНИЯМИ НА ФАЗОВЫЙ ВЕКТОР....................252
13.1. Оптимальные траектории, лежащие
на границе области............................ 253
13.2. Оптимальный по быстродействию
разворот в пространстве.........?.................259
13.3. Учет ограничений в виде неравенств.
Условия скачка........................................263
13.4. Оптимальное торможение космического
летательного аппарата.................................267
438
14. ЧИСЛЕННЫЕ МЕТОДЫ ПРОГРАММИРОВАНИЯ
ОПТИМАЛЬНОГО УПРАВЛЕНИЯ.............................272
14.1. Сведение к задаче математического программирования.... 272
14.2. Методы решения задач со свободным концом....274
14.3. Методы, использующие функции штрафа........279
15. ПРОГРАММИРОВАНИЕ ОПТИМАЛЬНОГО
УПРАВЛЕНИЯ ПРИ ДЕЙСТВИИ
СЛУЧАЙНЫХ ВОЗМУЩЕНИЙ...............................281
15.1. Необходимые условия оптимальности
для дискретных систем.............................281
15.2. Оптимизация однопараметрической коррекции. 286
15.3. Необходимые условия оптимальности
для непрерывных систем. Стохастический
принцип минимума............................... 288
15.4. Оптимальное управление летательным аппаратом
в бессиловом поле. Линейная система
с квадратичным критерием качества................293
15.5. Учет вероятностных ограничений.............295
16. МИНИМАКСНЫЕ ЗАДАЧИ УПРАВЛЕНИЯ.
ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ
В КОНФЛИКТНОЙ СИТУАЦИИ.............................299
16.1. Управление дискретными системами.
Необходимые условия оптимальности................300
16.2. Управление линейной системой.
Пример двусторонней операции.....................308
16.3. Управление непрерывными системами.
Необходимые условия оптимальности................312
16.4. Простейшая задача преследования.......... 314
16.5. Линейные игры преследования
с квадратичным критерием качества................317
17. ДЕТЕРМИНИРОВАННЫЕ ЗАДАЧИ СИНТЕЗА
ОПТИМАЛЬНОГО УПРАВЛЕНИЯ........................... 320
17.1. Достаточные условия оптимальности
при дискретном управлении.........................322
17.2. Алгоритм оптимальной коррекции. Линейные
дискретные системы, оптимизируемые
по квадратичному критерию.........................325
17.3. Достаточные условия оптимальности
при непрерывном управлении. Уравнение Беллмана.... 329
17.4. Оптимальное интегро-терминальное управление
летательным аппаратом. Аналитическое конструирование
оптимальных регуляторов..........................333
439
18. СТОХАСТИЧЕСКИЕ ЗАДАЧИ СИНТЕЗА
ПО ПОЛНЫМ ДАННЫМ.....................................337
18.1. Достаточные условия оптимальности.
Дискретный случай.................................338
18.2. Алгоритм оптимальной коррекции. Линейные
дискретные системы, оптимизируемые
по квадратичному критерию.............................341
18.3. Учет дополнительных терминальных ограничений.
Дискретный случай.....................................345
18.4. Оптимальное управление стационарным спутником
с использованием двигателя большой тяги...............350
18.5. Методы приближенного синтеза
оптимального управления......................... 356
18.6. Оптимизация коррекции траектории
космического аппарата.................................374
18.7. Оптимальное управление стационарным спутником
с использованием двигателя малой тяги.................384
18.8. Достаточные условия оптимальности.
Непрерывный случай. Стохастическое уравнение Веллмана.397
18.9. Линейные непрерывные системы,
оптимизируемые по квадратичному критерию..........400
18.10. Оптимальное управление конечным состоянием
спускаемого аппарата..................................403
18.11. Учет дополнительных терминальных ограничений.
Непрерывный случай....................................408
18.12. О методах приближенного синтеза
оптимального управления...........................414
19. СТОХАСТИЧЕСКИЕ ЗАДАЧИ СИНТЕЗА
ПО НЕПОЛНЫМ ДАННЫМ...................................415
19.1. Достаточные координаты. Дискретный случай.......415
19.2. Оптимальное управление линейной дискретной системой
при наличии аддитивных возмущений.................418
19.3. Оптимальное управление линейной непрерывной
системой при наличии аддитивных возмущений........425
19.4. Синтез автономной системы управления конечным
состоянием спускаемого аппарата.....;.............430
Библиографический список...............................433