Текст
                    АКАДЕМИЯ НАУК СССР
Ордена Ленина Институт проблем управления
Б. А. БЕРЕЗОВСКИЙ Ю.М.БАРЫШНИКОВ
В.И.БОРЗЕНКО Л. М. КЕМПНЕР
Многокритериальная
оптимизация
Математические
аспекты
Ответственный редактор
член-корреспондент АН СССР
П. С. КРАСНОЩЕКОВ
8
МОСКВА «НАУКА» 1989

УДК 519.816 Многокритериальная оптимизация: Математические аспек- ты / Б. А. Березовский, Ю. М. Барышников, В. И. Борзенко, Л. М. Кемпнер. М.: Наука, 1989.— 128 с.— ISBN 5-02-006543-9 В монографии с единых позиций исследуются свойства функций выбора, бинарных отношений, рассматриваются проблемы аппрокси- мации функций выбора, асимптотические свойства выбора по бинар- ным отношениям, гладкие задачи многокритериальной оптимизации; вводится и исследуется понятие асимптотической эквивалентности функций выбора. Для специалистов, занимающихся вопросами оптимизации, а также работающих в области прикладной математики. Рецензенты: доктор технических наук Э. А. ТРАХТЕНГЕРЦ, кандидат физико-математических наук С. Ю. ЯКОВЕНКО Научное издание Борис Абрамович БЕРЕЗОВСКИЙ, Юлий Маратович БАРЫШНИКОВ, Владимир Игоревич БОРЗЕНКО, Лев Маркович КЕМПНЕР Многокритериальная оптимизация: Математические аспекты Утверждено к печати Ордена Ленина Институтом проблем управления АН СССР Редактор издательства А. А. Боровая Художник Д. А. Шпаков Художественный редактор Н. В. Михайлова Технический редактор М. IO. Соловьева Корректор В. А. Бобров И Б № 39980 Сдано в набор 09.01.89. Подписано к печати 05.05.89. Т-00163. Формат 60X90V16. Бумага тип. № р Гарнитура обыкновенная. Печать высокая. Усл. печ. л. 8,0. Усл. кр. отт. 8,19. Уч.-изд. л. 8,5. Тираж 2400 экз. Тип. зак. 2485. Цена 1 р. 70 к. Ордена Трудового Красного Знамени издательство «Наука» 117864, ГСП-7, Москва, В-485, Профсоюзная ул., 90 2-я типография издательства «Наука» 121099, Москва, Г-99, Шубинскпй пер., 6 „ 1602110000-228 М 055(02)-89 65-89. кн. 2 3 Издательство «Наука», 1989 ISBN 5-02-006543-9
Введение Предмет этой книги столь же популярен, сколь и неопределен. Практически все специалисты-прикладники (конструкторы, ме- неджеры и др.) сегодня осознают, что оптимизировать нужно^ и не на глазок, а с привлечением максимально строгого аппарата. Массовое понимание этого пришло после войны, когда родилась область Operations Research, а вскоре было замечено (и замечено именно прикладниками), что отнюдь не всегда ясно, что же собст- венно оптимизировать. Поскольку математики на эту ситуацию сразу не откликнулись, возникло множество самых разнообразных способов выходить из возникающих затруднений. Развитие обла- сти приняло экстенсивный характер, ибо дело не стояло, и решать надо было сейчас, а не завтра. Итак, уже при рождении много- критериальная оптимизация не имела четко очерченных границ и прочной математической базы. Несмотря на это новое направ- ление быстро развивалось, отхватывая куски то у теории игр, то у инженерной психологии, то у математического программи- рования. Поэтому у склонного к строгости автора книги по многокри- териальной оптимизации естественное желание определить пред- мет рассмотрения, а затем начать первую главу со слова «Пусть...» натыкается на непреодолимое препятствие: здесь скорее нужен ботаник-систематик! Однако многообразный мир многокритериальной оптимизации можно разделить на два царства: в одном из них интересуются, как сравнить пару или небольшое число вариантов (альтернатив, решений...), в другом — как из многих вариантов выбрать неболь- шое число. И тут мы можем сделать первое твердое признание: предлагаемая книга целиком посвящена второму направлению. Причин этому несколько. Основная, пожалуй, состоит в том, что первое направление в некотором смысле — подобласть психо- логии, математизация которой (или хотя бы принятие каких-то строгих общепринятых постулатов) — дело будущего, если оно вообще осуществимо. Другая причина — выбор из многих вариан- тов есть область научных интересов авторов. Теперь, после (довольно иллюзорного) ограничения предмета рассмотрения, можно сформулировать цель книги: мы хотим пред- ложить набор понятий, методов и результатов, которые, с нашей точки зрения, и достаточно универсальны, чтобы с их помощью описывать и интерпретировать задачи многокритериальной опти- мизации, и достаточно поддаются исследованию, чтобы быть не- посредственно приложенными к конкретным задачам. Разумеет- 3
ся, мы не претендуем на патент панацеи от всех многокритериаль- ных бед, но надеемся хотя бы описать вещества и примерные пропорции для смешивания лекарств. Мы не хотим предъявлять свод инструкций на все случаи жизни — КАК выбирать,— но скорее объяснить, ЧТО значит — выбирать по многим критериям. Язык, которым мы будем пользоваться,— язык математики, универсальность которого служит в известной мере гарантом прочности постоянно подстраивающегося организма многокрите- риальной науки. При этом мы, разумеется, ни в коем случае не хотим терять связи с почвой — конкретными разработками. Для этого потребовалось, чтобы основные вводимые структуры были непосредственным отражением основных неформальных структур прикладной многокритериальной оптимизации. Первой такой структурой служит функция выбора как отраже- ние понятия оптимальности. По аналогии с тезисом Черча (нефор- мальное понятие алгоритма адекватно формальному понятию ре- курсивной функции) можно сказать, что основная наша посылка такова: понятие «оптимальность» описывается функциями выбора. Это, естественно, не есть строгий математический факт, но экс- периментальный результат, подтверждаемый всем опытом много- критериальной оптимизации. Функция выбора определяется тремя объектами: множеством вариантов, которые вообще могут рассматриваться; совокупностью допустимых наборов вариантов; правилом, которое каждому та- кому набору ставит в соответствие некоторый его поднабор на- илучших, или оптимальных, вариантов. Это правило и есть, соб- ственно говоря, функция выбора, а оптимальные варианты в не- котором наборе (предъявлении) называются выбором. Заметим, что мы принципиально считаем необходимым допол- нительно выделять совокупность предъявлений, из которых осу- ществляется выбор. Причин этому несколько, и к ним мы еще вер- немся чуть ниже. Вторая основная структура — структура критериального пространства. Сам термин «многокритериальная оптимизация» предполагает, что варианты полностью характеризуются своими оценками по критериям. Наличие же каких-либо дополнительных соображений, не сводящихся к критериям и влияющих на опти- мальность тех или иных вариантов, означает, что либо есть какие-то не учтенные нами критерии («скрытые параметры»), либо задача попросту лежит вне рассматриваемой области. Итак, с формальной точки зрения главным действующим лицом книги является выбор в критериальном пространстве. Но вернемся к основам. Коль скоро у каждого лица, принима- ющего решение (ЛПР), есть свое понимание оптимальности, то, казалось бы, пусть оно берет и осуществляет выбор, согласуясь с ним! Но этого-то как раз ЛПР обычно и не может сделать. По- этому с прикладной точки зрения главная задача многокритери- альной оптимизации — помочь человеку сделать выбор. Но чужая душа — потемки, и, перекладывая задачу принятия решения на 4
ЭВМ или консультанта, мы автоматически получаем, что одно по- нятие оптимальности заменяется другим. Ясно, что это понятие оптимальности должно быть, с одной стороны, близким к исходно- му у ЛПР, а с другой стороны, достаточно формализуемым, чтобы с ним можно было работать алгоритмически, а не интуитивно. Мы пришли к основному дуализу многокритериальной оптими- зации: понятие ----------------> формализация понятия оптимальности оптимальности ЛПР «аппроксимация» Обе части этой диады описываются функцией выбора. Заметим, что стрелка, соединяющая части, именуется аппроксимацией лишь в кавычках. Это отражает бедность наших знаний о том, что зна- чит более или менее точно аппроксимировать один принцип опти- мальности другим (т. е. одну функцию выбора другой). Отметим различие между наборами допустимых предъявлений справа и слева. У ЛПР предъявление допустимо, если оно может сделать из него выбор. Вообще свойства выбора (а значит, и прин- цип оптимальности ЛПР) сильно зависят еще и от того, что именно «подсовывает» ему жизнь для анализа. У ЭВМ (или консультанта) до- пустимы те предъявления, на которых работает формальная модель. В первой главе вводится понятие функции выбора и излагают- ся основы теории выбора. Как уже говорилось выше, функция вы- бора есть формальный (т. е. строго определяемый) объект, отра- жающий весьма неформальную вещь: представления человека об оптимальности. Поэтому имеет смысл исследовать те (формаль- ные) свойства функций выбора, которые имеют интерпретацию в содержательных терминах, а также те классы функций выбора, которые (точнее, «неформальные реализации» которых) встречают- ся на практике. Поэтому глава начинается с примеров функций вы- бора, имеющих максимальное прикладное содержание. Почти все эти примеры так или иначе дедуцируются из бинарных отноше- ний — второго фундаментального понятия, освещаемого в этой главе. Это, по-видимому, объясняется тем, что понятие «опти- мальность» неотделимо от понятий «лучше» или «хуже», которые суть бинарные отношения (предпочтения). Один из видов проду- цирования функции выбора из бинарного отношения наиболее важен — это так называемые графодоминантные функции выбора, выбирающие варианты, лучше которых нет. Ответу на вопрос, почему это так, изучению свойств таких функций выбора, по сути, и посвящена эта книга, ибо в практике многокритериальной оптимизации иные функции выбора, как правило, не встречаются. Условия рациональности, налагаемые на функцию выбора, оказывается, влекут возможность ее представления в том или ином виде. Эти условия (именуемые условиями наследования, согласо- вания и отбрасывания) введены в первом параграфе. Там же при- ведены доказательства ряда замечательных импликаций из этих 5
условий. Так, например, из свойства наследования следует, что функции ’выбора есть объединение графодоминантных и Т. (Ц. йатем исследуются свойства графодоминантных функций выбо- ра, обусловливаемые различными свойствами бинарных отноше- ний. Описание этих свойств (транзитивности, ацикличности и т. п.) ведется на языке верхних срезов. Все эти рассмотрения связаны с упоминавшейся выше пробле- мой аппроксимации. На данном уровне общности изучаются лишь два вида аппроксимации: изнутри и снаружи. Оба важны в много- критериальной оптимизации. Аппроксимация функций выбора снаружи применяется, когда мы хотим заменить функцию выбора, описывающую представления человека об оптимальности, на моде- лирующую функцию выбора, не потеряв ни одного варианта, ко- торый он считает оптимальным; аппроксимация изнутри нужна, когда необходимо (как правило, в алгоритмах выбора) выделить хотя бы один вариант, являющийся оптимальным (по аппрокси- мируемой функции выбора). Взаимосвязь свойств аппроксимирую- щей и аппроксимируемой функций выбора весьма тонка. Так, на- пример, невозможно аппроксимировать изнутри графодоминант- ную функцию выбора, порождаемую циклическим бинарным отно- шением, графодоминантной функцией с ациклическим отношением. Исследование проблем, связанных с аппроксимацией нетранзи- тивных бинарных отношений транзитивными приводит к понятиям транзитивного замыкания, мажоранты и миноранты. Завершается глава примерами. Вторая глава посвящена геометрии бинарных отношений. Гео- метрические структуры возникают в многокритериальной оптими- зации совершенно естественно, ибо каждая альтернатива харак- теризуется оценками по критериям или вектором в линейном ве- щественном пространстве. Поэтому мы привлекаем геометрические понятия, методы и интуицию для конкретизации идей, выдвинутых в гл. 1. Как и во всякой геометрической теории, здесь важней- шую роль играют симметрии изучаемых объектов относительно тех или иных замен координат. Равным образом и в многокритериаль- ной оптимизации возникает иерархия классов бинарных отноше- ний в критериальном пространстве, выдерживающих те или иные преобразования. Самое естественное преобразование в многокри- териальной оптимизации — масштабирование. В зависимости от типов разрешенных изменений масштаба, которое выдерживает би- нарное отношение, выделяются классы порядковых, линейных и разностных отношений. В этих классах оказывается возможным связать геометрию верхних срезов со свойствами бинарных отношений. При этом, грубо говоря, ацикличность связана с существованием опорной гиперплоскости в нуле для верхнего среза нуля, транзитивность — с выпуклостью, а мажоранта и миноранта — с красивым гео- метрическим объектом — звездчатой внутренностью тела. Использование понятия инвариантности при заменах позво- 6
ляет дать также аксиоматическое списание упорядочения крите- риев по важности. Оно подробно исследовано в гл. 2. Третья глава им^т дело с конечными классами бинарных от- ношений в критериальном пространстве, но большей части — с кла сом порядковых отношений. Чем больше преобразований должно выдерживать отношение, тзм «меньше свободы» остается у него. Порядковых отношений, инвариантных относительно произвольны^ непрерывных монотонных покоординатных заменА существует лишь конечное число. Важность классов, содержащих конечное число отношений, за- ключается в том, что лишь они, по-существу, пригодны в качестве базы аппроксимации. В главе вводится семейство конечных классов отношений (в которое входит класс порядковых) и дока- зывается, что отношением этого семейства может быть прибли- жено сколь угодно точно любое разностное, причем, если ап- проксимирующие отношения слабее аппроксируемого, эта сходи- мость влечет сходимость выборов соответствующих графодоми- нантных функций выбора (а вообще говоря, это не так). Затем подробно исследуются порядковые отношения. Для это- го предлагается удобный способ их кодификации — язык булев- ских полиномов. Критерии транзитивности и ацикличности, най- денные в гл. 2, подвергаются дальнейшей конкретизации, вплоть до способа по булевому полиному выяснять, удовлетворяет ли по- рядковое отношение этим свойствам. То же проделывается для упорядочения критериев по важности и для выделения мажоранты и миноранты. Изложение иллюстрируется примерами. К третьей главе имеется приложение, в котором с позиций, из- ложенных выше, описываются несколько конкретных методов многокритериальной оптимизации. При этом основной упор де- лается на естественность и проверяемость предположений о структуре предпочтений ЛПР и на геометрическую картину. Четвертая глава посвящена следующему подходу к проблеме. Уже отмечалось, что структура множества предъявлений (т. е. то, какие наборы вариантов бывают предъявлены ЛПР) играет сущест- венную роль в изучении понятия «оптимальность». При этом ес- тественно учитывать, какие наборы бывают предъявлены чаще? какие — реже. Грубо говоря, различие или сходство выборов двух лиц на множествах, которые им предъявляются очень редко (почти не встречаются), маловажно по сравнению с различием или сход- ством их выборов на множествах, которые им попадаются часто. Формализация этого простого соображения и есть предмет этой главы. Вводится мера различия двух функций выбора на фикси- рованном множестве — предъявлении. Если предъявление слу- чайно, то эта мера есть случайная величина, и чем меньше она, тем больше схожи функции выбора. Асимптотическая эквивалент- ность двух функций выбора — стремление этой случайной вели- чины к нулю по мере роста мощности предъявления — централь- ное понятие главы. Переход на такую асимптотически вероят- ностную точку зрения на сходство и различие функций выбора 7
позволяет оправдать наше повышенное внимание к графодоми- нантным функциям выбора и обосновать преимущественное их использование на практике многокритериальной оптимизации. Как следует из общей теории выбора, для того чтобы гарантиро- вать графодоминантность функций выбора, надо предполагать выполнение свойств наследования и согласования. Каждое из них вполне естественно, но конъюнкция двух естественных свойств уже не обязательно есть естественное свойство (самый популярный пример такого гладко вымощенного естественными свойствами пути к противоречию с интуицией — парадокс Эрроу). В этой же главе мы предполагаем выполнение лишь одного свойст- ва рациональности — наследования. Оказывается, некоторые статистические свойства функции выбора вкупе со свойством нас- ледования гарантируют асимптотическую эквивалентность ее гра- фодоминантной функции выбора. Приводится ряд интересных, имеющих самостоятельный инте- рес (хотя и возникающих по ходу доказательств) утверждений о статистических свойствах функций выбора со свойством наследо- вания. Пятая и шестая главы носят довольно специальный, факульта- тивный, характер. В них речь идет о свойствах многокритериаль- ных моделей в двух постановках — вероятностной (гл. 5) и глад- кой (гл. 6). В пятой главе предполагается, что на некотором множестве задано бинарное отношение, и рассматривается совокупность не- доминируемых по нему вариантов среди случайно выброшенных. Число таких вариантов, естественно, тоже случайно и является главным изучаемым объектом гл. 5. Знание этой статистической характеристики важно, с одной стороны, для нужд мотивировочной гл. 4, с другой стороны, оно бывает очень полезно на практике в качестве ориентира — чего же ожидать от применения той или иной модели выбора, и, наконец, эта информация находит приме- нение в теории принятия решений в условиях риска. Основной результат таков: в случае линейного отношения, если область, куда бросаются варианты, ограниченная, то среднее и дисперсия числа недоминируемых вариантов есть CNa, где N — число вариантов, а С, а (конечно же, а<^1) зависят от геометрии области и верхнего среза. Этот ответ верен в случае общего по- ложения. При вырождениях (которые, кстати, ранее в основном и изучались!) возникают асимптотики типа ClnfoN. Показано, что это есть имманент прямых произведений с почти одинаковой степенью роста. Приведены известные факты о распределении числа недоминируемых вариантов и ряд других задач и поставок. В шестой главе мы описываем гладкие задачи многокритери- альной оптимизации. Здесь, пожалуй, впервые в этой книге, по-су- ществу, важна структура исходного множества вариантов — оно предполагается гладким многообразием (грубо говоря, это мно- жество, задаваемое системой уравнений). Функции — критериаль- ные оценки — на нем также предполагаются гладкими. Чтобы по- 8
нять, какую информацию мы извлекаем здесь, обратимся к одно- критериальной постановке. Это классическая область. Здесь из- вестно, что если градиент функции в точке обращается в нуль (эти точки называются экстремальными), то она есть локальный максимум, если гессиан отрицательно определен. В этом послед- нем случае экстремальная точка изолирована. Кроме того, извест- ны довольно сильные оценки на число экстремальных точек раз- ных видов (теория Морса). Так же развиваются события и в гл. 6 (с естественными услож- нениями) — определяются экстремальные и локальные оптималь- ные (по бинарному отношению в критериальном пространстве) точки, выводятся условия локальной экстремальности, исследу- ется, когда их достаточно для выделения всех локально-оптималь- ных точек, описывается локальная и глобальная топологии мно- жества экстремальных точек. Завершает книгу библиографический комментарий — факти- чески краткий обзор литературы по основным рассмотренным воп- росам.
1 Функции выбора и бинарные отношения 1.1. Функции выбора: определения и примеры В основе любого оптимизационного метода лежит первичное по- нятие «оптимальность». Что означает этот термин? Что значат сло- ва «выбрать лучший»? Ответ на эти вопросы не может быть одно- значен, ибо в зависимости от того, какая задача ставится перед нами, в эти слова мы вкладываем различный смысл, который меняется от задачи к задаче: существуют десятки общеизвестных и сотни малоизвестных правил выбора лучших, более или менее похожих друг на друга. Это привело к тому, что появилось большое количество методов многокритериальной оптимизации с собственными трактовками понятия «оптимальность». Мы постараемся рассмотреть понятие оптимальности в макси- мальной его общности. При этом нам прядется принимать во вни- мание следующее соображение. Выбор лучших вариантов из неко- торого множества имеет два аспекта. Первый — очевидный. Он связан непосредственно с человеком — лицом, принимающим ре- шения, а именно с его системой предпочтений, его представления- ми об оптимальности. Менее очевиден второй аспект — человек выбирает варианты из предъявляемого ему множества, но механизм, формирующий это предъявление, часто не подвластен человеку. И этот механизм может оказывать самое существенное влияние на методологию выбора. Чтобы пояснить эту мысль, приведем такой Пример. Вы желаете посмотреть спектакль в театре. Когда же вы обращаетесь в кассу, вам предлагают билет только в амфитеатр — другие места уже распределены. В этих условиях вопрос выбора для вас приобретает триви- альный вид: вам требуется выбрать ровно тот вариант (билет), который будет предъявлен. И даже если ваши представления об оптимальности настолько совершенны, что из любого множества вы сможете выбрать действительно лучший вариант,— в описан- ной ситуации это не будет играть ни малейшей роли. Есть и другая причина, в силу которой учет механизма предъ- явления играет существенную роль. Рассмотрение всех возмож- ных предъявлений и принципов оптимальности на них без уче- та способа формирования этих предъявлений автоматически замы- кает теорию выбора в теоретико-множественные рамки, результа- ты такой теории редко могут быть естественно интерпретированы и использованы на практике. Включение в эту теорию механизма предъявлений позволяет обогатить ее дополнительными струк- 10
турами и, как следствие, получить практически значимые резуль- таты. Итак, переходим к математическому моделированию выбора. Пусть А есть множество всех вариантов. Это множество мы будем называть исходным. Среди всех подмножеств А выделим некото- рый класс — класс допустимых предъявлений. В литерату- ре существует традиция, согласной которой <А совпадает с множе- ством всех подмножеств А (обозначается 24). Но то, что эта тра- диция требует расширения, показывает следующий Пример. Пусть А — R — действительная прямая; прин- цип оптимальности задается условием: х лучше ?/, если х yv и выбору подлежит вариант с максимальным значением. Тогда, если предъявить открытый интервал (0,1), т. е. множество точек {0<^£<^ 1}, то никакой вариант из этого интервала не может считаться оптимальным: ведь для любого х найдется точка (напри- мер, (ж+1)/2), лежащая в интервале и более предпочтительная, чем х. Это дает нам право сделать вывод, что виной всему не не- удачное определение оптимальности (его корректность не вызы- вает сомнений), а неудачная конструкция предъявления. В самом деле, если ограничить множество допустимых предъявлений компактными подмножествами прямой (например, отрезками, точ- ками), то лучший вариант всегда существует и единствен. Та- ким образом, именно сужение класса допустимых предъявлений с произвольных подмножеств прямой до компактных множеств поз- волило разумно определить выбор. Введем следующее определение: функцией выбора на классе допустимых предъявлений Л из исходного множества А называет- ся оператор С из Л в множество всех подмножеств 2А, удовлет- воряющий тождеству С (X) С X, т. е. формально функция выбо- ра — это тройка (А, Л, С : Л —> 2А : X С (X) Q X). Функция выбора отражает представление человека об оптимальности сле- дующим образом: выбор из множества есть подмножество лучших в нем вариантов. Приведем примеры операторов выбора, у которых A CZ Rn. 1. Функция выбора по Парето CPar (X) = {X е х : V(/ е X: X y3i > уД, т. е. точка х выбирается в X в том и только в том случае, когда любая другая точка у из X имеет хотя бы по одной координате значение меньше чем х (рис. 1.1). 2. Функция совокупно-экстремального выбора CC9(X) = {^GX:3fVZ/eX^>^}, т. е. точка выбирается в том и только в том случае, когда она име- ет максимальное значение хотя бы по одной координате (рис. 1.2). У пражнение. Показать, что еслиХ таково, что Хх, у ЕЕ х, Vi = 1,..., п хгф уг, то СРаг (X) Ссэ (X). 3. Cf (X) = {х X : х = arg шах / (я)}, х&х И
Рис. 1.1. Выбор по Парето Рис. 1.2. Совокупно-экстремальный выбор где / : А R — некоторая функция (называемая обычно функцией полезности). Так, если A СЕ Rn, a f (х) — выпуклая функция, то d (Х)С С₽аг (X). Сейчас мы перейдем к рассмотрению общих свойств функций выбора, известных в литературе, как свойства наследования, от- брасывания и согласованности. В терминах этих свойств будут ис- следоваться в последующих главах различные функции выбора. Итак, рассмотрим первое из этих свойств: Свойство Н (наследования). Оно состоит в том, что вариант, выбираемый на некотором множестве, выбирается также и на под- множестве, его содержащем: vx' с х е л с(Х) п х'с с (X'). Легко видеть, что функция выбора Ссэ обладает свойством на- следования, так как если я ЕЕ X доставляет максимум некоторой координате на предъявлении X, то х доставит ей максимум и на любом предъявлении X' С X. Упражнение. Показать, что СРаг обладает свойством Н. Упражнение. Показать, что если и С2 обладают свой- ством Н, то этому свойству удовлетворяют также функции IJ С2 и Ci f) С2. Свойство О (отбрасывания). Оно определяется как неизменяе- мость выбора при удалении из предъявления невыбираемых вари- антов: VX' с X е Л С (X) С ХМ С (X') G С (X). Упражнение. Показать, что объединение двух функций выбора, обладающих свойством О, также обладает этим свойством. Показать, что это неверно для пересечения (привести пример). Упражнение. Показать, что СРаг и Ссэ обладают свойст- вом О. У пражнение. Показать, что функция выбора, удовлет- воряющая условию С(С(Х) |J C(Y)) = С (X (J У) (Плотт, 1967), обладает свойствами Н и О и обратно. 12
Бывает полезно сравнивать между собой функции, определен- ные на разных множествах. Определение. Пусть Л1 С 2А», Л2 CZ 2As С2: Л2-> 2А% /:Ai->A2, /Mi)cz^2- Тогда оператор Сх =^= /*С2, такой, что VX GE С\ (А ) =/-1оС2о/(X) Р| X, называется оператором выбора, индуцированным С2 по /. Упражнение. Если функция непустого (т. е. VX ЕЕ Л С (X) ф) выбора на конечном множестве удовлетворяет условиям Н и О, то существует совокупно-экстремальная функция, индуци- рующая С. Доказательство приводится в [1]. Свойство С (согласованности). Оно состоит в том, что пересече- ние выборов из двух различных множеств лежит в выборе из их объединения, т. е. если вариант выбирается в каждом из двух множеств, то он выбирается и в их объединении: VX, Y : X, Y, X U Y е Л С (X) Q С (У) С С (X U Y). Упражнение. Показать, что СРаг обладает свойством С. Привести пример функции Ссэ, не обладающей свойством С. Упражнение. Показать, что если С\ и С2 обладают свой- ством С, то это верно и для Q С2. Показать, что это неверно для объединения С\ J С2. Итак, мы рассмотрели три свойства функций выбора, имею- щие ясный содержательный смысл. Покажем теперь, какое отношение эти свойства имеют к разра- ботке методов многокритериальной оптимизации. В начале этой главы мы заметили, что существует множество методов оптимизации, вкладывающих в понятие «оптимальность» различный смысл. Тем не менее подавляющее большинство пра- вил выбора лучших имеет одну общую деталь: выбор осуществля- ется на основании информации о попарных сравнениях объектов. Итак, для изучения закономерностей выбора лучших вариантов при оценке их по нескольким критериям предварительно разбе- ремся в особенностях попарного сравнения. Таким образом, мы приходим к понятию бинарного отношения. Пусть А — исходное множество. Подмножество декартова квадрата А х А (т. е. множества (х, у), где х, у ЕЕ А) называется бинарным отношением. Вместо записи (х, у) ЕЕ Я будем исполь- зовать более краткую: хЯу. Часто будет удобно для каждого варианта х задавать мно- жество {у'.хЯу}, называемое верхним срезом точки х и обозначае- мое Ях. В терминах верхних срезов бинарное отношение можно опре- делить отображением А -> 2а : х а именно хЯу Еу Е Понятно, что оба эти способа задания бинарного отношения эквивалентны. 13
Поскольку наша цель — исследование закономерностей выбора из вариантов, оцениваемых по нескольким критериям, то особый интерес представляет и соответствующий класс бинарных отно- шений. Для отношений этого класса исходное множество вариан- тов А есть подмножество пространства Rn с фиксированными коор- динатными функциями — критериями. Этот класс является основ- ным в теории многокритериальной оптимизации, так как человек осуществляет свой выбор, опираясь на информацию о том, на- сколько интересующие его объекты удовлетворяют тем или иным целям (критериям), причем часто степень удовлетворения может быть выражена численно. В этом контексте пространство RH называется пространством критериев (оси координат — шкала, г-я координата — оценка по критерию Г). Так, выбор по Парето и совокупно-экстремальный выбор — это функции выбора в пространстве критериев. Суще- ствует несколько способов выбора лучших объектов на основании информации о попарных сравнениях. Наиболее распространен Способ 1. Он основан на том, что объект не может считаться лучшим (опти- мальным) среди множества объектов, если при сравнении с ка- ким-нибудь другим объектом этого множества он окажется худ- шим. Функция выбора по такому правилу называется графодоми- нантной, строгое ее определение имеет вид (Х)л= Мах^ X == {.г ЕЕ X : Vy ЕЕ X хЛу}, где черта над Л означает отрицание х. Выше мы упоминали, что функция выбора по Парето СРаг обла- дает одновременно тремя свойствами — Н, О и С. Легко заметить, что СРаг — графодоминантная функция, в которой Л есть отноше- ние Парето, определяемое следующим образом #Рагпу о Vi = 1,..., п Xi уt А х у. Возникает вопрос: при всяком ли Л графодоминантная функ- ция обладает этими свойствами? Упражнение. Показать, что С* обладает свойствами Н и С. У прежней не. Привести пример, когда свойство О для функции С& не выполнено. Какое условие следует наложить на Л, чтобы свойство О было выполнено? Ясно, что способ 1, хотя и распространенный, но далеко не единственный, использующий бинарное отношение для определе- ния множества лучших вариантов. 1 Название «графодоминантная» выбрано по следующей причине. Дело в том, что теория выбора изначально оперировала с конечными множествами ва- риантов, а бинарное отношение на конечном множестве естественно задает- ся ориентированным графом, вершины которого соответствуют вариантам исходного множества, а дуга из вершины у в вершину х приводится тогда и только тогда, когда хЛу. 14
Способ 2. Можно усилить требования к оптимуму и счи- тать оптимальными варианты, которые не только являются недо- минируемыми, но и доминируют любой другой вариант исходного множества: Мах^Х = {хЕ^Х : Ху ^ХуЛх}. Упражнение. Показатель, что Мах^ = Мах^=1, где Л~1^{(х,у)^А х A'.yRx}. Нетрудно видеть, что дополнительное требование сильно ог- раничивает возможности применения этого способа определения оптимума. Покажем это на примере отношения Парето. Вариант оптимален по Парето, если любой другой вариант хуже хотя бы по одному критерию. Легко видеть, что выбор по Парето ни- когда не пуст. Если же выбор осуществляется вторым способом, то вариант оптимален только тогда, когда он имеет наивысшие оценки по каждому из критериев. Ясно, что существование такого- варианта весьма нетипично. Способ 3. Пусть множество X конечно. Пусть для х, у ЕЕ А t (х, у) = 1, — 1, О если уЛх и хЛу\ если хЛу и уЛх\ в противном случае. Т(х) = 3 i(^i/).TorSaCT(X) = {xeX:Vz/eX71(^)>71(y)}. ?/ех Поскольку именно такой способ определения чемпионов (с точностью до численных значений t (х, у)) принят на многих тур- нирах, функция Ст получила название турнирной. Упражнение. Показать, что Ст, вообще говоря, не обла- дает свойствами Н, О, С. Какова максимальная мощность множе- ства А, при которой эти свойства еще имеют место? Мы видим, что турнирный выбор, в отличие от других спосо- бов определения лучших, не удовлетворяет никаким ранее описан- ным свойствам рациональности: наследования, отбрасывания, сог- ласованности. Тем не менее турнирный выбор получил очень ши- рокое применение в спортивных состязаниях. Это, очевидно, свя- зано со следующими причинами. Во-первых, выигрыша х у у во многих видах спорта, где состязается большое число участни- ков, далеко недостаточно для того, чтобы считать х лучше, чем у. Во-вторых (и это, наверное, главная причина), турнирный выбор выделяет в большинстве случаев единственного победителя (ре- же — двух и больше), причем этот выбор достаточно устойчив к незначительным изменениям в расстановке сил (т. е. бинарного отношения). С другой стороны, графодоминантный выбор в ана- логичной ситуации почти всегда был бы пуст, что в данном случае делает его неприемлемым. Итак, мы привели несколько способов получения оптимально- го подмножества, и в основе каждого способа лежит попарное срав- 15
нение вариантов. Основным из них является первый — выделение ва- риантов, недоминируемых по неко- торому бинарному отношению (графодоминантная функция вы- бора). Важность графодоминант- ного способа обусловливается сле- дующими утверждениями. Утверждение 1.1. Пусть С удовлетворяет свойству Н. Тогда С = (J Ci — объединение некото- рого семейства графодоминантных функций выбора. Рис. 1.3. «Букет» верхних срезов Доказательство. Для каждой точки х А рассмот- рим совокупность подмножеств таких, что для всякого X Й7Ж X <4их С(Х). Это множество упорядочено по вклю- чению. Пусть Hfrx— семейство максимальных по включению подмножеств из ЗСХ. Положим 9С = (J ЗСХ и определим семейство X бинарных отношений следующим образом: х Л\У, если Уе^; А, если У В точке х задан «букет» верхних срезов J?x (рис. 1.3). Покажем, что С = (J Мах^у. В самом деле, пусть иже Тогда X е Й7Ж» и найдется У ЕЕ X CZ У, а значит, = Л\У, X П = х П (Л\У) = т. е. X е Мах^уХ. Обратно, пусть найдется У ЕЕ Хх такое, что X Q «Яж = ф, тогда либо У ЕЕ SCX, тогда = А \ Y, а значит, X У и ж Е ЕЕ С(Х) (по условию Н); либо У 9СХ, тогда = А в про- тиворечии с X Г| — ф- Доказательство окончено. Таким образом, всякая функция выбора со свойством Н есть объединение графодоминантных функций выбора. Отметим также, что графодоминантная функция выбора обладает свойством О тогда и только тогда, когда определяющее бинарное отношение транзитивно. Отсюда функция выбора со свойством Н обладает и свойством О, если существует ее разложение в объединение гра- фодоминантных функций выбора, определяемых транзитивными бинарными отношениями. Утверждение 1.2. Пусть функция выбора С удовлетворяет условиям Н и С. Тогда С графодоминантная. 16
Для доказательства нам надо лишь проверить, что в каждой точке х Хх состоит из одного подмножества. Пусть |Й7Ж|^>1. Выберем два подмножества X, F Е ~х. По определению, х ЕЕ е С(Х), х G С(У). Если X е С(Х и У), то существует Z е Жхч содержащее X и У, что противоречит их максимальности, откуда х С(Х U У), что и требуется. Итак, условие С гарантирует, что в каждой точке «букет» со- стоит из одного множества. Упражнение. Показать, что пересечение двух графо- доминантных функций выбора С^1 и С^г также; есть графодоми- нантная функция Упражнение. Показать, что объединение двух графодо- минантных функций выбора может не быть графодоминантным. Бинарные отношения могут быть вложены одно в другое, как подмножества декартова квадрата: X Л. О большем из них будем говорить как о более сильном, о меньшем — как о более слабом: если J#1 CZ Я. то Л о большем числе пар (я, у) S Е Л X Л утверждает, что хЯу. В терминах верхних срезов Я сильнее J?1, если и только если для всякого х Ях ЕЭ Ях. Выполняется важное соотношение между оптимумами из фик- сированного множества по двум вложенным бинарным отноше- ниям — оптимум по более слабому лежит в оптимуме по более сильному: Я С Я' => Мах^ е Мах^г. Действительно, уж если некоторый вариант не доминируется никаким другим по более сильному бинарному отношению, то он заведомо не доминируется никаким другим вариантом по более слабому отношению. Это наблюдение лежит в основе практически всех методов мно- гокритериальной оптимизации и принятия решений. Общая схема рассуждений (в большинстве работ она не указывается явно, но авторы, безусловно, ей следуют) такова: лицо, принимающее ре- шение (ЛПР), сталкивается с необходимостью проанализировать необозримо большое число вариантов, оцениваемых по нескольким критериям, и выбрать наилучшие (наилучший); предполагается, что представления об оптимальности ЛПР описываются некото- рым бинарным отношением на множестве вариантов. Однако вы- явить это бинарное отношение мы не в состоянии. Тем не менее, исходя из более или менее правдоподобных соображений, мы мо- жем построить бинарное отношение, более слабое, чем предпоч- тения ЛПР, т. е. указать пары, в которых заведомо (с его точки зрения) один вариант лучше другого (пример: если один вариант превосходит другой по всем критериям, то он заведомо его лучше, иными словами, отношение Парето слабее предпочтений ЛПР). По полученному бинарному отношению из исходного множества можно выделить оптимум. Он будет содержать все варианты, оп- тимальные с точки зрения ЛПР, а количество вариантов в нем 17
(мощность) будет тем меньше, чем сильнее аппроксимирующее отношение. В идеале получившееся множество будет достаточно мало (обозримо), чтобы ЛПР могло уже самостоятельно выбрать в нем наилучшие, с его точки зрения, варианты. Если же это не так, то можно пытаться сконструировать новое бинарное отноше- ние, по-прежнему более слабое, чем предпочтение ЛПР, но более сильное, чем предыдущее, для дальнейшего сужения множества рассматриваемых вариантов. Для проверки корректности такого подхода предлагаем читателю выполнить Упражнение. Пусть J?1 слабее, чем J?. Верно ли, что Мах^ Мах-#' — Мах^? Однако иногда встречается и другая задача: научиться выде- лять хоть какие-то варианты из оптимума. Здесь опять исполь- зуется указанное выше соотношение, но аппроксимирующее отно- шение выбирается уже более сильным. Это гарантирует, что опти- мум по нему лежит среди оптимальных, с точки зрения ЛПР, ва- риантов. Первый подход (использующий более слабые отношения) на- зывается аппроксимацией изнутри, второй — снаружи. Наиболее типичное отношение, используемое при аппроксимации снаружи, есть отношение, задаваемое функцией. Пусть ft A. —> R — функция на множестве вариантов. По ней можно построить отношение на A:x^fy <=> f(x) f(y). Если J/? — отношение на А и сильнее J?, то / называется изотонной функцией. Иначе говоря, f изотонна, если из х^у следует, что /(ж) < f(y)- Нахождение максимума функции — задача, хорошо исследо- ванная в самых разных предположениях. Поэтому при поиске элементов из оптимума использование в качестве отношений, ап- проксимирующих снаружи, отношений, задаваемых функциями, весьма эффективно. Итак, решение прикладных многокритериальных задач вклю- чает два этапа: поиск аппроксимирующего отношения и нахожде- ние оптимума по нему 2. При этом на втором этапе алгоритмы поиска сами могут (явно или неявно) использовать аппрокси- мацию другими отношениями. Успех в построении таких отноше- ний зависит от двух обстоятельств: от свойств аппроксимируемого отношения и от желаемых свойств аппроксимирующего. Изучению этих свойств и посвящен следующий раздел. 2 Отметим, что не случайно мы рассматриваем лишь два вида приближений — снаружи и изнутри. Дело в том, что на практике очень трудно сказать что бы то ни было о близости тех или иных отношений, и реально невозможно из этого факта сделать вывод о близости оптимумов по ним: исследование не- прерывности (в каком бы то ни было смысле) операции Мах^Х по обоим своим аргументам находится в зачаточном состоянии. 18
1.2. Свойства бинарных отношений Основные свойства бинарных отношений в критериальном прост- ранстве определяются независимо от их геометрической струк- туры, в теоретико-множественной категории. Поэтому пока что будем говорить о бинарных отношениях на некотором множест- ве А. Напомним формулировки основных интересующих нас свойств бинарных отношений. Транзитивность. Бинарное отношение Л называется транзи- тивным, если из хЛу и уЛя следует, что хЛя. Это свойство экви- валентно может быть определено иначе. В терминах верхних срезов: Л транзитивно <=> из у е= Лх следует, что Лу С Лх. Чтобы дать еще одну формулировку, введем полезную конструк- цию соединения бинарных отношений: пусть Лг, Л2 — бинарные отношения на множестве А. Их соединением Л± * Л2 называется бинарное отношение на Л, состоящее из таких пар (х, у) е= А X А, для которых существует z, такое что хЛ-^, яЛ2у. Лу*Л2 = {(х, у) ЕЕ А X А : Hz ЕЕ А : хЛ^г, гЛ2у}. Бинарное отношение можно интерпретировать как матрицу с элементами, равными 0 или 1. Тогда, если рассматривать опе- рации логического умножения и объединения как структуру буле- вой алгебры, то операция соединения есть не что иное как матрич- ное умножение. Вообще, если рассмотреть диойдную алгебру (например, взятие максимума и минимума), то можно рассмотреть соединение матриц, интерпретируемых как нечеткие бинарные от- ношения с коэффициентами в указанной диойдной алгебре, и опре- делить для них свойства транзитивности, ацикличности и т. п. Было бы весьма интересно с практической точки зрения исследо- вать возникающие здесь структуры. Оставляем читателю в качестве упражнения проверить, что транзитивность Л эквивалентна соотношению Л * Л С Л. Ацикличность. Циклом длины к по бинарному отношению Л называется цепочка х-^..., х^ £= Л, таких, что хгЛх2Л...ЛхК = х±. Переформулировка этого условия в терминах верхних срезов ничего нового не дает. Минимальное число /с, при котором сущест- вует такая цепочка, называется минимальной длиной цикла би- нарного отношения. Если ни для какого к не существует цикла длины к, то бинар- ное отношение называется ацикличным. Минимальная длина цикла ациклического бинарного отношения принимается равной бесконечности. Чтобы дать определение существования циклов и ацикличности на языке соединений матриц, напомним еще ряд вспомогательных свойств. Рефлексивность, антирефлексивность, симметричность, анти- симметричность. Бинарное отношение рефлексивно, если для вся- кого х ЕЕ А хЛх, Если же ни для одного х это не выполняется, то отношение называется антирефлексивным. Если для любых 19
х, у S А верно, что хЛу => уЛх, то бинарное отношение называ- ется симметричным. Если же это не выполняется ни для какой па- у\ то отношение называется антисимметричным. В тер- минах верхних срезов: рефлексивность — для любого х х ЕЕ Лх\ антирефлексивность — для любого х х Лх\ симметричность — х ЕЕ Лу =^> у ЕЕ Лх, антисимметричность — х ЕЕ Лу \ у ЕЕ Лх х у. Среди всех бинарных отношений на А есть три выделенных: пустое отношение Л& (никакие два элемента не сравнимы), пол- ное Л\ (всякий элемент находится в отношении со всяким) и диа- гональ Л (х находится в отношении с самим собой и более ни с каким элементом). Свойство рефлексивности Л можно выра- зить также, сказав, что Л сильнее Лм антирефлексивности — «Я? П Л^ — Л&. Возвращаясь к циклам, нетрудно видеть, что существование цикла длины к равносильно непустоте пересечения /с-кратного соединения Л самого с собой и диагонали: Л к П Л^ =7^ где Л*к = Л*...*Л. По каждому бинарному отношению можно построить объеди- нение всех его /r-кратных соединений самого с собой (к-х степеней). оо Это снова бинарное отношение J?*°° = [J Л*к- Очевидно, что Л k=i ациклично тогда и только тогда, когда J?*°° антирефлексивно. От- ношение Л*°° носит специальное название —- транзитивное замыка- ние Л. Роль операции транзитивного замыкания весьма велика. Если Л транзитивно, то его транзитивное замыкание совпадает с ним самим (действительно, Л Л * Л по определению транзитив- ности, откуда все Л** С Л\ Кроме того, очевидно, что Л*^ силь- нее Л (аппроксимирует его снаружи). Различие между и Л может служить мерой нетранзитивности Л. Итак, ацикличность отношения равносильна антирефлексивности его транзитивного замыкания, а для транзитивного отношения — антирефлексив- ности. Транзитивное замыкание можно определить еще как наисла- бейшее транзитивное отношение, более сильное, чем исходное. Доказательство правильности этого определения опирается на следующее полезное свойство операции транзитивного замыкания: она сохраняет вложимость отношений —? из Лх S Лг следует, что Л*\° С Действительно, непосредственно проверяется, что Лх CZ Лг ==> Лг * Лх С Л^ * откуда вытекает искомое. Покажем теперь, что Л*™ есть самое слабое из всех транзи- тивных отношений, более сильных чем Л. Мы уже знаем, что J?*°° сильнее Л. Пусть Л' транзитивно и сильнее Л. Тогда получаем Л С2 Л^ => Ж°° С Л*™ — Л\ что и требовалось. Еще одно элементарное, но полезное свойство. 20
Упражнение. Покажите, что если Ях и транзитивны, то их пересечение тоже транзитивно. Взятие транзитивного замыкания позволяет по бинарному отно- шению канонически строить транзитивное отношение, аппроксими- рующее исходное снаружи. Можно ли построить канонически вы- деленное транзитивное отношение, аппроксимирующее исходное изнутри? Оказывается можно, и не одним способом. Пусть Я — бинарное отношение, полагаемое всюду далее реф- лексивным. Назовем мажорантой 3 Я (обозначение — J#Dur) би- нарное отношение, состоящее из тех пар (х, у), для которых выпол- няются следующие условия (рис. 1.4, а): (D1) хЯу, (D2) Vt уЯ1 => хЯ1. Транзитивность J/£Dur проверяется просто: пусть ^J?Dur у, уЯЭигь9 Если z/J?Dur z, то yЯz^ и, следовательно, xЯz, что доказывает (D1). Кроме того, из zЯt следует уЯ1 и хЯ1, откуда (02), т. е. #J?Dur z что и требовалось. Отношение J#Dur можно задать и в терминах верхних срезов. Верхний срез J?Dur в точке х есть пересечение всех верхних срезов Я, содержащих х: Ях^г = П (рис. 1.4, б). Упражнение. Покажите равносильность двух определе- ний. По аналогии с мажорантой можно построить миноранту тогда и только тогда, когда выполняются требования (рис. 1.5): у (м1) хЯу (м2) Vz zЯx => zЯy В терминах верхних срезов миноранту определить уже нельзя, поэтому надо ввести понятие нижних срезов. Упражнение. Введите это понятие и дайте определение миноранты на языке нижних срезов. Понятно, что по аналогии можно ввести еще много классов, канонически связанных с Я транзитивных бинарных отношению аппроксимирующих Я изнутри, напр. Я1 (рис. 1.6): t (хЯу, %^&^[гЯх, уЯР==>гЯ1х гЯуя хЯ1. Такое разнообразие транзитивных отношений, аппроксимиру- ющих исходное изнутри, по сравнению с аппроксимаций Я сна- ружи связано со следующим обстоятельством: среди всех транзи- тивных бинарных отношений на данном множестве А можно выде- лить два класса: содержащих исходное (аппроксимирующих его 3 Название 4. мажоранта» не совсем удачно, но исторически возникло впервые в теории игр. 21
Рис. 1.6. Отношение Л1, Рис. 1.5. Миноранта снаружи) и лежащих в нем (изнутри). В первом классе есть наи- слабейший элемент — транзитивное замыкание Это обуслов- ливается тем, что пересечение двух элементов первого класса снова есть элемент первого класса (проверьте!). Во втором классе единого наисильнейшего элемента нет: объединение двух тран- зитивных отношений не обязательно транзитивно, а транзи- тивное замыкание его может вывести нас из класса. Тем не ме- нее во втором классе можно рассмотреть совокупность тех отно- шений, для которых не существует более сильных и лежащих в том же классе отношений, и рассмотреть пересечение всех отно- шений данной совокупности. Получившееся отношение будет, ес- тественно, лежать во втором классе, т. е. транзитивным и аппрок- симирующим исходное отношение изнутри. Роль его в том, что всякая разумная аппроксимация транзитивным отношением из- нутри должна содержать его, в противном случае можно взять объединение аппроксимирующего отношения и описанного и тран- зитивное замыкание объединения. Упражнение. Проверьте, что полученное таким обра- зом отношение будет лежать во втором классе. Обозначим построенное отношение (пересечение всех неусили- ваемых отношений второго класса) через Л^. Оказывается, что верно Утверждение 1.3. Л^ ~ Л1. Действительно, пусть пара (я, у) (=£ Л^. Это значит, что су- ществует некоторое транзитивное отношение Л' CZ Л, такое, что Л' 22
нельзя усилить, не выходя из второго класса, причем (я, у) ЕЕ «5?, {х, у) Л'. Но если Л’ нельзя расширить за счет добавления пары (я, у), то, значит, существуют цепочки xltffl'x2. . .х^Л'х = = х, у = х^Л' ...Л' хь такие, что (x-^Xi) Л'. (В противном случае можно было бы взять объединение J?'|J (я, у) и транзитивно замкнуть, что снова привело бы к отношению второго класса.) Так как Л' транзитивно, то существование таких цепочек означает существование т,Л' х и уЛЧ, таких, что (z, t) Ж, что, в свою оче- редь, равносильно (х, у) Я1 и доказывает, что Л1 CZ С другой стороны, (сГ, у) Л1, т. е. существуют z, t: гЛх, уЛ1, но (z, t) Л. Рассмотрим совокупность отношений второго класса, содержащих обе пары (z, х) и (г/, t). Эта совокупность, оче- видно, непуста, и в ней можно выделить неусиливаемое отно- шение С Л. Очевидно, что это отношение неусиливаемо и во всем втором классе. С другой стороны, Л" не может содержать пары (х, у), так как это влекло бы (по транзитивности Л") при- надлежность (х, у) к Л1. Значит, Л^ Q Л*, а следовательно, и Л^ = Л*. Утверждение доказано. Связь между J?Dur, и Л1 не такая сильная Утверждение 1.4. J?Dur р| j^Mo11 СЕ Л1. Доказательство. Если, например, х, у J?Dur, то существует z, такое, что уЛъ, но (х, у) (=£ Л. Рассматривая сово- купность отношений второго класса, содержащих (^, г/), и рассуж- дая по аналогии с предыдущим доказательством, получаем, что (х, у) се X Случай (х, у) ЕЕ J?Mo11 таков же. Упражнение. Приведите пример Л. для которого включе- ние из предыдущего утверждения строгое. Укажем одно свойство, полезное для проверки ацикличности. Пусть ЛА cz Л2 и Л2 ациклично. Тогда и Лх ациклично. С другой стороны, если Лх имеет цикл длины fc, той имеет цикл длины к. Чем же интересны перечисленные выше свойства с точки зре- ния приложений? Они играют роль на обоих этапах решения мно- гокритериальных задач — и при аппроксимации, и при построе- нии оптимума. На этапе построения оптимума, когда мы имеем дело с конст- руктивно строящимся аппроксимирующим бинарным отношением, свойства транзитивности и ацикличности важны, поскольку они обусловливают корректность работы большинства алгоритмов по- иска оптимума. Так, например, важнейшее место в идеологии алго- ритмов выбора занимает следующая очевидная идея: если предло- жить простой способ отыскания одной недоминируемой точки, то можно использовать следующую процедуру: найти недоминиру- емую точку, исключить ее из предъявления вместе со всеми точ- ками, которые она доминирует; на оставшемся множестве найти новую недоминируемую точку и т. д., пока есть что выбрасывать. Такая процедура, вообще говоря, существенно ускоряет про- цесс по сравнению с тривиальной процедурой попарного сравне- ния, так как позволяет не сравнивать между собой доминируемые точки. 23
Рис. 1.7. Выбор по нетранзитивному отношению а — «^-ациклично; б — выделяем х, отбра- сываем у\ в — выделяем z Понятно, что для обоснования такой процедуры достаточно транзитивности и ацикличности бинарного отношения. Без этого условия не обойтись. На рис. 1.7 приведен пример, когда описан- ная процедура дает неверный ответ из-за нетранзитивности отноше- ния (доминируемая точка оказалась включенной в оптимум). Однако, выбор по Парето может быть произведен с помощью этой процедуры, так как отношение Парето транзитивно. Наверное, самый легкий способ найти недоминируемую точ- ку — это построить достаточно простую изотопную функцию / и взять ее максимум. Во многих случаях в качестве / можно брать линейную функцию или даже одну из координат (т. е. проекцию на некоторую шкалу). На этапе аппроксимации информация о свойствах отношения, описывающего структуру предпочтений ЛПР, весьма существенна с точки зрения желаемых свойств аппроксимирующего отношения. Действительно, если, к примеру, известно, что аппроксимируе- мое отношение транзитивно, то отношение, аппроксимирующее изнутри, также можно выбирать транзитивным (транзитивное за- мыкание снова будет аппроксимацией изнутри). Если же исходное отношение циклично, то аппроксимация снаружи ацикличным от- ношением (в частности, изотонной функцией) невозможна. Свойства транзитивности и ацикличности имеют вполне ощу- тимую реальную интерпретацию: в применении к структуре пред- почтений ЛПР они естественно связываются с непротиворечиво- стью его взглядов. Вряд ли кто-нибудь станет возражать, что от- ношение «лучше, чем» должно быть транзитивным и ацикличным, хотя на практике это выполняется далеко не всегда. По-видимому, разумный подход к анализу противоречивости ЛПР представляет теория размытых множеств, но эта тематика выходит за рамки на- шей книги. Сделаем еще одно замечание о структуре предпочтений ЛПР: во многих работах делается предположение о том, что она задается гладкой функцией полезности, которая, впрочем, явно не задана. Разработано много способов восстановления таких функций, по- иска максимума по ней и т. п. Как правило, делается предположе- ние, что эта функция зависит лишь от критериальных оценок и монотонна по ним, что и служит основанием для отнесения этих работ к области многокритериальной оптимизации. Нам такое по- ложение дел представляется весьма сомнительным — задача явно 24
однокритериальная, коль скоро существует единая функция по- лезности, в то время как многокритериальная постановка сущест- венно опирается на принципиально возможную несравнимость пар объектов. Задачи же с функцией полезности, хотя бы и не за- данной явно, следует, видимо, относить к математическому прог- раммированию. Приведем теперь несколько примеров бинарных отношений в критериальном пространстве и рассмотрим их свойства. 1) Отношение Парето было определено в 1.1 (см. рис. 1.1). Представляем читателю проверить, что оно транзитивно, ациклич- но, антирефлексивно, антисимметрично. 2) Лексикографическое отношение. Его определение: VJ7, у е Rn х£п у <4 Я/: < уг Д V/ < i х{ = у{. df Ясно, почему отношение имеет такое название: превосходство у над х определяется по превосходству по первому из лексикогра- фически упорядоченных критериев (именно по такому правилу располагаются слова в словарях: сначала они упорядочиваются по первой букве, если первые буквы совпадают,— по второй и т. д.). Лексикографическое отношение также транзитивно и ациклич- но. 3) Мажоритарное отношение. Обозначим для х, у Rnrxy — количество индексов г, для которых xt yt. Тогда хЛпу 44 гху>гух- df Здесь предпочтение отдается тому из двух вариантов, который имеет превосходство по большему числу шкал. Мажоритарное отношение широко применяется в системах го- лосования. Упражнение. Показать, что мажоритарное отношение нетранзитивно. Показать, что оно циклично. Какова минималь- ная длина цикла отношения Лп? В заключение раздела опишем полезный способ конструиро- вания отношений. Пусть А19 А2 — множества (Rni и Rn% к при- меру) и — бинарные отношения на А2 соответственно. Тогда можно определить прямое произведение X J?2 бинар- ных отношений на прямом произведении Ar X А2 (Rni X Rn* — = Rm+n2): (rrn x2) (J?x X J?2) (yv y2), если и только если х-^^, Упражнение. X J/?2 транзитивно тогда и только тог- да, когда транзитивны сомножители, и ациклично, если один из сомножителей ацикличен. Доказать. Приведите пример ациклич- ного произведения цикличных сомножителей. Пример. Отношение Парето можно представить через пря- мое произведение отношений нестрогого порядка: пусть — бинарное отношение нестрогого порядка на прямой, тогда Parn = < X . . . X < \Д. 25
Геометрия бинарных отношении в критериальном пространстве 2.1. Геометрические аспекты инвариантности Этот раздел весьма важен для всей идеологии книги. Принцип инвариантности играет ключевую роль в большинстве алгорит- мов аппроксимации отношений. Суть его чрезвычайно проста: если информация, полученная об отношении, инварианта относи- тельно каких-либо преобразований исходного множества — евк- лидова пространства с выделенными осями — Rn, то аппроксими- рующее отношение следует искать в классе отношений, не меняю- щихся (инвариантных) под действием этого преобразования. Рассмотрим несколько основных примеров. Вообще говоря, от- ношение на Rn задается произвольным подмножеством декартова квадрата Rn X Rn. Точки х (ЕЕ Rn можно сдвигать на произволь- ный вектор z : х х + z. Обозначим это преобразование через Sz. Можно определить класс отношений, инвариантных относи- тельно всех Sz (z (Е Rn). (Отметим, что при z О Sz не сохраняет выделенные оси.) Такие отношения называются разностными (обо- значение: 5? ЕЕ 531). Иными словами, — отношение в шкалах разностей, если отношение пары вариантов х и у зависит лишь от разностей оценок вариантов по каждой шкале. Точнее, 3^1 {Л : хЛу о (х + z) Л (у + z)}, (Bl) где — класс всех отношений в Rn. Кроме сдвигов Sz, на Rn действуют еще и растяжения с по- ложительными коэффициентами к : х —> кх. Обозначим такие пре- образования через Класс отношений в Rn, инвариантных относительно всех Sz и обозначается через 5?2. Отношения это- го класса называются линейными. Иначе говоря, Л — линейное, если отношение пары х и у зависит лишь от направления вектора у — х, т. е. от отношения разностей одноименных координат по каждой паре шкал. Точнее, = {Л ^3^:хЛу^хЛ (х + Му — ^))}- (В2) И сдвиги Sz и дилатации не меняют упорядочения чисел на осях координат, т. е. если i -я координата (оценка по Z-му крите- рию) вектора х превосходит i-ю координату вектора у, то тот же порядок сохраняется и для векторов Szx, Szy и D^x, D^y. Можно для любого набора F = Д, ..., fn монотонных функций (т. е. таких, что х у влечет Д (х) fL (у)) рассмотреть преобразование PF: (х . . . хп) i-> (Д^) ...fn (хп)). Отношения, инвариантные относи- 26
тельно таких преобразований, называются порядковыми (класс ЗЗз). Отметим, что преобразования Sz и суть преобразования типа Рр для f (х) = х + z и f (х) = кх, 1 О, соответственно. Поскольку классы получались последовательным уси- лением условий (инвариантностью относительно большего числа преобразований), то очевидны включения 2 Й 3 ®з- При п 1 эти включения строгие. Формальное определение класса Л — отношение в поряд- ковых шкалах (порядковое отношение), если отношение пары Рис. 2.1. Верхние срезы отношений в Rn х и у зависит лишь от порядка их оценок по каждой шкале: е £02 : хЛу 44 (PFx) л (PFy)}. (ВЗ) Видно, что определения в терминах инвариантности относи- тельно тех или иных преобразований неконструктивны, а формаль- ные определения громоздки. Однако можно сильно упростить их, используя язык верхних срезов. Имений Л °J3i ^Лх — х = Лу — у (напомним, что А + В (А - В), где А, В CR" есть множество векторов а b (а — Ъ), а ЕЕ А, Ъ ее В (сумма Минковского)) (рис. 2.1, а). Из этого определения следует, что Лх — Ло х. Множество S (R) = Ло назовем верхним срезом разностного отношения. Л ЕЕ ЗЗ'ъ 44 5 (Л) — геометрический конус, т. е. S (Л) вместе с каждой то чкой х Ф 0 содержит проходящий через х луч (рис. 2.1, б) Л 6= ®з 44 S (J^) состоит из ортантов, т. е. множеств, задавае- мых уравнениями или неравенствами вида хг * 0, где * ЕЕ {(, = , >} (рис. 2.1, в). Упражнение. Проверьте эквивалентность определений классов отношений в терминах верхних срезов и формальных оп- ределений (В1) — (ВЗ). Упражнение. Распространите эти определения на фун- кции выбора. Покажем теперь эквивалентность определений классов £01 — £0з в терминах геометрии верхних срезов и в терминах инвариантности. Класс £01 : (^, у) Л =4 у е Лх = Л{} + х = 5 {Л) + х =4 У — х ЕЕ S (Л). 27
Но у — х е S (J?) => (у 4- z) —- (х + z) е 5(J^). Значи i г Л ЕЕ <%Г влечет инвариантность Я относительно сдвигов. С другой стороны, если Л инвариантно и (х, у) ЕЕ Л. у — х — у' ~ х , тогда у' — х' ЕЕ 8 (Л). Значит, из (х, у) €z Л к у ~ х = у' — хг следует, что (х , у') ЕЕ Л, что и требовалось. Класс • если Л инвариантно относительно сдвигов и растя- жений, то Л лежит в . Далее ОЛх^ кОЛкх ==> кОЛх, т. е. Ло = ~ 8(Л) есть геометрический конус^ Наоборот, если 8(Л) — гео- метрический конус, то хЛу => ОЛ (у — х) OR (ку — кх) => кхЛку, т. е. Л инвариантно относительно гомотетий. Класс ЗЭз- пусть G — совокупность всех преобразований вида Рр. Так как сдвиги и дилатации с положительными коэф- фициентами суть элементы G, то всякое отношение, инвариант- ное относительно G, лежит в ЗЗ^- Далее, пусть Go — множество всех gE^G, таких, что g(0) == 0. Тогда 5 (Л) должен быть инвариантен относительно Go. Пусть ОЛх, и у лежит в том же квадранте, что и х. Тогда монотонными преобразованиями, сохраняющими 0, и, следо- вательно, знаки оценок х по шкалам, можно перевести х в у. Поэтому вместе сх 8(Л) содержит и весь квадрант, содержащий х. Обратное можно вывести из того факта, что квадранты инвариант- ны относительно монотонных преобразований координат, сохра- няющих 0. Отметим, что для определения класса порядковых отношений ЗЗз можно было воспользоваться меньшими группами ps всех глад- ких монотонных преобразований прямой или даже р1 аффинных монотонных преобразований прямой. Действительно, нам, по су- ти, требовалась лишь транзитивность действия GQ на произволь- ном квадранте, а прямое произведение группы линейных преобра- зований с положительным якобианом обладает этим свойством. Содержательно: принадлежность классу ®з соответствует воз- можности смены масштаба, различной по различным шкалам, что, конечно, более естественно, чем предположения, приведенные в описании класса 33^- 33% представляет особый интерес, поскольку, как будет показа- но ниже, производные от отношений весьма широкого и практи- чески важного класса кусочно-гладких отношений лежат в ®2- Класс ЗЗ31 определяется пересечением 8 (Л) с множеством /3, где Гз = П {— 1, 0» ({—1, 0, 1}; — три точки на г-й шкале). По сути, 7—1 1з есть объединение центров всех Л-мерных граней единичного куба для к = 0, . . ., п. (При к ~ 0 это вершины единичного куба, при к — п — центр соответствующей грани есть просто 0.) В еди- ничном кубе —2п~*Сх /с-мерных граней, а точек в /3 всего Зп. То, что Л?ЕЕ£®з определяется пересечением 5(Л} /3, следует из того, что в каждом ортанте Rn лежит ровно одна точка из /3, 28
поэтому произвольное подмножество однозначно и корректна задает S (Я). Из последнего рассуждения следует, что для лю- бого п класс ЗВз конечен. Отметим, что если при замене базиса (изменение шкал) в Rn классы 33? и 33? остаются прежними, то класс 33? изменяется, т. е. определение класса 33? существенно связано с введением коорди- нат в пространстве Rn. Это обусловлено тем, что если в случаях и 33? группы, относительно которых инвариантны отношения соответствующих классов, определились независимо от базиса, используя только структуру аффинного пространства в Rn, то класс 33? выделялся при помощи группы G, определяемой через разложение R ' R х . . . X R. Нетрудно заметить, что множества преобразований; определяю- щих каждый из классов 33? — 33?, являются группами. Ясно, что задание бинарного отношения, инвариантного относительно не- которой группы преобразований квадрата, эквивалентно заданию некоторого подмножества пространства орбит действия этой груп- пы. В случае класса 33^ множество орбит есть Rn (рис. 2.2). По- этому Л С Rn X Rn задается подмножеством S (J?) С Rn. В слу- чае ®2 пространство орбит есть объединение (п — 1)-мерной сфе- ры и точки 0. Лишь в случае 33^ пространство орбит дискретно и нумеруется центрами граней всех размерностей единичного куба в Rn. Их число Зп. Классы 33? — < весьма важны в многокритериальной опти- мизации по следующим причинам. Во-первых, их геометрия существенно богаче геометрии произ- вольного отношения и позволяет строить развитую теорию и (на ее базе) легко алгоритмизируемые методы нахождения оптимума па отношениям этих классов. Иными словами, эти классы очень удоб- ны в качестве аппроксимирующих отношений. Во-вторых, на эта- пе аппроксимации информация, получаемая от ЛПР, как правило, инвариантна относительно тех или иных преобразований, о кото- рых шла речь выше. Другие примеры использования принципа инвариантности при- водятся в Приложении. Часто приходится иметь дело с некоторым обобщением конст- рукции инвариантных отношений. Пусть а : А X А —> А X А — некоторое преобразование декартова квадрата исходного множест- ва Л, Аа С А X А. Тогда назовем a-сохраняющимся, если (х, у) €= Аа р] Я => а (х, у) ЕЕ Я. Если G — некоторое множество преобразований, Ag = А X А для всех g ЕЕ G, и для любога g Е С существует h, такое, что gh = hg, и сохраняющее А X А неподвижным, то, очевидно, отношение, ^-сохраняющееся для всех g ЕЕ G, является G-инвариантным. Это построение возникает при анализе упорядочения критери- ев по важности (о котором будет говориться в разд. 2.3).
Рис. 2.2. Множество орбит для ЗР* Рис. 2.3. Отношение SimsPar2 Для всякого а и Я можно ввести понятие симметризации Я по а. Пусть Яо = Я, Яг = a (J?o Q Аа) и т. д. = а^Я^ Q ^а)> Тогда ёш1аЯ = Яо (J Я! U . . . Упражнение. Проверьте, что SimaJ? есть минималь- ное «-сохраняющееся отношение, более сильное, чем Я. Важность понятия симметризации заключается в следующем: если известно, что Яс, описывающее структуру предпочтения ЛПР, «-сохраняется, и мы уже построили отношение Я, аппроксимирую- щее Я& изнутри, то, симметризовав Я. мы опять получим аппрок- симацию Яс изнутри. Доказательство есть очевидное следствие двух фактов: 1) С =Ф Sim^^ С SimaJ?2, 2) Если Я «-сохраняющееся, то SimaЯ — Я. Упражнение. Проверьте верность этих утверждений. Отсюда видно, что отношения, аппроксимирующие изнутри «-сохраняющиеся, следует также искать в классе «-сохраняющихся. Приведем еще один Пример. Пусть А — R?1n Sc {1, ..., п} X {1, ..., п} — некоторое подмножество множества пар Для вся- кого (Z, ;) GE S положим (г, /) (х, у) = у) — перестановка i-й и /-й координат у первого вектора. Далее, пусть Ai} = {х} Xj}. Тогда наименьшее отношение, содержащее Я и (//)-сохра- няющееся для всех (f, /) S, называется 5-симметризацией Я (обозначается SimsJ?) по Подиновскому. Если Я = Рагп, то Sims = Я называется отношением Подиновского с 5-упорядоче- нием критериев (рис. 2.3). Упражнение. Определите, в каких классах лежат от- ношения: а) Парето; б) мажоритарное; в) лексикографическое; г) задаваемое функцией / (.2?) = хх + х2^ д) задаваемое функцией f (х) = е) Подиновского. 30
2.2. Критерии транзитивности и ацикличности Перейдем теперь к более детальному рассмотрению связи между геометрией бинарных отношений и их свойствами. При этом ос- новное внимание будем уделять отношениям классов в связи с их популярностью в качестве аппроксимирующих. Язык верхних срезов хорошо отражает специфику бинарных отношений в критериальном пространстве, он позволяет устанав- ливать связь между имманентными (т. е. инвариантными относи- тельно эквивалентности) свойствами бинарных отношений и гео- метрическими характеристиками подмножеств евклидова прост- ранства Rn. Поэтому будем использовать этот язык в наших рас- смотрениях. Рассмотрим свойство существования цикла, или, напротив, свойство ацикличности (напомним, что отношение ациклично, если ни для какого /с GE N не существует цикла длины к). Уже предположение принадлежности Л ЕЕ ®Г позволяет сфор- мулировать ясный геометрический аналог этого свойства. Цикл длины к существует тогда и только тогда, когда сущест- вует к векторов с суммой 0, лежащих в 5(J?). Действительно, если хгЛх2 ... ЛхкЛх\ — цикл длины к, то, по определению 5 (J?), каждая разность хг — хг~1 (I = 2, ..., к) _и х1 — хк должна лежать в 5 (J?), и сумма этих векторов есть 0. г С другой стороны, если z' ЕЕ S (Л) и 2 zt = 0, то векторы ;гг = z* j=i образуют цикл (проверьте!). Рассмотрим связь между ацикличностью отношений Л ЕЕ и существованием изотопной функции <р : Rn —» R1, т. е. такой, что хЛу => <р (ст) ср (г/). Упражнение. Показать, что существования изотонной функции достаточно для ацикличности Л. Оказывается, это не только достаточное, но во многих слу- чаях еще и необходимое условие ацикличности отношения Л. Сформулируем условия, когда это так. Построим транзитивное замыкание отношения Л (обозначим его через Лт). Пусть для каж- дой точки х верхний срез Лх измерим относительно лебеговской меры в Rn. Далее, пусть для любых*(;г, у) ЕЕ Лт разность Лх \ Лу имеет ненулевую меру. Это выполняется, например, тогда, когда эта разность имеет непустую внутренность. В этих предположе- ниях ацикличность Л эквивалентна существованию изотонной функции. Заметим, что наложение условий не на само Л, а на его транзитивное замыкание, не слишком обременительно, ибо каса- ется достаточно общих свойств отношения Лт, В частности, доста- точно постулировать открытость Лх, чтобы выполнилось условие измеримости Лтх- Доказательство эквивалентности использует прямое построение изотопной функции /. Пусть р — не обращающаяся в 0 положи- 31
Рис. 2.4. Примеры острых и ту- пых множеств а — S — острое; б — нетупое и неост- рое; в — S — тупое тельная измеримая функция р : Rn R1, такая, что j pdx = 1. Rn Тогда положим f(x) = \ pdx. Нетрудно видеть, что эта функция т &х изотонна, если Я ациклично. Этот общий принцип является ключевым при исследовании ацикличности отношений различных классов. Часто изотопную функцию удобно искать среди линейных. В этом случае условие существования такой функции может быть сформулировано в терминах геометрии верхних срезов. Для этого в дальнейших построениях нам потребуется несколько понятий. Пусть ScR\ Тогда гиперплоскость LCRfc (гиперплос- костью называется множество решений уравнения = (3, где а Ф 0) называется опорной (соответственно строго опорной) для S, если S целиком лежит в замкнутом (открытом) полупрост- ранстве, определяемом гиперплоскостью L. Линейной оболочкой Ж (S) называется минимальное линейное подпространство L С Rn, содержащее множество S С2 Rn. Рассмотрим множество S вложенным в свою линейную оболочку: S cz X(S) С Rfc(/c п). Если S в X(S) имеет опорную (строго опор- ную) гиперплоскость, проходящую через точку х е X(S), то 5 на- зывается нетупым (острым) в точке х. Совокупность множеств не- тупых (острых) в точке х будет обозначаться через (5<). Если S не есть нетупое в х множество, то S называется тупым в х (совокупность тупых в х множеств обозначается 5>) (рис. 2.4). Теперь можно выписать достаточное условие существования ли- нейной изотонной функции, которое автоматически будет достаточным условием ацикличности отношения Л. Утверждение 2.1. Пусть Af(J?) = |J (J?x — х). Тогда если _ хеА острое в точке 0, то существует линейная изотопная функ- ция. Действительно, построим гиперплоскость L в X со- держащую 0, такую, что M(J?) лежит в одном из открытых по- лупространств, на которые L делит Х(М Возьмем линей- ный функционал ср на <£J(M(J?)), такой, что cp/L = 0, ср положи- телен на полупространстве, содержащем M(J^), и продолжим ср произвольным образом на все Rn. Тогда ср будет изотонной функ- цией. Действительно, если х$у, то у ЕЕ Лх => у—х ЕЕ J?x — 32
— x CL следовательно, <р (у) — ср (.г) = <р (у — х) > О по по строению ф, что и требовалось показать. Перейдем теперь к изучению свойств разностных отношений ЕЕ 59Г. Инвариантность относительно переноса верхних срезов разностных отношений позволяет избегать операции объединения или пересечения множеств вида — х по ж, так как все они сов- падают. Основные свойства для ЕЕ записываются в терминах гео- метрии верхних срезов так: 1. Л рефлексивно О S (Л) ЕЕ 0; 1а. антирефлексивно О 5(H) 0; 2. симметрично о x_Ez S (Е?) — х ЕЕ £(J?), т. е. 5 (J?) сим- метрично относительно 0; 3. асимметрично о т. е. 8(Л)^\ — 4. антисимметрично о х, —х ЕЕ => х ~ 0, т. е. SW П - Я(Л) = {0}; к 5. Л имеет цикл данных к о Я {хг ЕЕ S : ^хг = 0; 6. транзитивно О 5(Е?) + S(J?) СЕ 5(J?). Этот набор фактов очевиден и не требует специальных доказа- тельств. Для ЕЕ все — .г совпадают и равны по опреде- лению 5(J$). Поэтому достаточное условие существования линей- ной изотопной функции и ацикличности выглядит так: Утверждение 2.2. Если 5(J?) — острое в 0, то ациклично,; и существует линейная изотопная функция. Мы уже отмечали, что ацикличность Л можно вывести и из факта существования более сильного, чем J?, ацикличного от- ношения Л', т. е. такого, что Л Л'. Если ф — изотопная функ- ция, то бинарное отношение Л^^Л, и Л ациклично. Важность рассмотрения линейных функций определяется тем, что из Л^ ЕЕ ЙЗГ следует, что ф — линейная с точностью до произвольной монотонной функции из R в R. Вообще говоря, условие остроты множества S (Л) не необходи- мо для ацикличности Л. Приведем ~ Пример. Пусть>~Л е и S (Л) = {—1, У2}. Тогда ясно, что £(Л) — тупое в 0 множество, а цикла не существует (про- верьте!). Нетрудно показать, что в этом примере непрерывной изотонной функции не существует. Однако, сняв условие непрерывности, ее можно построить. Пусть Л СЕ R —- подгруппа чисел вида i + jj/"2, i, / Е Z, Р = R/a — множество смежных классов. Выбрав в каждом классе р ЕЕ Р по представителю х (р) ЕЕ R, положим <р (z) = <р (х) (р (z) J- i +1 У 2) = i + Упражнение. Проверьте, что ф изотонна. Перейдем к рассмотрению свойств отношений класса По- 33
скольку этот класс уже лежит в (соответствующая группа сим- метрий шире), то можно ожидать более сильных результатов о связи геометрии верхних срезов (т. е. множества S (J$)) со свойст- вами J?. Действительно, это так. Удалось получить необходимые и достаточные условия транзитивности, ацикличности существо- вания цикла длины к. Поскольку эти условия опираются на свойства выпуклости 5(J?), напомним определения. Множество 5 С Rn выпукло, если х, у ЕЕ S, к ЕЕЕ [0, 1] => кх + + (1 — к)у ЕЕ 5, т. е. вместе с любыми двумя точками оно содер- жит и соединяющий их отрезок. Выпуклой оболочкой Чоо (5) мно- жества S называется множество (ко (8) = {х EEE Rn: И^ЕЕ/?}, Е- 0}: = 1, — х}. % о (8) можно определить как мини- мальное выпуклое множество, содержащее 5. Отсюда очевидно, что 8 выпукло тогда и только тогда, когда (So (8) = S. Нетрудно видеть, что 8 выпукло тогда и только тогда, когда для некоторого к выпукло пересечение 8 с любым линейным многообразием раз- мерности к. Отсюда следует, что, начиная с к = 2, можно заменить слово «многообразие» на «подпространство». Положительной оболочкой множества 5 С R?i называется множество 3d (8) = {х ЕЕ Rn: Я{.ггЕЕ 5}, > 0}: = х}. Здесь, в отличие от определения выпуклой оболочки не требуется равенства единице суммы коэффициентов в линейной комбинации. Очевидно, что (5) — конус, и %o(S) CZ (5). Можно определить 3^(8) как минимальный выпуклый конус, со- держащий S. Справедливо следующее Утверждение 2.3. Если 5 — конус, то ^o(S) = 3^(8), Дейст- вительно, достаточно показать, что Л (8) С %>р (S). Пусть х ЕЕ З5 (S), и при этом х ~ ^кгх\ где >0, я1 ЕЕ 5. Пусть РЧ ~ yi ~ Тогда для любого цц-1, а / Е по определению конуса. Далее, х = причем = 1. Следовательно, xEE^o^S), что и требовалось доказать. Это утверждение дает возможность в качестве критерия выпук- лости конусов принять условие 5° (S) = 5 вместо более сильного <во (5) = 5. Докажем теперь критерий транзитивности отношений Л ЕЕ » который состоит в следующем. Теорема 2.4. Пусть Л ЕЕ 33™ • транзитивно тогда и только тогда, когда S (Л) выпукло. (Необходимое условие транзитивно- сти показано в [8].) Доказательство. Пусть 8 (Л) С Rn - выпуклый ко- нус. Согласно приведенному выше утверждению, (8 (Л)) = = S (Л), поэтому х, у ЕЕ 8 (Л) => х + у е 8 (Л). Это значит, как указано выше, что отношение Л транзитивно. Пусть теперь Л транзитивно. Пусть ж1, . . ., х*ЕЕ S (Л), .. . . ., > 0. Тогда для любого I к}Хг ЕЕ 8 (Л), и из транзитивно- 34
сти Я последовательно получим + X2.r2e=5 (J?),. . . + . . . или ^(S(J?))CS(J?). Но S(j£)C^ (S(J?)), следовательно, ^(5(J?)) = 5(J?), что является условием вы- пуклости конуса 5 (J?). Теорема доказана. По аналогии с понятием положительной оболочки можно вве- сти понятие транзитивной оболочки У (S) множества S С Rn: к 1 По определению, Я транзитивно тогда и только тогда, когда S' (S (Я)) = $(Я). S' (S) можно определить и как минимальное транзитивное множество, содержащее S (под транзитивным мно- жеством (> cz Rn понимается Q — 3(Я), где Я транзитивно). Легко видеть, что S СТ. S (S) CZ Я (S), а если S — конус, то 5 £ В (5) = S (5) = S (S) cz X (S), следовательно, S’ (5) — тоже конус. Заметим в заключение, что в доказательствах предыдущего утверждения и теоремы существенно требование Я ЕЕ . Приме- ры отношений из 331, транзитивного с невыпуклым S (Я) и нетран- зитивного с выпуклым Я(Я), приведены на рис. 2.5. Заметим, что критерий транзитивности можно доказать, ис- пользуя то, что Я ЕЕ 331 — транзитивно тогда и только тогда, когда транзитивно сужение Я на любую плоскость, проходящую через 0; то же можно сказать о выпуклости. На плоскости же совпадение для Я ЕЕ 332 этих свойств очевидно. Перейдем к выводу критерия ацикличности. Далее для крат- кости будем записывать, опуская верхние индексы S< = 5<, = = S^, S> е= S> и полагать все гиперплоскости проходящими через 0. Сначала докажем Утверждение 2.5. Пусть 5CR — конус. Тогда следующие условия эквивалентны: (а) ^(5) - X (5), (б) (в) S — тупое множество в своей линейной оболочке X (S). Доказательство будем проводить по схеме (а) =$> (б), (а) => (в), (б) => (а), (в) => (а). (а) => (б) : пусть имеет место (а). Тогда S С (S) = X (S) и, следовательно, — SQ^(S), т. е. выполнено (б); (а) => (в): предположив, что S ЕЕ (т. е. что S — нетупое), по- лучим, что S имеет в X (S) опорную гиперплоскость. Но тогда и S (5) имеет ту же опорную гиперплоскость. Значит, S(S}EE что противоречит (а); (б) => (а): пусть — S се (5), xE%(S), т. е. 1 где хг е= S (I = 1,..., к). Для каждого номера г, такого, что <С 0, 35
представим х в виде 7-1,...,/, T/je5. xfj>o. 5=1 Такое представление существует согласно (б). Отсюда^получим i i х = S М’ — 3 к 2 КзУ3 = 2 Мг + 3 УзУ1, гЛ|>0 i.^<o 1 гА|>0 1 где все коэффициенты %ги р7- уже неотрицательны, т. е. х ЕЕ 99 (S). Таким образом, X (5) с 99 (5), что означает в действительности X (5) = ^(5); в ==> а : пусть S cz S>, но 99 (S) ф X (S). Пусть х ЕЕ X (S) \ \ 99 (5). Тогда из стандартных теорем выпуклого анализа в силу Рис. 2.5. Выпуклость и транзитивность а — S выпукло, но не транзитивно; б — S транзитивно, но не выпукло выпуклости SP (S) вытекает, что существует линейная функция <р: £ (S) R и у е R, также, что для любых у ЕЕ 5° (5) т (у) у и ф (х) у. Так как 99 (S) — конус, то у можно положить равной 0. Если у 0, то ф (у) > у, и ф (Ху) = Х(ср(у) > у для любого к >> 0, значит, ф (у) > у/Х для всех X > 0, т. е. ф (у) 0, и для любого у > 0 существует г/, такое, что ф (у) у, откуда ф (х) <9 0. Если же у отрицательно и существует у, такое что ф (у) < у, то можно выбрать X 0, такое, что ф (Ху) у (х), что противоре- чит определению у. Следовательно, можно положить у = 0. Но тогда гиперплоскость L GZ X (S) = {х : ф (х) = 0} будет опорной для 99 (S), т. е. S — нетупое в X (S), что противоречит (в). Сле- довательно, все импликации доказаны, а вместе с ними и утверж- дение. Перед формулировкой условия существования цикла введем Определение. Объединение к различных лучей с началом в точ- ке 0 назовем Л-звездой, которую обозначим через Sk. Отметим, что A-звезда представляет собой минимальный конус, натянутый на к неколлинеарных векторов. Теорема 2.6. Пусть S (Л) ее Rn — конус. Тогда Л обладает циклом длины т + 1, но не обладает циклом меньшей длины. Здесь т = min dim X (S'), S' ее S (Л), S' — тупое в X (S') 36
(т. е. теорема устанавливает соответствие между минимальной длиной цикла отношения и минимальной размерностью линей- ной оболочки тупого конуса, принадлежащего S (Л)). Для доказательства теоремы докажем следующие две леммы. Лемма 1. Пусть S cz Rn — тупой конус, Int (5) — внутрен- ность S в своей линейной оболочке X (S). Пусть луч г CZ S таков, что —г CZ IntS5 (S). Тогда £ F S> (т. е. конус S тупой). Из утверждения следует, что для доказательства леммы доста- точно показать, что X (5) cz Л (S). Пусть х ЕЕ X (S). Рассмотрим плоскость L, проходящую через луч г и вектор х. Очевидно, что — г ЕЕ Int(^ (5) f~] Л), а значит, х представим в виде суммы двух векторов из L с положительными коэффициентами, т. е. х ЕЕ 3й (5). Лемма 2. Для любого тупого конуса S найдется (к + 1) = звезда Sk+1 ci S, тоже тупая, где к т = dim X (5). Рассмотрим луч г ЕЕ S. Так как S — тупой, то, согласно ус” ловию (б) утверждения, следует, что —rCESb(S). Но тогда —г С 3й (5 \ г), причем ясно, что dim X (5 \ г) = dimX (S) = т. Рассмотрим все m-звезды Sa cz S \ г. Очевидно, что Ф (S\r) = и (S%) = U Int 5s (Sa), где под Int 9^ (Sa) пони- cz a,k<m мается внутренность 3d (Sa) в его линейной оболочке X (<)). Значит, найдутся такие а() и Аг0 что —г СЕ Int 3d (Sa.)- Рассмотрим (Ar0 + 1)-звезду = г J 5a". Из леммы 1 следует, что 5> (т. е. что (к0 + 1)-звезда — тупая). Понятно что CZ 5; таким образом, лемма доказана. Доказательство теоремы. Пусть к — длина неко- торого цикла к т. Это означает, что существует набор векторов к {.г2}, i = 1, . . ., к^хг = U. Натянем на {з?}1 Л-звезду Sk. Очевид- но, что —Sk CZ ^(5а), т. е. выполняется условие (б) утверждения 2.5. Следовательно, S — тупое в своей линейной оболочке, но dim S* к — 1 < т, т. е. размерность линейной оболочки X(S ) оказалась меньше минимально возможной (по условию теоремы). Из этого противоречия следует, что цикла длины т и меньше не существует. Существование цикла длины т + 1 следует из леммы 2. Теорема доказана. Следствие 1. Л ациклично тогда и только тогда, когда 5 (J/?) нетупое в своей линейной оболочке. Следствие 2. Л ациклично тогда и только тогда, когда Л слабее некоторого обобщенного лексикографического упорядоче- ния. Здесь под обобщенным лексикографическим упорядочением понимается отношение, определяемое так: хХвУ п-> W ~ <Pi (*/), Здесь (i=l,...,n)~ линейные, линейно независмые функции наР. Действительно, из предыдущей теоремы следует, что если Л ациклично, то S (Л) — 37
нетупое, т. е. существует Lr GZ Rn? такая, что Lr опорна для 8(<Я). Это равносильно существованию фх: фх (х) > 0 для всех х ЕЕ S(J?). Рассмотрим сужение на Iq, определяемое множест- вом 5(J?) П Lr Тогда S(J?) П L± также нетупое в LT, и сущест- вует гиперплоскость L2EZLV такая, что L2 — опорная в Lr для 5(J?) П L±. Выберем линейную функцию ф2‘ 2ц —> R, такую, что ф2 неотрицательна на S (J?) П и продолжим ее произ- вольным образом на всё Rn. Выбирая далее гиперплоскости Lk CZ опорные для S (J?) П и строя функционалы ф^, Рис. 2.6. Циклические и ациклические отношения положительные на S (J?) р| Lk^19 получим искомый набор функ- ций фг. Заметим, что именно нетупость любого конуса S' GZZ 8 (Л) в своей линейной оболочке гарантирует возможность построения опорных гиперплоскостей Lt. Проверка того, что Л CZ Lg, т. е. того, что Я слабее такого обобщенного лексикографического упорядочения, тривиальна. В обратную сторону, если J?CZ£g, то в силу ацикличности Lg^ ациклично. На рис. 2.6 приведены примеры отношений Я ЕЕ 532- Отноше- ние J?, верхний срез которого изображен на рис. 2.6, а, ациклично, что следует из существования строго опорной гиперплоскости (в данном случае прямой L). Отношение, изображенное на рис. 2.6, б, имеет цикл длины 2, так как существует конус S' ЕЕ S (J?) размерности!. Верхний срез отношения, изображен- ного на рис. 2.6, в, хотя и имеет опорную гиперплоскость (пря- мую L, совпадающую с осью ординат), однако циклично по той же причине, что и в предыдущем случае (здесь S' = L). И, наконец, на рис. 2.6, г изображено отношение, имеющее цикл длины 3. Исследуем теперь особенности операций взятия мажоранты и миноранты в случае классов $31 и 332 (случай ЗЗз будет рассмотрен в гл. 3). Утверждение 2.7. Пусть е S3?. Тогда .7?Du’' = S?Mo11 е S3?. Принадлежность J?Dur, и Лп классу инвариантных относи- тельно сдвига почти очевидна: если некоторая пара (х, у) удовлет- воряет утверждению, прочие аргументы которого инвариантны относительно сдвига, то и сдвинутая пара (х + 2, у + z) также удовлетворяет этому утверждению (принцип инвариантности). 38
Упражнение. Продумайте вышесказанное, проведя подробное доказательство. Путь теперь х ЕЕ S (J?Mo11). Это означает, что для всякого у ЕЕ 8(Л) х Е z Е= 8 (Л), Принадлежность же rr ЕЕ 5(J?Dur) означает, что для вся- кого у Е— S (J?) у + х ЕЕ S (J?). Оче- видно, эти условия эквивалентны. Рассмотрим теперь класс Sift- Упражнение. Проверьте, что если Л 3ft, то ^?Dur = ЛПоП, Рис. 2.7. Звездчатая внутрен- /77 Z <75 it Л7~)П НОСТЬ Л — ЛЕ лежат в 332. Оказывается, наложение дополнительного условия на 8 (Л) (геометрический конус) влечет нетривиальную информацию о мажоранте, миноранте и проч. Именно, если предположить 8 (Л) замкнутым, получим Утверждение 2.8. = я* если Л нетранзитивно, Л, если Л транзитивно. Очевидно, что хЕЕ8{Л[}, если и только если для любых у, z ЕЕ 8 (Л) у Е х Е zEE 8 (Л). Но так как отсюда и 1/X (х + ty + + Kz) е 5 (Л), то для любого Z О х/к + у 4- z 8 (Л), т. е. в силу замкнутости 8 (Л) у Е z ЕЕ 8 (Л). Но это означает в силу произвольности z/, z, что 8 (Л) — транзитивное множество. Итак, операция <Ф> в известном смысле — индикатор транзи- тивности: транзитивные отношения она не меняет, нетранзитивные переводит в пустые. Отношение J?Dur также допускает замечательное «геометриче- ское описание». Чтобы перейти к нему, напомним одно понятие. Пусть V СЕ Rn — тело. Звездчатой внутренностью У, обозначае- мой через St У, называется совокупность точек у ЕЕ У, таких, что для любой w ЕЕ V отрезок [и, ш] СЕ V (рис. 2.7). Упражнение. Докажите: а) если V выпукло, то Sty = У; б) Sty выпукло. Утверждение 2.9. Пусть J?2 ЕЕ®2. Тогда 5(J?nur) = St(5(J^?)). Доказательство. Пусть х 8 (J?Dur), у 8(Л). Отсюда вытекает, что х + у ЕЕ 8 (Л). Коль скоро для любых а, р >0,а + р = l,ccr(ES(^Dur), Pz/E^) над + fiy ЕЕ 8 (Л), то отрезок [х, у] целиком лежит в 8 (Л), т. е. ж ЕЕ St(S(J/?)). Обратно, если хЕЕ 8 (Л) таков, что для любого у Е 8 (Л)[х, у] ЕЕ ЕЕ 5 (Л), то (х Е у)/2 ЕЕ 8 (Л) и, значит, х Е у ЕЕ 8 (Л), откуда х ЕЕ 8{ЛЛ^Х}, что и требовалось доказать. Отсюда мы получаем Следствие. Если V — геометрический конус, то и St У — геометрический конус. 39
Заметим, что StP допускает еще одно замечательное описание. Среди всех выпуклых тел, содержащихся в V, есть максимальные, т. е. те, к которым нельзя добавить ни одной точки из V, чтобы сохранить их выпуклость. Пересечение всех максимальных выпук- лых тел, очевидно, выпукло и совпадает с St У. Упражнение. Докажите это. (Указание: действуйте по аналогии с доказательством того, что Л" = Л*). Теперь рассмотрим для всякого Л ЕЕ 33% пересечение всех максимальных отношений среди транзитивных, более слабых, чем Л, и линейных. Обозначим полученное отношение через Л[^п- Очевидно, сужение класса, по которому берется пересечение, ведет к увеличению этого пересечения, т. е. Л' }1п ЕЕ Л'1. Действш но, Л^гп достаточно велико. Утверждение 2.10. = ЛВиг- Доказательство. Ясно, что Л^п ЕЕ 33% и что 3(Л^п) есть пересечение всех максимальных выпуклых конусов, лежа- щих в Я(Л) (выпуклость равносильна транзитивности в 33%). С другой стороны, 5(J?Mo11 ) = 5(J?Dur) = St S (Л). Результат предыдущего упражнения показывает совпадение этих множеств. Таким образом, учет соображений инвариантности существен- но обогащает наши знания в геометрии бинарных отношений в критериальном пространстве. 2.3. Упорядочение критериев по важности Обсудим теперь чрезвычайно популярное в многокритериальной оптимизации понятие упорядочения критериев по важности. Вве- дение этого понятия было связано с необходимостью получить о решаемой задаче дополнительную информацию, которая позволи- ла бы добиться дальнейшего сужения множества оптимальных ва- риантов (мы уже отмечали, что оптимизация по Парето часто ока- зывается неудовлетворительной именно из-за большой мощности оптимального множества). Вопросы о важности критериев, адресованные ЛПР, оказывают- ся, с одной стороны, достаточно понятными ЛПР, а с другой — его ответы могут быть эффективно использованы в алгоритмах оптими- зации. Однако, во многих методах требуется, чтобы важность крите- риев ЛПР выразил численно — сообщил так называемые весовые коэффициенты. Такая задача либо оказывается ЛПР не под силу, либо ЛПР сообщает заведомо неточную информацию, что приво- дит к ошибочным решениям. Примером качественного упорядочения критериев, т. е. без определения весовых коэффициентов, является лексикографиче- ское упорядочение. Ясно, однако, что круг многокритериальных задач с лексикографически упорядоченными критериями слишком 40
узок, поэтому хотелось бы иметь более общее определение сравни- тельной важности. Интуитивно ясно, что один критерий важнее другого, если уве- личение на несколько единиц оценки по первому из них важнее уменьшения оценки по второму на столько же единиц. Отсюда вид- но, что понятие важности критериев следует определять через перестановки оценок по различным критериям. На этом пути есть одно препятствие: возможность перестанов- ки оценок по критериям подразумевает возможность измерения этих критериев в одних и тех же единицах. Введение этого требо- вания снижает практическую ценность понятия упорядочения кри- териев: приведение шкал к однородным масштабам часто нереа- лизуемо практически. Даже использование мнения ЛПР в силу неизбежных неточностей его ответов не может гарантировать кор- ректности определения упорядоченности неоднородных критериев. Способов уменьшения оценки по одному критерию и увеличе- ния по другому много, поэтому существует несколько определе- ний упорядочения критериев по важности. Об одном способе упорядочения мы уже упоминали. Это $-упо- рядочение по Подиновскому. Оно определено для довольно узкого класса отношений (являющихся симметризацией отношения Па- рето), однако и в его основе — перестановка критериальных оце- нок. Критерий i оказывается не менее важным, чем критерий у по Подиновскому, если из ^SimPar?/ (где <f Xj) следует, что x'(Sims Par)?/', где х'п у' — векторы, полученные соответственно из х и у перестановкой ?-й и у-й координат. Мы дадим здесь более широкие определения сравнительной важности критериев (для любого бинарного отношения в критери- альном пространстве, а не только для симметризаций), в основе ко- торых лежит тот же принцип перестановки критериальных оценок. В отличие от приведенного выше упорядочения по Подиновскому, симметризация по преобразованиям, входящим в эти определения, сохраняет класс Обозначим через stj симметрию Rn относительно гиперплоско- сти Xi = Xj, переставляющую оценки по Z-й и у-й координатам. Определение. Пусть Л ЕЕ Sn. Тогда будем говорить, что крите- рий i не менее важен в абсолютном смысле, чем критерий у для отношения Л (обозначается если и только если Nx £= : xi xj 8^ (Лх П {Xi .9j}) С Л3..х- Из этого определения видно, что влияние одного критерия больше, чем другого, если перестановка оценок по критериям (большая оценка приходится на менее существенный критерий) не нарушает отношения между векторами. Определив отношение =±, можно стандартным образом разбить его на отношения строгого превосходства критерия i над крите- рием (обозначаемого ?4j), равноправия (i^y) и породить 41
Рис. 2.9. Упорядочение критериев в относительном смысле Рис. 2.8. Примеры упорядочения критериев в абсолютном смысле отношение несравнимости по важности (г х у) (рис. 2.8): i Д / О i j & / ==± i, i j О i =± j & / A i, i X / О Однако в этом определении верхний срез в точке х отражается относительно биссектрисы xt = Xj, которая, вообще говоря, через О не проходит. Абсолютное упорядочение существенно исполь- зует базовый элемент о для построения отношения =±. Определим также сравнительную важность критериев инвариантно относи- тельно переноса, ибо необходимо формализовать возможность пе- реставлять разности оценок по критериям. Определение. Пусть Л ЕЕ S3n. Тогда критерий i не менее важен, чем критерий у в относительном смысле для отношения Л (обозна- чается I ]), если и только если для любого х ЕЕ Rn S (Лх X Q {«Tj S'tj (Лх х). Отметим различия в определениях абсолютного и относи- тельности по важности: если в определении абсолютного упорядо- чения фигурировали соотношения на два разных верхних среза 42
Ях и то в относительном случае есть некоторое условие на один верхний срез Кроме того, в относительном случае нет ог- раничений на х, в отличие от абсолютного, где х: xt Xj. Как и для абсолютного упорядочения, можно ввести на множе- стве критериев отношения превосходства, равноправия и несрав- нимости по важности в относительном смысле (рис. 2.9). Как уже говорилось, практически все методы, позволяющие по- низить сложность задачи, используя те или иные свойства ее сим- метрии, опираются на понятия действия преобразований. В разд. 2.1 было введено определение действия группы на отноше- ния. Покажем, что упорядочения критериев по важности как в аб- солютном, так и в относительном смысле не составляют исключе- ния и вкладываются в общую схему. Напомним, что отношения инвариантно относительно мно- жества преобразованийG, если Gдействует на А X А = Rn X Rn, и каждому элементу g С G сопоставимо подмножество Ag CZ А X X А, так что выполняется условие (хЯу, (х, у) е Ag) g(x, у) е Я. Покажем теперь, как надо определить упорядочение критериев по важности в терминах действия группы: G есть набор пар (г, /), z, 7'6=(1,..., п) элементов. Для определения абсолютного упоря- дочения надо положить Аг/- = {(х, у) : Xj, уг z/j}, ((i, j) — транспозиция, и (z, 7) (х, y)=z(sijX, Stjy). Так как транспозиция порождает группу sn, то можно определить действие sn и Ag для всех g е sn. Если под действием транспозиции (j,/) отношение пе- реходит в себя, то i j. Отсюда можно задать бинарное отношение а на критериях как максимальное, такое, что отношение инва- риантно при А и, определенных выше для , и Аг/- = ф для . . .а , I, 7 : П Подобная же конструкция может быть проведена и для относи- тельного упорядочения критериев по важности. Достаточно поло- жить A(f, у) = {(х, у) : yt — xt < г/, — Xj}, если i 7, иА(?-,;) = ф в противном случае. Действие же транспозиции (Z, 7) на паре (х, у) определяется как (Z, 7) (х, у) = (х, х + Sfj {у — х)). По произвольному отношению Я и произвольному отношению может быть построена симметризация Л в абсолютном или отно- сительном смысле. Ее можно определить как минимальное отно- шение J?', содержащее такое, что для J?' и для всякой пары i 7 верно, что для отношения J?' i не менее важен, чем 7 в абсо- лютном или соответственно относительном смысле. Вообще го- воря, для симметризованного отношения и для всех исходно заданных пар i 7 выполняется указанное упорядочение по важ- ности, однако могут возникнуть и другие пары упорядоченных критериев. В терминах симметризации можно определить упорядочение 43
критериев по важности для Л как максимальное отношение на критериях, симметризация по которому совпадает с Л. Итак, показано, что понятие упорядочения критериев по важ- ности можно, естественно, формулировать в терминах действия ко- нечного набора симметрий на отношениях. Выясним теперь вопрос о соотношении абсолютного и относи- тельного упорядочений критериев по важности. Для произволь- ных отношений это, вообще говоря, разные упорядочения. Однако уже для отношений класса S” относительное и абсо- лютное упорядочение критериев по важности совпадают. Пока- жем, что если Л — разностное отношение, то из i г± / следует, что t /, и наоборот. Действительно, пусть i 7. Тогда у eRn : Уг — Xi ^yj — у ЕЕ Лх=^»х8^(у — х) ее Лх. Если х, > Xj и yi yj, то неравенство уг — хг у^ — Xj вы- полнено. Так как Л ЕЕ S?, то из х + (z/ — х) = Лх следует, что + sij (У — х) ЕЕ т. е. s^y ЕЕ Л8..х, что и означает вы- а полнение i j. Обратно, если i 7, то (Ло П {хг < Xj}) CZ Ло. Но тогда, если у СЕ Лх yt — xt < — Xj => у — х П {xt — Xj} и su(y ~ х) ( - Ло, что дает искомое х + Sij(y — х) ЕЕ Лх. Итак, для Л ЕЕ 331 доказано, что i j <=> j у. Таким образом, усло- вия инвариантности верхних срезов относительно сдвига доста- точно для эквивалентности двух различных определений упорядо- чения критериев по важности. Поэтому для разностных отношений значки а и г будут опускаться. В случае разностных отношений упорядочение критериев по важности определяется геометрией единственного множества Ло = 8(Л), поэтому можно определять упорядочение критериев по взаиморасположению 8 (Л) и биссектрис. Например, i j эквивалентно условию симметричности 8(Л) относительно гипер- плоскости Xi = Xj. Как показывают предыдущие рассмотрения, в определении упо- рядочений критериев как в абсолютном, так и в относительном смыслах большую роль играли биссектрисы-гиперплоскости вида Xi — Xj. Это очень неинвариантный объект — линейные преобра- зования, сохраняющие все эти гиперплоскости, суть перестановки координат и гомотетии.;Как уже говорилось выше, в случае неодно- родных критериев приравнивание оценок не имеет физического смысла, поэтому биссектрису точно провести не удается. При из- менении же положения биссектрисы упорядочение критериев по важности изменяется и не может быть использовано для аппрокси- мации. Однако в случае порядковых отношений подобных проблем не возникает. Именно при изменении положения биссектрисы упо+ рядочение по важности для порядкового отношения (неважно, в абсолютном или относительном смыслах, так как всякое порядко- 44
вое отношение является разностным, а для них упорядочения сов- падают) не изменяется, и поэтому может быть определено устойчи- вым образом. Действительно, изменение положения биссектрисы Xi = Xj можно описать как сжатие (растяжение) одной из коорди- нат в X 1 раз, причем другая остается неизменной. Вообще гово- ря, геометрия верхнего среза при этом изменяется, и изменение ее положения по отношению к гиперплоскости xt = Xj приводит к изменению упорядочения критериев Z, /. Но, по определению порядковых отношений, они выдерживают монотонные преобра- зования координат, в том числе и растяжения. Следовательно, при таких преобразованиях верхний срез порядкового отношения не изменяется, равно как и его взаимное положение с биссектрисами, а значит, не изменяется и упорядочение критериев по важности. Этот факт снимает проблемы, связанные с необходимостью подбо- ра одинаковых единиц измерения критериев при использовании порядковых бинарных отношений. Оказывается, что упорядочение критериев по важности и клас- су порядковых отношений обладает еще одним регуляризующим свойством. Вообще говоря, отношения не обладают свойствами транзитивности, и, следовательно, —> не есть отношение строгого порядка, а <-» не есть отношение эквивалентности. Однако в классе можно доказать, что есть транзитивное и рефлексивное от- ношение (полагаем i ]). Отложим доказательство до гл. 3, в которой будет развита необходимая техника. Заметим только, что это подтверждает указанное выше свойство симметризации по не- которому упорядочению критериев по важности содержать воз- можно больше отношений zz>, чем в исходном упорядочении. Если было порядковым, то упорядочение критериев по важности в симметризации по некоторому отношению на критериях будет его транзитивным замыканием. Рассмотрим теперь несколько известных порядковых отношений с точки зрения упорядочения критериев. Для отношения Парето все критерии равноправны. Действи- тельно, если ^Parni/, т. е. если у — х ЕЕ S(JPsxn), то для любых Z, jsij(y —х) ЕЕ S (Par11). Действительно, zE 5(Parn) о Vi = 1, ..., п Zi 0, и перестановки оценок не меняют этих неравенств. Отсюда i / для всех i, j, и, значит, 1^2 п. В отличие от отношения Парето, где все критерии оказались равноправными, в случае лексикографического отношения ника- кие два критерия не равноправны. Более того, один из них обяза- тельно будет более важным, чем другой. Нетрудно понять, что упорядочение критериев Z, j по важности определяется сужением лексикографического отношения на координатное подпространство = 0, ..., = 0}. Однако это сужение есть снова лексико- графическое упорядочение. Ясно, кроме того, что 1 —> 2. Из этого вытекает, что критерии упорядочены следующим образом : 1 2 -> . . . -> п. Для мажоритарного отношения, как и для паретовского, все 45
критерии равноправны. Действительно, результат сравнения век- торов х, у определяется знаком числа тху разности количества кри- териев, оценка х по которым превосходит оценку у, и количества координат, по которым у оценивается лучше, чем х. Но любая перестановка координат оставляет это число неизменным, следо- вательно, мажоритарное отношение переходит в себя при симмет- риях относительно биссектрис. Отсюда 1 +-> 2 ... п. Предположим, что нам удалось получить информацию от ЛПР о сравнительной важности критериев (в определенном выше смыс- ле). Покажем, как использовать эту информацию для сужения мно- жества отношений, из которых отбирается аппроксимирующее. Процедура сужения основана на следующем простом соображении. Пусть Я аппроксимирует J?c изнутри (J? GZ J?c) и для критерий i не менее важен, чем критерий j в абсолютном или относительном смысле. Тогда симметризация 3?с по упорядочению i zx j совпа- даете J?c. Следовательно, симметризация должна лежать внутри J?c, т. е. симметризованное отношение также аппроксимирует изнутри. Отсюда немедленно вытекает, что искать аппрокси- мирующее отношение следует в случае выполнения i j для среди тех отношений, для которых это упорядочение также вы- полняется, ибо в противном случае отношение можно симметри- зовать так, что упорядочение будет выполняться, а отношение по-прежнему будет аппроксимирующим изнутри. Рис. 2.10. Аппроксимация поряд- ковым отношением Заметим, что информация типа \(i j) не позволяет нам су- жать класс аппроксимирующих отношений. Действительно, хотя для может быть ~|(fz±y), но максимальное аппроксимирую- щее отношение может быть с упорядоченной парой t z± /. Приве- дем пример. Пусть 6= задается верхним срезом 5 (J/?) — = {х\х2 > 0, хх + х2 > 0} (рис. 2.10). Тогда для 2 => 1, но |(1 2). Единственное же (и потому максимальное) аппрокси- мирующее отношение из есть паретовское, для которого верно не только 2 1, нои lz±2. Еще одно подтверждение ска- занному состоит в том, что для произвольного У?с отношение на критериях не обладает, вообще говоря, свойством транзитив- ности, для всякого же порядкового отношения упорядочение критериев по важности транзитивно и поэтому должно содержать вместе с / и еще и в отличие от упорядочения для<>?с. 46
Порядковые отношения 3.1. Аппроксимация отношений Ранее мы уже писали, что решение многокритериальной задачи состоит из двух этапов — аппроксимации структуры предпочте- ний (изнутри или снаружи в зависимости от целей) и выбора опти- мума по аппроксимирующему отношению из исходного множест- ва. (Эти этапы могут итеративно повторяться.) Очевидно, что основная сложность оптимизации заключена именно в первом этапе — аппроксимации, ибо второй этап — вы- бор множества недоминируемых — в настоящее время осуществля- ется хорошо разработанным и легко анализируемым алгоритмом, весьма близким идейно к алгоритмам математического программи- рования. С другой стороны, даже незначительные погрешности на первом этапе могут привести к серьезным ошибкам в результате, и как бы ни был совершенен алгоритм выбора, не удается устра- нить ошибки этапа аппроксимации. Задачи же, возникающие на этапе аппроксимации, исследованы очень слабо как психологами (которые должны ответить на вопрос: как именно следует получать информацию от человека, чтобы обеспечить ее непротиворечивость и достоверность), так и математиками (которые должны понять, какая информация наиболее важна для аппроксимации и как эту информацию использовать в расчетах на ЭВМ). В этой книге мы занимаемся второй, математической, стороной этого вопроса. Коль скоро речь идет об аппроксимации, сразу же возникает вопрос: отношениями какого класса мы будем аппроксимировать структуру предпочтений ЛПР? В предыдущей главе было рассмот- рено несколько классов бинарных отношений в критериальном пространстве. Это классы: — разностных, $3% — линейных и — порядковых отношений. Эти классы вложены: S3™ ZD ЗЭ2 73 ZD 33 3, причем ЗЗз конечен. Выбор класса для аппроксимации должен быть произведен ис- ходя из следующих соображений: этот класс должен быть доста- точно богат, чтобы позволить как можно точнее провести аппрок- симацию, но этот класс должен быть достаточно прост, чтобы процесс аппроксимации можно было бы алгоритмизировать. Оче- видно, что ни ®i, ни ЯЗ2 не удовлетворяют второму требованию. Остается лишь класс порядковых отношений ЗЗ3. Так как он ко- нечен, то допускает простую алгоритмизацию, однако при этом достигается лишь очень грубая аппроксимация (во многих зада- чах не удается получить более точную аппроксимацию, чем отно- шением Парето). 47
Рис. 3.1. Верхний срез отношения из Pfan (h Е Р) Именно по этим причинам мы предложим здесь модель, в основе которой аппроксимация структуры предпочтений отношениями такого класса, который хотя и конечен, но в отличие от класса З83 позволяет аппроксимировать с любой степенью точности. Введем в рассмотрение семейство конечных классов отношений в п- мерном пространстве критериев. Это семейство отношений зависит от трех целых параметров.Каждый член семейства обозначается (Z, г, р). Определение. Пусть Z, г, р ЕР N (N — множество натуральных чисел). Тогда Л ЕР (I, г, р) тогда и только тогда, когда а) б) 5 (J?) = U 1=1 в) st = {ж ЕЕ : VI г 2 ~г & ij * ft=i где * — знак или , причем Г) Vf,7 2- | Ор\ + |^ol<p; Vi',7, к а^, ^-eZ (Z — множество целых чисел). Смысл этого определения следующий: каждое отношение клас- са jun (Z, г, р) есть разностное отношение, причем верхний срез нуля есть объединение I выпуклых множеств, каждое из которых задается г строгими или нестрогими неравенствами, причем сум- ма модулей коэффициентов ограничена сверху числом р, а сами коэффициенты — целые числа. На рис. 3.1 изображен верхний срез отношений Л ЕЕ S3n (Z, г, р). Заметим, что мы аппроксимируем разностными отношениями Л ЕЕ ЗВп (I, г, р) разностные же отношения. Аналогично теория мо- жет быть развита для произвольных отношений, но мы ограни- чиваемся разностными отношениями в силу того, что они прак- тически покрывают все мыслимые приложения. Кроме того, для них геометрическая картина нагляднее. Укажем сначала некоторые очевидные свойства классов Sin (Z, г, р). Они монотонны по каждому параметру, т. е. VZ <Е Г, r < r', Р р' верно включение ®n (Z, г, р) ЕЕ (//тЛр')- Нефор- 48
мально соотношение этих классов выглядит так: чем больше числа Z, г, р, тем, с одной стороны, сложнее задать отношение этого класса, но, с другой стороны, тем точнее можно приблизить некоторое произвольное Л ЕЕ 33™ отношением класса 33™ (Z, г, р). Кроме того, каждый класс 33™ (I, г, р) конечен. Это очевидным обра- зом следует из его определения. Таким образом, эти классы отношений служат кандидатами в качестве базы аппроксимации. Отметим, что определение класса S3n (Z, г, р) существенно ис- пользует базис в пространстве Rn и, более того, неинвариантно даже относительно преобразований Rn, сохраняющих шкалы, но меняющих масштаб по каждой шкале. Вообще говоря, если ли- нейное преобразование Rn не переводит в себя решетку Z х • • . X Z, то классы 53n(Z, г, р) не сохраняются. Если же эта решетка переходит в себя, то каждое отношение класса S3™ (1,г,р). переходит в отношение возможно другого класса того же семей- ства. Однако это не служит препятствием к использованию отно- шений классов 33™ (Z, г, р) в качестве аппроксимирующих, так как эти отношения не есть реальные структуры предпочтений ЛПР,. обладающие поэтому некоторыми свойствами симметрии, но лишь приближающие их. Корректность использования этих отношений обусловливается тем, что в некотором смысле они с произвольной точностью ап- проксимируют любое отношение класса 33™. Именно, так как все 33™ (Z, г, р) QZ 33™, достаточно приблизить с любой точностью, множество S (3?). Однако S (J?) может уходить на бесконечность, т. е. не лежать ни в какой конечной части Rn. Более того, всякое нетривиальное отношение (с S (Л) =^= 0) класса 33™ именно так и ведет себя. С практической же точки зрения рассмотрение уда- ленных частей S (Л) бессмысленно. Действительно, как правило, исходное множество вариантов А ограничено. Результаты выбора из А по отношению Л ЕЕ 33™ определяются разностями оценок вариантов и срезом S (Л). Но если А ограничено, то и множество, разностей оценок А — А (т. е. векторов z, таких, что z = х — у, х, у ЕЕ А) ограничено. Следовательно, поведение S (Л) вне мно- жества А \ А не влияет на результат сравнения. Поэтому ап- проксимировать имеет смысл лишь множества 5 (Л) Q Bq, где Bq — {х : || х || q} — шар радиуса q. Здесь верна следующая Теорема ЗЛ. Пусть # О, тогда существует функция <р : N X N X N —> R, такая, что: а) <р монотонно убивает по каждому аргументу; б) если Zn, rn, рп оо по п, то <рп = <р (Zr, rn, рп) 0 и в) любое ограниченное шаром Bq отношение класса 33™ (т. е. такое, что S (Л) СЕ Bq с точностью ср (Z, г, р) аппроксимируется отношением класса 33п (Z, г, р), где точность понимается в смысле* метрики Хаусцорфа. Напомним, что метрикой Хаусдорфа называется метрика на пространство подмножеств метрического пространства (в нашем 4$
случае Rn), определяемая следующим образом: dn(s1,s2) = = sup inf d (x, у) + sup inf d (x, у). Здесь dH — метрика Хаусдорфа, $i,s2 Ez Rn, d — метрика в Rn. Доказательство. Положим ср (Z, г, р) — = sup inf dn (s, s (/?)). Тогда условие в), очевидно, вы- s^Bq R^Bn(J,r,p-) полнено. Условие а) следует из включений Вп (I, г, р)^Вп(1/, г', р') для любых /<;/', г г', р р'. Остается показать выполнение условия б). По известным утверждениям топологии шар Bq ком- пактен и для любого е О обладает Е-покрытием, т. е. существует конечный набор i = 1, . . ., TV, такой, что открытые шары Вг (zt) радиуса е с центром в zt покрывают шар Bq. Пусть далее f(z)~ шах йн(2, Bq\Bz(zi)'), f(z) непрерывна на Bq как мак- l^i^N симум непрерывных функций и положительна. Значит, есть а О, такое, что Ве_о (zz) — тоже покрытие Bq, и отсюда если z'i таковы, что для всех id(z\, zt) о, то Ве (z/) — тоже покры- тие Bq. Выберем в о-шаре, окружающем точку zh точку z'i с рацио- нальными координатами. Зададим каждую точку z\ системой уравнений вида a^Xj — Ь00(); —а^х} + Ьц^О, j = 1, . . ., п. Тогда множество z\ задает элемент класса Вп (7V, 2п, р), где п р — 2 шах ( У | atj [ + | 1). По определению е-сети, для любого S i j=l можно выбрать такое подмножество z — {z'i}, что djy (z, s) e (для этого достаточно включить в z лишь те z-, где Bz {z'i) [Д S 0). Значит, ср (7V, 2п, р) е. Но в силу монотонности ф, начиная с некоторого п{п = min п , п': ln> > N, гп> 2тг, Рп> р), фп е. Так как е можно брать сколь угодно малым, теорема доказана. Обсудим ее. Неформально ф(/, г, р) есть не что иное, как точ- ность аппроксимации подмножеств Bq элементами Лп (Z, г, р). Тео- рема показывает, что, сделав Z, г, р достаточно большими, можно шолучить сколь угодно точную аппроксимацию. При этом аппрок- симация, вообще говоря, будет производиться не изнутри. Более того, можно привести пример, когда аппроксимация изнутри отношениями класса <Йп (Z, г, р) невозможна. Пусть J/? GE 5Й2 зада- ется 5 (J?) = {(£, y2t)}, t^> О, лучом, выходящих из 0 с накло- ном У 2. Упражнение. Покажите, что ни для какого непустого J?' ЕЕ ST (Z, г, р) Л не сильнее Л'. Однако заметим, что этот пример соответствует нереальному случаю. Невозможность идеального измерения влечет за собой, как правило, то, что верхний срез отношения имеет непустую внутренность. В этом же случае для открытых множеств 5 (J?) возможна аппроксимация изнутри с любой точностью. Более того, сходимость будет не только в метрике Хаусдорфа, но и в тополо- гическом смысле. Напомним, что sn —> s, если хЕ S (ЭУ0: N > 7V0 =^> х е sn). 50
Теорема 3.2. Пусть 5(J^)CE®g открыто. Тогда су- ществует последовательность ЕЕ 58п (I, г, р), что —>Л, Л^ СЕ Л. Доказательство. Выберем последовательность ЕЕ s (J?) всюду плотную в S (это можно сделать в силу сепара- бельности Rn). Каждая точка zc обладает открытым шаром BQ(zt) с центром в zt, лежащим в S. Выберем куб Ц е 5°(zf) с рациональными вершинами, содержащий zt, такой, чтобы U Ц = S. Каждый I} описывается 2п целочисленными уравне- г к ниями с суммой модулей коэффициентов р;. Но тогда J Ц = S (Л%) 1=1 задает отношение e®n(/c, 2п, max pt). Из того, что Q Ц = ST г i—1 следует, что Л^ —> J?, что и требовалось доказать. Итак, мы установили, что классы (Z, г, р) можно эффективно^ использовать и при аппроксимации изнутри в случае открытого S (J/?), имеющем практическую значимость. При этом верно сле- дующее: оптимум в любом предъявлении по таким аппроксими- рующим отношениям сходится к оптимуму по аппроксимируемо- му отношению. Теорема 3.3. Пусть СЕ Я. Л^ -> J?. Тогда Мах^А -> Мах^А. Доказательство. Так как CZ J?, то Max^fcA ED ZDMax^A. Пусть .г ЕЕ А \ Мах^А. Это значит, что существует I/ СЕ А, такое, что xRy. Но так как, по определению, начиная с не- которого Nq, пара (х, у) находится в отношении (TV > 7V0),. то х £= Мах^ А ==> х lim Мах.# А, что и требовалось доказать. Jf-*oo Отметим, что если не предполагать Л^ СЕ Л. то утверждение о сходимости выборов к истинному неверно. Пример: пусть А есть множество натуральных чисел, Л — пустое отношение (т. е. Мах^А — А) и Л^ есть отношение превосходства как минимум на Л, т. е. пЛ^т тп — к. Ясно, что Л* —> Л, и Мах^А ф 0. Итак, мы доказали три аппроксимационных теоремы, позволя- ющие использовать конечные классы отношений в качестве базы аппроксимации разностных отношений. Аналогичные построения можно было бы привести для произвольных отношений в Rnr но практика показывает достаточность уже этих классов для нужд алгоритмизации процесса принятия решений. Более того, на самом деле используется лишь очень небольшой начальный «кусок» трехпараметрического семейства (Z, г, р). Ситуация здесь вполне аналогична ситуации в численных ме- тодах вычислений: с одной стороны, известна полнота системы конечных тригонометрических полиномов в L2 [0, 2л), а с другой стороны, в реальных алгоритмах используется пять — семь гар- моник. Возможности использования при построении алгоритмов вы- бора отношений конечных классов с большими Z, г, р сужаются ограничениями на число шагов алгоритмов аппроксимации. 51
Хотя отношения из г, р) с большими Z, г, р очень точно при- ближают истинное отношение, за это приходится платить боль- шим числом вопросов к ЛПР о результатах выборов из пар. А ведь именно по этим ответам определяется аппроксимирующее отно- шение. Чем шире класс отношений, из которых надо выбрать аппрок- симирующее, тем больше число шагов алгоритмов аппроксимации. Приведем ряд примеров, иллюстрирующих это общее положение. Рассмотрим первоначально задачу выделения произвольного отношения в пространстве критериев Rn. Оно задается как под- множество в декартовом квадрате Л CZ Rn X Rn, имеющем раз- мерность 2п. Если мы знаем, что отношение Л надо искать в классе разност- ных, т. е. если Л е= то оно определяется подмножеством S (Л) уже n-мерного пространства Rn, что очевидным образом уменьшает сложности, связанные с его восстановлением. Если удалось установить принадлежность Л классу линейных -отношений то Л восстанавливается по подмножеству 8(Л) П S^1 (п — 1)-мерной сферы. Если Л — порядковое, то оно определяется по конечному множеству S (Л) П /3 (/3 — «троичный куб», т. е. Зп точек в Rn вида (av . . ., aj, at е {—1, 0, 1}) Это отражает общий факт, что действие группы понижает раз- мерность задачи: исходно dim Rn X Rn = 2п. При группа есть Rn и 2n — dimG = 2n — n — n. При группа есть Rn [> R+ (полупрямое произведение сдвигов и растяжений), ее размерность есть п + 1 и 2п — (п + 1) = п — 1. При размерность груп- пы (pl)n (где р1 — группа афинных монотонных преобразований прямой) есть 2п, и задача становится 2п — 2п = 0-мерной, т. е. дискретной. Упражнение. Докажите, что ®з = SBn (Зп — 1, 2n, 1). Важность введенных нами классов отношений заключается в следующем. С одной стороны, необходимость алгоритмизации влечет пот- ребность в конечной записи отношений, что неизбежно приводит к выделению конечных классов отношений. С другой стороны, аппроксимационные теоремы показывают, что классы S3n (Z, г, р) могут служить для аппроксимации произвольных отношений класса 33™ с произвольной точностью, т. е. могут быть выбраны в качестве базы аппроксимации. Основная же причина выбора аппроксимирующих отношений из конечных классов заключа- ется в том, что лишь для конечных классов число шагов алгоритма аппроксимации (число обращений к ЛПР, или, более формально, количество информации в битах, задаваемой ЛПР), необходимое для определения аппроксимирующего отношения, не зависит от мощности исходного множества вариантов. (Это подтверждается, в частности, подсчетом размерности многообразия, подмножество 52
которого определяет отношение.) Так как в задачах многокрите- риальной оптимизации, использующих взаимодействие человек— машина, основным лимитирующим фактором является диалог, а число представляемых к рассмотрению вариантов может быть чрезвычайно велико, то более широкие классы отношений не могут быть выбраны для аппроксимации. При определении классов г, р) рассматривались выпуклые множества, задаваемые пересечениями открытых или замкнутых подпространств. Открытые подпространства соответствовали стро- гим определяющим неравенствам, а замкнутые — нестрогим. Рас- смотрим, в каких случаях это различие существенно. Допустим, что в предъявлении А есть пара вариантов я, у, результат сравне- ния которых изменяется при замене каких-либо строгих нера- венств на нестрогие (или наоборот). Это означает, что вектор у — х лежит на границе замыкания верхнего среза (т. е. на мно- жестве положительной коразмерности). Следовательно, анализ того, насколько устойчива такая ситуация, звисит от структуры множества А — А. Если множество А конечно, или, более общо, имеет размерность 0, то и Л — А имеет размерность 0; следова- тельно, в случае общего положения никакой вектор z А — А не лежит на границе верхнего среза 5(J?). Иными словами, сколь угодно малое возмущение множества может «снять» вектор z — у — х с границы S (J?) и «перевести» ого как внутрь S (Л) (если внутренность S (Л) не пуста), так и на- ружу, в Rn — 5(J?). Значит, в этом случае результат сравнения неустойчив по отношению к малым возмущения и не имеет реаль- ной практической значимости. С другой стороны, если А обладает какой-то симметрией, совокупность малых возмущений Л, со- храняющих эту симметрию, может быть много меньше, чем сово- купность произвольных малых возмущений, и поэтому отноше- ние может быть устойчиво. Если множество А континуально (имеет положительную раз- мерность), то и Л — А имеет не меньшую размерность. Поэтому пересечения А — А с границей верхнего среза S (J?) имеют устой- чивый характер и сохраняются при малых возмущениях множе- ства А. Отметим, что так как отношение при аппроксимации выби- рается из счетного числа конечных классов, то все предыдущие рассуждения можно снабдить квантором общности по ЕЕ ЕЕ (Z, Л р), например, если А конечно, то в случае общего поло- жения ни для какого Я ЕЕ ЗВп (I, г, р) вектор у —- х (х, у ЕЕ Л) не лежит на границе множества S {Л). (Все эти рассуждения име- ют мотивировочный, а не доказательный характер, поэтому не определяются точно понятия общего положения и малого возму- щения.) Итак, различение строгих и нестрогих неравенств при описании Sdn (Z, г, р) существенно лишь тогда, когда нельзя пренебрегать возможностью попадания вектора у — х на границу множества S (ЗП). В случае, когда это различение не нужно, традиционно 53
используют строгие неравенства. Соответствующий подкласс отношений, задаваемых строгими неравенствами, обозначается 33п& (I, г, р), и отношения этого подкласса называются отношения- ми в строгих шкалах. Под 33п^ (I, г, р) понимается запись «класс Ж (Z, г, р) или класс SA (Z, г, /?)». Упражнение. Докажите оценки числа отношений в клас- сах: („п+1 \ 1г (2) card ®gn) = 23”, (3) card = 22”. Можно ли улучшить оценку (1)? 3.2. Порядковые отношения. Булева запись Класс ЗЗз^ выделяется из семейства 33п (I, г, р) как основной при машинной реализации алгоритмов аппроксимации. Это опреде- ляется по меньшей мере тремя причинами. Первая: Для определения результата сравнения необходима лишь информация о порядке оценок варианта по шкалам. Эта информация достаточно груба, так что ЛПР, сообщая результат сравнения, делает ошибку с меньшей вероятностью, чем при коли- чественных оценках критериев. Такое свойство отношений из ЗЗз^ обусловливается инвариантностью его элементов относи- тельно группы монотонных замен по шкалам. Вторая: Аппроксимация порядковыми отношениями, как пока- зывает опыт, уже достаточно трудоемка. Поэтому повышение точности аппроксимации путем расширения класса практически нереализуемо. Третья: Класс ЗЗз^ содержит многие из известных бинарных отношений, использующихся в алгоритмах выбора: отношение Парето, лексикографическое, мажоритарное и др. Конечность класса 33п (I, г, р) может быть использована для вве- дения формального языка описания бинарных отношений этого класса. Однако это становится реально возможным лишь для класса порядковых отношений Л GE формальный язык опи- сания которого прост и нагляден. Напомним определение порядковых отношений на языке верхних срезов: ЗЗз = Р? е 33™ : S (Л) — набор квадрантов}, где под квад- рантом понимается множество, задаваемое системой п неравенств и уравнений, левые части которых — координаты; например, {^1 А 0, х2 > 0, х3 <d 0, гг4 = 0} — квадрант в R4. При этом имеет значение, в каких шкалах задано отношение — в строгих или нестрогих. 54
Использование строгих шкал допустимо, когда попаданием вектора у — х (х, у, ЕЕ Л) на границу (J?) можно пренебречь. Это равносильно тому, что можно пренебречь совпадением оценок разных вариантов по какой-либо шкале, так как 5(^), а следо- вательно, и его граница состоят из квадрантов. Для задания верхнего среза S (J?) порядкового отношения бу- дем использовать язык булевской логики. Сначала сделаем пред- положение, что Л ЕЕ ЗЗзХ т. е. шкалы строгие. Квадрант, задаваемый неравенствами Д 0, где = п а. = — 1 \/1» г = 1, . . . , п, кодируется мономом Д и/, где Uj — булевская переменная, а = 1 или —1 обозначает соответствен- но отсутствие или наличие отрицания. Объединяя все к(к^2п) Рис. 3.2. Булевский язык описания порядковых отношений « — р<я (u) = uiu2; б — р&г (и) = utu2 + щй2 4- щГс2 квадрантов верхнего среза 5(J#), получаем полином порядкового отношения J?: Р& W = V А г ==1 j=i Этот полином обладает свойством хЯу О ZMsgn^j — Жх), . . sgn(yn — xn)) = 1 по определению Р^(и). Это означает, что при описанной кодировке отношения потери информации не происходит, т. е. по восста- навливается Л. Упражнение. Покажите, что если существует булевский полином Р, такой что выполняется указанное свойство, то отно- шение Л — порядковое в строгих шкалах. Для удобства восприятия знак конъюнкции иногда будем опускать, а вместо знака дизъюнкции — писать «плюс». Некото- рые примеры полиномов для отношений Л ЕЕ приведены на рис. 3.2. В дальнейшем будем пользоваться операцией приведения. Если полином Pji представим в виде Р^ (и) = UjP V вместо записи Р будем писать Р и называть это операцией приведения 55
по переменной Uj. Если Р приведен по всем переменным, то полу- ченный полином называется приведенным. Так, если P&(u) = U1U2U3 + и1и2и3, то этот полином можно привести по переменной и3: Р& (^) = ^1^2* А полином Р#г (и) — + и1и2й3 + u1il2u3 + ^1й2й3 может быть приведен по переменным и2 и и3 к виду Р^ (и) = иг. В случае отношений в строгих шкалах подобная операция не может привести к потере информации о квадрантах верхнего сре- за 5(3?). Однако для отношений в нестрогих шкалах такая запись не- достаточна: нужно вводить уже троичную логику. Мы обойдем эту трудность, введя для нестрогих шкал «многоэтажную» бу- левскую запись. Введем векторный булевский полином, в i-й компоненте этого вектора выписываются квадранты, лежащие в координатах под- пространствах размерности I. Под координатным подпространст- вом здесь и далее понимается линейное подпространство Rn, задаваемое системой уравнений вида = 0, . . ., xi]z = 0}. При этом будем полагать, что ц<\ • • <С Такую координатную пло- скость будем обозначать где 1к = (Z19 . . ., ik). Заметим теперь, что имеется еще одна трудность при записи полинома в нестрогих шкалах. Если, например, во второй компо- ненте полинома Рл отношения 3? ЕЕ 3?f присутствует моном и2г то он может обозначать как множество {xt = 0, х2 0}, так и множество {х2 > 0, х3 = 0}. Для того чтобы такая неоднознач- ность не возникала, в каждой компоненте будем последовательно выписывать квадранты, лежащие в координатных плоскостях, упорядоченных лексикографически. Общая схема записи полинома в нестрогих шкалах имеет сле- дующий вид: Рл (и) = Go) Gi), •• •,(*„) (^1, 2)’ • • • ’ (^1-1, п) компонента п, компонента п — 1, компонента п — 2, Gi,...,n-i), • • •» компонента 1. Запись (Zo) в тг-й компоненте означает, что здесь описываются квадранты, лежащие в координатной плоскости максимальной размерности, т. е. телесные квадранты размерности п. Запись 1} в (п — 1)-й компоненте означает, что здесь описы- ваются квадранты, у которых z-я координата, и только она, равна нулю. 56
В общем случае запись Zfl.. означает, что здесь описываются квадранты, у которых нулю равны координаты с номерами^,.. .,fk, т. е. квадранты, лежащие в координатной плоскости Z/r Эта за- пись находится, очевидно, в (п — /с)-й компоненте. Приведем при- меры записи отношений в строгих и нестрогих шкалах. 1. Отношение Парето Рагп 4. В случае строгих шкал полином паретовского отношения представляет собой моном PParn(U) = A ui- В случае нестрогих шкал векторный полином выглядит так: -Рраг" («) = UX . . . ип (п), и2 . . . ип, . . . , иг . . . Un-1 А — 1), и3 . . . ип, . . . , Uj . . . Un—2 (п — 2), • • • • • • Un, . . . Ux (1). Так, запись . ип находится, очевидно, в (п — 2)-й компоненте и обозначает квадрант, лежащий в координатной пло- скости Z2>3. Иногда при записи полиномов в нестрогих шкалах для удобст- ва компоненты вектора будем отделять друг от друга знаком |. Так, для Par3: Ррат3 (Ц) = j ^2^3’ ^1^3» *^1^2 | ^2» ^1* Go) (^1) (^2) (*3) G1,2) (^1,з) (^2,з) Координатные плоскости, содержащие указанные квадранты,; приведены на рис. 3.3. 2. Лексикографическое отношение Если сравнение вариантов производится в строгих шкалах, то Р'с#п (и) ~ так как лексикографическое отношение при этом полностью опре- деляется первой координатой. В случае нестрогих шкал коорди- натной плоскости соответствует моном где /* = min/; I = (1, . . . ,п). Так, отношение Ж4 (= В3 представимо полиномом ^1 1 ^2* ^1» ^1» I ^3» ^2» ^1» ^1» I ^4, ^3* ^2> 1* Верхний срез лексикографического отношения в пространст- ве R3 приведен на рис. 3.4. 4 Определение отношений из примеров 1—3 приведены в 2.1. 57
Рис. 3.3. Верхний срез отношения Парето в R3 Рис. 3.4. Верхний срез лексикографического отношения в R3 Рис. 3.5. Верхний срез мажоритарного отношения в R3 3. Мажоритарное отношение JLn. Для мажори- тарного отношения в строгих шкалах булев полином имеет вид РМФ) = V Л *44 геГа j=l где Ig = {i • S 0} . К=1 Для нестрогих шкал координатной плоскости 11к соответствует запись Л Ч», где К — множество индексов таких, что Например, в координатной плоскости Z(1>3) пространства’ R5 квад- ранты верхнего среза отношения JZ5 описываются так: На рис. 3.5 приведен верхний срез мажоритарного отношения в не- строгих шкалах, полиномиальная запись которого имеет вид ZZ2ZZg, I ^3, ^2? 1* Замечание. При полиномиальной записи порядкового отношения в нестрогих шкалах число компонент записи полинома соответствует в общем случае размерности пространства Rn. 58
Легко, однако, понять, что не обязательно все компоненты поли- нома должны быть заполнены. Так, существует разновидность мажоритарного отношения, ко- торое определяется следующим образом: xJLny^myx^>^ {у предпочтительнее я, если превосходит его более чем по поло- вине критериев). Упражнение. Докажите, что в случае строгих шкал JLn = JLn, а в случае нестрогих шкал JLn CZ JLn. Координатной плоскости в полиноме Рмп (и) соответствует запись V . А 4°. г&К где К — множество таких индексов Z, что S (%- + !)>«• Очевидно, что координатная плоскость не содержит ни одного квадранта верхнего среза отношения Jln. Действительно, в этом случае у, Aij + 1) < [-J-] max (oru +1)0, 1 т. е. множество К пусто. Таким образом, заполненными оказы- ваются только [п/2] «верхних» компонент полинома Р^п. Итак, нами описан язык булевских (векторных) полиномов, позволяющий описывать произвольные отношения класса ЗЗз^- Приведем теоремы, позволяющие записать критерии транзитив- ности и ацикличности, описанные выше, на языке булевских век- торных полиномов, для порядковых отношений. 3.3. Критерии транзитивности и ацикличности для порядковых отношений Когда отношение, аппроксимирующее структуру предпочтений ЛПР, построено, прежде чем будет произведен выбор по этому отношению, может возникнуть естественный вопрос: каковы его свойства. Свойств бинарных отношений существует множество, однако важнейшими, действительно используемыми в алгоритмах выбора, являются два — транзитивность и ацикличность. Транзитивность многими ЛПР часто выдвигается необходимым свойством отношения предпочтения. Однако тот же ЛПР может, выдавая необходимую информацию, допустить своего рода непо- следовательность, в результате чего построенное с его помощью 59
отношение окажется нетранзитивным. В этот момент особенно важным может оказаться умение выявить этот факт, поставить в известность ЛПР и указать причину нетранзитивности. Столь же важным является свойство ацикличности. Ациклич- ность бинарного отношения, как известно, гарантирует непустоту выбора по этому отношению (например, для конечных множеств). Нарушение этого свойства может привести к тому, что из исход- ного множества вариантов ни один не будет выбран, что, разуме- ется, неприемлемо в практических задачах. Тем не менее цикличе- ские отношения предпочтения в ряде случаев находят применение (например, мажоритарное отношение используется очень часто). В связи с этим возникает вопрос: насколько мы гарантированы от пустого выбора по циклическому отношению? Очевидно, это за- висит от минимальной длины цикла этого отношения (т. е. мини- мального числа вариантов гг1, . . ., таких, что х2 предпочтитель- нее я4, х3 предпочтительнее х2, . . ., хк предпочтительнее хк~Ч но х* предпочтительнее хк), а именно: чем меньше минимальная длина цикла, тем скорее выбор окажется пустым. Введение для порядковых бинарных булевой записи (см. разд. 3.2) позволяет переформулировать выведенные в гл. 2 кри- терии транзитивности и ацикличности, что дает возможность алго- ритмически устанавливать эти свойства. Сначала докажем соответствующие теоремы для случая стро- гих шкал J? Gz В^. При доказательстве критерия транзитивности будем полагать полином (и) приведенным, т. е. непредставимым в виде Ря = UjQ = 1, . . тг), где полином Q не содержит переменной Uj. Для доказательства критерия транзитивности введем опреде- ление цилиндра как подмножества евклидова пространства. Пусть q = {х.+ Ъ>0, . . . х.+ 0, х._ <" 0, . . ., х._ <С 0} — квадрант, lj = {xiA = 0, . . -,Xi = 0} — координатная плоскость, где I+ = {it, . . Г = {£, . . ix-}. Тогда цилиндром cf+y- называется прямое произведение C/+I- = qi+i- X Lj (при этом, разумеется, предполагается, что по- парные пересечения /+, Г, J пусты, a I+ U Г U J = I)- На рис. 3.6 приведены примеры квадранта и цилиндра в R3. В приведенном полиноме Р<% (и) цилиндру <?+/-, очевидно, соот- ветствует моном и.+ . . . и. + й._ . . . . Ч гк+ Ч гк~ Теорема 3.4. Пусть ЕЕ и Р^(и) — его приведенный поли- ном. Тогда — транзитивно О Р& (и) — моном (т. е. транзитивны те и только те порядковые отношения в стро- гих шкалах, которые сводятся к паретовскому отношению некото- рой меньшей или равной размерности, быть может, с заменой знака некоторых переменных). 60
Рис. 3.6. Квадрант и цилиндр в R3 * (3) а — квадрант ^(23)Ц); б — цилиндр с(2)(1) Рис. 3.7. Свойства порядковых отно- шений а — = и2; б — == гц 4- и2щ Доказательство. Достаточность очевидна, так как паретовское отношение любой размерности транзитивно. Для доказательства необходимости предположим, что верхний срез S (J?) определяется квадрантами дт+т-, . . ди _. Тогда поло- 21/1 жительная оболочка ^(5(3/?)) представляет собой цилиндр cj+I~, где* Г = {i: ЯЛ : i е It /\ Як :i е /Д, I = {i • Я/с I i Я/с I i (ЕЕ J = {i:ttk:i^lt/\nk:i^lb}. Согласно теореме 2.4, Я (= ®2 (а значит, и ®з) транзитивно тог- да и только тогда, когда S (J?) выпукло. Критерием выпуклости множества S является равенство (S) = S (см. утверждение 2.3). В нашем случае это имеет место только тогда, когда S — ци- линдр, приведенный полином которого, как было показано выше, является мономом. Теорема доказана. На рис. 3.7 приведены примеры, иллюстрирующие критерий транзитивности порядковых отношений в R2. Верхний срез мажоритарного отношения Jf1 (см. рис. 3.5) не является цилиндром при п 3 (при п <Z 3 JLn = Parn), поэтому Мп нетранзитивно. 61
Верхний срез лексикографического отношения Хп (см. рис. 3.4) представляет собой цилиндр 42””’п), поэтому Хп транзитивно. Перейдем к доказательству критерия ацикличности и опреде- лению минимальной длины цикла порядкового отношения в стро- гих шкалах. Верна следующая Теорема 3.5. Пусть Я ЕЕ $3™s- Тогда Л имеет минимальный цикл длины ттг, где т — минимальное число мономов в таком полиноме Р, что а) Ря = Р + Q, где Q — некоторый булевский полином; б) в полиноме m п о t е Р — \/ /\ j ^7*1» 7*2 • j=l г=1 Доказательство. Действительно, пусть условия а) и б) теоремы выполнены. Докажем, что существует цикл длины тп, т т. е. найдутся такие я1, . . ., хт ЕЕ 5(R), что^^г — 0. 1 Обозначим 7V/ число мономов полинома Р, в которых аг;- 0 (г = 1, . . ., т). Соответственно определим величину NJ. Очевид- но, что А/ + N] = т (для любого у). Заметим теперь, что если х ЕЕ S (J?), то (Л^, . . ., кпхп ЕЕ S (Л)^ где kf 0 (Z = 1, . . ., п). Рассмотрим векторы х1, . . ., хт, такие, что VZ>J- х} = Gij. Оче- видно, хг ЕЕ S (J?) (£ = 1, . . ., т). Теперь рассмотрим векторы у1, . . .,ут, такие, что . —TVj, если = N], если £j>0. Понятно, что VZ уг ЕЕ S (Л) в силу сделанного замечания. т Но в векторе % = ^уг каждая координата равна (А/А; — 1 т — N]Nj) = 0, т. е. %уг == 0, следовательно, цикл длины тп су- 1 ществует. Покажем, что не существует цикла длины, меньшей т. Из ус- ловия б) теоремы следует, что для любого набора к мономов из Р^(к < т) найдется у0, такое, что все имеют один знак. А это начит, что гиперплоскость 1£ = {xjo = 0} является строго опор- ной для Sp?), и, согласно утверждению 2.2, отношение, опреде- ляемое полиномом Р^ц, ациклично. Теорема доказана. Упражнение. Покажите, что условие б) доказанной теоремы эквивалентно тому, что для отношения описываемого полиномом Р, S (R) тупое. Следствие. Пусть Тогда — ациклично в том и только в том случае, когда в полиноме Р^ существует у0, такое, 62
что для Vin Z2 оМо = aWo (т. e. когда функция GijUjo изотонна и гиперплоскость lio опорна для S (J?). Это означает, что опорные гиперплоскости для порядковых отношений в строгих шкалах можно искать лишь среди координатных. Проиллюстрируем доказанную теорему в следующих примерах. Пример 1. Булев полином мажоритарного отношения имеет вид Pj^(u) ~ + ^^2^3^ +^^2^3^. Каждая переменная в полиноме встречается как с отрицанием, так и без него. Поэтому, согласно следствию из теоремы 3.5, отношение имеет цикл. Заметим теперь, что каждая переменная входит с отрицанием ровно в один моном, поэтому после отбрасывания любого монома новое отношение перестает быть цикличным. Таким образом, ми- нимальная длина цикла отношения J/lS равна 4. Упражнение. Доказать, что минимальная длина цикла отношения Лп равна оо (при 1 п 2); 3 (при п = 3, п 5); 4 (при п = 4). Пример 2.. Рассмотрим порядковое отношение Я ЕЕ задаваемое следующим полиномом: Ря(и) = и1и2и3и4 + + йги2й3и^ + и1и2и3И^ + + йги2й3и^ + Очевидно, Я имеет цикл длины 6, так как все переменные встре- чаются как с отрицанием, так и без него. Однако минимальная длина цикла равна 3, потому что порядковое отношение Я, за- даваемое полиномом Р- (и) = uru2u3u^ + й1и2й3и4 + ^2и3й4, циклично (и при этом Я ЕЕ Я}, а ни для каких двух полиномов из P# условия а) и б) теоремы 3.5 не выполнены. Условия транзитивности и ацикличности, полученные для по- рядковых отношений в строгих шкалах, могут быть распростране- ны на общий случай Я ЕЕ 533. Имеет место следующая Теорема 3.6. Отношение Я ЕЕ 5Э3 транзитивно тогда и только тогда, когда: а) каждой координатной плоскости в записи полинома Р^ соответствует не более одного монома; б) цилиндры младшей размерности принадлежат замыканиям цилиндров старшей размерности (т. е. на языке булевских поли- номов моном, соответствующий координатной плоскости Zjx, делится на моном, соответствующий координатной плоскости Zj2, если* Zjx ZD Zj2 (или cz J2)). 63
4 Рис. 3.8. Нетранзитивное %: = = Щй2 I и2, Доказательство оче- видно. Условия а) и б) равно- сильны выпуклости верхнего среза S (Я), что, согласно теореме 3.5, является необходимым и достаточ- ным условием транзитивности Л. Приведем примеры, иллюстри- рующие условия транзитивности. Пример 1. Отношение Па- рето. Полином его, как было показано ранее, имеет вид PPar (и) = иги2 . . . ип (компонента п), и2 . . . ип, . . ., иг . . . (компонента п — 7), ип, . . ., иг (компо- нента 1). Условие а), очевидно, выполнено. Заметим, что координат- ной плоскости ljx соответствует моном Д Uj. Пусть Д CZ Д. Тогда моном Д д содержит все переменные предыдущего монома, т. е. делится на него. Условие б) также выполнено. Отсюда следует транзитивность Par™. Пример 2. Лексикографическое отношение. Ранее было показано, что в записи полинома Р^п координатной плоскости ljt соответствует моном где Д — min /. Поскольку для любой г\/г координатной плоскости Zj2, такой, что Д CZ Д, 71 ЕЕ Д, имеет место равенство min / — min /, то ей соответствует тот же самый 1\J2 моном Ujt, что и lje Таким образом, оба условия а) и б) выполне- ны, т. е. Хп транзитивно. Пример 3. Рассмотрим порядковое отношение Я ЕЕ 53^ для которого выполнено условие а), но не выполнено условие б) (рис. 3.8). Полином его имеет вид Р^ (и} — ДД | и2,их. Хотя каждой координатной плоскости соответствует не более одного монома, цилиндры младшей размерности не принадлежат замыканию цилиндров старшей размерности. Поэтому отношение Я не является транзитивным. Действительно, пусть х = (1,1), у = (1, 2), z = (2, 2). Тогда хЯу, уЯя, но хЯъ. Теперь докажем критерий ацикличности для порядковых от- ношений Я ЕЕ • Теорема 3.7. Пусть Я ЕЕ Тогда Я имеет цикл длины т, где т — минимальное число мономов в полиноме Р, таком, что а) Р < Р&,} б) для любого / переменная д либо отсутствует в полиноме Р, п о. п либо найдутся два монома /\щ1 и /\uGi (быть может, находящиеся 1 1 г в разных компонентах векторного полинома Р), что сгг сг|. 64
Покажем, что если выполнены условия а) и б), то существуют т векторов, принадлежащих верхнему срезу S {Л) и в сумме даю- щих 0. Рассмотрим вектора я1, . . ., з:тЕВп, такие, что Vi = 7, . . ., т: 1, если в z-м мономе полинома Р бц = 1; — 1, если в i-м мономе полинома Р <5ц — — 1; 0, если в z-м мономе полинома Р переменная Uj отсутствует. Понятно, что Vi х*^8(Л). Обозначим (как и при доказатель- стве теоремы 3.5) (соответственно N]) число мономов полинома Р, в которых 6ij 0 (соответственно ог-7- < 0). Рассмотрим теперь вектора г/1, . . ., z/m, такие, что Уз = Л7|, если ^<^0; 0, если х] — 0; — Nу, если х} - 0; >0. По построению, г/1, ..., у™ ЕЕ S (J?) и^(/ 0- Таким образом, существует цикл длины т. Минимальность этого цикла следует из невыполнения условия б) теоремы для полинома, содержащего менее тп мономов: существования строго опорной гиперплоскости для верхнего среза S (Л) достаточно для ацикличности Я. Теорема доказана. Следствие. Пусть Л ЕЕ 33^. Тогда Л ациклично в том и только в том случае, когда существует такое обобщенное лекси- кографическое отношение Хв(к rij, что Л СЕ Xq. Обобщенное лексикографическое отношение Х\ было определено в разд. п. 2.2. Последовательность (фх, . . ., срп) изотопных функций в этом слу- чае имеет вид ср^ = гДе (Л» • • -,/п) —- перестановка индек- сов (1, . . rij, t — 1, . . ., п. Действительно, согласно теореме 3.5, найдется переменная Ujx полинома Р^, которая присутствует в некоторых мономах Р& везде либо с отрицанием, либо без него. Без ограничения общности будем здесь и далее полагать, что — без отрицания: = 1. Тогда верно следующее: Уж, !/еВп ^;<г/л=Фж^г/. Обозначим Pjt(u) — полином, содержащий те и только те мономы, в которые не входит переменная u7l. Применив к этому моному результат теоремы 3.5, придем к необходимости существования переменной и7-2, входящей в некоторые мономы Р^ (и) только без отрицания. Тогда Vx,y ЕЕ Rn: хл < Ул V (хл = Узе хл < Уг,) Х-Яу. 65
Продолжая так далее, получим последовательность координат 71? . . ., 7К, такую, что Nx, у Rn: (Я/: — у^ • • ~ Уч-^ xii yij) хЯу А это означает, что для лексикографического отношения имеет место следствие Vrr, у G Rn хЯу => х^вУч т. е. Я CZ Не- формально ацикличность Я ЕЕ 333 можно записать как суще- ствование такой перестановки (^. . . гп) чисел (1 . . . м), что в Р& I П1 1 а1 для любого полинома Р (ц) = \/ Д и кц 1-Й компоненты ¥7^, /2 j==i i=i i i Рассмотрим некоторые примеры, иллюстрирующие доказан- ную теорему. Пример 1. Отношение Парето. В пространстве R3: Ррагз(^) = UrU2U3 | U2U3, Щи3, UrU2 | U3, U2, ZZj. Легко видеть, что Par3 CZ Hg, где <р$ = х^ (7’17’2/3) — любая пере- становка чисел (1, 2, 3). В случае Rn это также верно для любой перестановки чисел (1 . . . п). Пример 2. Пусть порядковое отношение Z? ЕЕ задается полиномом Ря (и) = ихи2и3 + й1и2и3 + и1й2и3 I ^2^3’ ^U3, UjU2 I ^35 ^2> ^1* Переменная и3 — единственная, которая входит без отрица- ния в полином Р^. Полином Р, полученный из Р& выбрасыванием переменной и3, имеет вид Р = 0| щи2 | u2, zzr Здесь обе перемен- ные встречаются только без отрицания, поэтому Я CZ Хв, где Ф1 = ^3, Ф2 Х1' Фз = Х2'> ИЛИ Ф1 = Х^ Ф2 = Х2, Фз = Х1- Пример 3. Мажоритарное отношение. В трехмерном про- странстве Р<М,'Л (^) — U]U2U3 + ZZ'iZZ2lZ'3 —|— U-^U2U3 | ^’2^’3’ ^i^S’ W’iW'2 I ^3? ^2» W'l• Здесь каждая переменная присутствует в записи полинома как с отрицанием, так и без него. Поэтому соответствующее отношение циклично. Полином Р = и1и2й3 + и1й2и3 + и1и2и3 удовлетворяет условиям а) и б) теоремы 3.5, значит, минимальный цикл имеет длину 3. 66
Рис. 3.9. Ацикличность а — (pt = ха, (р2 = хх; б = = xt, (р2 = ~xt Примеры ациклических отно- шений в ®з и соответствующих им обобщенных лексикографических отношений приведены на рис. 3.9. В гл. 1 мы ввели понятие ма- жоранты и миноранты бинарного отношения — транзитивных отно- шений, выделяемых каноничес- ким способом и аппроксимирую- щих изнутри исходное отношение. Конечность класса порядко- вых отношений дает нам возмож- ность алгоритмизировать процесс выделения его мажоранты (сов- падающей в данном случае с минорантой, так как ЗВз CZ ®Г). Особенно нагляден случай строгих шкал. Итак, пусть Л е 53^, Р^ (w) = \/ Д ufa. Для любых двух мо- номов и° = Д u^J и и?' = Д назовем промежуточными все МОНОМЫ Д Uiij, ДЛЯ которых О'/ = ИЛИ = О'/. Утверждение 3.8. Моном и° = Д ufv’ входит в Р^моп (^) тогда г и только тогда, когда для любого монома и°' = Д входящего в Р&, все мономы, промежуточные для и° и и0', входят в Р^. Доказательство. Назовем сигнатурой вектора х G= Rn вектор а, такой, что Vi = 1, . . ., п: (У г = 1, если ^^>0; 0, если xt = 0; — 1, если <^0. Пусть векторы х и у не имеют ни совпадающих, ни нулевых коор- динат. Пусть а и о' — сигнатуры соответственно х и у.Очевидно, что тогда сигнатура вектора х + у — промежуточная для а и о'. Отсюда вытекает, что хЕ$ (J?Mo11), когда вместе с и° и в Р& входят все промежуточные мономы. Покажем, что для данных сигнатур а и а' можно всегда подоб- рать такие векторы х и у указанных сигнатур, что сигнатура век- тора х + у примет произвольное промежуточное для о и а' зна- чение. Пусть а" — промежуточная сигнатура. Подберем такие х и у, что для каждого i | xt | = 2 | yt |, если а/ = и 2 | | = yt, если о/ — сД Ясно, что о" — сигнатура суммы х + у. Это завершает доказательство утверждения. 67
Упражнение. Где в доказательстве использовалось пред- положение о строгих шкалах? Таким образом, принадлежность полиному мажоранты монома устанавливается проверкой принадлежности некоторого числа мономов полиному Р<%- Выделение мажоранты порядкового отношения в нестрогих шкалах также допускает алгоритмизацию. Однако из-за потери наглядности мы не приводим здесь результатов, хотя идея оста- ется такой же, как и для случая строгих шкал. Введенный в этой главе булевский язык можно использовать еще для одной цели. В гл. 2 мы определили упорядочение крите- риев по важности и заметили, что в классе отношение (не меньшей важности) транзитивно и рефлексивно. Здесь этот факт будет доказан с использованием булевского языка. Утверждение 3.9. В классе отношение транзитивно и рефлексивно. * Доказательство. Переведем сначала на булевский язык определение отношения z±. Нетрудно видеть, что квадранты, пересекающиеся с гиперплоскостью xt = переходят в себя при симметрии относительно нее. Квадранты, у которых xt > соответствуют членам полинома Р^, содержащим UjUj. Положив Ui = 1, Uj = 0, мы выделим ровно эти квадранты. Поэтому усло- вие упорядочения критериев записывается на булевском языке так: = 1, Uj = 0)> Р^Щ = 0, Uj=l). df Здесь Р^ — полином отношения J?, знак > соответствует стан- дартному порядку на полиномах: Р(и) Q(u) Vu0 Р(и0) Q(u0). Теперь легко доказать транзитивность Действительно, пусть i /, / к. Тогда для Uj = 1: Р^ (ui = 0, Uj = 1, и^ = 1) Р^ (и{ = 1, Uj = 0, и* = 1) > > Р^ (щ = 1, Uj = 1, щ = 0), а для Uj = 0: PJ? = 0, Uj = 0, и}. = 1) Д Р^ = O,Uj — 1, и^ = 0) > Д Р^ (ui — 1, Uj ~ 0, zzR = 0), т. е. i к. Рефлексивность отношения следует непосредственно из определения. Теперь легко доказать, что отношение есть эквивалентность (£<->/, / к) =^> (Z j =* к Д к z± ] ==> i) =т> (i к /\к i) (i к и что отношение —> есть строгий по- рядок: I —> /, j —> &==> i zz± к. Если было бы верно к ==> j, то по транзитивности получили бы к=± j, но это противоречит опре- делению —>.
Асимптотические свойства функций выбора 4.1. Выбор из случайных множеств В гл. 1 нами был рассмотрен ряд свойств функций выбора, имею* щий содержательный смысл: различные комбинации этих свойств обусловливают тот или иной способ порождения'выбора. В част- ности, было показано, что выполнение свойств Н (наследования) и С (согласованности) эквивалентно графодоминантности функ- ции выбора. Ослабить эти условия нельзя, однако можно попро- бовать ввести в рассмотрение дополнительную структуру, учиты- вающую механизм предъявлений, и выяснить, не дает ли это воз- можности пользоваться выгодами графодоминантности в более широких случаях. То, что конструкция предъявления множеств имеет важней- шее значение при определении функций выбора, мы отмечали в гл. 1. Здесь мы, не пытаясь описать механизмы предъявлений вообще, постараемся выделить те механизмы, которые харак- терны именно для многокритериальной оптимизации. Исходное множество вариантов (всех мыслимых) обычно очень велико (как правило, описывается некоторым континуальным подмножеством пространства критериев). Однако ЛПР часто стал- кивается с необходимостью выбирать из конечного числа альтер- натив (хотя это конечное число, как правило, большое). Значит, механизм формирования предъявлений должен порождать конеч- ные подмножества исходного множества вариантов. Далее, до начала решения задачи предъявляемое для анализа множество неизвестно ЛПР (хотя обычно ясно, в какой области лежат пред- лагаемые варианты, и при условии достаточной опытности специа- листа, осуществляющего выбор, даже ясно, в какой части исход- ного множества варианты будут встречаться гуще, в какой — ре- же). Таким образом, мы естественно приходим к тому, чтобы счи- тать конечное подмножество-предъявление X CZ А случайным» Обозначим через N случайное число — количество предъявляе- мых вариантов (N = | X | ). Как же порождается X? Здесь мы сделаем предположение: А есть вероятностное пространство, а X есть повторная независимая выборка из А объема N. (Попросту говоря, сначала природа выкидывает число N — мощность вы- борки, а затем, «зажмурив глаза», бросает N точек в А. Список точек из Л, в которые попала природа, и есть выборка). Конечно, можно усомниться в правомочности такого предположения. Одна- ко это есть стандартный способ моделирования случайности. 69
Более того, здесь мы принимаем это предположение лишь для простоты рассуждений, а на самом деле все результаты верны при значительно более слабом условии: числа вариантов выборки в непересекающихся областях Вг, В2 Q A (B± р| В2 — 0), IXJ = == | X Р| Вг | и |Х2 I = 1-Х" П «почти независимы» при боль- ших N. Здесь мы не будем развивать эту тему. Как же взаимодействуют человек и природа и какие дополни- тельные сведения удается получить в результате учета такого взаимодействия? Коль скоро не все предъявления равноправны, нам следует сосредоточить внимание на поведении ЛПР, на наи- более вероятных предъявлениях, игнорируя его возможный вы- бор в невозможных ситуациях. Иными словами, в изучении струк- туры предпочтений ЛПР мы должны отождествлять в некотором смысле выборы, различающиеся лишь на маловероятных множе- ствах. (Никто не назовет антагонистами двух жителей Москвы, сходных во взглядах на русскую кухню, но решительно не соглас- ных друг с другом по поводу приготовления ласточкиных гнезд или жареной саранчи.) Таким образом, мы приходим к необходи- мости введения понятия эквивалентности функций выбора. 4.2. Сравнение принципов оптимальности: асимптотическая эквивалентность функций выбора Нам надо научиться сравнивать две функции выбора (\ и С2. Естественно, это сравнение должно основываться на сравне- нии случайных множеств Сх(Х) и С2(Х), где X — случайное ко- нечное предъявление. Для этого нам надо уметь сравнивать про- извольные конечные подмножества А. Введем меру различия между конечными подмножествами А: пусть X, Y CZ А, | X |, | Y | < оо. Определение. б(Х, У) = у (ХАУ — симметрическая раз- ность X и Y, т. е. X&Y = (X \ У) U (У \ *))• Функция 6 обладает следующими свойствами: 0) б(Х, У) = б (У, X), 1) 0 < б(Х, У) < 1, 2) б (X, У) = 0 =» X - У, 3) б(Х, У) = 1=>(Х П У) = 0. 4) б(Х, У)=>б (X, X и У), 5) б (Х,лУ) б (X, Z) + б (Z, У) (неравенство треугольника). В проверке нуждается лишь свойство 5, остальные очевидны. Бу- дем использовать для обозначения пересечения множеств мульти- пликатную запись XYZ = Х_(~| У П (Л \Z) (Z —дополнение до). Можно полагать, что XYZ = ф. (Иначе, переходя к множест- вам X' = X \ XYZ (J X", У' = У \ XYZ U У", где X", У"С 70
CZ XFZ, I X" I = I Y" [ - I XYZI, получим, что 6 (X\ Z) - 6 (X, Z), 6 (У', Z) - б (У, Z), б (X', Y') > 6 (X, У), X'K'Z = 0). Далее, «перенося» аналогично элементы X из XYZ, в XYZ, можно, уве- личивая 6 (X, У) и не изменяя 6 (X, Z), 6 (У, Z), прийти к одному из двух случаев: a) XYZ - 0, б) XYZ = ф. Случай a) б (X, У) = 1,. так как ХУ = XYZ J XYZ - 0, К z у 7х \XZ\^\XYZ\ + \YZ\ \XZ\ ±\XZ\ + \XYZ\ + \YZ\ ’ . у \YZ\ + \XYZ\ + \XZ\ iYzl + iYZI + iXYZ\ + IXZI ’ Очевидно, что 6 (X, Z) + 6 (У, Z) > 1 - б (X, У). Случай б) Л / у _ |XZ| + |AyZ| + |XyZ| + |yz| ° ’ ' I XZ I + I XYZ I + I XYZ I + I XYZ I + I YZ | ’ я /у ух__________IXZI + IXYZI [ 9 ' “ I XZ I + I XYZ | + I XYZ I + I XY I ’ я /у 7х _________IXYZ1 + IYZ) v ' |XyZ| + |XrZ| + |XyZ| + |FZ| • Опять-таки неравенство треугольника проверяется очевидно. Итак, б — расстояние на совокупности конечных подмножеств» Функция б достаточно естественна. Интуитивный смысл ее таковз если выбрать наудачу элемент из X, то вероятность того, что он не будет элементом У, мала, если мала б (X, У) (конечно, то же верно и для вытаскивания элемента из У), т. е. б имеет физический смысл максимума вероятностей «ошибок первого и второго рода». Коль скоро б измеряет различие между конечными подмноже- ствами А, то для конечного X и двух функций выбора (\ и С2 6(Cx(X), С2(Х)) служит удобной числовой мерой различия прин- ципов оптимальности, описываемых функциями выбора С± и С2 на предъявлении X. Перейдем теперь к учету механизма порож- дения предъявлений. Мы предположили, что X — случайное ко- нечное подмножество А, Тогда Cr (X) и С2(Х) — два случайных конечных подмножества А и б(С1(Х), С2(Х)) — случайная вели- чина. Вероятностные характеристики этой величины и описывают степень сходства или различия Сг и С2 при данном механизме фор- мирования предъявления X. Действительно, если б (С± (X), С2 (X)) с большой вероятностью мало, то, «как правило», С± и С2 при дан- ном механизме порождения предъявлений выбирают «почти одно и то же», а сильные расхождения в выборах маловероятны. На- помним, что описанная ситуация имеет в теории вероятностей свое название: б мала по вероятности, иными словами, Р (б (Cr (X), С2(Х)) > ег) в2, 81? еа — малы. (JP— вероятность события, опи- сываемого в скобках.) 71
Нас будут интересовать асимптотические задачи, в которых | Х| = N велико. Как уже говорилось, мы будем считать X повторной незави- симой выборкой объема N. Обозначим соответствующую случай- ную величину через 8N = 6(С1(Х), С2(Х)). Определение. С± асимптотически эквивалентна С2 (обозначе- ние: если 6N сходится по вероятности к нулю (8^ —> 0) р при N —> оо, или Е8м —> 0 (Е — оператор взятия математического ожидания), что равносильно, так как 0 <1 8 1. Смысл этого определения в том, что две функции выбора, с на- шей точки зрения, почти одинаковы, если различающая их слу- чайная величина б становится сколь угодно мала при достаточно больших размерах предъявления, или, что эквивалентно, ее сред- няя величина стремится к нулю. Асимптотическая эквивалентность С± и С2 означает, что замена С\ на С2 влечет сколь угодно малую ошибку на достаточно больших предъявлениях. Отметим, что определение aeq самым существенным образом учитывает механизм порождения предъявлений и замена его мо- жет сделать С\ и С2 не эквивалентными. С точки зрения математической строгости определение не сов- сем корректно, так как ничто, вообще говоря, пока не гаранти- рует измеримости функции 6. Тем не менее ряд вполне естествен- ных предположений, которые мы сделаем ниже, опирающихся на вполне естественные требования согласованности принципов оптимальности на множестве А с дополнительной вероятностной структурой, позволит нам обосновать законность всех рассужде- ний. Далее мы будем рассматривать лишь функции выбора со свой- ством наследования (Н). Это свойство наиболее просто формули- руется и присуще почти всем оптимизационным конструкциям (уменьшение числа вариантов в предъявлении не может привести к объявлению прежде оптимального варианта неоптимальным). Сделаем еще ряд предположений. Как мы знаем, всякая функция выбора со свойством Н есть объединение нескольких графодоми- нантных функций выбора. Мы будем считать их число конечным (трудно себе представить принцип оптимальности, вырабатывае- мый человеком или коллективом людей, учитывающий бесконеч- но много бинарных отношений). Коль скоро на А есть вероятност- ная структура v, то резонно предположить, что верхние срезы би- нарных отношений, определяющих функцию выбора, почти в лю- бой точке измеримы, т. е. можно определить вероятность того, что случайно брошенный вариант доминирует данный. Эта гипотеза также вполне естественна: в контексте многокритериальной опти- мизации вероятностные структуры суть борелевские меры на Rn, а верхние срезы — борелевские множества. Для дальнейшего полезно будет получить явные формулы для вычисления среднего числа вариантов выбираемых функций вы- бора со свойством Н из X — повторной независимой выборки из А объема А. Пусть X = {^, . . ., xN }; X/ (А) = 1, если xt ЕЕ С (X), 72
N и 0 - иначе; Тогда |С (X) | = 2х« (^) и Е | С(Х) | = S£Xi W = = NE'^1(N) = NP(xr ЕЕ С(Х)) = Np(N). (Первое равенство — среднее суммы есть сумма средних, второе следует из независи- мости Х/ от нумерации, третье — расшифровка Xi (-V), четвертое — введение обозначения р (Лг).) В гл. 1 мы показали, что если С (X) удовлетворяет свойству Hf то она представима в виде объединения графодоминантных функ- ций выбора: С(Х)= и СДХ), где Cj(X) — Махд.Х; — бинарное отношение; J — некоторый набор индексов. Далее мы будем предполагать, что все функции выбора со свой- ством Н порождаются конечным числом графодоминантных функ- ций выбора, т. е. что набор J конечен. Это предположение вполне естественно в контексте многокри- териальной оптимизации. Каждую из графодоминантных функций С&. можно интерпретировать как отражение того или иного пред- почтения, «запрятанного» в представлении ЛПР об оптимальности. Странно предполагать, что даже в столь совершенном аппарате^ как человек или экспертная группа, может скрываться более чем конечное число оптимизационных признаков. К этой проблеме можно подойти и с традиционной «теоретико- функциональной» стороны и явно задать условия, при которых функция выбора С порождается конечным числом графодоминант* ных функций. Введем условие vx1? .. хк ее зс П С (Х<) с и с(Х7их{). Непосредственно видно, что S2 есть классическое условие со- гласия, что каждое 2к+1 слабее, чем (из выполнения следует выполнение 2к+1), й что если |Й7| = Z, то функция выбора удовле- творяет условию 2Z+1: среди Хх, . . ., Хг обязательно есть совпадаю- щие множества X-L и Х^ откуда Sz+1 сводится к очевидному вклю- чению В р| С (Х^ CZ С (Х^ (отсюда, в частности, вытекает, что если А конечно, то всякая функция выбора на нем удовлетворяет при к > 21^1 + 1). Обозначим классы функций выбора, удовлетворяющих SR3E через Так как SR+1 слабее, чем то эти классы вложены: CZ ^R+1. Обозначим через $ объединение всех = U 1 (т. е. функция выбора С ЕЕ F, если’п только если С ЕЕ для не- которого к). 73
Теорема 4.1. Класс функций выбора, представимых в виде объе- динения конечности числа графодоминантных функций, совпадает с пересечением классов 31 и (Здесь 3£ — класс функций выбора, удовлетворяющих свойству наследования). Доказательство. Лемма. Если С± ЕЕ С2 ЕЕ то $1 U ^2 €= Проверим это. Пусть Хх, . . ., Хк+Н1 е= <27. Ясно, что р| [fх [J С2 (Хг-)1 есть объединение пересечений следую- i щего вида: р| Са (Xj), где а равно 1 пли 2. Покажем, что каж- дый такой член лежит в |J ((\ (Xt [J Xj) |J C2 (Xt |J Xj)) = = (U G (Xi (J Xj)) и (Ц C2’(Xi и X;)) = Y. Действительно, рассмотрим какой-нибудь член p] Ca (X). Представим его в виде (A G (Xt)) П (П C2(Xi), где huz2 = {1, .. к+ 1-1}. Ясно, что либо [ZJ > к, либо \I21 I. В первом случае в силу Сг ЕЕ имеем n G (X.) с и G (х, и хд с ( и G (Xi и isJi i^=jeTi l^i^j^k+l -1 U Xj)) U (С2 (Xi U Xj)), откуда тем более это верно для Q Са (Xt) CZ П G (Х^. Значит, указанный член входит в У. Во г Ii втором случае аналогичные рассуждения показывают, что опять- таки этот член входит в Y. Поскольку каждое множество входит в У, то входит в него и их объединение, что и требовалось. Из леммы немедленно вытекает, что функции выбора, предста- вимые в виде объединения конечного числа графодоминантных, лежат в П Действительно, графодоминантные лежат в 3£ П $ = 3€ П ^2- Отсюда их объединение лежит в СЕ Об- единение же графодоминантных функций выбора лежит в что и требуется. Покажем теперь, что если С СЕ 3£ П , то С представима в ви- де объединения конечного числа графодоминантных функций вы- бора. Действительно, если С ЕЕ 3t, то она представима, как уже говорилось выше, в виде объединения графодоминантных функ- ций выбора: С = U С#.- Для каждой точки можно породить «бу- г кет» верхних срезов отношений i ЕЕ I- Можно считать, что ни одно из этих множеств не вложено в другое, в противном случае большее можно отбросить. Допустим, что в некоторой точке х таких верхних срезов (^i)x— к. Покажем, что тогда С ЕЕ Действительно, рассмот- рим множества Хг = (А \ (Л?ДХ) U {^}. Тогда х ЕЕ C(Xt) для всех i, но х С (Xj (J ХД, так как в противном случае Xt U X, П А — для некоторого к, или ( $>t f-] что не допускается. Значит, условие не выполнено. Итак, если С ЕЕ то число верхних срезов в каждой точке конечно, т. е. С порождается конечным числом графодоминантных функций выбора. 74
Отсюда по классической формуле включения—исключения по- лучаем |С(Х)| = £|СДХ)|- з |СДХ) ПGWI + • • • з з, к •••±IGWn---nc1J|(X)|. Заметим, что пересечение графодоминантных функций выбора есть графодоминантная функция выбора по объединению соответ- ствующих бинарных отношений (это было упражнение из гл. 1). Итак, мы свели задачу нахождения среднего числа выбирае- мых вариантов для функции со свойством Н к той же задаче, но уже для графодоминантной функции выбора. Пусть Я — измери- мое бинарное отношение. Положим р,д (х) = v (у ЕЕ Ях) — мера верхнего среза отношения Я в точке х. Тогда среднее число не- доминируемых по Я вариантов в выборке X объема N есть 1 Е | Мах^Х | = N J (1 - нл (x))dv (х) О (доказательство — в следующей главе). Для всякого подмножества L CZ J построим бинарное отноше- ние Яь~ U Для Удобства будем писать вместо Тог- да, комбинируя предыдущие формулы, получим 1 Е | С (X) | = N $ (2 (1 - Н ~ S (1 - (*)Р + • • • о jeJ h^32^J • • • + (— 1),J,(1 — Ц; (x))N-r dv (x). Интеграл и есть р (N) — вероятность для данного варианта быть выбранным среди N. Отметим следующий любопытный факт: p(N) не возрастает. Действительно, подынтегральное выражение в последней формуле есть просто вероятность того, что ни один из случайных вариантов х2, . . х^ не попадет в верхний срез неко- торого бинарного отношения в точке хг. Ясно, что эта вероят- ность убывает с ростом N. Рассмотрим один класс функций выбора, довольно часто встре- чающийся на практике, и покажем на его примере, как работает понятие асимптотической эквивалентности. Пусть С — функция выбора, для которой p(N)—» а 0. Оказывается, любая такая функция выбора асимптотически эквивалентна чрезвычайно про- сто устроенной индикаторной функции выбора, описываемой сле- дующим образом: пусть В GZ А — подмножество исходного мно- жества вариантов. Тогда индикаторная функция выбора Св выби- рает в точности элементы предъявления, лежащие в В : СВ(Х) = — X П В. Интерпретация такой функции выбора очевидна: В есть область допустимых по качеству элементов, А \ В — недо- пустимых, и более тонкие различия нас не интересуют. Так вот* если вероятность данного варианта быть выбранным не стремится 75
к нулю, то функция выбора практически может быть рассматри- ваема как задаваемая неким порогом качества. Перейдем к строгому доказательству высказанного утвержде- ния. Пусть С — функция выбора со свойством Н и p(N) —> а > О (напомним, что до конца главы мы считаем все функции выбора со свойством Н порождаемыми конечным числом измеримых бинар- ных отношений). Пусть как и прежде,— мера верхнего сре- за бинарного отношения в точке х. Положим г (х) — == пйпцДх), F (t) = Р (г (х) t) (мы имеем право на введение этих функций в силу измеримости всех встречающихся объектов). Пусть В CZ А есть множество х, для которых г (х) = 0. Л е м м a. v (В) = а. Действительно, p(N) оценивается сверху выражением p(N)< ^i-dv(x)+ $ В А\В 1 <v(B) + |J| $ (l-^-idF(f)=:v(B) + O(l), 0+ 1 1 так как § (1 — t)N~r dF (t) = § (1 — t^-1 d (F (t) — F (0)). Поддиффе- o+ о ренциальное выражение монотонно стремится к нулю при t —> 0 (см. гл. 5), откуда вытекает искомое. С другой стороны, если х ЕЕ В, то с вероятностью 1 х выбира- ется, и, следовательно, p(N) v (В), что и требуется. Утверждение 4.2. С aeq Св. Е\СВ(Х)\ Доказательство. Ясно, что -f,r>r,v\ ।----> 1 ПРИ |Х I Zj I С (А) j —» оо в силу предыдущей леммы. Кроме того, с вероятностью 1Св (X) CZ так что | Св (X) | |С(Х) | почти всюду. Кро- ме того, дисперсия |Св(Х) | есть Na(l — а). Основной оценочный результат из теории вероятности приве- дем в виде леммы. Лемма. Пусть X, Y — случайные величины, такие, что 0 < X < У, - с Тогда Е Х >( V EY 14-ei ’ Е*Х 10 да Y \ 14-61 J ' Действительно, с вероятностью, не меньшей чем 1 — = = 1----|р, X EX (1 — 6). С другой стороны, Е >ЕХ(1 - 6); е/4- | ЕХ(1 — 6))> . Положив 6=7/ е2, получаем искомое. Применяя эту лемму к случайным величинам | Св (X) | и | С(Х) |, |СВ(Х)|| D\CB(X)\ получаем, что Е "Груут.---> 1 при N ос, так как = 76
= —------>0. Отсюда, так как СВ(Х) CZ С (X) при почти всех X, получаем, что Е8 (Св (X), С (X)) —> 0 при N -» оо, т. е. Св aeq С. Итак, если доля вариантов, выбираемых функцией выбора со свойством Н не обращается в нуль, то эта функция выбора может рассматриваться как задаваемая некоторым абсолютным уровнем качества. Отметим, что в доказательстве существенны были три момента: 1) СВ(Х) CZ С (X) с вероятностью 1 (другими словами, Св почти всегда аппроксимирует С изнутри); 2) Е |СВ(Х) | асимптотически эквивалентна Е |С(Х) |; 3) дисперсия D | Св (X) | асимптотически мала по сравнению с Е2 | Св (X) |. Будем называть функции выбора, обладающие последним свойством, хорошо обусловленными. Тог- да, повторяя рассуждения доказательства, получаем Утверждение 4.3. Пусть С± аппроксимирует С2 изнутри, сред- ние числа вариантов, выбираемых по каждой из функций выбора, асимптотически эквивалентны и Сг хорошо обусловлена. Тогда CiaeqCj. Еще проще получить то же следствие, предполагая не Cv а С2 хорошо обусловленной. Обратим внимание также на то, что индикаторные функции вы- бора Св являются графодоминантными: они задаются бинарным отношением J/?B, определяемым в терминах верхних срезов следую- щим образом: {ф, если х 6Е В; А, если хЕ. 4\В. Упражнение. Проверьте этот факт. 4.3. Свойства наследования и согласованности В разд. 4.2 мы видели, что широкий класс функций выбора со свой- ством Н неожиданно оказался асимптотически эквивалентным семейству графодоминантных функций выбора, т. е. функций выбора со свойствами Н и С. В этом параграфе мы увидим, что при наложении некоторых естественных условий это выполняется всегда, т. е. все достаточно хорошие функции выбора со свойст- вом Н асимптотически эквивалентны графодоминантным. Это и оправдывает наш курс, взятый в начале книги, на изучение в пер- вую очередь бинарных отношений и взятия максимума по ним. Для того чтобы сформулировать результат, введем еще одно понятие. Функции выбора и С2 называются зависимыми, если Е\Сх(Х}\~Е ICJX) П С2(Х) | ~ Е|С2(Х) | при 7Vоо (~ означает обычную асимптотическую эквивалентность, т. е. / — g f — 0(g) и £ = О (/)). Смысл этого определения тот, что взятие пересечения выбор не уменьшает (с точностью до констан- ты) избирательностей (избирательность — доля выбираемых ва- риантов, т. е. p(N)). Отметим, что если события хЕ Сг(Х) и 77
xE C2(X) независимы, то Cr и C2 независимы, за исключением разобранного случая, Е | С\ (X) | ~ Е | С2(Х)| ~ N. Пример. Пусть А = R2, (\ (X) = argmax xv С2(Х) = argmax j*2. х х Пусть вероятностная мера задается равномерной плотностью в об- ластях, изображенных на рис. 4.1, а — в. Тогда в случае а и б С\ и С2 независимы, в случае в — зависимы. Бинарные отношения будем называть зависимыми или незави- симыми, если таковы графодоминантные функции выбора, ими определяемые. Пусть Bi(t) — функция распределения случайной величины цг, введенной выше. Будем говорить, что Яг — регу- лярное бинарное отношение, если Bt — правильно меняющаяся функция. Теорема 4.4. Пусть С — хорошо обусловленная функция вы- бора со свойством наследования, задаваемая конечным числом попарно независимых регулярных бинарных отношений Я^ Тогда существует бинарное отношение J?, такое, что графодоми- нантная функция выбора, соответствующая ему, асимптотически эквивалентна С. Доказательство. Определим Я следующим образом: А разбивается на конечное число измеримых областей множест- вами уровня функции argmax цДя) (если этот argmax не единст- вен, то, предварительно упорядочив индексы, положим функцию равной минимальному индексу из argmax). В области, где функция равна /, положим верхний срез Я в точке х равным верхнему срезу Я[ в точке х. Задание верхних срезов в каждой точке определяет бинарное отношение. Нетрудно видеть, что это бинарное отношение измеримо. Далее, очевидно, что ап- проксимирует С изнутри. Наконец, оценим Е \ (X) \1Е | С (X) |. Пусть ц(1) р(2) <;...— упорядочение мер верхних срезов, а В^ (t) — функции распреде- ления соответствующих случайных величин. Тогда очевидно: я I GHX) I = И E\C(X)\^N^l-t)^d^B{i}(t). Далее, B^(t) S(2) (£);>... . Покажем, что 5(2) (£) = о (5(1) (£)). Действительно, пусть это не так. Тогда вдоль последо- вательности ta —> 0 —р'2) с "> 0. Далее ^(1) "а) -5(1) (0 = 3 Р (Иг < Mi = min ц) > Р (pf < 0. В(2) (t) - 3 Р (Pi < г W тах(|хг,р})< min {pR} < P (Pi < Pj<0- KIc^oo j Отсюда- k \ < у У ------г—=—-~4-----. Далее, допустим, 0(1) (га) -у* 0(1) 78
Рис. 4.1. Зависимость функций выбора Рис. 4.2. Эквивалентность функций выбора что с > О для всех z,/, а. Так как то С > 0, откуда Р (gi, |1, < ta) cP (|1, < ta), откуда Е | CAi (J | ~ сЕ\ С^(Х)|. Поскольку то же верно для у, получаем противоречие. Значит, --------=—(----------->0 °(1) 'fa) в о и в(--—т—>0. Но ^отсюда немедленно вытекает (см. следую- ^(1) W щую главу), что Е | С(Х) | = TVf (1 _ г)*~М5(1)(г) (1 + О’(1)), т. е. гр V4-.---> 1 при N —> оо, т. е. мы попадаем в условия 2i | С (Л) I сформулированного ранее утверждения, что и доказывает С& aeq С. Что можно сказать об ограничительности условий последней теоремы? Как проверить их выполнение? Эти вопросы упира- ются в необходимость изучения вероятностных характеристик функций выбора, задаваемых бинарными отношениями. Более или менее подробное исследование этой проблемы содержится в следующей главе, где, грубо говоря, доказывается, что для достаточно хороших отношений в общем случае они регулярны, независимость их, нестрого говоря, вытекает из пустоты пересече- ния их максимумов из Л, в общем случае С<% хорошо обусловлены, а из независимости и хорошей их обусловленности вытекает хорошая обусловленность С. Итак, при достаточно необременительных предположениях функция выбора со свойством наследования в критериальном про- 79
странстве асимптотически эквивалентна графодоминантной функ- ции выбора. Другой массовый пример независимых — случай, когда со- бытия хЛЦу и хЛ,у независимы в вероятностном смысле (и Е | СЯ.(Х) | = О (7V)). Разберем пример на рис. 4.1. Функция выбора С = Сг |J С2 — совокупной экстремизации — хорошо обусловлена в случаях а, б. (Дисперсия стремится к нулю, среднее — к 2.) В случае в дисперсия | С | при всех N больше некоторой положительной кон- станты. Как выглядит в случаях а, б отношение Л, для которого С aeq G?? Надо провести «диагональ», разбивающую А на куски А]. • Hi Иг и А2 • Иг <С Hi и положить для х ЕЕ АГЛХ = для х е А2 Лх = (Л2)х (рис. 4.2). Полученный результат можно интерпретировать следующим образом: графодоминантные функции выбора, или, иначе, функ- ции выбора, обладающие свойствами Н и С, плотны относительно описанной метрики среди функций, удовлетворяющих ряду тех- нических требований. Это показывает, что на практике, где эти требования, как правило, выполнены, условие Н влечет выпол- нение условия С в описанном асимптотическом смысле.
Вероятностные свойства бинарных отношений Глава посвящена статистическим характеристикам бинарных от- ношений. Они интересны нам по следующим причинам. Во-первыхж они дадут обоснование утверждениям гл. 3, содержащей мотиви- ровку нашего предпочтительного внимания именно к бинарным отношениям. Во-вторых, знание статистических характеристик дает инфор- мацию о том, что можно ожидать при выборе по тому или иному отношению. И, в-третьих, зная статистические характеристики бинарных отношений, можно пытаться использовать их при аппроксимации: если мы стоим перед выбором, какое из двух бинарных отношений использовать в качестве аппроксимирующего отношения ЛПР изнутри, естественно постараться выбрать то, для которого сред- нее число недоминируемых меньше. В этой главе мы будем заниматься в основном следующей по- становкой задачи, обоснованной в гл. 4: А — множество вариан- тов, v — вероятностная мера на нем, J? CZ А X А — бинарное отношение на Л, полагаемое измеримым, N — целочисленная случайная величина. Пусть X — повторная независимая выбор- ка объема N (это значит, что сначала «разыгрывается» число а затем в Л в соответствии с мерой v «бросаются» N точек хг, . . ., и X {хг, . . xNj). Число недоминируемых в X вариантов |Мах,^Х| случайно. Основной вопрос, стоящий перед нами: каковы вероятностные характеристики случайной величины $ = | тах^Х|? Отметим еще раз, что механизм порождения X достаточно про- изволен, в действительности будет использовать лишь то, что ко- личество вариантов в любой измеримой области В GZ Л | X р| В | зависит лишь от меры v(B). В конце главы мы опишем постановку, позволяющую работать с выборкой бесконечного объема. 5.1. Математическое ожидание числа недоминируемых вариантов Итак, пусть X — случайная выборка. Образуем N случайных величин . ., Хх: Xi = 1, если xt ЕЕ Мах^Х, и 0 в противном случае. Очевидно, все Xi измеримы. Далее ясно, что перенумера- ция Xi не меняет их совместного распределения, т. е. х? симмет- 81
ричны. Очевидна следующая формула: N |МахЛХ|= 3 Xi- ?=1 Далее положим N фиксированным (не случайным) числом. Резуль- таты для случайного N могут быть получены рандомизацией. Будем обозначать оператор математического ожидания (ставящий в соответствие случайной величине ее среднее) через Е. Среднее число недоминируемых вариантов в выборке объема N есть тогда N N e(TV)=£|Max^X| = Я SXi= S ЕЪ = NEfa. г=1 г=1 Последний переход сделан в силу симметричности Математи- ческое ожидание Efa есть просто вероятность того, что первый вариант из выборки недоминируем. Здесь надо сделать замечание. Все сказанное справедливо не только для графодоминантных, но и для произвольных функций выбора. Именно: для нахождения математического ожидания мощности выбора необходимо и достаточно определить вероятность того, что произвольно выбранная точка х ЕЕ X попадет в С (X). Какова же вероятность Р(хг €= Мах^Х)? Если хг = а 4, то это есть просто вероятность того, что ни один из оставшихся вариантов х2. . . ., х^ не доминирует хг, т. е. не лежит в Ла (равно- сильно — лежит в А \ Ла). Обозначим меру через ра. Это измеримая функция (теорема Фубини) и Р (хх ЕЕ Мах^Х/у (тг = = а) = Р(х2, . . х^ ЕЕ А\ Л^ =(1 — ц(<2))Л-1 (в силу незави- симости х^. Чтобы найти полную вероятность, проинтегрируем последнее выражение по всевозможным а и получим e(N) = N (5.1) А Пусть F(p) — функция распределения случайной величины р(а), т. е. F(|i) = Р(ц(а)<^ ц). Тогда, по теореме Фубини, 1 е(Х) = Л7 J(l —(5.2) О Пределы интегрирования здесь взяты 0 и 1, так как величина р (а) имеет смысл вероятностной меры множества и изменяется в этих пределах. Чтобы освоиться с введенным понятием, приве- дем Пример 1. Пусть А ~ [0, 1], Л — отношение мера равномерная. Тогда р (х) = 1 — х, F(p), = р, e(N) = 1 = N (1 — р)^1 dp = 1, т. е. в среднем из N величин выбирается 1. о Это, впрочем, и так ясно, ибо всегда из N 0 различных точек на отрезке ровно одна имеет максимальную оценку. 82
/аяЛ Рис. 5.1. Поведение^функцииТ^ = N(i — p)iV 1 _J_ Из формулы (5.2) видно, что вся информация о поведении e(N) как функции N «спрятана» в функции /Др,). Таким образом, для вычисления e(N) не нужно рассматривать интеграл (5.1) по обла- сти от функции, зависящей от параметра, а достаточно рассмот- реть некоторое интегральное преобразование функции F([i). Это преобразование называется преобразованием Меллина. Изу- чим асимптотическое поведение e (N) при N —> оо. Пусть /Др,) = Fx(p,) + F2(p,) и Fr (р) монотонно возрастает на [0, 1] и не обращается в 0 при р, 0. Пусть, кроме того, F2 (н)/^1 (и) 0 при р, 0. Тогда е2 (2V)/^ (N) -> 0 при N —> оо, где ei (TV) = N § (1 — р,)^'1 dFi (р). Действительно, пусть на отрезке о [0, 6] F2(p)//4 (м) < £- Тогда i6i J (1 - р)^"1 dF2 (р) J (1 - р)*"1 dF2 (р) J (1 - р)7^1 dF2 (р) о << ° । Д 1 6 в/2 J (1 _ ^V-l dF1 (fl) J (1 _ Н)АМ dF1 (Ц) ООО <с I F (р/2)(1 — d/2)7V-1 Устремляя /V к оо, получаем, что второй член стремится к ну- лю. По произволу 8 заключаем, что e2{N)/e1 (TV) —> 0 при TV оо. Это утверждение показывает, что асимптотическое разложение функции jP(p) влечет асимптотическое разложение функции e(N), т. е. если мы интересуемся лишь главным членом e(7V), то мы мо- жем изменять F(p) на члены более высокого порядка малости в 0. Если /^(р) несет в себе всю информацию о e{N), то информация об асимптотике e(N) содержится в поведении /Др,) в сколь угодно малой окрестности нуля, или, другими словами, в росте F (р,) в 0. Причины этого становятся ясны, если рассмотреть последователь- ности функций TV (1 — р)7^1 (рис. 5.1). Интегралы от этих функ- ций равны 1, сами функции стремятся к нулю на любом отрезке [б, 1], все более вытягиваясь в 0 (такая последовательность на- 83
зывается б-образной, так как сходится к б-функции Дирака). Вклад от функции ^(ц) на любом отрезке [б, 1] становится с рос- том N сколь угодно мал. С другой стороны, преобразование Меллина почти совпадает с умноженным на N преобразованием Лапласа функции ^(ц) (во всяком случае, с точностью до аддитивной константы). (Далее мы будем пользоваться обозначениями f — g, если f/g —> к У= 0, оо при стремлении аргумента к пределу, / ~ если к = 1, f — О (g), если к у= + оо, f =-- о (g), если к = 0.) Оценим разность 11 } N J e<-v(N-r>dF (р) — N jj (1 — dF (р) = Л' jj — 0 0 о 1 N-2 — (1 — ц)Л~]) dF (ц) = N (в-м- — 1 + ц) (1 — ц)^"1 X о ?‘=0 1 X dF (ц) < N jj - Ne-^N-VdF (ц). о В последнем неравенстве использовалось то, что сходящийся знакопеременный ряд с убывающими членами е~* — 1 -|- р, = ц2 = -------. .мажорируется первым членом и что — — р, на [0, 1]. Последний интеграл оценивается следующим образом: функция _!£_ e-y,(N-i) достигает своего максимума в точке р* = ~дг—р 2 е2, (N — I)2 и этот максимум равен откуда последний интеграл ~1. Итак, для вычисления асимптотик среднего числа недомини- руемых вариантов можно пользоваться преобразованием Лапласа функции распределения меры верхнего конуса случайной точки. Приведем несколько примеров вычисления среднего числа не- доминируемых вариантов. Пример 2. Пусть А = Rn, Л = Рагп — отношение Паре- то, вероятностная структура задается плотностью р(хг . . ., хп) = = Pi (^1) • • • Рп Сгн)- Пусть Gi — функция распределения случай- ной величины xt. Тогда замена х^ —> СДгс,) сохраняет Л и пере- водит плотность в равномерную в единичном кубе 0 xt 1, i = 1, . . ., п. Вычислим F(p). Нетрудно видеть, что мера верхнего конуса в точке (^х . . . хп) есть (1 —- #х) .. . (1 — хп) (рис. 5.2). п Отсюда Г(ц) есть объем множества, в котором Ц(1— 1 0 xv . . ., хп 1. Покажем по индукции, что W = (-lnp)7f! i=l 84
Рис. 5.2. Верхний срез отно- шения Парето в R3 Рис. 5.3. Отношение Для п = 1 это очевидно (см. предыдущий пример). Вычислим F(p) = Fn(p) в ^-мерном пространстве через Fn_r (р). Если р а <1 1, то объем сечения множества р (х) р плоскостью хг — а равен Fn_x (p/а) (см. рис. 4.2), а при 1 <; а р — единице. Отсюда Ц 1 1 П-2 Рп (н) = § dx + Fn_, (ц/х) и + J -J- ( £ ( ~ N.^.. у dx = О Ц. Ц. i=0 1 n-2 = ц + |л^^1пгр/и)//!й1п-^- = ц 0 n-1 -н(1 +£(1п‘(^)/п)=^п(р). 1 1 n71 1 i i Отметим, что dFn (p) = __ dp, откуда асимптотику среднего числа недоминируемых можно вычислить вариантов: e(N)^ lnn-17V (п-1)! . Итак, если оценки по критериям независимы, а отно- шении паретовское, то число недоминируемых вариантов растет как степень логарифма общего числа вариантов. Пример 3. Пусть А = R2, = Par2 — паретовское, плотность — равномерная в треугольнике хи х2 0, xt + х2 1. Тогда если расстояние от точки х до гипотенузы есть h, то р (х) = h2, откуда F (р) = ]^2р — р, и e(N) ~ ]/"N. Пример 4. Пусть А = R1, 0 — монотонно возрастающая функция [0, 1] в [0, 1], а мера — равномерная на [0, 1]. Бинарное отношение определим на [0, 1] (вероятность попадания вне от- резка равно 0) следующим образом: хЛъу 0 (х) < у. Очевидно, что если 0(^r) х на [0, 1], то транзитивно и ациклично (рис. 5.3). Найдем F(p). Верхний срез в точке у есть множество х\ 6 (х) <у. Его мера p(z/) = О1 (у). В силу монотонности 0 по- лучаем, что р (у') < р (у) у' < у, стало быть, F(p(z/)) = у, от- куда F(p) — 0(р). Итак, для любой непрерывной F(p) р су- 85
ществует транзитивное и ацикличное Л в (одномерном!) кри- териальном пространстве, задаваемое открытым подмножеством декартова квадрата критериального пространства, функция рас- пределения меры верхнего среза которой совпадает с F(|x). Этот пример показывает, что, вообще говоря, можно получить практи- чески произвольный рост среднего числа недоминируемых вариан- тов. Прежде чем сформулировать утверждение, скрашивающее по- следний неутешительный вывод, отметим еще две общие связи e(N) и F(p). Во-первых, о стремлении e(N) к бесконечности можно судить по поведению частного F (р,)/р, в окрестности 0. Именно: lim e(N) = , 7V-*oo ц-*0 т. e. бесконечности возникают справа и слева одновременно. Действительно, пусть F (ц)/р, -> к. Тогда, исходя из того, что при F(|i) = ц e(N) = 1, и из утверждения об асимптотическом разло- жении получаем е (N) -> Л. Если же F (ц)/^ становится сколь угод- но велико, то e(N) превосходит любое наперед заданное число, т. е. стремится к оо. Во-вторых, коль скоро е (N)/N — почти преобразование Лап- ласа F(p), то мы можем сразу применить Тауберовы теоремы, заключающиеся в следующем. Пусть F (ц) — правильно меняющая- ся функция, т. е. такая, что Vo 1, существует предел lim y = ф(0- Тогда ф (/) обязательно имеет вид ta (так как ц-*0 Г W F (ц) у нас — функция распределения и F (£ц) F (ц), то а > 0) или 0. Тауберовы теоремы устанавливают связь между асимпто- тикой F (ц) в нуле и ее преобразованием Лапласа на беско- нечности. Именно, если ф (t) = ta, то оо (LF)(p) = $ ^dF (f) Г (а) о при р оо , где Г (а) — гамма-функция, обобщающая понятие факториала (Г (и) = (п — 1)! при натуральных п). Нетрудно заметить, что функции вида ца (—-In р,)^ — правиль- но меняющиеся с ф (i) = ta. Отсюда нетрудно вывести асимпто- тику из примера 2: е (7V) ж N (LF) (N) х NY (a) N~a С дру- гой стороны, знание поведения е (N) позволяет (при правильном изменении е (N)) определить асимптотику F (ц) в нуле и, таким об- разом, сделать вывод о некоторых свойствах Л. Например, если е (N) ~ V, то легко заключить, что F (0) 0, и, стало быть, мно- жество вариантов с верхним срезом нулевой меры имеет положи- тельную меру. Подробно обобщение этого случая разобрано в гл. 4. Рассмотрим теперь типичную ситуацию многокритериальной оптимизации: А = R71, Л — линейное отношение, задаваемое 86
Рис. 5.4. Условия трансверсальности выпуклым конусом К, не содержащим прямых, вероятностная структура определяется своей плотностью р, которая отлична от нуля в области 7, которая является «многообразием» с углами, причем выполняется следующее условие регулярного подхода: пусть h (х) — расстояние от точки х до границы dV. Тогда р (х) = = b (х) hs (х), где $ > —• 1, Ъ (х) — непрерывна на V и не обра- щается в 0. Будем предполагать, что выполняется некоторое условие тран- сверсальности. Пусть W — множество, и ЕЕ 7, таких, что р (и) — = 0 (слабый оптимум). Пусть W есть объединение гладких стра- тов, причем максимальная размерность страта к. Так как очевид- но W GZ dV, то к <; п — 1. Условие трансверсальности Т таково (оно накладывается на пару (р, К)). Для некоторой точки глад- кости w страта W\ максимальной размерности замыкание w + К пересекается с TwWi и с У лишь по w (iv + К р| TyWi = w, iv + К П V = iv). На рис. 5.4, а, б нарисованы v, К, не удовлетворяющие ус- ловию трансверсальности, на рис. 5.4, в — удовлетворяющие. Не вдаваясь в подробные обсуждения условия 7\ укажем, что он является условием общего положения, т. е. всякую пору (и, /Г), не удовлетворяющую условию 7, можно сколь угодно мало «по- шевелить», чтобы она уже удовлетворяла условию трансверсаль- ности, и, с другой стороны, всякая пара, близкая к Z-nape, снова удовлетворяет условию Т. Иными словами, общая задача много- критериальной оптимизации удовлетворяет условию Т. Сформулируем Утверждение 5.1. Пусть Л, Л. р — как описаны выше, причем пара (р, К) удовлетворяет условию Т, и размерность страта W максимальной размерности есть к. Тогда e(N) ~ ff'ln+s') (напомним, что s — показатель в представлении плотности в виде b (х) hs (х)). Наметим основные черты доказательства этого утверждения для случая к —1. Как видно из асимптотической эквивалент- ности е (N)/N преобразованию Лапласа F (р) и из тауберовых тео- рем, достаточно показать, что F (р) ~ |xM+«)/(n+s). Введем в окрест- ности dV координаты (h, V) следующим образом: в окрестности страта размерности Z, где V локально задается уравнениями п-1 %! > 0, . . ., xn-.t > 0, построим векторное поле В = — У1 87
и склеим все получившиеся векторные Ьу поля путем разбиения единицы на ок- W рестности dV. Легко проверить, что ~7\ каждую точку окрестности векторное / \ </_\ поле «выносит» на границу области. По- / \ /\ \ ложим и (а) — пересечение интеграль- \/ I ной кривой точки а под действием \ V / векторного поля с dV, a h(a) — время \ / выхода на границу. Легко видно, что \ / fe(a)/p(a, dV) — непрерывно продолжа- / ется на замыкание У. Интегрирование X. по окрестности dV распадается на интег- рирование по спроецированной мере Рис. 5.5. Слабый оптимум и * Р по д V интегралов по индуцирован- ным мерам на кривых и 1 (и). В силу пре- дположения о характере подхода к плотности к границе мера и * р задается плотностью, а индуцированная мера на кривых задается плотностью, эквивалентной hs при малых h. Далее ясно, что вдоль слоя проекции a—^U (а) ц(а) растет не медленнее, чемй (o)r'+s, а в окрестности точек, где выполняется условие трансверсальности, — эквивалентно hn+s. Объем области, в которой р, (а) ц, есть интег- рал подУ от объемов мер той части слоев, где ц (а) ц. Так как р, вдоль слоя растет либо как hn+8, либо быстрее, то объем соответ- ствующей части слоя есть либо 0 (p/s+1)/(n+s)), либо 0 (p/s+1>/(b+s)), что и доказывает утверждение теоремы, ибо интегрирование по ком- пактной области имеет порядок роста, равный максимальному порядку в этой области, если этот последний достигается на от- крытом множестве. Приведем примеры. Пример 5. Пусть У — симплекс в Rn: У = {х: < 1, Х[ 0}, мера — равномерная в У, конус К такой, что функ- ция строго возрастает вдоль К. Тогда е (N) — Пример 6. Если слабый оптимум состоит из отдельных то- чек (рис. 5.5), то е (N) ограничено. То, что в случае паретовского отношения и У — единичного кубане наблюдается степенного роста e(N), есть следствие вырож- денности ситуации: во всех точках слабого оптимума конус ка- сается грани! Однако сколь угодно малый поворот (конуса или грани) приводит к ситуации общего положения, и е (N) начинает Расти как степень N. Приведем еще два результата, посвященные специальным слу- чаям пары (У, J?). Утверждение 5.2. Пусть мера — многомерное нормальное рас- пределение, т. е. задается плотностью ехр ---(А = = ll^ijll — положительно определенная симметрическая матрица коэффициентов корреляции величин х^), а Л — паретовское. Тогда е (N) - С (A) lnn i7V, где С (А) — константа, зависящая от А. 88
Вывод этой формулы сопряжен с громоздкими преобразова- ниями, и мы его опускаем. Другой случай относится к рассмотренному в гл. 3 отношению Подиновского, учитывающему неравноценность критериев, и ме- ре, равномерной в единичному кубе. Пусть Р — некоторое би- нарное отношение на множестве {1, . . ., п} критериев, j/?p — отно- шение Подиновского, отвечающее упорядочению Р (иными сло- вами, если = {(х, у) : xt yt = xh yj = xt, ук = хк, к =/= Z, у для некоторой пары iPj}, то Лр есть транзитивное замыка- ние Я (и отношения Парето). Введем на множестве Sn перестано- вок из п элементов бинарное отношение Р: вРа', если а получает- ся из а' композицией транспозиций вида (Z, /), где iPj. Пусть с (о) ~ | а' : а'^а|. Обозначим через еР (N) среднее число недоми- нируемых по J?p, через е& (N) — среднее число недоминируемых по паретовскому отношению. Утверждение 5.3. 1 ул 1 Приведем набросок доказательства. Лемма. Пусть Be = {х : 0 xt 1, хг &х2 <1 . . . < ЕП^Хп}. Положим п Fe (ц) = Р (р (а) < ща 1= 5ё), где р (х) = П 1 Тогда ,. 1 lim -------—:------— -г- . ц-о р(—lap) 1)! Ясно, что для п = 1 лемма верна. Заменой переменных легко по- лучить, что 1 8£(р) - ( ^xVFV (dxv J I 8 Х\ / О V 1 / Рассуждая по индукции, видим, что = 0(|lnn-1p)|). Пусть С& = {х : 0 Xt <1 1, xiv для некоторой перестановки (г19. . ., in). Ясно, что есть объединение областей, получаемых из В^ путем всевозможных перестановок координат. Из леммы немедленно вытекает, что eg (N) — среднее число недоминируемых по Парето вариантов в любой области от- личается от (N) на величину меньшей степени"роста. Так как ZD т0 Max,>?pCZ Maxpar, откуда среднее число недомипи- 89
руемых по Яр вариантов, попавших вне Се, асимптотически мало по сравнению с £0 (X). Теперь, чтобы оценить среднее число недо- минируемых по Яр вариантов, лежащих в eg, заметим, что для х : xh exi2 мера верхнего среда Яр отличается от увеличенной в с(о) раз (о-перестановка ... гп) ) меры верхнего среза Я# на ной области величину, стремящуюся по е к ф. Отсюда в указан- W<h> при е ’ что и влечет ут' верждение. Пример 7. Пусть п = 2, р = (1, 2), т. е. первый критерий важнее второго. Тогда еР (N) — + -у-) In N = -|- In Д'. Пример 8. Пусть п произвольно, Р — полное, т. е. для лю- бой пары (Z, 7) iPj. Тогда, очевидно, для всякой ос(а) = п!, и 1 In11"1 N __________1 VI 1 In71"1 N __ In77"1 /V ep ' n\ 2 n\ (n—1)! (n—1)!n! Подведем теперь некоторые итоги первого раздела. Было по" казано, что в достаточной общей ситуации многокритериальной оптимизации е (N) имеет степенной рост как функция N. В то же время во множестве специальных примеров e(N) растет значи- тельно медленнее: как степень логарифма N. Это указывает на общий принцип: снижение асимптотики среднего числа недомини- руемых вариантов отражает симметрию (в широком понимании!) задачи. Если среднее число недоминируемых вариантов невели- ко, значит, есть какие-то регулирующие факторы. 5.2. Дисперсия и распределение числа недоминируемых вариантов Эти характеристики случайной величины 5 (N) значительно хуже поддаются вычислению. Сложности здесь связаны вот с чем: если для оценки ES (N) достаточно было найти вероятность Р {хг Е= ЕЕ Мах^Х}, что, в свою очередь, сводилось к нахождению функции распределения меры верхнего среза случайного варианта, то для оценки второго центрированного момента — дисперсии — необ- ходимо уметь вычислять вероятность Р {xj, х2 ЕЕ Мах^Х}, что тре- бует нахождения функции распределения меры объединения верх- них срезов двух случайных вариантов. Вычисление же /г-го мо- мента требует нахождения Р . . . хк ЕЕ Мах^Х}. Введем некоторые обозначения. Пусть X = (хп . . .,хм). Поло- жим для мультииндекса I = ... 1\ц) р1 = Р е Mxil U • • • U #чи1)’ н7 = Р р • • Г Рг= Р (-Ч, • • , Xi е=.Мах^ X), . I IL - /1 >1 90
Общая формула для дисперсии DS (N) при фиксированном У есть DS{N) = E(S2(N)) - (ES (N))2 = + Npi _ _у2А2. Подобным же образом можно вычислять 4-й центрированный момент (он понадобится при нахождении распределения S (АО): M4S(N) = №Pi + 6М3^3 + 7М2^2 + NP1 - 4NP1 (NWP3 + + ЗМ2^2 + NP1) + 6№P1 (№p2 + NP1) - 3^. Укажем явные формулы для Pi при фиксированном N. Будем обозначать для простоты xt > Xj вместо х^х; и Xi.[_Xj-> если ни Хг%Х], ни Xj^Xi не выполняется: Pi = $ (1 —н1’2’•’i)N-1dP(a;1...xi). Xil ... ±х. Допустим, что N не фиксировано, а распределено случайно: N = i с вероятностью а/. Пусть Ф (z) = 2а^г, O(fe)(z)= d . dz Тогда EN^Pi = j (1 — p,1 ••*) dP (x4 . . . xt) = j (1 — — В частности, если N распределено пуассоновски с па- раметром X, то Ф(з) = £-Mi-z) и фр] — хгф. Далее мы займемся именно пуассоновски распределенным N, в основном для удобства вычислений. Как будет видно, формулы получаются в этом случае особенно простыми. На самом деле, все результаты верны и для фиксированного N. Простота выкладок отчасти объясняется тем, что при пуассоновски распределенном N количества вариантов, попавших в непересекающиеся области, независимы. Данный раздел посвящен изложению результата, дающего асимптотическое поведение распределения числа недоминируемых вариантов для широкого класса многокритериальных задач. Укажем точно наши предположения. Пусть V CZ Rn — об- ласть с кусочно-гладкой границей dV. Пусть отношение задано выпуклым телесным конусом К, не содержащим прямых. В V задана некоторая плотность р, определяющая вероятност- ную компоненту задачи. Будем считать, что р представимо в виде р (х) = с (х) hs (s> — 1), где с отделено на V от 0 и оо , a h (х) — рас- стояние от точки х до границы д V. Обозначим через W множество тех точек V, для которых их верхний срез имеет меру 0 (будем на- зывать W слабым оптимумом). Ясно, что W CZ dV. Предположим далее, что для всякой точки w GE W, в которой существует каса- тельная к W гиперплоскость TwW, замыкание внутренности кону- са К, снесенное вершиной в точку ш, пересекается с TwW и с V лишь по w (условие сильной трансверсальности границы конусу). Из этих условий вытекает условие 7, но не наоборот. Вообще, в классе всех многообразий (с углами) нельзя малым шевелениям уничтожить касание конуса с границей (например, граница шара и произвольный конус касаются кое-где друг друга, и это сохра- 91
няется при малом шевелении шара и конуса). Однако если перейти к классу многогранников, то формулируемое условие станет ус- ловием общего положения. Если N распределено пуассоновски с параметром X, то имеет место следующая Теорема 5.4. a) DS (X) ~ ES (к) и S (к) — ES (к) б) —^====-^- слабо сходится к нормальному за- кону при А оо . Укажем основные моменты доказательства. Как следует из приведенных выше формул для EN^pt и дисперсии 5(Х), DS (X) = к2 ^1,2dv (24) dv (х2) + к § e~l^dv (х±) — XilX2 Х1 — к2 £-MMt+M-2)dv (xj dv (х2). Х1, Х2 Все функции р1 — измеримые, поэтому по теореме Фубини DS (к) можно записать как 1 DS (к) = к2 $e-^dP (р^ <rA*i1*2) + о 1 1 + Ц e-^dp (ц1 < р) — X2 e-^dp (щ + р2 < ц). О о Так как Р (р1’2 < р Д х± | х2) = Р (р1’2 < р) — Р (р1’2 < р Д Д хг >- х2) — р (р1’2 > р Д х2 >- ^1) и из рх + р2 < р вытекает, что р1’2 < р, то DS (к) можно записать как 1 X2 $ е-’-М (Р (И1.2 < р) - р (И1 + р2 < р) - О 1 1 — к2 e~wdP (р1*2 Д р Д х2 Д- дг1) — к2 e~^dP X о о 1 х (|Л1,2 < И Л *1 >- ж2) + X e-^dP (Pj < р). О В указанных предположениях три последних члена имеют по- рядок ES (к) — к ™+s. Для оценки первого члена сверху можно применить следующее соображение: если р1’2 < р < р1 + р2, то рх < р и Х?Х1 (") J?X2 |Д р| V =7^ Ф (в противном случае р1’2 = р1 + р2, что противоречит р1»2 < р1 + р2). Если зафиксировать х1ч то область возможного изменения х2 (схематично изображенная на рис. 5.6) имеет объем, меньший ЛСр, где К — некоторая константа, для ограниченности коей и требуется условие сильной трансверсальности. Так как 92
Рис. 5.6. К доказательству теоремы Рис. 5.7. К вычислению интеграла Рх < р, то Р (р1’2 < р < р1 + р2) < К\ьР (р < р'), и для перво- го интеграла мы имеем ту же оценку, что и для остальных: О (ES (X)). Поскольку не все члены в формуле для дисперсии вхо- дят с плюсами, то надо показать еще, что их главные части т-1 (— X w+s) взаимно друг друга не зануляют. Доказательство этого сугубо техническое, и мы его здесь опустим. Тем самым доказан пункт а) теоремы. Для доказательства пункта б) важно оценить 4-й момент S (X). Это делается подобно оценке дисперсии, но требует более четкого введения некоторых геометрических конструкций. Пусть VK' = V X ... X V — декартова k-я степень V, Дк — диагональ, т. е. А^ = {{х. . . х) ЕЕ Ук}. Назовем подмножество К ЕЕ VfcAfc = подмножеством, если выполняется следующее усло- вие: если (аЕ... Хк) ЕЕ К, то объединение верхних срезов точек ^i(U ^xi) П У связано (в стандартной топологии Rn). Если мно- жество V не имеет граней слабого оптимума РУ, не трансверсаль- ных конусу, то, нестрого говоря, К в окрестности Wk близко к диагонали А/с. Следующая лемма, несущая в себе основную гео- метрическую часть доказательства, уточняет это. Лемма. Пусть Уц = {х^ V : р (х) < р}, 5(|Х) = Р (х е УД = К П У^. Тогда, если К — Ак — подмножество, то при до- статочно малых р существует L: р ((хх ... хк е К^) < (jx). Доказательство. Пусть .г ЕЕ Ум. Попробуем оценить меру множества ({х} * Ук-1). Если нам удастся по- казать, что она меньше где LY — некоторая константа по х и р, то лемма будет доказана. Действительно, тогда р ((^ . . . Хх)ЕЕ ЕЕ < 2?(ц) (ZiP)^1, что и требуется. Для доказательства ?той оценки, как и в доказательстве утверждения 5.1, введем коорди- наты (5, h) в окрестности W, так чтобы 5 параметризовало бы W, ah — расстояние до W. Определим множество F\ (х) индуктивно: 93
F^ = {x}, F^1 (x) = {y G существует W,v & F^. w>- >- v, w^~ у}. Очевидно, что если К Д^-подмножество,то К^(х) €= ЕЕ (х). Для оценки меры F*(x) отметим, что диаметр множества nwF» (х) (где nw : V-+W, (s, h) —>s) имеет порядок fe(p)— толщи- ны слоя нетрудно проверить, что в указанных предположени- ях над различными 5 толщины слоя отличаются не более чем в аб- солютную константу раз, и поэтому fe(p) определена корректно. /г(Ц) Отсюда мера fJ(X) имеет порядок few-1(p) p(h)dh при пра- 6 вильно меняющейся р. (Из рассуждений в доказательстве 5.1 h ясно, что порядок fem-1(p) ^p(h)dh не меньше, чем ц. С другой о 1 Л(ц/2) 1 (и) (* стороны, порядок ц не меньше, чем -------------Ji \ p(h)dh— ц; 2 V о эти оценки соответствуют мерам цилиндров с основаниями на W и {р(х) = р}, {ц (х) = р/2}, описанных и вписанных в соответ- ственно.) Лемма доказана. Выписав явно выраженные для четвертого момента $(Х) и имея в виду найденную выше асимптотику дисперсии, запишем, обо- значив через ег — e~^1"Adv (х-^ . . . dv (^): Xj-lX. u4s (X) = V (е4 — ^е3ег 4- 6в2с4 — Зе4) + 6Х3 (е3 — ^еге2 — ~ + е* + 5е2е2 - Зе3) + О (ES (X))2. Оценим первые слагаемые (для краткости записи dv (х4) . . . dv (х7) будем опускать): е4 = е"^1’2’3,4 — 4 р1,2,зе-^1>2’3 __ Хи х2» х3> х4 XilXjjlXs — 6 £ (JX1.2J2 е-ХЦ1.2 — 4 (И1)’ ХЦХ2 Xj еге3 = е-Мв1-2-3^') — 3 j (ц1)2 е-^<и‘+и«) — хп х2, х3, х4 xt, х2 — 3 § р,1,2е-.11(и1-г+и*)1 (5.3) Х!±Х2, Х4 е2е{ — § _ 2 Х1, х2, х3, х4 хп х3, х4 Эти преобразования сделаны исходя из того, что коль скоро ко- нус транзитивен, то, если неверно, что xr | х2 I х2 I а, например, я4 ЕЕ J?X1 U <^хч U ^х3> то р1’2,3,4 = Ц1’2’3. Прочее аналогично и вполне тривиально. 94
Соберем для начала в (5.3) интегралы по У4 (обозначим через А множество {1, 2, 3, 4} \ Л): е-хи1’2’3’4 У х1э х2, х3, х4 1=1 хп х2, х3, х4 4- 2 5 — 3 l^i^j^4 хп х2, х3, х4 хн х2, х3, х4 Пусть, к примеру, J?X4 не пересекается ни с одним из J?X2, J?Tg (рис. 5.7). Тогда нетрудно видеть, что ц1,2,3,4 = pl,2,3 4~ р4, р1>2’4 4- Ц3 = Ц1»2 4- JX3 + И4, р1’3’4 + + р2 = р1’3 + р4 + р2, р2’3’4 + р1 = р2’3 + р4 + р1, р1’4 + 4- Р2 4- р3 = Р2’4 + р1 + р3 = р3’4 + р1 + Р2 = Р1 + Р2 + + р3 + р4, и соответствующие члены взаимно уничтожаются. Аналогично раз- бираются остальные случаи. Отсюда подынтегральное выражение отлично от нуля в объеди- нении шести множеств Ktj, таких, что Q У =/= 0, и то же верно для оставшейся пары. Каждое из есть произведение дв'ух А2-подмножеств, откуда весь интеграл имеет асимптотику 0 » что и требуется. Аналогичным образом можно оценить оставшиеся члены и по- казать, что гДе *— абсолютная константа. Ввиду тривиальности этих оценок, полностью аналогичных предыдущим, мы их не приводим. Доказательство теоремы. Пусть W' CZ W — замк- нутое множество, совпадающее с замыканием своей внутренности в W. Обозначим через kWr множество х G= V, таких, что Rx Q П W CZ Ж'. Если есть пуассоновское распределение интенсив- ности X в У, можно рассмотреть случайную величину Swf (М — число элементов выборки из киУ, недоминируемых другими эле- ментами выборки из kWr. Что можно сказать о числе недоминируемых вариантов в вы- борке из kW1! К нему применимы все предыдущие рассуждения и, в частности, оценки дисперсии и четвертого момента с теми же константами. k R Пусть теперь W = П И? — разбиение W на замкнутые обла- 1=1 сти Wi числом к с непересекающимися внутренностями. Пусть далее S* (X) — число вариантов в kW*: недоминируемых другими вариантами из kWi, выборка вк№* предполагается пуассоновской с интенсивностью Xv (/cWt), или, что то же, есть пересечение вы- борки, задаваемой пуассоновским потоком в У интенсивности Л, с kW-\ 95
При X, стремящемся коо, функция распределения (25? (Х))~ стремится к функции распределения 5(Х)~. (Здесь и далее Х~ —^г==------центрированная и нормированная X). Чтобы доказать это, введем величину zk (X) — S (X) — $ (X). 2=1 Легко получить, пользуясь теми же геометрическими сообра- Ez (М Г! /1 - Dz (М жениями, что и раньше* оценки = О (X vl+s) = , • zio (Л) 3Jo \Л>) откуда , к х 1/, к D s'! (К) \ sm- - ((ч)л—bw 2=1 Второе слагаемое сильно сходится к нулю. Поэтому, если один из оставшихся членов сходится к какому-либо распределению, то то же верно и для второго. Пусть Xf — последовательность, для которой S (Xj)^ -> F. Пусть далее последовательность W — |_| Иф разбиений с kj -> оо 2=1 такова, что ( S (Xj))~ —> F, и max diamw^ —>0 при j -> оо . 2=1 г г Тогда 5/(Xj) независимы при разных Z, диаметры w'-J стремятся к нулю, и, следовательно, --т—-------> 0 по у, и в силу оценок W (х.) четвертого момента M^S^i (Xj)<^ LD2Sb (Xj). Исходя из этого, сформулируем схему серий из величин (М — ESi3 (Х;), удовлетворяющих условию Линдеберга. (Оцен- ка четвертого момента и неравенство x2dp x2dp позво- x>t ляют сделать это.) Получаем, что f — нормальное распределение (0, 1). Отсюда S (Х)~ сходится к нормальному распределению, что и требовалось. Нахождение констант при главном члене в формулах для сред- него и дисперсии — сложная задача, которую проще всего решать численным моделированием на ЭВМ. Сделаем ряд заключитель- ных замечаний. Теорему можно значительно расширить. Вот на- правления экспансии. Условия степенного подхода р к W можно заменить на условие правильного подхода р = bv (fe), где г — правильно меняющаяся функция. Требование, чтобы W содержал (т — 1)-мерную грань, выте- кающее из наших условий трансверсальности, не нужно. Если W есть объединение /с-мерных граней, то среднее растет, как 96
NV™**, а дисперсия — как среднее, распределение же, по-преж- нему, нормально. Можно снять требование трансверсальности всюду, оставив условие существования точки трансверсальности. Тогда условия теоремы станут условиями общего положения в классе всех мно- гообразий с углами. Для доказательства этого факта надо оцени- вать интегралы дисперсии вблизи точек касания конуса с W. Данная теорема — единственный результат, оценивающий дис- персию и распределение для широкого класса мер и отношений. Некоторые частные результаты приведены в следующем разделе. 5.3. Статистические характеристики прямых произведений Вырожденные случаи часто возникают в следующих ситуациях: множество А есть прямое произведение At X Л2, вероятностная структура на нем есть прямое произведение вероятностных струк- тур (для Bi d А Р(а е Вг х в2) = Р(а е 51)-Р(а е 52)), на каждом из сомножителей есть функция выбора, функция выбора на А получается некоторым образом из функций выбора сомножи- телей. В этом случае естественно задать вопрос: как связаны ста- тистические характеристики выбора на прямом произведении и на сомножителях? Будем далее обозначать л, проекцию А на г-й сомножитель: (л£: а = (ах, а2) «ь i = 1. 2), все величины, относящиеся к А, будут обозначаться без штрихов, к Аг — одним штрихом, к А2 — двумя (например, e'(N) — среднее число выбираемых из выборки объема N вариантов из А1? ц" — случайная величина — мера верхнего среза на А2). Наиболее просто связь между статистическими характеристи- ками прямого произведения и характеристиками сомножителей устанавливается в том случае, когда С -= С" П С" и N — фик- сировано. Очевидно, что в этом случае pt = р\ pl, откуда непо- средственно получается, что знание моментов величин S'(N) и S"(N) от 1 до к включительно определяет 1-й, ..., А>й моменты величины 5(ЛГ). Например, рг = р[р^ откуда е (Д') = (-V) = Л>; (N) р\ (N) = Х1ХХХ2 . т. е. среднее число выбираемых вариантов по пересечению функ- ций выбора есть произведение соответствующих средних чисел сомножителей, деленное на N. Если С" и С" — графодоминант- ные, порожденные бинарными отношениями и J/?" на At и А2, то С = С П С" — тоже графодоминантная, порожденная бинарным отношением л^1 (J?') (J л^1^")- Так как |С' J С”\ = |С'| + \С" | — | С' П С"1, то из преды- дущих рассуждений вытекает, что, зная характеристики сомножи- телей, можно определить характеристики объединения выборов. 97
Пример 9. Пусть Аг = R1, Az — R1, С" и С" выбирают точку с максимальной координатой, р' и р" равномерно распре- делены на [0, 1]. Тогда С — С' |J С" и R2 = R1 X R1 — сово- купно-экстремальный выбор (см. гл. 1), а мера — равномерная в единичном квадрате. Нетрудно видеть, что среднее число выби- раемых вариантов в этом случае есть 2-----. Действительно, |С'(Х)| = \C,r (Х)| = 1 для всякого непустого X, а \С' П С"| = 1, если есть вариант с максимальной оценкой по обоим критериям (что выполняется, очевидно, с вероятностью 1/2V), и 0 — иначе. Отсюда немедленно вытекает искомое. В общем случае, ко- гда A =Rm —R1 х ... X R1, р = р1 . . . pw, все рг неатомарны, т т С = IJ Ci — совокупная экстремизация по т критериям, в (Л7) =
Гладкие задачи многокритериальной оптимизации Эта глава посвящена теории многокритериальной оптимизации в случаях, когда исходное множество вариантов и бинарное отно- шение на нем являются гладкими. В ней мы исследуем те специфи- ческие проблемы, которые возникают в такой постановке, опи- раясь на общие концепции и принципы глав 1—3. Характер этих проблем во многом аналогичен классическим задачам оптимиза- ции, которые составляли ядро прикладной части анализа XVIII — XIX вв., хотя методы, позволяющие дать разумное решение этих проблем, появились лишь в последние 30—40 лет. Практиче- ски все результаты в этой главе, как и в предыдущих, лежат в сфере анализа и не дают конкретных алгоритмов нахождения не- доминируемых вариантов. 6.1. Основные определения Введем основные структуры, являющиеся специфическими для гладких многокритериальных задач. Мы предполагаем, что ис- ходное множество вариантов устроено локально как n-мерное ев- клидово пространство, или, говоря математическим языком, яв- ляется многообразием размерности п. Такая постановка предпо- лагает некоторую информацию о том, как склеивается многооб- разие из своих локальных частей. Мы не будем вдаваться в детали (которые можно найти в многочисленных учебных пособиях по дифференциальной топологии), скажем лишь, что все функции склейки предполагаются гладкими, т. е. дифференцируемыми нужное число раз. Более того, читатель, не желающий обременять себя излишними сведениями, почти всюду (кроме раздела 6.3) может считать, что исходное множество вариантов X есть просто открытое множество в Rn. Предположим далее, что на X задано несколько функций /в • fm — оценок по критериям, которые опять предполагаются дифференцируемыми нужное число раз. Кратко будем записывать этот набор функций-критериев как критериальное отображение f : X Rm. Наконец, будем считать, что в Rm задано бинарное отношение Л. То, что Л задано BRm, т. е. то, что сравнение вариантов осу- ществляется на основании критериальных оценок, есть основная черта многокритериальной оптимизации. Специфика проявляется 99
здесь в том, что мы уже не можем упрощать рассмотрения, пред- полагая, что X CZ Rm, как это мы делали раньше. Все сильно зависит от свойств отображения /. Для облегчения понимания результатов полезно все время проводить аналогию с однокритериальным (классическим) слу- чаем. Изложим основные пункты классической теории, которые будут служить нам ориентирами в общей ситуации. Итак, пусть есть некоторое многообразие X размерности п и задана функция / : X —> R (критерий!). На R есть бинарное от- ношение «больше». Точка х ЕЕ X называется оптимальной (—не- доминируемой), если не существует точки у ЕЕ X : j(y) > /(х). Классическим является следующее необходимое условие опти- мальности: если точка х оптимальная, то в ней все частные произ- водные функции / обращаются в 0. Те точки, в которых выполнено последнее условие, называются экспериментальными и являются тем самым подозреваемыми на оптимальность. Отметим, что экстремальность точек определяется условием обращения в нуль производных первого порядка. Дать достаточное условие оптимальности точки, основываясь лишь на знании поведения функции в ее окрестности, невозможно. Однако можно ограничить запросы и потребовать локальной оп- тимальности. Точка называется локально-оптимальной, если она оптимальна в некотором достаточно малом шаре, ее содержащем. Тогда достаточное условие локальной оптимальности состоит в отрицательной определенности гессиана (матрицы, составленной из частных производных второго порядка) в данной точке. Экстремальные точки, в которых определитель гессиана отличен от нуля, называются невырожденными. Оказывается, что общая функция / имеет только невырожденные экстремальные точки. Слово «общая» означает, что множество функций с вырожденными экстремальными точками чрезвычайно мало, так что случайно взя- тая / должна иметь лишь невырожденные экстремальные точки. Таким образом, указанных условий в общем случае вполне хва- тает, чтобы отловить все локально-оптимальные точки. Более того, для общей функции можно даже сделать существен- ные выводы о структуре множества оптимальных точек. Во вся- ком случае, они лежат изолированно (поэтому, если X компактно, их конечное число), и часто, обладая некоторой информацией об X, можно дать некоторые оценки (неравенства Морса) на их число. Итак, видно, что маршрут нашего исследования должен быть следующим. Оптимальные точки -> локально-оптимальные точки экст- ремальные точки -> условия экстремальности условия локаль- ной оптимальности —проверка того, что для общего критери- ального отображения этих условий достаточно для «отлова» всех оптимальных точек выяснение для общего критериального ото- бражения локальной структуры множества оптимальных точек -> —> глобальная структура. Итак, в путь. 100
Точка х ЕН X называется оптимальной, если не сущест- вует точки у (= X, такой, что Множество оптима- льных точек зависит, как мы ви- дим, не только от J?,ho и от кри- териального отображения /. Совершенно аналогично «одно- критериальному» случаю точка х называется локально-оптима- льной, если х оптимальна в не- которой своей окрестности. На рис. 6.1 приведены примеры оп- тимальных и локально-оптима- Рис. 6.1. Оптимальные и локально- оптимальные точки льных точек. Отметим следующее: то, что точка х является оптимальной, определяется верхним срезом бинарного отношения Я в точке j(x) и не зависит от Л (у) в других точках. Это обстоятельство уже сильно локализует задачу. Иными словами, х оптимальна, если /(X) Q = $,и х локально-оптимальна, если существует до- статочно малый шар Ш, содержащий х (окрестность х), такой, что /(Ш) А = Ф- Теперь мы хотим определить экстремальные точки. В «однокри- териальном» случае экстремальность точки означала обращение в нуль всех частных производных критерия. В нашей ситуации для определения экстремальности также нужно знать лишь част- ные производные первого порядка функций-критериев. Обсудим подробнее, откуда берется условие экстремальности точки. Если / — гладкая функция, то с точностью до малых порядка 2 и выше / совпадает с линейной функцией (напомним, что X локально мож- но мыслить себе как линейное пространство Rn, так что понятно* что имеется в виду под линейной функцией в этом случае; если выбрано другое отождествление окрестности точки с Rn, то новая линейная функция отличается от старой снова на малые порядка 2, см. стандартные руководства). Тогда, если эта линейная функция непостоянна, то можно найти малый шаг, который при- водит к ее увеличению. Поскольку f отличается от своей линейной части на малые высшего порядка, то и / в «сдвинутой» точке будет больше, чем в исходной. Отсюда для локальной оптимальности х необходимо, чтобы линейная часть / была константой, что приво- дит к уже упомянутому условию. Аналогичные рассуждения в многокритериальном случае при- водят нас к следующей теореме. Теорема 6.1. Пусть х — локально-оптимальная точка, — линейная часть отображения / в точке х (т. е. линейное отображе- ние из окрестности х в R™) и замыкание содержит точку 101
f (x). Тогда образ Dfx (=ImDfx) не содержит окрестности 0 в Rm. Доказательство. Если Im Dfx = Rm, то, по теореме о неявной функции, всякая точка, достаточно близкая к f (х), имеет прообраз в X (ибо эта теорема утверждает, что если Im Dfx = Rm, т. е. если ранг rank Dfx = т, то прообразы точек, достаточно близких к / (х), локально устроены одинаково и, зна- чит, непусты в силу непустоты прообраза / (х)). Но тогда, выбирая у ЕЕ достаточно близкую к f (х), что можно сделать в силу условия / (х) ЕЕ получаем, что существует х : у — f (xf) Jlf (ж), т. е. оо не является локально-оптимальной. Полученное противо- речие доказывает теорему. Отметим, что это условие содержательно лишь при п т, так как в противном случае ранг Df всегда п < т. Кроме того, укажем на то, что это условие не зависит от того, как мы отожде- ствили окрестность х с окрестностью нуля в Rn, так как ранг матрицы линейного оператора (размерность его образа) опреде- лен инвариантно. Итак, мы получили, что аналогом экстремальных точек в «од- нокритериальном случае» служит условие rank Dfx т — 1. В дальнейшем точки, в которых выполнено это условие, мы будем просто называть экстремальными. Условие на то, что замыкание верхнего среза в точке f (х) содержит ее саму, является также необходимым для содержатель- ности результата: в противнОхМ случае точка х автоматически является локально-оптимальной. Действительно, очевидно, что тогда существует достаточно малая окрестность х, образ которой не пересекается с Будем обозначать множество экстремальных точек через Sp Это множество, как явствует из его определения, не зависит от бинарного отображения J?. Какова же его структура в случае типичного критериального отображения /? Если п < т, то, как уже упоминалось, 2^ — X вне зависимо- сти от /. Если же т (что наблюдается в большинстве много- критериальных задач — число параметров не меньше числа кри- териев), то Sj совпадает с множеством S4(/), первым из иерархии специальных множеств, инвариантно связанных с отображени- ем /, играющих важнейшую роль в теории особенностей дифферен- цируемых (не обязательно критериальных!) отображений. Как мы уже говорили, Df — это линейная часть отображения /, т. е. линейное отображение Rn —>• R™. Естественно, если мы вы- берем некоторую систему координат в окрестности в J?n, то это отображение можно задавать матрицей п X т, в которой на пе- ресечении z-й строки и /-го столбца стоит частная производная J-й критериальной функции по г-й координате: dh _ dfm dxi * ’ ’ dxi Df=.............. dfi dfm dzn •'• dxn 102
Ранг этой матрицы (т. е. максимальное число линейно неза- висимых столбцов) не превосходит т. Обозначим те точки, где ранг Dj — т — I. через 2г(/). Тогда известная теорема утверждает, что для типичного отображения / множество 2г(/)есть гладкое многообразие в X размерности п — in + im — i2 (если вдруг получилось, что это число отрицательно, то 2г(/) пусто). Здесь все-таки надо сделать несколько разъяснений о том, что такое «типичное» или «общее» отображение /. Подробное и строгое изложение увело бы нас слишком далеко, поэтому мы будем гово- рить на неформальном уровне. Множество функций или отобра- жений само очень похоже на многообразие, только бесконечной размерности. Утверждение о том, что некоторое свойство явля- ется типичным, или общим эквивалентно тому, что совокупность отображений или функций, этим свойством не обладающих, об- разует по отношению к этому многообразию такое же подмноже- ство, как, скажем, линия по отношению к плоскости или поверх- ность по отношению к пространству. Интуитивно ясно, что типич- ная или общая точка плоскости не лежит на данной линии, равно как и некоторая ее окрестность. С другой стороны, если вдруг мы столкнулись с точкой, лежащей на этом неприятном множестве (линии, поверхности ...), то сколь угодно малое шевеление точки снимает ее с этого множества (рис. 6.2). Таким образом, типичное свойство является «грубым» в терминологии специалистов по ав- томатическому управлению, или «выполняющимся с вероятно- стью 1». Мы надеемся, что в той или иной степени разъяснили смысл терминов «типичность» или «общность» для читателя, не интере- сующегося основаниями теории особенностей, и будем употреб- лять их далее без подробных объяснений. За более строгими оп- ределениями отсылаем читателя к многочисленным учебникам. Итак, мы видим, что для общих критериальных отображений совокупность экстремальных точек 2^ = S1 (/) образует (при п > т) подмногообразие размерности т — 1, в котором лежат множества локально-оптимальных и оптимальных точек. Подроб- но структура множества локально-оптимальных точек обсужда- ется в разд. 6.3, а мы сейчас перейдем к выяснению условий ло- кальной оптимальности. 6.2. Условия локальной оптимальности Этот раздел посвящен необходимым и достаточным условиям локальной оптимальности, а также выяснение того, насколько они исчерпывающи. Как уже отмечалось, локальная оптималь- ность точки х зависит лишь от свойств отображения / в окрестно- сти точки х и верхнего среза в точке f(x). Поэтому на протяже- нии этого раздела мы будем считать, что X = Rn, х = 0 е Rnf f(x) — 0, a будем для краткости обозначать через К. Введем еще несколько дополнительных определений. Назовем 103
Рис. 6.3. Касательный конус касательным конусом в К в 0 множество векторов у, таких, что выполнено следующее условие. Существует е > 0, такое, что для | z | е и достаточно малых т множество {t(y + 2)}, 0 t < т лежит в К (см. рис. 6.3). Этот касательный конус будем обозначать через ТК. Очень легко проверяется следующее свойство: ТК является открытым геометрическим конусом, т. е. ?/ Е ТК ==> достаточно малый шар с центром в у, и луч из 0 в у лежат в К. Теперь мы можем уточнить утверждение теоремы 6.1 и тем самым усилить необходимое условие 1-го порядка. Теорема 6.2. Если точка является локально-оптимальной, то образ Df в этой точке не пересекается с ТК. Доказательство. Пусть вектор х е= К — Rn таков, что D^y ЕЕ ТК (напомним, что Df — линейный оператор из Rn в R™). Воспользуемся теперь формулой Тейлора f{tx) = /(0) + tDfx + g(x), I g(t)\/t -> 0, t -+ 0. Вектор у — DfX ЕЕ ТК, откуда и tDfX — ty также лежит в ТК. Более того, выберем е и как в определении касательного конуса, а т2 таким, чтобы при t < т2| g(t) \/t + <^е. Тогда вектор f(tx) = t(у + g(t)/t) при t <Z min(r1T2) лежит в К. Но это, оче- видно, противоречит локальной оптимальности нашей точки, что и требовалось показать. В данном доказательстве хорошо виден основной прием, при- меняемый для доказательства необходимых условий локальной оптимальности, именно: ищется некоторое семейство кривых, проходящих через «подозреваемую» на оптимальность точку (в теореме 6.5 — кривые вида tx), а затем переводится на геомет- рический язык требование, чтобы ни одна такая кривая не отобра- жалась бы «внутрь» К. Пусть Z = Rn\ К, a TZ — касательный конус к Z. Рассмотрим случай п < ш. Здесь можно сформулировать простое достаточное условие оптимальности, близкое к теореме 6.2. Теорема 6.3. Пусть п < m и rank Df — п. Тогда, если Im Df \ {0} GZ TZ, то точка 0 локально-оптимальна. 104
Доказательство. Из условий вытекает, что Im Df — линейное подпространство в Rn размерности п, целиком (кроме О!) лежащее в TZ. Так как и Im Df, и TZ — суть конуса, то они определяются своими пересечениями с единичной сферой S в R™s которые можно рассматривать как их базы: Im Q S = Af TZ P| S = В. Так как В открыто в S, а А замкнуто и A CZ В, то можно выбрать е 0, такое, что е — окрестность А также ле- жит в В. Рассмотрим теперь квадратичную функцию в Rm, кото- рая совпадает с | • |2 на ортогональном дополнении к Im Df и обра- щается в 0 на Im Df (такая функция, очевидно, существует; ее легко построить явно), обозначим ее через <рх. Положим ср = = фх — е | - |2. Тогда из построения вытекает, что ср | Im Df е I * I2» а ф1к 0. Теперь в силу формулы Тейлора имеем ф (/ (*г)) = Ф — 0 (|я|)). Так как, по условию максимальности ранга Df, | Dtx | const | х |, то ф (/ (ж)) —a const |rr|2 + + 0 (|а?|2), откуда при х, достаточно близких кО, ф (/ (х)) <С 0, т. е. образ малой окрестности 0 не задевает К, что и требовалось. В этих рассуждениях видно, что доказательство достаточных условий в некотором смысле «двойственно» доказательству необ- ходимых: в первом случае рассматривается класс кривых и усло- вие выводится из того, что ни одна из этих кривых не «залезает» в К; во втором — ищется функция, принимающая разные знаки на К и образе /, откуда, естественно, вытекает пустота их пересе- чения. Такие функции мы будем называть отделяющими. Преимущество приведенных рассуждений перед обычными ссылками на компактность, лемму об отборе кривых и т. п. в том^ что они не используют, по-существу, конечномерности задачи и легко обобщаемы. Попробуем понять, что конкретно означает условие теоремы 6.2 для паретовского сравнения, т. е. для К = R™. (Ясно, что в этом случае ТК есть внутренность положительного ортанта.) То, что образ Df не пересекается с открытым положительным ортантом, означает (так как Im Df — линейное подмногообразие в Rm), что существует целая гиперплоскость Н, содержащая ImZ>^ и не пересекающаяся с этим ортантом. (Это легко вывести для любого открытого выпуклого ТК. Данный частный случай остав- ляем читателю в качестве упражнения.) Эта гиперплоскость задается некоторым уравнением = 0, не равны все 0. Из того что Пне пересекается с Int R™, получаем, что все 0. Матрица Df определяет линейный оператор из Rn в R™. То, что образ этого оператора лежит в гиперплоскости Н, означает, что столбцы ее, будучи сложенными с коэффициентами дают нуле- вой вектор. Таким образом, для паретовского Я мы получим. Следствие 6. 1. Точка является локально-оптимальной по Парето, только если выпуклая оболочка градиентов критериаль- ных функций содержит 0. Вообще, если сравнение Я в R™ является конусным и тран- зитивным (см. гл. 2), т. е. задается выпуклым конусом К, то пус- тота пересечения Im Df с ТК равносильна тому, что Im Df содер- 10В
жится в некоторой гиперплоскости Н, задаваемой уравнением I (х) = = 0, причем I (х) на К неотрицательна. Совокупность линейных функционалов Z, неотрицательных на выпуклом конусе К. обозначается через К*. Очевидно, проверяется, что К* — это геометрический конус, и что а) К* всегда замкнут; б) (/£*)* = /£*, если К замкнут; в) если К содержит прямые, то Int К = ф (здесь подразумева- ется, что К* вложен в лг-мерное пространство линейных функцио- налов на Rm, это пространство само обозначается R™*). Итак, мы можем переформулировать теорему 6.2 так: Теорема 6.4. Если точка 0 локально-оптимальна по транзитив- ному конусному сравнению, задаваемому конусом К, то сущест- вует I ЕЕ /Г*, такое, что l&Df = 0, или что VZ(ZoZ) = 0. Отметим, что условие rank/)/<C т также эквивалентно сущест- вованию Z ЕЕ (Rw)*, Z Ф 0; такого, что UDj= 0, но не дает никаких ограничений на это Z. Таким образом, теорема 6.4 уточняет поня- тие экстремальной точки, которое пока не зависело от сравне- ния Я. Теперь в случае, когда Я такое, как в теореме 6.4, введем понятие /^-экстремальных точек, т. е. таких, в которых сущест- вует Z-свертка градиентов критериальных функций, обращающая- ся в 0, с Z ЕЕ К*. Совокупность таких точек будем обозначать через Kf. На рис. 6.3 показаны точки и Kf. В качестве иллюстрации результатов, приведенных выше, рассмотрим вопрос об оптимальности в смысле мажоритарного правила в гладкой ситуации. Пусть размерность т нечетна, т = 21 + 1, в Rm задано относительное сравнение Я, такое, что одна точка превосходит другую, если она доминирует по ка- ким-либо (Z + 1) критериям. Иными словами, Я есть объединение С2Т+1 паретовских сравнений по Z + 1 критериям. Предположим, что точка 0 ERn локально-оптимальна относи- тельно критериального отображения /. Что из этого вытекает? Рассмотрим любой набор из (Z 4- 1)-го критерия. Согласно след- ствию 6.1, градиенты этих критериев в точке 0 должны быть линейно зависимы, и ранг соответствующей подматрицы, состав- ленной из частных производных выбранного набора критериев, не превосходит Z. Так как это верно для любого набора из Z 4~ 1 градиента, то ранг матрицы Df также не превосходит Z. Иными сло- вами, все градиенты лежат в линейном подпространстве размер- ности (на самом деле, ^min(Z, п)). Будем обозначать это подпространство через L. Используем теперь более точно следствие 6.1. Если точка 0 мажоритарно недоминируема, то выпуклая оболочка любых (Z + 1) градиентов содержит 0. Итак, в подпространстве L раз- мерности к min (n, Z) задано 21 4- 1 векторов хъ . . ., т2/+1, из которых выпуклая оболочка любых Z 4- 1 содержит 0. Выберем какую-либо гиперплоскость Н в L, проходящую через 106
О и не содержащую ни один из векторов (если это возможно). Тогда, очевидно, по одной из сторон Н лежит не менее I + 1 век- тора нашего набора, выпуклая оболочка которых не может содер- жать 0. Отсюда Н обязана содержать один из векторов, а зна- чит — один из градиентов обращается в нуль. Предположим, что только один вектор (например, х) равен нулю. Рассмотрим тогда некоторый отличный от нуля вектор на- шего набора. Если прямая, проходящая через и 0, не содержит более векторов х^ j 1, Z, тогда можно найти гиперплоскость Н', содержащую лишь векторы хг и Xi из набора. По одну сторону от этой гиперплоскости лежит не менее I векторов набора, выпуклая оболочка их и хг не содержит 0. Значит, для всякого вектора Х[ есть вектор х^ ему кратный. Итак, мы получили, что либо в матрице Df есть два нулевых столбца, либо в ней есть один нулевой столбец и для каждого нену- левого есть ему кратный. Может ли такая ситуация возникнуть для типичного f ? Обра- щение в нуль одного градиента для типичной функции наблюда- ется в изолированных точках. Градиент другой функции в этих точках (для общего набора функций, а стало быть, и градиентов) в нуль не обращается. Значит, для каждого градиента, не равного нулю, найдется кратный ему. Но это, опять-таки, нетривиальное условие, которое в данной точке (где df\ — 0) выполняться не обязано, если только п =/= 1. Если же п = 1, то любой вектор кра- тен любому. Итак, мы пришли к выводу, что для общего критериального отображения локально-оптимальные по мажоритарному отноше- нию точки могут возникать лишь при п = 0 (т. е. X — дискрет- ный набор точек) или п = 1 (рис. 6.4). Таким образом, успешное применение мажоритарного правила априори может быть лишь на конечных предъявлениях или линиях. Попытки распространить его на другие континуальные предъяв- ления неизбежно (если не пытаться, конечно, подгонять критерии под задачу!) приводят к «парадоксальным» ситуациям теории го- лосования и к возникновению массы работ, пытающихся в них разобраться. Возвращаясь к доказательству последнего результата, следует отметить, что в теории особенностей есть универсальный способ унификации рассуждений типа «в точке, где градиент одной функ- ции равен нулю, другой не равен...». Этот способ называется сильной теоремой трансверсальности Тома. Далее мы будем ее использовать, поэтому уделим ей некоторое место. Смысл этой теоремы заключается в том, что она позволяет, вме- сто того чтобы проводить рассуждения типа описанных выше, под- считывать некоторые размерности. Представим себе, что на X заданы какие-то гладкие функции Л,...,/™ (или, что то же, отображение X —> R™), и некоторые условия на значения этих функций (например, /х = 0, /2 = 2, . . .). Тогда совокупность точек, в которых эти условия выполняются^ 107
Рис. 6.4. Мажоритарное отно- шение: локально-оптимальные точки будет для общего набора . ., fm гладким подмногообразием размер- ности п — числа условий. Это, ин- туитивно, более или менее очевид- ное утверждение составляет содер- жание слабой теоремы трансверса- льности. Оказывается, оно может быть значительно усилено: можно раз- решить накладывать условия не только на значения самих функций, но и на значения производных, d/2 a d3f* / о априм.р, g-= 6, —/, = 3 „ т. п. При этом, если число условий (разумеется, независимых) есть к, то для общего набора ft совокупность точек, где они выполняются, есть гладкое подмногообразие X размер- ности п —- к. Это, по-существу, и есть сильная теорема тран- сверсальности. Так, условие локальной оптимальности точки по мажоритарно- му отношению, как мы видели выше, может быть записано в виде объединения систем условий, в каждой из которых слишком много независимых, что приводит к пустоте соответствующего множества. Обсудим теперь вопрос о достаточных условиях. Выше было приведено достаточное условие для случая п < т теорему 6.3). Характерным в нем было то, что оно формулировалось в тер- минах первых производных функций /г, как и необходимые усло- вия. Поэтому их называют условиями первого порядка. Отме- тим, что существование достаточного условия первого порядка резко контрастирует с однокритериальным случаем. Однако при п т аналогия восстанавливается, и для формулировки доста- точного условия требуются производные второго порядка. Пусть точка О Rm локально /^-экстремальна, где К — замк- нутый выпуклый телесный конус в Rm. Это значит, что существует 10 ЕЕ К* : KoDf = 0. Пусть — гессиан функции Хо/, т. е. матрица из частных производных дх. дх, j к = ^к Теорема 6.5. Пусть Н — отрицательно определена на множестве т. е. для g е= Rn, таких, что Df% ЕЕ /С £ =И= 0, /У (£, £) = = SA7-fc|7£ft < 0. Тогда точка 0 локально-оптимальна. Доказательство. Будем проводить его методом отде- ляющих функций. Пусть А = {£ : Н(£, £) 0}; А — замкнутый конус в R'*. Так как A Q {Df)~[K — 0, то для любого Л р| 108
Рис. 6.5. Поле ядер f] Sn~l есть л Е А7* : kDf1- < 0, так как К и, следова- тельно, отделим от него линейным функционалом. Так как XDf отрицателен на окрестности g, получаем покрытие А, из которого в силу компактности A Q Sn~2 можно выбрать конечное подпо- крытие. Другими словами, можно найти конечное число 2^ ЕЕ А”*, таких, что объединение открытых полупространств Lt == = {х : KiDf -x < 0} покрывает А \ 0. Отсюда объединение откры- тых конусов {£ : #(£, Ю <0} покрывает Rn, а объедине- ние их баз — сферу 5П-1. Согласно стандартным теоремам тополо- гии, можно выбрать меньшие открытые конусы Li СЕ Ьь В СЕ СЕ {$ : Я(£, £) < 0}, такие, что их замыкания лежат в Lb {£: Я(£.£)< 0} соответственно, а объединение вновь есть Rn \ 0. Для каждого из существует ег- 4> 0, такое, что на Li П Ше. функция отрицательна. Действительно, очевидно, что первая производная сужения на луч из Li квалифицирован- но отрицательна, а вторая ограничена, откуда следует искомое. Покажем, что существует е0, такое, что на В р| Шво функция Хо/ отрицательна. Действительно, сужение Ло/ на любой луч из В имеет нулевую первую производную, квалифицированно отрица- тельную вторую п ограниченную третью, откуда вытекает требуе- мое. Итак, явно предъявлены функции на Rm (точнее, линейные функционалы), положительные на К и такие, что их поднятия на Rn в некоторой окрестности 0 отрицательны (кроме 0), что доказы- вает требуемое. х2 Рассмотрим простой пример. Пусть п = т = —------f- xv /2 =----у- 4- xv К — паретовский. Подозреваемая точка: (1, 1). 1 2 или — в2 > о, ~ > 0, откуда = g8. Гессиан = - 1 0\ 0 — 1 / ' Очевид“ но, что квадратичная форма, определяемая ею, отрицательна /— 1 l\/g Находим Хо = (1, 1), если Df %ЕК, то ( 1/\| х1 [ %* ---9 — + «гг + х2 есть матрица вида 109
на векторах вида (Е, £), да и на всех векторах, не равных 0. Зна- чит, точка (1, 1) локально Jf-оптимальна (на самом деле, и гло- бально, см. рис. 6.5). Насколько это достаточное условие далеко от критерия ло- кальной оптимальности? Оказывается, для случая, когда rank Df = т — 1, существует очень близкое к теореме 6.6 необ- ходимое условие 2-го порядка. Теорема 6.6. Пусть X0D/ = О, /.0 #= 0, точка 0 локально К-оп- тимальна. Тогда на (Dt)~xK гессиан функции неположитель- но определен, т. е. Df ЕЕ К =$ Н (£, £) <1 О Доказательство в духе общей схемы сводится к по- строению надлежащей кривой в Rn, образ которой лежит в К. TlywbDf Е е КъН (I, £)>0. Рассмотрим кривую vt = f(t% е R™< d2p I Пусть v2 =.I . Вектор v2 EE Rn лежит по ту же сторону от гиперплоскости {Хо = 0}, что и конус К. Выберем вектор v из внутренности К так, чтобы v — v2 ЕЕ Im Df (что, очевидно, мож- но сделать). Рассмотрим параболу vt == tvr + t2 (v — Vj), где dVf । 1 . Очевидно, что если е-окрестность точки и ле- жит в К, то и е^2-окрестность точки vt лежит в К. Рассмотрим кривую в Rn вида + £2ц, где Df ц = и — vr. Выписав ряд Тейлора для /(^ + £2ц), получим, что образ ее ле- жит в О (Z3) — окрестности vt, что и доказывает теорему. Обобщение на случай произвольного ранга выглядит так: Пусть л : Rn -> Rn/Im Dt — проекция вдоль образа Df, Q = = л (К), Тогда, если образ (Df)~iK при композиции квадратич- ной части / и проекции л пересекаются с Q, то рассматриваемая точка локально не оптимальна. Доказательство этого полностью аналогично предыдущему. Итак, «зазор» между необходимыми и достаточными условия- ми остался. Однако в многокритериальном случае он «шире», чем в однокритериальном. Действительно, если общая функция — морсовская, т. е. такая, для которой необходимые и достаточные условия локальной оптимальности в экстремальных точках сов- падают, то в многокритериальном случае вполне может возник- нуть неустранимая ситуация, когда о части точек мы ничего не сможем сказать с помощью наших условий второго порядка: ни гарантировать их оптимальности, ни локальной доминируемости. Причина этого, разумеется, в том, что оптимальных по конусу точек слишком много. Разумеется, можно, исходя из метода кривых и отделяющих функций, расширить иерархию необходимых и достаточных условий. Эти условия будут использовать все более высокие по- рядки производных и срабатывать в тех ситуациях, где буксуют менее тонкие условия. Но где гарантия, что есть конец этим тон- костям, что существует конечное число производных, зная значе- ния которых мы сможем для общего набора функций /1? . . ., fm разделить все точки X на локально-оптимальные и заведомо таки- 110
ми не являющиеся. Оказывается, такое конечное число суще- ствует. Приведем его оценку. Пусть Л — произвольное полуалгебраическое множество в R™. Скажем что г — струя отображения / в точке х — «^-доста- точная, если для любого отображения имеющего в х производ- ные порядка <>, совпадающие с производными /, множество /’ЦЛ?) не пересекается с окрестностью х, если и только если (f')-1(^?) не пересекается с окрестностью х. Отображения с доста- точными струями чрезвычайно удобны для выработки критерия локальной оптимальности (здесь конечно же,— верхний срез некоторого бинарного отношения в точке f(x)). Действительно, достаточно взять полиномиальное отображение с теми же произ- водными в х, что и у / и проверить, пересекается ли образ окрест- ности х под действием полиномиального отображения с полуал- гебраическим множеством. Это может быть легко осуществлено алгоритмически с помощью метода Тарского — Зайденберга. Таким образом, для существования эффективного алгоритма разбиения X на локально-оптимальные и нелокально-оптимальные точки по значениям фиксированного числа производных было бы достаточно, чтобы для некоторого г и общего набора функций не- достаточные струи не встречались бы (если бинарное отношение в Л — полуалгебраическое). Оказывается, имеет место замечательная ситуация. Пусть для общего набора совокупность точек X, в которых r-струи недо- статочны, имеет размерность I. Тогда совокупность точек, где {г + 1)-струи недостаточны, имеет размерность не более I — 1. Таким образом, для общего набора /г-, взяв достаточно большое г (например, большее м), можно добиться отсутствия точек с не- достаточными струями и, значит, потенциальной возможности алгоритмической проверки на локальную J^-оптимальность всех точек X. Доказательство предыдущего утверждения опирается на ряд технических результатов, таких, как подготовительная теорема в форме Мальгранжа и теорема Тома об изотопии, обсуждение ко- торых увело бы нас далеко, и поэтому не приводится. Отметим в заключение раздела, что для Л, заданного выпук- лым конусом К, можно оценить размерность множества точек с недостаточной 1-струей как min(m, п) — 1, откуда следует оцен- ка на г = min (m, п) + 1 — знания производных такого порядка достаточно для относительных сравнений, чтобы выделить все ло- кально-оптимальные точки. 6.3. Структура оптимума Перейдем теперь к изучению того, как устроено множество ло- кально-оптимальных точек в многообразии параметров Хп от- носительно критериального отображения / : Хп —> R™. Вообще говоря, это множество устроено очень сложно. Эта сложность (в отличие от простой структуры множества локальных 111
максимумов для морсовских функций) проявляется устойчиво и отражает нетривиальность акта сравнения в Rw. Далее мы огра- ничимся случаем бинарных отношений в Rm, определяемых вы- пуклым телесным конусом К, который задается алгебраическими неравенствами, и не содержит прямых. Выше была введена иерархия множеств Эу CZ Kf CZ Sy; ло- кально-оптимальные точки составляют подмножество локально- экстремальных точек, которые, в свою очередь, лежат в множе- стве Sy- = S1^) — многообразии Бордмана — Тома точек, где ранг Df < min(?n, ri). Фактически изучение локальной структуры каждого из этих множеств содержит сложные моменты и ведется последовательно: в Sy выявляются точки из Kf, а в Kf — точки из Эу. Займемся сначала вопросом о том, насколько хорошо устроено множество Sy. Как уже упоминалось, в Sy = S1 (/) содержится целая иерар- хия подмножеств SJ (/) ZD S2(/) ZD • • - где S1 (/) — это те точки, в которых ранг матрицы Df меньше общего (т. е. min(m, «)) на i. Пусть п т. Теорема 6.7. Для общих критериальных отображений S1 (/) \ S2 (/) является гладким многообразием. Чтобы лучше понять смысл этой теоремы, надо упомянуть, что возле точек из S2 (/) S1 может быть очень сильно особым. Харак- терный пример: п = т = 4, /i = х±х2 + х4х3 + яг2.г4, /2 = *Г1 ~ Х2 + V3 ~ — х4х4^ f3 — <г3, /4 = х4. Несложными вычислениями можно найти, что в точке 0 ранг Df = 2, т. е. О ЕЕ S2, в окрестности нуля множество S1 (/) зада- ется уравнением х? + х4 — х$ — х?3 — 0 и, стало быть, негладко в нуле, и что эта ситуация сохраняется для любого отображения /, достаточно близкого к приведенному со всеми своими производ- ными. Иными словами, этот пример показывает, что, вообще го- воря, в окрестности S2 множество S1 не гладкое. Таким образом, теорема 6.7 гарантирует нас от довольно не- приятного явления в случае отсутствия точек типа S2. Доказатель- ство этой теоремы использует нормальные формы Морена и здесь воспроизводиться не будет. Когда же на X отсутствуют точки типа S2? Мы знаем, что при п~^ т размерность S* (/) в X для общих f есть п — i (п — m + I). Соответствующее множество пусто, если эта размерность отрица- тельна. Отсюда получаем условие п — 2 (п — m + 2) < О, или п 2m — 4. Итак, при п 2m — 4 множество S1 (/) является гладким подмногообразием в X. Какую же часть в S (/) составляет множество Kf? Для того что- бы ответить на этот вопрос, напомним два понятия. Стратифицированное подмножество многообразия X — это на- бор из некоторого числа (может быть, бесконечного) подмного- образий различной размерности (эти подмногообразия называются стратами), таких, что замыкание любого страта лежит в объеди- 112
Рис. 6.6. Стратифицированные подм- ножества Рис. 6.7. Многообразие с углами нении этого страта и конечного числа стратов меньшей размер- ности, причем выполняются некоторые условия регулярного при- мыкания стратов разной размерности. Мы не будем выписывать эти условия (то, что запрещено, показано на рис. 6.6), укажем лишь, что, согласно теории Уитни, множества, задаваемые ана- литическими уравнениями и неравенствами, или получаемые из них диффеоморфизмом объемлющего пространства, удовлетворяют этим условиям. С достаточной степенью точности читатель может отождествить эти понятия. Многообразием с углами называется множество, которое ло- кально задается как кусок Rn, выделяемый к п неравенствами вида хг 0, . . Очевидно, что многообразие с углами есть стратифицированное подмножество объемлющего простран- ства; обратное, конечно, неверно. На рис. 6.7 — примеры много- образий с углами (на рис. 6.6 их нет). Эти понятия введены, потому что единственное, что известно про Э/ и Kf в общей ситуации, это Теорема 6.8. Пусть X — компактное многообразие. Тогда для общего набора критериальных функций/и Эу, и — стратифици- рованные подмножества X. Доказательство технически довольно сложно и использует много понятий теории особенностей, здесь не обсуждавшихся, и поэтому не будет воспроизводиться. Отметим лишь, что, соглас- но теоремам об условиях локальной оптимальности предыдущего раздела для общего отображения / и конуса К. задаваемого алгеб- раическими неравенствами, условия критичности и локальной оптимальности — это алгебраические .условия на производные критериального отображения /. В сочетании с теоремами транс- версальности этот факт показывает, что ничего удивительного в стратифицируемое™ Э/ и Kj нет. ИЗ
fft? fw) Рис. 6.8. и Kf Для Насколько велики стратифици- рованные (в общем случае) под- множества df и В случае с Kf ответ более или менее очевиден. Именно, Kf — замкнутое подмно- жество в 2 у, совпадающее с за- мыканием своих стратов размер- ности (т — 1). Интуитивно Kf есть образ базы двойственного к К конуса К* при следующем многозначном отображении. Пусть |Х| = 1, А = - скалярная свертка критериев. Тогда 0(Х) = {х ЕЕ X: градиент А в х = 0}, т. е. 0 (X) — сово- ~ купность критических точек А- г 1 Очевидно, кто Kf есть объединение 0(Х) повсемХ ЕЕ К*, |Х | — 1. конуса К, выпуклого и не содержащего прямых, К* П 5т-1 — (т — 1)-мерное подмножество (стратифицирован- ное). Нетрудно проверить, что для общей точки X производная (правильно понимаемая!) отображения 0 невырождена, откуда и получается (т — 1)-мерность образа. Точки же, где производная вырождена, образуют для общих X собственное подмножество в откуда и получается плотность (т — 1)-мерных стратов в Kf. Подробности мы снова опускаем. Устройство df немного более сложно, чем Kf. Дело, конечно,, в том, что df выделяется условиями более высокого порядка, чем Kf. Более того, df — не замкнутое множество (см. рис. 6.8). Однако для общего / df лежит в замыкании своих (т — ^-мер- ных стратов. Не следует, однако, думать, что df получается из связных кусков Kf выбрасыванием каких-либо стратов границы dKf, как на рис. 6.8. Граница замыкания Эу лежит в объединении трех множеств: границы Kf истратов Бордмана—Тома 22(/) [J S1,^/). Опишем последний подробнее. Как мы видели ранее, 2Ц/) — 2у есть (т — 1)-мерное многообразие (с особенностями), лежащее в X. На X задано критериальное отображение /. Сузим его на Sy, т. е. рассмотрим отображение f: 21 (/) —> Rm. Если в некоторой точке 2/ гладко, то можно ввести производную отображения f и следить за ее рангом. Те точки, где он падает (т. е. становится меньше т — 1), и есть точки S1»1^). Влияние границы Kf на границу df очевидно; в 22 страт S1 теряет гладкость, а 2М воз- никает из условия 2-го порядка, а если сужение гессиана на ядро Df меняет сигнатуру (перестает быть положительно определен- ной), то точка должна лежать в 21»1 или в S2. Последнее — из по- нятий теории особенностей. Размерность множества 2М(/), как и множества 22(/), может быть явно указана для общих /, она равна п — (п — т + 1) 2 = 114
= 2т — п — 2. Если 2т — 2, то для общих / S1*1 и S2 пусты. В этом случае, разумеется, замыкание Эу совпадает с целы- ми связными компонентами Kj. Обсудим теперь, каковы эти компоненты при 2 т — 4, т. е. когда Sy — гладкое многообразие в X. Пусть в R задано конеч- ное число лучей в общем положении, т. е. никакие к из них не со- держатся в линейном пространстве размерности (при к /л), а конус К есть их выпуклая оболочка. Тогда имеет место следующая Теорема 6.9. Для общего / множество Kj есть многообразие с углами. Доказательства мы не приводим. Отметим лишь, что хотя К П — не обязательно многообразие с углами, К* р] 8т~г — обязательно им является, и что именно это обстоятельство и опре- деляет структуру Kj. Вообще неформальный принцип, интуитив- но ясный из рассмотрения О, гласит, что особенности границы Kj имеют тот же тип, что и особенности границы Л*. Приведем, наконец, теорему о свойствах Эу и Kj, весьма важ- ную в приложениях. Пусть X = R . Теорема 6.10. Пусть для любого Л ЕЕ р] Sm~x функция Д = строго выпукла на X. Тогда Эу = Kj. Доказательство. Из строгой выпуклости Д следует, что Д имеет ровно один экстремум х^ ЕЕ Kj. Наоборот, для каж- дого х Kj существует к ЕЕ К*: х есть экстремум Д. Покажем, что х ЕЕ Эу. Действительно, образ f(x) лежит по одну сторону от гиперплоскости SXj*(z/f —Д (х)) — 0, пересекаясь с ней в од- ной точке f(x), а конус К — по другую, что и требуется. Очевидно, что если S2 = ф, то Эу = Kt диффеоморфны (по- средством невырожденного в этом случае отображения О) базе конуса К* р| S™"1. Упомянем в заключение о «глобальных результатах» типа тео- рии Морса. Эта теория, грубо говоря, оценивает снизу число критических точек разного типа общей функции. Имеются неко- торые результаты и в оценке числа компонент Kj разных типов для общих критериальных отображений. Наибольший прогресс здесь достигнут для случая т — 2.
ПРИЛОЖЕНИЕ Анализ некоторых методов многокритериальной оптимизации Выделение множества Парето при решении многокритериальных задач часто не является удовлетворительным решением. Это связано с тем, что при до- статочно большом исходном множестве вариантов множество Парето оказы- вается недопустимо большим для того, чтобы ЛПР было бы в состоянии осу- ществить окончательный выбор самостоятельно. Таким образом, выделение множества Парето можно рассматривать лишь как предварительный этап оптимизации, и налицо проблема дальнейшего сокращения этого множества. Наиболее логичным и последовательным представляется путь построения бинарного отношения предпочтения, более сильного, чем отношение Парето, позволяющего сузить множество выбираемых вариантов до приемлемых с точ- ки зрения ЛПР размеров. Разумеется, что для этого потребуется некоторая дополнительная информация, которую придется получить от ЛПР. Это может быть информация о критериях, о самих сравниваемых вариантах и т. д. Задача, стоящая перед создателями методов, заключается в том, чтобы с по- мощью этой информации обосновать своп действия по сужению выбора и гарантировать ЛПР от того, чтобы ни один из вариантов, представляющих для него интерес, не был потерян в процессе оптимизации. Необходимо отметить, что необоснованность сужения множества Па- рето является существенным недостатком многих методов многокритериаль- ной оптимизации. Мы рассмотрим два метода оптимизации, наиболее близких по идеоло- гии к методу порядковой оптимизации, изучаемому в настоящей книге. Бу- дет проведен сравнительный анализ методов. П1. Методы ЭЛЕКТРА Группа методов (ЭЛЕКТРА I, ЭЛЕКТРА II, ЭЛЕКТРА III) предложена про- фессором Б. Руа (Франция). В этих методах бинарное отношение предпочте- ния (более сильное, чем отношение Парето) строится следующим образом. Для каждого из п критериев (предполагается, что критерии числовые) определяется вес — число, характеризующее важность соответствующего критерия (оно тем больше, чем важнее критерий). Для того чтобы опреде- лить, превосходит ли вариант х — (#i...xn) вариант у = (^...г/п)? произво- дятся следующие действия. Множество / критериев разбивается на три подмножества: /+(х, у) — критерии, по которым х превосходит у; Г= (г, у) — критерии, по которым х и у имеют одинаковые оценки; /“(х,?/) — критерии, по которым у прево- сходит х, Далее определяется относительная важность Рху, Р^у, Р~у каждого из этих подмножеств (по своему для ЭЛЕКТРА I, II, III) —числа, в некотором смысле аналогичные весам. Устанавливается некоторый порог с и считает- ся, что вариант х превосходит вариант у только в том случае, когда некото- рая функция (называемая индексом согласия) удовлетворяет условию f(Pxy,Pxy,P~xy)>c. (П.1) Вид функции f также определяется по своему в каждой модификации ЭЛЕКТРА. Очевидно, что отношение, определяемое (П.1),— порядковое (см. гл. 3). 116
Условие (П.1) является необходимым, но недостаточным условием пре- восходства х над у. В методах ЭЛЕКТРА формулируются дополнительные условия, которые предназначены учитывать-не только порядок следования оценок х и у по критериям, но и значения xt — yt их разностей. Эти условия (называемые индексом несогласия) могут быть записаны в виде dxy < d, (П.2) где d — пороговое значение индекса несогласия; dxy для каждой модифика- ции ЭЛЕКТРА определяется по-своему. Причина введения этого условия станет понятна несколько ниже. Таким образом, отношение предпочтения определяется так: Р^Х, Рух)>С f\dyX<d (П-3) Далее создатели ЭЛЕКТРА отступают от традиционного выделения подмножества недоминируемых вариантов. Они предлагают, следуя ме- тодам теории игр, несколько расширить это подмножество путем выделения в исходном множестве ядра, все элементы которого несравнимы между со- бой, и любой вариант, не вошедший в ядро, домпнируется хотя бы одним элементом ядра. Выделение ядра на множестве исходных вариантов является заключи- тельным этапом методов ЭЛЕКТРА. Дальнейшее его сужение может быть до- стигнуто заданием других, более жестких ограничений в условиях (II. 1) и (П.2), т. е. увеличением порогового значения индекса согласия с и умень- шением порога индекса несогласия d. Проведем анализ описанного метода. На первом этапе (во всех модификациях ЭЛЕКТРА) с помощью Л ПР определяются веса критериев — положительные действительные числа, которые тем больше, чем важнее соответствующий критерии. Такой подход, как совершенно очевидно, имеет сугцественный недостаток — неоднозначность определения весовых коэффициентов. Так, в примере из [51] при назначении весов критериям, по которым предстоит выбрать автомобиль, от Л ПР по- лучается следующая информация: цена (критерий 1), важнее комфортности (критерий 2), а та, в свою очередь, важнее, чем скоростные качества (крите- рий 3) и внешний вид автомобиля (критерий 4). Кроме того, критерии 3 и 4 имеют одинаковую важность, а, рассматриваемые совместно, имеют большую важность, чем критерий 1 (цена). Таким образом, Л ПР сообщает информацию о критериях качественного типа. Авторы предлагают в соответствии с этим назначить веса pi (i — 1, ...,4), так, чтобы выполнялись соотношения Pl Ръ Рз = Рп Рз + > Ри а именно рг ~ 5, р2 = 4, р3 — р± = 3. Понятно, однако, что это решение да- леко не единственное. Например, соотношения не изменятся, если все веса увеличить на положительную константу. Следует подчеркнуть, что все известный попытки перевода чисто качественной информации о критериях в числовую (весовые коэффициенты) всегда приводят к подобной неоднознач- ности. Далее определяются важности групп критериев 1+(х, у), 1^(х, у), 1~ (<г, у), как сумма весов, входящих в них критериев: 4У = S Pi (*s {+.-,=})• iei*(x,v) В качестве условия (П. 1) предлагается (ЭЛЕКТРА I) взять выражение вида 4- , л х О <пл) S'". 1 где п — число критериев, 117
или (ЭЛЕКТРА II) выражение вида Р+ ух Р~ ху Со (П.5) когда число совпадающих Заметим, что условие (П.4) можно применять лишь тогда, когда сравне- ние вариантов происходит в строгих шкалах (тогда множество Р^у пусто) или оценок у различных вариантов достаточно мало по сравнению с п. В противном случае отноше- ние предпочтения может оказаться симметрич- ным (х лучше у и у лучше х одновременно). В этом случае следует пользоваться усло- вием (П.5). Упражнение. Какое из условий (П.4) и (П.5) более сильное? Когда эти условия стано- вятся эквивалентными? Опишем теперь этот метод в терминах верх- них срезов, принятых в данной книге. Рассмотрим бинарные отношения D'1 и %2Г определяемые условиями (П.4) и (П.5). Поскольку разбиение множества критериев на подмножества /+, 1=, 1~ осуществляется только на основании порядковой информации о сравниваемых вари- антах х и у, то, как уже было сказано, эти отношения являются по- рядковыми. Так, в методе ЭЛЕКТРА I верхний срез определяется следую- щим образом: Рис. Ш. Верхний срез отношения тУ S (.Й1) = = (М1 . . . U г): J1, > С1 У, (4" < С1 < 1 i:sgn ирч) В методе ЭЛЕКТРА II 5(^?2)={и: 2 Pi>c2 pii i:sgn i:sgnu£<o Порядковые отношения «%1 и J22 являются модификацией мажоритарного порядкового отношения (см. разд. 3.2), в определении которого все веса pi можно считать равными единице. Мы уже имели дело с двумя типами мажо- ритарных отношений Лп и J/Ln (см. разд. 3.2): 5 (Лп) = [и : N+ (и) > N~ (и)}, 5(ЛП) = {и : N+(и) > п/2}, где N+ (и), (А~ (и)) — число положительных (отрицательных) координат и. Легко видеть, что при р^ = . . . = рп: .9?1 □ лп, причем при с1 = х/2 в случае строгих шкал «%1 = J/Ln. Также очевидно, что J£2 ZD J/b'1, причем в случае с2 =1 — Jbn. Использование мажоритарных порядковых отношений в методах опти- мизации связано с двумя существенными проблемами. Первая, присущая всему классу порядковых отношений,— это то, что незначительный выигрыш по одному критерию может полностью компенсировать большой проигрыш по другому критерию. Так, например, если п — 5, х = (10, 10, 10, 1, 1), у = (9, 9, 9, 10, 10) и все критерии имеют одинаковую важность, то при с2 = 1 вариант х превосходит у (по отношению <%2), хотя преимущество х над у по первым трем критериям весьма незначительно, а по 4-му и 5-му кри- териям х значительно уступает у. 118
Для того, чтобы обойти эту трудность, и используется условие (П.2 (индекс несогласия). Это условие вырезает в множестве так называемую область несравнимости, которая определяется исходя из знаний относитель- ных оценок сравниваемых вариантов. С этой целью задается область несогла- сия D, такая, что для любых вариантов я и у из того, что пара (я, у) е D, сле- дует, что х31у. Если, например, D = {(я, у) : Vi = i..,n xi — yi^> 5}, то это значит, что у не может доминировать х, если уступает ему более пяти единиц хотя бы по одной координате. С учетом индекса несогласия отношения 31х и г&2 записываются так: 3 Pi ро, (П.6) i- .sgnu^X) 5(^)={u: 2 р. >С2 (П.7) i:sgnu^>o isgn U|<o где Z)o = {и : (0, u) <== £)}. Очевидно, что 33 и тем сильнее отличаются от порядкового отношения, чем больше размеры множества D. В случае D — ф 33 — порядковое отно- шение (i = 1, 2). На рис. П.1 прИВедеН верхний срез бинарного отношения 33. Здесь п = 2. Веса критериев р, = 4, р2 = 1; индекс несогласия задается областью D = {(^, у) : Vi = 1, 2 хг = Уг > 3}; С1 = 0,75. Вторая сложность, возникающая при использовании мажоритарных отношений и их модификаций, связана с возможностью появления циклов, т. е. таких ситуаций, когда х1 лучше, чем х2, х2 лучше, чем ж3, и т. д., лучше, чем хк, но х\ в свою очередь, лучше, чем хх. Это может привести к тому, что выделяемое множество оптимальных вариантов окажется пустым. Поэтому при использовании таких отношений необходимо уметь выявлять эти ситуации и знать, каким образом их можно избежать. В методах ЭЛЕКТ- РА эта проблема не рассматривается. В заключение этого раздела приведем иллюстрированный пример опти- мизации с помощью метода ЭЛЕКТРА II. Пусть исходное множество А ва- риантов. сравниваемых по пяти критериям, имеет вид хх = (5,3,2,7,2), х* = (1,6,6,4,5), х2 = (4,2,3,5,1), х9 = (2,7,5,2,6), х* = (3,4,1,6,3), х1 = (6,5,6,3,4). хх = (7,1,4,1,7) Все семь вариантов несравнимы по Парето, поэтому для сокращения разме- ров множества А необходимо получить у ЛПР дополнительную информацию. 1-й этап. От ЛПР получается информация о сравнительной важности критериев. Пусть ЛПР сообщил, что: критерии 1 и 2 имеют одинаковую важность, критерии 3, 4 и 5 имеют одинаковую важность, каждый из первых двух критериев важнее каждого из оставшихся. В со- ответствии с этой информацией критериям назначаются веса: Pi ~ Р% ~ 2, р3 — pt = р5 = 1. 2-й этап. Строится матрица 7 X 7, в которой элемент atj означает Допустим, что в качестве порогового значения индекса согласия выбрано (с помощью ЛПР) с2 = 1,25. Как видно из таблицы, любой из семи вариантов 119
доминируется хотя бы одним из остальных. X 6 КЗ 0,75 0,75 0,75 0,17 0,17 X 0,75 0,75 0,75 0,75 0,17 0,75 1,3 X 0,75 0,75 0,75 0,17 1,3 1,3 1,3 X 0,75 0,75 0,75 1,3 1,3 1,3 1,3 X 0,4 1,3 1,3 1,3 1,3 1,3 2,5 X 0,75 6 6 6 1,3 0,75 1,3 X Поэтому без учета индекса несогласия подмножество оптимальных вариан- тов оказалось бы пустым. 3-й этап. С помощью Л ПР устанавливается индекс несогласия. Пусть D — {(гс, у) : х{ — yi 5}. В этом случае один из вариантов — х7 — оказы- вается недоминируемым. Оптимальным будет считаться также вариант х5 (который несравним с х7). Итак, метод ЭЛЕКТРА II в данном примере позволил сократить исход- ное семиэлемёнтное множество до двух элементов #5 и х7. В этом его плюс. В чем же состоят минусы? Во-первых, в совершенно произвольном назначении весовых коэффици- ентов. Если бы Л ПР, увеличив на 1 вес каждого критерия, принял веса pi = р2 = 3, р3 = р4 = р5 = 2, то при выбранном пороге с2 — 1,25 большинство отношений между вариантами изменится (так, варианты х2 и х3 будут уже несравнимы, в то время как ранее х3 был более предпочтите- лен). Подобный произвол, конечно, сильно влияет на окончательный выбор. Во-вторых, возможное наличие циклов, которое может свести на нет всю оптимизацию. Положение можно исправить, введя достаточно низкий порог индекса несогласия, однако априори неясно, из каких соображений этот по- рог следует выбирать. Так, в рассмотренном примере порог d = 5 обеспечи- вал непустоту выбора, но если бы Л ПР остановился на значении d = 6, это не нарушило бы цикла: х7 лучше, чем ж6, ж6 лучше, чем х:\ х° лучше, чем х7, и выбор оказался бы пустым. В-третьих, один из принципов оптимизации — усиление требований к оптимуму должно приводить к его вложенному сужению, а ослабление — к расширению — оказывается нарушенным. Так, при пороге индекса согла- сия с2 = 1,25 и несогласия d = 5 оптимум состоит из вариантов х3 и х7. Уве- личение порога с2 до 1,4 (при неизменном d), казалось бы, должно расширить этот оптимум или же оставить его неизменным. Однако метод ЭЛЕКТРА выделяет другой оптимум: {.г6, х7}. Таким образом, следует констатировать, что группа методов ЭЛЕКТРА при всей своей привлекательности не лишена традиционных недостатков,, присущих многим современным методам многокритериальной оптимизации. П2. Метод Подиновского [27, 28] Такой метод, как ЭЛЕКТРА, имеет своей целью построение более сильного,, нежели паретовское, бинарного отношения предпочтения. Как и в ЭЛЕКТРА, для этого используется дополнительная информация — информация о срав- нительной важности критериев. Однако основное и существенное отличие метода Подиновского состоит в том, что качественная информация о критериях, получаемая от Л ПР, не преобразуется в количественную. Автору (впервые в практике многокрите- риальной оптимизации) удалось освободиться от необходимости ввода весо- вых коэффициентов важности критериев, вносящих большую неопределен- ность в решение задачи. Информация о сравнительной важности критериев задается совокуп- ностью сообщений Л ПР типа: 1. Критерий i важнее, чем критерий / (обозначается iBj)\ 2. Критерии i и j равноценны (обозначается iSj); 120
3. Набор критериев (4...4) важнее, чем набор (/].../т); 4. Наборы критериев (^...i/) и одинаковы по важности. В дальнейшем мы ограничимся рассмотрением сообщений первых двух типов. Полученная информация используется для сужения множества Парето следующим образом: пусть х s R™, хг3 получен из х перестановкой координат i и ]. Тогда, если от ЛПР получено сообщение о равноценности критериев i и / (iSj), то варианты х и хг3 считаются эквивалентными (xlx13). Если же ЛПР считает, что критерий i важнее критерия j (iBj), то из двух вариантов более предпочтительным считается тот, у которого больше г-я координата. Так, если Xi > Xj, то х предпочтительнее, чем хг3 (хРхг3). Далее, посредством взятия транзитивного замыкания расширяется отношение Парето: ф=> 3z : (yPz V ylz) Д х Parn z (отношение I считается рефлексивным, т. е. xlx}. — бинарное отношение, более сильное, чем паретовское. Очевидно, что рефлексивно и транзитивно. Заметим, что оно не только не порядковое, но даже не принадлежит классу разностных отношений. Опишем построенное отношение в терминах верхних срезов, принятых в этой книге. Рассмотрим точку х е Rn, а также множество Yx всех точек, получае- мых из х произвольной перестановкой координат. Совокупность сообщений ЛПР о сравнительной важности критериев определяет в Yx подмножество KJ = [у s Yx : ylx V уРх}. Взятие транзитивного замыкания означает, что верхний срез отношения в точке х является объединением срезов па- ретовского отношения во всех точках из Yz. Таким образом, верхний срез отношения в точке х определяется так’. = {у е= Rn : 3z : х Par" z Д (ylz \J yPz)}. (П .8) Так, например, если (в случае двух критериев) ЛПР считает критерии равноценными (152), то верхний срез в точке отношения является объеди- нением паретовских срезов точек х и ж12 (рис. П.2, а). Если же ЛПР считает, что критерий 1 важнее критерия 2 (1В2), то х более предпочтителен, чем х12 (рис. П.2, б). Следовательно, в точке х = Раг£, а в точке у = Par{/ (JParyl2. Мы рассмотрели случай, когда ЛПР дает информацию только о парах критериев. Более общий случай, когда ЛПР сравнивает между собой наборы критериев, по-существу, не отличается от рассмотренного. Разница состоит лишь в способе определения подмножества Yx. Построенное на основании информации о важности критериев бинарное отношение позволяет значительно сузить множество Парето. Так, если имеется информация о том, что все п критериев равноценны, то при большом числе сравниваемых вариантов, это позволяет сузить паретовское множест- во приблизительно в п\ раз. (Информация о превосходстве одного критерия над другим является более слабой.) Что же дает нам информация о важности критериев в конкретном при- мере сравнения семи вариантов из предыдущего раздела. Рассмотрим наибо- лее благоприятный случай, когда все критерии равноценны. Тогда, по опре- делению, отношения ^?п нам достаточно упорядочить оценки каждого ва- рианта (например, но убыванию) п среди полученных векторов выбрать не- доминируемые по Парето. 121
Рис. П2. Упорядочение критериев а — 1S2; б — 1В2 Упорядочим оценки: = (7,5,3,2,2), хь = (6,6,5,4,1), = (5,4,3,2,1), xQ = (7,6,5,2,2), х3 ~ (6,4,3,3,1), гг7 = (7,6,5,4,3). 5^4 = (7,7,4,1,1), Недоминируемыми по Парето оказались векторы и £7, следовательнот результат выбора методом Подиновского — это варианты х* и х1. Другим достоинством метода Подиновского, как уже было сказано, яв- ляется то, что сузить множество Парето удается, не вводя числовых аналогов важности критериев, но пользуясь лишь качественной информацией об их сравнительной важности. Остановимся на недостатках, присущих этому методу. 1. Все, что говорилось выше об использовании информации о важности критериев для построения отношения «%п, относилось к так называемым од- нородным критериям, т. е. таким, значения которых принадлежат одному и тому же множеству. В этом случае векторная оценка варианта х после перестановки любых координат также является векторной оценкой. При- мером однородных критериев может быть множество одинаково компетентных экспертов, оценивающих варианты по одной и той же шкале. В этом случае действительно может быть непринципиально, получил вариант х оценки х± — а, х2 — Ь, или хх = Ь, х2 = а. Этот факт и используется при построе- нии отношения «%п. Сложности появляются, когда критерии оказываются неоднородными (а такое бывает очень часто). Для определения сравнительной важности двух критериев уже необходимо иметь дело с приращениями по этим критериям. И вместо обычной равноценности (для однородных критериев) определяется равноценность по (hihj), когда любые два варианта х и у, такие, что yi — = Xj hi, yj — xj — hj одинаковы по предпочтению. Необходимость учета приращений резко сужает возможности применения этого определения, так как в разных точках исходного множества вариантов эти приращения могут оказаться разными, и определение станет некорректным. Но даже если эти приращения всюду одинаковы и равноценность по (hihj) имеет место, то это практически означает, что введены весовые коэффициенты важности критериев. Действительно (рис. П.З) все варианты, расположенные на прямой а, одинаковы по предпочтительности в силу произвольности малых приращений, а это означает, что предпочтительность варианта х определя- ется взвешенной суммой / (х) = hxx2 + h2xr. Таким образом, для неоднородных критериев определения сравнитель- ной важности сводятся к определению коэффициентов важности критериев. Это является основным недостатком метода. 2. При построении бинарного отношения используется операция транзитивного замыкания. Этим, по-существу, предполагается, что пред- почтение ЛПР заведомо транзитивно, но это предположение никак не прове 122
Рис. П4. Нетранзитивность х31пу, y3tTlz, но <r^nz ряется. Такой прием является попыткой выдать желаемое за действительное, ибо известен ряд широко используемых правил выбора (например, то же мажоритарное правило), когда предпочтение Л ПР не является транзитивным. Примером может служить и рассмотренный в предыдущем разделе метод ЭЛЕКТРА. Отметим здесь также, что взятие транзитивного замыкания решает про- блему транзитивности «%п только в том случае, когда в качестве исходного отношения (см. (П.8)) выбрано отношение Парето. Для любого транзитивного отношения, как видно из рис. П.4, транзитивное замыкание не транзитивно! П.З. Метод порядковой оптимизации В основе предлагаемого метода лежит аппроксимация изнутри структуры предпочтений Л ПР (описываемой бинарным отношением) некоторым отно- шением из конечного класса. Мы будем предполагать, что отношение ,%ЛПР описывающее структуру предпочтений Л ПР разностное: ^лп₽ е а ап- проксимировать его будем порядковыми отношениями ^лпр ZD е . В основе метода лежит следующая процедура: 1) определение упорядо- чения критериев по важности, 2) нахождения порядковых отношений удовлетворяющих этому упорядочению, 3) построение пересечения = П^ по всем таким Полученное 3^* и есть аппроксимация предпочтения Л ПР. Для иллюстрации метода вновь рассмотрим пример сравнения семи ва- риантов по пяти критериям. Пусть в результате опроса Л ПР получена следующая информация о важ- ности критериев: входящие в группы LY = {1, 2} и Ь2 = {3, 4, 5) имеют одина- ковую важность, причем каждый критерий из Lr важнее любого критерия из £2- Поскольку сравниваемые варианты не имеют совпадающих оценок ни по одному критерию, аппроксимацию мы можем проводить в классе поряд- ковых отношений в строгих шкалах. Нетрудно показать, что в этом случае полином аппроксимирующего отношения имеет вид (и) = 1^2(143^4- U3U5+ щи5), т. е. «быть лучше» означает «быть лучше по первым двум и любой паре из оставшихся трех критериев». В нашем примере недоминируемыми по являются варианты я4, z5, ж6, х1. 123
Чем сильнее оказались упорядочены критерии, тем уже выбор. Пусть упорядочить удалось все критерии, кроме двух последних: 1 — 2 3 — (4 «-> 5). В этом случае аппроксимационный полином имеет вид (u) = Uj. (и2 + U3 (ut 4- U5)), и выбранными окажутся только два варианта: х* и х1. Попытаемся в максимальной степени объективно охарактеризовать изу- чаемый метод. Разумеется, и он имеет свои недостатки. 1. Процесс получения от ЛПР информации о сравнительной важности критериев достаточно трудоемок. В общем случае мы должны задать ЛПР порядка и2 вопросов (где п — число критериев), что сложно при большом п. Хотя надо отметить, что в ряде благоприятных случаев порядок числа воп- росов к ЛПР может быть снижен до п. 2. ЛПР может, сам того не ведая, давать противоречивую информацию о сравнительной важности критериев. Это необходимо отслеживать. 3. Наверное, главный недостаток: построить аппроксимирующее отно- шение для случая нестрогих шкал значительно труднее, чем для строгих,— как это было в рассмотренных примерах. Весьма вероятно, что потребуются дополнительные вопросы к ЛПР относительно принадлежности тех или иных квадрантов верхнему срезу отношения <^(ЛПР). Честно остановившись на недостатках, перейдем теперь к достоинствам предполагаемого метода. Для решения задач выбора в строгих шкалах для сравнительно неболь- шого числа критериев (5—7) этот метод особенно эффективен. Он дает возмож- ность обоснованно, без внесения произвола, аппроксимировать предпочте- ние ЛПР, а в ряде случаев определить его в точности. Также несомненное достоинство состоит в том, что он не зависит (в отличие от ЭЛЕКТРА) от числа сравниваемых вариантов. Кроме того, критерии могут иметь произ- вольную природу и не обязаны быть однородными, как при использовании метода Подиновского. На этом мы заканчиваем сравнительный анализ трех методов многокри- териальной оптимизации, предоставляя читателю право иметь ио этому поводу собственную точку зрения.
К литературе Гл. 1. Первое описание аксиоматического, а не дескриптивного подхода к описанию моделирования предпочтений содержится в фундаменталь- ном труде [26]. Вехами в развитии теории выбора стали монографии [34, 43, 46]. В своем изложении основ теории выбора мы следуем, в основном, [1, 2]. Свойства графодоминантных функций выбора иссле- довались впервые в теории игр [26, 18] (ядро = Мах и т. п.). Сама идео- логия аппроксимативного подхода более пли менее явно присутст- вует во многих работах (см. обзоры и сборники [17, 39, 41]). Собствен- но свойства бинарных отношений энциклопедически описаны в [14]. Мажоранты введены в [29]. Гл. 2. Первое и важнейшее из бинарных отношений в критериальном про- странстве введено Парето в [44]. Идеология инвариантности является переносом на многокритериальную оптимизацию «физического» обра- за мысли [35]. Конусные бинарные отношения играют большую роль в функциональном анализе [3, 20]. Симметризации были впервые вве- дены в [8]. Критерий ацикличности получен впервые. Тема упорядоче- ния критериев по важности чрезвычайно популярна среди теоретиков многокритериальной оптимизации [9, 37, 28]. Упорядочения по Поди- новскому введены в [27, 28]. Гл. 3. Точности аппроксимации бинарных отношений^ посвящены работы [12, 13]. Конечные классы и сопутствующие аппроксимационные тео- ремы — новые. Порядковые отношения были параллельно введены в [16, 9]. С булевой записью порядковых отношений тесно связаны методы работ [24, 33]. Критерии транзитивности и ацикличности по- рядковых отношений — новые. Гл. 4. Изучение свойств функций выбора на случайных предъявлениях посвящено много работ (см. обзор [31]). В основном они концентриро- вались вокруг оценок мощности выбора. Предлагаемая модель асимп- тотической близости введена в [7]. Индикаторные функции известны так же, как суммарные [2]. Гл. 5. Впервые задача об оценке числа недоминируемых вариантов в конеч- ной случайной выборке рассмотрена в [4] (в контексте статистических приложений) для паретовского сравнения и независимых координат. Впоследствии эти результаты многократно переоткрывались [10, 16, 23]. Результаты о выборках из многокритериального нормального рас- пределения содержатся в [22]. Среднее число недоминируемых вари- антов при зависимых критериях изучалось в [6, 30], дисперсия и рас- пределение — в [5]. Среднее число вариантов, недоминпруемых по По- диновскому, описано в [8, 6]. Дисперсия и распределение числа недо- минируемых по Парето вариантов в задаче с независимыми критериями исследовались в [4, 10]. Гл. 6. Структура множества недоминируемых вариантов в гладких задачах начала всерьез изучаться в работах Смейла [48], постановки в которых были мотивированы задачами математической экономики. Впослед- ствии эти работы многократно переписывались и переиздавались [45, 47]. Хорошими учебниками по дифференциальной топологии и особенностям дифференцируемых отображений служат [19, 35]. Метод изложения условий оптимальности, принятый в книге, новый. Боль- шая информация об условиях оптимальности и структуре оптимума содержится в [49, 50]. О мажоритарном правиле см. [40, 42].
Литература 1. Айзерман М. А., Малишевский А. В. Некоторые аспекты общей теории выбора лучших вариантов / Препр. Ин-та пробл. упр. М., 1980. 36 с. 2. Айзерман М. А., Малишевский А. В. Проблемы логического обоснования в общей теории выбора / Препр. Ин-та пробл. упр. М., 1980. 79 с. 3. Акилов Г. И., Канторович Л. В. Функциональный анализ. М.: Наука, 1977. 350 с. 4. Барндорф-Ниелъсен О., Соблъ М. О распределении числа элементов мно- гомерной выборки, принадлежащей заданному слою // Теория вероятно- стей и ее применение. 1966. Т. И, вып. 2. С. 152—166. 5. Барышников Ю. М. О распределении числа недоминируемых вариантов // Изв. АН СССР. ТК. 1986. № 3. 6. Барышников Ю. М. О среднем числе недоминируемых по бинарному отно- шению вариантов / АиТ. 1985. № 6. 7. Барышников Ю. М., Березовский Б. А. Асимптотическая эквивалентность функций выбора И АиТ. 1986. № 4. 8. Березовский Б. А., Борзенко В. И., Кемпнер Л. М. Бинарные отношения в многокритериальной оптимизации. М.: Наука, 1981. 151 с. 9. Березовский Б. А., Кемпнер Л. М. Оценка влияния информации об упо- рядочении критериев на число оптимальных вариантов // АиТ. 1980. № 6. С. 101-110. 10. Березовский Б. А., Травкин С. И. Диспетчеризация очередей заявок в вычислительных системах // АиТ. 1981. № 1. С. 105—113. 11. Березовский Б. А. и др. Информационные аспекты многокритериальной оптимизации И Достижения и перспективы. Вып. 16. М., 1981. С. 52—57. 12. Бондарева О, Н. Сходимость пространств с отношением и теоретико-игро- вые следствия // Журн. вычисл. математики и мат. физики. 1978. № 1. С. 28-35. 13. Бондарева О. Н. Конечные приближения для ядер и решений кооператив- ных игр // Журн. вычисл. математики и мат. физики. 1976. № 3. С. 37—43. 14. Бурбаки Н. Начала математики. М.: Мир, 1965. Ч. 1. 348 с. 15. Виноградская Т. М. Среднее значение числа неподчиненных решений в многокритериальных задачах // Изв. АН СССР. ТК. 1976. № 2. С. 16— 24. 16. Виноградская Т. М., Рубчинский А. А, Бинарные координатные отноше- ния в критериальном пространстве. 1. // АиТ. 1981. № 3. С. 95—104. 17. Вопросы анализа и процедуры принятия решений. М.: Мир, 1976. 229 с. 18. Воробьев Н. Н. Современное состояние теории игр // Успехи мат. наук. 1970. Т. 25, вып. 2. С. 3-21. 19. Голубицкий М., Гийемнин В. Устойчивые отображения и их особенности. М.: Мир, 1977. 290 с. 20. Дэй М. М. Линейные нормированные пространства. М.: Изд-во иностр, лит., 1961. 21. Иванин В. М. Вычисление дисперсии числа элементов множества Парето для выборки независимых векторов с независимыми компонентами И Теория оптимальных решений. Киев: ИК АН УССР, 1986. С. 39—56. 22. Иванин В. М. Об одной оценке математического ожидания числа элемен- тов множества Парето // Кибернетика. 1975. № 3. С. 42—47. 23. Кукса А. Я., Шор Н. 3. О методе оценки количества условно-оптималь- ных траекторий дискретного сепарабельного динамического программи- рования // Кибернетика. 1973. № 3. С. 28—38. 126
24. Макаров И. М. и др. Теория выбора и принятия решений. М.: Наука 1982. 312 с. 25. Миркин Б. Г, Проблема группового выбора. М.: Наука, 1974. 254 с. 26. Нейман Дж., Моргенштерн О. Теория игр и экономическое поведение. М.: Наука, 1970. 707 с. 27. П одиновский В. В. Многокритериальные задачи с однородными равноцен- ными критериями И Журн. вычисл. математики и мат. физики. 1975. Т. 15, № 2. С. 130-141. 28. Подиновский В. В. Многокритериальные задачи с упорядоченными по важности критериями И АиТ. 1976. № 11. С. 118—127. 29. Современное состояние теории исследования операций // Под ред. Моисее- ва Н. Н. М.: Наука, 1979. 30. Травкин С. И., Лихогрудова Л. Е., Травкина А. Е. Распределение макси- мальных элементов при зависимых показателях //IX Всесоюз. совещ. по пробл. управл. М., 1983. С. 29—36. 31. Шоломов Л. А. Оценочные результаты в теории выбора // Изв. АН СССР. ТК. 1983. № 1. 32. Хирш М. Дифференциальная топология. М.: Мир, 1979. 33. Шоломов Л. А. Применение логических методов в задачах последователь- ного выбора. М.: 1980. 56 с. 34. Arrow К. S. Social choice and individual values. N. Y., Wiley, 1951. 35. Berezovski B. A., Baryshnikow Yu. M. Symmetries in multicriteria opti- mization and their applications 11 Leet. Notes in Econ. and Math. Syst. 1986. Vol. 285. P. 38—46. 36. Fishburn P. Decision and value theory. N. Y.: Wiley, 1964. 37. Keeney R. L., Rail a H. Decisions with multiple objectives: preferences and value tradeoff. N. Y.: Wiley, 1976. 38. Kim К. H., Roush F. W. The liberal paradox and the Pareto set // Math. Soc. Sci. 1985. Vol. 9, N 1. 39. Larichev О. E., Nikiforow A. D. Analitical Survey of Procedures for solving MMPP // Leet. Notes in Econ. and Math. Syst., N 285. 40. Mckelvey R. D. Intransitives in Multidimensional Voting Models and Some Implications for Agenda Control // J. Ec. Th., Vol. 12, 1976. 41. Multiple Criteria Decision Making // Univ. S. Car. Press, 1973. 42. Plott C. R. A Notion of Equilibrum, and its Posibility Under Majority Rule // Amer. Econ. Rev. 1967. 43. Plott C. R. Axiomatic social choice theory//Am. J. Polit. Sci., 1976. Vol. 20. 44. Pareto V. Cours d’Economic Politique. Lausanne: Houge. 1889. 45. Saari D., Simon C. Singularity theory of utility mappings // J. Math. Econ. 1977. Vol. 4. P. 21—43. 46. Sen A. R. Collective choice and social welfare S. Fr.; Holden day, 1970. 47. Simon C., Titles C. Characterization of optima in smooth Pareto economic systems // J. Math. Econ. 1975. Vol. 2, N 1. P. 53—67. 48. Smale S. Global analysis and economies V // J. of Math. Econ. 1974. Vol. 1, N 3. P. 29—41. 49. Wan Y. H. On local Pareto optima // J. Math. Econ. 1976. Vol. 3, N 2. P. 56—63. 50. Wan Y. H. On the algebraic criteria for Pareto optima // Topology. 1977. Vol. 16. 51. Roy B. Problems and methods with multiple objective functions. Math. Programming. North-Holland Publish. Company. Amsterdam: 1972. Vol. 1, N 2. P. 239—266.
Оглавление Введение................................................... 3 1 • Функции выбора и бинарные отношения................... 10 1.1. Функции выбора: определения и примеры................ 10 1.2. Свойства бинарных отношений.......................... 19 2» Геометрия бинарных отношений в критериальном простран- стве ................................................. 26 2.1. Геометрические аспекты инвариантности................ 26 2.2. Критерии транзитивности и ацикличности............... 31 2.3. Упорядочение критериев по важности................... 40 3. Порядковые отношения.................................. 47 3.1. Аппроксимация отношений.............................. 47 3.2. Порядковые отношения. Булева запись.................. 54 3.3» Критерии транзитивности и ацикличности для порядковых отношений . 59 4. Асимптотические свойства функций выбора............... 69 4.1. Выбор из случайных множеств.......................... 69 4.2. Сравнение принципов оптимальности: асимптотическая эк- вивалентность функций выбора.............................. 70 4.3. Свойства наследования и согласованности ..... 77 5* Вероятностные свойства бинарных отношений .... 81 5.1. Математическое ожидание числа недоминируемых вариан- тов ...................................................... 81 5.2. Дисперсия и распределение числа недоминируемых вариан- тов .................................................... 90 5.3. Статистические характеристики прямых произведений. . 97 6. Гладкие задачи многокритериальной оптимизации ... 99 6.1. Основные определения.............................. 99 6.2. Условия локальной оптимальности.....................• ЮЗ 6.3. Структура оптимума.................. 111 Приложение Анализ некоторых методов многокритериальной оптимиза- ции ..................................................116 П.1. Методы ЭЛЕКТРА.......................................116 П.2. Метод Подиновского...................................120 П.З. Метод порядковой оптимизации.........................123 К литературе.................................... . . 125 Литература........................................... 126
АКАДЕМИЯ НАУК СССР Многокритериальная оптимизация Математические аспекты