/
Автор: Юдин Д.Б.
Теги: исследование операций математика математический анализ системный анализ вычислительные системы теория управления
ISBN: 5-02-014109-7
Год: 1989
Текст
ТЕОРИЯ И МЕТОДЫ
СИСТЕМНОГО АНАЛИЗА
Д.Б. ЮДИН
ВЫЧИСЛИТЕЛЬНЫЕ
МЕТОДЫ
ТЕОРИИ
ПРИНЯТИЯ
РЕШЕНИЙ
МОСКВА "НАУКА"
ГЛАВНАЯ РЕДАКЦИЯ
ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ
1989
ББК 22.18
Ю16
УДК 519.816
Юдин Д.Б. Вычислительные методы теории принятия реше-
- М.: Наука. Гл. ред. физ.-мат. лит., 1989. - 320 с. (Теория
и методы системного анализа.). - ISBN 5-02-014109-7.
Рассматриваются экономные вычислительные методы принятия решений.
Излагаются необходимые сведения о бинарных отношениях, о функциях
выбора и о возможных подходах к оптимизации по бинарному отношению.
Приводится обзор современных эффективных методов линейного и выпук-
выпуклого программирования, которые могут быть использованы в вычислитель-
вычислительных схемах алгоритмов выбора. Излагаются разные версии достаточно ymraepv
сальной модели - обобщенного математического программирования (ОМП),
в которую укладываются многие задачи принятия решений. Разрабатывается
и оценивается конструктивная схема анализа и численного решения линей-
линейных и выпуклых задач ОМП.
Для специалистов в области теории принятия решений, прикладной мате-
математики, системного анализа, теории управления.
Табл. 1. Ил. 12. Библиогр. 179 назв.
Рецензент
доктор физико-математических наук Цурков ВЛ.
Редакционная коллегия серии
"Теория и методы системного анализа":
академикДМ.Гвишиани (председатель),
академик СВ. Емельянов (заместитель председателя),
академик СС Шаталин,
доктор экономических наук ?.3. Мильнер,
доктор технических наук Ю.С. Попков
„ 1402050000-036 ,^ ол ^
Ю юзгстло 15М9 ® Издательство "Наука".
053@2)"89 Главная редакция
физико-математической литературы,
ISBN 5-02-014109-7 1989
ПРЕДИСЛОВИЕ
Управление системой, проектирование устройства, планирование деятель-
деятельности и вообще принятие решений предполагает, как правило, достижение
некоторой цели или, по крайней мере, последовательное приближение к
некоторому наиболее предпочтительному состоянию или поведению. Тер-
Термины "управление", "проектирование", "планирование", "решение" в
научной и особенно научно-популярной литературе встречаются в сочетании
с характеристиками "целенаправленное", "целеустремленное", "оптималь-
"оптимальное". При этом понятие целей и путей ее достижения обычно не разъяс-
разъясняется: авторы апеллируют к интуиции читателя. Между тем в сколь-
нибудь серьезных ситуациях принятия решений формирование цели как в
содержательном, так и в формальном смысле представляет собой далеко
не простую и не всегда однозначно формулируемую задачу.
Только в простейших случаях удается указать шкалу — целевую функ-
функцию, значения которой измеряют качество решения. Для качественного и
численного анализа возникающих при этом задач оптимизации решения раз-
развиты теория и методы математического программирования.
В более сложных ситуациях качество решения — его полезность — не
может быть (во всяком случае непосредственно) оценено единственной
функцией и даже несколькими шкалами. Механизм рационального выбора
в таких случаях требует некоторой дополнительной косвенной информации,
позволяющей по крайней мере сравнивать альтернативы. Таково, в част-
частности, положение дел при выборе решений в многокритериальных ситуа-
ситуациях, когда изучаются многоцелевые системы, в теории групповых реше-
решений, когда решение должно учитывать интересы различных лиц, и при выбо-
выборе стратегий рационального поведения в конфликтных ситуациях. Во
всех этих случаях выбор равновесного, компромиссного, справедливого
решения требует дополнительно априорного определения понятий равно-
равновесия, компромисса, справедливости.
В ряде разделов теории принятия решений имеются различные опреде-
определения рационального компромисса. Часто понятие компромисса задается
набором аксиоматически сформулированных требований к решению или к
порождающему его механизму выбора. Различные "естественные" наборы
требований приводят к различным определениям "справедливости". В
отдельных случаях, но далеко не всегда, указываются дополнительные осо-
особенности ситуации, при которых то или иное определение равновесия
можно считать более приемлемым.
3
В других случаях определение рационального выбора связывают с из-
изучением и систематизацией опыта специалистов, зарекомендовавших себя
на практике в той или иной проблемной области. Обработка представитель-
представительной выборки наблюдений за решениями и действиями опытных диспет-
диспетчеров, диагностов, экспертов позволяет получить представление о так
называемой функции выбора — зависимости принимаемых решений от
ситуаций, встречающихся в рассматриваемом классе задач. Это может
оказаться достаточным, чтобы при правдоподобных допущениях о классе
ситуаций построить механизм (компактную вычислительную процедуру),
реализующий в каждой ситуации решение, в некотором смысле близкое к
тому, которое принял бы в тех же условиях специалист, опыт которого
отражен в функции выбора.
В общем случае определение "рационального, выбора", "компромисса"
или "справедливости" (если оно вообще возможно) выходит за рамки
проблематики формальных дисциплин, не представляет собой матема-
математическую задачу, а является скорей предметом психологии, социальных
наук и политики. Тем не менее в экономике, в технике и в ряде других
областей человеческой деятельности имеются многочисленные задачи
выбора решений, в которых принцип определения компромисса не вызы-
вызывает у специалистов разногласий.
В теории принятия решений изучаются не только формально-логические,
ной психологические, экономико-математические и социологические ас-
аспекты проблемы. До сих нор здесь больше споров, чем согласованных
подходов. Тем не менее в работах последних лет, главным образом фор-
формального толка, обсуждаются и аргументируются условия, при которых
различные определения равновесия могут быть использованы для пос-
постановки и решения тех или иных классов прикладных задач. Однако за
исключением весьма ограниченного числа случаев обсуждение принципов
рационального выбора не сопровождается разработкой конструктивных
методов, реализующих такой выбор.
В предлагаемой монографии мы не собираемся вступать в дискуссию о
подходах к определению компромисса при выборе решения. Пока еще
такие дискуссии рождают больше жара, чем света. Наша цель — расширить
конструктивные возможности принципов согласования целей и интересов -
разработать вычислительные методы приемлемой трудоемкости, позволя-
позволяющие выбрать компромиссное решение при различных определениях поня-
понятия "компромисс".
Современная теория выбора решений представляет собой синтез мо-
моделей и методов, возникших в различных дисциплинах — в математичес-
математическом программировании, в исследовании операций, в математической эко-
экономике, в автоматическом регулировании. Исторически сложились различ-
различные подходы и соответственно различные языки теории выбора решений —
язык критериев качества, язык бинарных отношений, язык функций вы-
выбора, аксиоматический язык. Отсюда разнообразие понятий и терминов,
относящихся к близким проблемам. В этом имеются достоинства и не-
недостатки. Различные языки по-разному чувствительны к отдельным ас-
аспектам принятия решений. Однако изложение одних и тех же или близ-
близких проблем в различных понятиях и терминах усложняет исследование и
освоение принципов и механизмов принятия рациональных решений.
Анализ индикаторов предпочтений, лежащих в основе теории полезности,
позволил в тех случаях, когда это возможно, перекинуть мост между би-
бинарными отношениями и критериями качества. Однако далеко не всегда
можно поставить в соответствие бинарному отношению скалярную функ-
функцию. Существуют ситуации, когда бинарное отношение можно характеризо-
характеризовать вектор-функцией критериев (например, выбор по паретовскому прин-
принципу, который не сводится к скалярной оптимизации). Тем не менее би-
бинарные отношения также охватывают далеко не все ситуации выбора,
представляющие интерес для теории принятия решений. Нередки случаи,
когда из содержательных соображений следует считать результат сравнения
пары альтернатив зависящим от контекста выбора - от других альтерна-
альтернатив, входящих в множество предъявленных вариантов решений. Возникают
также ситуации выбора, когда попарное сравнение альтернатив вообще
лишено смысла. В частности, бинарые отношения вряд ли могут быть
использованы, если требуется выбрать "типичный" вариант или "ори-
"оригинальную" альтернативу из заданного множества вариантов. В таких
случаях представляет особый интерес третий подход и соответственно тре-
третий язык теории принятия решений - язык функций выбора. Аргументом
функции выбора является не отдельная альтернатива и не пара вариантов,
подлежащих сравнению, а все предъявленное множество вариантов, из
которого следует выбрать "лучшие".
Выбор можно также характеризовать его свойствами. Требования к
рациональному решению обычно формулируются в виде набора аксиом.
Аксиоматический язык используется в теории групповых решений для
определения понятий "справедливость", "согласованность" и в теории игр
для определения понятий "равновесие", "компромисс".
Целесообразно разделять языки принятия решений на два класса -
языки концепций выбора и языки механизмов выбора. Концепции выбора
ставят в соответствие каждой ситуации набор "лучших" решений или набор
свойств "лучших" решений. Язык механизмов — это язык алгоритмов вы-
выбора. На языке концепций отвечают на вопрос "что выбирать", на языке
механизмов - "как выбирать". Язык функций выбора и аксиоматический
язык - это языки концепций выбора, язык математического программиро-
программирования и язык бинарных отношений — примеры языков механизмов выбора.
В терминах [1] языки первого класса определяют внешнее описание выбо-
выбора, а языки второго класса — его внутреннее описание. Следует полагать,
что функция выбора, если под этим термином понимать и такие ее версии
как условная, динамическая и стохастическая функции выбора, представ-
представляет собой наиболее естественное, универсальное и удобное для анализа
описание концепции выбора. Отсюда - целесообразность выражения в тер-
терминах функций выбора результатов, формируемых на других языках
теории принятия решений. Интерес представляет также построение механиз-
механизмов принятия решений, реализующих любую функцию выбора или функ-
функции выбора того или иного класса.
Этим вопросам, главным образом, и посвящена монография.
Между двумя направлениями теории принятия решений, определяемы-
определяемыми функциями выбора и реализующими их вычислительными процедура-
процедурами, лежит широкий спектр идей и работ, относящихся к рациональному
выбору. Мы их, однако, обошли в монографии. Во-первых, потому, что
5
они представляются нам менее завершенными. Во-вторых, потому, что
нельзя объять необъятное.
В монографии можно выделить обзорные и оригинальные главы. Обзор^
ные главы посвящены общим сведениям о бинарных отношениях и функ-
функциях выбора и некоторым вспомогательным результатам, изложенным или
намеченным в различных источниках, главным образом, в периодической
литературе последних лет. Оригинальные главы содержат описание методов
и оценку трудоемкости общих и специальных вычислительных схем, реали-
реализующих различные концепции выбора.
Вряд ли можно (да и вряд ли целесообразно) говорить об унификации
моделей принятия решений, предназначенных для качественных исследова-
исследований. Смысловая трактовка конкретного класса задач, специфика струк-
структуры и те или другие детали содержательной интерпретации задач класса
могут оказаться определяющими для выявления качественных характе-
характеристик решения. Что же касается вычислительных методов принятия ре-
решений, то унификация идей и алгоритмов - важное условие прогресса в
этой области. В связи с этим центральное место в монографии отводится
универсальным процедурам принятия решений — обобщенному математи-
математическому программированию (ОМП), его упрощенной версии — матема-
математическому программированию в порядковых шкалах (МППШ) и его
естественному расширению — многошаговому обобщенному математичес-
математическому программированию (МнОМП). Частные реализации соответствую-
пщх вычислительных схем представляют собой методы анализа для спе-
специальных разделов теории принятия решений.
Утверждения, приведенные в обзорной части монографии, как правило,
не доказываются. Исключение представляют лишь те результаты, в кото-
которых процесс доказательства оказывается конструктивным или способст-
способствует уточнению смысла утверждения.
Результаты оригинальной части монографии сопровождаются достаточ-
достаточно подробной аргументацией.
. Отдельные главы монографии и рукопись в целом автор обсуждал со
своими коллегами А.С. Немировским, Л.А. Шоломовым, Э.В. Цоем,
М.Г. Гафтом, А.С. Красненкером и АД. Юдиным. Их советы и замечания
способствовали уточнению результатов и совершенствованию аргумента-
аргументации. Всем им автор весьма признателен. Оставшиеся недочеты и погреш-
погрешности целиком на совести автора.
Глава I
БИНАРНЫЕ ОТНОШЕНИЯ
§1. Введение
1.1. Бинарные отношения представляют собой важную математическую
категорию, используемую в логике, в алгебре, в математической экономи-
экономике и других разделах науки. В последние десятилетия обозначилась роль
бинарных отношений в общей теории принятия решений.
Основные понятия теории бинарных отношений сформировались еще
в прошлом веке. Частные задачи, связанные с бинарными отношениями,
встречаются уже в исследованиях де Моргана A860) и Фреге A879).
Первое систематическое изложение теории бинарных отношений содержит-
содержится в третьем томе "Алгебры логики" Шредера [88] A895). В связи с про-
проблемами логики и оснований математики бинарные отношения рассматри-
рассматривались Уайтхедом и Расселом в "Principia Mathematica" [93] A910).
В настоящее время можно найти обсуждение различных понятий теории
бинарных отношений в руководствах по теории множеств и общей алгебре
[12, 23]. Наиболее подробное изложение различных аспектов теории бинар-
бинарных отношений на русском языке имеется в работах Риге [41 ], Вагнера
[13], Шрейдера [50] и Кируты, Рубинова и Яновской [21]. К сожалению,
в теоретических и прикладных работах по этому вопросу до сих пор нет
единой терминологии. Приведенный ниже краткий обзор основных резуль-
результатов теории бинарных отношений ориентируется главным образом на
прикладные исследования по принятию решений.
1.2. В теории принятия решений рассматриваются два подхода к измере-
измерению качества решения — кардинальный (количественный) и ординальный
(порядковый). Классический кардинальный подход приписывает каждому
решению количественную оценку — число — значение некоторой функции
(показателя качества решения). Кардинальный подход к оценке качества
решения не охватьюает многих естественных ситуаций выбора. Далеко не
всегда удается оценивать качество решения единой функцией. Существен-
Существенно более широкие приложения у ординального (порядкового, или качест-
качественного) подхода к оценке решений. Порядковый подход не требует
оценки каждого фиксированного решения, а связан лишь со сравнением
любой пары решений и выделением более предпочтительного. Формализм
ординального подхода основан на теории бинарных отношений.
Пусть G некоторое множество объектов (конечное, счетное или несчет-
несчетное). В зависимости от контекста будем называть их элементами, объекта-
объектами, вариантами или альтернативами. Рассмотрим декартово произведение
7
GX G =G2. Любое его подмножество RQGX Gопределяет некоторое
бинарное отношение между элементами x€G. Пусть элементы х, у €G.
Будем говорить, что объекты (элементы) хну находятся в бинарном
отношении R (и записывать xRy или х Ъ- у), если (х, >>) € Л.
Язык бинарных отношений позволяет сравнивать по качественным
признакам объекты произвольной природы. Каждому типу качественной
информации соответствует определенный класс отношений. С помощью
бинарных отношений можно описать разнообразные типы соответствия
между элементами множества. Характер отношений определяется истолко-
истолкованием содержательного смысла сравнения альтернатив. В зависимости
от смысла, вкладываемого в понятие "сравнение", соответствия, опреде-
определяемые бинарными отношениями, могут быть отношениями родства,
включения, доминирования, блокировки, сходства, порядка и т.д. Чтобы
бинарное отношение могло истолковываться в тех или иных содержатель-
содержательных терминах, оно должно удовлетворять некоторым формальным требо-
требованиям, которые ограничивают выбор множестваRCGXG,определяюще
го соответствующее бинарное отношение.
Естественное обобщение бинарных отношений — это тернарные и вооб-
вообще л-арные отношения. Однако усложнение анализа, связанное с опериро-
оперированием более сложными категориями, по-видимому, не оправдывается
полученными с их помощью эффектами. Ряд результатов, учитывающих
множественные отношения (в частности, зависимость выбора от ситуации —
от контекста выбора), могут быть получены с помощью систем бинарных
отношений или посредством бинарных отношений между множествами
вариантов. Бинарные отношения позволяют формировать конструкции
принятия решений, лишенные недостатков непосредственного сравнения
пар объектов. Так,введенные далее схемы многошагового обобщенного
математического программирования дают возможность описать с помощью
бинарных отношений любой мыслимый механизм выбора.
Отметим еще, что в теории принятия решений отказ от бинарности
(от выбора, основанного лишь на сравнении пар и не учитывающего общую
обстановку) не проходит бесследно. Возникают ситущии, когда некоторым
участникам, определяющим решение, выгодно скрывать свои истинные пред-
предпочтения и вносить дезинформацию.
§ 2. Действия над бинарными отношениями
2.1. Над бинарными отношениями можно проводить различные операции.
Эти операции естественно сводятся к соответствующим действиям над
множествами, определяющими отношения-операнды. Операции над бинар-
бинарными отношениями позволяют по некоторым известным отношениям
между наборами элементов получать логические следствия, — может быть,
не столь очевидные, как исходные, — отношения между элементами рас-
рассматриваемых наборов.
Введем определения.
Пустое подмножество ф в G X G называют нуль-отношением, а само
множество GXG- универсальным отношением. Диагональ множества
GXG, т.е. множество А = {(*, х) \ х € G }, называют единичным бинарным
отношением или отношением равенства в G.
8
Перечислим некоторые действия над бинарными отношениями.
1. Объединением RtUR2 отношений RxnR2 называется бинарное отно-
отношение, которое включает все пары (х, у), содержащиеся в Ri или R2.
2. Пересечением R\ О R2 отношений Rx и R2 называется бинарное отно-
отношение, которое содержит только общие для Rx uR2 пары (х, у). Бели Rt
и R2 не имеют общих пар, то говорят, что их пересечение пусто, и записы-
записывают/?! ПЛ2 гф.
3. Разностью /?i \R2 отношений R\ и R2 называют бинарное отношение,
составленное из тех пар (х, у), которые содержатся в R % и не содержатся
4. Симметрической разностью отношений R i и R2 называется отношение
Я такое, что/? = (Rty R2)\(Rt ПR2) = (Rt \R2)U (R2\Rt).
5. Дополнением R к отношению R называют бинарное отношение, содер-
содержащее те и только те пары (х, у) из G Х_С, которые не входят в Л, т.е.
R=(GXG)\R. Ясно, что пересечениеRHR =ф.
6. Обратным отношением R'1 к отношению R назьюают бинарное отно-
отношение, содержащее пару (х, у) в том и только в том случае, когда (у, х) €
l
yy _
Нетрудао доказать, что (R ~* J1 = R и JF1 = (R у1.
7. Двойственным отношением Rd к отношению R назьюается отношение,
определяемое формулойRd = R~l = (G XG)\R~ г.
8. Сужением Rq отношения R = RG, определенного на G, на подмноже-
подмножество Gx С G называют бинарное отношение, состоящее из тех пар {х, у) ? R,
для которых xGGj, у €GX9 т.е. Rq -Rq ^(Gt XG^.
9. Композицией (произведением) /?i ° R2 отношений Rx и R2 называют
бинарное отношение, которое содержит пару (х, у) тогда и только тогда,
когда существует zGG такой, что (х, г) € /? г, (z, у) € /?2.
10. Дг-й степенью Rk отношения /? назьюают бинарное отношение, кото-
которое содержит пару (х, у) тогда и только тогда, когда существует цепочка
элементов х = дг0, х i,x2,... ,xk = ууъ которой (хуу-Ху+1)Е/{ для / =
= 0,1,...,*- 1. Ясно, 4toRk=Rk-1 or.
11. Отношение R2 содержит Rt, если R t С R2.
2.2. Перечислим некоторые свойства приведенных операций.
1. Если на множестве G заданы бинарные отношения Rit /€/, то
( П Я,.) = П ДГ\ ( U Л,) - U RJ\ (RfoRA-1 =R~l oR?.
is i /e/ /e/ /e/ 7 7
2. Композиция (произведение) бинарных отношений ассоциативна:
(Rt о R2) оR3 =Rt о (R2 о R3).
3. Для сужения отношений Ri9 /€/, заданных на G, на подмножество
t С G справедливы равенства
П ^)Gl = П (R#)G ( U /*,)Gl = U (R()G
(#)G ( ,)Gl
4. Для любых отношений Rt,R2,R3 справедливо равенство
(RxU R2)oR3 =(Rt о R3)U (R2 о R3).
5. Для любых/?ь/?2./?з справедливо включение
(Rt nR2)oR3 с (Rx о R3)H(R2 о R3).
6.Если/?1 С/^тоД!1 CR?, RtoR3 CR2oR3uRboR1 <ZR3oR2.
7. Для любых отношений Rt и R2
rf^RfHR?, (Rtn R2)d = R? U R2d, (Rd)d =R.
§ 3. Способы задания бинарных отношений
3.1. Бинарное отношение R между элементами xt конечного множества
(/ = 1,..., п) можно задавать матрицей R = II Гц \ из нулей и единиц, в кото
рой Гц = 1, если xtRx^ и Гц = 0, если не выполняется x{Rxj.
Пусть R = II Гц II, R = 117/у Л,Л -1=II Гц1 II, Rd = II r^ I - матрицы, отвечающие
бинарному отношению R, его дополнению R, обратному отношению R
и двойственному отношению Rd.Тогда V /, / Тцр 1 — г/;-, г^1 = гц> rff = 1 — /у/.
Если/?! = Иг^1^!! и R2 = IIг?2*II— матрицы бинарных отношений Ri и
/?2 соответственно, то матрица1
l.J?a llr^ll, отвечающая объединению RtUR2, состоит из элементов
г«у=r^ vrti* **?е ^'Пу гдеv ~"знак да3
2. R- II Г/у II, отвечающая пересечению
i 2, состоит из элементов
г'/ = г/^ А г//2^'»^ G *'п>где д ~ знак конъюнкции»
3. /? = II Гц II,. отвечающая композиции R% ° R2, равна булеву произ-
произведению матриц Rx и R2.
Отсюда следует упомянутое выше свойство ассоциативности компози-
композиции (RtoR2)oR3 =«! o(R2oR3)=Rt oR2oR3.
Для единичного (или диагонального) отношения А имеем Гц = 1 при i = /
и Гц = 0 при i =^/. Для универсального отношения Гц = Г" Vi, /.
32. Бинарное отношение на конечном множестве элементов можно
задавать также ориентированным графом Г(А)> вершины которого соот-
соответствуют элементам хь а стрелка из дг,в Xjотвечает отношению xtRXj.
Граф T(R) есть геометрическое изображение бинарного отношения подоб-
подобно тому, как график представляет собой геометрическое изображение
функции.
Граф r(R~l) получается из графа Г(Д) изменением направления всех
дуг. Чтобы перейти от графа T(R) к графу V(Rd), необходимо:
1) исключить из T(R) все пары противоположных дуг и все петли;
2) присоединить новые противоположные дуги fay) и {У,х,)9 соответ-
соответствующие парам вершин х ту, не связанным в Т(К) дугой.
3) добавить все петли (х,х9), которых не было в графе Г(/?).
В графе универсального отношения GXGдуги соединяют любую пару
вершин. В графе диагонального отношения А содержатся только петли
при всех верпщнах, а других дуг нет.
33. В более общем случае, когда множество альтернатив G не обязатель-
обязательно конечно, можно задавать бинарное отношение его срезами (сечениями).
Верхний срез GR(x) отношения R в точке х это — множество элементов
10
;; E G таких, что (у, x)ER, т.е.
GR(x) = {yeG\(y,x)GR}=
Аналогично определяется нижний срез HR (jc) отношения R в точке дц
Легковидеть, что Vx Е G GRinR2Qc) = GR (x)nGR2(x);HR Пя2(*) =
= HRi (х) П //*3(jc); G/?(*) = <AG*(*);#*(jc) = G\HR(x); Ся-г (х) = HR(x):
HR-x (jc) = G*(jc); GA(x) = #a(jc) = {x> ;GG* (x) = HG>(x) = G.
Частным бинарным отношениям, ограниченным некоторыми условиями,
соответствуют частные булевы матрицы и орграфы в случае конечного
множества альтернатив и частные классы срезов (сечений) в общем случае.
Выделение бинарных отношений, обладающих специальными свойствами,
позволяет приспособить их к анализу конкретных взаимодействий между
альтернативами jc E G, интерпретируемыми в содержательных терминах
различных дисциплин.
§ 4. Свойства бинарных отношений
Перечислим некоторые часто используемые свойства частных классов
бинарны* отношений.
1. Отношение R называется рефлексивным, если Vjc Е GxRx, т.е. если
отношение R выполняется между объектом и самим собой. Другими слова-
словами, R рефлексивно, если единичное отношение A CR. В матрице II rif II
рефлексивного отношения Гц = 1, V*. В графе T(R) при каждой вершине
имеется петля. Любой элемент хЕ G принадлежит и верхнему и нижнему
cpe3yBJc:jcGG/j(jc) и xGHR(x) VxGG.
2. Отношение R называется антирефлексивным, если (jc, x)^R Vjc G G,
т.е. если отношение R может выполняться только для несовпадающих
объектов. Для антирефлексивного отношения xRy^x^^y. В матрице
II Г/у II антирефлексивного отношения ги = О V/. В графе Т(К\ отсутствуют
петли. Любой элемент jc EG не принадлежит ни верхнему, ни нижнему
срезу в jc: jc^G^x) и x$HR(x) VxGG.
3. Отношение R называется симметричным, если Vjc у EG (x, у) €
Е R =» (у, х)Е R. В матрице II Гц II симметричного отношения г/;- = г/7 V/, /.
В графе Г(Я) вместе с дугой (jc/? xj) содержится дуга (jc;-, jc,) . Верхний
и нижний срезы R в точке х совпадают для любого*EG. Легко видеть,
что для симметричного отношения R=R~l.
4. Отношение R называется антисимметричным, если из (jc, у} Е R и
( у, jc) ER следует, что х =у, т.е. Vjc, у EG(xRy) л ( yRx) => jc = у. Другими
словами,/? антисимметрично, если/? П Л С А.
В матрице И Тц II антисимметричного отношения гуг^ = 0 для / Ф /. Граф
Г(/?) не содержит одновременно дуг (xif xj) и (х;«, jc,) при i Ф /. При
любых jc EG и yEHR(x), хФу, нижний срезЯл(^) не содержит jc. Тоже
относится к верхним срезам. Диагональное отношение А одновременно
симметрично и антисимметрично.
5. Отношение R называется асимметричным, если RHR~l =0, т.е. если
по крайней мере одно из соотношений xRy и yRx несправедливо. Для
асимметричного отношенияxRy=>yRx Vjc,д>EG.В матрице асимметрич-
11
наго отношения г/;щ¦» О V/,/. Граф Г(К) ж содержит одновременно
дуг (хьху) и (xf,Xi) V/,/. Нижний срез Нм(у) не содержит х для лю-
любых x^GnyGHR(x). Таким же свойством обладает верхний срез.
6. Отношение R ^ = R ft R "J называют симметричной частью бинарно-
бинарного отношения R, а отношение R^ = R\R^ - асимметричной частью
отношения R. Отношение Л W всегда симметрично, а Л-W _ асимметрич-
асимметрично. Если Л само симметрично, то R^ = R, если R асимметрично, то
Д<<> = R.
7. Отношение Л назьюается транзитивным, если Vxj,zGG из
(х, у) Е Rn (у9 z) G Л следует (х, z) G Л. Другими словами! R транзитив-
транзитивно, если/? ©Л с Д. .
В матрице II /у7- || транзитивного отношения из rik rkJ- = 1 следует^/ = 1.
В графе Г(/?) существование дуги изхв у через некоторое z EG гаранти-
гарантирует наличие дуги (х, у). Для каждого х е Guy G ?Л(х) справедли.-
во GR(y)C GR(x).
8. Отношение Л называется негатранзитивным, если его дополнение
R транзитивно.
В матрице II />/ II негатранзитивного отношения из rik = 0 и г^7* = 0 сле-
следует /уу = 0.
9. Отношение Я называется сильно транзитивным, если оно одновремен-
одновременно транзитивно и негатранзитивно. В матрице || Тц || сильно транзитивного
отношения из rik rkj = 1 следует Гц = 1, а из rik - тщ = 0 вытекает Гц = %0^
10. Отношение называется слабо транзитивным (псевдотранзитивным),
если из xR Wy и yRz следует x/?z (здесь R(j) = Я П R ~*).
11. Отношение /?i назьюается транзитивным относительно отноше-
отношения R29 если
(а) из(х,^)еЛ! и (y,z)GR2 следует (x9z;)€J?l9
(б) из(х,.у)€Д2 и G,z)G/?1 следует (x,z)G/?,.
Ясно, что транзитивность отношения R относительно самого себя есть
обычная транзитивность R.
12. Отношение R называется ацикличным, если Rn П R~l = ф для лю-
любых и. Ацикличность означает, что из xRzx, zx Rz2,..., zn _ 1Л<у следует
х ?= j/. В ацикличном отношении Я отсутствуют циклы произвольной
длины:
V(x= Хо,Х!,... ,хл_ь хп=уI {(xRxx) A ... л (Хя^!^) A(yRx)}.
В матрице || Г//1| ацикличного отношения из Tik^rkxk% ..^w_1/s= I
следует / Ф /.
Если вершины х и у графа T(R) соединены путем, то в Г(Я) нет ду-
дуги (у, x).M3Zi GGR(x)9z2 еСк(гг)9...9у €GR(zn_t) следует, что
Gr (у) не содержит х. Аналогичное условие имеет место для нижних сре-
срезов. Ацикличное отношение асимметрично.
13. Отношение R называется полным (совершенным, связным), если
\fx9yGGm6o (x9y}GR9 либо (y9x)ER^ либо выполняются оба вклю-
включения. В матрице полного отношения V/, / либо /у/ = 1, либо /у,- = 1, либо
справедливы оба равенства. В графе Г(Д) полного отношения дугой
соединяются либо х и у, либо у и х, либо одновременно пары веп-
12
шин (х, у) и (у, х). Для полного отношения GR (х) U HR (х) ¦ G Vx €G.
Полное отношение рефлексивно.
14. Отношение Л называется слабополным или слабосвязным, если
\/х,д>е?таких, чтох=?.у либо (дс,^)€Л, либо 0>,л:)еД. В матрице
слабосвязного отношения >ИФ]9 либо г*7 = 1, либо Гц* 1. В графе
Г(Л) слабосвязного отношения V* =?д> дугой соединяются либо х и у,
либо j и х, либо присутствуют обе дуги. Для слабосвязного отношения
lx}UGR(x)UHR(x) = G VxGG.
15. Отношение R называется транзите но полным, если для любых п
из XiFbc2,x2Rx39... jXh_tRxn следует сравнимость *i и хя, т.е. Xi&k,,
или хп Rxt.
16. Отношение R называют транзитивным замыканием отношения R9
если оно является пересечением всех транзитивных отношений, содер-
содержащих/?.
§ 5. Связи между свойствами бинарных отношений
Приведем без доказательств некоторые простые утверждения о связях
между свойствами бинарных отношений. В дальнейшем используется
только часть из них. Остальные - полезные упражнения.
1. Если бинарное отношение R рефлексивно, то этим свойством обла-
обладает и R.
2. Бели бинарное отношение R симметрично, то и Л симметрично.
Больше того,R симметрично тогда и только тогда, когда R = R~l.
3. Бели бинарное отношение R антисимметрично, то и Л антисим-
антисимметрично.
4. Если бинарное отношение R асимметрично, то и R "! асимметриздо.
5. Бели бинарное отношение R транзитивно, tohR'1 транзитивно.
6. Если бинарное отношение R рефлексивно, то двойственное отноше-
отношение ЯJ антирефлексивно. .Если R антирефлексивно, то Rd рефлексивно.
7. Бинарное отношение R симметрично тогда и только тогда, когда
симметрично двойственное отношение Rd.
8. Бинарное отношение R асимметрично тогда и только тогда, когда
двойственное отношение Rd полно.
9. Бинарное отношение R негатранзитивно тогда и только тогда, когда
двойственное отношение Rd транзитивно.
10. Бинарное отношение R слабосвязно тогда и только тогда, когда
двойственное отношение Rd антисимметрично.
11. Если бинарное отношение R асимметрично, то оно и антирефлек-
антирефлексивно.
12. Объединение произвольного числа рефлексивных отношений явля-
является рефлексивным отношением.
13. Пересечение произвольного числа рефлексивных отношений явля-
является рефлексивным отношением.
14. Объединение произвольного числа антирефлексивных отношений
является антирефлексивным отношением.
15. Пересечение произвольного числа антирефлексивных отношений
является антирефлексивным отношением.
13
16. Объединение произвольного числа симметричных отношений явля-
является симметричным отношением.
17. Пересечение произвольного числа симметричных отношений являет-
является симметричным отношением.
18. Для того чтобы композиция/?! о R2 симметричных отношений была
симметрична, необходимой достаточно,чтобы/?! °&г = Я2 °R\.
19. Пересечение произвольного числа антисимметричных отношений
является антисимметричным отношением.
20. Объединение Rx UR2 антисимметричных отношений Rx и R2 анти-
антисимметрично в том и только в том случае, когда Rt HR2l Q А (где А —
единичное (диагональное) отношение).
21. Если бинарное отношение R асимметрично, то пересечение отноше-
отношений RC\RX асимметрично при любом R х.
22. Объединение RXUR2 асимметричных отношений асимметрично
тогда и только тогда, когда R{ П R2X = ф.
23. Пересечение любого числа транзитивных отношений является тран-
транзитивным отношением.
24. Бели два бинарных отношения транзитивны и одно из них транзи-
транзитивно относительно другого, то объединение этих отношений тразитивно.
25. Если бинарное отношение R транзитивно, то его симметричная часть
^) и асимметричная часть R^также транзитивны. Обратное, вооб-
вообще говоря, неверно: из транзитивности R^ и R^ не следует транзитив-
транзитивность R. Это выполняется лишь, если отношение R *л) транзитивно относи-
относительно R^s\
26. Если R ацикличное бинарное отношение, то оно асимметрично
27. Если R - антирефлексивное транзитивное бинарное отношение
то оно ациклично.
28. Если бинарное отношение R симметрично, транзитивно и V* Зу:
xRy> то оно рефлексивно.
29. Если бинарное отношение R антирефлексивно и транзитивно, то
оно асимметрично.
30. Если бинарное отношение R асимметрично и негатранзитивно, то оно
транзитивно.
31. Если бинарное отношение R антирефлексивно, транзитивно и слабо
полно, то оно негатранзитивно.
32. Если бинарное отношение R ациклично и слабо полно, то оно нега-
негатранзитивно.
33. Бинарное отношение R негатранзитивно тогда и только тогда, когда
Vjc,y,zGG xRy => (xRz) v (zRy). ,
34. Если бинарные отношения Rt и R2 рефлексивны, то Rx U R2 С
CRxoR2.
35. Бинарное отношение R асимметрично тогда и только тогда, когда
оно совпадает с асимметричной частью двойственного отношения Rd.
36. Бинарное отношение R полно тогда и только тогда, когда его асим-
асимметричная часть R(а) совпадает с двойственным отношением R d.
37. Из ацикличности и транзитивной полноты вытекает транзитивность.
38. Если R транзитивно, то оно совпадает со своим транзитивным замы-
замыканием R=R,h наоборот, если R=R,toR транзитивно.
14
39. Если отношение Rx содержит отношение R2, то и транзитивное
амыкание Rt содержит транзитивное замыкание R2 :
R2 Q Rx => R2 Q Rt.
40. Если отношение R рефлексивно, то рефлексивно и его транзитов-
л
ное замыкание R.
41. Отношения R и R совпадают.
42. Если Rt и R2 рефлексивны, то рефлексивна и их композиция
Rx о Д2.
л
43. Транзитивное замыкание R симметричного отношения R симмет-
симметрично.
44. Ни для какого отношения не может быть R=Rd.
45. Отношение RU(RnRd) = RU (Я )(j) всегда полно.
46. Для любого отношения R=(R~l \R) U (R ПRd).
47. Для любого отношения R'} CRU (R OR'1).
48. Для полного отношения R СЛ и^/? =Л и(ДПЛ~!).
49. Есди для /? асимметрично, то Rd и Л - полные отношения.
50. Для асимметричного отношения R "! СЯиЛ=Ли(Л n/?d).
51. Если R антисимметрично и рефлексивно, то Rd и Я слабо полны.
52. Если Rx и R2 полные отношения, то Rx oR2 полно.
Глава II
СПЕЦИАЛЬНЫЕ БИНАРНЫЕ ОТНОШЕНИЯ
§ 1. Упорядочения и безразличие
Выделим классы бинарных отношений, обладающих свойствами, естест-
естественными для процессов принятия решений.
Чтобы использовать бинарные отношения для сравнения вариантов
из некоторого множества, целесообразно ввести понятия упорядочения
(строгого и нестрогого) и безразличия.
Минимальное требование к строгому упорядочению (строгому пре-
превосходству) — это асимметричность соответствующего отношения Р. Это
условие и служит определением строгого упорядочения. Итак, строгое
упорядочение Р - это асимметричное бинарное отношение. Как мы видели
в § 5 гл. I, из асимметричности бинарного отношения следует его анти-
антирефлексивность. Следовательно, строгое упорядочение Р - это асимметрич-
асимметричное, антирефлексивное бинарное отношение.
Под отношением безразличия будем понимать отношение /, исключаю-
исключающее строгое превосходство одного элемента над другим. Оно может быть
выражено через строгое упорядочение Рв виде
хТу <=> (хРу)л (уРх);
иногда вместо xly используется обозначение х ~у. Из приведенного
соотношения и определения строгого упорядочения следует, что отно-
отношение безразличия / симметрично и рефлексивно. Эти два свойства мо-
могут служить определением отношения безразличия. Таким образом, отноше-
отношение безразличия (в другой терминологии отношение толерантности) -
это симметричное и рефлексивное бинарное отношение.
Отношение безразличия между вариантами может возникнуть в одном
из трех случаев:
а) лицо, принимающее решение (ЛПР), считает, что нет разницы
(в смысле отношенияР) между вариантами хиу?
б) ЛПР не уверено в строгом превосходстве одного из вариантов над
другим (в строгом упорядочении вариантов между собой);
в) ЛПР считает варианты хиу несравнимыми между собой. «
Отношения строгого упорядочения Р и безразличия Т индуцируют
отношение R нестрогого упорядочения R=Pu7.
Отсюда следует, что отношение R полно (а потому и рефлексивно).
Полнота может служить определением нестрогого упорядочения.
16
Используя свойства действий над бинарными отношениями, легко
проверить справедливость следующих утверждений.
Утверждение 1. Строгое упорядочение и нестрогое упорядочение обра-
образуют двойственную пару отношений
/> = Rd = Л, R = Pd = Р'1.
Утверждение 2. Имеет место соотношение
/U Р U Р'1 = GXG.
Из определения /и Л и утверждения 1 следует, что отношение безраз-
безразличия/ является симметричной частью нестрогого упорядочения /?, а стро-
строгое упорядочение Р — асимметричной частью R, т.е.
/ = Pd П (Р*)-1 = R П
Р = R\T =
§ 2. Слабый порядок
2.1.. Введенные отношения - строгого и нестрогого упорядочения и без-
безразличия - определяют весьма грубые подходы к сравнению вариантов,
не обладающие достаточной определенностью и избирательностью. Для того
чтобы использовать бинарные отношения как инструмент рационального
выбора из множества объектов произвольной природы, необходимо наде-
наделить отношения дополнительными более жесткими свойствами. Для срав-
сравнения и выбора вариантов естественно использовать отношения, обладаю-
обладающие такими свойствами, как транзитивность и негатранзитивность. Сузим
класс строгих упорядочений, добавляя к свойству асимметричности соот-
соответствующего бинарного отношения негатранзитивность либо транзитив-
транзитивность. Получим новые классы отношений, более приемлемые в задачах
выбора решений.
Будем называть слабым порядком асимметричное негатранзитивное
бинарное отношение Р. Другими словами, слабый порядок Р — это нега-
транзитивное строгое упорядочение. Примером слабого порядка является
отношение "больше" (>) на любом пододюжестве G вещественной
прямой.
По аналогии с рассуждениями предыдущего параграфа можно по сла-
слабому порядку Р индуцировать два бинарных отношения / и R :
xly <=> (хРу) л (уРх). A)
Наряду с xly будем использовать запись х^у. Отличие от введенных
ранее обозначений / и ~ связано с тем, что для слабых порядков это
отношение обладает специальными свойствами.
Как будет показано ниже, если Р — слабый порядок, то бинарное отноше-
отношение /, определяемое приведенным соотношением, рефлексивно, симметрич-
симметрично и транзитивно. Бинарное отношение, обладающее этими свойствами,
называется эквивалентностью. Можно сказать, что отношение эквивалент-
эквивалентности — это транзитивное отношение безразличия.
Слабый порядок Р и отношение эквивалентности /порождают нестрогий
слабый порядок R как объединение слабого порядка и эквивалентности
J!S?U/, те. xRy <=> (хРу) V (xly).
2. Д.Б. Юдин ***
Дальше будет показано, что таким образом порождаемое отношение R
транзитивно и полно. Эти свойства могут служить определением нестро-
нестрогого слабого порядка.
Примером нестрогого слабого порядка является отношение "больше
или равно" (>) на любом подмножестве G вещественной прямой. Из
определения отношений слабого порядка и нестрогого слабого порядка
вытекает
Утверждение 3. Слабый порядок Р и нестрогий слабый порядок R обра-
образуют двойственную пару отношений
Из утверждения 3 и определений Ли/ следует, в частности, чтб отноше-
отношение эквивалентности — симметричная часть нестрогого слабого порядка R,
а слабый порядок - асимметричная часть R:
I = R П /Г1 = Д<*>, Р = R\I = R<a\
Утверждение 4. Пусть Р — отношение слабого порядка, а / — отношение,
определяемое формулой A). Для любых х9 у € G выполняется одно и
только одно из трех соотношений хРу9 уРх, xly.
Имеет место
Утверждение 5 [46]. Слабый порядок — транзитивное отношение.
Доказательство. Слабый порядок Р асимметричен и негатранзи-
тивен. Легко видеть, что отношение Р негатранзитивно тогда и только
тогда, когда
хРу => Vz (xPz) v (z#y). B)
Действительно, пусть это не так, и имеет место (хРу, xPz, zPy). Тогда
из негатранзитивности Р вытекает хРу, что противоречит хРу. Поэтому
из негатранзитивности Р следует B). Верно и обратное - иэ B) вытекает
негатранзитивность Р. Пусть это не так, и имеет место (хРу, yPz, xPz).
Тогда xPz => ~\((xPy) v (yPz)\ и B) нарушено.
Предположим теперь, что хРу и yPz. Тогда по B) должно быть
(xPz)\/(zPy) и (yPx)\/(xPz). В силу асимметрии слабого порядка хРу
и уРх невыполнимы одновременно (равно как и уРги zPy). Поэтому
должно быть xPz. Следовательно, отношение Р транзитивно. Утвержде-
Утверждение 5 доказано.
Утверждение 6. Если Р — слабый порядок, то бинарное отношение /,
определяемое формулой A), рефлексивно, симметрично и транзитивно.
Доказательство. Рефлексивность и симметричность / вытекают
из определения A). Пусть /нетранзитивно, т.е. xly,ylz, но xTz. Тогда
в соответствии с утверждением 4 либо х/^либо zPx. В силу негатранзи-
негатранзитивности слабого порядка Р должно выполняться соотношение B) и,
поскольку должно иметь место (xPz)v(zPx), то должно удовлетворяться
одно из соотношений хРу, yPz9 zPy и уРх. Последнее же противоречит
предположению xly,ylz. Транзитивность отношения /доказана. Таким
образом, отношение / есть отношение эквивалентности.
2.2. Назовем сильным порядком слабосвязный (слабополный) слабый
порядок.
18
Пусть Р - слабый порядок на G. Обозначим через G/I множество клас-
классов эквивалентности на G в смысле отношения /. Условимся говорить,
что два класса Xи Уяз G/Iнаходятся в отношении Р, если в этих клас-
классах можно выбрать по элементу х € X и у G F, так что хРу, т.е.
(VAT, Г G G/J) (ДГРГ <=> (Эх G Z, j; G Г)Р)
В этом случае скажем, что Р порождается слабым порядком Р.
Приведем без доказательства«следукнцее
Утверждение 7. Бинарное отношение Р на множестве классов эквива-
эквивалентности G/I, порожденное слабым порядком Р, является сильным по-
порядком (т.е. асимметрично, негатранзитивно и слабосвязно).
Таким образом, по слабому порядку Р на множестве G можно по-
построить сильный порядок Р, "склеив" некоторые элементы из G.
23. Имеет место
Утверждение 8. Нестрогий слабый порядок R =PUI транзитивен и
полон.
Доказательство. Транзитивность R следует из транзитивнос-
транзитивности Р и / и утверждения 7. Допустим, что отношение R неполно, т.е. для
некоторых jc, у имеет место (xRу) л (yRx).
Тогда в силу определения R имеет место (хРу) л (хТу) л (уРх). А это
противоречит утверждению 4.
Приведем без доказательства сводку свойств пары двойственных отно-
отношений PmR — слабого порядка и нестрогого слабого порядка.
Утверждение 9. Пусть Р ylR — слабый порядок и нестрогий слабый поря-
порядок на G, а/ - отношение эквивалентности. Для всех jc, y9 zGG имеют
место соотношения [44,46]
1. (xPy)A(yRz) => xPz,
2. (xRy) л (yPz) => xPz,
3. (хРу) л (yPz) => xPz,
4. (хРу) л (yRz) => xRz,
5. (xRy)A (yPz}=* xRz9
6. (xRy) л (yRz) => xRz,
7. (xPy) => (xPz) v (zPy).
8. (хРу) л (ylz) => xPz9
9. (xly) л (yPz) => xPz,
10. (Xly) Л (J>/Z) "* X/2.
§ 3. Эквивалентность
3.1. Мы определили отношение эквивалентности / как рефлексивное,
симметричное и транзитивное бинарное отношение.
Укажем другое (содержательное) определение отношения эквивалентно-
эквивалентности, равносильное приведенному выше. Введем понятие разбиения множест-
множества G. Система (конечная или бесконечная) непустых подмножеств
/^G1,G2,...)} множества G называется разбиением G. если G = U Gt и
2* 19
Gf П Gf =0 при i Ф j. Понятие разбиения позволяет дать конструктивное
определение отношению эквивалентности.
Отношение / на множестве G называется эквивалентностью, если суще-
существует разбиение {G\9 G2, ...) множества G такое, что соотношение xly
выполняется тогда и только тогда, когда х и у принадлежат некоторому
одному и тому же классу Gf этого разбиения.
Утверждение о равносильности этого определения эквивалентности при-
приведенному ранее формулируется следующим образом.
Утверждение 10. Если бинарное отношение / на множестве G рефлексив-
рефлексивно, симметрично и транзитивно, то существует разбиение {Glf G2,...} мно-
множества G такое, что соотношение xly выполняется тогда и только тогда,
когда х и у принадлежат одному и тому же классу разбиения. Обратно:
если задано разбиение {Glt G2,...) множества G и отношение xly опреде-
определено как принадлежность х и у одному и тому же классу разбиения, то 1
рефлексивно, симметрично и транзитивно.
Доказательство. Пусть бинарное отношение / рефлексивно, сим-
симметрично и транзитивно. Обозначим через Gx множество
Gx ={z\xlz).
Легко видеть, что для V х, у € G либо Gx=Gy, либо GxDGy s ф. Дейст-
Действительно, пусть Gx П Gy Ф ф. Покажем, что Gx = Gy. Пусть z G GXC\ Gy.
Тогда по определению Gx и Gy имеет место xlz и ylz. В силу симметрично-
симметричности / имеем ylz => zly, а по транзитивности J из xlz и zly следует xly.
Пусть теперь v — произвольный элемент Gy, т.е. ylv. Из xly и ylu следует
xlv, т.е. v G Gx. Таким образом, GyCGx. Точно так же доказывается, что
GxCGy. Следовательно, Gx=Gy. Эти рассуждения и рефлексивность отно-
отношения / приводят к выводу, что множества вида Gx образуют разбиение
множества G. Пусть теперь имеет место xly. По определению это значит,
что у G Gx. Но в силу рефлексивности / выполнено xlx и, стало быть,
х G Gx. Следовательно, хну принадлежат одному и тому же классу раз-
разбиения. Пусть теперь, наоборот, и G Gx и v G Gx. Покажем, что ulv.
Действительно, из приведенных включений следует, что xlu и xlv. По сим-
симметричности /имеет также место ulx. Вследствие транзитивности'/ из
ulx и xjv вытекает ulv.
Докажем теперь обратное утверждение. Пусть {Gif G2,... } - разбиение
множества G. Поскольку UG^ = G, то любой х G G входит в некоторый
класс Gt. Отсюда вытекает xlx, т.е. отношение / рефлексивно. Если х и у
входят в Gf, то и у и х входят в G/, т.е. из xly вытекает ylx — отноше-
отношение / симметрично. Пусть теперь имеют место xly и ylz. Это значит, что х
и у входят в класс Gf, а у и z — в Gj . Классы Gf и Gf содержат общий
элемент у. Стало быть, Gf = Gj, а тогда и х G Gf и z G Gf, т.е. имеет место
xlz, и, следовательно, отношение / - транзитивно. Утверждение доказано.
Как видим, в процессе доказательства не использовалась дискретность
множества G и конечность или счетность разбиения. Запись разбиения в ви-
виде { G\, G2,...} принята лишь для упрощения обозначений.
3.2. Отношение эквивалентности подробно исследовано в [50]. Там,
в частности, указаны условия, при которых те или иные операции над отно-
20
шениями эквивалентности дают в результате отношение эквивалентности.
Приведем эти условия без доказательства.
Будем обозначать бинарное отношение R на множестве G парой (R, G).
Прямой суммой бинарных отношений (Rl9 Gt) и (R2, G2) назьюается би-
бинарное отношение (Rt U R2, Gx U G2). Прямая сумма обозначается сим-
символом е. Таким образом,
(RlfGt) e (R2fG2) = (Ri U R2, Gx U G2).
Если Gi П G2 = 0-, &Rt nR2 - отношения эквивалентности, то их прямая
сумма также является отношением эквивалентности.
Пусть множество G можно разбить на два непересекающихся множества
G\ и G2 (из которых одно может быть пустым), так что
(RlfG) =
(Ri,G)= (R21,Gt) e (R22f G2),
и при этом Ru С R2ly a R22 С Rl2. В этом случае бинарные отношения
Rt и R2 называются когерентными.
Имеют место следующие свойства операций над отношениями эквива-
эквивалентности.
1. Объединение It U l2 отношений эквивалентности 1\ и 12 представляет
собой отношение эквивалентности в том и только в том случае, когда 1Х и
12 когерентны.
2. Объединение Ix U /2 эквивалентностей 1Х и /2 является отношением
эквивалентности в том и только в том случае, когда оно совпадает с компо-
композицией этих отношений, г.е. когда Ix U /2 = 1Х о /2.
3. Композиция Д о /2 отношений эквивалентности 1Х и /2 представляет
собой отношение эквивалентности в том и только в том случае, когда она
коммутативна, т.е. когда 1г о /2 = /2 о Jx.
§ 4. Качественный порядок
4.1. В § 2 указывалось, что отношение стрргого упорядочения -
асимметричное бинарное отношение - недостаточно избирательно и опреде-
определенно и более жесткий подход к сравнению вариантов должен наделить
используемое бинарное отношение, помимо свойства симметричности, еще
и такими свойствами, как негатранзитивность или транзитивность.
В § 2 из класса отношений строгого упорядочения были выделены асим-
асимметричные негатранзитивные отношения — отношения слабого порядка.
Здесь будет рассмотрен другой подкласс отношений строгого упорядоче-
упорядочения — асимметричные транзитивные бинарные отношения. В [44] такие
отношения называются качественным порядком. (Смысл этого названия
будет пояснен дальше.) Другое эквивалентное определение качественного
порядка - антирефлексивное, транзитивное бинарное отношение (в ряде
работ такие отношения называются строгим частичным порядком).
Легко видеть, что слабый порядок является и качественным порядком
на G (из асимметричности и негатранзитивности бинарного отношения
следует его транзитивность). Обратное, вообще говоря, неверно.
21
Примером качественного порядка Р является порядок на вещественной
прямой,д>азличающий лишь достаточно удаленные между собой точки:
хРу «=» х > у + 1.
В этом примере, как легко проверить, отношение Р не является негатран-
зитивным и, следовательно, не является слабым порядком.
Граф отношения качественного порядка Р на конечном множестве G
не содержит контуров. И обратно, всякому графу без контуров может быть
сопоставлен качественный порядок. Пусть имеется граф без контуров.
Определим на множестве вершин этого графа отношение Р : хРу, если су-
существует путь, ведущий по направлению стрелок из х в у: Такое бинарное
отношение на графе без контуров антирефлексивно и транзитивно, т.е.
представляет собой качественный порядок. Легко видеть, что пересечение
любого числа качественных порядков представляет собой качественный по-
порядок. Назовем отношение R = Pd9 двойственное к качественному поряд-
порядку Р, нестрогим качественным порядком* Нетрудно проверить, что нестро-
нестрогий качественный порядок полон и негатранзитивен. Полнота и негатранзи-
тивность могут служить определением нестрогого качественного порядка.
Любой нестрогий слабый порядок является и нестрогим качественным
порядком. Обратное, вообще говоря, неверно.
Примером нестрогого качественного порядка является порядок на веще-
вещественной прямой, не различающий близких точек: xRy *¦*• х > у — 1.
В этом примере нестрогий качественный порядок R не является нестрогим
слабым порядком, поскольку для R здесь не выполнено условие негатран-
зитивности.
4.2. Приведем без доказательств несколько утверждений о качественных
порядках, позволяющих, в частности, оправдать название этого отношения
и пояснить природу различия между свойствами слабого порядка и качест-
качественного порядка.
Пусть Р — слабый порядок на G. Индуцируемое по формуле A) поряд-
порядком Р отношение безразличия / является, как мы видели, отношением
эквивалентности, т.е. рефлексивно, симметрично и транзитивно. Пусть те-
теперь Р W есть качественный порядок на G. Индуцируемое им по формуле
xJWy <=> х ~ у «=> (хРЮу) л (у
отношение качественного безразличия является рефлексивным, симметрич-
симметричным, но в общем случае уже не транзитивным бинарным отношением
на G, т.е. не является отношением эквивалентности. Это значит, что качест-
качественные порядки отличаются от слабых порядков меньшей точностью,
избирательностью, определенностью. Качественные порядки используются
для выбора варианта,- когда ЛПР пренебрегает некоторыми потерями в от-
отдельных компонентах выбираемого вектора, а считается, главным образом,
с качественными характеристиками вариантов. Двойственность качествен-
качественного и нестрогого качественного порядков и определение качественного
безразличия означает, что качественный порядок и качественное
безразличие представляют собой соответственно асимметричную и симмет-
симметричную части нестрогого качественного порядка.
22
Отношение / *** качественного безразличия индуцирует по формуле
отношение эквивалентности /*** - рефлексивное, симметричное, транзи-
транзитивное отношение. Таким образом, отношение качественного безразличия
оказывается отношением эквивалентности /^ тогда, когда из без-
безразличия х к какому-либо z G G следует, что у также находится в отноше-
отношении качественного безразличия с z и наоборот.
4.3. Приведем без доказательств еще некоторые свойства качественных
порядков [46]. ^
Утверждение 11. Пусть рЮ - качественный порядок на С, а /*** и
/(*) _ порождаемые им качественное безразличие и эквивалентность.
Тогда V х, у.Е G выполняется ровно одно из четырех соотношений
Пусть р(к^ и /^ — качественный порядок и эквивалентность
на G, а />(*) — отношение на G/I^k^9 порождаемое р(к) (т.е.
Имеет место
Утверждение 12. Бинарное отношение Р (/с) на множестве классов экви-
эквивалентности G/I^, порожденное качественным порядком, также являет-
является отношением качественного порядка.
Таким образом, по качественному порядку на G можно построить каче-
качественный порядок на G/I^, "склеив" некоторые элементы из G.
Для двойственной пары качественных отношений (качественного поряд-
порядка ?W и нестрогого качественного порядка /?***) и порожденных ими
отношений качественного безразличия / ^ и качественной эквивалентно-
эквивалентности /**) имеет место утверждение, аналогичное утверждению 9 для слабого
и нестрогого слабого порядков и определяемой ими эквивалентности.
Утверждение 13. Пусть Р **) и Л *** - качественный и нестрогий качест-
качественный порядки, а / *** и /**) - порожденные ими качественное безразли-
безразличие и качественная эквивалентность. Vjc, у, z E G имеют место соотно-
соотношения [44,46]:
Л
2. (xRwy) Л (yP(k)z) => xR(k)z,
3. (jcP(fcV) Л
4.
23
5. (xR <*V) л (yR <*>z) =* xPik)z,
6. (xP(k)y) => (*/>(*>z) V (z/?(*V),
7. (xPWy) - (*/?<*>z) v (z/><*V),
8. (x/<*>y) ~ <*/><*>/«=* з^М л
9. (x/>(*V) л 0>/<*>z) => jc/><*>z,
10. (x/(/cV) л
§ 5. Интервальный порядок и полупорядок
5.1. Как мы видели, слабый порядок обладает более жесткими характе-
характеристиками, чем качественный порядок. Отношение безразличия, порож-
порождаемое слабым порядком, транзитивно и, следовательно, является эквива-
эквивалентностью. Безразличие, индуцируемое качественным порядком, не обяза-
обязано быть транзитивным и, вообще говоря, не совпадает с отношением экви-
эквивалентности.
Введем классы бинарных отношений, занимающих промежуточное поло-
положение между слабым порядком и качественным порядком.
Назовем полутранзитивным порядком Р бинарное отношение на G,
обладающее следующим свойством: Vjc, y.9 z9 t G G из хРу и yPz сле-
следует либо xPt, либо tPz.
Назовем интервальным порядком Р антирефлексивное бинарное отноше-
отношение на С, обладающее следующим свойством: Vjc, у., z9 t ? G из хРу и
zPt следует xPt или zPy. Можно показать, что интервальный порядок
транзитивен и, таким образом, является качественным порядком.
Полутранзитивный интервальный порядок будем назьюать полу-
полупорядком.
Класс интервальных порядков и его подкласс - полупорядки обладают
некоторыми свойствами, позволяющими использовать их для сравнения
пар объектов в ситуациях, в которых слабый порядок не может быть
применен из-за транзитивности определяемого им отношения безразличия,
а качественный порядок оказывается чересчур грубым инструментом срав-
сравнения из-за недостаточной разрешающей способности. ^
Интервальный порядок Р и порождаемое им отношение безразличия /
индуцируют на множестве G два бинарных отношения Рх иР2:
хРху ^> 3z G G: (jc/z) л (zPy),
хР2у <=> 3z G G: (xPz) л (zly).
Имеет место следующее
Утверждение 14. Отношения Рг и Р2, определяемые интервальным по-
порядком /\ являются слабыми порядками, а отношение эквивалентности /,
24
отвечающее интервальному порядку, определяется через отношения эквива-
эквивалентности 1\ и /2, соответствующие слабым порядкам Рх и ?2, по
формуле
xly «=> (xlxy) Л (xl2y),
где х11у^=>(хР1у)л(уР1х), х12у<=>(хР2у)л(уР2х).
Построим множество Y, состоящее из элементов, взятых по одному из
каждого класса эквивалентности, принадлежащего G//, где / - отношение
эквивалентности, соответствующее интервальному порядку Р.
Приведем в соответствие каждому элементу хЕ Y "искусствейный" эле-
элемент х*. Обозначим множество таких элементов через У* и определим
на У U У* отношение Р3, полагая
уРъх *=> уРхх, (а)
у*Р3х* <==> yP2xt @)
уР3х* «-» yPxf G)
у*Р3х *=* yRx, F)
где R — нестрогое бинарное отношение, определяемое интервальным поряд-
порядком Р, Я = Р U /, а />! иР2 — слабые порядки из утверждения 14.
Оказывается, что таким образом определенное отношение Р3 является
слабым порядком на Y U У*.
Имеет место
Утверждение 15. Бинарное отношение Р3у индуцируемое интервальным
порядком Р по соотношениям (а) — @), является слабым порядком.
Это утверждение существенно используется при построении численного
представления для интервального порядка.
Утверждение 15 можно усилить для полупорядков.
Пусть для полупорядка Р, представляющего собой полутранзитивный
интервальный порядок, определены указанным выше способом отношения
Рх пР2. Определим еще на G отношение Ро по формуле
хР0У *=* (хРгу) V (хР2у) Vx, у е G.
Имеет место следующее
Утверждение 15#. Бинарное отношение Ро, порожденное полупоряд
ком Р, является слабым порядком на С.
Дальше при рассмотрении численных представлений специальных бинар-
бинарных отношений мы снова придем к выводу, что интервальные порядки
обладают характеристиками более жесткими, чем качественные порядки,
однако более грубыми, чем слабые порядки.
§ 6. Другие специальные бинарные отношения
6.1. В параграфе 4 мы рассматривали отношение качественного порядка
на G и порожденное им двойственное отношение — отношение нестрогого
качественного порядка. Кроме того, как мы видели, качественный порядок
индуцирует на G отношения качественного безразличия и качественной эк-
эквивалентности,
25
Здесь мы рассмотрим другие бинарные отношения, так или иначе связан-
связанные с качественным порядком.
Качественный порядок Р — это асимметричное транзитивное бинарное
отношение. Другое эквивалентное определение качественного порядка -
это антирефлексивное и транзитивное бинарное отношение. Качественный
порядок Р во втором определении в литературе часто назьюается (чтобы
подчеркнуть неполноту отношения) строгим частичным порядком.
Со строгим частичным порядком Р связан нестрогий частичный поря-
порядок R, определяемый по формуле R = Р U А, где Д — единичное (диаго-
(диагональное) отношение.
Из приведенной формулы следует, что порядок R рефлексивен, транзи-
тивен и антисимметричен. Эти три свойства, из которых ни одно>е следует
из других, могут служить определением нестрогого частичного порядка.
Подчеркнем, что хотя понятия качественного и строгого частичного поряд-
порядка совпадают, понятия нестрогого качественного и нестрогого частичного
порядка различны.
Множество G, на котором задан нестрогий частичный порядок, называет-
называется частично упорядоченным. Пусть между частично упорядоченными G и
G9 установлено взаимно однозначное соответствие <р: <р(х) = х\ х € G,
х' € G \ Если из xRy, где х, у. Е G, всегда следует <р (x)Ry (у) и обратно,
то <р называется изоморфизмом между G и G$, а сами множества G и
G' - изоморфными частично упорядоченными множествами.
Будем говорить, что частично упорядоченное множество Cj изоморфно
вкладывается в частично упорядоченное множество G2, если существует
изоморфное отображение Gx на некоторое подмножество Gf2 множества
G2, причем G2f рассматривается с нестрогим частичным порядком, индуци-
индуцированным в нем нестрогим частичным порядком множества G2.
Легко видеть, что если Р — строгий частичный порядок, то и Р также
строгий частичный порядок. Если R нестрогий частичный порядок, то
R nR'1 = Д.
Действительно, по определению R
R П R-1 = (Р U Д) П (Р-1 U Д) = (Р П Р'1) U (Р П Д) U
U (Р П A)'U Д = 0и0и0иД = Д.
Приведем примеры строгого и нестрогого чаЛичного порядка.
Отношение теоретико-множественного включения на множестве подмно-
подмножеств множества G является частичным порядком. Строгое включение С
определяет строгий частичный порядок, нестрогое включение С — нестро-
нестрогий частичный порядок.
Частичный порядок по включению играет особую роль в теории частично
упорядоченных множеств. Имеет место
Утверждение 16. Всякое частично упорядоченное множество изоморфно
вкладывается в множество 2Н всех подмножеств некоторого множест-
множества Я, частично упорядоченного по включению. В качестве Н можно взять,
например, само множество Q.
Простое доказательство этого утверждения можно найти в [23] *
26
Рассмотрим еще примеры строгого и нестрогого частичного порядка.
Отношения Р и R, определенные на множестве всех непрерывных функ-
функций на отрезке [а, Ь] по формула^
*(*) Vx e[afb],
fRip *=> f(x) > <p(x) Vx e[a,b]9
являются соответственно строгим и нестрогим частичным порядком.
Отношения Р и R, определенные на множестве всех натуральных чисел
по формулам
л
хРу *=* — — целое число, большее 1,
У
х
xRy <=> — — целое число,
У
является соответственно строгим и нестрогим частичным порядком.
Обобщением нестрогого частичного порядка, впрочем, как и обобще-
обобщением отношения эквивалентности, является отношение квазипорядка, или
предпорядка, - рефлексивное, транзитивное бинарное отношение.
Симметричный квазипорядок является отношением эквивалентности.
Антисимметричный квазипорядок является нестрогим частичным
порядком.
Если отношение R есть одновременно эквивалентность и нестрогий час-
частичный порядок, то оно есть единичное отношение А — отношение равенст-
равенства на G. Соответствующее разбиение множества G состоит из подмножеств
множества G, содержащих ровно по одному элементу.
Легко видеть, что если R — квазипорядок, то отношение R П R реф-
рефлексивно, симметрично и транзитивно, т.е. R П/? — отношение эквива-
эквивалентности.
Пусть R — квазипорядок на множестве G, а / = R ПЛ" — отношение
эквивалентности. Обозначим через R отношение на G/I, порождаемое R
(T.e.(VX, YeG[I)(XRY *=> (ЭхGX, yGY)xRy).
Имеет место утверждение, аналогичное утверждениям 7 и 12.
Утверждение 17. Отношение R на множестве классов эквивалентности
G//, порожденное нестрогим частичным предпочтением (квазипоряд-
(квазипорядком) R, является нестрогим частичным порядком.
Таким образом, по квазипорядку на G можно построить нестрогий час-
частичный порядок на G/I, "склеив" некоторые элементы из G.
6.2. При решении задач выбора часто удобно рассуждать в терминах
"предпочтений". Предпочтение — это бинарной отношение, наделенное неко-
некоторыми специальными свойствами.
Отношение квазипорядка (предпорядка) называют также нестрогим час-
частичным предпочтением.
Под строгим частичным предпочтением будем подразумевать антиреф-
антирефлексивное, транзитивное бинарное отношение. Используя введенные раньше
термины, можно сказать, что это отношение качественного (либо строгого
частичного) порядка.
27
Из антирефлексивности и транзитивности строгого частичного предпочте-
предпочтения следует его асимметричность и ацикличность.
Назовем строгим порядком слабополное (слабосвязное) строгое частич-
частичное предпочтение, т.е. антирефлексивное, транзитивное, слабополное бинар-
бинарное отношения. Нетрудно проверить, что строгий порядок негатранзитивен
и потому является сильным порядком (п. 2.2). Обратно, сильный порядок
обладает всеми свойствами строгого порядка, т.е. эти понятия совпадают.
Будем называть нестрогим порядком полный (связный) нестрогий частич-
частичный порядок, т.е. рефлексивное, транзитивное, антисимметричное, полное
бинарное отношение. Нестрогий порядок называют также линейным поряд-
порядком, а строгий порядок — строгим линейным порядком.
Справедливо
Утверждение 18. Если Р — строгий порядок, то R = Р U Д — нестрогий
порядок. И обратно, если R — нестрогий порядок, то Р s R \ Д — строгий
порядок.
Назовем слабополное строгое частичное предпочтение строгим предпочте-
предпочтением, а полное нестрогое частичное предпочтение (связный квазипоря-
квазипорядок) — нестрогим предпочтением. Таким образом, строгое предпочтение —
это антирефлексивное, транзитивное слабополное бинарное отношение,
т.е. строгий порядок, а нестрогое предпочтение — рефлексивное, транзи-
транзитивное, полное бинарное отношение, т.е. нестрогий слабый порядок.
Если в утверждении 17 заменить нестрогое частичное предпочтение на
нестрогое предпочтение, то порождаемый им нестрогий частичный поря-
порядок R на множестве классов эквивалентности G/I заменится на нестрогий
порядок.
6.3. Приведем без доказательств некоторые простые утверждения об
операциях над порядками и предпочтениями. Доказательства приведенных
утверждений можно найти, например, в [50].
Утверждение 19. Если Rt и R2 - нестрогие частичные порядки (строгие
частичные порядки, квазипорядки), то пересечение Rx П R2 также являет-
является нестрогим частичным порядком (строгим частичным порядком, квази-
квазипорядком). Пересечение строгого и нестрогого частичного порядков есть
строгий частичный порядок.
Свойство полноты не обязательно сохраняется при пересечении поряд-
порядков. Пересечение строгих порядков Р П Р = 0, а пересечение нестрогих
порядков ЛПЛ-1=Д.Ив том и в другом случае пересечение не содержит
ни одной пары различных элементов и, следовательно, не является полным
бинарным отношением. Объединение строгих или нестрогих частичных или
полных порядков, вообще говоря, не является порядком. Пусть, например,
R — нестрогий порядок на G, тогда иЛ - нестрогий порядок на G, но
R U Д~! = G X G - универсальное бинарное отношение и, следовательно,
не является порядком.
Композиция строгих или нестрогих, частичных или полных порядков
также, вообще говоря, не является порядком. Например, для нестрогого
порядка R отношение R © R~l = GXG - универсальное бинарное отно-
отношение, не являющееся порядком.
В таблице 1 указано, какие специальные бинарные отношения (т.е. какие
наборы свойств бинарных отношений и при каких условиях) замкнуты от-
28
Таблица 1
Специальные бинарные отношения
Операции
RlUR2 RtoR2
1- Строгое упорядочение (асимметричность)
2. Безразличие (симметричность, рефлексив-
рефлексивность)
3. Нестрогое упорядочение (полнота)
4. Слабый порядок (асимметричность, нега-
транзитивность)
5. Эквивалентность (рефлексивность, сим-
симметричность, транзитивность)
6. Нестрогий слабый порядок (транзитив-
(транзитивность, полнота)
7. Качественный порядок (асимметричность,
транзитивность)
8. Нестрогий качественный порядок, (нега-
транзитивность, полнота)
9. Нестрогий частичный порядок (рефлексив-
(рефлексивность, антисимметричность, транзитив-
транзитивность)
10. Квазипорядок (рефлексивность, транзи-
транзитивность)
11. Строгий порядок (антирефлексивность,
транзитивность, слабая полнота)
12. Нестрогий порядок (антисимметричность,
транзитивность, полнота)
E)
A)
A)
A)
(8)
D)
A)
(+)
C)
Л
Л
л
D)
D)
D)
A)ЛF)Л
Л G)
D)
A) Л (б)
G)
(-)
D)
D)
носительно операций пересечения, объединения и композиции. Знак (+)
в таблице означает замкнутость отношения, указанного в строке, по опера-
операции, определяющей столбец. Знак (-) фиксирует отсутствие замкнутости
соответствующего набора свойств отношений по операции, указанной
в столбце. Цифры, помеченные в некоторых клетках таблицы, указывают
номера приведенных ниже условий, при которых бинарные отношения,
определяемые номером строки, замкнуты относительно операций, отвечаю-
отвечающих номеру столбца.
Условия на пары бинарных отношений Rx и R2:
A) Rt ПД;1 =0,
B) Rx П R2* С А,
C) Rx П R? = Д,
D) Rr и R2 взаимно транзитивны,
E) Rt и R2 взаимно транзитивны,
F) R2 транзитивно относительно Rx,
G) R2 транзитивно относительно Rt,
(8) R% и R2 когерентны.
29
Таблица 2
Тип отношений
Свойство отношений
Рефлек-
сив-
сивность
Анти-
рефлек-
сив-
ность
Симмет-
рич-
ричность
Анти-
симет-
рич-
ность
Асим-
метрич-
метричность
Тран-
зитив-
зитивность
Нега-
тран-
зитив-
ность
Пол-
Полнота
Слабая
полно-
полнота
Ацик-
лич-
личность
Строгое упорядочение
Безразличие (толерантность) ¦
Эквивалентность *
Нестрогое упорядочение (¦)
Слабый порядок
Нестрогий слабый порядок (нестрогое (*)
предпочтение)
Качественный порядок (строгий частич-
частичный порядок, строгое частичное пред-
предпочтение)
Нестрогий качественный порядок (¦)
Квазипорядок (предпорядок, нестрогое *
частичное предпочтение)
Нестрогий частичный порядок ¦
Строгий порядок (сильный порядок,
строгое предпочтение)
Нестрогий порядок (линейный порядок) (*)
(¦)
(¦)
(¦)
(*)
(*)
*
(*)
О
(¦)
(¦)
(*)
(*)
(*)
(*)
(*)
(¦)
Пример: Символ A) Л F) л G) в таблице 1 означает, что слабый
порядок замкнут относительно композиции Лt © R2 при выполнении усло-
условий A), F) и G), т.е. когда R% и/Jj1 не пересекаются, аЛ2 и Д2 тран-
зитивны относительно Rt. Символ (8) в пятой строке таблицы 1 означает,
что отношение эквивалентности замкнуто относительно объединения при
условии когерентности Rt и R2.
6.4. Приведем в заключение сводку определяющих свойств специаль-
специальных бинарных отношений, используемых в теории принятия решений
(табл. 2). Знак * показьюает, что отмеченное свойство входит в опреде-
определение типа отношений. Знак (*) означает, что отмеченное свойство выте-
вытекает из остальных. В таблице указаны используемые здесь названия типов
отношений.
В литературе нет твердо установившейся терминологии по типам отно-
отношений. Принятому здесь термину строгое упорядочение соответствует в
[46] термин "предпочтение", а в [40] и [22] - "строгое предпочтение".
Принятому здесь термину нестрогое упорядочение соответствует в [22]
"слабое предпочтение".
Вместо термина слабый порядок в [46] и [21] принят термин "слабое
упорядочение", а в [44] -"предпочтение".
Принятому здесь термину нестрогий слабый порядок соответствует в
[21] "совершенное упорядочение", а в [38] — "предпочтение". Принятому
здесь термину качественный порядок соответствует в [40] "строгий поря-
порядок" и в [21] — "строгое частичное упорядочение". Принятому здесь тер-
термину нестрогий частичный порядок соответствуете [21] и [23] "частичное
упорядочение", а в [40] — "нестрогий порядок". Принятым здесь терми-
терминам строгий и нестрогий порядки соответствуют в [40] "совершен! щ
строгий" и "совершенный нестрогий" порядки.
§ 7. Особенности бинарных отношений
на непрерывных множествах
7.1. Все приведенные до сих пор рассуждения о специальных бинарных
отношениях относятся в равной степени к отношениям, заданным на
дискретных (конечных и счетных) и непрерывных множествах G (подмно
жествах топологических пространств Е).
Ниже будут обсуждаться дополнительные свойства и особенности уп<
рядочений на непрерывных множествах. Речь будет идти о понятиях непре-
непрерывности упорядочений относительно топологии на Е и выпуклости упо-
упорядочений.
В содержательных терминах непрерывность упорядочений означает, что
если лицо, принимающее решение, предпочитает вариант Зс варианту у,
то оно предпочтет и элемент Зс элементу у, если хну "близки" соответ-
соответственно к х и у. Приведем формальное определение понятия непрерыв-
непрерывность упорядочений.
Пусть множество вариантов G, на котором задано строгое упорядоче-
упорядочение Р, является топологическим пространством. Бели отношение Р обладает
индикатором (так называемой функцией полезности) (см. гл. V), то свой-
свойство непрерывности отношения может быть выражено в терминах непре-
непрерывности индикатора. В противном случае требуется более тонкая тополо-
31
гическая классификация отношений и более разветвленная терминология.
Подробно эти вопросы рассмотрены в [21]. Мы же ограничимся здесь
более грубыми рассуждениями, относящимися, главным образом, к стро-
строгим и нестрогим упорядочениям. Однако введенных ниже понятий ока-
окажется вполне достаточно для последующих приложений.
Приведем два определения непрерывности упорядочений.
Определение I. Отношение R нестрогого упорядочения на G называется
непрерывным, если множество {(х, y)\xfy), где Р - соответствующее
строгое упорядочение, является открытым подмножеством декартова
произведения GXG.
Определение II. Отношение R нестрогого упорядочения на G назьюается
непрерывным, если верхние и нижние срезы соответствующего строгого
упорядочения Р (множества {х\ххРх} и {х\хРх2}) открыты в G \/хи
х2 €Е G, или, что то же самое, верхние и нижние срезы R (множества
{x\xxRx} и {x\xRx2}) замкнуты в G при каждом xlfx2 €G.
Можно показать, что оба приведенных определения непрерьюности упо-
упорядочения эквивалентны между собой.
7.2. В непрерывных моделях теории принятия решений, как и в теории
оптимизации непрерывных функций на топологических пространствах,
особую роль играют выпуклые (вогнутые) структуры.
Приведем определения вогнутого упорядочения на выпуклом множест-
множестве С -
Пусть множество G, на котором определены строгое Р и соответствую-
соответствующее нестрогое R упорядочения, выпукло. Отношение R на G вогнуто, если
выполняется одно из приведенных ниже условий (I), (II), (III).
(I) Множество {x\xRz} является выпуклым подмножеством G при
каждом, z EG.
(И) xRy=>{\x + (l-\)y)Ry \fx,yeG, 0< Х< 1.
(III) Множество {x\xPz} является выпуклым подмножеством G при
каждом zGG.
Имеет место
Утверждение 20. Условия (I), (II), (III) эквивалентны.
Пусть по-прежнему множество G выпукло. Приведем усиленные усло-
условия вогнутости упорядочений.
(IV) Если хРу для jc, у е G, то { \х + A - \)у)Ру для 0 < X < 1.
(V) Если xRy, хФу, х, у е G, то { X* + A - \)у)Ру для 0 < X < 1
(строгая вогнутость).
Имеет место
Утверждение 21.
(О
V 7 V f N f
(ю) Если нестрогое упорядочение R непрерьюно, то (IV) -> (II).
Доказательства утверждений B0) и B1) можно найти в [38].
Глава III
ФУНКЦИЯ ВЫБОРА
§ 1. Введение
1.1. Обсудим вначале в содержательных терминах понятия, связанные с
функцией выбора. Класс задач принятия решений описывается множест-
множеством однотипных ситуаций, в условиях которых предстоит произвести вы-
выбор. Будем характеризовать условия конкретной задачи класса множест-
множеством решений, которые в принципе могут быть приняты в соответствую-
соответствующей ситуации. Ситуацию, описанную в терминах определяемых ею возмож-
возможных решений, будем называть также предъявлением. Итак, понятия "за-
"задача класса", "ситуация" и "предъявление" можно здесь рассматривать
как синонимы, выраженные .каждое в своих терминах.
Подмножество возможных в данной ситуации решений, каждое из
которых является "хорошим" решением для соответствующей задачи
класса, будем называть выбором.
Функция выбора — это многозначное отображение, определяющее зави-
зависимость выбора от предъявления.
В виде функции выбора может быть записана реакция опытного диспет-
диспетчера, управляющего воздушным движением, на ту или иную обстановку
на земле и в воздухе. В форме функции выбора могут быть зафиксированы
действия опытного сталевара, управляющего плавкой, в зависимости от
условий, определяющих качество плавки. Диагнозы болезней, установлен-
установленные опытным специалистом, наблюдающим больных определенного про-
профиля, и предлагаемые им схемы лечения также могут быть записаны в тер-
терминах функций выбора. Число подобных примеров можно умножить.
Функция выбора, записанная для достаточно большого количества ситуаций
определенного класса, может служить основанием для автоматизации про-
процесса выбора решений в соответствующем классе задач. Можно ожидать,
что функция выбора является подходящим средством для описания и
решения задач, формулируемых в проблематике искусственного ин-
интеллекта.
Обозначим через G множество в принципе возможных решений для всех
задач класса, через XQG - множество в принципе возможных решений для
конкретной задачи X класса (для конкретной ситуации X), а через.С(ДГ) С
С X - множество "хороших" решений задачи X. Отображение Y = С(Х) С X
представляет собой функцию выбора.
Таким образом, функция выбора определяет концепцию выбора. Дру-
Другими словами, функция выбора определяет понятие "рациональный",
3. Д.Б. Юдин 33
"справедливый", "компромиссный" выбор в ситуации X, принадлежащей
заданному классу ситуаций.
Другое фундаментальное понятие теории принятия решений - механизм
выбора — указывает, как произвести выбор, рациональный с точки зрения
заданной функции выбора. Механизм выбора может быть реализован как
алгоритм или организационная система, способные в указанной ситуации
обеспечить выбор решения, соответствующий заданной концепции рацио-
рационального выбора.
В теории принятия решений рассматриваются частичные и полные функ-
функции выбора. Частичные функции выбора определяют рациональные реше-
решения не для всех ситуаций изучаемого класса. Они обычно отражают накоп-
накопленные знания и опыт. Пополнение функции выбора — расширение мно-
множества ситуаций, на которых определен рациональный выбор, может про-
производиться либо за счет дополнительного экспериментирования, либо за
счет приписывания функции выбора некоторых свойств, определяемых
содержательными особенностями изучаемого класса задач.
Функция выбора непосредственно приводит в соответствие каждой си-
ситуации выбора "рациональное" решение независимо от механизма выбора
и от условий, определяющих "рациональный" выбор. Отсюда универсаль-
универсальность и простота функции выбора, как средства, описьюающего выбор.
Однако обилие ситуаций в реальных классах задач принятия решений при-
приводит к тому, что функция выбора, не связанная с конкретным механиз-
механизмом выбора решений или не удовлетворяющая конкретному набору требо-
требований к рациональному решению, не может быть компактно записана и
для ее практического использования необходима чрезмерно большая па-
память.
Для расширения круга приложений функций выбора к проблематике
принятия решений представляет интерес классификация функций выбора
по реализующим их механизмам и по набору характеристик, которые опре-
определяют понятие "рациональное" решение для соответствующей функции
выбора. Сравнивая различные механизмы, отвечающие одной и той же
функции выбора, можно выбрать наиболее экономные (в том или ином
смысле) механизмы, реализующие заданную концепцию выбора. Такого
рода вопросам уделяется внимание в ряде последующих глав.
1.2. Приведем формальное определение функции выбора.
Пусть множество G представляет собой (конечное или бесконечное)
множество альтернатив, a ffl - семейство некоторых подмножеств мно-
множества G. Пара (G, S8 ) называется обстановкой, а элемент X семейства
$ — предъявлением.
Выбор в обстановке (G, S ) сопоставляет предъявлению Х€$1 его
подмножество Y = С(Х) СХ- множество альтернатив х е X, отобранных
(лицом, принимающим решение, или посредством некоторого механизма
выбора) в предъявлении X. Отображение Y - С(Х) называется функцией
выбора. Если 58 С 2G, функция выбора называется частичной, если
SB = 2G, функция выбора - полная. Функция выбора может быть задана
таблицей, набором свойств (аксиом), механизмом выбора, или гибрид-
гибридным путем (таблицей значений на ограниченном числе опорных предъяв-
предъявлений и свойствами или механизмом выбора для интерполяции таблицы).
34
Приведем несколько примеров функций выбора, отвечающих различным
механизмам принятия решений.
1. Скалярный оптимизационный механизм - выбор лучшего по задан-
заданному скалярному критерию качества /(*) варианта х € X
2. Условно-экстремальный механизм — выбор, определяемый схемой
математического программирования с целевой функцией /о(*) и функ-
функционалами ограничений //(*), i = 1,... ,/я,
(x): /,(*)< О, /« 1,... ,т]>.
3. Оптимизационный механизм доминирования, определяемый бинар-
бинарным отношением R,
CR(X)= {xeXW/yGX xRy).
4. Механизм блокировки, определяемый бинарным отношением R, -
выбор "неулучшаемых" по R элементов X,
cR(X)= {xexwtyex yRx).
(Если R не полное или не антисимметричное бинарное отношение, то
CR (X), вообще говоря, отличается от CR (X). Легко видеть, что CR (X) =
= С d(X) и CR(X) = CR (X), где Rd - отношение, двойственное к R.)
5. Механизм ограничений, определяемый бинарным отношением R и
заданным элементом и € G, - выбор элементов х G X, "лучших" по R
фиксированного элемента и G G,
6. Механизм блокирующих ограничений, определяемый бинарным отно-
отношением R и заданным элементом и Е G, — выбор х Е X, неблокируемых
фиксированным элементом uGG,
Cu(X)={xeX\uRx)
(CU(X), вообще говоря, отличается от Си (X) ).
7. Паретовский механизм, определяемый вектор-функцией критериев
()?
Са(Х) = { х €Х\ Эу €*: /,(^)>//(дс), / = 1,..., т).
8. Механизм лексико-графической оптимизации, определяемый вектор-
функцией критериев {fi(x)}^L1, ft упорядочены по важности,
f,(x), t- 1,... ,m, X0~X).
9. Механизм лексико-графической оптимизации с уступками, опреде-
определяемый вектор-функцией {//(дс)}^, и вектором уступок {6,}^.,:
С„у(Х) = { х <=Хт | X, = arg^C*): max/Ддс) - 5 <
x
< /,(*)< max /,(x)], /- 1,... ,т; Хо = X}.
Xt-i
3* 35
10. Совокупно-экстремальный механизм. Для любого предъявления X
выбираются точки, доставляющие максимум на X по крайней мере одной
из компонент заданной вектор-функции /(х) {/()JI
cC9(X)={xex\3i \fyex
11. Турнирный механизм, определяемый бинарным отношением R,
представляет собой скалярный оптимизационный механизм с критерием
fR (x), специальным образом зависящим от R,
fR(x)= 2 fR(x,y), где
1, если (xRy) л (yRx),
О, если (yRx) л (xRy),
1
— в других случаях.
СТ(Х) = { х е Х\ х = arg тах/д<*)>.
12. Механизм центров тяжести для обстановки (G9ffi), в которой ? -
множество выпуклых подмножеств множества G, сопоставляет каждому
предъявлению XCffi его центр тяжести
fxdx
хех\х =
13. Сильнодоминантный механизм доминирования, определяемый би-
бинарным отношением R С G X 2G,
14. Сильнодоминантный механизм блокировки, определяемый бинар-
бинарным отношением Л С G X 2G,
Cc*(X) = {xGX\\fYCX YRx}.
15. Слабодоминантный механизм доминирования, определяемый бинар-
бинарным отношением R С G X 2G,
ССлд(*)={*е*^ел ЗУСДГ: [^€Г] л [xRY]}.
16. Слабодоминантный механизм блокировки, определяемый бинар-
бинарным отношением RCGX2G,
CCJl*(X)={x€X\HyGX 3YCX: [y€Y] Л [YRx]}.
17. Гипердоминантный механизм доминирования, определяемый бинар-
бинарным отношением R С 2G X 2G,
18. Гипердоминантный механизм блокировки, определяемый бинарным
отношением RC2GX2G,
= iY1CX\\fY2CX Y2RYt}.
36
19. Механизм голосования (мажоритарный выбор или выбор по боль-
большинству) , определяемый вектор-функцией критериев { /jOc)}Jllf
cMui(X)={xex\vyex 2sign[/,(*)-Ж>0] > о).
Заметим, что если в примерах 7, 9, 19 отождествлять вариант х с егс
вектором оценок z - (zx,..., >zm), где zt = ft(x), i = 1, m, то паретов-
скую Cn(X), лексико-графическую СЛ(Х) и мажоритарную СМй^(Х)
функции выбора можно представить, как функции выбора, определяемые
соответственно векторными оптимизационными механизмами блокировки
* *, С*М(Х), где
Hiiyi) ...л (*|_1=л_1)
^M^^Esignfo-^) > 0.
1
В приведенных примерах функция выбора выражается через механизм
выбора. Вообще говоря, представляется более естественным обратный
подход. Из содержательных соображений или по результатам наблюдений
за действиями эксперта или лица, принимающего решение, строится функ-
функция выбора - зависимость множества "лучших" вариантов от множества
предъявленных вариантов - и определяется механизм, реализующий эту
зависимость. Такому подходу посвящены последующие главы.
§ 2. Классификация функций выбора
2.1. Непосредственное задание функций выбора в виде таблицы, в кото-
которой каждому допустимому предъявлению сопоставляется выбор, в сколь-
нибудь сложной обстановке (при немалой мощности множеств Си Я)
является чрезвычайно трудоемкой, практически неподъемной работой,
требующей огромной памяти. К такому заданию функций выбора прихо-
приходится прибегать в тех случаях, когда ставится задача автоматизации не-
некоторого типа интеллектуальной деятельности, механизм и характеристи-
характеристики которой неизвестны. Обычно для изучения механизма принятия реше-
решения опытным специалистом (экспертом) в определенном классе задач
управления явно недостаточно объяснений лица, принимающего решение.
Накопленная информация о выборе решения специалистом в большом
числе однотипных ситуаций является, как правило, более объективным
исходным материалом для формулировки правдоподобных гипотез о
механизме выбора и о свойствах экспертных решений.
Для автоматизации интеллектуальных решений в определенной области
создаются экспертные системы, основой которых являются так называе-
называемые базы знаний. Понятие базы знаний до сих пор четко не определено
и в различных работах истолковывается по-своему. Представляется, что
под базой знаний в той или иной интеллектуальной области целесообразно
понимать частичную функцию выбора, отражающую опыт эксперта, и ме-
механизм, пополняющий ее. В качестве подобного механизма может быть
37
применена, например, интерактивная система, позволяющая по подходя-
подходящему аксиоматическому определению рационального выбора и известной
частичной функции выбора восстановить ее значение на заданном предъяв-
предъявлении.
К непосредственному табличному описанию функции выбора по резуль-
результатам наблюдений за поведением опытного ЛПР целесообразно прибегать
только в экспертных системах, для которых нет компактной записи за-
зависимости выбора от предъявления. Компактная запись функции выбора
возможна в двух случаях: когда известен механизм, реализующий выбор
(например, некоторый экстремальный принцип или система неравенств),
и когда известен набор условий (требований или аксиом), определяющий
рациональный выбор. В первом случае говорят о поэлементной записи
функции выбора, во втором случае — о целостном описании Y = С(Х).
Обозначим через 2 множество всевозможных функций выбора. Выде-
Выделим из множества 2 два подмножества Zo и^ функций выбора, часто
встречающихся в прикладных задачах. Подмножество Хо включает все
функции непустого выбора т.е. такие, что С(Х) Ф ф при всех X Ф ф.
В подмножество Хх включают все функции однозначного выбора, т.е.
функции выбора, сопоставляющие каждому предъявлению X Фф един-
единственное решение х = С(Х) С X. Ясно, что Sj С 20 С 2.
В классической теории выбора, связанной, главным образом, с матема-
математической экономикой, особую роль играют функции выбора, порожден-
порожденные бинарными отношениями (см. § 1 Cr(X) и Cr(X)). Они будут под-
подробнее рассмотрены дальше. Здесь только отметим, что в соответствии с
результатом Сена [89]:
1. Бинарное отношение R порождает функцию выбора, принадлежащую
к подклассу 20 > в том и только в том случае, когда отношение R, рассмат-
рассматриваемое как отношение блокировки, ациклично.
2. Бинарное отношение R порождает однозначную функцию выбора
СЯ(Х), т.е. функцию, принадлежащую подклассу Si, в том и только в
том случае, когда R не только ациклично, но и слабо полно.
2.2. В работах Айзермана и Малишевского [2]— [5] рассмотрены вве-
введенные в различных исследованиях характеристические свойства функций
выбора и на их основе построена классификация функций выбора, связан-
связанная с порождающими их механизмами.
Приведем без доказательств соответствующие результаты и классифи-
классификацию.
Рассмотрим четыре характеристических свойства функций выбора.
Говорят, что функция выбора С(Лг)удовлетворяет характеристическому
свойству
наследования (Я),если
YCX=>C(Y)DC(X)DY,
согласия (С),если
X=YUZ=*C(Y)nC(Z)CC(X),
отбрасывания (О) (независимости от отбрасывания отвергнутых ва-
вариантов) , если
С(Х) С Y С X =* C(Y) = С{Х\
38
константности (К) (или строгого наследования), если
{YCX, УПС(Х)Фф или
Здесь Х9У,гФф.
Каждое из перечисленных свойств выделяет в пространстве функций
выбора фундаментальную область, которую будем обозначать соответ-
соответственно через Я, С, О и К. В подмножествах 20 и2, функций выбора
будем обозначать соответствующие области через Яо, Со, Оо, АГ0 и Я1, С\,
Ol9 Kx. Обозначим дополнения этих областей в 2 через Я; С и О соот-
соответственно. Оказывается, что эти области и их пересечения могут быть
приняты в качестве естественной основы для классификации функций
выбора и порождающих их механизмов [1].
В частности, имеет место
Утверждение 1.1° [1]. Характеристические свойства Я, С и О незави-
независимы в совокупности, т.е. в множестве 2 функций выбора все восемь
областей НПСПО, НПСПО,... ,НПСС\б непусты.
2°. КСНПСПО.
3°. В подмножестве Si функций выбора фундаментальные области
Hi,Ох ,КХ сливаются в одну.
2.3. Заметим, что сколь бы естественными не представлялись характе-
характеристические свойства функций выбора, можно указать вполне осмыслен-
осмысленные задачи, в том числе и практически интересные, которые приводят
к выбору, не удовлетворяющему ни одному из характеристических
свойств. Приведем пример такой задачи, построенный Э.В. Цоем. Речь
идет о выборе центра круга (шара) максимального радиуса, целиком
принадлежащего заданной области X множества G. Примем в качестве
множества G некоторое множество, содержащее прямоугольник с верши-
вершинами @,0), @,4), B,0), B,4). Подмножества X QG будем считать
предъявлениями. Обозначим через р(х, ЪХ) минимальное расстояние от
точки х G X до границы области X. В этих терминах функцию выбора,
определяющую решение задачи на предъявлении X, можно записать в виде
С(Х) = {х еХ\х = arg max р(х, дХ)}.
Покажем, что таким образом определенная функция выбора не принад-
принадлежит фундаментальным областям Я, К, О и С.
Пусть предъявление X определяется прямоугольником с вершинами
@,0), @,4), B,0), B,4), а предъявление Y С X— квадратом с вершинами
@,0), @,2), B,0), B,2) (см. рис. 3.1). Ясно, что С(Х) -геометрическое
место центров кругов максимального радиуса, полностью содержащихся
в X; С(Х) есть отрезок, соединяющий точки A,1) и A,3), a C(Y) со-
содержит единственную точку — A,1). Пересечение отрезка С(Х) с квадра-
квадратом Y представляет собой отрезок [A,1), A,2)]. Таким образом, из
Y С X не следует C(Y) D УП С(Х), т.е. свойство наследования для рас-
рассматриваемой функции выбора не удовлетворяется. По тем же причинам
не удовлетворяется и свойство строгого наследования (свойство констант-
константности) К.
Пусть теперь по-прежнему предъявление X — прямоугольник с верши-
вершинами @,0), @,4), B,0), B,4), а предъявление Y - квадрат с вершинами
@,1), @,3), B,1), B,3). С(Х) - по-прежнему отрезок [A,1), A,3)],
39
a C(Y) - точка A,2). Включение С(Х) С Y С X имеет место, но из него
не вытекает С(Х) = C(Y). Таким образом, условие О также не удовлет-
удовлетворяется.
Покажем, что и условие согласия (С) также нарушается. Обозначим
через S прямоугольник с вершинами А = ( - > Ь\ В = (Ш, 0), С =
, 3), /> = (%, 3),а через Z - прямоугольник с вершинами А, В, С9 =
С
= A54, 4), D1 = (Й, 4) (см. рис. 3.2). В качестве предъявления У примем
X\S. Тогда СЧ*) отрезок - [A,1), A,3)], С(У) - отрезок М# =
= [0$,3^),(l%,3%)],aC(Z) -отрезок [A,й), A,3#)]. Под предъяв-
предъявлением X будем понимать объединение X = Y U Z. Ясно, что JT по-преж-
по-прежнему прямоугольник с вершинами @,0), @,4), B,0), B,4). Пересечение
C(Y) П C(Z) содержит единственную точку A,3—). В рассматриваемом
примере С(Х) 2> С(У) П C(Z). Следовательно, условие согласия С также
нарушается.
Приведенный пример позволяет утверждать, что результаты, относя-
относящиеся только к функциям выбора, содержащимся в фундаментальных
областях, не дают еще основания судить об особенностях всех функций
выбора, представляющих практический интерес.
2.4. Сен [89] доказал следующее
Утверждение 2, Для того чтобы функция выбора С(Х), ХС G, порожда-
порождалась бинарным отношением R на G (т.е. для того чтобы функция выбора
определялась оптимизационным механизмом доминирования или блоки-
блокировки), необходимо и достаточно, чтобы она принадлежала области Н П С.
Айзерман и Малишевский конкретизировали результат Сена. Они рас-
рассматривают три уровня функций выбора, порожденных бинарными отно-
отношениями. К первому уровню они относят все функции выбора, порожден-
порожденные любыми бинарными отношениями. Подкласс функций выбора, по-
порождаемый качественными порядками, относится к функциям второго
уровня. Более точно это означает, что качественный порядок задается на
некотором подмножестве С'СС, а варианты из G\G' считаются непри-
40
емлемыми, т:е. не выбираются ни в каких предъявлениях. Более узкий
подкласс функций выбора, определяемый слабыми порядками (на
G* С G), образует функции третьего уровня.
Как мы увидим в гл. V, слабые порядки и только они обладают инди-
индикаторами бинарных отношений. Это значит, что функции выбора третьего
уровня и только они соответствуют скалярным оптимизационным меха-
механизмам.
Во введенных терминах справедлива следующая детализация теоремы
Сена[1].
Утверждение 3. 1 . Для того чтобы функция выбора порождалась ка-
качественным порядком, необходимо и достаточно, чтобы она принадлежала
области НПСОО.
2°. Для того чтобы функция выбора порождалась слабым порядком,
необходимо и достаточно, чтобы она принадлежала области К.
В [1] приведено следующее
Утверждение 4. 1°. Для того чтобы функция выбора принадлежала об-
области Я, необходимо и достаточно, чтобы она порождалась некоторым
сильно доминантным механизмом доминирования.
2°. Для того чтобы функция выбора принадлежала области С, необхо-
необходимо и достаточно, чтобы она определялась некоторым слабодоминант-
слабодоминантным механизмом доминирования.
3°. Для того чтобы функция выбора принадлежала области О, необхо-
необходимо и достаточно, чтобы она порождалась некоторым гипердоминантным
механизмом доминирования, выделяющим из каждого X CG единствен-
единственное Y.
Существуют, конечно, и другие механизмы, порождающие все функции,
принадлежащие каждой из рассматриваемых областей. Некоторые из этих
механизмов-указаны в [21]. В связи с этим представляют интерес следую-
следующие соображения.
Пусть /?!,..., Rk — бинарные отношения на G, С *(Х) - функции вы-
выбора, порожденные бинарными отношениями Ri9 определяющими выбор
недоминируемых по Rt элементов X. Определим по произвольной буле-
булевой функции ф(ах,..., ак) функцию выбора С( • ) = C(Ri,..., Rk, ф) на
G по формуле х ЕС(Х) <=> ф(а\,...,ак) = 1, где
( 1, если xECR\X)9
lO, если х$С \Х).
Строго говоря, не всякая функция С(Х), получаемая этим способом,
является функцией выбора, т.е. удовлетворяет включению С(Х) СХ.
Мы будем исключать из рассмотрения множества, для которых включения
С(Х) СХ нарушены.
Оказывается, что любую функцию выбора можно представить через
функции выбора С *(Х), определяемые бинарными отношениями. Имеет
место
Утверждение 5 [31]. Для любой функции выбора С() на G существуют
бинарные отношения Rl9..., Rk и булева функция ф(аг,..., ак) такие,
что
C(.) = C(Rt,...,Rk9t).
41
В частности, если булева функция ф оказывается мажоритарной (т.е.
ф(ах,..., ак) = фм (аг,..., ак) равна 1 тогда и только тогда, когда боль-
больше половины переменных равны 1), класс функций выбора, определяемых
бинарными отношениями Rf по приведенной формуле, совпадает с клас-
классом Я функций выбора, удовлетворяющих характеристическому свойству
наследования.
Класс функций выбора, определяемых мажоритарной булевой функцией
(или так называемой функцией голосования), будем обозначать классом
МФВ. Итак, справедливо
Утверждение 6. Область в 2, определяемая классом МФВ, совпадает с
фундаментальной областью Я.
Аналогичный результат имеет место и для функций выбора, опреде-
определяемых бинарными отношениями /?/, i = 1,..., &, и булевой функцией
к
ф(аг,..., ак) = фс (с^,..., ак) = V а,, где а, определены в (¦). 06-
ласть в 2, определяемая классом С = C(Rl9 . . . , Rk, ф$)> также совпа-
совпадает с фундаментальной областью Я.
В заключение параграфа приведем теорему Эрроу [73], положившую
начало этой проблематике, и ее обобщения из [1].
Утверждение 7. 1°. Для того чтобы функция выбора была реализуема
некоторым скалярным оптимизационным механизмом, необходимо и
достаточно, чтобы она принадлежала области К.
2°. Для того чтобы функция выбора была реализуема некоторым паре-
товским механизмом, определяемым вектор-функцией критериев, необ-
необходимо и достаточно, чтобы она принадлежала области Я ПС ПО.
3°. Для того чтобы функция выбора была реализуема совокупно-экстре-
совокупно-экстремальным механизмом, необходимо и достаточно, чтобы она принадлежала
области НПО.
Как уже отмечалось, слабые порядки и только они описываются скаляр-
скалярным оптимизационным механизмом. Поэтому п. 1 утверждения 7 экви-
эквивалентен п. 2 утверждения 3. Пункт 2 утверждения 7 совпадает с п. -1 ут-
утверждения 3, поскольку имеет место следующий факт, вытекающий из
результатов гл. V.
Утверждение 8. Функция выбора С() является паретовской тогда и
только тогда, когда она порождается качественным порядком.
Заметим, что пример из п. 2.3 отнюдь не противоречит п. 1 утвержде-
утверждения 7, поскольку целевой функционал задачи р(х, ЪХ) - функция не
только от точки х G X, но и от границы ЭЛГ предъявления Л", а в опреде-
определении скалярного оптимизационного механизма (см. п. 1.2) критерий
качества f(x) решения зависит только от точки х Е X.
Более общая задача типа примера из п. 2.3 — это задача вписывания в
заданное выпуклое тело эллипсоида максимального объема. Решение та-
такой задачи требуется в одном из современных методов выпуклой опти-
оптимизации (см. § 2 гл. VII "Метод вписанных эллипсоидов"). Таким обра-
образом, экстремальные механизмы выбора (в некотором смысле традицион-
традиционные) далеко не исчерпываются скалярной оптимизацией в смысле п. 1.2.
2.5. Представляет интерес следующий результат.
Для того чтобы построить полную функцию выбора С(Х), удовлет-
удовлетворяющую условию строгого наследования (и такую, что при X Ф ф
42
С(Х) Ф 0), достаточно знать ее значения
не более чем на п предъявлениях Вх =
В2 = C(G\C(G)),..., Вк =
.i\2?fc_i), где А( = Л/_х\В(-\,
^i = G, / = 1,..., А: < л (здесь л - чис-
число альернатив в множестве G).
Рассмотрим дерево с вершинами-мно-
вершинами-множествами Ах = G, Вх = C(/4i), Л/+1 =
= Aj\Bj, Bj = С (Ар, i = 1, 2,..., Л — 1
Aсм. рис* 3.3).
• к
Ясно, что 5/ ПВ, Фф при i =?/ и U Вг =
= G. Это значит, что { Вг }* - разбиение
множества G. Поэтому Ч X G 2 е найдется
минимальный номер i такой, что С(>1/) П
ПЛгт^0иЛГС/4/. Тогда по свойству строго-
строгого наследования (свойству А)
•С(Аг)Г\Х^ВгПХ.
Ясно, чтб если функция выбора удовлетворяет свойству наследования (Я)
то построенная таким обр зом частичная функция выбора для предъявле-
предъявлений В\$ B2t..., Bki к < и, позволяет восстановить полную миноранту
С(Х), т.е. функцию С.(Х) такую, что VX е 2G C.(X) С С(Х).
§ 3. Операции над функциями выбора
3.1. Рассмотрим операции объединения, пересечения и суперпозиции
функций выбора и установим, какие операции сохраняют свойства функ-
функций выбора и не вьюодят функции из той или иной области множества Z.
Изучим также вслед за [1, 70] вопрос о разложении сложных функций
выбора по функциям более простых классов.
Введем операторы F^7), F^Ky F^PtJy f<{k,l) и F\t)> пРеобРазУю"
щие одни функции выбора в другие соответственно по формулам
Ск(Х)9
П С«(Л), С(Л)- П U
/е//€/,- Are/
: Cf(Cf— 1 (• • • ^2 (С\ (X) )...)).
Обозначим через 9 с соответствующими индексами (U, П, un, пи, ©)
преобразование класса Q функций выбора, определяемое как отдельным
оператором F, так и классом операторов ?.
В работах Малишевского, аннотированных в [1], установлены классы
функций выбора, в которые перечисленные операторы переводят функции
выбора из фундаментальных областей Я, С, О, К и их пересечений,
43
Приведем некоторые из полученных там результатов.
Будем говорить, что область Q G 2 замкнута относительно оператора F,
если при любых Q() 6 0, / = 1,..., N, имеет место С() =F(Ci@, • • •
..., Cyv(*)) ? Q. Область Q замкнута относительно класса 9 операторов,
если она замкнута относительно каждого оператора F из этого класса.
Мы будем дальше говорить о замкнутости области Q С 2 относительно
преобразования &, имея в виду в зависимости от контекста замкнутость Q
относительно оператора F или класса ?.
Имеют место следующие утверждения
Утверждение 9. В пространстве 2 всех функций выбора
1°. Область Я замкнута относительно преобразований 5*и и 3й °:
2°. Область С замкнута относительно SPn:
Рп(С) = С.
3°. Область О замкнута относительно 3*и:
Следствие.
1°. Область Н замкнута относительно 3й ип
#ип(#) #пи(#) #
2°. Область Н ПС замкнута относительно 3^п:
&п(НПС) = НПС
3°. Область НПО замкнута относительно 3й и:
Утверждение 10. В пространстве Б всех функций выбора более широ-
широкие фундаментальные области и множество 2 в целом могут быть полу-
получены из более узких фундаментальных областей с помощью преобразова-
преобразований 9>и, #п, #ип и 3»пи по следующим формулам:
1°. НПО = 9>и(НПСП0),
2°. НПО =3>и(А),
з°. # = зи
4°. 2 = &и(С),
5°. НПС =РП(НПСПО\
6°. Я =9>п(НП01
7°. С= #П
8°. 2 = З
9°. Я = Рип(НПСПО) = &пи(НПСПО),
10°. Я = 3»ип(Я) = #nu(Jt),
11°. 2 = f ип(СПО) = 3»пи(СП0).
32. Для преобразования суперпозиции 5^°, отвечающей последова-
последовательному использованию функций выбора, не имеют места столь простые
44
соотношения между фундаментальными областями множества функций
выбора как те, которые выполняются для 3*и, 3*°, &ип и 9 . Рас-
Рассмотрим преобразование 5°0, образованное двухместной суперпозицией
функций выбораС(Х) =СХ(Х) ®С2(Х) = С2{СХ(Х)).
Если С\ и С2 содержатся в одной области Q пространства 2 или ?0>
то введенное ранее понятие замкнутости области относительно оператора
или класса операторов сохраняет смысл. Если же С\ й С2 относятся к раз-
разным областям (Cj G gj, С2 ? Q2) > то целесообразно ввести понятия услов-
условной замкнутости области Qx относительно Q2 (или g2 относительно Q\).
Облаете Gi ^ S (или 20) назовем условно замкнутой относительно Q2>
если 3*° ((?i, Q2) — &• Аналогично определяется условная замкнутость
Q2 относительно Qi • В этих терминах имеет место утверждение [8].
Утверждение 11.1°. В пространстве ?0 функций выбора область Ко
замкнута безусловно относительно преобразования суперпозиции д*°,
т.е.#0(*о,*о) = Ко.
2°. Ни одна из фундаментальных областей Яо, С0,О0 и их пересечений
не замкнута относительно преобразования З*0.
3°. Каждая из фундаментальных областей и их пересечений, взятые в
качестве Q2, условно замкнуты на второй ступени суперпозиции при
Qi = Ко «а первой ступени.
4°. Каждай из фундаментальных областей и их пересечений, взятые в
качестве Q2y не замкнуты ни при какой из фундаментальных областей и
их пересечений, принятых в качестве Qt.
5°. Никакая из фундаментальных областей и их пересечений не являет-
является условно замкнутой в качестве Qt при Q2 = Ко (и тем более при Q2y
совпадающей с одной из фундаментальных областей или с их пересече-
пересечениями).
6°. 9>&(НПС9НПС) С С.
§ 4. Декомпозиция функций выбора
4.1. Под декомпозицией функций выбора мы будем понимать пред-
представление функций выбора из одних классов с помощью функций из дру-
других более простых классов. Исходную функцию выбора будем называть
композицией составляющих. Приведем предложенные в последние годы
конструкции, позволяющие представить функции выбора из фундамен-
фундаментальных областей и произвольные функции выбора через функции из
более простых классов.
Декомпозиция функций выбора позволяет обсуждать выбор в доста-
достаточно общей ситуации в терминах более простых ситуаций, например, на
языке критериев или на языке тех или иных специальных бинарных от-
отношений. Таким образом, по результатам решения более простых задач
удается построить решение исходной более сложной задачи.
Простейшей декомпозицией функции выбора является ее "разложе-
"разложение в ряд" по функциям из более узких классов. Функция выбора С(Х)
к
представляется в виде "линейной комбинации" С(Х) = U [Yt ПС{(Х)],
/ = 1
коэффициенты которой - фиксированные предъявления У, (не завися-
зависящие от X), а С/ (X) - функции из некоторого специального класса.
45
В работах Алескерова, ^Завалишина, Литвакова ([8], [9]) доказано
Утверждение 12. Для любой функции выбора, удовлетворяющей ха-
характеристическому свойству наследования (С(Х) G Я), существуют та-
такие к, Yf Q G и Q (ДО € Ко, i = 1, . . . , к, что имеет место разложение
В частности, если С(Х) - совокупно-экстремальная функция выбора,
a Cf(X) — функции выбора, порождаемые линейными порядками, то можно
взять У, = G, и, таким образом,
На утверждения 5 и б из § 2 можно также смотреть как на определе-
определение декомпозиций функций выбора из фундаментальной области Я.
Утверждение б в других терминах означает, что любая функция выбора
из области Я может быть представлена в виде мажоритарного выбора
(с помощью функции голосования) по некоторой системе функций,
порождаемых бинарными отношениями. Можно, однако, доказать, что
при этом для почти всех функций из Я число используемых отношений
экспоненциально растет с ростом числа вариантов (при 20 вариантах это,
грубо говоря, миллион отношений). Это означает, что доказательство спра-
справедливости тех или иных декомпозиций функций выбора из определен-
определенных классов еще ничего не говорит о возможности конструктивной реали-
реализации этих представлений. Для оценки практической реализуемости деком-
декомпозиций необходимо дополнить качественные исследования о существо-
существовании тех или иных представлений функций выбора фиксированных клас-
классов построением соответствующих экстремальных конструкций и изуче-
изучением их сложностных характеристик.
42. Функции выбора, порождаемые механизмами выбора, которые
основаны на бинарных отношениях и используют операции U, П и суперпо-
суперпозиции, обладают следующим свойством. Если предъявляется единственный
вариант х и он приемлем (т.е. ВХ ^ G такой, что х Е С(Х))9 то х выби-
выбирается
Класс таких функций выбора обозначим через 2° (в отличие от 20
Класса функций непустого выбора).
В [1] анонсирован результат Малишевского, который в несколько
уточненной формулировке имеет следующий вид.
Утверждение 13. Любая функция выбора С(Х) G 2° представима в
виде разложения по суперпозициям функций, порождаемым бинарными
отношениями,
(XX) = U Л С2,„( U П Clfi,lk(X))9
где все составляющие функции выбора Cltifjk() и С2,//( •) могут быть
взяты из фундаментальной области И П С ПО, т.е. определяются качест-
качественными порядками.
46
Оценки сложности этого представления, однако, не приводятся.
В [54] и [55] приведены более простые декомпозиции произвольных
функций выбора
Утверждение 14 [54]. Любая функция выбора С (ДО G 2° представима
в виде мажоритарной операции (операции голосования)
1 г
, 1 < I, <...</*<*
от суперпозиций функций выбора, порождаемых произвольными бинар-
бинарными отношениями
С(Х) = Maj (С2Л(С1Л(ХI..., C2tk(Cltk(X))\
Здесь составляющие функции выбора Ci,/(-) и С2,/( ) принадлежат
более широкой фундаментальной области (ЯПС), чем в утверждении 13
(НПСПО).
Можно, однако, получить представление любой функции выбора через
функции, порожденные даже более узким классом бинарных отношений,
чем произвольные качественные порядки, а именно полупорядками. Имеет
место
Утверждение 15 [55]. Любая функция выбора С(Х) G 2° может быть
представлена через функции, порождаемые полупорядками, в виде
С(Х) = П
Если взять функции, участвующие в этом разложении, из еще более
узкого класса — из класса функций выбора порождаемых слабыми
порядками, т.е. из фундаментальной области К, то представление из
утверждения 15 не может быть гарантировано для любой функции вы-
выбора. Однако несколько более сложное представление, чем в утвержде-
утверждении 15, но более простое, чем в утверждении 13, гарантирует декомпози-
декомпозицию произвольной функции выбора. Имеет место
Утверждение 16. Любая функция выбора С(Х) G S0 может быть пред-
представлена в виде
С(Х) = П U C29i){C\ti){X) U Cnltii(X)\
где функции C'x^ji •), Ci't//(-) и С2,//() порождаются слабыми поряд-
порядками и даже, более того, строгими порядками.
Этот факт вытекает из доказательства теоремы 1 в [70].
Последний результат интерпретируется в терминах организационных
систем. Структура системы, предназначенной для реализации произволь-
произвольной функции выбора, может быть представлена в виде набора двухступен-
двухступенчатых управляющих звеньев, каждая ступень которых руководствуется
своим скалярным критерием качества. Решение системы является неко-
некоторой теоретико-множественной функцией от решений отдельных ступе-
ступеней управляющих звеньев.
47
§ 5. Аппроксимация функций выбора
5.1. Функция выбора — логически весьма простое понятие. Тем не ме-
менее непосредственная запись функции выбора, например в виде таблицы,
при немалом числе вариантов и предъявлений — практически неподъемная
задача. Качественное описание таких функций и их использование для
решения конкретных практических задач вызывает серьезные затрудне-
затруднения. Для манипулирования с функциями выбора целесообразно иметь
их упрощенные представления, в каких-то смыслах мало отличающиеся
от рассматриваемых функций, легко обозримые и допускающие описание
исходных объектов с помощью более простых и наглядных понятий, либо
с помощью уже изученных экономно записываемых функций выбора,
либо с помощью конструктивных механизмов, обеспечивающих реализа-
реализацию приближенных представлений. Таким образом, возникает задача
аппроксимации функций выбора наиболее близкими в определенном
смысле к ним функциями из заданных классов.
Первые постановки таких задач принадлежат Фишберну [83] и Шоломо-
ву [52]. Достаточно общие результаты в этом направлении получены
Литваковым [27,28,29].
В работах Шоломова рассматривались аппроксимации произвольной
частичной функции выбора в произвольной обстановке (G, S3 ) функ-
функциями, представимыми бинарными отношениями. В работах Литвако-
ва [27, 28] речь шла о приближении любой полной функции выбора
(S3 = 2G) другой функцией из некоторого заданного класса. В более позд-
поздней работе [29] результаты, полученные для полных функций выбора,
обобщены на частичные функции.
Приведем некоторые определения.
Мажорантой частичной функции выбора (С, S3 ) называется всякая
полная функция С*, для которой С*(Х) 2 С(Х) VX G S3 .
Обозначим множество мажорант для функции С(Х)
D(C) ={С*Е2|СЧГ) 5 С(Х) VXES}.
Минорантой частичной функции выбора (С, 59 ) называется всякая
полная функция Ст, для которой С*(Х) ^ С(Х) V XG 59.
Обозначим множество минорант для функции С(Х)
. L(C) = {c.ez\c.(X)^ C(X)
Пусть Q — некоторый класс полных функций выбора.
Назовем верхней аппроксимацией функции выбора (С, 59 ) в классе Q
функцию Св ? б, если для любой мажоранты С* ? D(C) выполнено
В()(
Нижней аппроксимацией функции выбора (С, S3 ) в классе Q называет-
называется функция Сн ? б, если для любой миноранты С* ? L(C) выполняется
^Х
п{)т()
Отметим, что включения С*(Х) 2 СШ(Х) и СВ(Х) 2СН(Х) гарантиру-
гарантируются лишь для X € S3 и не обязательно выполняются на предъявлениях
Х<? S3 .
Верхние и нижние аппроксимации существуют отнюдь не для всех функ-
функций выбора. Представляют интерес условия существования аппроксима-
аппроксимаций. В [52] доказано следующее
48
Утверждение 17. Для любой функции выбора (С, 59 ) существует верх-
верхняя аппроксимация в классе функций, представимых бинарными отноше-
отношениями. Она реализуется бинарным отношением доминирования R
xRy <=>{ЭХеЯ: х<ЕС(Х),уеХ).
Это отношение R называется выявленным отношением Самуэлсона.
52. Для полных функций в [27, 28] получены необходимые и доста-
достаточные условия для существования верхних и нижних аппроксимаций
из класса Q.
Утверждение 18.1°. Для того чтобы верхняя аппроксимация из клас-
класса Q существовала для произвольной функции выбора С € 2, необходимо
и достаточно, чтобы область Q удовлетворяла условиям
а) 4Cl9C2eQ C1(X)nC2(X)eQ,
б) Q содержит "тождественную" функцию Cl(X) = X \fXG2G.
2°. Для того чтобы нижняя аппроксимация из класса Q существовала
для произвольной функции выбора С Е 2, необходимо и достаточно,
чтобы область Q удовлетворяла условиям
a)VCbC2GB C1(X)UC2(X)EtQf
б) Q содержит "нулевую" функцию выбора СФ(Х) = 0 V X Е 2 .
Если С(Х) ^бив классе Q существует такой набор функций (Q(JT)},
что С(ХУ = ПС/(ДГ), то функция С(Х) не имеет верхней аппроксимации.
Если С(Х) ф. QvlbQ существует такой набор { С$ (X) }, что С(Х) = UQ (X),
то функция С(Х) не имеет нижней аппроксимации.
В [28] и [29] в качестве класса Q аппроксимирующих функций выбора
рассмотрены фундаментальные области Я, С и О и некоторые их пересече-
пересечения и выписаны соответствующие верхние и нижние аппроксимации для
полных функций выбора.
Утверждение 19. Пусть С(Х) — произвольная полная функция выбора
на 2. Тогда
а) в классе Q = H существуют верхняя и нижняя аппроксимации функ-
функции выбора С,
б) в классе Q = С существует верхняя аппроксимация функции вы-
выбора С, а нижняя возможна лишь как тривиальная (т.е. только для С из
того же класса),
в) в классе Q = О существует нижняя аппроксимация функции вы-
выбора С, а верхняя возможна лишь как тривиальная,
г) а классе Q = Н П С существует верхняя аппроксимация функции
выбора С, а нижняя аппроксимация существует для функций выбора,
удовлетворяющих условию
(так называемому прямому условию Кондорсе), и только для них.
д) в классе Q-НПО существует нижняя аппроксимация.
5.3. Пусть С — произвольная полная функция выбора, Qx, Q2 — задан-
заданные классы функций выбора, удовлетворяющие условиям утвержде-
утверждения^.
В [29] введены два алгоритма построения аппроксимации функций
выбора {Qi,G2(O}h {О(ОЬ
4. Д.Б. Юдин 49
Алгоритм {<2i, QiiC)} позволяет эффективно строить аппроксима-
аппроксимацию произвольной функции С в пересечении классов Qt ngj, если из-
известны алгоритмы построения аппроксимаций в каждом из этих классов
для любой функции С. Верхняя (нижняя) аппроксимация функции С в
классе Q\ П Q2 строится следующим образом. Найдем С\ — верхнюю
(нижнюю) аппроксимацию С в классе Qx, затем С? - аппроксимацию Сх в
классе Q2» далее С3 - аппроксимацию С2 в классе & и тд. Указанный
процесс через конечное число шагов приведет к функции Св (С„) — верх-
верхней (нижней) аппроксимации функции С в классе Qi П Q2..
Алгоритм О (С) — представляет собой рекуррентную процедуру по-
построения нижней аппроксимации С для случая, когда в качестве класса
аппроксимирующих функций выбрана фундаментальная область О. Ниж-
Нижняя аппроксимация С в классе О строится следующим образом.
Выберем пару Предъявлений Х\ Хп таких, что
[С(Х') С X" С х'] л [С(Х')ФС(Х")]9
т.е. предъявлений, при которых нарушается условие О независимости от
отбрасывания отвергнутых вариантов. Положим Сх = С, где С — аппрок-
аппроксимируемая функция выбора, и построим последовательность
f САХ')ПС((Х") при X = X1 или X = Х\
( С,(Х) при ЛГ Ф X1 и ЛГ # ЛГ#.
Функция выбора С задана на конечном множестве вариантов. Поэтому
через конечное число итераций i = i0 процедура выдает функцию Cfo(X)9
для которой условие О выполняется. Эта функция и представляет собой
нижнюю аппроксимацию функции выбора С в классе О.
В [29] установлен явный вид функций из фундаментальных областей
Я, С и О и их пересечений, аппроксимирующих произвольную полную
функцию выбора.
Утверждение 20. 1°. Верхняя аппроксимация произвольной полной функ-
функции выбора С в классе Н имеет вид
СВ(Г)= U C(Z)nX,
а нижняя аппроксимация С в Я представима в виде
СН(Х) = Х\ U [Z\C(Z)}.
Z<=X
2*
2*. Верхняя аппроксимация произвольной полной функции выбора С в
классе С имеет вид
св(Х)={уех\\/хех 3Z^x: [xez]*[yec(Z)]},
а нижняя аппроксимация функции С в классе С существует только для
С(Х) € С (тривиальная ситуация).
3°. Верхняя аппроксимация функции выбора С в классе О существует
только в тривиальной ситуации, когда С(Х) G О, а нижняя аппроксима-
аппроксимация С в классе О реализуется алгоритмом О (С).
4°. Нижняя аппроксимация произвольной функции выбора С в классе
Я ПО реализуется алгоритмом {Я, О (С)}.
50
5°. Верхняя аппроксимация произвольной функции выбора С в классе
Я ПС реализуется выявленным отношением Самуэлсона.
Пункт 5° утверждения 20 представляет собой следствие из утвержде-
утверждения 17.
В [29] условия существования аппроксимаций, сформулированные
для полных функций выбора, обобщены на случай частичных функций.
В частности, в [29] показано, что утверждение 18 переносится на слу-
случай частичных функций выбора, если заменить в условиях 1°а, 1°б, 2°а,
2°б класс Q его подклассом Qo, содержащим полные функции выбора
из С. Qo =6^2, где по-прежнему 2 - множество всех функций выбора
с областью определения 2е.
§ 6. Логическое описание функций выбора
6.1. Исследование функций выбора при конечном числе альтернатив
и разработка различных форм представления сложных функций выбора
через более простые существенно упрощается с помощью их логического
описания, предложенного Л.А. Шоломовым в [51].
Не будем здесь различать варианты и их номера. Таким образом,
G = {1, 2,. .. , л). Будем задавать предъявленияXQG булевым набором
X = (*!,... ,хя),гдех/ = 1,если/ GXHXf = 0 при / ? X. Следовательно
универсальному множеству G соответствует вектор A,..., 1), а пусто-
пустому множеству ф — вектор @, . . . , 0). Пусть на G задана функция вы-
выбора С(Х). Выбор С(Х) описывается семейством булевых функций
0, если i 4С(Х).
Условие С (ДО 5 X в булевых терминах записывается в виде
= х,С(О(*(О). где C(/)(JT(/)) - булева функция от п - 1 переменных,
полученная из С^(Х) подстановкой xt = 1. Функция C^^(X^^)t если
она отлична от константы, может быть записана в виде некоторой конъ-
конъюнктивной нормальной формы
С@(?@)= д »<«(?«), , A)
где 2)У\Х^) = Vxp. Здесь s и / пробегают некоторые множества ин-
индексов, Of G{0, 1), в запись х° означает х и Зс соответственно при а =
= 1 и а = 0.
Условие принадлежности С(Х) к множеству Б° означает, что либо
является константой, либо
г... 3c/_i xi+l... хп = xt ... J,.i х/+1 :.. хп. B)
Последнее соотношение, как легко видеть, имеет место тогда и только
тогда, когда в каждой дизъюнкции 2) О содержится некоторый член с
отрицанием, т.е.
VI еТ^п Vs3j : of = 0.
4* 51
Булева функция С^(Х) описывает выбор варианта/ без учета правиль-
правильности выбора остальных вариантов. Набор функций С^^(Х) для / =
= 1, . . . , п является логическим представлением функции выбора С(Х).
62. Приведем логические описания некоторых простых функций вы-
выбора, с помощью которых можно формировать произвольные сложные
функции.
Функция выбора Cr (X), соответствующая оптимизационному механиз-
механизму доминирования по бинарному отношению R, определяется набором
булевых функций
Л xh i = 1,...,и. C)
я-(/)
Эта запись означает, что вариант / Е 1, п будет выбран, если / Е X и если
любой вариант / е 1, п такой, что (/, /) ? R, не входит в X.
Аналогичным образом, с функцией выбора CR(X), соответствующей
механизму блокировки по бинарному отношению Л, можно связать систе-
систему булевых функций
* h i = 1,...,я. D)
Вариант /6 1, п будет отобран функцией выбора С(Х)9 если i E X и
если любой вариант / Е 1, п такой, что ( /, /) G R, не входит в X.
Функция выбора Cr9u(X) по допустимости, соответствующая механиз-
механизму доминирующих ограничений по бинарному отношению R и заданно-
заданному множеству вариантов U Я G, представимому булевым набором U =
= («ь '. . . , ип) {щ = 1 при i E Uи Uf = 0 при/ ^ U), определяется систе-
системой булевых функций
/ея-(/) 7
Аналогичным образом, функция выбора CV' (X) по допустимости,
соответствующая механизму блокирующих ограничений по отношению R
и заданному набору вариантов U, может быть представлена системой буле-
булевых функций
*и& х, Л п,, / = пГ.
/ес(/)
63. Установим теперь булево представление более сложных функций
выбора. Начнем с последовательного выбора по набору отношений
r = (яь;..,я*).
По аналогии с полученными ранее выражениями для логических описа-
описаний функций выбора, отвечающих различным механизмам выбора, можно
получить, что булевы функции С$ « (X), описывающие последователь-
ный выбор по первым t отношениям B < t < к), выражаются через функ-
т*ии &в » &) Для t - 1 отношений по формулам
R | • • • **• t— 1
52
Последовательно применяя эту формулу при / = 2, ...,?, находим
функции СУ\Х) =/ С$ R (X) - логические описания последова-
последовательного выбора по набору бинарных отношений. Здесь предполагается,
что выбор на f-м шаге производится по бинарному отношению доминиро-
доминирования. Если на некотором шаге г варианты выбираются по отношению
блокировки RT, то логическая операция л в последней формуле произ-
производится по jeGRT(i)={j\jRTi}.
В частности, при двухэтапном выборе по отношениям блокировки
Ri и R2 суперпозиции CR(X) = С^2{С^Х{Х)) соответствует логическое
описание
ф = с* ¦*¦(*) = с*ЧХ) л с** (ft =
СО СО СО /еся2(/) {1)
= */( Л х,) Л (*,V( V хр)). F)
I^GR{i) /есЛа(/) ресЛ1(/)
Если в последовательном выборе на каждом шаге выбор реализуется
не бинарным отношением, а другим механизмом с известным логическим
представлением, то результирующее булево описание функции выбора без
труда определяется через составляющие логические функции. Пусть, напри-
например, функция выбора образована некоторой суперпозицией С(Х) -
C«(JO = С®{С[1 \П • • •, С[пНХI 1 = 1,..., п. G)
Зная булевы описания С\ и Cj, нетрудно восстановить логические функ-
функции, соответствующие выбору С.
Пусть теперь С(Х) образована композицией
где F(Yi,. . . , Yk) — монотонная (т.е. выражаемая через U и О) теорети-
теоретико-множественная операция.
Логические представления С^^(Х) предполагаются известными. Для
того чтобы получить булево описание выбора С(Х), следует выразить
F(Yt, . . . , Yk) через операции и и О и построить по ней булеву функ-
функцию f(yi, s. . , ук), заменив действия U и П на булевы операции v и
л соответственно и аргументы Yt - булевыми переменными yt. Тогда
логическое описание С^\Х) функции С(Х) следующим образом вы-
выразится через булевы представления С^(Х) составляющих функций
выбора:
с«\х) = /(cfcft..., сЦЩ), / - 1,.... я.
Используя приведенные соотношения, запишем булево представление
функции выбора, реализуемой механизмом так называемого обобщенного
математического программирования (см. гл. X).
Механизм обобщенного математического программирования (ОМП)
представляет собой механизм оптимизации (доминирования или блокиров-
блокировки) по бинарному отношению Ro на допустимом множестве вариантов,
определяемом системой ограничений по отношениям Rj доминирования
53
или блокировки и заданными множествами векторов Up. Механизм ОМП
может быть записан в виде
(Adm — admissible — допустимый).
Здесь в зависимости от того, рассматриваются ли механизмы доминирова-
доминирования или блокировки,
Opt*, (X) = { х ? Х\ V у G X xRoy),
AdmRf>Us(X) ={xeX\4uGUs xRsu),
или
*rs,usQO ={xex\vueus uRsx).
F — монотонная теоретико-множественная операция.
Будем здесь для определенности рассматривать только механизмы
доминирования.
Введем булевы переменные
/ 1, tex, (s) f l, feuS9
I 0, i<?X, > I 0,
И ПОЛОЖИМ
X - (xlt..., xn)9 Up -
0- @u...,0m).
Определим два набора булевых функций:
C(i)(X, U) = l^fenu Adm/?p, Up(X) =
= F(AdmRpt Up (X)9peT^i),
C{i)(X, U) = 1 <=> i G OptRo(C\U Adm/2p> i/p(*))= Ор^о(С(ЛГ, ?0).
Набору функций С^*\Х, ?/), i = 1,. . . , п однозначно соответствует обоб-
обобщенная функция выбора C(X,U)9 U= {U%t..., U^), и наоборот.
Булевы описания С^^(Х, Щ можно получить, если присутствующую
в их определении теоретико-множественную функцию F(Yl9 . . . , Ym)
выразить через операции О, U и сопоставить ей булеву функцию
f(yif ...» Ут)* заменив Пии логическими операциями Л и v и пере-
переобозначив аргументы У/ через yi. Учитывая введенные ранее булевы
представления для функций выбора CRiu по допустимости, получаем
r) = jc,/( Л м.A),..., Л п/т)),
/ея- (/) ' /6Я- @ ;
Л1 Rm
В соответствии с логическим описанием функции выбора, отвечающей
механизму доминирования по бинарному отношению R09 получаем
54
следующее выражение для С^(Х, U) = OptRt(C^(X, U)):
C, U) = ?<*>(? U) Л C0)(X, U) =
*,/( Л 5/V..., *Л п/т>) Л (x,V
/ея- (О ' /ея- (О ' 1ея- (О
я кт к
Л й.A>,..., Л и
- (О ; /
1 т
По известной обобщенной функции выбора С(Х, IX) могут быть вы-
выписаны соответствующие булевы функции С^^(Х, U)t i = 1,. .. , п. Если
эти функции допускают представление приведенного выше вида, то,
как нетрудно доказать, оно строится однозначно и по нему восстанавли-
восстанавливается соответствующий механизм обобщенного математического програм-
программирования.
6.4. Воспользуемся логическими описаниями различных механизмов
выбора для выражения произвольной функции выбора из класса 2° че-
через простейшие функции, реализуемые строгими порядками [70]. Правда,
это представление оказьюается далеко не самым экономным. Однако,
как мы увидим, в дальнейшем (см. гл. XII) оно служит основой для
важных выводов о механизмах, реализующих произвольные функции
выбора на конечном множестве вариантов.
Для упрощения рассуждений будем считать, что все варианты являют-
являются приемлемыми, т.е. условие B) выполнено при всех i.
Как было сказано в начале этого параграфа, булево представление
любой функции выбора из 2° (если только С^(Х^) не является
константой) может быть записано в виде
С@(х@) = A#(F), Ж® = Vxp, (8)
где каждая дизъюнкция 3)^ содержит некоторый член x?f с оу = 0.
Сопоставим каждой дизъюнкции 3)^ функцию выбора
CLif(X)\J U CL$i(CLJs(X)UCLi(X)l (9)
0 /1 1
где!,/ — строгий порядок со старшим элементом f, гЬц — строгий порядок
со старшим элементом i и следующим за ним элементом /. Через s здесь
обозначен индекс некоторой перепоенной xj, входящей в дизъюнкцию
g)(t) c отрицанием. Такие переменные, как мы видели, должны содер-
содержаться в каждой дизъюнкции 3)^1\
Положим
Q(*)= r*CitS(X). A0)
s
Запишем'булевы представления составляющих функций выбора (9).
)
В соответствии с формулой D) и с определениями СЬУ(Х) иСР'ЦХ) имеем
= ж, ж), Cg?(j?) = ж- ж,,
55
где
Отсюда, используя представления F) — (8), получаем
xs(x, v Ъф),
* v *,(*, v ft)) = *,(xj v *,).
При установленных соотношениях булево описание функции выбора (9)
принимает вид:
= V x,x,v V
или, поскольку в силу A) V х
s v «JO).
Переменная Зсл поглощается дизъюнкцией 2)^\ Поэтому С/^ (ЛП =
и вследствие A0)
Л Cg(l) = х, Л2>«\
S S
Сравнивая полученное выражение с исходным логическим представле-
представлением A) заданной (произвольной) функции выбора С(X), получим
Как мы видели, условие С(Х) ?1в булевом описании функций выбора
эквивалентно соотношению X/C(l)(X(l)) = С^\Х).
Мы получили таким образом, что:
A1)
Это равенство получено в предположении С^\Х^) Ф const.
В случае С^\Х^^) = 1 зададим функцию Ct(X) не формулой A0),
а равенством Q (Х)г = X; при этом соотношение A1) сохранится.
В результате при каждом / построена функция Ct(X), которая пра-
правильно описывает выбор i-го варианта вне связи с другими. Остается
исключить зависимость от i и свести реализации Q(X) при разных i в
одну.
Обозначим через ?/-/ строгий порядок со старшим элементом i и
младшим элементом /. Легко заметить, что
при '"''
ЗЗ..Зс„ при
Учитывая это соотношение и неравенство Ск }(ХК }) ЖЦ' V/, вытекаю-
вытекающее из B) и A1), можно убедиться,что
56
Это означает, что Г"
С(Х) = U ( П CLi-f(X))nCi(X).
Заменив каждую из функций Q(JT) ее выражением (9) —A0), получим
представление функции СЕ 2° в виде
ai//(lftf()jfl/()X 02)
где функции C'isi/(-)9 Cj.j/C')» С2,//(-) порождаются строгими поряд-
порядками.
Суперпозиции функций выбора C2(Ci(•)) соответствует последова-
последовательному (двухэтапному) применению механизмов выбора, реализующих
Сх ( •) и С2 ( •). Композиция U П С/Д •) отвечает параллельному выбору
по каждой из функций С#( *) и "совмещению" полученных таким образом
вариантов. Следовательно, на приведенные здесь рассуждения можно
смотреть как на обоснование утверждения 16 настоящей главы, которое
может быть интерпретировано следующим образом.
Произвольная функция выбора С(Х) G 2° может быть реализована
с помощью параллельной системы двухэтапных выборов из предъявле-
предъявления X с применением строгих порядков и компоновки полученных ре-
результатов при помощи некоторого набора теоретико-множественных опе-
операций.
Это, конечно, далеко не самый экономный из универсальных спосо-
способов реализации произвольной функции выбора. Более экономные уни-
универсальные механизмы выбора будут рассмотрены далее.
§ 7. Некоторые утверждения а функциях выбора
на непрерывных множествах
7.1. Почти во всех рассуждениях настоящей главы предполагалось,
что функция выбора задана на дискретном множестве вариантов (аль-
(альтернатив). В этом параграфе будут рассмотрены некоторые особенно-
особенности функций выбора на непрерывных множествах.
Пусть Ж — метрический компакт (компакт, в котором может быть
введена метрика), f — семейство всех замкнутых подмножеств Ж.
Точки компакта ЛГбудем называть альтернативами, множества X Е f "-
предъявлениями. Теоретико-множественная функция С(Х) : f ->$> такая,
что C(X)QX V X € F, называется функцией выбора на множестве ЯГ аль-
альтернат ив.
Альтернатива х называется приемлемой, если С({х}) Ф ф. В силу
С({*}) Ъ{х) для приемлемых альтернатив С({х}) ={х). Альтернативы,
для которых С({х}) = 0, будем называть неприемлемыми.
Предположим, что выполнены следующие условия.
(i) условие строгого наследования
\fXGf
57
(выбор из подмножества включает всякую альтернативу, выбираемую
из множества и лежащую в подмножестве).
(ii) если х G X Gf их приемлема, то С(Х) Ф ф (если предъявле-
предъявление содержит приемлемую альтернативу, то из него что-то выбирается);
(iii) множество ЭС* всех приемлемых альтернатив непусто;
(iv) условия непрерывности: еслиХ/ G f, Xt >ЛГе^их/ GX/ та-
/ ->«
ковы, что Х( >х и xt €C(Xf) V/, то х G С(Х) (предел последователь-
ности альтернатив, выбираемых из сходящейся последовательности
предъявлений, выбирается из предельного предъявления).
Напомним, что сходимость последовательности предъявлений Х( G f,
Хг > XG f означает:
и
6L{xi):xieXi V/ xt
Такая сходимость называется сходимостью в метрике Хаусдорфа.
7.2. Имеет место
Утверждение 21. Пусть R — бинарное отношение на Ж*, определяемое
условием
xGC({x,y}) => xRy.
Тогда R — полное, транзитивное, рефлексивное отношение (нестрогое
предпочтение), непрерывное на ЗС* (т.е. график отношения R замкнут в
X* X Я*).
Доказательство.
1°. Прих?#* х€С({х}) =С({х, х}), так чтоxRx, т.е./* рефлексивно.
2°. Пусть ?* — семейство всех замкнутых подмножеств JC*. Ясно, что
при Х€:$*9фФХ по (ii) имеем С (X) Фф, так как X содержит приемлемые
альтернативы. Поэтому если х, у G JT*, то С({х, у}) Ф ф. Пусть, скажем,
х е С((х, у}). Тогда xRy. Если же у G С({х, у}), то yRx. Так как
С({х, у}) С {х, у)у то других случаев быть не может. Следовательно,
R полно.
3°. Пусть х, у, z G X* и х/?у, .y/te. Проверим, что при этом xRz. Для
этого рассмотрим А = С({х, у, z}) и докажем, что А Э х. Действительно,
пусть А ^ х. Тогда возможно, что А Э у. В этом случае С({х, у, z}) П
^{х,у)Фф (это пересечение содержит у) и по (i)
С({х,у}) = C({x,^,z}) П {х,у} ={У),
поскольку х$А= С({х, у, z}). Но тогда
что противоречит условию.
Пусть теперь А $ х и А фу. ТогдаЛ=*{2}и С({yf z}) = С({х, у, z}) П
П {у, z) = { z } по (i), так что C({j>, z}) = { z}=*n (^/*z), что снова проти-
противоречит условию. Итак,* G А и по (i)
58
т.е. xRz. Транзитивность R доказана.
4°. Осталось проверить, что R непрерывно. Пусть Х/Лу/> xit yt E яг*,
Требуется доказать, что xRy. В самом деле,
{хг,у() >{х,у), х( Е
xt > х => хеС({х,у})
/-> ~
по (iv), так что xRy. Утверждение 21 полностью доказано.
7.3. Оказывается, что в условиях (i) — (iv) функция выбора может
быть реализована скалярным экстремальным механизмом.
Имеет место
Утверждение 22. В условиях (i)-(iv) существует непрерывная функ-
функция/: JC-+E1 такая,что VXEF С(Х) = Arg max {/(jc) | xGXD jc*)h
УС* замкнуто.
Доказательство 1°. Проверим, что Ж* замкнуто. Действительно,
если Xf Е Х*у х{ > jc, то предъявления {х?} > {х}, и по (iv)
2°. Проверим, что VXe f С(Х) = С(Х
В самом деле,
(а) Пусть вначале С(Х) Ф ф. Убедимся, что тогда С(Х) СХ П J5T*.
Поскольку С(Х) QX, то надо проверить лишь, что С(Х) С JST*. Но если
х еС(Х), то С({х}) =С(Х) П {х} по A),такчтоС({х}) ={х) Фф
и jc G J5T*. (Другими словами, если С(Х) Ф ф, то С(Х) состоит лишь из
приемлемых альтернатив.) Итак, при С(Х) Ф ф С(Х) СХ П J5T*. Но тогда
по (i) С(Х П J5T*) = С(Х) Г) (X П X*) = С(Х). Следовательно, при
С{Х) Ф ф утверждение 2° доказано.
@) Пусть теперь С(Х) = ф . Тогда и С(Х П ЛГ*) = 0 (так как если х G
Е C(Jf П J5C*), то х приемлем, но х G X, а тогда по (п) С(ЛГ) # 0, что
противоречит допущению). Итак, 2° доказано.
3°. В соответствии с утверждением 21 бинарное отношение R на Я1*,
определяемое условием х Е С ({х, у}.) =>xRy> рефлексивно, транзитивно,
полно и непрерывно. (Далее будем считать, что все альтернативы х Е ЯГ*,
а предъявления X Е 5Г*.)
4°. Как будет показано в § 6 гл. V, в условиях утверждения 21 бинар-
бинарное отношение R имеет непрерыбный индикатор
1 Vjc.^ E #•).
Можно считать/о сужением на J5T* непрерывной функции /: JC-+E1 (по-
(поскольку JF* замкнуто в УС ).
5°. Пусть ЛГ€ JT», ^=^0. Проверим, что
С(Г) = Arg max{/(jc) | jcE X).
Пусть х Е C(A). Тогда \/у е X имеем по (i) С({х, у}) = C(Z) П
п {х,у} 2 л:, так чтох/?.у и/(х) >/(v). Отсюда
jcE Argmax{A^)l лг'Е^Г}. A3)
59
Обратно, пусть имеет место A3). Проверим, что х € С(Х). Пусть х* €
€ С(Х). Тогда по доказанному х* G Arg max {/(*') I jc* G X), так что
/(*) =f(x *) • Это значит, что дс/te* и дс*Лс.
По определению тогда дг G С({х, х*}) и дс* G С({х, х*})9 так что
= С(Х) П { дс, дс*}. Левая часть этого равенства, как мы видели, есть { х, х*}.
Отсюда
{jc,x*}=C(jc)O{jc,jc*} => хеС(Х),
что и требовалось доказать.
Итак, С(Х) = Arg max { f{x) \ х е X } при X G $•• и VJT € У С{Х) =
= С(ЛГПяг*) =Argmax{/(x)
Утверждение доказано.
Глава IV
КЛАССИЧЕСКИЕ УСЛОВИЯ РАЦИОНАЛЬНОГО ВЫБОРА
§ 1. Нормальные функции выбора
1.1. Первые формальные работы по изучению взаимосвязей рациональ-
рационального выбора и определяющего его предпочтения принадлежат, по-види-
по-видимому, Е. Слуцкому и П. Самуэлсону. Их результаты изложены в терминах
и понятиях теории потребительского спроса. Цель таких работ - объясне-
объяснение вектора спроса, выбираемого потребителем при заданных ценах и фик-
фиксированном доходе. В неформальных терминах методы получения функций
спроса по так или иначе построенным предпочтениям и определяемой ими
функций полезности рассматривались еще в конце прошлого века. Осно-
Основой современной теории выбора можно считать работу Эрроу [73], в ко-
которой он, игнорируя специфику потребительского спроса, обобщил различ-
различные подходы к определению рационального выбора через свойства порож-
порождающих его бинарных отношений. Эрроу рассматривает непустой выбор
С(Х) Ф ф \/Х Ф ф и предполагает, что семейство S3, на котором определе-
определена С(Х), содержит все конечные подмножества множества G. Та же пробле-
проблематика при менее жестких условиях рассматривалась в работах А.К. Сена
[89,90].
В этой главе рассматриваются только "классические" условия рацио-
рационального выбора, т.е. обсуждаются лишь случаи, когда концепция выбора
определяется бинарным отношением.
Уже отмечалось, что функцию выбора и бинарное отношение можно
связать различными путями. Опишем некоторые подходы к построению
бинарного отношения по функции выбора.
1. Введем бинарное отношение R, положив
Vx, у eG xRy <=* ЗЛГеЗЗ : {хеС(Х),
2. Определим бинарное отношение Re условием
Vx, yeG xRcy «=> хЕС({х,у}).
3. Введем отношение Р, полагая
yeG xPy <=>зхея.{хес(Х), уех\с(Х)}.
В первом определении х "по крайней мере не хуже"у,еслих€Хвыби-
хуже"у,еслих€Хвыбирается, а у принадлежит предъявлению X и, значит у может быть также
выбран* Бинарное отношение Re индуцировано, функцией выбора в тер-
терминах попарного предъявления и сравнения. Бинарное отношение ?, отве-
61
чающее третьему определению, соответствует тому, что Эрроу для специ-
специальных бинарных отношений называет выявленным предпочтением,
По отношению Р х предпочитается у, если х выбирается из Xt а у Предъяв-
Предъявляется, но отвергается. Бинарные отношения, порожденные одной и той же
функцией выбора по разным определениям, приводят, вообще говоря, к
различным результатам сравнения пар альтернатив. По отношению Р опре-
определяется отношение Л выявленного нестрогого предпочтения: хку <==> уРк.
4. Отношение выявленного предпочтения Р индуцирует также отноше-
отношение "неявно выявленного предпочтения" Р*, представляющее собой так
называемое конечное замыкание Р: хР*у, если Зх/ € G,i = О, 1, . . . , п:
х0 = х, хп = у, Х/__| Pxt. Отношение Р* будет использовано далее в силь-
сильной аксиоме выявленного предпочтения.
1.2. Рассмотрим функции выбора CR (X) и CR (X), порожденные бинар-
бинарным отношением R (см. гл. И).
В силу определения двойственного к R бинарного отношения Rd (Rd =
= F:i = (G XG)\R-X) ясно, что CR(X) = CRd(X) и CR(X) =CRd(X).
Поэтому из двух функций выбора, порожденных бинарным отношением/?,
будем рассматривать одну (Cr(X) или Cr(X)).
Поставим в соответствие каждой функции выбора С(Х) ее образ —
функцию CR(X), порожденную бинарным отношением R, построенным
по С(Х):
CR(X)={xGX\ VyEX xRy).
Ясно, что С(Х) Q CR(X) VJf G 63 , так как по определению бинарного
отношения, выявленного по С(Х)9 х Е С(Х) означает, что \/д>Е X имеет
место xRy, т.е. х ? CR (X). Однако обратное включение может не выпол-
выполняться.
Будем называть функцию выбора нормальной, если С(Х) = CR (X)
\fX G SB . Нормальная функция выбора полностью определяется бинар-
бинарным отношением R. Всякая нормальная функция представима некоторым
бинарным отношением, и, наоборот, всякая функция, представимая отно-
отношением, нормальна.
Ясно, что далеко не все функции выбора являются нормальными.
При 93 Ф 2° разным бинарным отношениям могут соответствовать
одинаковые функции выбора.
Условие нормальности полной функции выбора [89, 90] было сформу-
сформулировано в утверждении 2 из § 2 гл. III. Оно выглядит следующим образом.
Теорема 1. Для нормальности полной функции выбора С(Х) необходи-
необходимо и достаточно, чтобы С(Х) удовлетворяла соотношениям
(Я) если XCY, то C(XJC(Y)DX,
(С) аХг)ПС(Х2)С С{ХХ U*2).
Напомним, что (Н) называется условием наследования, а (С) —условием
согласия.
1.3. Паретовский и лексико-графический механизмы выбора (см. гл. III)
порождают нормальные функции выбора Сп (X) и Сл (X). Функции выбора
Сп (X) и Сл (X) индуцируют паретовское и лексикографическое бинарные
отношенияRn и Rn (см. п. 1.2 гл. III).
62
Отношение Парето Rn определяется формулой
Vx.yeG Q Еп
xRny <=> {V/ е 1,я ху > yf и Э/о € 1, п: х/в > д>уо>.
Множеством Парето Gn называется множество
Gn ={xeG\ VyeG y~Rnx).
n
Чтобы определить лексико-графическое бинарное отношение Лл, зада-
зададим на { 1, 2,. . . , и } строгий порядок такой, что кг > к2 > ... > кп, где
kt - номер координаты на /-м месте порядка.
Отношение лексикографии Rn определяется формулой
Vx, yGGQ En xRny <=>{[xkl >укх], или
1*^ = Укх п*к2 > Ук2),
или ..., или [xki = yki, ..., xknl = укп1 и хкп > ykj) .
Отношения Rn и Rn мог)гг быть записаны более компактно, если ввести
функции
Ai(x,y)=xf - yt.
Тогда
AJx.y) > 0 иЗ/ое17«: Д/о(х,^)>0},
, или [Aki(x,y)=O и A»t(x,Л>0^], или ....
или [Ак.(х,у) = 0, /€ 1, я - 1 и Дкп(х,у) > 0]) .
Отношения Ru и Rn инвариантны относительно переноса. Для них
{x-y-z-w} =>{xRy <=> zRw).
Отношения Rn и Rn являются координатными отношениями. Дня срав-
сравнения векторов х и у по этим отношениям достаточно располагать лишь
информацией о знаках разностей одноименных координат.
Заметим, что к координатным отношениям относится также часто ис-
используемое мажоритарное бинарное отношение /?Mtj (см. гл. III), в соот-
соответствии с которым вектор х предпочитается вектору у, если х превы-
превышает у в большем числе координат, чем у превышает х:
Vx, у G G С Еп хДмар' *=* 2 sign(A,(x,>0) > 0.
/= 1
1.4. Приведем условие непустоты нормального выбора.
Теорема 2. Для того чтобы нормальный выбор С(Х) = С* (X) был не-
непуст для любого конечного X Я G, необходимо и достаточно, чтобы по-
порождающее бинарное отношение было ациклично.
Доказательство. Проверим достаточность условия. Пусть R ацик-
ациклично, х Q G, х е X. Возможны два случая. Если \/у € X имеет место уЯх,
тогда по определению нормального выбора х Е С(Х) и, следовательно,
С(Х) непусто. Если же найдется у Е X такой, что JrRx, то либо у€ С(Х),
либо найдется z E ЛГ, при котором имеет место zRy. Продолжая процесс и
63
учитывая конечность множества X и ацикличность R, найдем и G X такой,
что Vu G X выполнено vRu, т.е. и G С(Х). Таким образом, при ациклич-
ацикличном R нормальный выбор С(Х) = CR(X) Ф ф.
Убедимся теперь в необходимости утверждения теоремы. Пусть R не
ациклично. В этом случае найдется набор альтернатив xt G G таких, что
Xf +1/?дс/ (/ = 1, ...,? — 1) HXtRxk. Но тогда по определению выбора по
отношению R для предъявления X ={xlf х2,... ,хк) выбор С(Х) = С*(Х)
пуст. Теорема доказана.
Доказанное утверждение подтверждает высказанный ранее тезис о том,
что ацикличность является минимальным требованием для рациональности
выбора, порожденного бинарным отношением.
1.5. Назовем функцию выбора С(Х) транзитивной, если
U Х2) = С(ХХ)Ф 0,
С{Х2 иЛГ3) = С(Х2) Ф ф}^ С(Хг UX3) = С{ХХ).
Введение понятия оправдывается следующим утверждением [31].
Теорема 3. Если бинарное отношение R транзитивно, то и порождаемая
им нормальная функция выбора CR(X) транзитивна.
Доказательство. Пусть CR(X U Y) = CR(X) Ф ф . Это значит,
что \?х G CR(X) vtVyGY имеет место xRy. Аналогично, если CR(Y UZ) =
= CR(Y) Ф ф, то V^ G CR(Y), Vz G Z, справедливо yRz. В силу транзи-
транзитивности R отсюда следует, что Vjc G CR(X) и Vz G Z имеет место xRz,
а это значит, что CR(X) Q CR(XUZ).
Очевидно, что (\/х G (X\CR(ЛО)вьтолнено х ^ CR (XU Z)). Пусть z G
G Z \ЛГ и z G Сд (JTU Z). Тогда SfxGX имеет место z/?jc,и, следовательно,
\fyGY справедливо zRy, т.е. z G Cr (УU Z). Это значит, что z G Сд (F) С
С Y. Отсюда следует, что yRx VjcG X Полученное соотношение противо-
противоречит принятому предположению CR(XU Y) =CR(X). Теорема доказана.
1.6. Выше был введен паретовский механизм выбора и соответственно
паретовская функция выбора Сп (X).
Напомним в несколько иной форме два характеристических свойства
паретовского выбора, приведенные в утверждениях 7 и 8 гл. III.
1. Класс паретовских функций выбора совпадает с классом нормальных
функций выбора, удовлетворяющих условию
(О) {С(Х) С Г С х) =* { C(Y) = С(Х)},
называемому условием отбрасывания отвергнутых альтернатив.
2. Функция выбора Сп(Х) является паретовской тогда и только тогда,
когда она порождается антирефлексивным транзитивным бинарным отно-
отношением (т.е. качественным порядком).
§ 2. Взаимосвязь между условиями рационального выбора
2.1. Рассмотрим, следуя К.Дж. Эрроу [73], пять условий, которые мо-
могут быть приняты в качестве определений рационального выбора, и устано-
установим взаимосвязи между ними. Будем рассматривать лишь полные функции
выбора, т.е. функции, для которых 9В = 2°.
64
(С1) Если 3^такой, что х G С(Х) иуе С(Х), то хР*у.
(С2)Если XQ У, то Х\С(Х)С Y\C(Y).
(СЗ) Если XQ Y9 то C(Y) ЩС с(ЛГ).
(С4) Если XQ Y и С(У) ПЛГ#0,то С(*) =С(Г) ПХ
(С5) Если хРу9 то не существует такого Y,4to x G Y и у G C(Y).
Условие (С 1) рационального выбора называется сильной аксиомой вы-
выявленного предпочтения. Условие (С1) означает, что если х и у — две
альтернативы, отобранные из предъявления X посредством функции выбо-
выбора С(Х), то бинарное отношение Р* неявно выявленного предпочтения не
может "предпочесть" одну из этих альтернатив другой.
Более слабое (как мы увидим дальше) условие (С2) означает, что если
некоторая альтернатива не выбрана из предъявления X, то она не выбирает-
выбирается и при расширении предъявляемого множества альтернатив.
Условие (СЗ) (эквивалентное, как мы увидим далее, условию (С2))
предъявляет собой условие наследования, а несколько более сильное
условие (С4) — условие строгого наследования. Условие (С4) означает,
что если предъявление Y сужается до X и при этом все еще содержит часть
элементов из C(Y)9 то ни одна ранее не выбранная альтернатива не может
быть выбрана, и ни одна из выбранных альтернатив не отвергается.
Условие (С5) рационального выбора называется слабой аксиомой выяв-
выявленного предпочтения. Условие (С5) означает, что если бинарное отноше-
отношение Р выявленного предпочтения "предпочитает" альтернативу х альтерна-
альтернативе у, то не существует предъявления Y, содержащего х, при котором
C(Y) отберетд\
2.2. Установим теперь взаимосвязь между приведенными условиями ра-
рационального выбора.
Теорема 4. Имеет место логическое следование условий рационального
выбора, изображенное стрелками на ребрах графа Г с вершинами
(С1)-(С5) (рис. 4.1).
Доказательство.
а) Убедимся, что (С1) => (С5). Пусть это не так: (С1) имеет место,
а (С5) — нет. Из того, что (С5) не выполняется, следует, что можно выб-
выбрать альтернативы х и у и предъявление Y так, что хРу, х G Y и у G С(У).
При этом возможны два случая: либо х € Y\C(Y), либо х € C(Y). Если
х €= Y\C(Y), то уРх. По определению отношения Р* неявно выявленного
предпочтения имеем тогда уР*у9 что противоречит условию (С1) при
х =у. Если же jc€ С(У), то снова получаем противоречие с (С1), так как-
при этом хРу=*хР*у9 несмотря на то, что xGC(Y) и yGC(Y).
б) Докажем, что (С4) => (С5). Пусть это не так: (С4) выполняется,
а (С5) — нет. 'Тогда существуют альтернативы хиу и предъявления X и Y
такие, что
хес(Х)9 уех\с(Х)9 xgy, yec(Y). (¦)
Из первых двух включений следует, что {х, у) СХ, а {х, у } П С(Х)
содержит единственный элемент х. Тогда из (С4) следует, что С({х, у }) =
= х. Но из х G Y и у G С(У) (см. (*)) следует, что {х, у} С Y, а из у G
G C(Y) следует (х, у} ПС(У)Ффиуе (х,у) П С( У). При этих услови-
условиях (С4) =*у & С({х, у))9 что противоречит (если х Фу) только что полу-
5. Д.Б. Юдин 65
ченному соотношению С({х, у }) = х. Но х = у исключается первыми дву-
двумя включениями из (*). Таким образом, (С4) => (С5).
в) Проверим теперь, что справедливо и обратное следование: (С5) =»
¦* (С4). Пусть это не так: вьшолняется (С5) и при XС Yи С(У) ПХФф
имеет место С (Я) ФС(У) ПХ.
Возможен один из двух случаев: либо C(X)\[C(Y) П X] Ффтбо
[C(Y) П ЛГ]\С(ЛГ) Ф ф. Пусть имеет место первый случай и у €Е
е C(X)\[C(Y) ПХ]9хе C(Y) ПХ. ТогдаxeC(Y),yG Г (поскольку
Рис. 4.1
ye C(X) CXCY) viy$C(Y) (поскольку д>?С(У) Ши^; G Г). Та-
Таким образом, у G У\С(У) и, следовательно, хРу. Но то, что при этом
у G С(Х), х G X, противоречит (С5). Поэтому в рассматриваемом слу-
случае (С5) => (С4).
Пусть теперь имеет место второй случай: у € [C(Y) П Х]\С(Х), х €
€ С(Х). Тогдахе С(Х),у GХ\С(Х),так чтох?д/. Но при этомх G С(Х) С
С ДГ С 7и^€ ДГ\С(-?)> ч*0 опять противоречит (С5). Таким образом,
и в этом случае (С5) =* (С4). Итак, доказано, что (С4) <=* (С5).
г) Утверждение (С4) «¦ (СЗ) очевидно при C(Y) ПХФф. Если же C(Y)C\
П X = 0, то (СЗ) имеет место в любом случае.
д) Докажем, что (С2) о (СЗ). Пусть X С У. Если выполняется (С2),
то [ЛГ\С(*) ] П C(Y) * 0 или, что то же самое, [С(У) О X] \С(Л0 « 0, что,
в свою очередь, эквивалентно (СЗ). Итак, (С2) =» (СЗ). Справедливо и
обратное. Если выполняется (СЗ), то [C(Y) П ДГ] \С(Х) = 0 или, что то
же самое, С(У) О [Х\С(Х)] = 0. Но [ДГ\С(ДГ)] С X С Г. Отсюда следует
условие (С2). Таким образом, (С2) о (СЗ). Теорема полностью доказана.
2.3. До сих пор мы не предполагали специальных свойств бинарного
отношения Р выявленного предпочтения и не делали никаких допущений
о структуре С(Х).
Пусть теперь R — нестрогое предпочтение, Сд (X) — функция выбора,
порожденная предпочтением R,a Rc - бинарное отношение, индуцирован-
индуцированное функцией Cr (X) посредством попарного сравнения (xRcy> если
х€Сл({х,у}). Имеет место следующее утверждение:
Теорема 5. Сц(Х) удовлетворяет условиям (С1) — (CS). Кроме того,
R=RC-
Доказательство. Убедимся в справедливости свойства (С1)
для функции выбора CR (X).
66
По определению CR (X) = { х Е X\xRy У/у Е X) . Как мы видели,
нестрогое предпочтение R определяет отношение Р- R\R~l такое, что если
найдетсяXС G, для которогоxECR(X)9y€X\CR(X)9 то %Ру.
^Функция выбора Cr (X) порождает бинарное отношение Р: Vx, yGG
хРу в том и только в том случае, если 3XCG: {хЕСд(Д0,д>Е
Е X\CR (X) }. В свою очередь Р индуцирует отношение Р*: хР*у9 если
3xf ex9i =0,1,...^п: х0 = х,х„ =у^хг-ХРхг.
Из определения Р следует, что хРу =* хРу9 а в силу транзитивности Р
хР*у=>хРу.
Допустим теперь, что ЗХ С G и х, у Е С/? (X) такие, что хР*.у- Тогда
будем иметь, что хРу и д> Е Х\С(Х). Мы пришли к противоречию. Сле-
Следовательно, y€CR(X)xP*y при х. Справедливость условия (С1) для
CR (X) доказана.
Из теоремы 4 следует тогда, что CR(X) удовлетворяет и свойствам
(С2) — (С5). Фунция выбора CR(X) индуцирует бинарное отношение Re у
для которого xRcy, тогда и только тогда, когда xECR({x,y}).
По определению CR (X) х- Е CR ({ х, у } ) в том и только в том случае,
когда xRy и х/*х. В силу рефлексивности нестрогого предпочтения xRx
имеет место для всех х. Это значит, что xRcy тогда и только тогда, когда
xRy9 т.е. R = Re. Теорема доказана.
Докажем теперь утверждение, в некотором смысле обратное теореме 5.
Теорема 6. Пусть функция непустого выбора С(Х) удовлетворяет свой-
свойству (С1), (С4) или (С5), R — бинарное отношение, индуцируемое С(Х)
по формуле
xRy9 если хеС({х,у})9
а CR (X) — функция выбора, определяемая R по формуле
cR(X)={xex\\/yex xky).
Тогда R — нестрогое предпочтение, а CR (X) = С(Х).
Доказательство. В силу теоремы 4 достаточно предположить,
что С(Х) удовлетворяет (С4). По условию выбор непуст, и функция вы-
выбора определена для всех конечных предъявлений, принадлежащих мно-
множеству 59 = 2G9 и, в частности, для произвольной пары альтернатив{х,у}..
Это значит, что всегда либо х Е С( { х, у } ), либо у Е С( { х, д>} ). Следова-
Следовательно, для бинарного * отношения R, определяемого функцией выбора
С(Х)9 всегда выполняется либо xRy9 либо yRx9 т.е. бинарное отношение
Л удовлетворяет условию полноты. Поскольку эти рассуждения справед-
справедливы и при х = у9 то отношение Л и рефлексивно. Покажем, что R9 кроме
того, транзитивно.
Положим, что имеют место xRy и yRz. Если у = z или х = д>, то соотно-
соотношение xRz очевидно. Пусть теперь х9 у9 2 различны, а предъявление X
состоит из этих трех альтернатив, и при этом х $ С(Х). Если у Е С{Х),
то{х, у) ПС(Х) Ф ф9 и по условию (С4) имеет место С({х, у})-
= ix, у) П С(Х). По предположению xRy9 т.е. х Е С({х, .у} ), и, следо-
следовательно, х Е С(Х). Мы пришли к противоречию. Поэтому предположение
у Е С(Х) неверно и х ^ С(Х) =*у §Ё C(JQ. Точно так же убеждаемся, что
у $ С(Х) =» z $ С(Х), Таким образом, в принятых допущениях С(Х) = ф9
5* 67
что противоречит исходному условию о непустоте выбора при любом
предъявлении X С G. Это значит, что предположение х 4- С(Х) неверно.
Итак, х ? С(Х). Тогда х G { х, z) О С(Х), и, следовательно, { х, z) П
О С(Х) Ф ф. Поэтому условие (С4) приводит к х Е С({х, z}) или, что
то же самое, к xRz. Мы доказали транзитивность R. Следовательно, отно-
отношение R полно, рефлексивно и транзитивно и является, таким образом,
нестрогим предпочтением.
Покажем, что С(Х) = Ся(Х).ПустьхеС(Х)9уеХЛоттхе (х,у) П
П С(Х) и, следовательно, х € С({х, у}) или, что то же,хЯу Чу € X.
По определению нормальной функции выбора х ? CR (X). Таким образом,
C(X)CCR(X).
Пусть теперь xeCR(X),ye С(Х). Тогда {х, у ) П С(Х) Ф ф. Посколь-
Поскольку xRy, то х е С({х, у}) = { х, у) О С(Х) С С(Х)9 так что CR (x) С
С С(Х). Сопоставляя это включение с полученным ранее, находим С(Х) =
= С/? (ЛГ). Теорема доказана.
2.4. Установленный результат позволяет усилить утверждение теоремы 4.
Имеет место
Теорема 7. Для непустого выбора условие (С1) эквивалентно услови-
условиям (С4)и (С5).
Доказательство. Утверждения (С 1) => (С4) и (С1) => (С5) сле-
следуют из теоремы 4. Докажем обратное: (С1) вытекает из (С4) или (С5).
Пусть С(Х) удовлетворяет условию (С4) или (С5). Тогда по теореме 6
С(Х) = CR (X), где CR (X) — нормальная функция выбора, определяемая
нестрогим предпочтением R. По теореме 5 CR (X) удовлетворяет условию
(С1).
Узава [91] показал, что условия (С2) или (СЗ) недостаточно для спра-
справедливости утверждения теоремы 6. Однако если С(Х) — однозначная функ-
функция выбора (т.е. определяет единственную альтернативу для каждого
предъявления X), то условие (С2) оказывается достаточным для того,
чтобы отношение R, определяемое функцией выбора С(Х), было нестро-
нестрогим предпочтением и чтобы С(Х) = CR(X).
Однозначная функция выбора представляет интерес для технических
приложений, где единственность решения — естественное свойство управ-
управления и проектирования. Однако в экономических и социальных прило-
приложениях теории принятия решений однозначность выбора является ограни-
ограничительным обстоятельством. Оно исключает возможность безразличия
и предъявляет таким образом жесткие требования к рациональному по-
поведению.
§ 3. Аксиомы классического рационального выбора
3.1. А.К. Сен [89, 90] расширил и в известной степени завершил (для
конечного числа вариантов) исследования Эрроу и Узавы по рациональ-
рациональному выбору, основанному на бинарных отношениях.
В предыдущем параграфе приведено три способа построения бинар-
бинарного отношения по функции выбора:
1°. {ЭХеЗЗ: [хеС(Х),уеХ]} =>xRy.
Соответственно строгое бинарное отношение Р = R^ и отношение / =
68
= R (*) определяются формулами:
xPyo(yRx)A(xRy),
xIyo(xRy)A(yRx).
2°.xeC({x,y})*>xRcy.
Соответственно
хРсУ *(yRCx)*(xRcy),
xIcyo(xRcy)*(yRcx).
3°. 3XG&: {xGC(X),yeX\C(X)}
Соответственно
xRy oyPx,
xTy о (xRy) л (yRx).
Следующий пример [89] иллюстрирует различие между разными оп-
определениями бинарных отношений по одной и той же функции выбора.
Пусть функция выбора следующим образом определена на множестве
ix,y9z):
x = C({xty}\ y = C«y,z}), x = C({x,z», y = C({x,y,z}).
В соответствии с приведенными отношениями получаем:
1. xly, yPz и xPz,
2. хРсу, yPcz и xPcz,
3. хРу, yPz, xPz и уРх.
Из этого примера видно, что отношение Р может оказаться неасим-
неасимметричным, т.е. Р не обязательно совпадает с R ^. Можно непосредствен-
непосредственно убедиться в том, что при любых функциях выбора С(Х)
Для нормальной функции выбора, т.е. для С(Х) = Cr (X) = {x€X\V yEX
xRy }, X Q G, имеет место R = Rc, но из R = Rc не следует, что функция
выбора нормальна. Если R = R, то функция выбора нормальна, хотя обрат-
обратное не гарантируется — из нормальности фукнции выбора, вообще гово-
говоря, не следует R = R.r ^
Как мы видели в п. 1.1 § 1, отношение выявленного предпочтения Р
индуцирует отношение "неявно выявленного предпочтения" Р*, пред-
представляющее собой конечное замыкание Р. Аналогичным образом отно-
отношение R порождает так называемое отношение "неявно выявленного пред-
предпочтения в широком смысле" (обозначаемое далее через НО, представляю-
представляющее собой конечное замыкание R:
х Wy, если 3 х{ Е G, / = 0,1,..., п:
х0 =дс, хп -у : X/_i Rxj.
69
Отношение W будет использовано ниже при рассмотрении аксиом рацио-
рационального выбора.
3.2. В приведенных понятиях может быть сформулирован более широ-
широкий список аксиом классического рационального выбора, чем в преды-
предыдущем параграфе, и доказана их эквивалентность.
Рассмотрение ряда различных интуитивно приемлемых аксиом дает
(при совпадении представимых ими классов функций выбора) извест-
известное основание для аргументации определения классического рациональ-
рационального выбора.
Будем рассматривать следующие аксиомы рационального выбора (здесь
R, Rc, R, Р и W - отношения, определенные выше по функции выбора,
Р* — конечное замыкание Р, a W - конечное замыкание R) :
(Al) R является нестрогим предпочтением и С(Х) нормальна,
(А2) Rc является нестрогим предпочтением и С(Х) нормальна,
(A3) xRy=> {\/XmyGC(X) ихGXследуетxGC(X)} ,
(A4)xWy=*{VXn3yeC(X) их ex следует хе С(Х)) ,
(А5) x?y=>yRx,
(А6) хР*у =>yRx,
(А7) R = R,
(А8) RC=R и С(Х)нормальна.
Имеет место следующее утверждение [89], расширяющее результаты
предыдущего параграфа.
Утверждение 1. Условия (А1)-(А8) эквивалентны.
Отдельные фрагменты этого утверждения рассматривались в различ-
различных работах. Некоторые расхождения в формулировках результатов,
которые можно заметить, объясняются тем, что в одних статьях в качест-
качестве предъявлений рассматривались произвольные подмножества G, в дру-
других — допускались только предъявления из заданного подмножества мно-
множества G. Кроме того, одни работы предполагали многозначность функции
выбора, другие - исходили из однозначных (элементнозначных) функций
выбора.
Для однозначных функций выбора справедливо
Утверждение 2. Однозначная функция выбора нормальна в том и толь-
только в том случае, если R — строгое предпочтение.
3.3, Рассмотрим еще несколько аксиом "слабой" рациональности, кото-
которые при определенных условиях эквивалентны аксиомам (А1) - (А8) клас-
классической рациональности.
(А9) Для любых X, У С G и \/х € X из х G C(Y) и X С Y следует х е
()
Это так называемое свойство а, введенное Черновым [77]. Оно озна-
означает, что если х выбирается из некоторого множества Y, то он выбирается
из всех его подмножеств. Свойство а совпадает с введенным ранее свой-
свойством наследования
(А10) ДпялюбыхХУ ГС <7Vx, y еС(Х), если Х^ У, то xGC(Y) толь-
только вместе с у? C{Y).
Это — так называемое свойство /3, введенное Сеном в [89] .Оноозначает,
что если х иу выбираются в X С У, то х выбираются в У только в том слу-
случае, если и у выбирается в У.
70
(All) Пусть М - любой класс предъявлений, а V — объединение всех
множеств из М. Тогда если х G С(Х) V X € Л/, то * G C(F).
Условие (АН) означает, что если х выбирается из каждого предъявле-
предъявления некоторого класса, то он выбирается и из объединения предъявлений
класса. Оно эквивалентно введенному ранее условию согласия.
(А12) Для любых X, Г?G и Vjc, ye С(Х) из X С Y следует, что {х} Ф
ФС(Г).
Условие (А12) означает, что если х и у выбираются из предъявления
X С У, то ни один из них не представляет однозначного (единственного)
выбора в Y.
Имеют место следующие утверждения.
Утверждения 3. Любая нормальная функция выбора удовлетворяет
аксиоме (А9).
Утверждение 4. Однозначная функция выбора удовлетворяет аксиоме
(А9) в том и только в том случае, если она удовлетворяет аксиоме (A3).
Таким образом, однозначная функция выбора, удовлетворяющая ус-
условию (А9), удовлетворяет и (А1)-(А8).
Утверждение 5. Для любой функции выбора условие (А9) означает,
что Л =#с.
Утверждение 6. Любая функция выбора удовлетворяет (A3) в том и
только в том случае, если она удовлетворяет условиям (А9) и (А10).
Таким образом, совместное выполнение условий (А9) и (А10) экви-
эквивалентно классической рациональности выбора, т.е. выполнению любой
из аксиом (А1)-(А8). Это значит, в частности, что (А9) и (А10) сов-
совместно равносильны аксиоме (А1) и, следовательно, обеспечивают нор-
нормальность и транзитивность функции выбора. Теорема 1 настоящей главы
означает, что совместное выполнение условий (А9) и (АН) является не-
необходимым и достаточным условием нормальности функций выбора.
Промежуточным свойством функции выбора между нормальностью
и нормальностью и транзитивностью является нормальность и квазитран-
квазитранзитивность.
Функция выбора квазитранзитивна, если она порождается квазитран-
квазитранзитивным отношением (напомним, что нестрогое бинарное отношение
квазитранзитивно, если отвечающее ему строгое отношение Р транзитив-
но. Соответствующее отношение безразличия / может быть нетранзитив-
нетранзитивным) .
Утверждение 7. Для нормальной функции выбора CR (X) порождающее
ее бинарное соотношение R квазитранзитивно в том и только в том слу
чае, когда выполняется условие (А 12).
Глава V
ОПТИМИЗАЦИЯ ПО БИНАРНОМУ ОТНОШЕНИЮ
И ИНДИКАТОРЫ
§ 1. Определение Р- и R-оптимальности
1.1. В последующих главах важную роль играет выбор вариантов, "опти-
"оптимальных" по тому или иному (специальному) бинарному отношению. В
связи с этим рассмотрим возможные определения оптимальности по бинар-
бинарным отношениям. Разные аспекты этой проблемы изучались в [21], [23],
{50], [73], [34], [71]. Рассмотрим от дельно случаи строгого (асимметрич-
(асимметричного) Р и нестрогого R бинарного отношения.
Пусть Р строгое отношение на G. _
1°а. Назовем элемент х* € G максимальным по отношении^ Р, если .у Ас*
Vy eG.
2°а. Назовем элемент х* Е G наибольшим элементом G по отношению Р,
если Чу^СуФ л:*, имеет место х*Ру.
Пусть теперь R — нестрогое отношение на G.
1°б. Назовем элемент х* G G максимальным по R, если yRx* => x*Ry
VyGG.
2°б. Назовем элемент х* Е G строго максимальным по R, если >>/*** =>
=>х*=у Чу EG.
3°б. Назовем элемент x*GG наибольшим по R, если x*Ry Чу G G.
4°б. Назовем элемент х*Е G строго наибольшим noR,ecmx*Ry \fyGG
nyRx*=>x*=y Чу EG.
Вычисление максимального элемента часто называют оптимизацией по
блокировке, а наибольшего - оптимизацией по доминированию.
Элемент х* является максимальным для некоторого отношения R в
том и только в том случае, когда он оказывается максимальным для стро-
строгого отношения Р' =R*a\ совпадающего с асимметричной частью R.
Наибольший элемент по R и максимальный по Р — двойственные поня-
понятия. Элемент х* является Р-максимальным в том и только в том случае,
когда он является наибольшим для отношения/?' = Pd. И, наоборот, эле-
элемент х* является /^-наибольшим в том и только в том случае, когда он мак-
максимален для отношенияР' =Rd.
Для нестрогого упорядочения R понятие строго наибольшего по R эле-
элемента совпадает с понятием строго максимального элемента.
1.2. Приведем другие определения оптимальных по бинарному отноше-
отношению элементов, которые при некоторых условиях эквивалентны прежним.
Новые определения допускают естественные обобщения понятия оптималь-
оптимального по R элемента множества G.
72
Введем обозначения G%(x)9 H°R(x)9 ER(x)9 NR(x)9 GR(x)9 HR(x) для
множеств элементов, "строго предпочитаемых х по R", "строго подчинен-
подчиненных х по Л", "эквивалентных л: по Л", "несравнимых с х по Л", "нестрого
предпочитаемых х по Л" и "нестрого подчиненных х по R".
y*x\yRxAxRy}9
\xRyAyRx),
H°R(x)UER(x).
Заметим, что все определения оптимального элемента по произвольному
бинарному отношению R9 приведенные в предыдущем пункте, могут быть
сформулированы в единой стандартной форме. Элемент х* Е G есть опти-
оптимальный по/? элементна множестве вариантов G, если GR (х*) = ф.
Рассмотрим следующие четыре множества — объединения некоторых
из перечисленных множеств:
Множества S R(x)9k = 1 -г4, порождают четыре множества
Подчеркнем, что здесь С — знак строгого включения. Поэтому х
%
Зафиксируем некоторое подмножество DCG.
Назовем точку х* € D к-максимальным элементом (по отношению
R на множествеDCG9 если SR(x*) является максимальным по включению
элементом семейства { SR(x), х ЕD) , 1 <к <4, т.е. если 3z E D: SR(z) D
Э ?*(*¦).
_ Другими словами, х* Е D является fc-максимальным элементом, если
3z ЕЭтакого,что SZ\(z) DDC ®R(x*) DD.
Множества SR (x)9l<k<4, представляют собой множества, "подчинен-
"подчиненные" элементу х отношением R в интуитивно приемлемом смысле. При
этом "максимальным" SR(x) отвечают "минимальные" G\SR(x).
Отметим,что G\SR(х) = GR(x),
— естественные семейства элементов, "не худших по R, чем х".
1.3. Сопоставим теперь приведенные ранее определения оптимальных по
Р и R элементов с определением максимального по включению элемента.
73
Пусть Р — строгое бинарное отношение на G. Нетрудно непосредственно
убедиться в справедливости следующего утверждения.
Утверждение 1р.
1°а. Элемент х* максимальный по строгому бинарному отношению Р,
представляет собой 2-максимальный по Р элемент, для которого
2°а. Элемент дс* наибольший по строгому бинарному отношению Р9
представляет собой 4-максимальный по Р элемент, для которого
Заметим, что такого элемента *•, для которого Sj> (х*) = G \ { х* } (соот-
(соответственно Sp (х*) = G \ { х* }), может не существовать. Но среди множеств
{ Sj>(x), х € G } (соответственно Sp(x)9 xGG) при этом может существо-
существовать (а в случае конечного числа альтернатив - всегда существует) макси-
максимальное по включению множество. Соответствующий ему элемент х* будет
максимальным (соответственно наибольшим) элементом в новой поста-
постановке.
Обозначим через G€ максимальное по включению; подмножество G
такое, что рх (G, G€ ) = е (рх - расстояние по Хаусдорфу).
Тогда естественно под е-максимальным (соответственно под е-наиболь-
е-наибольшим) элементом подразумевать элемент jcj, для которого S%(x^) Э G€
(соответственно Sp(x^) D G€). Ясно, что такого элемента может не
существовать. В то же время в приведенном в § 5 гл. VIII определении
е-оптимального по включению элемента такое приближенное решение су-
существует всегда, когда G Ф ф.
1.4. Пусть теперь R — нестрогое бинарное отношение. Сопоставляя оп-
определения 1°б — 4°б оптимальных по R элементов с определением fc-мак-
симальных по R элементов, нетрудно убедиться в справедливости следую-
следующего утверждения.
Утверждение 1д.
1°б. Элемент х* максимальный по нестрогому бинарному отношению Л,
представляет собой 1-максимальный по R элемент, для которого
2°б. Элемент х*, строго максимальный по нестрогому бинарному отно-
отношению R, представляет собой 2-максимальный по/? элемент, для которого
3°б. Элемент х* наибольший по нестрогому бинарному отношению R,
представляет собой 3-максимальный по R элемент, для которого
4°б. Элемент *• строго наибольший по нестрогому бинарному отноше-
отношению R, представляет собой 4-максимальный по R элемент, для которого
Как видим, ^-оптимальность, которая сводится к оптимизации по вклю-
включению множества SR (x), существенно более широкое понятие, чем тради-
традиционная/'- или/?-оптимальность, ^-максимальный по бинарному отношению
74
R элемент х* оказывается и Л-оптимальным в традиционном смысле, если
Sr(x*) совпадает (в зависимости от типа традиционной оптимизации) с
G или с G \ [ х* }. Это весьма жесткое требование, и таких элементов может
не существовать.
В следующем простом примере бинарного отношения, заданного приве-
приведенным на рис. 5.1 нетранзитивным графом, не существует максимального
элемента в смысле любого из приведенных традиционных определений.
В
Рис. 5.1
Однако относительно этого бинарного отношения существуют 1-максималь-
1-максимальные элементы. Это элементы Л, В, С, А ь В\, Сх.
1.5. Традиционное понятие "оптимизация по бинарному отношению/?",
истолковываемое как доминирование или блокировка по R, страдает ря-
рядом недостатков. Нетранзитивность отношений не позволяет использовать
для поиска решений эффективные итеративные вычислительные методы.
Выбор по отношению, имеющему циклы, может оказаться пустым. Кон-
Конструктивные методы оптимизации бинарного отношения R на компактных
множествах G разработаны только для вогнутых целевых бинарных отно-
отношений.
Возникает необходимость в обобщении понятие Opt# G, позволяющем
эффективно вычислять множества Л-оптимальных элементов в тех случаях,
когда они существуют, и естественным (интуитивно оправданным) спосо-
способом расширить понятие R -оптимальности, когда традиционные определе-
определения приводят к пустому выбору.
Определение /:-оптимальности не уступает в содержательном смысле тра-
традиционным определениям оптимальности по бинарному отношению, одна-
однако позволяет при этом избежать некоторых недостатков, присущих им.
Сопоставление вариантов по бинарному отношению R производится на ос-
основе мажорируемых ими множеств альтернатив.
Меняя понятие мажорируемости, получаем различные типы выбора.
С бинарным отношением R связывается частичный порядок, индуцируе-
индуцируемый отношением включения множеств, и, таким образом, преодолевает-
преодолевается ряд трудностей, обусловленных традиционными определениями Opt#G.
Определение ^-максимальных по R элементов естественно, но оно от-
отнюдь не исчерпывает возможные интуитивно оправданные определения
OptRG. Более того, представляются возможными расширения подходов
к выбору по бинарному отношению, обогащающие понятие оптимальности,
позволяющие учитывать дополнительные требования к решению и r извест-
75
ной мере соответствующие выбору опытных специалистов в сложных ситуа-
ситуациях [71].
Свяжем с каждым бинарным отношением R некоторую частичную функ-
функцию выбора C(GR(x) UNR(x)). Будем называть ее корректирующей
функцией выбора, а соответствующую оптимизацию - (R, ^-оптимиза-
^-оптимизацией.
Смысл этой функции выбора в том, что из самого широкого множества
точек, "не худших по /Г' точки х, выбирается подмножество, точки кото-
которого, и только они, в дальнейшем считаются точками, не худшими данной
точки х относительно R. (R, С)-оптимизацию можно интерпретировать как
подход к учету субъективных предпочтений лица, принимающего решение,
в рамках, определяемых бинарным отношением/?. Условие jc € C{GR (у) U
U NR (у) ) означает, что точка х не хуже у и относительно нового бинарного
отношения W:
W = {(x,y)\xeC(GR(y)UNR(y))}.
Таким образом, (R, С) оптимизация представляет собой составной вы-
выбор по R, учитывающий дополнительные условия, накладываемые кор-
корректирующей функцией С( • ).
Поясним это следующими примерами.
Пример 1. Пусть на множестве G необходимо найти точку х», для кото-
которой Н% (х* ) является максимальным по включению элементом семейства
{ Н% (у) \у G G) (т.е. ^-максимальный элемент при к = 4). Тогда GR (х* ) U
и NR(x*) является минимальным по включению элементом соответствую-
соответствующего семейства.
Таким образом, сравниваются множества
GR(x)VNR(x) и GR(y)UNR(y).
Однако не все точки из NR (х) и NR (у) могут быть существенны для лица,
принимающего решение. В этом случае он сравнивает более узкие множест-
множества C(GR (x) VNR (x) ) и C(GR (у) VNR (у) ).
Для ЛИР могут быть несущественными и некоторые точки из GR (x) и
GR(y). Пусть, например, G - множество участников шахматного турнира.
Будем считать, что игрок х сильнее игрока у тогда и только тогда, когда х
набрал не меньше очков, чем у. Но если несколько игроков набрали одина-
одинаковое число очков, то при необходимости упорядочить их лучший из нихх
отвечает не минимальному GR(x)9 а минимальному C(GR(x))9 где
C(GR(x)) - подмножество GR(x) участников, имеющих одинаковую сум-
сумму очков и так называемый коэффициент Бергера не меньше (в смысле
лексико-графического упорядочения), чемх.
Пример 2 подсказан Красненкером А.С.
Пример 2. Пусть G - прямоугольник ОАВС (см. рис. 5.2), а/? - отноше-
отношение лексикографии. Точка В является оптимальным по доминированию
(и по блокировке) элементом G. Верхний срез G#(x) в точке х — это
прямоугольник хА\ВС\. Введем корректирующую функцию выбора
C(GR(x)) = GR{xv), где xv - ближайшая к (xj + v, x2 + v) точка G {v -
заданная константа). Рис. 5.2 иллюстрирует случай, когда
В2 =(xi +p,x2
76
При этом C(GR(x)) = GR(B2) — прямоугольник с вершинами В и В2 и
сторонами, параллельными Охг и Ох2 • В этом примере (R, С)-оптимальными
будут все точки квадрата, принадлежащего G, с вершиной В и сторонами
Приведенный пример имеет определенное прикладное значение. Здесь
с помощью корректирующей функции выбора добавляется условие устой-
устойчивости решения.
А
X
Рис. 5.2
В
с3
с.
Перейдем теперь к формальным-определениям.
Введем множества
C(GR(y)UNR(y))CC(GR(x)UNR(x))}
и их сужения F% с (х) на X Я: G:
С G^ (х) П ЛГ,
Напомним, что для всех традиционных определений R -оптимальных на X
точек х* имеет место GR(x*) ПХ = ф.
Точка х G Gназывается (R, С)'максимальной ((Л, С)-оптимальной)
на G, если Fr9c(x) - минимальный по включению элемент семейства
{FRtc(z)>y e G)>т-е- не существуетz GG такого,чтоFRtC(z) С /^>с(д:).
Точка xGG называется(К,С)гмаксимальным ((R, С)-оптимальным) эле-
элементом X (условным оптимумом), если F%\c(x) является минимальным
по включению элементом семейства {F% с(у), у GX) .
Интуитивная приемлемость введенных определений основана на том,
что выбор производится из множества вариантов, которые не хуже данного.
Вообще говоря, эти определения могут быть еще несколько расширены,
если в выражении для FRfC(x) (соответственно F%с(х)) заменить отно-
отношения включения произвольным частичным упорядочением. Это, однако,
не принципиальная модификация определения оптимизации по бинарному
отношению, поскольку, как известно (см. утверждение 16гл. И), любое
частично упорядоченное множество D изоморфно вкладывается в мно-
множество всех подмножеств Д упорядоченное по включению.
Все введенные выше определения Л-оптимальных элементов отвечают
некоторым фиксированным корректирующим функциям выбора С( *) и
частичным упорядочениям 3*, совпадающим с отношениями включения.
В частности, если R — строгое отношение, то корректирующая функция
выбораС(-), отвечающая максимальному по R элементу, определяется
выражением
C(GR(x)UNR(x)) = G°R(x\
а функция выбора, соответствующая наибольшему noR элементу,
Если R — нестрогое отношение на G, то корректирующие функции
выбора, отвечающие соответственно максимальному, строго максимально-
максимальному, наибольшему и строго наибольшему элементу, определяются фор-
формулами: .
Корректирующие функции выбора С(*)(' )> соответствующие ^-макси-
^-максимальным элементам, имеют вид
C(k)(Gk(x)UNR(x)) =
где S#(x) - множества, введенные в п. 3. Таким образом, для ft-макси-
мальных элементов
FR,c(x) = { y\G%(y)CG%(x) н
(G\SR(y))C(G\SR(x))}={y\G%(y)CGoR(x)H
S%(x)CSR(y)}CS3R(x).
Обозначим множество /?-оптимальных элементов через XR, а множество
(R, С) оптимальных - через XRC.
Имеет место
Утверждение 2. 1) Множество (Я, О-оптимальных элементов включает
множество Л-оптимальных элементов (XRC 2 XR).
2) Если R — полное бинарное отношение, а корректирующая функция
выбора С( • ) монотонна (т.е.Л^ Y=>C(X) Q С(У))и XR Ф ф, то
Доказательство. 1) Если XR = ф , то утверждение 1) очевидно.
Пусть XR Ф ф 9х* € XR. По определению XR GR (х*) ПХ = ф . Поэтому
FRC(xm) = ф , и, следовательно, х* G XRC. Таким образом, XR Q XRC.
2) Пусть х ф. XR. Тогда XR С GR (х) П X (поскольку х е GR (x)). В то
же время Vx* e XR имеем х* G G°R (х) П X, GR(x*) ПХ = ^.Следова-
^.Следовательно, F^.cW - ^л V* ^ ^/?- Поскольку F^c^*) = * Vx*G Л'я,
то х $ Л^'с. Отсюда в силу включения XR ^ ЛГ^^ получаем XRtC = -У/е-
В последующей части гл. V оптимизация по бинарному отношению пони-
понимается в смысле п. 1.1. Оптимизация в более широком смысле, намеченная
в п.п. 1.2-1.5, рассматривается в гл. VIII и IX при построении алгоритмов
78
решения задач математического программирования в порядковых шкалах
и обобщенного математического программирования (ОМП) с произволь-
произвольными бинарными отношениями.
§ 2. Условия существования Г- и R-оптимальных элементов
(случай конечных множеств G)
В [21] приведены условия существования максимального и наибольше-
наибольшего элемента по бинарному отношению для конечных множеств G и топо-
топологических пространств. Там же можно найти ссылки на первоисточники,
в которых эти результаты получены. Доказательства оригинальных резуль-
результатов приведены в тексте [21].
Приведем соответствующие утверждения без доказательств.
Вначале рассмотрим условия, гарантирующие существование "экстре-
"экстремальных" элементов на любом конечном подмножестве X множества аль-
альтернатив G.
Эти условия главным образом связаны с ацикличностью (точнее, с
транзитивным замыканием) отношения на G. Будем обозначать транзи-
транзитивное замыкание строгого отношения Р через Р или Р^, а транзитив-
транзитивное замыкание асимметричной части R(л) нестрогого отношения R через
Дг<в> илиЛ(в>.
Утверждение 3. Строгое отношение Р обладает максимальным элементом
на любом конечном подмножестве ХЯ G вАтом и только в том случае:
когда транзитивное замыкание Р (отношение Р = р(т)) является качествен-
качественным порядком.
Утверждение 4. Нестрогое отношение R обладает максимальным элемен-
элементом на любом конечном подмножестве X Я: G в том и только в том слу-
случае, когда транзитивное замыкание асимметричной части R (отношение
Л (а) - gr {а) ^ является качественным порядком.
Утверждение 5. Если нестрогое отношение R рефлексивно, то оно обла-
обладает строго максимальным элементом на любом конечном подмножестве
X Q G в том и только в том случае, когда транзитивное замыкание R -
отношение R — является нестрогим частичным порядком.
Утверждение 6. Нестрогое отношение R имеет наибольший элемент на
любом конечном подмножестве X множества G в том и только в том слу-
случае, когда оно является полным, а транзитивное замыкание его асимметрич-
асимметричной части (отношение R^ = /?т(в)) является качественным порядком.
Утверждение 7. Нестрогое отношение R обладает строго наибольшим
элементом на любом конечном подмножестве X множества G в том и толь-
только в том случае, когда R является линейным порядком.
Утверждение 8. [50]. Пусть Р - строгий порядок (строгое предпочте-
предпочтение) на конечном множестве G. Тогда на G можно выбрать такую нумера-
нумерацию G = { Х\, х2, . . ., хп }, что соотношение XjPxt будет выполняться тогда
и только тогда, когда/ > /.
Это утверждение означает, что любой строгий порядок на конечном
множестве G равносилен обычному порядку на некотором отрезке на-
натурального ряда. Для строгих порядков понятия "наибольший" и "макси-
"максимальный" элемент по отношению Р на G совпадают.
79
Если бинарное отношение Р не обладает свойством слабой полноты, то
понятия максимального и наибольшего элементов могут не совпадать.
Может оказаться, что х максимален, но не находится в соотношении хРу
с некоторыми другими элементами, поскольку они могут быть несрав-
несравнимы с х.
Если порядок на конечном множестве G не является строгим порядком,
то элементы этого множества нельзя перенумеровать так, чтобы большим
номерам соответствовали более предпочтительные элементы. Более общие
результаты будут изложены далее в связи с порядками и индикаторами.
§ 3. Условия существования Р- и Л-оптимальных элементов
(случай бесконечных множеств G)
3.1. В утверждениях 3—8 конечность подмножества X множества G или
самого множества G существенна. Для так или иначе упорядоченных бес-
бесконечных множеств может не существовать максимальных элементов.
Например, во множестве всех целых чисел, упорядоченных по возрастанию,
нет максимального элемента. Однако для некоторых специальных классов
отношений на бесконечных множествах можно доказать существование
максимальных и наибольших элементов.
Напомним и уточним некоторые понятия, которые нам понадобятся
в дальнейшем.
1°а. Строгое отношение Р на топологическом пространстве G полуот-
полуоткрыто сверху (соответственно снизу), если \fx G G верхний срез - мно-
множество {у\ уРх} (соответственно нижний срез - множество { у | хРу})-
является открытым.
2° а. Строгое отношение Р на топологическом пространстве G называет-
называется открытым (непрерывным), если график Р - множество {(х, у) \ хРу} -
открыт в топологии декартова произведения GXG.
1°б. Нестрогое отношение R на топологическом пространстве G назы-
называется полузамкнутым (полунепрерывным) снизу (соответственно -
сверху), если Vx E G нижний срез — множество {у | xRy) (соответствен-
(соответственно верхний срез — множество { у I yRx}) — замкнут в G.
2° б. Нестрогое отношение R на топологическом пространстве замкнуто
(непрерывно), если график R — множество {(х, у) \xRy) — замкнуто в
GXG.
Имеют место следующие утверждения об условиях существования мак-
максимальных и наибольших элементов на компактном множестве G альтер-
альтернатив [21,34].
Утверждение 9. Если строгое отношение Р на компактном топологичес-
топологическом пространстве G вариантов полуоткрыто снизу и для любого конечного
подмножества X Я G найдется такой элемент х ? G, что уРх Чу Е А7то
отношение Р обладает на G максимальным элементом.
Утверждение 48. Если нестрогое (полное) отношение R на компакт-
компактном топологическом пространстве G вариантов полузамкнуто сверху и для
любого конечного подмножества X Q G найдется такой элемент х ? G,
что xRy Vy EX,toR обладает на G наибольшим элементом.
Утверждение 11. Если строгое отношение Р непрерывно на компактном
топологическом пространстве G, то для любого элемента^ € G существует
80
максимальный элемент х*, удовлетворяющий условию**/^ илидс* =
= У-
Утверждение 12. Если строгое отношение Р непрерывно на топологичес-
топологическом пространстве G и любое множество Gx всех элементов у Е G, для ко-
которых уРх или у = х, компактно, то существует максимальный элемент**
такой, что х*Ру или х* =у.
Условия утверждения 12 вычурны; они выполняются для тех тополо-
топологий, в которых присоединение точки к открытому множеству дает компакт.
3.2. Важную роль в оптимизации по бинарному отношению играют от-
отношения нестрогого частичного порядка/?— рефлексивные,транзитивные и
антисимметричные бинарные отношения. (Заметим, что отношение Л,
обратное к отношению нестрогого частичного порядка R, само является
отношением нестрогого частичного порядка.) Множество G с заданным на
нем нестрогим частичным порядком называется частично упорядоченным.
Частично упорядоченное множество может содержать линейно упорядочен-
упорядоченные подмножества, в которых любые два элемента сравнимы. Такие под-
подмножества называются цепями (возрастающими или убывающими).
Частично упорядоченные множества могут иметь единственный макси-
максимальный элемент или много различных максимальных элементов и могут
не содержать ни одного максимального элемента.
Определим специальный класс частично упорядоченных множеств (класс
вполне упорядоченных множеств), которые удовлетворяют любому из
перечисленных далее условий, как оказывается, эквивалентных мевду со-
собой (см., например, [23]). Эти условия могут быть определены как на ко-
конечных, так и на бесконечных множествах.
Условия максимальности. Любое непустое подмножество X частично
упорядоченного множества G обладает хотя бы одним максимальным
(в X) элементом.
Условие обрыва возрастающих цепей. Любая возрастающая цепь элемен-
элементов частично упорядоченного множества G
xlR~1x2R~lx3 . . . R^XnR ...
обрывается на конечном месте. Другими словами, существует такой индекс
л, на котором эта цепь стабилизируется, т.е.
хп = xn+i = • • •
Условие индуктивности. Пусть все максимальные элементы частично
упорядоченного множества G обладают некоторым свойством А, и из спра-
справедливости этого свойства А для всех элементов, строго следующих за
некоторым элементом дс, может быть выведена справедливость этого
свойства для самого элемента х. Тогда все элементы частично упорядочен-
упорядоченного множества G обладают свойством А.
Линейно упорядоченное множество, удовлетворяющее любому из пере-
перечисленных трех эквивалентных условий, называется вполне упорядочен-
упорядоченным. Вполне упорядоченное множество обладает единственным макси-
максимальным элементом. Любое подмножество вполне упорядоченного мно-.
жества, в свою очередь, вполне упорядочено. Множество целых отрица-
отрицательных чисел вполне упорядочено в его естественной упорядоченности.
Во вполне упорядоченном множестве для каждого элемента х сущест-
существует элемент, непосредственно следующий за ним, кроме случая, когда х
6. Д.Б. Юдин 81
является максимальным элементом G (минимальным элементом G, упо-
упорядоченного отношением R'1).
3.3. При доказательстве эквивалентности свойств вполне упорядочен-
упорядоченных множеств, впрочем, как и при использовании теории множеств для об-
обоснования многих других утверждений о бинарных отношениях на тополо-
топологических пространствах, часто приходится обращаться к так называемой
аксиоме выбора.
Аксиома выбора формулируется следующим образом. Любому мно-
множеству G можно привести в соответствие некоторую функцию <р, сопостав-
сопоставляющую каждому непустому подмножеству X из G один определенный
элемент у (X) этого подмножества.
Для счетных множеств G аксиома выбора очевидна. В этом случае эле-
элементы G могут быть пронумерованы, и требуемая функция $(Х) может
быть получена, например, если каждому непустому XQ G сопоставить
элемент подмножества X с наименьшим номером. Для континуальных G
обосновать аксиому выбора, по-видимому, нельзя.
Введенные выше понятия частично упорядоченного и вполне упорядочен-
упорядоченного множества позволяют сформулировать аксиому выбора в других
терминах и глубже понять ее логические основы.
Пусть X — подмножество частично упорядоченного посредством отно-
отношения некоторого частичного порядка множества G. Назовем верхней
гранью подмножества X в множестве G любой элемент х из G (не обя-
обязательно принадлежащий X), для которого xRy Vj> E X. Аналогичным
образом определяется нижняя грань подмножества X в множестве G.
Заметим, что множество М цепей (линейно упорядоченных подмно-
подмножеств) частично упорядоченного множества G само будет частично упоря-
упорядоченным при помощи отношения теоретико-множественного включения.
Максимальные элементы (если они существуют) множества М называют
максимальными цепями.
Во введенных терминах могут быть сформулированы три теоремы и
доказана эквивалентность каждой из них аксиоме выбора.
Теорема Цермело. Любое множество можно вполне упорядочить.
Теорема Хаусдорфа. Любая цепь частично упорядоченного множества
содержится в некоторой максимальной цепи.
Теорема Куратовского-Цорна. Если любая цепь частично упорядочен-
упорядоченного посредством отношения частичной упорядоченности R множества G
обладает верхней гранью, то Vjc E G найдется некоторый максимальный
элемент х* такой, что x*Rx.
Доказательство эквивалентности каждого из этих утверждений аксио-
аксиоме выбора имеется, например, в [23].
§ 4. Условия существования?- и R-оптимальных элементов
на выпуклых компактах
Оптимизация вогнутых и выпуклых бинарных отношений на выпуклых
компактах оказывается корректной задачей при существенно менее жест-
жестких требованиях, чем в общем случае. Рассмотрим условия существования
1 максимальных элементов у бинарных отношений на выпуклых компак-
компактах. Приведенные ниже утверждения обсуждаются и доказаны в [21].
82
Утверждение 13. Пусть множество G является выпуклым компактом в
евклидовом пространстве Еп, а строгое отношение Р на G
(i) вогнуто,
(И) полунепрерывно снизу в следующем смысле. Если последователь*
ность {хп) сходится к jc и уРх, то существует последовательность {уп}
такая, что упРхп Чпъуп -+у.
Тогда отношение Р обладает на G максимальным элементом.
Утверждение 14. Пусть множество G является сепарабельным выпуклым
компактом, а нестрогое отношение R на G обладает следующими свойст-
свойствами.
(i) для любого открытого X Q G множество { х \ yRx =*>> € X } открыто.
(ii) Vjc G G и любой его окрестности Ux элемент' х не содержится в
замыкании со {у \ yRx y?Ux).
Тогда отношение R обладает на G строго максимальным элементом.
Отношение R, в частности, удовлетворяет условиям утверждения 14,
если оно вогнуто, имеет замкнутый график и каждый элемент х € G яв-
является крайней точкой среза R - множества {у\ yRx} (т.е. (xRx) л
л (yRx) л (zRx) л(х = \=>x=y=z)t
Множество экстремальных элементов отношений на выпуклых компак-
компактах может иметь довольно сложную структуру, однако при некоторых не-
нежестких условиях это множество оказывается выпуклым. Приведем два
условия такого рода.
Утверждение 15. Пусть G - выпуклый компакт, а Р - строгое отноше-
отношение, обладающее на G множеством G* максимальных элементов. Множест-
Множество G * выпукло, если для 0 < X < 1
хР(\у + A -X)z) => (xPy) v (xPz).
Утверждение 16. Пусть G — выпуклый компакт, г R — нестрогое отно-
отношение, обладающее на G множеством G* максимальных элементов. Мно-
Множество G* выпукло, еслр при 0 < X < 1 и xR(\y + A - X) г)существуют
такиехьх2 € G,4tojc = Xa:1 + A -X) x2,XiRyHX2Rz.
§ 5. Численное представление бинарных отношений
5.1. В традиционных моделях управления, планирования и проектирова-
проектирования выбор решения обычно связан с оптимизацией некоторой целевой
функции. В простых ситуациях, когда цель выбора очевидна (по край-
крайней мере, в содержательных терминах) и единственна, — а такие ситуа-
ситуации главным образом и рассматриваются на практике—в качестве формаль-
формального аппарата теории выбора используются развитые в настоящее время
методы решения условных и безусловных экстремальных задач. В более
сложных и тонких ситуациях при выборе объектов произвольной природы,
когда цель выбора не может быть однозначно и четко определена, при поис-
поиске компромисса в конфликте или при необходимости согласовать инте-
интересы участников выбора, оптимизация по скалярному критерию может
потерять смысл. Тем не менее бинарные отношения могут быть использо-
использованы во многих таких задачах для сравнения вариантов решения. Как мы
видели, при относительно нежестких требованиях к структуре бинарного
6* 83
отношения понятия "Р-оптимальность" и "Д-оптимальность" оказываются
содержательно вполне осмысленными. Однако аппарат оптимизации выбора
по заданному бинарному отношению, особенно при бесконечном множестве
альтернатив, весьма слабо разработан. В связи с этим оказываются актуаль-
актуальными следующие две задачи. Целесообразно, во-первых, выяснить, в какой
мере детально разработанные методы скалярной оптимизации могут быть
использованы для выбора решения в сложных ситуациях, не укладываю-
укладывающихся в рамки классических экстремальных задач. Во-вторых, значитель-
значительный интерес представляет разработка механизмов, позволяющих непосред-
непосредственно, используя парные сравнения по бинарным отношениями, подго-
подготавливать выбор решения в сложных ситуациях. Далее будет уделено вни-
внимание и той, и другой задаче.
5.2. Традиционная теория полезности, развитая главным образом в мате-
математической экономике, устанавливает условия, при которых сравнение
и оптимизация по бинарному отношению Р на G эквивалентны сравнению
и оптимизации по скалярной функции *р(х) на G,b частности, по непрерыв-
непрерывной или по выпуклой функции. Такие функции называются функциями
полезности или индикаторами бинарного отношения (индикаторами
I рода).
Не каждому бинарному отношению можно привести в соответствие
индикатор. Однако если бинарное отношение обладает хоть одним инди-
индикатором, то оно обладает бесчисленным количеством индикаторов. Вся-
Всякая строго монотонная функция от исходного индикатора является инди-
индикатором того же самого бинарного отношения. Верно и обратное, если
<р(х) и ф(х) — два индикатора бинарного отношения Р и G, то всегда су-
существует такая строго возрастающая функция/(г), определенная на </?(G),
что ф(х)т/(<р(х)). Функцию fit) на <p(G) можно построить следующим
образом. Пусть f €<p(G). Положим f(f)= ф(х) для некоторого х из мно-
множества <p~1(t)= {x\ip(x) = t}. Это множество определяет класс безразли-
безразличия ф(х) = ф(у) VjCjjye^^). Функция /(г) определена однозначно
и строго монотонно возрастает, поскольку, если s, ?E<p(G) и s > t, то
хРу Vjc G ip'1 (s), у G «/Г1 (t), так что f(s) = ф(х) > ф(у) = f(t). Соотношение
ф(х) = f(<p(x)) выполняется по построению.
Таким образом, каждой задаче оптимизации по бинарному отношению
соответствует бесчисленное количество скалярных экстремальных задач.
Это затрудняет конструктивное использование индикаторов для выбора
альтернативы, оптимальной по заданному отношению. Дело в том, что,
как правило, скалярные задачи оптимизации, в первую очередь нелиней-
нелинейные, не могут быть точно решены за обозримое время. На практике при
решении скалярных экстремальных задач назначается из содержательных
соображений допустимая (абсолютная или относительная) погрешность
в оптимальном значении целевого функционала, по достижении которой
процесс приближения к оптимуму прекращается. Из-за неоднозначного
соответствия между оптимизацией по бинарному отношению и оптимиза-
оптимизацией по его индикатору теряется смысл в фиксации допустимой погреш-
погрешности и, таким образом, отпадают основания для остановки процесса ре-
решения задачи. Поэтому функции полезности - индикаторы бинарных
отношений — оказьюаются применимыми, главным образом, для обсужде-
обсуждения качественных проблем, связанных с установлением свойств бинарных
84
отношений и особенностей оптимизации по бинарным отношениям. Выбор
"оптимальных" элементов произвольной природы в соответствии с упоря-
упорядочением, определяемым заданным бинарным отношением, требует спе-
специальных конструктивных методов, развивающих и обобщающих методы
решения соответствующих скалярных экстремальных задач.
5.3. Понятие функции полезности применимо не к любым бинарным
отношениям. Если бинарное отношение не ациклично, то ему нельзя при-
привести в соответствие традиционную функцию полезности <р(х). Однако по-
понятие функции полезности может быть обобщено. Любому строгому би-
бинарному отношению можно.привести в соответствие, и притом бесчислен-
бесчисленным количеством способов, скалярный индикатор II рода — функцию
<р(х,у) на GXG9 знак который определяет выбираемую отношением Р
альтернативу
хРу <=* <р(х, у) > 0.
Для нестрогого бинарного отношения R
xRy <=* ip(x, у) > 0.
В случае, когда отношение Р обладает функцией полезности, индика-
индикатор II рода бинарного отношения <р(х, у) может быть выражен через функ-
функцию полезности <р(х) в виде <р(х9у) - <р(х) — у{у). В терминах индикато-
индикатора II рода могут быть записаны свойства бинарных отношений и охаракте-
охарактеризованы специальные бинарные отношения. Например, в качестве индика-
индикатора II рода строгого упорядочения — асимметричного бинарного
отношения - может быть взята кососимметричная функция <р(х, у) =
= —ф(у,х) Vjc,уGG. Для антирефлексивного бинарного отношения
у(х, х) < 0 Vjc Е G. Для рефлексивного бинарного отношения R
<р(х,х) > 0 Vx6 G.
Индикатор II рода симметричного бинарного отношения R удовлетворяет
неравенству
Ф,УМУ,х) > 0 Vx, у € G.
Для антисимметричного бинарного отношения
{ \v(x,y)\ + |<p(.y,x)| = V(x,y) + V(y,x)} =» х = у Vx, у е G.
Транзитивное бинарное отношение характеризуется импликацией
)] > 0} => iv(x,z) > 0} Vx,y9zeG.
Для негатранзитивного отношения
{m*xMx,y\ip(y,z)] < 0} =* {<p(x,z)<0} Vx,y,zeG.
Индикаторы II рода полного и слабополного отношения удовлетворяют
соответственно условиям
*<?с,У) < 0 => *(у,х) > 0 Vx9y е G,
<р(х9у) < 0 => ip(y,x) > 0 Vx9y G G хФу.
Для ацикличного бинарного отношения
1-ь */) > 0, xl9...9xk Е G) => <р{хк9хх) < 0.
85
Аналогичным образом записываются условия, связывающие индикаторы
II рода результатов действий над бинарными отношениями (объедине-
(объединения, пересечения, композиции и др.) с индикаторами II рода исходных
отношений.
В терминах индикаторов II рода могут быть описаны известные механиз-
механизмы, реализующие частные классы функций выбора и произвольные
функщш выбора.
Как и традиционная функция полезности, индикатор II рода бинарных
отношений оказывается удобным, главным образом, при решении качест-
качественных задач, в частности, для установления связей между свойствами
бинарных отношений и выяснения условий, при которых осмыслена опти-
оптимизация по бинарному отношению. Что же касается конструктивных воз-
возможностей выбора решений, то у индикатора II рода они столь же ограни-
ограничены, как и у традиционных функций полезности. Оптимизация по бинар-
бинарному отношению требует специальных методов. Конечно, принципы по-
построения методов скалярной оптимизации функций, порождаемых бинар-
бинарными отношениями, существенно используются дйя конструирования ме-
механизмов выбора решений в сложных ситуациях.
§ 6. Индикаторы бинарных отношений (функции полезности)
6.1. Функцией полезности или индикатором строгого отношения Р,
заданного на множестве G, называют функцию <р(х), определенную на G,
такую, что
хРу*<р(х)>*(у). О)
Эта запись имеет смысл только для ациклических бинарных отношений.
Часто используют другое, более жесткое определение функции полез-
полезности:
хРу «=> <р(х) > <р(у). B)
Бинарное отношение Р может быть представлено в виде B) в том и толь-
только в том случае, если Р - слабый порядок. При этом функция <р(х) по-
постоянна на классах безразличия, т.е.
хТу => </>(*) = <р(у)9
где / — отношение безразличия, определяемое порядком Р.
Утверждение 8 § 2, в частности, может быть переформулировано как
условие, при котором строгое отношение Р на конечном множестве G
имеет индикатор <р(*/) = /.
Бинарное отношение Р не обладает функцией полезности вида B),
если оно или определяемое им отношение безразличия Т нетранзитивно.
Нарушение транзитивности отношения безразличия при выборе реше-
решений - нередкое явление, наблюдаемое в поведении людей. Оно обычно
объясняется наличием порога чувствительности у эксперта, не позволяю-
позволяющего ему различить альтернативы, в некотором смысле близкие между
собой. Появляется необходимость в изучении бинарных отношений, пред-
ставимых в виде
хРу ~ ф) > ip(y) + v(y), C)
где \р — функция полезности, a v > 0 — пороговая функция.
86
Установим, при каких условиях бинарное отношение обладает тем или
иным численным представлением.
Приведем утверждение, сопоставляющее различным классам бинарных
отношений, заданным на конечном множестве вариантов, те или иные
представления с помощью индикаторов.
Утверждение 17. 1°. Каждому слабому порядку Р можно привести
в соответствие индикатор у(х) с нестрогой шкалой (когда различным х
могут отвечать одни и те же значения индикатора)
хРу *=
2°. Каждому линейному порядку R может быть сопоставлен индикатор
<р(х) со строгой шкалой (принимающий для разных х разные значения)
xRy «¦* ?(х) >ip{y).
3°. Каждому интервальному порядку Р можно сопоставить две функ-
функции - индикатор <р(х) и порог различения v(x) > О, так что
хРу <=> <р(лг) > <р(у) + р(у)
(v(x) можно интерпретировать как погрешность измерения).
4°. Каждому полупорядку Р можно привести в соответствие скалярную
функцию ip(x) и число v > О такие, что
хРу *=> ф) > <р(у) + v.
5°. Каждому качественному порядку Р можно сопоставить набор ска-
скалярных функций крх (jc), ..., \рк (х), так что
хРу <=>(
т.е. качественный порядок определяется паретовским бинарным отноше-
отношением на множестве критериев \рх,..., \рк.
Доказательство. 1°. Пусть G — конечное множество, Р — слабый
порядок, R -РUI = Pd — нестрогий слабый порядок (в других терми-
терминах - нестрогое предпочтение).
Обозначим, как обычно, верхний срез отношения Р через Gp(x) (Gp(x) =
= {yeG\yPx}).
В силу асимметрии слабого порядка Р имеет место ровно одна из трех
альтернатив - либо хРу, либо уРху либо xly. Это значит, что имеет место
одно из трех включений - либо Gp(x) С Gp(y), либо GP(x) D GP(y), либо
GP(x) = Gp(y). Обозначим через N(x) число элементов в GP(x). Имеем
хРу <=* GP(x) С GP(y) <=* N(x) > N(y),
где N(x) = |С| - N(x).
Итак, существует функция N(x) — индикатор слабого порядка Р
хРу <=> N(x) > N(y).
Ясно, что для нестрогого слабого порядка
xRy <=> N(x) > N(y).
2°. Путь теперь бинарное отношение, помимо свойств слабого порядка,
обладает слабой полнотой, т.е. является строгим порядком. Тогда имеет
87
место
(хРу) v (yPx) v О=х).
По доказанному слабый порядок Р обладает индикатором
хРу <=> <р(х) > <р(у).
Если порядок Р, кроме того, слабо полон, то Vjc,j> ? G имеет место
Это значит, что в случае строгого (сильного) порядка <р(х) в разных точках
принимает разные значения (т.е. индикатор такого отношения является
индикатором со строгой шкалой).
Для нестрогого слабого порядка R = Р U / существует функция <р такая,
что
Линейный порядок представляет собой сильный порядок, дополненный
парами (х, х) \/х. Из приведенных рассуждений ясно, что для линейного
порядка существует индикаторная функция </?(дг) со строгой шкалой, при-
принимающая разные значения для разных х.
3°. Согласно утверждению 15 гл. II интервальный порядок Р порождает
слабый порядок Р3 на множестве YU Y*. Здесь множество Y состоит
из элементов, взятых по одному из каждого класса эквивалентности, при-
принадлежащего G/I(I- отношение эквивалентности, порожденное интер-
интервальным порядком Р), а У* - множество "искусственных" элементов дс*,
сопоставляемых каждому элементу х Е Y. В силу того, что Ръ - слабый
порядок, существует вещественнозначная функция /на YU Y* такая, что
\/1 V е YUY*
%Ръ^<=> /($)> /(г?).
Положим для х G Y у(х) =/(х) и v(x) =/(**) — f(x). Тогда, учитывая
свойство G) слабого порядка Р3 (уР3х* *=*уРх) (см. утверждение 15
гл. II),получаем
уРх ~ *{у) > <р(дг) + v(x) Vx,y e Y.
Поскольку из свойства F) отношения Р3 следует х*Р3ху то имеет место
р(х) > 0.
Положим у(х) = ф(у) и v(x) = v(y) при xly и у G Y. Тогда соотношение
хРу <=> ф) > у(у) + v(y) Vx, у EG
следует из утверждения 14 гл. II и следующих импликаций:
(хРу) л (ylz) => xPz,
(xly) л (yPz) => xPz,
вытекающих для слабых порядков из утверждения 9 гл. П.
4°. Пусть теперь Р — полупорядок - полутранзитивный интервальный
порядок. Покажем, что в этом случае можно положить *>(*) = у = 1, т.е.
что для полупорядка при подходящем выборе $ имеет место соотношение
хРу <=> ip(x)
88
Приведем схему доказательства, принадлежащего П. Суппесу и Дж. Зи-
несу. Подробную аргументацию можно найти в [43].
Рассмотрим на числовой прямой Т бинарное отношение &у опреде-
определяемое соотношением
а&р <=> а > 0 + У.
Легко видеть, что отношение & - полупорядок. Действительно, 9 анти-
рефлексивно и из (аРр) А G #5) = (а > 0 + 1) Л (у > б + 1) следует, что
если одно из соотношений» > 5 + 1 или у > (S + 1 неверно, то имеет место
другое соотношение. Аналогичным образом проверяется полутранзитив-
полутранзитивность 9>. Из (а9>&) Л $2h) = (а > 0 + 1)Л (/3 > -у + 1) вытекает, что если
одно из соотношений а. > б + 1 или б > у + 1 неверно, то справедливо дру-
другое.
Пусть теперь Р — бинарное отношение на множестве классов эквивалент-
эквивалентности, порожденное полупорядком Л т.е.
V*, YEG/I XPY<*CxGX, yGY):xPy.
Отношение Р9 вообще говоря, не является полным.
Введем отношение R на G/J такое, что
4ZGG/I XRY*>{ZPX=>ZPY)A (YPZ^XPZ).
Можно доказать, что бинарное отношение R определяет линейный порядок
на G/I, т.е. R рефлексивно,антисимметрично, транзитивно и полно на G/L
Из XPY следуетДЛ У, но не наоборот.
Отношение Р индуцирует также отношение безразличия 7 на множестве
классов эквивалентности G/I.
Утверждение 4° будет полностью аргументировано, если удастся дока-
зать,^то для конечного множества G/I классов эквивалентности полупоря-
полупорядок Р на G/I изоморфен полупорядку 3й на части числовой оси Т.
Для линейного порядка R на G/I = {Хо, Хи ..., Хп)
XiRXi-i и ХгФХ^х.
Определим функцию у (Хг ) = xt, / =0, 1,..., л, где лг/ однозначно оп-
определяется следующими условиями:
A)
B) C/,0</<0(ВД Л
i I
где/ наименьшее из 0 </ </ удовлетворяющее левой части B).
Заметим, что каждый класс Хг фигурирует либо в условии A), либо в
условии B). Если не существует/ такого^что XfPXj-i, то имеет место
Х{1Х0 и выполняется условие A). Если XtlXj и XjPXj_г,то можно найти
наименьший номер j такой, что ДГ/РЛ/_ ь
Остается проверить, что <р является однозначным соответствием и
89
Свойство однозначности <р можно доказать, убедившись, что xt > х,_
Для этого надо разобрать возможные случаи:
1°. Xtlx0. 2°. Xjxf Л XiPXj-i B°2i.Xi^lTXo;
2°б. Х^ХРХО; 2°б1,/ = /; 2°б2,
Проверка сводится к непосредственному учету соотношений A) и B),
определяющих х,- = <р (Xt) для каждого из возможных случаев.
Покажем теперь, что ХгРХк =*хг >хк + 1. Пусть А) — первый по порядку
класс эквивалентности, для которого имеет место XtLXj и XjPXj- г, Тогда
/ - 1 > к и */_ i > хк. В рассматриваемых условиях дс;_ i + 1 < дс,-, от-
откуда xt >хк + 1.
Пусть теперьх( >хк + 1. Покажем, что отсюда следует ХгРХк (естествен-
(естественно, предполагается, что / > к). Пусть утверждение неверно, тогда xjxk.
Пусть X] — первый класс эквивалентности, для которого верно XflXj.
Тогда к > 1 и хк > дсу. Случай/=0исключается.Он приводит к противоречию
с соотношением xt >хк + 1, поскольку в этом случае XjIXq nXkIX0 (так
как XfRXic), и О <Х/ < 1 и 0 <хк < 1. Поэтому/ > 0. Тогда xt < Xj + 1,
но хк > Xj и xt <xk + 1. Мы снова пришли к противоречию. Соотношение
XtPXk «* {jc/ > xfc + 1} *> <р (ДГ,-) > <р (Хк) + 1, а вместе с ним и анонсиро-
анонсированное утверждение доказаны.
Заметим, что в доказательстве существенно использована конечность
числа классов эквивалентности полупорядка. Неясно, справедливо ли ут-
утверждение в случае бесконечного (даже счетного) числа элементов мно-
множества G/L
5°. Рассмотрим теперь случай, когда бинарное отношение — качествен-
качественный порядок — асимметричное транзитивное отношение. Предполагается,
что множество G содержи! конечное число элементов G = {1, 2,...,N).
Положим (/>(/)= { tpt(/),..., <pN(j)} , где
О, если (/Ft)Л(/#/),
2, если /А*.
Ясно, что вектор-функция </> (/) определена для качественного порядка Р
всюду на G.
Докажем, что
где Яп — паретово бинарное отношение, определяемое вектор-функцией
критериев у на множестве G,
Покажем, что/7% => y(j)Rn <p(k).
Пусть /Pfc. Тогда по определению (р (/) при любом фиксированном i
и в cwiyjPk имеет место <#(/) = 2 > <р,(Л:) (= 1),
<#(*) = 2 =>Ш,
90
а поскольку по условию jPk, то
Ш =»(//>*) Л(Ш).
Учитывая транзитивность качественного порядка Р, получаем отсюда
для любого фиксированного /.
Итак, /РАгвлечет* (/)>*(*) и<р* (/) >*>*(*)>т-е./Р* =>*>(/) Rn<p(k).
Покажем, что для качественного порядка Р справедливо и обратное:
(
Пусть <р(/ ) Rn <р(к). Тогда </>* (/) > & (к) = 1.
Неравенство ^*(/) ^ 1 может выполняться либо при <р*(/) = 2, что по
определению ^ означает /Pit, либо при <?*(/) = 1, что означает / = к. Но при
/ = * равенство <р (/) = ^ (А:) имеет место для всех компонент вектор-функ-
вектор-функции \р и, стало быть, у (/) Лп<р (?) не имеет места. Итак, при у (/) Rnip (к)
вьшолняется *pk(j) = 2, что по определению <р означает /Pfc. Таким обра-
образом, ip (/') /*„<? (*) =>jPk. Качественный порядок на множестве G эквивален-
эквивалентен паретову бинарному отношению'на наборе критериев <р{ (/).
Утверждение доказано.
Заметим, что имеются работы, в которых аналогичный результат дока-
доказан для критериев другой структуры. Больше того, доказано [84], что
результат настоящего пункта справедлив и при числе критериев <р/, меньшем,
чем число 7V элементов множества G. Однако число критериев, с помощью
которых может быть представлен любой качественный порядок на ко-
конечном числе ^вариантов, не может быть меньше
[г]
Таким образом, при конечном числе вариантов линейный порядок (и
сильный порядок) характеризуется критерием со строгой шкалой, слабый
порядок — критерием с нестрогой шкалой, интервальный порядок — крите-
критерием и порогом различия, зависящим от варианта, полупорядок — крите-
критерием и постоянным порогом различения, а качественный порядок — набо-
набором критериев. Сформулированный результат позволяет следующим об-
образом расположить специальные классы бинарных отношений по возрас-
возрастающей жесткости определяющих их характеристик;
произвольное бинарное отношение — качественный порядок — ин-
интервальный порядок — полупорядок —слабый порядок — сильный
порядок.
Каждый последующий класс бинарных отношений включается в преды-
предыдущий..
6.2. Установим теперь условия, при которых бинарное отношение, задан-
заданное на бесконечном множестве вариантов, обладает тем или иным числен-
численным представлением. Выясним также, в каких случаях функция полезнос-
полезности непрерывна и вогнута.
Введем, следуя [21], определения
1. Сечением множества G, на котором задано отношение Р, назовем
разбиение а= {S(~\S^+) } множестваG такое, что
91
2. Семейство сечений {ок \к ЕЖ } множества G, упорядоченного от-
отношением Р, называется порядково-паотным, если Vx, у € G таких, что
уРх, существует сечение ok= {SJ±~\ 5^+) } такое, чтох G 5^~>, у G 5^+>.
3. Множество G с заданным на нем отношением Р назьюается порядковое
сёпарабельным, если оно обладает не более чем счетным порядково-плот-
ным семейством сечений.
4. Семейство сечений {ок \ к GJC) назьюается согласованным, если
ViJGX либо5/+) С5/+^,либо5/+> Э5/+).
В [21] приведены следующие условия существования функций полез-
полезности, менее жесткие, чему Фишберна [46] иДебре [81].
Утверждение 18. Для того чтобы отношение Р обладало на G представ-
представлением
D)
E)
необходимо и достаточно, чтобы множество G с заданным на нем отноше-
отношением Р было порядково-сепарабельным.
Утверждение 19. Для того чтобы представление D) было двусторонним,
т.е. удовлетворяло условию
необходимо и достаточно, чтобы оно удовлетворяло условию E), а отно-
отношение Р было слабым порядком.
Утверждение 20. Для того чтобы отношение Р обладало на G представ-
представлением
с v (х) > 0, необходимо и достаточно, чтобы множество G с заданным на
нем отношением Р имело не более чем счетное порядково-плотное согласо-
согласованное семейство сечений {ок} , обладающее следующими свойствами:
О) если zes?~\ х eSp* и уРх9 то yPz9
(И) если yPz, то существует такое к, что z G Sfc~\ у G S^ иг7у=>
В литературе изучены также условия, при которых возможно то или
иное численное представление бинарных отношений при дополнительных
требованиях о полунепрерывности сверху, непрерьюности и вогнутости
индикатора.
6.3. Приведем другие условия [46], гарантирующие наличие индикатора
отношений, менее общие, но в ряде случаев легче проверяемые и более
конструктивные.
Утверждение 21. Пусть отношение Р — слабый порядок на G, а множество
классов эквивалентности G/I счетно. Тогда существует индикатор отноше-
отношения Р на G, удовлетворяющий условию B) для любых х, у G G.
Подчеркнем, что утверждение может не выполняться, если множество
G/I окажется тГконечным, ни счетным.
Несколько более слабое утверждение можно получить, если заменить
слабый порядок на качественный порядок - асимметричное, транзитивное
отношение Р. В этом случае отношение безразличия 7 может не быть тран-
транзитивным^ соотношение A) нельзя гарантировать. Однако если отношение
92
/, соответствующее качественному порядку Р9 —отношение эквивалентно-
эквивалентности, то имеет место следующее утверждение
Утверждение 22. Пусть Р — качественный порядок на G, а множество
классов эквивалентности G/I счетно. Тогда существует индикатор отноше-
отношения Р на G, удовлетворяющий условиям
Утверждения 21 и 22 могут быть распространены на случай, когда требо-
требование счетности G//можно заменить более слабым. Введем для этого поня-
понятие плотности относительно порядка, несколько более жесткое, чем поня-
понятие порядковая плотность, введенная в п. 6.2 настоящего параграфа.
Пусть Р - бинарное отношение на G. Назовем множество ЯСС Р-тот-
ным в множестве С, если\/x,yGG\H: xPy 3z GН: (xPz) A(zPy).
Введем на множестве классов эквивалентности G/I отношение Р' так,
4TOVZ, YGG/I
XP'Y«*3xGX, yGY: xPy.
Во введенных терминах имеет место следующее обобщение утвержде-
утверждения 21.
Утверждение 23. Существует такая функция у(х) — индикатор Р на
множестве G, что соотношение B) Vjc, у ? G выполняется в том и только
в том случае, когда отношение Р является слабым порядком и существует
подмножество множества классов эквивалентности G/I, Р'-плотное в G/I.
Аналогично формулируется следующее обобщение утверждения 22.
Утверждение 24. Пусть Р качественный порядок на G и существует
подмножество множества G/I классов эквивалентности, Р9 -плотное в G/I.
Тогда существует индикатор <р(х) отношения Р на G такой, что
4x,y<=G,
Подчеркнем, что здесь плотность относительно порядка — условие
достаточное, но отнюдь не необходимое для выполнения приведенных
импликаций. Обратим также внимание на то, что утверждения 22 и 24 не
противоречат п. 5 утверждения 17, в котором рассматривается соответ-
соответствие вида *=* а не =*, как в утверждениях 22 и 24.
Лексикографическое бинарное отношение является примером,
когда условие плотности относительно порядка нарушается.
Одним из первых сформулировал условия существования индикатора
бинарных отношений, заданных на топологическом пространстве, Дебре
[81, 82]. Теорема Дебре доказана при несколько более жестких требова-
требованиях к бинарному отношению, когда оно представляет собой нестрогое
или строгое предпочтение (рефлексивное или антирефлексивное транзи-
транзитивное и слабополное отношение).
Имеет место
Утверждение 25. Индикатор предпочтений существует, если предпочтение
(строгое Рили нестрогое R) непрерьюно, а множество представляет собой
93
связное топологическое пространство, имеющее счетное всюду плотное
подмножество.
В случае, когда G — подмножество векторного пространстваЕп9 сущест-
существование счетного всюду плотного подмножества обеспечивается автомати-
автоматически и для существования индикатора предпочтений достаточно связности
множества G и непрерывности предпочтений.
6.4. Рассмотрим теперь численное представление в форме C). Критерий
представимости в форме C), определяемый утверждением 20, трудно-
труднопроверяем. Приведем более простое условие для численного представления
интервального порядка. Имеет место:
Утверждение 26. [46]. Если отношение Р является интервальным поряд-
порядком на G, а множество G/I соответствующих классов эквивалентности
счетно, то на G существуют индикатор <р(х) и пороговая функция р(х),
представляющие Р в форме C). Справедливо и обратное. Антирефлексив-
Антирефлексивное отношение Р9 удовлетворяющее соотношению C), является интерваль-
интервальным порядком.
Пороговая функция р(х)> обеспечивающая нетранзитивность отношения
безразличия для интервального порядка, определяет интервал безразличия
1(х) в точке х. 1(х) = [<р(х\ <р(х) + v(x)].
По представлению C) интервал безразличия 1(х) интервального поряд-
порядка Р целиком лежит правее 1{у) в том и только в том случае, когда хРу.
Если два таких интервала пересекаются, то их элементы находятся в отно-
отношении безразличия.
Дня полупорядков Р, представляющих собой полутранзитивные интер-
интервальные порядки, аналог утверждения 26 может быть доказан при более
жестких условиях.
Утверждение 27. Пусть Р является полупорядком на G, а множество
соответствующих классов эквивалентности G/I конечно 7 Тогда существует
функция у>(х) на G, при которой
При соответствующем строго монотонном преобразовании <р(х) можно
заменить в этом соотношении 1 на любое положительное число. Пороговая
функция v(x) в этом случае не зависит отх, т.е. все интервалы безразличия
можно сделать одинаковыми по длине.
63. До сих пор предполагалось, что элементы х множества G — объекты
произвольной природы. В частном случае, когда элементы х — точки под-
подмножества /i-мерного векторного пространства Еп9 а отношение Р является
монотонным слабым порядком, условия существования функции полез-
полезности упрощаются и интуитивно истолковываются более естественным
образом. При G СЕп существование счетного всюду плотного множества
обеспечивается автоматически, так что наличие индикатора отношения
можно не обусловливать специальным требованием плотности относительно
порядка.
Пусть*, уеЕ", х = {хи...,хп\у = (Уи...>уп)9х > у <=>(хФ у и
Х(>У(, /= 1,... ,ri),G — прямоугольное подмножество Еп, т.е. G —декар-
—декартово произведение Gt: G -Gi X ... X Gn.
Отношение Р называется монотонным, если х > у =>хРу.
Имеет место
94
Утверждение 28. Пусть G — прямоугольное подмножество Еп, а Р —
монотонный слабый порядок и, кроме того,
(xPy)A(yPz)**
A - »)z] Py} .
Тогда существует индикатор у(х) отношения Р9 удовлетворяющий условию
хРу **=> ip(x) ><р(у) V jc, у G G.
Утверждение 29. Пусть G - неотрицательный ортант в Еп9 а отношение
Р - качественный порядок на G, для которого
(а) [(x>y)A(yPz)] V[(xPy)A(y>z)] ~xPz,
(б) xPy~{3z)((x>z)A(z>y)).
Тогда существует индикатор <р(х) отношения Р9 для которого
хРу -> </>(*) >*(у) VxfyeG.
Здесь условие (а) вместе с антирефлексивностью Р означает, что х>у=>
^уРХу т.е. возрастание каждой компоненты вектора х не уменьшает превос-
превосходство по отношению Р вектора х над вектором у. Условие (б) означает,
что если вектор х превосходит у по отношению Л то можно так увеличить
(может быть, весьма незначительно) все компоненты вектора у, чтобы х
по-прежнему превосходил по отношению Рвозросший вектору.
Представляет интерес выяснение условий, при которых индикатор
отношения представляет собой непрерывную функцию. Дело в том, что
непрерывный индикатор на соответствующих ограниченных множествах
достигает- максимального значения, и это позволяет ставить задачи об
"оптимизации" выбора по бинарному отношению.
Оказьюается, что условий утверждения 28 достаточно, чтобы индикатор
ip(x) слабого порядка был непрерьюен, а условия утверждения 29 достаточ-
достаточны для непрерывности сверху индикатора у(х) качественного порядка.
§ 7. Условия существования вогнутого индикатора предпочтений
7.1. В прикладных задачах принятия решения представляют особый
интерес такие специальные бинарные отношения, как вогнутые предпочте-
предпочтения, т.е. непрерывные, вогнутые, рефлексивные, транзитивные и полные
бинарные отношения. Будем здесь, кроме того, считать, что рассматривае-
рассматриваемые отношения регулярны, т.е. множества одинакового уровня - области
эквивалентности — имеют размерность ниже размерности области определе-
определения предпочтения.
Установим условия (в п. 7.1 - необходимые и достаточные, в п. 7.2 -
необходимые, а в п. 7.3 - достаточные) существования вогнутого индика-
индикатора предпочтений.
Введем некоторые определения.
Пусть R — бинарное отношение на GCEn, f: G->C Отображение /
будем называть изотопным, если
95
Будем называть отрезок [х0, хх] правильным относительно бинарного
отношения R на выпуклом компакте GCEn (Я-правьыьным), если х0
точка минимума, а хх - точка максимума относительно R на G и других
точек экстремума на [х0, хх ] нет.
Утверждение 30. Пусть R - регулярное непрерывное предпочтение на
выпуклом компакте G СЕп. Для того чтобы/? имело вогнутый индикатор,
необходимо и достаточно, чтобы R было вогнутым и существовало изо тон-
тонное отображение F: G-+G такое, что для некоторого Л-правильно го отрез-
отрезка [xo»JKo] множество
X = {(a,y)\a<l,yeG, F(y)R [х0 + а(у0 - х0)]} СЕ1ХЕп
было выпукло и Рг^и X = G.
Доказательство. Пусть R имеет вогнутый индикатор /(•)•
Тогда, очевидно, R вогнуто. В силу непрерьюности R и . компактности G
R имеет на G точки минимума и максимума.
Обозначим через х0 одну из точек минимума, через Х\ — одну из точек
максимума, а через у0 — ближайшую к х0 точку пересечения отрезка
[*о» *i] c верхним срезом Gr(xx) предпочтения R в точке Х\. Будем
считать R нетривиальным отношением (в случае тривиального отношения
доказьюаемое утверждение очевидно). Тогда хофуо, и в силу регулярно-
регулярности R отрезок [х0, у о ] R -правильный. Положим
Отображение F ( • ) изотонное, так как «/?(•) также индикатор R. Построим
множество X по отображению F и правильному отрезку [х0, у0). Множест-
Множество X является подграфиком функции \р ( • ). Поскольку \р ( • ) вогнута, X
выпукло. Необходимость доказана.
Докажем теперь достаточность сформулированных условий вогнутости >
индикатора.
Положим у(у) = sup {а | (а, у)ЕХ). Тогда X является подграфиком
</>(•), и поскольку X выпуклое множество, <^( • ) - вогнутая функция.
Пусть ylt у2 — произвольные точки множества G нугЯу2.Т1о определению
<р имеем
Отсюда <р( у\) ^ур{ у г)- А из вогнутости R и правильности отрезка
[*о> У о] вытекает импликация
Комментарий. Фактически ^>(у) определяет точку пересечения
отрезка [xo,^o] cGR(F(y))yT.e. [х0 ^<р(у)(у0 -xo)]IRF(y). Множество
X — аналог подграфика в случае скалярной вогнутой функции.
7.2. Приведем необходимое условие существования вогнутого индикато-
индикатора непрерьюного регулярного предпочтения R.
Утверждение 31. Пусть R — негрерьюное регулярное предпочтение на
выпуклом замкнутом множестве G СЕп. Для того чтобы R имело вогну-
вогнутый индикатор, необходимо, чтобы верхний срез GR() был выпуклым
многозначным отображением.
96
Доказательство. Обозначим через /( * ) вогнутый индикатор и
зафиксируем произвольные Х6(О,1),дгьх2е^ У^Ся(х\)» гДе х\ =
= \xi ¦ A — X)х2. Пусть для определенности x2Rxx. Вследствие вогнутости
R, вытекающей из существования вогнутого индикатора, реализуется одна
из двух возможностей:
l.x2PyRxl9 где P = R\IR,
2.yRx2.
В первом случае справедлива цепочка соотношенийx2PyRx\Rxx. Луч
x(t) = х2 +1{у - х2), t > О, пересекает границу GR (z) при yRzRxx ровно
в одной точке (в силу регулярности R). Отсюда следует существование
точки ух €GR(xt) такой, что Хуг + A -\)х2 = у, т.е. у ? \GR(Xi) +
+ A — X)GR(x2). Вследствие произвольности у справедливо включение
Следовательно, GR( • ) — выпуклое многозначное отображение.
Во втором случае x2Rxx и y&GR(x2) CGR(xx). Справедливость дока-
доказываемого утверждения здесь очевидна.
7.3. Приведем достаточное условие существования вогнутого индикатора
непрерывного регулярного предпочтения R. Обозначим, как обычно, верх-
верхний и нижний срезы R в точке х через GR(x) и HR(x), и пусть SR(x) =
= GR(x)nHR(x).
Утверждение 32. Пусть R — непрерывное регулярное предпочтение на
выпуклом замкнутом множестве G С En,GR( • ) - выпуклое точечно-мно-
точечно-множественное отображение и существует прямая /, имеющая непустое пере-
пересечение с SR (jc) Vх ? G, так что выполнено соотношение
\Нк(Х1)П1 + A-\)Ня(х2)П /С(ХСл(х0 + A- \)GR(x2))c,
где Ас — дополнение множества А. Тогда R имеет вогнутый индикатор.
Доказательство. Возможны два случая:
1°. R не имеет максимальных элементов в G.
2°. R имеет максимальные элементы в G.
Рассмотрим первый случай. Покажем, что при всех х G G прямая / пере-
пересекается с SR(x) ровно в одной точке. Пусть, наоборот, для некоторого
у G G прямая / пересекается с SR (x) в двух точках ух пу2. Из непрерыв-
непрерывности R следует, что на [.Уь.Уз] предпочтение R достигает максимума,
пусть, для определенности, в точке у0. Из регулярности R вытекает, что
V х G G П / ;>о#*- Из того, что / имеет непустое пересечение с SR(x)
\fxGG, следует, что у0 — максимальный элемент R на G. Но это противо-
противоречит предположению об отсутствии максимальных элементов в G.
Таким образом, V* G G прямая / пересекается с SR(x) ровно в одной
точке.
Из выпуклости GR (x) вытекают следующие включения:
С (GR(xK)f С HR(xx).
Отсюда следует, что HR ( • ) = HR ( • ) П / - вогнутое точечно-множест-
точечно-множественное отображение.
7. Д.Б. Юдин 97
Обозначим через а(х) точку пересечения прямой / с Sr(x). Тогда
VXG @, 1), V*i, X2 € G имеем
где х^ = Xjcj +A -Х)лг2.
Из того, что х\ — максимальный элемент в HR {х\), вытекает, что
a{xK)R[\*(xx) + (\ -Х)а(х2)]. (*)
Отсюда следует существование вогнутого индикатора. Действительно,
пусть *i, Jt2 С / О G, причем х2Рхх (где Р = R\Ir). Обозначим
хх = X*! + A - Х)х2, X G @, 1). Покажем, что VX е @,1) х2РххРх1.
Из вогнутости R вытекает, что X\Rxt, а из регулярности R следует строгое
отношение Х\Рхг.
Если бы имело место xxRx2, то вне отрезка [хх, х2] нашлась бы точка
z E / ПС такая, что zPx\, и соотношение Х\Рх2 не сможет выполняться
вследствие вогнутости Я, а соотношение x\Irx2 - по регулярности Л.
Таким образом, х2 Рх\.
Из приведенных выше рассуждений следует, что t2 > tx *m*x(t2)Rx(ti),
где x(t) = xx +r(x2 -хг).
Введем функцию t ( • ): G -+E1 определенную соотношением
хх +t(x)(x2 -
Поскольку по определению а(х) имеем xIr ol(x) , то
*(У) > *(х) <яв> .уЛл: V х, у eG.
Следовательно, t ( • ) - индикатор Л. Из соотношения ( ¦) следует, что
{хг +r(Xx + (l -\)y)(x2 -xl)}R{\(xl
Отсюда получаем
Г(Хх + A -XV)>Xf(x) + (l -X)fCv) VXG@,
что и доказывает вогнутость t ( • ).
Рассмотрим теперь второй случай. Будем считать, что R нетривиально.
(Если R — тривиальное предпочтение, справедливость утверждения оче-
очевидна.) Пересечение / с GR(xm), где хт — максимальный элемент R на G,
является связным замкнутым собственным подмножеством /. Возможны
три случая:
(а) / П GR(x,) = у0,
(б) / П
(в) / П
98
Рассмотрим случай (а). Пусть хг G / П G, хг Фу о- В силу регулярно-
регулярности R луч /1 ={y(t) \y(t) =у0 +1 (*! - у0), * > 0} пересекает те 5д (х),
с которыми он имеет непустое пересечение, ровно в одной точке.
Если не существует 10 < 0 такого, что
y{t)P{yo + fo(*i - 7о)> V у it) е 1г,
то /1 пересекает Sr (х) \/x G G, причем ровно в одной точке. Если же та-
такое t0 < 0 существует, то ясно, что указанными свойствами обладает
к = МО 1^@=^0+^1 -УоХ t < 0}.
Исследуем теперь случай (б). Рассмотрим два луча:
/i ={y{t)\y(f) = yo+t{yt-yo\ t>\}9
к >
По крайней мере один из них имеет непустое пересечение с SR (x)
С, причем (в силу регулярности R) пересекает Sr (х) только в од-
одной точке.
В случае (в) указанным свойством обладает луч
/i = iy(t)\y(t) = yo+t(yx -уо)у t < 0}.
Как и в случае (а), справедливость утверждения вытекает из выпуклости
многозначного отображения Gr ( •).
§ 8. Общие условия существования Р- и Л-оптимального выбора
на компактном множестве вариантов
8.1. В предыдущих параграфах излагались условия существования опти-
оптимальных в различном смысле вариантов при выборе по бинарным отноше-
отношениям, принадлежащим к тем или иным специальным классам отношений.
Эти условия, как правило, конструктивны и проверяемы. В последнее вре-
время появился ряд работ, в которых предприняты попытки привести на
едином языке достаточно общие (может быть, не столь легко проверяе-
проверяемые) условия существования оптимального по бинарному отношению
выбора, из которых вытекали бы известные частные условия для специаль-
специальных случаев, сформулированные различными авторами в различных терми-
терминах. Обзор подобных работ для компактных множеств вариантов (содер-
(содержащий, впрочем, и оригинальные результаты автора) приведен в [34].
Некоторые общие определения и утверждения из [34] представляют
интерес в связи с последующим изложением.
В предыдущих параграфах, где рассматриваются условия существова-
существования Р-оггтимума и Я-оптимума применительно к специальным классам
бинарных отношений, вводятся вслед за [21] два определения оптимизации
по строгому отношению Р и четыре определения оптимизации по нестрого-
нестрогому отношению R. Таким образом удается отразить особенности оптимиза-
оптимизации по различным специальным бинарным отношениям. При подходе
к оптимизации по бинарным отношениям, не учитывающем специфики
отдельных классов отношений, не могут быть выявлены и соответствующие
7* 99
тонкие эффекты оптимизации. Поэтому в [34] вводится только одно опре-
определение JP-оптимизации и два определения R-оптимизации. Приведем эти
определения.
Будем называть множеством максимальных на G элементов по строгому
отношению Р множество
МР ={х* G G |3y: хРх*}.
Назовем множеством наибольших на G элементов по нестрогому отно-
отношению R множество
NR ={х* е G\\fx е G x*Rx).
Будем называть множеством максимальных элементов по нестрогому
отношению R множество
MR = ix* G G \xRx* => x*Rx).
Здесь не рассматриваются определенные в § 1 (п. 1.1) наибольший эле-
элемент по строгому отношению Р и строго максимальный и строго наиболь-
наибольший элементы по нестрогому отношению R. В [34] не рассматриваются
также более общие определения Р- и Л-оптимальности из пп. 1.2—1.5.
Укажем связь между множествами NR и MR, отвечающими одному и ¦
тому же нестрогому бинарному отношению R.
Утверждение 33. 1°. Всегда NR С MR. Для того чтобы NR = MR, необхо-
необходимо и достаточно, чтобы VxGG было выполнено условие
[ By G G: xRy] =» [ 3 z: (zRx) Л (jcRz)].
2°. Если R транзитивно и NR Ф 0, то NR =MR.
Множества оптимальных по отношениям Р и R элементов могут быть
выражены в терминах нижних и верхних срезов соответствующих бинарных
отношений в точке х.
Пусть НР (х), Gp (x), HR (x), GR (x) - соответственно нижние и верх-
верхние срезы отношений Р и R в точке х. Имеют место следующие выражения
для множеств оптимальных элементов по отношениям Р nR.
Утверждение 34.
МР = G\v{HP(x)\x GG} = n{G\HP(x)\x G G),
NR = n{GR(x)\x GG},
MR = n{GR(x) U (G\HR(x))\x G G).
8.2. Введем понятия, позволяющие сформулировать условия, необходи-
необходимые и достаточные для непустоты множеств Мр и NR.
Назовем строгое отношение Р конечно-недоминируемым на G, если для
любого конечного множества X CG существует элемент у GG такой, что
хРу Vx G X.
Эквивалентное определение конечной недоминируемости строгого отно-
отношения Р формулируется следующим образом.
100
Строгое отношение Р конечно-недоминируемо на G, если не существует
такого конечного множества ХС G, что
U{HP(x)\x еХ} = G ,
или, что то же, если для любого конечного множества ХС G выполнено
П {G\HP(x)\x е Х)Ф 0.
Назовем нестрогое отношение R конечно-доминируемым на множест-
множестве G, если для любого конечного множества X С G существует элемент
у G G такой, что yRx \fx € X
Эквивалентное определение конечной доминируемости нестрогого отно-
отношения R формулируется следующим образом.
Нестрогое отношение R конечно-доминируемо, если для любого конеч-
конечного множества ХС. G выполнено
n {GR{x)\x EX} Ф ф.
В этих терминах формулируются следующие утверждения о необходи-
необходимых и достаточных условиях непустоты множеств оптимальных по Р и
R элементов.
Утверждение 35. Пусть множество G компактно, а все нижние срезы
строгого отношения Р - открытые множества (т.е. Vx G G НР(х) - от-
открытое множество). Тогда для того чтобы множество МР максимальных
по отношению Р элементов было непусто, необходимо и достаточно, чтобы
Р было конечно-недоминируемо на G.
Утверждение 36. Пусть множество G компактно, а все верхние срезы
нестрогого отношения R замкнуты (т.е. V х G G Gr(x) - замкнутые мно-
множества) . Тогда для того чтобы множество NR наибольших по отношению R
элементов было непусто, необходимо и достаточно, чтобы R было конечно-
доминируемо.
Утверждения 35 и 36 вытекают одно из другого, если учесть следующее
Утверждение 37. Для того чтобы множество МР максимальных элемен-
элементов по строгому отношению Р совпадало с множеством NR наибольших
элементов по нестрогому отношению R, необходимо и достаточно, чтобы
Р kR были двойственными отношениями P=Rd.
Для непустоты множества MR максимальных по отношению R элемен-
элементов известно только достаточное условие.
Утверждение 38. Пусть G компактно, а нестрогое отношение R рефлек-
рефлексивно, транзитивно и обладает замкнутыми верхними срезами на G.
Тогда множество MR максимальных по отношению R элементов непусто.
8.3. Решение многокритериальных задач связано с теми же проблемами,
что и оптимизация по бинарному отношению. Естественно, что и вопросы
существования оптимальных в том или ином смысле решений многокрите-
многокритериальных задач сводятся к аналогичным вопросам существования опти-
оптимального выбора по бинарному отношению.
Многокритериальная задача
{fi(x)\i GI) -* max|jc <E G
101
определена, если указано, в каком смысле следует истолковывать макси-
максимум вектор-функции /(х) = { // (х) \ i G /}, где /, вообще говоря, беско-
бесконечное множество индексов.
В литературе обычно под оптимизацией вектор-функции /(х) = {// (*)}
подразумевается оптимизация по паретову бинарному отношению.
Более общий подход к решению многокритериальных задач (который изла-
излагается в гл. X) предполагает оптимизацию {//(*)} по, вообще говоря,
произвольному бинарному отношению, отражающему предпочтения лица,
принимающего решение.
Напомним определения некоторых понятий, посредством которых фор-
формулируются условия существования паретова решения многокритериаль-
многокритериальных задач. Пусть f(x) = {//(*) | / € /}. Положим
/О0> «-> Шх) > ft(y) V/ €Е /},
{fix) >/&)} ~( ffr) > fi(y) Vie/, f(x) Ф
</(*)>/00 > ~ Ш*)>/Ю0 V/G7}.
Назовем точку jc € G
(i ) полуэффективным (слабооптимальным по Парето) решением мно-
многокритериальной задачи, если Эу GG: f(y) >/(дс);
(ii) эффективным (оптимальным по Парето) решением многокрите-
многокритериальной задачи, если By G G: f{y) > /(jc);
(iii ) идеальным решением многокритериальной задачи, если \fyGG
выполняется /(дс) ^/00-
Обозначим соответственно через 5/, Е/, J/ множества полуэффектив-
полуэффективных, эффективных и идеальных точек многокритериальной задачи.
Определим нестрогое бинарное отношение /?, положив
xRy *=>{f(x) ^f(y)}, xty E G.
Тогда // представляет собой множество наибольших элементов, а
Е/ — множество максимальных элементов множества G по нестрогому
отношению R, т.е. Jj = Nr, a E/ = Mr. Поэтому утверждение 33 можно
следующим образом переформулировать в терминах многокритериальных
задач.
Утверждение 33#. 1. Всегда /7 С Е/. Для того чтобы // « Е/, необходи-
необходимо и достаточно, чтобы V х Е G выполнялось условие
[Э/€/, ЗуеС: fi(y)>fi(x)] => [3zGG f(z) > /(*)].
2. Если // Ф 0, то Ji =Е7.
Приведем условия непустоты множества полуэффективных, эффектив-
эффективных и идеальных точек многокритериальной задачи.
Утверждение 39. Для существования полуэффективных точек у много-
многокритериальной задачи достаточно, чтобы хотя бы одна из компонент // (х)
достигала максимума на G. Соответствующие точки максимума и включе-
включены в множество 5/.
102
Утверждение 40. Пусть множество G компактно и V / € / ft (x) полу-
полунепрерывны сверху на G. Тогда множество ?/ эффективных точек
непусто.
Следующее утверждение нетривиально только для случая бесконечного
числа частных критериев // (х) многокритериальной задачи.
Утверждение 41. Пусть множество G компактно и V / G / //(х) полу-
полунепрерывны сверху на G. Тогда для того чтобы // было непусто, необхо-
необходимо и достаточно, чтобы непусто было множество /^ , где /' - любое
конечное подмножество множества индексов /.
В [34] показано, что утверждения 40 и 41, сформулированные в терми-
терминах паретовых бинарных отношений, вытекают соответственно из общих
утверждений 36 и 38.
Глава VI
ОБЗОР ВЫЧИСЛИТЕЛЬНЫХ МЕТОДОВ
ТЕОРИИ ПРИНЯТИЯ РЕШЕНИЙ
§ 1. Введение
Задачи теории принятия решений и соответственно методы их анализа
целесообразно классифицировать в зависимости от концептуальной инфор-
информации о целях и области определения выбора и от характеристик источни-
источников конкретной информации, позволяющей оценивать допустимость
предъявленных вариантов и сравнивать их качество. Концептуальная ин-
информация о целях и области определения выбора позволяет установить
принцип оценки допустимости, согласованности и качества решения. Допус-
Допустимое множество решений может задаваться своими геометрическими свой-
свойствами, либо описываться системами равенств и неравенств или содержа-
содержательными соображениями — правилами, алгоритмами, позволяющими про-
проверять соответствие любого предъявленного варианта решения требова-
требованиям на допустимость.
Выбор может преследовать одну или несколько целей. В первом случае
проблем нет. Независимо от того, имеется ли формализованный показа-
показатель качества решения, характеризующий степень достижения цели, или
существует "оракул" — источник информации, указывающий для рассмат-
рассматриваемого варианта его характеристики допустимости и качества, выбор
решения сводится к анализу условной экстремальной задачи — в принципе
пройденному этапу теории принятия решений.
Существенно более сложна ситуация, в которой выбор требует достиже-
достижения нескольких целей или решение должно удовлетворять, вообще говоря,
несовпадающим интересам нескольких лиц. Здесь возникают проблемы,
связанные с установлением и аргументацией понятий "равновесие", "сог-
"согласованность", "компромисс", "справедливость". Рассматриваются раз-
различные подходы к определению этих понятий. На выбор подходящего оп-
определения оказывают влияние конкретные особенности решаемой задачи.
При этом в каждом отдельном случае характер агрегирования требований
к решению в той или иной мере основан на субъективных соображениях
эксперта или лица, принимающего решение.
Изучаются три класса путей к установлению компромисса между раз-
различными требованиями к решению. Первый класс связан с использованием
зарекомендовавших себя на практике механизмов выбора — содержатель-
содержательно оправданных процедур принятия решений. Второй класс путей к уста-
установлению понятия "компромисс" — так называемый аксиоматический под-
подход - сводится к разработке и формулированию интуитивно рациональных
104
требований к этому понятию и к доказательству существования процедур
(возможно, классов процедур), удовлетворяющих таким требованиям.
Наконец, третий класс путей согласования различных целей и интересов
в той или иной области состоит в задании некоторых функций выбора, ука-
указывающих для разных обстановок (предъявлений) из заданного множества
ситуаций подходящий выбор. Функция выбора может быть установлена,
например, на основании наблюдений за действиями (решениями) опытного
эксперта — специалиста по решению задач данного типа. Так, в принципе,
могут быть установлены функции выбора, отвечающие трудноформали-
зуемым решениям диспетчера системы управления, диагнозам опытного
врача, действиям сталевара, управляющего плавкой.
В терминах функции выбора могут быть описаны и два других подхода
к принятию решения в сложных ситуациях, связанные с использованием тех
или иных процедур выбора или основанные на различных системах акси-
аксиом, — содержательно приемлемых определениях свойств равновесия. Фор-
Формальные приемы, устанавливающие связь между этими подходами, пред-
ствляют практический интерес. Если любой функции выбора можно бу-
будет сопоставить процедуру, реализующую ее, а системе аксиом, характе-
характеризующей компромиссный выбор, можно будет привести в соответствие
функцию выбора, то по свойствам, приписываемым "справедливому" ре-
шениютчможно будет восстановить механизм, автоматически осуществляю-
осуществляющий такой выбор. Больше того, тогда окажется возможным по функции
выбора, отражающей результаты достаточного объема наблюдений за реше-
решениями опытного специалиста, строить автоматизированные процедуры, вос-
восстанавливающие (при некоторых естественных допущениях о характере
предъявлений) решение специалиста в заданной- ситуации с погрешностью,
не превышающей заданную.
Подробней эти вопросы будут обсуждаться в последующих главах.
В настоящей главе приводится краткий обзор различных механизмов
принятия решений.
В § 2 конспективно излагается современное состояние традиционного
математического программирования - механизма решения классических
условных экстремальных задач, в которых заданы критерий качества ре-
решения — скалярная функция, характеризующая степень достижения цели,
и скалярные функционалы, описывающие область допустимых решений.
Экономные методы математического программирования используются в
последующих главах как вспомогательный аппарат для конструктивных
методов принятия решений в более сложных ситуациях, в частности, для
механизмов выбора решений в многокритериальных задачах и в конфликт-
конфликтной обстановке. Некоторые из подобных методов линейного и выпуклого
программирования, достаточно эффективные на практике, изложены в
гл. VII "Вспомогательные вычислительные методы".
В § 3 дано краткое описание математического программирования (вы-
(выпуклого и линейного) в порядковых шкалах - эффективного механизма
"оптимального" выбора объектов произвольной природы по результатам
их парных сравнений на основе предпочтений лица, принимающего реше-
решение.
Рассматривается также случай, когда бинарные отношения, определяю-
определяющие выбор, могут быть нетранзитивны и неполны.
105
В :§: 4 схема математического программирования в порядковых шкалах
обобщается на случай выбора, основанного не на непосредственном сравне-
сравнении объектов, а на попарном сравнении векторов их характеристик. Соот-
Соответствующие задачи называются задачами обобщенного математического
программирования.
В § 5 приводится характеристика схемы многошагового обобщенного
математического программирования, излагаются ее свойства и возмож-
возможности. Эта схема может рассматриваться как механизм точной или при-
приближенной (с любой требуемой точностью) реализации произвольной
функции выбора.
Материалы § § 3-5 далее подробно обсуждаются и аргументируются в
гл. VIII, IX и XII.
В § 6 обсуждаются актуальные задачи теории принятия решений. Вы-
Выявляются предположения, лежащие в основе Современных подходов к
выбору решения, которые '.подвергаются» критике со стороны ряда специа-
специалистов. Намечаются пути преодоления принципиальных и вычислитель-
вычислительных трудностей. В частности, предлагается программа исследований, имею-
имеющих целью ослабить требования к ЛПР, исключить его рутинную деятель-
деятельность, сохранив за ним лишь творческие задачи, связанные с выражением его
знаний, опыта, шкалы ценностей, идеологических установок и жизненных
позиций.
§ 2. Традиционное математическое программирование
2.1. Простейшая ситуация выбора решений соответствует случаю, когда
лицо, принимающее решение, преследует единственную цель, и эта цель
может быть формально задана в виде скалярной функции - критерия ка-
качества выбора — или значения критерия качества могут быть получены для
любого допустимого набора значений аргументов. Предполагается также,
что известна область определения параметров управления — компонент
выбираемого вектора - или во всяком случае для любой заданной точки
может быть установлено, является ли она допустимым выбором, т.е. при-
принадлежит ли она области определения критерия качества решения. В та-
такой ситуации задача выбора решения может быть формализована и описа-
описана моделью математического программирования.
В задаче математического программирования требуется вычислить л-мер-
ный вектор х, оптимизирующий (обращающий в максимум или минимум
в зависимости от содержательной постановки задачи) критерий качест-
качества решения /0(х) при соблюдении ограничений fj(x)> u/>fGl>r9 х E
Е G, где/у, / GO, г,- известные скалярные функционалы, щ - задан-
заданные числа, G — заранее заданное множество л-мерного пространства.
Таким образом, задача математического программирования имеет вид:
Ew. A)
В зависимости от свойств функций /- (/o>/i> • • • >/V) и множества G
имеют дело с тем или иным классом задач оптимизации.
Если все функции / линейные, a G — многогранное множество, имеют
дело с задачами линейного программирования; если среди функций/ ветре-
106
чаются нелинейная - задача оказывается задачей нелинейного программиро-
программирования. Среди нелинейных экстремальных задач выделяют выпуклые задачи,
в которых максимизации подлежат вогнутые функции/0(х) при вогнутых
функционалах ограничений/7 (х) и выпуклой области G.
Методы качественного анализа задач и вычислительные методы решения
существенно зависят от того, является ли G непрерывным или дискретным
множеством. Задачи, в которых G содержит конечное или счетное число
точек, выделены в специальный раздел математического программирова-
программирования — целочисленное или дискретное программирование со своими специ-
специфическими понятиями и своей проблематикой.
В математическом программировании трудности сводятся, главным
образом, к построению экономных вычислительных методов решения
задач. Формализация задач, укладьюающихся в рамки математического
программирования, не связана с принципиальными трудностями - поня-
понятие "приемлемое решение" здесь обычно без труда определяется извне
из содержательных соображений. Совсем иная ситуация возникает при
формализации задач теории выбора решений, связанных с достижением
многих целей, с согласованием интересов группы лиц, с преодолением
конфликтов. Здесь, кроме вычислительных трудностей, появляются труд--
нбсти концептуального характера, связанные с определением понятий
"компромисс", "равновесие", "справедливое решение".
2.2. Приведем формальное описание понятий, в терминах которых мо-
могут быть охарактеризованы задачи и методы непрерьюного математическо-
математического программирования.
Зафиксируем семейство (/, G) задач математического программи-
программирования и снабдим его источником информации об индивидуальных зада-
задачах класса - оракулом О. Оракул определяется множеством X допусти-
допустимых вопросов, множеством У возможных ответов и функцией наблюде-
наблюдения: ф(х,/): X X (/, ?)-> У, приводящей в соответствие каждому вопросу
xElXuo индивидуальной задаче / из рассматриваемого семейства ответ
уег.
Метод S3 численного решения задачи представляет собой набор инструк-
инструкций по формированию очередных вопросов, выбору момента остановки
и построению приближенного решения в зависимости от накопленной
к очередному шагу информации о решаемой задаче. Метод одновременно
"идентифицирует" индивидуальную задачу класса (в окрестности ее реше-
решения) и решает ее. Решение задачи численным методом 59 с оракулом О
происходит итеративно по шагам. На каждом шаге метод "задает вопрос"
х GX оракулу и получает от него ответу = ф(ху/) G У. Каждый следующий
вопрос при осуществлении этой процедуры формируется по предыдущим
вопросам и ответам.
Метод Ж, использующий оракул О для решения задач семейства
(/, G), характеризуется своей трудоемкостью и погрешностью. Трудо-
Трудоемкостью метода 33 на задаче f класса называется число шагов (число
вопросов, задаваемых оракулу), требуемое для решения задачи. Трудо-
Трудоемкостью метода 3d на к/шссе задач называется верхняя грань трудоем-
костей индивидуальных задач семейства. Погрешностью метода 3d на зада-
задаче f класса (т.е. погрешностью результата z метода SB в качестве прибли-
107
женного решения задачи/) называется величина
€ = €(z, /) = max{/,-/0(z), ux - fx(z\ ... ,ur-fr(z)} ,
где /«, — оптимальное значение целевой функции /0(*) в области своего
определения. Погрешностью метода 58 на классе задач называется верх-
верхняя грань по /погрешностей ffi на индивидуальных задачах класса.
Сложностью (информационной) N(e) решения задач класса (/ G) с
помощью методов 58, использующих оракул О и обеспечивающих при-
приближение с погрешностью, не большей е, называется минимальная трудо-
трудоемкость, с которой метод 58 может еще решить любую индивидуальную
задачу / класса с погрешностью, не превышающей е. Другими словами,
сложность (информационная) N(e) класса задач (/, G) — это минималь-
минимальное число / шагов, при котором еще существует некоторый метод 58, ис-
использующий оракул О и решающий задачи класса с трудоемкостью не бо-
более / и погрешностью, не превышающей 6.
23. В [35] оценена информационная сложность различных классов
задач математического программирования. В частности, там аргументиро-
аргументирована бесперспективность поиска универсальных методов решения любых
невыпуклых задач. Информационная сложность класса всех гладких невы-
невыпуклых задач нелинейного программирования f(x)->max\x EG оцешвает-
ся снизу неравенством
/iy/*
N(e)> k)()
Здесь с(п9 к) — некоторая константа, G — единичный шар в Еп, а функ-
функция / дифференцируема на Еп сколь угодно много раз, причем ее частные
производные до порядка к включительно не превосходят по модулю 1 во
всем пространстве. Предполагается, что оракул сообщает значения произ-
производных / всех порядков от 1 до к в любой точке, в которой метод задает
ему вопрос. На практике к обычно невелико, к =1+2 (старшие производ-
производные мы оценивать не умеем). Таким образом, при немалых ли 1/е раз-
разработка метода, годного для любых невыпуклых задач, - безнадежная
затея. Целесообразно разрабатывать специальные методы, учитывающие
структуру и специфику более узких классов задач. Чем уже этот класс,
чем больше особенностей структуры задач может быть учтено, тем больше
шансов на "изобретение" метода приемлемой трудоемкости. Заметим, что
катастрофический рост N(e) с ростом п и 1/е вызван не столько много-
экстремальностью, сколько невыпуклостью рассматриваемого класса
задач. Одноэкстремальность не является еще тем свойством невыпуклых
задач, которое позволяет существенно сократить трудоемкость их решения.
Выделение подклассов нелинейных задач, для которых могут быть разра-
разработаны эффективные методы анализа, должно быть основано на других
структурных свойствах функционалов, определяющих условия задачи.
Класс общих выпуклых задач является достаточно широким классом
задач нелинейного программирования, который характеризуется, прием-
приемлемой трудоемкостью решения. В то же время в этот класс укладываются
многие прикладные задачи.
108
Для класса общих выпуклых задач получены верхняя и нижняя оценки
асимптотики сложности по е -> 0 [66]:
< 2,2] я In- [, € < 1,
6
N(€)> -!-"ln-, e< e(G),
Здесь ] а [ — наименьшее целое число >а, e(G) — зависящая от G вели-
величина погрешности, начиная с которой справедлива нижняя оценка слож-
сложности. Для тел G с "хорошими" геометрическими свойствами (например,
для шаров в пространствах Лебега Lp) сложность Np (e) ограничена сверху
полиномом от 1/е, почти не зависящим от размерности п. График, привел
денный на рис. 6.1, иллюстрирует изменение сложности класса общих
выпуклых задач для случая, когда тело G хорошо аппроксимируется
евклидовым шаром.
В главе VII приведены алгоритмы некоторых эффективных методов
выпуклого программирования, которые могут быть также использованы
как вспомогательные методы для решения задач обобщенного выпуклого
программирования.
2.4. Обсудим теперь подходы к анализу задач дискретного математичес-
математического программирования — задач вида A), в которых множество G со-
содержит конечное или счетное число точек. При конечном числе альтерна-
альтернатив можно всегда выбрать лучший вариант, перебирая альтернативы и
сравнивая их между собой. Однако при немалом числе допустимых вариан-
вариантов перебор требует астрономического числа вычислений. Важно выяснить,
/7 In П -
есть ли надежда построить достаточно общие и эффективные вычислитель-
вычислительные методы точного или приближенного решения массовых вычислитель-
вычислительных задач дискретной математики. Если таких надежд нет, то следует,
по-видимому, разбивать массовые дискретные задачи на все более узкие
классы и строить более эффективные методы, основанные на изучении
особенностей частных подклассов задач. Накопленный опыт и результаты
теории вычислительной сложности, возникшей два десятилетия тому назад,
заставляют склоняться именно к этому выводу.
Известно относительно небольшое число классов дискретных задач,
трудоемкость решения которых растет как полином от размерности задачи
109
(от числа переменных, подлежащих вычислению). Сформулировано огром-
огромное число содержательных классов задач, для решения которых построены
методы с экспоненциальной относительно размерности задачи трудоем-
трудоемкостью, но не найдено методов с полиномиальной сложностью. Больше
того, указано большое число классов задач, так называемых универсаль-
универсальных задач (их насчитьюается уже тысячи и к ним относятся многие часто
встречающиеся на практике комбинаторные задачи) — в некотором смысле
максимально трудоемких. Доказано, что если хотя бы для одного из этих
классов задач будет построен полиномиальный метод решения, то удастся
построить методы полиномиальной сложности для любой задачи дискрет-
дискретного математического программирования. Вопрос о существовании поли-
полиномиально разрешимых универсальных переборных задач четко поставлен
и формализован, но до сих пор не решен. Решение этого вопроса является
одной из важнейших проблем теории вычислительной сложности.
Заметим, что теория информационной сложности нелинейного програм-
программирования и теория вычислительной сложности дискретного программи-
программирования отражают разные аспекты сложности классов задач. Теория
информационной сложности предусматривает идентификацию задачи
в процессе диалога лица, принимающего решение, и оракула. Для задач
нелинейного программирования в общей постановке нет "естественного"
способа выделения индивидуальной задачи класса. В теории вычислитель-
вычислительной сложности нет необходимости в идентификации задачи — в ней рас-
рассматриваются классы задач, для которых просто решается вопрос
о кодировании индивидуальных задач класса. Таким образом, в теории
вычислительной сложности задача считается идентифицированной своим
кодом, но ограничиваются средства, которые можно применять для преоб-
преобразования заданного кода задачи в код решения. Это должен быть алго-
^ ритм; обращение к таблице, (бесконечной) или использование случайного
механизма недопустимы. В теории информационной сложности, напротив,
применяемые средства никак не ограничены, но зато информацию о ре-
решаемой задаче разрешается получать в рамках строго регламентирован-
регламентированного диалога.
§ 3. Математическое программирование в
порядковых шкалах (МППШ)
3.1. Традиционная схема математического программирования, требую-
требующая задания целевой функции - критерия качества выбора - и функциона-
функционалов ограничений, выделяющих область определения задачи, удобная,
привычная, но отнюдь не обязательная составная часть механизма принятия
решения. Многолетний человеческий опыт выбора решений, обобщенный
в различных прикладных дисциплинах, далеко не всегда связывается
с необходимостью указания (даже словесного) окончательной цели выбора
и рамок множества допустимых решений. Решение принимают люди, и для
них часто понятие последовательного предпочтения одного из сравни-
сравниваемых вариантов другому - более естественный путь выбора рациональ-
рациональной альтернативы, чем формулировка цели и приближение к ней. При этом
допустимое множество альтернатив нередко целесообразно задавать не
неравенствами, выделяющими приемлемые варианты, а некоторыми усло-
110
виями предпочтения выбираемых вариантов определенным, заранее задан-
заданным альтернативам. Такие ситуации встречаются, в частности, когда выбор
должен обеспечить достижение ряда целей, а его допустимость определяют
разные лица, ведающие различными ресурсами, ограничивающими выбор.
Так, например (см. [61]), предпочтения в номенклатуре предметов,
удовлетворяющих ту или иную потребность населения, определяются
торговыми организациями, а возможности производства устанавливаются
предпочтениями промышленных предприятий, зависящими от наличного
оборудования и сырья. Рациональный заказ торговых организаций промыш-
промышленности может быть, таким образом, формализован как выбор номен-
номенклатуры предметов заданного назначения, оптимизирующий предпочтения
торговли и учитывающий предпочтения промышленных предприятий,
участвующих в изготовлении заказа. В свою очередь, выявление торговыми
организациями платежеспособного спроса - набора продуктов, предпо-
предпочитаемого той или иной группой населения, производится в результате
наблюдения за предпочтениями потребителей. Обработка этой информации
дает основания для планирования производства, удовлетворяющего спрос.
Аналогичным образом строятся модели, согласовывающие интересы заказ-
заказчиков с возможностями исполнителей в различных отраслях человеческой
деятельности.
Обобщение схемы математического программирования и переход от
моделей, требующих задания функционалов, определяющих цели и огра-
ограничения задачи, к моделям, учитывающим предпочтения лиц, участвующих
в выборе решения, расширяет диапазон приложений теории экстремальных
задач. Специалисты по математической экономике подчеркивают, на-
например, что теория полезности, возникшая в 1870-х годах, была чрезмерно
стеснена приверженностью своих основоположников к таким малосущест-
малосущественным вопросам, как количественная измеримость полезности. Освобо-
Освободившись от этих связывающих ее ограничений и перейдя от количественных
к порядковым понятиям, классическая идея полезности выросла в совре-
современную теорию потребительского предпочтения. Можно ожидать, что
обобщение схемы математического программирования и переход от коли-
количественных шкал к порядковым окажется полезным и в других приложе-
приложениях теории принятия решений.
3.2. Рассмотрим простейший переход от условной экстремальной задачи
в количественных шкалах к задаче в порядковых шкалах.
Пусть G — некоторое фиксированное компактное множество в Еп,
Л/,/ = 0,1,... ,г, - рефлексивные, транзитивные и полные бинарные от-
отношения на шаре, содержащем G, — предпочтения. Ro — предпочтение
лица, принимающего решение,Л/, /= 1,... , г, могут интерпретироваться
как предпочтения лиц, ограничивающих каждый по-своему множество до-
допустимых планов. Некоторые из отношений Rj могут определяться обыч-
обычными функциональными неравенствами, ограничивающими диапазоны
изменения различных компонент решения.
Обозначим через ujj = 1,..., г, заданные априори точки G и будем
считать, что план хЕ G допустим по /-му ограничению, если xRjUj. Соот-
Соответственно назовем точку xGG допустимым решением, если R
111
Задача математического программирования в порядковых шкалах
(МППШ) представляет собой задачу выбора "наилучшего" (в смысле би-
бинарного отношения Ro — см. гл. V) среди допустимых решений. В ней
требуется найти х* такое, что
x*Rox\xRfuh x*Rftih j G 1777 х.х* G G. A)
Другая запись задачи математического программирования в порядковых
шкалах, допускающая различные обобщения, имеет вид
х > max \xRjtij, /Gl,r, x G G. B)
Ro
Пусть 3) — множество допустимых точек:
Предположим, что 3D Ф ф, т.е. множество допустимых решений задачи B)
непусто. Выберем некоторую метрику ||-|1 в Еп и обозначим через
Pl|.jl(jc) расстояние (в метрике ||-||) от точки хдо множества G* решений
задачи B).
Приближенное (с погрешностью не более е) решение х задачи B) есть
любая точка х € 2), не худшая (в смысле Ro) наихудшей точки jtjj'й мно-
множества G*. Здесь Gl- {xG 3)\р\\.\\(х)<е} - бюкрестность мно-
множества G* точных решений (в SD) задачи B).
Вряд ли можно ожидать разработки процедуры приемлемой трудоем-
трудоемкости для произвольных задач математического программирования в по-
порядковых шкалах. В § 2 было указано, что для достаточно широких
классов нелинейных задач традиционного математического программиро-
программирования не существует методов приближенного решения, трудоемкость
которых приемлемым образом растет с ростом размерности задачи. Для
дискретных экстремальных задач существование таких методов также
весьма проблематично. Этот вывод естественно переносится и на задачи
математического программирования в порядковых шкалах. В связи с этим
мы ограничимся рассмотрением выпуклого математического программиро-
программирования в порядковых шкалах, т.е. задач, в которых множество G выпукло,
а предпочтения Л,-,/GO, г, определяющие условия задачи B), вогауты.
Для таких задач в гл. VIII разработан диалоговый метод решения - про-
процедура, позволяющая по последовательно предъявляемым (в соответствии
с требованиями метода) альтернативам и получаемой локальной информа-
информации о предпочтениях Rj на соответствующих парах вариантов получить
е-приближенное решение задачи. Там же приводится оценка трудоемкости
метода, которая оказывается вполне приемлемой. При расширении
понятия "оптимизация по бинарному отношению", приведенном в гл. V,
и соответственно при расширении понятия "е-оптимальное по Ro решение"
(см. гл. VIII) удается обобщить метод решения выпуклой задачи матема-
математического программирования в порядковых шкалах на случай произволь-
произвольных (нерефлексивных, неполных и нетранзитавных) бинарных отношений.
112
§ 4. Обобщенное математическое программирование (ОМП)
4.1. Выбор рационального решения интуитивно связан с так или иначе
понимаемой оптимизацией. В простейшем случае, когда задан показатель
качества решения — шкала, устанавливающая полезность каждой допусти-
допустимой альтернативы, возникаю? лишь технические задачи, связанные с вы-
вычислением максимума или минимума функции того или иного класса
на допустамом множестве альтернатив. Как мы уже видели, изучение
моделей и методов решения условных экстремальных задач - предмет
ставшей уже классической дисциплины — математического программиро-
программирования вместе с его динамическими и стохастическими версиями.
К анализу моделей математического программирования сводится реше-
решение задач проектирования технических систем вполне определенного назна-
назначения. В рамки математического программирования укладываются задачи
планирования при четко сформулированном критерии качества плана.
Наконец, математическое программирование может быть использовано
в качестве аппарата синтеза одноцелевых систем управления. Однако
в исследовании теоретических проблем экономики, социологии, военного
дела и других дисциплин, связанных с выбором рациональных решений,
роль традиционного математического программирования более скромна.
В экономической теории возможности математического программирова-
программирования ограничены изучением экономической системы, управляемой единой
волей и контролирующей все аспекты решений. Такая хозяйственная
система описывается моделью экономики Робинзона Крузо. В реалисти-
реалистических моделях экономики развитие системы определяется интересами
многих лиц. Каждый участник хозяйственной системы — производитель
и потребитель — имеет свои представления о наилучшем распределении
ресурсов и благ. Основная задача экономической науки - разработка
путей "рациональной" организации системы, установление "равновесных"
"справедливых" норм распределения благ — не укладывается в рамки
классической теории математического программирования. Еще более
сложна проблема "справедливого" распределения прав и обязанностей
в общественных науках. Выбор "компромиссных" групповых решений
требует принципиально новых подходов, существенно более широких
и гибких, чем в традиционной теории оптимизации. Аналогичные трудности
возникают при проектировании многоцелевых систем. Современные слож-
сложные системы, обеспечивающие производство и управление, предназначены
для решения разнообразных задач и должны удовлетворять многим, порой
взаимоисключающим, требованиям. Как в каждом отдельном случае
агрегировать критерии качества системы, отражающие различные цели,
поставленные перед ней, - одна из важнейших задач теории принятия
решений. Задача еще больше усложняется, когда выбор решений происхо-
происходит в конфликтной ситуации и каждый участник конфликта своими дейст-
действиями не способен определить значения всех переменных, влияющих на
достижение его целей. "Игровые" проблемы являются не только разделами
теории конкурентной экономики, военной науки и дипломатии. В том
или ином виде они встречаются при решении различных задач организации
производства, проектирования технических систем, управления техноло-
технологическими процессами.
8. Д.Б. Юдин 113
4.2. Как видим, в основе различных разделов теории принятия решений
лежат такие понятия, как равновесие, компромисс, справедливость. Мы,
конечно, далеки от мысли выразить человеческие ценности и общественные
идеалы числом. Разработка и совершенствование шкалы ценностей - сти-
стимулов человеческого поведения — не является задачей математики, точнее,
является задачей не только математики.. Это главная проблема науки,
искусства, морали, связанная со смыслом человеческого существования.
Тем не менее нам представляются возможными обобщения понятий и вы-
вычислительных методов оптимизации, расширяющие круг прикладных
задач, для которых могут быть получены рациональные решения, отвечаю-
отвечающие историческому опыту и интуиции специалистов.
Настоящий параграф посвящен обобщенному математическому прог-
программированию — методологии, которая распространяет принципы и методы
традиционного математического программирования, предполагающего
скалярные критерии качества и функционалы ограничений, на случай
векторных критериев и векторных ограничений. В отличие от традиционной
теории оптимизации схемы обобщенного математического программиро-
программирования (ОМП) не оценивают допустимость и качество каждой альтернативы,
а приближаются к решению в процессе сравнения пар альтернатив. Оптими-
Оптимизация и ограничения в ОМП трактуются в терминах бинарных отношений,
в частности, в терминах отношений предпочтения. В общем случае оптими-
оптимизация и ограничения по бинарным отношениям определяются неоднозначно.
Интерпретация этих понятий зависит от содержательного смысла условий
задачи и свойств бинарных отношений, по которым производится оптими-
оптимизация или выделение допустимых альтернатив.
Во многих случаях ОМП представляет собой естественный подход к чис-
численному решению многокритериальных задач, к принятию групповых
решений и к анализу конфликтных ситуаций. Предлагаемый подход к вы-
выбору решений существенно учитывает предпочтения лиц, принимающих
решение (ЛПР). При этом предполагается, что каждый участник процесса
принятия решений индуцирует на множестве альтернатив некоторые би-
бинарные отношения и сохраняет их в процессе решения задачи.
4.3. Формальная запись модели ОМП - естественного обобщения схемы
традиционного математического программирования и расширения модели
математического программирования в порядковых шкалах — имеет вид
/0(х) -* тах(Д0) I//(*)*/«/, j € Г7 х EG QE*.
При стандартных определениях оптимизации по бинарному отношению
приведенная запись означает следующее. Требуется вычислить вектор- х*
такой, что
п
ff(x)Rfi4h j Е ТГ7 х, х* Е G С Еп
Здесь ft (х), /GO, г, - вектор-функции в Ет*9 и,- - фиксированный вектор
в /ГШ/, Rj9 j Е 0, г, — бинарные отношения на G ? Еп.
В соответствии с замечаниями § 1 гл. V понятия оптимизации по бинар-
бинарному отношениюR0 {jcGG|/o(jc)-^max(/?o)} и ограничений по бинарно-
бинарному отношению Rj {xEG\fj (x)Rj щ } могут быть расширены и использова-
114
ны следующим образом.
{* е G\fo(x)-+ тах(Л0)> "~
<=> {х ег&\\fyec s?o
lx G G\ff(x)Rfuf) ~ {x Q o
для одного из значений к = 1 -г 4. Определения множеств S% (•) см. в § 1
гл. V. Под оптимизацией по бинарному отношению можно также понимать
(R, С) оптимизацию (см. п. 1.5 гл. V).
Выбор типа оптимизации и ограничений определяется содержательными
особенностями задачи.
Ясно, что в приведенные схемы укладываются многие задачи теории
принятия решений и среди них —задачи, для которых до сих пор не было
конструктивных методов анализа.
Замена вектор-функции fo(x) на скалярную функцию, оптимизации
по бинарному отношению Ro - на естественную скалярную оптимизацию,
вектор-функций//(*), /€ 1, г, - на скалярные функции, а ограничения
по Rj — на обычные скалярные неравенства переводит модель ОМП
в традиционную модель математического программирования. При
= x, /€Е0, г, модель обобщенного математического программирова-
программирования переходит в модель математического программирования в порядковых
шкалах. Заметим, что любой задаче ОМП можно привести в соответствие
некоторую эквивалентную задачу математического программирования
в порядковых шкалах, если заменить бинарные отношения /fy, /G 0, г,
на Rj по формулам
¦* xRoy; ff(x)Rfuf <=> xRfuh j E 177
Многие прикладные задачи теории принятия решений могут быть постав-
поставлены как в терминах математического программирования в порядковых
шкалах (МППШ), так и в терминах обобщенного математического програм-
программирования (ОМП). Выбору объекта, производимому при непосредствен-
непосредственном сравнении пар объектов, отвечает модель МППШ. Выбору объекта,
основанному на сравнении его характеристик, соответствует модель ОМП.
Структура модели МППШ существенно проще структуры модели ОМП.
Однако размерность вектора х, определяющего объект, обычно сущест-
существенно выше размерностей векторов-характеристик, по которым оцени-
оценивается качество и возможности реализации объекта. Выбор модели, форма-
формализующей задачу принятия решений, зависит, кроме того, от свойств век-
вектор-функции fj (х), / G 0, г, и бинарных отношений /?/ и /?у, /GO, r.
4.4. В традиционном математическом программировании конструктив-
конструктивные методы решения разработаны для непрерывных выпуклых задач
и дискретных задач с полиномиальной сложностью. Показано, что слож-
сложность класса невыпуклых задач экспоненциально растет с ростом размер-
размерности задачи. Имеются серьезные основания ожидать, что для большинства
дискретных экстремальных задач не существует методов решения, слож-
сложность которых растет полиномиально с ростом размерности задачи. Следует
полагать, что аналогичные трудности возникнут и при разработке методов
8* 115
решения задач ОМП. По-видимому, методы приемлемой трудоемкости
можно разработать только для тех классов задач ОМП, в которых характе-
характеристики вектор-функций fj (х), области определения решения G и исполь-
используемых бинарных отношений Rj удовлетворяют некоторым специальным
требованиям. Так, конструктивные методы анализа непрерывных задач
ОМП построены для случаев, когда составляющие вектор-функций fj(x) —
линейные или.вогнутые функции, G — выпуклое множество, а бинарные
отношения Rj - непрерывные, вогнутые, монотонные и регулярные пред-
предпочтения.
Напомним, что бинарные отношения представляют собой предпочтения,
если они рефлексивны, транзитивны и полны. Бинарное отношение непре-
непрерывно, если множество {(x9y)\xRy } замкнуто в G X G. Полное отноше-
отношение R на выпуклом множестве G называется вогнутым, если \f xyy9 z Е G
таких, что гФуи nz-выпуклаякомбинациями, у, из xRy следует zRy.
В содержательных терминах вогнутость бинарного отношения требует,
чтобы каждый элемент на отрезке предпочитался худшему из концов.
Бинарное отношение R монотонно, если из х>у следует xRy. Отноше-
Отношение R регулярно, если множество точек, эквивалентных х (в соответствии
с отношением эквивалентности, порожденным /?), не имеет внутреннос-
внутренности Wx G G.
Модели ОМП с выпуклыми множествами G, вогнутыми fj(x) и вогну-
вогнутыми бинарными отношениями Rj будем называть моделями обобщенного
выпуклого программирования (ОВП). Заметим, что к моделям ОВП
могут быть сведены задачи ОМП с определенным образом согласованными
между собой невогнутыми бинарными отношениями Rj и невогнутыми
вектор-функциями fj(x). Бинарные отношения Rj соответствующей задачи
математического программирования в порядковых шкалах должны быть
вогнуты.
Для решения задач ОВП и, в частности, задач обобщенного линейного
программирования (ОЛП) разработаны экономные вычислительные мето-
методы и оценена их трудоемкость. Предложенные методы удается обобщить
и приспособить для решения задач ОМП, в которых можно отказаться от
требования рефлексивности, транзитивности и полноты бинарных отно-
отношений Rj . Однако в непрерывных задачах ОМП требования вогнутости
fj и Rj (или определенной согласованности характеристик fj и Rj, позво-
позволяющей считать задачу выпуклой) необходимо сохранять. По-видимому,
только в этом случае можно гарантировать приемлемый рост трудоемкости
решения задач с возрастанием их размерности. Выделение задач ОМП,
определяемых вогнутыми бинарными отношениями со специальными
свойствами, позволяет упростить соответствующие методы анализа.
Что касается дискретных задач ОМП, то здесь возникают те же пробле-
проблему, что и в традиционном дискретном математическом программирова-
программировании. Всякое продвижение в целочисленном программировании естествен-
естественным образом переносится и на обобщенное целочисленное программиро-
программирование (ОЦП).
45. Разработанные методы ОМП упрощаются и могут быть эффективно
использованы для анализа рациональных схем многокритериальной опти-
оптимизации, отвечающих случаю, когда агрегирование частных критериев
производится в соответствии с предпочтениями лица, принимающего реше-
116
ние. Схема многокритериальной оптимизации может быть получена из мо-
модели ОМП, если исключить из нее векторные ограничения — ограничения
Bnmfj(x)Rjitj - и сохранить лишь стандартные скалярные ограничения -
неравенства вида ?/(х)<0. В задачах выпуклой многокритериальной оп-
оптимизации ряд технических трудностей, связанных с решением задачи
ОВП, отпадает. Больше того, громоздкие процедуры решения задачи ОВП
становятся здесь гораздо более прозрачными.
Заметим, что в многокритериальных задачах так же, как и в ОВП, метод
эллипсоидов, используемый в качестве вспомогательного инструмента,
может быть заменен методом симплексов (см. гл. VII, § 1,4). При этом,
однако, несколько ухудшаются теоретические оценки трудоемкости про-
процесса поиска решения - число обращений к оракулу, гарантирующее реше-
решение задачи с погрешностью, не превышающей заданную, увеличивается.
Имеются, тем не менее, интуитивные основания ожидать, что в практичес-
практических расчетах этот эффект, как правило, не будет сказываться. Классичес-
Классический симплексный метод линейного программирования теоретически пред-
представляет собой метод с экспоненциальной вычислительной сложностью.
Однако на практике он не только нр уступает методу эллипсоидов - методу
с полиномиальной сложностью, но обычно (при немалой размерности
задачи) существенно превосходит его. По-видимому,если оценивать трудо-
трудоемкость процедур решения задач не по наихудшему случаю, а в "среднем",
определенным в соответствии с распределением "встречающихся" задач,
расхождение между теоретическими и практическими оценками исчезнет.
Заметим, что выбор лучшего метода решения многокритериальной
задачи, использующего предпочтения ЛПР, представляет собой, в свою
очередь, многокритериальную задачу. Трудоемкость метода определяется,
с одной стороны, числом вопросов к ЛПР, сравнивающему векторы пока-
показателей качества на различных планах, и, с другой стороны, числом обра-
обращений к оракулу, определяющему значения (и градиенты) функций
fj(x) и gi(x) на предъявляемых ему планах. Автор, выступающий здесь
в роли ЛПР, выбрал в гл. IX—XII лексико-графический подход к оптими-
оптимизации метода. От метода, в первую очередь, требовалась субоптимальность
по числу вопросов к ЛПР, и при этом условии число обращений к оракулу
следовало по возможности сократить. Предполагалось, что творческая
работа ЛПР. требует серьезного методологического и технического обеспе-
обеспечения и является существенно более трудоемкой, чем работа оракула,
определяющего' локальную информацию о функциях//(х) и ft(x).
Заметим в заключение параграфа, что методы решения задачи ОВП
и соответственно ее частного случая — специальной постановки многокри-
многокритериальной задачи - подробно изложены в гл. X, XI применительно к реф-
рефлексивным, транзитивным и полным бинарным отношениям. Там же
методы обобщены и конспективно описаны применительно к произволь-
произвольным вогнутым бинарным отношениям. В необходимых случаях, когда
при естественных определениях оптимума по бинарному отношению за-
задача ОВП не имеет решения, понятие оптимизации по бинарному отноше-
отношению обобщается в соответствии с соображениями, изложенными в гл. V.
Общая идея методов решения задач ОВП при этом сохраняется.
117
§ 5. Многошаговые задачи
обобщенного математического программирования
5.1. Как мы видели (см.. гл. III), общий подход к принятию решений,
способный выразить любую концепцию выбора, определяется функцией
выбора (ФВ) — теоретико-множественным отображением, позволяющим
выделить из всех возможных решений в данной ситуации (для данного
предъявления) приемлемые решения. Различные уточнения функций выбо-
выбора, такие, как динамическая ФВ, стохастическая ФВ, параметрическая ФВ,
условная ФВ, позволяют учесть специфику условий выбора и упрощают
запись соответствующих процедур принятия решения. Функции выбора
могут быть выявлены по результатам наблюдений за фактически
осуществляемым опытными специалистами выбором. ФВ могут быть также
заданы системой аксиом, формулирующих требования к рациональному
выбору. Наконец, ФВ могут быть определены механизмами выбора — вы-
вычислительными процедурами принятия решений.
В практических ситуациях число потенциально возможных предъявле-
предъявлений, отвечающих задачам фиксированного класса, астрономически велико.
Поэтому задание ФВ таблицей нереально. Автоматизация выбора требует
задания механизма выбора - вычислительного метода, реализующего
соответствующую ФВ для всевозможных предъявлений. В связи с этим
возникает задача представления произвольной функции выбора реализую-
реализующим ее механизмом. В главе III рассматривались частные механизмы
выбора, реализующие различные ФВ. Классический механизм выбора —
условная или безусловная оптимизация некоторого скалярного показа-
показателя качества решения — реализует весьма узкий класс ФВ. Более широ-
широкий класс функций может быть реализован оптимизацией по бинарному
отношению, схемой математического программирования в порядковых
шкалах и -моделью обобщенного математического программирования.
В гл. III—IV приведены компактные условия, которым должна удовлет-
удовлетворять ФВ для того, чтобы ее можно было воспроизвести оптимизацией
по скалярному критерию или по бинарному отношению. Для приложений,
однако, важно указать класс механизмов, которые реализуют произволь-
произвольную ФВ, отвечающую, по крайней мере, конечному числу альтернатив.
Последняя оговорка, впрочем, несущественна, поскольку на любом ком-
компактном множестве можно заменить ФВ ее е-аппроксимацией, отвечающей
конечному числу альтернатив и отличающейся от исходной ФВ (в метрике
Хаусдорфа) не более, чем на заданную величину е.
5.2. В [70] предложена многошаговая схема обобщенного математичес-
математического программирования (МнОМП), реализующая произвольную функцию
выбора на конечном множестве вариантов.
Схема МнОМП предполагает некоторое расширение понятия "задача
ОМП" и соответственно ее частного случая задачи МППШ. Это расширение
сводится к тому, что допустимое множество решений разрешается полу-
получать из множеств решений, выделяемых отдельными ограничениями за-
задачи (xRjUj),ne только их пересечением, но и их объединением. В связи
с этим будем записывать задачу МППШ (одношаговую) в виде
Opt*o (Z) | Z = П U Adm*f/t Ual(X),
118
где
Admn^if^W- ix e X\Vu G Us1 xRsfu)
— множество допустимых по ограничению с номером sj решений- из мно-
множества X. Здесь X&G — предъявление, Usj — заданное множество пара-
параметре» и (Adm — admissible — допустимый).
Предполагается, что понятие "оптимизации по бинарному отношению
Ко " (OptRo(Z)) фиксировано в соответствии с любым из определений,
введенных в гл. V. Это может быть, например, оптимизация по домини-
доминированию:
х е Opt^mW ~ (х € X) Л (Vy е X xRy)9
или оптимизация по блокировке:
|J =» (х е X)A(\fy е X yRx),
или, в более общем случае, (R, С)-оптимизация. Аналогичным образом
рассматриваются различные варианты допустимости Adm^ ц (X). (На-
(Напомним, что понятия оптимизации по доминированию и по блокировке
двойственны в том смысле, что
Аналогично
Admji
Перенумеровывая в записи задачи МППШ пары sj числами р, получим
Z=nUAdm* и (XX
р И И
и одношаговая задача МППШ принимает вид:
Аналогичным образом можно записать расширенную задачу ОМП:
Opt&o (Z) | Z = Пи ?
где, если под оптимизацией по Ro и допустимостью по Лр, f/p понимать,
например, оптимизацию и допустимость по доминированию
i
Так же, как и в § 4 настоящей главы, можно в соответствии с замечания-
замечаниями § 1 гл. V расширить определения оптимизации и допустимости, заменив
их оптимизацией по включению и ограничениями по включению множеств
Sr (/о(*)) и Sr (fp(x))> определяемых бинарными отношениями R0 и
Лр.°Выбор типа оптимизации и допустимости устанавливается особенностя-
особенностями постановки задачи — характеристиками используемых бинарных отно-
отношений и областей их определения.
119
Наиболее широкие определения оптимизации и допустимости по бинар-
бинарному отношению — это (R, С)-оптимизация и, соответственно, (R, С)-до-
С)-допустимость.
Схеме ОМП соответствует та же запись, что и для задачи ОМП, но в ней
предъявление X — произвольное подмножество множества G. Таким обра-
образом, схема ОМП представляет собой множество задач ОМП, каждая из ко-
которых отвечает фиксированному предъявлению X Таким же образом бу-
будем различать задачу и схему для других механизмов выбора.
Решению задачи ОМП соответствует, вообще говоря, некоторое множест-
множество вариантов. Чтобы сократить его, можно использовать некоторые другие
ограничения и некоторое другое оптимизирующее отношение. Решение
исходной задачи ОМП может быть принято в качестве входа (предъявле-
(предъявления) для другой задачи ОМП. Эти рассуждения можно продолжить. Таким
образом приходим к последовательной многошаговой схеме ОМП. На шаге
Г, t = 1,... Д, решается задача
Rp", t$
At)
где x(*"~l) — результат предыдущего шага, X^ = X. Последовательная
схема — это суперпозиция задач ОМП. Последовательная схема не реализует
все функции выбора. В частности, в рамках последовательной схемы не мо-
могут быть сформулированы некоторые экстремальные задачи. К ним отно-
относится задача о минимаксе. Недостаток последовательной схемы можно
устранить, если разрешить использовать на шаге t результаты любых преды-
предыдущих шагов:
Z«> = DU Adm4?) „(,)(*<'*>>), tp < t,
р *р ,Up
где Х^*р) - результат шага tpi tp < t, X^ = X - предъявление. Результа-
Результатом многошаговой задачи является Х^к'.
Обозначим через Jt множество всех tp таких, что Х^*Р* используется на
шаге t. Набор/ = (/1э...,/*) будем называть информационной структу-
рой схемы. Для последовательной структуры (ПсОМП) /r= {t — 1} , 7 Е
G 1Д; для параллельной структуры (ПрОМП) Jx =J2 = ... =Jh- i = ( 0 },
Jk = {1,..., k — 1}; для последовательно-параллельной структуры
(ПсПрОМП) Csь:.., sp, 1 < st < .. .< s, = k - 1) Jx = {0},/,/+1 =
= {0} (i = 1,/- I),/* = { S\9... ,Si),Jt = { f - 1} в остальных случаях;
для древовидной структуры (ДрОМП) C s, I < s < k — 1) J i =...=/,=
= { 0}, каждое/ = l,k— 1 входит ровно в одно множество Jt, t >/.
5.3. Выделим из всех функций выбора С(Х) класс 2° функций, обла-
обладающих свойством (п. 4.2 гл. III)
Для содержательных функций выбора это свойство естественно и неустра-
неустранимо.
120
Обозначим через МнОМП (Q) класс многошаговых схем, использующих
бинарные отношения только из класса Q. Будем рассматривать 4 класса
отношений L, W,Ph R(L С W CP CR); строгого порядка, слабого поряд-
порядка, качественного порядка и произвольных отношений.
Имеют место следующие утверждения [70]:
Теорема 1. Класс МнОМП (W) реализует любую ФВ из 2°.
Теорема 2. Класс МнОМП (L) реализует любую однозначную ФВ из 2°
(т.е. любую ФВ, выбирающую из каждого предъявления не более одного
варианта).
(Здесь мы расширили понятие однозначной функции выбора по сравне-
сравнению с классом 21 (гл. III), допустив пустой выбор, чтобы учесть возмож-
возможность неприемлемых вариантов.)
Усилить теорему 1, заменив W mL, нельзя.
Укажем, при каких информационных структурах класс многошаговых
схем ОМП реализует произвольную ФВ из 2 ° и приведем оценки энтропии
Нп(К) = log2 IК ^ |, где | А" № | - число всюду определенных ФВ над л-эле-
ментным множеством G, реализуемых многошаговыми схемами класса
К (доказательства этих утверждений приведены в [56,70]).
Теорема 3. Класс МнОМП (Q) реализует произвольную функцию выбора
из 2° при любом QDW. Для него Нп (МнОМП) ~ п 2п.
Теорема 4. Класс ПсОМП реализует не все ФВ из 2°. Для него
- п2 log2 п ^ Нп (ПсОМП) <? п2 log2 п.
4
Теорема 5. Класс ПрОМП реализует не все ФВ из 2°. Для него
Нп (ПрОМП) - У— • 2п~ *.
Эта оценка справедлива для ПрОМП (Q) при любом Q ^ W.
Теорема 6. Класс ПсПрОМП реализует любую ФВ из 2°. Для него
Яя(ПсПрОМП) ~п2п~1.
Однако класс ПсПрОМП обладает меньшими "функциональными возмож-
возможностями" по сравнению с классом МнОМП: если ограничиться отношениями
из W, класс ПсПрОМП (W) уже не может реализовать все ФВ из 2°. Для
ПсПрОМП (W)
Нп (ПсПрОМП(W)) - У — 2п~J.
7Г
Если же заменить класс W слабых порядков на класс Р качественных
порядков и даже полупорядков, то механизмами из ПсПрОМП (Р) ока-
окажется возможным реализовать любую ФВ из 2°.
Теорема 7. Класс ДрОМП обладает равными функциональными возмож-
возможностями с МнОМП (оба реализуют все ФВ из 2° при одних и тех же Q).
Для него
В классе, одношаговых схем ОМП реализуется лишь малая доля ФВ
из 2°. Для него
#„(ОМП) -я2.
121
5.4. Обозначим через г E) число шагов многошаговой схемы S и назо-
назовем сложностью ФВ CG 2° в классе МнОМП (Q) величину
tq(C) = min{rE)| SGMhOMII (Q): Cs = C],
где С$ означает ФВ, реализуемую схемой S.
Под сложностью класса механизмов МнОМП (Q) будем понимать ве-
величину
где 2°и) - множество всех ФВ из 2° над «-элементным множеством G.
Имеет место
Теорема 8. Для любых Q,Q2 W, существуют константы сх и с2 такие,
что
Чтобы изучить поведение сложности классов ФВ на неполном множестве
предъявлений SC2G, на котором они заданы (наблюдаются), введем
функции
- мощность множества $. Запись 58(О = Л означает, что
множество допустимых предъявлений ФВ совпадает со множеством 59.
Будем считать, что N является некоторой функцией п и -растет вместе с
п. Все неравенства, в которых участвуют функции от л, предполагаются
выполненными, начиная с некоторого п. Утверждение, что почти все объек-
объекты, зависящие от параметра л, удовлетворяют некоторому свойству, озна-
означает, что доля тех объектов, которые этим свойством не обладают, стре-
стремится к нулю с ростом л.
Имеет место
Теорема 9. Для любых классов отношений Q, QD W.
1°. Существует константа сх такая, что почти для всех множеств предъяв-
предъявлений 59 с параметрами (п, N)
, п, N)<cx(log2n + \og2N).
2°. Если N при некотором с удовлетворяет условию N> cn\og2n, то
существует с2 такая, что почти для всех множеств 58 с параметрами (п, N)
Сужение класса схем МнОМП до его подклассов с последовательно-
параллельной или древовидной информационной структурой не приводит
к существенному увеличению сложности класса механизмов: порядок
оценок не меняется.
Заметим, что теоремы 1 - 9 доказаны в [57, 70] конструктивно. Идея
построения схемы МнОМП (W) для произвольной ФВ С € 2° (и схемы
МнОМП (L) для однозначной ФВ) состоит в следующем. Рассматривается
функция С<*) (X), описывающая выбор объекта х е G (без учета правиль-
правильности выбора остальных объектов). С помощью операций пересечения и
объединения производится декомпозиция СХ(Х) на "фрагменты", в каж-
каждом из которых выбор объекта х зависит от других объектов у € X мо-
122
нотонно (наличие у способствует выбору*) или антимонотонно (наличие у
запрещает выбор х). Антимонотонная зависимость реализуется в схеме
путем оптимизации по подходящему отношению, а монотонная — посред-
посредством последовательной оптимизации по паре отношений. На этой основе
строится реализация для С***, а различные С^,x€G, совмещаются в
одну функцию С путем объединения при подходящем выборе ограни-
ограничений. Все построения проводятся с помощью логического (булева) пред-
представления ФВ и механизмов выбора [51, 52]. Схема доказательств теорем
1 и 2 будет приведена в п. 3.4 гл. XII.
5.5. Построение механизма выбора (схемы МнОМП) производится на
основе информации о выборе на ограниченном множестве 53C2G предъяв-
предъявлений. Сам же механизм выбора предполагается использовать при произ-
произвольных предъявлениях X Q G. Представляет интерес оценка качества
прогноза выбора в тех ситуациях, в которых он не наблюдался.
В главе XII на основе вероятностных неравенств Хеффдинга [85] для
сумм независимых случайных величин и их интерпретации в терминах
распознавания образов [14], получены (при некоторых приемлемых пред-
предположениях) оценки достаточного числа наблюдений за качеством реализа-
реализации ФВ "механизмом заданного класса, позволяющие судить о качестве
воспроизведения ФВ на произвольных предъявлениях. Чем более универ-
универсальным является механизм, тем больше информации он требует для своего
построения. Наоборот, чем меньше энтропия Н„(М) класса М механизмов
(чем уже его возможности), тем меньшим может быть объем выборки,
позволяющий по качеству реализации ФВ на контрольных предъявлениях
судить о качестве реализации ФВ на произвольных предъявлениях из G.
Как мы видели, энтропия классов многошаговых схем с различными ин-
информационными структурами достаточно велика. Это значит, что для пост-
построения схемы МнОМП с немалым числом шагов, восстанавливающей ФВ
с заданной точностью, требуется чрезмерно много наблюдений за реализа-
реализациями ФВ. Кроме того, вычислительная сложность решения задач МнОМП
быстро растет с увеличением числа шагов т. В связи с этим возникает проб-
проблема аппроксимации ФВ функциями, реализуемыми более простыми ме-
механизмами, такими, например, как схема безусловной оптимизации по би-
бинарному отношению, одно- и двухшаговая схема ОМП. Эти вопросы обсуж-
обсуждаются в гл. XII при рассмотрении вычислительных методов многошаго-
многошагового математического программирования.
§ 6. Актуальные зада<и теории выбора решений
6.1. В сколь-нибудь сложных ситуациях, когда цель выбора нельзя вы-
выразить единственным критерием, принятие решений существенно зависит
от шкалы ценностей лица, принимающего решение. До сих пор мы выра-
выражали субъективные установки ЛПР его предпочтениями — бинарными от-
отношениями, индуцированными на множестве альтернатив. Рассматриваемые
далее вычислительные методы принятия решений предполагают несвой-
несвойственные творческой личности в значительной мере рутинные обязанности
ЛПР. Методы ОМП и МнОМП требуют от источника информации многократ-
многократного сравнения пар объектов (альтернатив) или набора их характеристик.
При этом допускается, что ЛПР сохраняет индуцированные им бинарные от-
отношения в течение всего процесса подготовки и принятия решения.
123
Последнее предположение воспринимается критически многими специа-
специалистами, хотя современная теория экспертных оценок и теория выявленно-
выявленного спроса основаны на аналогичных допущениях. Чтобы устранить или по
крайней мере ослабить основания для критики принятого подхода к выбо-
выбору решений в сложных ситуациях, следовало бы исключить из схемы ОМП и
МнОМП рутинные задачи ЛПР и снизить требования к чрезмерной стабиль-
стабильности характеризующих его бинарных отношений.
В относительно простых одноцелевых задачах принятия решений, в кото-
которых критерий качества решения и ограничения на характеристики решения
заданы (по крайней мере, в содержательных терминах), нет необходимости
различать ЛПР и оракул - источник информации о функциях, определяю-
определяющих условия задачи. В этом случае решение полностью определяется объек-
объективными условиями задачи. Здесь требуется лишь источник информации о
характеристиках решения и нет места для проявления субъективных уста-
установок ЛПР.
Другое дело - многокритериальные задачи, групповые решения или вы-
выбор стратегии поведения в конфликтной ситуации. В таких задачах, помимо
условий, определяемых объективными характеристиками допустимых ре-
решений, необходимы еще соображения о способе согласования различных
порой противоречивых требований к решению. Мы уже указывали, что в
этом вопросе нет, да и не может быть единого приемлемого для всех под-
подхода. Компромисс определяет ЛПР, наделенный правами и ответствен-
ответственностью. Формальные методы обеспечивают при этом лишь логическую не-
непротиворечивость решений ЛПР. Формальные методы позволяют, кроме то-
того, прогнозировать последствия тех или иных решений ЛПР при заданных
сценариях эволюции условий задачи.
В задачах традиционного математического программирования предпола-
предполагается диалог метода (вычислителя или ЭВМ) с оракулом — источником
информации - экспертом или имитационной моделью. Число вопросов
метода может быть достаточно большим. Естественно, что и в сложных
задачах принятия решений необходим оракул - источник информации
об объективных характеристиках условий задачи - и он должен быть го-
готов отвечать на многочисленные вопросы метода. ЛПР — обычно руководи-
руководитель соответствующего ранга - несет ответственность за принципы согласо-
согласования требований к решению. Число вопросов, которые могут быть ему
заданы, должно быть ограничено, и ответы на них должны дать основание
методу (вычислителю или ЭВМ) обеспечить решение задачи.
6.2. Наметим целесообразную с нашей точки зрения, но далеко не пол-
ностью выполненную программу исследований, позволяющую ослабить
требования к ЛПР, сохранив за ним лишь творческие задачи.
Мы установили соответствие между функциями выбора и задачами
МнОМП. Любой функции выбора на конечном множестве альтернатив от-
отвечает (причем не единственным образом) схема МнОМП. Для любой ФВ
на компактном множестве альтернатив , это соответствие приближенное.
Оно может быть обеспечено с любой заранее заданной степенью точности.
Таким образом, любую заданную концепцию выбора можно реализовать с
помощью конструктивно определяемого ею механизма выбора - схемы
МнОМП.
124
С другой стороны, рациональный в том или ином смысле выбор, те или
иные не противоречащие опыту, интуиции и логике понятия "равновесие",
"компромисс", "справедливость" могут быть определены с помощью со-
соответствующей системы аксиом, фиксирующих постулируемые свойства
этих понятий. "Классические" условия рационального выбора - приемле-
приемлемые свойства ФВ приведены в § 1 гл. IV. Из литературы известны много-
многочисленные аксиоматические определения устойчивого выбора, справедли-
справедливого компромисса. Так, в работах Кини и Райфы [20], Миркина [33],
Кемени и Снелла [19] и других приводятся системы аксиом, по-разному
определяющие понятия рационального агрегированного критерия в много-
многокритериальной задаче или компромиссного выбора в задаче группового
решения. В монографии Неймана и Моргенштерна [37], а в последние го-
годы—в работах Вилкаса [15] и Воробьева [16] и многих других аксио-
аксиоматически определяются понятия равновесия для игр различной структу-
структуры. Можно соглашаться или не соглашаться с аксиоматическими определе-
определениями равновесия, компромисса, справедливости, развиваемыми различ-
различными авторами. Но большинству из них нельзя отказать в логической не-
непротиворечивости и в интуитивной соответствии здравому смыслу. Раз-
Различные системы аксиом, соответствующие одним и тем же неформальным
гуманитарным понятиям, отражают различные шкалы ценностей, и выбор
их в качестве основы для принятия решений в конкретной ситуации опреде-
определяется субъективными установками ЛПР - его опытом, знаниями, воспи-
воспитанием, идеологией.
Каждой системе аксиом, определяющей понятие "компромисс", может
быть приведена в соответствие функция выбора или класс функций выбо-
выбора. Ведь в конце концов постулируемые свойства "рационального" выбора
являются требованиями к функции выбора. Независимо от того, в каких
терминах сформулированы исходные аксиомы, определяющие понятие
"компромиссное" решение, их можно в принципе переформулировать
как требования к структуре функции выбора.
Участие ЛПР в процедурах принятия решений при этом радикально
меняется. Отпадает необходимость в рутинном последовательном срав-
сравнении альтернатив. Задача ЛПР становится творческой. От него требуется
указать, какая из предъявленных систем аксиом, определяющих поня-
понятие "рациональный выбор", больше соответствует исследуемой ситуации.
Если отобранной системе аксиом отвечает не единственная функция выбо-
выбора, ЛПР должен выделить из них наиболее подходящую изучаемой задаче.
Это может потребовать расширения набора аксиом дополнительным огра-
ограничением на выбор. Вместо предпочтений на множестве альтернатив от
ЛПР теперь требуются предпочтения на множестве четко определенных
понятий "компромисс". Таких понятий обычно много меньше, чем объек-
объектов выбора в исходной задаче. Однако их сравнение предъявляет гораздо
более жесткие требования к ЛПР, чем сравнение объектов.
Другой подход к выделению подходящей функции выбора (ФВ), удо-
удовлетворяющей заданной системе аксиом, требует от ЛПР указания рацио-
рациональных с его точки зрения значений ФВ на некотором подмножестве ти-
типичных предъявлений.
Следующий этап — построение и решение одношаговой или многошаго-
многошаговой задачи ОМП по принятым аксиоматически требованиям к ФВ - уже не
125
нуждается в участии ЛПР. Обязанности, возлагаемые при таком подходе на
ЛПР, предполагают его понимание места решаемой задачи в более широ-
широкой проблеме, наличие у него шкалы человеческих и общественных цен-
ценностей и готовность нести ответственность за принятое решение.
63. Выполнение намеченной программы требует
— выделения признаков, характеризующих классы ситуаций принятия
решений;
— расширения набора систем аксиом, которые могут служить в тех или
иных условиях определением компромисса, равновесия, справедливости;
— установления соответствия между системами аксиом, определяющими
рациональный выбор, и индуцируемыми ими функциями выбора.
Конечно, четкая постановка и анализ подобных задач выходят за рам-
рамки формальных дисциплин. Это вечные проблемы, эволюционирующие
вместе с условиями жизни. Следует, однако, полагать, что при любом уров-
уровне неформальных и формализованных знаний и опыта выбор определения
таких понятий, как "справедливое решение", в заданных конкретных
условиях допускает известный произвол. Окончательный выбор за ЛПР.
Цель формальной теории принятия решений - гарантировать логичес-
логическую непротиворечивость выбранных концепций "компромисса" и основан-
основанных на них процедур выбора. Формальная теория должна, кроме того, раз-
разрабатывать механизмы выбора, позволяющие освободить ЛПР от трудоем-
трудоемких рутинных операций и обеспечить ему возможность проявить свои зна-
знания, опыт и ответственность.
Далее неформальные проблемы теории принятия решений остаются в
стороне.
Глава VII
ВСПОМОГАТЕЛЬНЫЕ ВЫЧИСЛИТЕЛЬНЫЕ МЕТОДЫ
Между вычислительными методами теории принятия решений (в част-
частности, обобщенного математического программирования) и традиционны-
традиционными методами оптимизации имеется известная преемственность и взаимо-
взаимосвязь. Так же как методы решения многомерных экстремальных задач
содержат в качестве вспомогательной процедуры методы одномерной оп-
оптимизации, так и методы векторной оптимизации используют в качестве
вспомогательных фрагментов различные версии классического математи-
математического программирования. В частности, методы обобщенного выпуклого
и обобщенного линейного программирования используют в качестве состав-
составных фрагментов традиционные методы выпуклого и линейного програм-
программирования.
В настоящей главе излагаются современные вычислительные методы
решения выпуклых и линейных условных экстремальных задач.
В § 1 приводятся теоретические основы эффективного метода эллипсои-
эллипсоидов (МЭ) (его первоначальное название "модифицированный метод цент-
центров тяжести" (ММЦТ)), который может быть использован как метод вы-
выпуклого [35, 67] и, в частности, как метод линейного программирования
[49, 78]. Здесь приведена только версия метода эллипсоидов для выпук-
выпуклого программирования, поскольку, как показали проведенные расчеты
[74], он не дает для линейных задач большой размерности сокращения
объемов вычислений по сравнению с классическим симплекс-методом ли-
линейного программирования.
В § 2 рассматривается и оценивается модификация метода эллипсоидов,
предложенная Л.Г. Хачияном и др. — "метод вписанных эллипсоидов"
(МВЭ). В МВЭ число шагов такого же порядка, что и в методе центров
тяжести, однако каждая итерация существенно сложней, чем в МЭ.
В § 3 и 4 приведены версии метода симцлексов (МС) (не путать с
классическим симплексным методом Данцига для линейного программиро-
программирования), предложенного независимо друг от друга Ямницким Б. и Леви-
Левиным Л.А. [94] для решения систем линейных неравенств и Булатовым В.П.
и ДР* [7» 10, 11] — для выпуклого программирования. В § 3 изложена
версия метода симплексов для решения систем линейных неравенств [94],
а в § 4 - ее обобщения для решения общей задачи выпуклого программи-
программирования. В § 5 рассмотрена другая версия метода симплексов [7, 10, 11]
для выпуклого программирования.
127
В § § 6 и 7 описаны новые полиномиальные методы линейного програм-
программирования, предложенные в последние годы индусским математиком На-
рендрой Кармаркаром [87] и советским математиком А.С. Немировским
[36]. Как показывают проведенные расчеты, эти методы оказались эффек-
эффективными. Они не уступают и, по-видимому, даже превосходят симплекс-
симплексный метод Данцига.
Изложение и обоснование всех методов, описанных в главе, сопровож-
сопровождается оценкой их трудоемкости.
Все изложенные здесь методы оптимизации используются или могут
быть использованы в качестве эффективных вспомогательных алгоритмов
для построения механизмов выбора в задачах, не укладывающихся в
рамки традиционной скалярной оптимизации.
Рассмотренные вычислительные методы представляют собой разработ-
разработки последних лет. Их эффективность аргументируется соответствующими
формальными рассуждениями и подтверждается при тестировании на раз-
разнообразных, но пока еще не слишком широких классах задач.
Общая особенность приведенных здесь вычислительных методов за-
заключается в следующем. Для решения задачи каждым из этих методов
следует предварительно представить ее область определения в некотором
стандартном удобном для анализа виде (в виде шара, симплекса, пересе-
пересечения шара и линейного многообразия и т.д.). Исходная ситуация позволяет
на первом шаге итеративного процесса решения задачи существенно улуч-
улучшить значение ее целевого функционала. После первого шага ситуация
меняется — область локализации решения сокращается и теряет свою
стандартную начальную форму. Переход ко второму шагу начинается с
некоторого преобразования координат, которое придает новой области
определения задачи исходную стандартную форму, удобную для очеред-
очередного улучшения значения целевого функционала. Таким образом, каждая
итерация описанных методов связана с оптимизацией целевого функцио-
функционала на множестве некоторой стандартной формы. Это не последняя причи-
причина эффективности методов и простоты оценки их трудоемкости.
Разные версии метода эллипсоидов и метода симплексов используют
в качестве преобразования координат, позволяющего начинать каждую
итерацию метода со стандартного вида условий задачи, аффинное преобра-
преобразование, а метод Кармаркара и метод Немировского используют для этой
цели проективное преобразование.
§ 1. Метод эллипсоидов (МЭ)
1.1. Метод эллипсоидов — метод решения произвольных выпуклых
экстремальных задач вида
/0(х) + min !/,(*)< О, /=1,...,/я, xEG. A)
Здесь //(*), j = 0, 1, . . . , т, — непрерывные выпуклые (не обязательно
гладкие) функции, G — выпуклый компакт с непустой внутренностью.
Всегда можно считать G шаром или эллипсоидом. Дело в том, что выпук-
выпуклое множеств!) G можно описать системой выпуклых неравенств /) (х) <
< 0, / = 1, . .., к9 и, погрузив G в^шар, считать последние неравенства вклю-
128
ченными в систему
ff(x)<09 /=1,...,ет.
Введем выпуклую функцию fm+x (х) = р(х, G) - расстояние от. точки х
до выпуклого компакта G. Тогда условие х € G примет вид/т+1 (х) <0
и задача A) перепишется в форме
/о(х) -> min \fj{x) < О, /= 1,...,т, т + 1. B)
Если G = Wo — шар радиуса г0 с центром в хь то
= p(x,G) = max {0, \\х-хг й -г0}.
1.2. Алгоритм метода эллипсоидов состоит из последовательности одно-
однотипных итераций, приводящих шаг за шагом к сокращению объема облас-
области локализации решения.
К началу /-й итерации имеется эллипсоид W/_i с центром в X/ и си-
система координат Of _ i, в которой W{ _ j — шар того же объема, что и эллип-
эллипсоид. К началу 1-й итерации известны также радиус г(_г шара Wf_x и ве-
величина f*~l — наименьшее значение целевого функционала/0 (х), достиг-
достигнутое за предшествующие (/ — 1) итераций. На начальном шаге О0 — си-
система координат, в которой Wo — шар радиуса г0 (шар, в который погру-
погружена область G),
1.3. Приведем геометрическое описание метода.
На 1-й итерации проверяют вначале, принадлежит ли точка X/ — центр
шара Wj^i — внутренности области G. Если X/ € int G, то строится
опорный функционал р1т + г к /w+i(x) = p(x, G). (Легко проверить, что
\ . Xf — Х|
если G = WQ —шар радиуса г0 с центром в х^тор^+j =
II X/ - Хг
Если xt € int G, но какое-либо из условий //(х) <0, / Е 1,т, нарушает-
нарушается в точке JC/, то строится опорный функционал p}(xt) к /){jc) в xt.
Если же X/ G int G и все ограничения ffic) < 0, / G l,w, удовлетворяют-
удовлетворяются в точке Х/,то строим опорный функционал р{>(х/) к целевому функ-
функционалу /о (х) в точке X/.
Пусть для /-й итерации
m + 1, если X/ ^ int G,
/(/) = А если х/е int G, но 3jGl,m: //(x/)>0,
О, если X/GintG, )J(x/)<0 V/€ ITw.
Таким образом, в любом случае на 1-й итерации определяется опорный
функционал Р/(/>,
j?+1, если /m+i(x/)>0,
Pj(O = Pi> Jel>m> если /m+i(^/) =0, 3/Gl,m:
^o, если /w+i(x/) = 0, /JCx,) < 0
9. ДБ. Юдин 129
указывающий направление гиперплоскости, рассекающей Wt_i на две
части с непустой внутренностью. Только в одной из них может быть лока-
локализовано искомое решение.
Если направление разделяющей гиперплоскости определяется опорным
функционалом Р/(/>, то в части Wj-i, в которой находится решение,
должно быть
C)
При / (/) = т + 1 это неравенство означает, что точки части W{ _ i, содер-
содержащей решение, отстоят от G не дальше, чем xt. При / (/) € 1, т, отвечаю-
отвечающем нарушенному в х( ограничению, неравенство C) отделяет точки Wt _ х,
в которых невязки в у(/)-м ограничении не превышают невязку в точке
JC/. Наконец, при/(/) = 0 неравенство C) требует, чтобы значение целево-
целевого функционала на решении не превышало бы его величины в точке х(.
В силу выпуклости/,- (х),/ = 0,1,..., w, т + 1, имеем
//С*/) + (/>}> x-xt)<ffic). D)
При условиях D) неравенства C) переписываются в виде:
Это значит, что искомое решение задачи содержится в полушарии
1.4. Выделение полушария Н^/, локализующего решение, с помощью
гиперплоскости Pj (/) х = р;- (/) х,-, проходящей через центр Wt _!, называют
й б б й В б фф
j () ; ()
версией метода эллипсоидов без глубоких отсечений. В более эффектив-
эффективной, вообще говоря, версии метода — с глубокими отсечениями — можно
усилить неравенства C).
Множество, в котором может быть реализовано решение, удовлетворяет
неравенствам
{О при /= 1,... ,т, т + 1,
F E)
min(fo(x,), /'-») = /'¦ при / = 0.
При условиях D) (т.е. при выпуклых/у (х)) неравенства E) переписы-
переписываются в виде
( ffei) + (//> х - xi), j = 1,..., т, т + 1,
О >
Введем обозначение
MX/) при / = 1 т, т + 1,
4@ =
l/o(Jf/)-/' при / = 0.
Тогда выражение для области локализации решения принимает вид
W, ={хе «/,_, | dM + (рт, х-х,)< 0).
130
Область W( представляет собой сегмент шара Wt _ t, отделяемый гипер-
гиперплоскостью, ортогональной направлению Р/(/> и проходящей через точку
djy) на оси р7(/) (мы ведем рассуждения в системе координат 0/__i, в
которой Wf _ j - шар радиуса r/_jc центром в точке xt = 0 и разделяющая
гиперплоскость с нормалью Р/(/> параллельна одной из координатных
гиперплоскостей).
1.5. Для того чтобы начать очередной (/ + 1)-й шаг в ситуации, аналогич-
аналогичной началу 1-го шага, следует преобразовать сегмент Wt в шар Wf. Это
может быть сделано двумя способами. В [35] и [66] на основании сегмен-
сегмента как на диаметральной гиперплоскости строится полушарие. Затем полу-
полушарие включается в эллипсоид минимального объема и далее растяжением
и сжатием координат эллипсоид преобразовывается в шар Wt того же
объема.
Процедуру построения шара можно, однако, рационализировать, если
опустить этап превращения сегмента в полушарие, и сразу описывать эллип-
эллипсоид минимального объема вокруг сегмента и далее преобразовать эллип-
эллипсоид в шар того же объема [74].
Все связанные с такого рода преобразованиями соотношения, необходи-
необходимые для формирования вычислительной схемы метода эллипсоидов, выте-
вытекают из решения следующей задачи.
1.6. Задача: требуется описать эллипсоид минимального объема вокруг
сегмента шара радиуса 1, отделяемого гиперплоскостью, проходящей через
точку (d + h)p перпендикулярно направлению р(р — единичный вектор).
Рис. 7.1
По соображениям симметрии искомый эллипсоид будет эллипсоидом
вращения с осью р и центром в точке (d + h)p. На рис. 7.1 изображено дву-
двумерное сечение шара и эллипсоида, проходящее через ось р. Уравнение
эллипсоида
(t-d-hJ
= 1,
а2 Ь2
где t - проекция точки на ось (—р), as— проекция на ортогональную к р
гиперплоскость. Ясно, что граница искомого эллипсоида должна проходить
через точки t = l9s =0и t =d,s = y/l -d2. Поэтому
A-е/-ЛJ h2 \-d2
' a2 b2
131
Из этих уравнений определяем оси эллипсоида:
(\+d){\-d-hf
я = 1 -d-ht b2 = .
A -d-2h)
Квадрат отношения объема эллипсоида к объему исходного шара
-l{\-d-hJn
f (l-d-2h)n~l "
Остается выбрать /t, минимизирующее f.
Из условия = 0 получаем
dh
1 -d
h = .
Таким образом центр эллипсоида, описанного вокруг сегмента, располо-
расположен на оси р на расстоянии
1 - d l+nd
d + h = d + =
w+1 w+1
от центра шара W/_i.
Объем эллипсоида, описанного вокруг сегмента, в >/Т раз меньше
объема исходного шара радиуса 1. Следовательно, эквивалентный радиус
эллипсоида вычисляется из соотношений
A-rf-
d \ "ТЯГ/ 1 -</
я + 1 \я- 1/
Если радиус исходного шара не 1,аг/в1,а гиперплоскость, отсекающая
сегмент, проходит на расстоянии d от центра шара (d < ri _!), то экви-
132
валентный радиус эллипсоида, описанного вокруг сегмента, равен:
Я-1
7
П + 1
Л-1
Оценим величину рп(п) = VT"- сокращение объема области локализа-
локализации решения за одну итерацию метода. Для оценки рассмотрим худший
случай, когда d = 0.
Имеем
л+ 1
Я- 1
л+1
или
up-**-. - -(^И1 -р-)-'"(' * I
2 и2
Результаты
л
-2л1прЛ(л)
вычислении:
2
1,046
3
1,019
4
1,011
10
1,002
100
1,001
1.7. Уравнение эллипсоида минимального объема, описанного вокруг
сегмента, который отсечен от шара радиуса 1 с центром в нуле гиперплос-
гиперплоскостью, проходящей на расстоянии d + h от центра шара, записывается в
133
соответствии с приведенными рассуждениями в виде
\
/ 1+m/y 2 1 -d n-
it j s . —— • ——
\ 1 + л / 1+a и + 1
1.
Сделав замену переменных
r=Xr' -J + - , 5= X-~ V- 5', F)
получим, что уравнение эллипсоида в координатах t', s' есть
Параметр X следует выбрать так, чтобы преобразование координат сохра-
сохраняло объем. Для этого должно быть
ИЛИ
ff-1
n"(l-d)(l-d2J
А — 1,
w-1
откуда
W+l /1-1
п \\-d / \1+d
W-1
2П
n(i-rf) L\i + i/\i+tf /J p(w)
Подставляя значение X в формулы F) для преобразования координат,
получаем:
л-1
In
t - I ( Н JI ^' +
1+И
1
Tn
l/f* — 1 \#1 — w II
5
„-I \/l-rf \1
134
или, вводя обозначение
1
/п-\ 1 -d \ 2п
\7+7 777/
t = кп~Ч' + , s = - s\
приходим к следующим формулам для преобразования координат от
1
системы О , в которой эллипсоид есть шар радиуса — с центром в нуле,
Л
к исходной системе О:
l+nd _ 1
1+л ' к
Это значит, что координаты О получаются из координат Cf сдвигом начала
1 +nd
координат вдоль оси р в точку , изменением единицы масшта-
1 + /1
ба вдоль оси р в кп~1 раз и в ортогональной к р гиперплоскости — в
1
- раз.
к
Обозначим через Рр оператор проектирования на ось р (ортопроектор
Pi Pi
на р). Оператор Рр - это матрица с элементами — , где р = (рь ..., рп) —
разложение вектора р в исходных координатах. Оператор Pi проектиро-
проектирования на ортогональное дополнение к р находится как Рх = / — Рр, где
/ - единичная матрица.
Таким образом, преобразование координат от О' к О проводится по
формуле
где
х = -
Ар =
1
+ nd
+ л
Р
\\Р
1
К
?+
Pi
Ар
= К
п —
1Рр<
1
Из полученной выше оценки для pw(/f)=VT сокращения объема области
локализации решения за одну итерацию следует (см., например, [74]),
что метод эллипсоидов приводит к решению с погрешностью, не превышаю-
превышающей б, не более, чем на Т = ] 2л (л + 1) In — [ шагов, где г0 - радиус исход-
исходного шара, содержащего G, а г — радиус е-окрестности решения.
135
§ 2. Метод вписанных эллипсоидов (МВЭ)
2.1. Как известно [35], любая гиперплоскость, проходящая через центр
тяжести л-мерного выпуклого тела, делит его на две части так, что отноше-
отношение объема большей из них к объему всего тела не превышает
е
Следовательно, относительная погрешность е решения выпуклой задачи
методом центров тяжести (МЦТ) за N шагов
N
Чтобы гарантировать относительную погрешность, не превосходящую е,
достаточно применить МЦТ с числом шагов, не большим
N < + 1 < 2,19л ] In — [ + 1.
a(h)
Такова оценка минимального числа обращений к оракулу в произволь-
произвольной задаче выпуклого программирования. Для метода эллипсоидов, ко-
который удобно применительно к рассмотрениям настоящего параграфа
называть методом описанных эллипсоидов, оценка числа итераций в п
раз хуже:
1
N < 2п2 ] In - [ + 2.
е
МЦТ в чистом виде, однако, не реализуем, поскольку неизвестны сколь-
нибудь экономные методы вычисления координат центра тяжести произ-
произвольного выпуклого тела не очень малой размерности. В [48] предложена
модификация метода эллипсоидов с числом обращений к оракулу того же
порядка, что и в МЦТ, но с существенно более трудоемкими итерациями,
чем в методе эллипсоидов. Этот метод естественно называть методом
вписанных эллипсоидов.
В многокритериальных задачах, решаемых в критериальном пространст-
пространстве, размерность переменных (число критериев) обычно невысока, а число
обращений к ЛПР желательно по возможности сократить. Следует полагать,
что в таких задачах рассматриваемый низке метод может оказаться по-
полезным.
В методе вписанных эллипсоидов в исходную выпуклую область впи-
вписывается эллипсоид максимального объема. Через его центр проводится
гиперплоскость, делящая тело G на две части. В ту часть G, в которой
оказалась точка, отвечающая минимуму целевого функционала, вписыва-
136
ется эллипсоид максимального обьема, через его центр проводится гипер-
гиперплоскость, и процедура повторяется. Оказывается, что скорость убывания
объемов вписываемых таким образом эллипсоидов имеет тот же порядок,
что и обусловленная методом центров тяжести скорость убывания объемов
частей G, в которых находится искомый минимум f(x). Однако каждая
итерация метода вписанных эллипсоидов (МВЭ) гораздо сложней, чем в
ставшем уже традиционным методе эллипсоидов (МЭ).
В МЭ все итерации однотипны (и связаны с описанием эллипсоида мини-
минимального обьема вокруг полушария или сегмента шара). В МВЭ итерация
меняет свой характер от шага к шагу и связана с вписыванием эллипсоида
максимального обьема каждый раз в новое выпуклое тело. Вписывание
эллипсоида максимального обьема в произвольное выпуклое тело (впро-
(впрочем, как и описывание эллипсоида минимального объема вокруг любого
выпуклого тела) представляет собой задачу выпуклого программирования.
Она может быть решена любым методом выпуклого программирования.
Если выпуклое тело G — выпуклый многогранник, то описывание эллип-
эллипсоида минимального и вписывание эллипсоида максимального обьема
сводятся к решению выпуклой задачи* не требующему специального источ-
источника информации. Для построения эллипсоида минимального обьема
вокруг выпуклого многогранника достаточно знать его вершины. Для
вписывания эллипсоида максимального обьема в выпуклый многогранник
достаточно знать его грани, т.е. систему линейных неравенств, определяю-
определяющих многогранник.
22. Эллипсоид полностью характеризуется положительно определенной
симметричной матрицей Л и вектором х центра эллипсоида.
Пусть G С Еп — выпуклый компакт с непустой внутренностью, 2Л —
пространство симметричных п X и-матриц, 2 \ — подмножество 2„, образо-
образованное положительно определенными матрицами, ?+„ - замыкание ?„ —
подмножество неотрицательно определенных матриц.
Обозначим множество параметров (х, А) эллипсоидов, вписанных в G,
через S(G):
E(G) ={( x9A)\xGEn9 АеЪ% x+AuEG Vu: uTu < 1}.
Рассмотрим эллипсоид U, вписанный в G:
U ={x+Au\u*u < 1} =
= х+{и\(А'ги, A'xv) < 1}= x+{v\D~2v,v) < 1}. G)
Объем эллипсоида U равен
deM = |F|det4,
где | V | — объем единичного шара в Еп.
Вычисление параметров эллипсоида максимального объема, вписанного
в G, сводится к следующей экстремальной задаче:
F(A) = ln(deM) -» max|(jcM)G2(G). (8)
137
Лемма 1. Задача (8) является задачей выпуклого программирования.
Доказательство. Компактность 2 (G) и наличие у 2 (G) не-
непустой внутренности очевидны. Проверим выпуклость ?(G) и вогну-
вогнутость F(A) на ?,?.
Пусть (х,А), (у, В) G ?(G) и /i € [09 1]. Для и, мти < 1, имеем
х.+ Аи е G, у + Вы G G => (цх + A
)j ))()
Покажем, что F(i4) — вогнутая функция на выпуклом множестве
Пусть А, Ве ?* и м G [0, 1]. Имеем:
Пусть Xi,...,Xw — собственные числа матрицы Л~^А4""%. Тогда
det(/x + A - /iL-%A4-%) = П Ох + A - м)Х*)- Таким образом
п
det (/X -4 + A - yi)B) = det A • П (м + A - д) X/). Отсюда в силу вогнуто-
1
сти In Г
п
l-/i)J?) = FD) + Г
1
т.е. FD) — вогнутая функция на выпуклом множестве ?^.
2.3. Приведем некоторые замечания, которые будут дальше использо-
использованы при построении и обосновании метода вписанных эллипсоидов.
Снабдим пространство ?„ симметричных матриц скалярным произ-
произведением
Здесь tr A - след матрицы А - сумма ее диагональных элементов.
Имеет место
Лемма 2. Пусть матрица А € ?*. Тогда VF(A) =A "!.
Доказательство.
F(A +еВ)
Отсюда:
- (F(A+eB)-F(A)) = - In (det (/ + eЛ'1
е 6
138
Очевидно, при е -> 0 det(J + eQ) = 1 + etrQ + о(е). Поэтому
Km - (FD + eB)-F(A)) = tr (A'lB) = (А'\В)9т.е. VFD) = ^.
Лемма 3. Пусть G - выпуклый многогранник,
{veEn\aJv < bh /= l,...,m>.
Тогда 2 (G) выделяется в ^XZj неравенствами
\\Aaf\\+(ahx)<bh 1 < / < /w, (9)
где lit; || = (и1
Доказательство. Эллипсоид С/ (см. G)), определяемый матри-
цей А и центром х, принадлежит многограннику а*и <&., / Е 1, /и, если
(ahx+Au) < Ъ; VuuTu<l, j G l,m,
т.е. если
(ahAu) + (ahx) < bh \f и uTu < 1, / G T^T,
а последняя система неравенств эквивалентна неравенствам (9). Дейст-
Действительно, тах{@/,4н)|итн < 1} = 1Ма/||.
2.4. В соответствии с леммой 1 задача (8) является задачей выпуклого
программирования.Пусть(дг*, А*) — ее решение hFq =FD*). Обозначим
через (хе, Ае) G S (G) параметры эллипсоида, вписанного в G, такого, что
F(Ae) >Fb- e. A0)
Проведем через центр эллипсоида гиперплоскость П. Пусть Gn — часть G+
отсеченная гиперплоскостью П. Рассмотрим вписанный в Gn эллипсоид
с параметрами (у, В) G 2(<7п). Для характеристики метода вписанных
эллипсоидов следует оценить, как быстро от итерации к итерации будут
сокращаться максимальные объемы эллипсоидов, вписанных в соответ-
соответствующие части G. Для этого оценим снизу разность
Не ограничивая общности, можно считать, что А€ и
Рассмотрим эллипсоиды
U ={х€+А€и\иТи < 1} = x€+{v\(A;2v,v)< 1},
V ={у + Ви\иТи < 1} = y + {v\B~2v,v) < 1}.
Очевидно, U.VCG.
Как известно, любую пару положительно определенных форм можно
представить в некотором базисе (координаты относительно которого
обозначим через z) в виде
(A2z,z) и (A~4z),
где Л — диагональная матрица с положительными диагональными эле-
элементами. Другими словами, существует невырожденная матрица С та-
такая, что
СТА;2С = Л2, А^2 = (С*УгА2С'1'9
СТВ'2С = Л, В'2 = {СТУ1К'2С'Х.
139
Введем преобразование Еп на себя
T(z) = х0 + ft,
где хо = Ы (х€ +у), и положим
Рассмотрим эллипсоиды
t/0 =fl + {z|(A4^)< О, Ко = -a + {z|(Az,z) < 1}.
Легко видеть,что T(U0)= U и Г(К0)= F.
Действительно,
xe+{u\(A2C-lutC-lu) < 1} =
TA2CM,t/) < 1}= *е+{и|04;2и,«) < 1}= U.
Аналогично проверяется, что T(V0) = К.
Обозначим Go = C~l(G). Используя приведенные выше соотношения,
получим:
F(B) = F(A)+F(C).
Таким образом,
и, согласно A0),
1)>F&Q-e. A1)
Кроме того, а $ int Ко, поскольку центр хе эллипсоида Uне лежите
эллипсоиде V (V - эллипсоид, содержащийся в Gn).
2.5. Мы пришли к выводу, что требуемая оценка снизу Fq- F(B) сов-
совпадает с оценкой снизу F& - F(A) при условии, что а ф int Vo.
Пусть IGF". Рассмотрим опорную функцию к Go
и поляру Go
G0={tlp«)<l>.
Заметим, что 0 G int Go, поскольку а я-а лежат в inf Go. Поэтому р ({) > 0.
По определению опорной функции р{%) к Go имеем
(^,z), max (f,z)} =
(поскольку max {(и, z) | (Z>z, Dz) < 1} = max {(w, Z)"^) I (u, v) < 1} =
1}1T
140
Итак, || Л $ \\<р«) - (а, $); || Л$ || = р ({) + (а, $).
Отсюда
НоШ12 = ($,$) = (Л-'ЛМ) -(М.Л-1*) =||Л-ЧННЛ| ||. Поэтому
1Ш12 <Р2Ф-С«,1J.
Таким образом, для любого %& Е" справедливо неравенство
л л
Если теперь ? € Go, то р (?) < 1. Стало быть,
т.е. поляра Go содержится в эллипсоиде 5. Поэтому Go содержит поляру S-
множество { х\ (х, () < 1, Vf E S}. Уравнение эллипсоида S в подходя-
подходящих ортогональных координатах имеет вид
а уравнение его поляры, очевидно,
Итак, Go содержит эллипсоид W, уравнение которого в подходящих орто-
ортогональных координатах есть \\М~1х\\2 < 1, где М - матрица из 2^ с соб-
собственными числами 1,..., 1,л/1 + ||д||2.
я-1
Поэтому
Далее из а ^ int Fo следует, что ЦЛ"*1 -2я|| > 1 (поскольку Ко
= {х\\А"г (а + х)|| < 1}). Поэтому ||а|| > UminX/. Пусть minX/ = X
Тогда
I 5?
F^o >F(M)>In VI + —.
С другой стороны, область Go содержит эллипсоиды Uo и Vo:
Поэтому Go содержит и эллипсоид
Отсюда по определению FA :
/Л + Л" \ Л X/ + X/" Xi
• \2 / /=1 2 " 2 ¦
141
Полученные оценки для F*G приводят к неравенству
? >max ln>/l, nf
0 I 4 2 J
В соответствии с неравенством A1) F(A~l) > Fq - e. Ho F(A)
= -F(A). Поэтому
Очевидно, max 11 + —: , : "" > 1 + — , где X, - положитель-
4 4 ) 4
ный корень уравнения
X2
1+Т= 4 '
т.е.Х, = 1А\Д.
Поэтому FZ - F(A) > lnfl + —)-€. Но, как мы видели, Fq -
\ 8/ о
- -e.
о
Поскольку пара (у,5)Е2 (Gn) произвольна, тоЪтсюда:
9;
Подытожим приведенные рассуждения. Пусть G С Еп - выпуклый ком-
компакт с непустой внутренностью. Впишем в него эллипсоид максимального
объема
= ** + {v\(D*yxv9 (A*)'1v)< 1).
Обозначим F? = F(A •) = In det Л *.
Рассмотрим произвольный эллипсоид {х€ + А€и\\\и\\ < 1}, содержа-
содержащийся в^и имеющий F(A€) > Fq — e.
Гиперплоскость П, проходящая через центр этого эллипсоида, отсека-
отсекает от G тело Gu.
Впишем в Gn эллипсоид максимального объема. Пусть ему соответ-
соответствует симметричная положительно определенная матрица В*.
Обозначим F^ = In det В *.
Объемы эллипсоидов, характеризуемых матрицами А* и В* соответ-
соответственно, равны: VA* = | F|deM* и VB* = | V\detB*, где I V\ - объем
142
единичного шара в Еп. В силу A2) имеем
ИЛИ
Назовем вписанный в тело G эллипсоид максимального объема G-мак-
симальным.
Имеет место следующее утверждение.
Лемма 4. Отношение объема Gn-максимального эллипсоида к объему
8
G-максимального эллипсоида не превышает —.
В [49] приведена более сильная оценка:
VB* 8
-2- < 0,843 < 0,888...= -.,
Уа\ 9 '
(Вспомним, что для метода центров тяжести отношение объема тела Gn
к объему тела G не превышает 1 — — - 0,633. Здесь тело Gn — часть G,
е
отсекаемая от G произвольной гиперплоскостью П, проходящей через центр
тяжести G.)
2.6. Оценим трудоемкость вычислительной схемы выпуклой оптими-
оптимизации, основанной на идее метода вписанных эллипсоидов.
Будем решать задачу
f(x) -» min |jc € G С Еп9 A3)
где G - выпуклый компакт в Еп с непустой внутренностью, /(х) - не-
непрерывная квазивыпуклая функция. Предположим, что V х € int G оракул
способен указывать вектор <р(лг), $(х) Ф 0 при х > argmin/ такой, что
G
(ip(x)9z -x)<0 VzGG: f(z) <f(x). Положим Gm = Arg min {/(*) |jcG G}.
Предлагается следующая схема решения задачи A3).
Пусть Go = G и уже построены Go Э ... Э G*_ i; Gs - выпуклый ком-
компакт с непустой внутренностью.
На к-ы шаге решается вспомогательная задача
Пусть (x*,i4fc) 6^-приближенное решение ( 3^), т.е.
(хк9Ак)е2фк_г) и
Положим
(при ^(xfc) = 0 останавливаемся и полагаем решение исходной задачи рав-
равным хк).
143
9
Обозначим хк - argmin{/(x)|x E {xl9..., хк)) , и пусть In— — e>
о
>а>0и
/*(€) = тах{/(*)| х = ем + A - e)z, w G G,z G G«, } .
Имеет место
Теорема. При всех к
ка
Пх*)<Г(пе~ п).
Доказательство. Обозначим через | V\ = объем еда-
И * ¦)
ничного шара в Еп. Объем выпуклого тела G не меньше объема любого
вписанного в него эллипсоида, в частности, эллипсоида с матрицей А*, т.е.
|G|>|F|exp{F?} =WA.\.
С другой стороны, известна и оценка объема \G\ сверху через объем I VA*\
(теорема Фрица Джона) *)
\G\<nn\V\exp{F?}.
Аналогично для Gk
\Gk\<nn\V\exp{F?k}.
Из неравенства A2) вытекает, что
* > ( - \>ка
G~F°k>k\l s "/
Сопоставляя приведенные неравенства, получаем:
\Gk\<nne-k«\G\.
Если приданном б, 0 < е< l,Ge = eG+ (I - e)G., то объем \G€ \ =ew|G|.
Стало быть, при ew|G| > nne~ka\G\ множество G€\Gk непусто. Но в
G\Gk по определению хк f(x) > f(xk), так что /*(б) > f(xk). Итак,
tea
при е>пе п получаем/(х*) </* (е), т.е.
Г(хк)<Г(пе~ " ).
п п
Другими словами, при к > — In — обеспечивается требуемая точность ре-
ас е
шения (по значению целевого функционала).
2.7. Вычислительная схема метода вписанных эллипсоидов достаточно
конструктивна, если G - выпуклый многогранник. Обсудим соответствую-
соответствующую процедуру.
*) См. например: Грюнбаум Б. Этюды по комбинаторной геометрии и теории
выпуклых тел. - М.: "Наука", 1971.
144
Свяжем с каждой парой (ур Q)>y ? Еп, Q — невырожденная (возмож-
(возможно, несимметричная) п X и-матрица, эллипсоид
Предположим, что Go-G есть многогранник вида
lueEn\a]u<bh Kj<N0}
и известны yo,QouPo> 1 такие, что
V(yo,Qo)CGCV(yoJoQ).
Пусть уже построены, как описано выше, Go, G\>..., Gk~\> причем
G*_i = {uEEn\aju<bj9 l<j<Nk_t},
и известныyk-i,Qtc-i>ftt-1 > 1 такие, что
Предположим также, что на предыдущих шагах было обеспечено
Опишем последовательность операций Л:-го шага.
1 9
al) Решение задачи ( 3^) с ек < — In —.
2 8
Положим:
n \ук_х + efc_j
Ясно, что Я^- х есть аффинный образ G*_ j при отображении z -^7^-1 +
Qk-iZ, причем Нк-1 содержит шар {\\z II < 1} и содержится в шаре
UIK}
а2) Будем решать задачу
-% (z,
Условие F(A) > - 1А введено для удобства вычислительной процедуры.
Оно сокращает область определения допустимых матриц и исключает та-
таким образом особенности, связанные с близocтьюJiet А к нулю.
Учитывая лемму 3, можно переписать задачу C^) в виде
__ 1
lndet>4-+max \A ?2j,ln detA > ,
2 A4)
^
Легко непосредственно убедиться, что (О, X/) — допустимый план зада-
задачи (9>к) при- <Х<1.
е
Ю. Д.Б. Юдин 145
- 1 / 1 \ _ 1 / 1 \
Возьмем X = - ( 1 + ) и р = - / 1 )
n\iz\\2 + |Л-Х/|2<- р2}.
и положим
Здесь \А | = (tr D2)I/2 - норма А в евклидовом пространстве 2„;
II Ах II
IIА 1 — операторная норма матрицы Л; \\А II = max .
\\х II
Пусть #&_ j - множество допустимых планов задачи (&к). Убедимся,
В самом деле, если (z,A)€ W, то при I и II < 1 имеем:
4 -X/)w l<
)w IK
X+ llzll+ 1D-
X+ Ilzll + M-
>ДХ р1,
V2
и, следовательно, z + ^w G #&-!, т.е. удовлетворяются условия
U^ll + (^,z) <^-, Kj<Nk_l9 задачи A4).
Выполнение условия ^G2)J очевидно, поскольку из определения сле-
следует, что для любой точки W имеет место
и отсюда же
1
С другой стороны, пусть М - шар в Еп X 2„:
Л/={?,Л)е ^Л X 2„ | llzll2 + \А |2 <A +
Убедимся, что М Э Я^-i. Действительно, если (z, А) $ М, то либо IIz II>
2 l
|2
Проверим, что в обоих случаях V(z, А) не лежит в #&- г, т.е. (z, А) не
удовлетворяет системе неравенств \\ASf II + (^-, z) <fe/, I </ <Л^-1>заДа"
чи A4). Действительно, в первом случае уже z ф. Н^-г (напомним, что
#?_ j содержится в шаре {IIW t < j8^-1} ), а во втором - среди собствен-
собственных чисел А (сумма квадратов которых и есть как раз Ml2) одно по
модулю больше /Зл_ г. Поэтому diam V(z,A)> 2$ь-1»что невозможно при
Итак, Af D Я^_1 Э W, причем для радиусов r(W) и г(М) шаров И^ и
М имеем:
V V7
где к — абсолютная константа.
146
Изменение F ( • ) на #*_ х не превосходит
1
(поскольку по условию задачи (9*к) F(A) > — Vi при (z, А) G #*_1, а
собственные числа матрицы Л не больше j3fc_i, откуда следует, что
2.8. Используем теперь для решения задачи (&к) метод эллипсоидов,
1 9
настроив его на абсолютную погрешность —In—. Для применения метода
2 8
достаточно:
— априори располагать шаром, содержащим Н%~ i (у нас он есть — это
М),
— уметь на каждом шаге для предъявленной точки (z, A) E Еп X 2„
проверять включение (z, Л) Е intН%„ х. Если оно выполнено, нужно уметь
вычислить VF(A) (мы это также умеем: по лемме 2 VF(A) -А), Если
(z,A) ф Н%~ 1, необходимо найти такое Ф G Еп X ?Л, Ф =? 0, что
i^^j С { (и,В)еЕп X 2„ | ((и - z,? ->1),Ф)<0}.
Проверка включения (z, А) € #*_i и построение в случае (z, А) $
$ Н%-1 требуемого Ф производятся следующим образом.
По данным (z, А) выполняем следующие операции.
A) Приводим квадратичную форму (Аи, и) к взвешенной сумме квад-
квадратов, скажем, методом Лагранжа (метод дает матрицу В detB Ф 0, такую,
что ВТАВ диагональна). Если (ВТА В)и>0 V/ Е 1, п, то А > 0. В против-
противном случае для того /0, для которого (BTAB)t t <0, линейная форма
от 2 € 2Й (непостоянная) B(Q) = (BTQB)ioio неположительна при Q = А
и неотрицательна при Q G 2^. Стало быть, в этом последнем случае
(z, А) ? Н%-\ и можно взять Ф = @, VQB( • )).
B) Пусть теперь выполнено А € 2?. Вычисляя F (А), проверяем, верно
1
ли, что F (А) >—.
ЕслиF (А) <—'-, то (z, A) ^ #&_ 1э,ц можно взять:
C) Пусть, наконец, А €= 2^ и выполнено F(/4) > . Тогда проверяем
неравенства
(условия задачи A4)). Если все они выполнены как строгие, то (z, A) ?
? inttffc-j. В противном случае при некотором/ имеем \\Aaf- II+ (Zj,z) >
> bj И МОЖНО ВЗЯТЬ
10' 147
Итак, все этапы итерации метода эллипсоидов обеспечены. Для решения
1 9
задачи (&к) с абсолютной погрешностью, не превышающей — In —, доста-
2 8
точно сделать
< изменение F на Я%_г
-ил- т
l(aim 2ап) /
1 r(R0 1 9
-ln-
2 8
итераций, что в соответствии с приведенными рассуждениями не больше
где Кх и к2 - абсолютные константы.
2.9. Решив задачу Фк-х) с абсолютной погрешностью, не большей
1 9
- In -, мы найдем (zk, Ak) ^ 2 (#*- j) с
2 8
Эллипсоид максимального объема, вписанный в //*-i> определяется
параметрами (zk,Ak).
Рассмотрим эллипсоид
Он, очевидно, может быть представлен в виде
jc*+ { Л^ w | II ы II < 1 > ,
где
(>Г^ на самом деле вычислять не требуется). При 3T0MF&fc« — FB*) а
19
= Fffk_l — F(Ak) < — In — , х* — центр очередного эллипсоида.
2 8
Число линейных неравенств, определяющих очередной многогранник
Gk, увеличится на единицу Л^ = TV*-1 + 1. К неравенствам, определяющим
Gk- г = {и GEn\afu<bj, 1 </ <Nk- r }, добавится неравенство ajfku <
< bNk, где aNk =<p(xk)9 bNfc = ((p (xk), xk) >y (x^) - направляющий вектор
гиперплоскости, проходящей через хк и отсекающей от Gk- г часть, в ко-
которой f(u)<f(xk).
Остается построить у к9 Вки&к.
Рассмотрим отображение
и пусть
Sk-Til{Gk), Sk = T-k\Gk_xl
По построению Sk содержит единичный шар с центром в нуле. Более
того, всякий содержащийся в Sk эллипсоид имеет объем, не превышающий
148
exp ( - In - ) | V |, где | V Г - объем единичного шара в Еп. Действительно,
\ 2 8/^ ^
пусть 59 С Sk, 58 — эллипсоид максимального объема, вписанный в 5* •
Тогда Тк($В) С Tk{Sk) = G*-i — эллипсоид максимального объема, впи-
вписанный в шар, для которого справедливо соотношение:
11u К 1 > ))< iIn - ,
2 о
Отсюда
к(ги^))
П F<7({|II<1>)) П
и, следовательно, объем Sk-максимального эллипсоида 33
Г1 9\ /9 3|К|
П 8/ ~8 " 2n/2"
Последнее неравенство, справедливо для эллипсоида максимального
объема, тем более справедливо для любого другого вписанного в Sk эллип-
эллипсоида.
Нетрудно видеть, что тогда Sk содержится в шаре радиуса к4п, где аб-
абсолютная константа к 4 будет оценена в следующем пункте.
Обозначим фк = (Вк- iAk)Tip(xk). Имеем
(Действительно, положим Мк = { z G Sk | (фк, zk) <0} . ТогдаМк QSkC
С Sk. Пусть z €Mk; Tkz =yG G*_ х по определению Sk и включению Afjt ?
С Sk. Поскольку z еЛ/^, то (ф (хк),у)<0. Из того, что^ G G^_ j, следует
(по определению Gk) у G Gk. Отсюда z = 1%1{у) G Tkl(Gk) = 5^^. Таким
образом, Af/t = ^.)
Пусть
{ 1 \
( е^, — / J и
{ 1 \
Ясно, что 5fc содержит эллипсоид F( е^, — / J и содержится в эллипсоиде
Поэтому Gk содержит эллипсоид V(yk9 Bk) и содержится в эллипсоиде
Итак, при к > 1 можно взять fik = 2пк4 + 1.
2.10. В заключение оценим к4.
Пусть G - выпуклый компакт в Еп9 содержащий единичный шар V =
= { х | II х IK 1} , и объем всякого эллипсоида W, содержащегося в G, удов-
удовлетворяет условию
+аIП A5)
149
Обозначим г = max {II* IIIxjE G) и оценим г сверху. Пусть г = Их* В,
х* Е G. Тогда G содержит тело G, получающееся вращением плоской облас-
области Go вокруг оси Ох* (см^рис. 7.2). Пусть Wo — эллипсоид максимального
объема, содержащийся в G. Из соображений симметрии Wo есть результат
вращения эллипса Wo (пунктир на рис. 7.2) вокруг Ох*. Этот эллипс задает-
задается уравнением
(х-О2 а у
+ -г- < 1. Его полуось X = 1 + t, и он должен
Рис. 7.2
касаться прямых, ограничивающих Go. Уравнение "верхней" из них имеет
вид:
/ 1\ х - г г-х
у = - tg( arcsin -){x - г) = = .
\ V / Г у/г2 -1
Произведем преобразование координат, переводящее Wo в единичный
круг:
, х~* , У
х =- , у =-.
1 + t II
В координатахх', у' уравнение рассматриваемой прямой принимает вид:
li y/r1 -lj' + (l +t)x' = r-t. A6)
Условие касания эллипса Wo и "верхней" прямой, ограничивающей Go,
приобретает вид:
(Г_,J=М2(,2 -1) + A+ГJ. A7)
Действительно, точка Р касания указанной прямой с эллипсоидом (шаром
в новых координатах) имеет координаты v A + г, ix\/r2 — 1), т.е. принад-
принадлежит прямой, ортогональной касательной к шару. Условие принадлеж-
принадлежности точкиРпрямой A6) записывается в виде:
14A+ГJ +М2(>-2 - 1)) = г-г,
откуда
г- Г
A+О2+м2(^2-1) '
150
Точка Р, кроме того, лежит на окружности:
*>2(A+02 +»2(г2 -0)=1.
Отсюда
Таким образом,
1 r-t
откуда вытекает запись уравнения A7).
Из A7) получаем /и2 = (г - 1 - 2t)/(r - 1).
/1 W I \2
Обозначим отношение ( ) = д2 *я ~~* *Х2 = y(t). Имеем
\|К| /
(Г-1Г-1
Максимизируя <p(s) по s, мы должны получить s*x:t (поскольку ^Опо оп-
определению — эллипсоид максимального объема, вписанный в G).
Ъкр г- п
Условие = 0 дает г - п = (п + \)t или (при г > п) г- . При этом
bt n + 1
k 2
« + 1 / \ и + 1/
П -
/я- l
\Я+1
Г-
/ lX1 1 г+1 | й>0
Но ( ) >—, а >1. Поэтому 0 Li
\1/ е2 1 '
Учитывая A5),получаем:
1 г + 1
< 1 + а,
откуда
г < A + а)е(и + 1) - 1.
И, следовательно,
A +а)е(л+ 1)- 1
к4 < max = A + оJе - 1.
» > 1 п
151
/l 9\
В частности, при G = S*, как мы видели в п. 2.9, 1 + о = ехр(— In— 1.
Поэтому
*4 < V f- 2е - 1 * 5.
о
§ 3. Метод симплексов (МС) для решения систем линейных неравенств
ЗА. Метод симплексов (МС), как и метод эллипсоидов (МЭ), является
методом выпуклого программирования, основанным на идеях метода
центров тяжести (МЦТ), восходящих к [24]. Вместо эллипсоида мини-
минимального объема, описываемого на каждом шаге МЭ вокруг области,
"подозрительной на экстремум", в МС рассматривается симплекс малого
объема, содержащий эту область. Использование эллипсоида и симплекса в
конструктивных реализациях МЦТ определяется тем, что центр тяжести этих
тел легко вычисляется. У эллипсоида — это точка пересечения его осей, а ко-
координаты центра тяжести симплекса равны среднеарифметическим значе-
ниям координат его вершин хф = 2 лс,-.
л + 1 i
МС отличается от метода центральных сечений (метода центров тяжести),
предложенного в [24], существенно более экономным приемом построе-
построения симплекса малого объема, содержащего область, "подозрительную на
экстремум".
В МС, как и в методе центральных сечений, на каждой итерации через
центр тяжести очередного симплекса проводится гиперплоскость, разде-
разделяющая симплекс на два многогранника. В одном из них содержится иско-
искомый экстремум. Вокруг этого многогранника следует описать симплекс
малого объема, меньшего, чем объем симплекса, с которого начиналась
итерация. В [24] для этого требовалось q(ri) отсечений. Из рассуждений
[24] следует лишь грубая оценка q(n) < и In и. В методе симплексов
Я(п) = 1.
3.2. В [94] приведена версия МС применительно к решению задач ли-
линейного программирования, или, что практически то же самое, примени-
применительно к решению системы линейных неравенств.
В {94] решается задача: найти х G Rn такой, что
Ах > 0, A8)
где А — m X и-матрица ранга п (т> п).
В таком виде может быть записана и задача линейного программирова-
программирования. Оптимальные планы прямой и двойственной задач линейного програм-
программирования являются решением системы линейных неравенств, состоящей
из ограничений той и другой задачи, и неравенства между их линейными
формами.
Пусть е > 0, е Е Rm. Без ограничения общности будем искать реше-
решение A8), нормированное условием
(е, Ах) = 1. A9)
152
Будем считать, что система A8), A9) имеет решение.
Обозначим через В (я X т) -матрицу с неотрицательными элементами
такую, что det ( В А) Ф 0.
Ясно, что множество X решений A8), A9) содержится в множестве
решений системы
В Ах > 0, (е, Ах) = 1. B0)
Множество решений B0) — обозначим его Ав — есть и-вершинный
симплекс, лежащий в гиперплоскости (е, Ах) = 1. Его грани задаются
уравнениями
(iBA)t,x) = 0, (е,Ах)= \. B1)
Здесь (BA)i - /-я строка (я X я)-матрицы В А.
Пусть хт - центр тяжести симплекса Ав; х1? ..., хп - вершины этого
симплекса. Предположим, что хф не есть решение системы A8), A9).
Найдем матрицу В\ которая определяет симплекс Ав$, содержащий
множество Л" решений A8), A9),.
Дв. ±{х\В'Ах > 0, (р.Ах) = 1}
и имеет объем I Afi» I •< I Ав I (здесь речь идет о (п — 1)-мерном объеме
в плоскости A9)).
3.3. Пусть а = Af — та строка матрицы Л, для которой не выполняется
неравенство A8) в хф, т.е.
(а,хт) = {Ahxm) < 0, B2)
а хк — та вершина Ав , для которой (a, Xj ) минимально:
(а, хк)
/
Мы нумеруем вершины Ад, исходя из следующих соображений. Грани
Ав в соответствии с B1) задаются уравнениями
BfAx = 0, (е,Ах) = 1, BГ)
где Д7- - /-я строка матрицы В. Вершина Ав , противостоящая грани B1'),
нумеруется номером / и обозначается дсу.
Положим Ь = ВкА (Вк — к-я строка В, Ь .— и-мерная вектор-строка).
Построим матрицу Вf следующим образом. Увеличим А:i-й элемент
матрицы В для всех / на величину
(*. хк)
t = ' , п > 2, B3)
(а.хк)(п2-2п)
и сохраним прочие элементы.
Поскольку уравнения граней Ав имеют вид B1'), то уравнения всех
граней АВ9, кроме к-и, те же, что и у Ав, а уравнение Лг-й грани Ав»
(Ъ + ta)x = 0, (е, Ах) = 1, B4)
153
в то время как уравнение к-и грани Ав
Ьх = 0, (е, Ах) = 1.
Поэтому хк — общая вершина Ад и Afii, а исходящие из нее ребра А?»
направлены вдоль соответствующих ребер симплекса Ав:
х! - хк = е.(х. - хк\ j Ф к B5)
(х f — вершины Ав $).
Матрица /?', как и матрица В, состоит из неотрицательных элементов,
поскольку t > 0.
Действительно, (Ь9 хк) = (ВкА, хк) > 0, так как вершина хк симплекса
Ад противолежит грани (ВкА, х) = 0, (е, Ах) = 1, а симплекс Ад задается
неравенствами B0). Кроме того, и (а, хк) = (At, xk) > 0. В самом деле,
если бы было (а, хк) < 0, то в силу выбора индекса к было бы верно
(a, Xj ) < 0, 1 </ < /I, а тогда для любых х имело бы место 1 (Ах>0).
Это следует из того, что множество решений X системы A8), A9) лежит
вАв,а (а, х) = (Aif х) < 0 Vx G Ав в силу (а, х;) < 0, 1 < / < л, и,
стало быть, X = ф. Таким образом, (Ь9 хк) > 0 и (д, дг*) > 0 и, следова-
следовательно, t > 0.
Новый симплекс Ав* содержит часть А старого симплекса Ав :
А = ABi П Ав = {jc \BkAx+AiX > 0, Я/Лх > 0,
/ Ф ку (е, Ах) = 1} П { х | #*Лх > 0, Я/Лх > 0,
/ ^ к, {еу Ах) = 1} = { х G AB \Atx > 0).
Симплекс АВ9 содержит множество X решений системы неравенств
A8). Ниже будет показано, что объем Ав # по крайней мере в 1 +
раз меньше объема симплекса Ав. Таким образом, от шага к шагу сокра-
сокращается объем симплекса, содержащего решение системы A8).
3.4. Вычислим предварительно координаты вершин лг*-, / Ф к, сим-
I Ав1
плекса Ав» и оценим .
Вершина л:Д /. Ф к, принадлежит к-и грани Ав». Поэтому в соответ-
соответствии с B4)
(Ь + ta)x) = 0, у Ф к.
Учитывая B4),получаем:
{Ъ + ta){xk + ej(xf - хк)) = 0.
154
Отсюда
ta)(xk-xf) (b + ta)xf
1
ef (b + ta)xk (b + ta)xk
Ho bxj = О, / Ф к, поскольку при j Ф к вершина Xj принадлежит
к-и грани симплекса Ав, уравнение которой Ъх = 0, (е,Ах) = 1. Сле-
Следовательно,
1 *ЛХ/
е/ " F + ta)xk '
Таким образом, длины ребер Ав » получаются из длин соответствующих
ребер Ав делением на
2 taXf bxk + ta(xk - xj)
— = l - 7 Г~ = ~7T ; • B6)
e;- (b + ta)xj (b + ta)xk
Поэтому
тт^-г- п — • B7>
i г>лЛ
По выбору индекса Л в(дс/к - дс/) > 0. Поэтому — > . Учитывая
ef (Ы- ta)xk
выражение B3) для /, получаем:
1 Ьх* 1 , 1
ei ( (Ьхк)а \ 1 (я-0*
[ь + ) 1 +
(
ДХа:(Л2 ~ 2 П)/ П2 — In
B8)
В силу B6)
2 — = (n - 1) - 2
= (л-П- 2 — + —
Но в соответствии с B2)
/1 X s
ахт = а 2 — < 0.
Поэтому
2 -!>(„_!) +
(b
155
или, подставляя в
Из B7)
1
Отсюда
П
1
«/
и
1
> /1 -
B8)
это
1
-2(,
неравенство значение t из B3),
(я-
/*
FI - A
1
"О2
1
А: */
' = /I — /X.
- > Я - /X.
Ом).
B9)
C0)
C1)
Действительно, S In (I \ej) — вогнутая функция переменных 1/еу-. Это зна-
значит, что ее минимум достигается в крайней точке ее области определения —
многогранника C0). Координаты всех вершин этого многогранника опре-
определяются следующим условием: п- 2 из 1/еу равны /it, а одно 1 /еу- равно
л-(л-1)д. Поэтому П — ограничено снизу величиной цп~2(п-(п-\
/Фк е/
Учитывая значение ju из B8), получаем из C1):
1 / VI \
п — > ^""Ч— - (и - 1))=
¦•¦
Теперь можно оценить отношение объемов . Сопоставляя B7)
\ДВ*\
с последним неравенством, получаем (учитывая выражение B8) для /и):
In | Ав | — In j Ав> | > In
1-
(и - l)ln (\ —-)-
V (и-1Г/
и-1
) (И1J^ +sг
п-1/ 1 }(п-1J> 1 /(и -1O
г ¦ ' '
1 /(и - IO' 1 /(и - IJ'" * 2(и - IJ 2(и - IK
- / 1 1 \ 1 / 1 \
зО(«-1У ~ /(и-!J'/ > 2(й - IJ V " и-1/"
2(п - 1)
156
При больших п
bl^>_l_.ln/1 + _L_).
I Да' I 2(/i-lJ V 2(fi-lJ/
Таким образом, имеет место следующее утверждение.
Либо х, — центр тяжести симплекса Ав является решением исходной
системы неравенств A8), либо, переходя от матрицы В к В\ получаем
симплекс АВ', содержащий множество X решений исходной системы нера-
неравенств, и при этом объем Ав> меньше объема Ав по крайней мере
§ 4. Метод симплексов для решения общей задачи
выпуклого программирования
4.1. Рассмотрим общую задачу выпуклого программирования
fo(x) ¦+ min \ff(x) < О, /= 1,.... m:
х EG^R". ' C2)
Здесь fj (дс), / = 0,1,..., m, - выпуклые функции, G - выпуклый компакт
с непустой внутренностью. Будем считать G = Go симплексом. Если это
не так, заменим G симплексом До, содержащим область G.
Как и в методе эллипсоидов, введем выпуклую функцию /m+i(x) =
= р(х, G) - расстояние от точки х до области G. Тогда условие х G G
примет вид fm +1 (х) < 0, и задача C2) перепишется в форме
/о(*) - min 1/Дх) < 0, /- 1,2,... ,/я + 1. C2')
Описание общей схемы МС не отличается от описания общей схемы
МЭ (см. [67]). Следует только всюду заменить эллипсоиды W/на симп-
симплексы Д/, а области ^ = {х€ RV_ t \Pj(t)X <P/(/)JC/), содержащие искомое
решение (если оно существует), на области Д* = {xgA^j \рщук<р^усг).
При версии метода с глубоким отсечением следует заменить области
Щ = {х е W^x \dm +(р/@, х-х,)<0}
на
Д, = {лед,.! \dm + (р/@, х-хд < 0}.
Здесь дс/ - центр тяжести эллипсоида (соответственно симплекса) на 1-й
итерации.
4.2. Опишем особенности шага МС для решения выпуклых задач.
На каждом шаге МС имеется симплекс Д в Rп с вершинами хг, ...
1
..., хп+1 и центром тяжести х» = S xt. Кроме того, имеется
п +1 1
вектор р - опорный функционал к одному из функционалов /}, i = 0,
1, ..., т,т+ 1, задачи C2') и константа d. Область, "подозрительная
157
на экстремум", представляет собой часть симплекса Д:
А = {х G A\d + (х-х„ р)< 0}.
Обозначим
ф) = d + (х-хт, р)9
*i я </>(*/) = «* + (*/-*., p), 1 < i < ai + 1, C3)
где xt - вершина симплекса Д. Суммируя C3) по /, получаем:
л + 1
S C4)
Пусть к — номер из 1, л + 1, который отвечает наименьшему <#. Таким
образом,
ipk < <р,, / G 1,л + 1. C5)
Будем искать вершины х[, i G 1, п + 1, симплекса Д', содержащего об-
область А, в виде:
** = хк,
Х{ = хк + ^(дс# - **), /G/= { 1,2,..., к- 1,Л + 1,...,л + 1}.
Здесь е/ > 0 — подлежащие определению параметры.
Формулы C6) означают, что симплекс А' имеет вершину в точке хк
и ребра, идущие вдоль ребер симплекса Д. Ясно, что отношение объемов
А' и А равно
7ТГ ¦ .5Л (ЭТ)
Параметры е/ — отношения длин ребер симплексов А' и А - должны
обеспечить минимум отношения C7) при условии А ? А', или, что то же,
при условии, что вершины А лежат в А'.
Пусть/(+)= {iGI\*Pi>0}9 ^(-)=( /€/|<р/<0}. Возможны 3 случая
А, В и С.
Случай А. фк > 0. По определению номера к в этом случае ^/ > 0, / G
G 1, п + 1, и, следовательно, <р(х) > 0. Это значит, что либо А пусто, либо
А лежит в гиперплоскости ф(х) = 0.
Если А = 0, задача не имеет решения. Если А принадлежит гиперплос-
гиперплоскости <р(х) = 0, то объем | А | = 0 и задача решена.
Далее будем считать <рк < 0. ^
Случай В. /(_) = 0. Тогда область Д уже симплекс с вершинами C6) и
*> = */ = -тт-т = ^^' /G/- <38)
Случай С. (рЛ<0и/(_) ?=0. В силу C4) и</>0в этом случае /(+) Ф ф.
Запишем выражения для вершин А. Координаты вершин щ облас-
области А, лежащих на ребрах, которые исходят из хк, при t G /(+) определяются
158
по формуле
Щ - хк + Tt(xt-xk), C9)
где
Tf = _J^*J i**_. D0)
I ?>* I + I <Pk I Vt - 4>к
Вершины н^ области А, лежащие на ребрах, которые исходят из хк,
при s ?/(-) совпадают с вершинами xs симплекса А:
«, - х*. D1)
Как видим, us можно определить по формулам C9) при rs= 1. Наконец,
координаты вершин uts многогранника А, лежащих на ребрах, которые
связывают вершиныxt симплекса A (t E/(+)) с вершинами xs ($€:/(_)), вы-
вычисляются по формуле
Щ$ = TtsXt + A -Tts)xs = ** + rf5(xr-x5), D2)
где
<«>
43. Запишем теперь условия принадлежности вершин ии uSy uts области
А симплексу А', определяемому вершинами C6).
При tGI(+) вершина щ многогранника А лежит на прямой, содержащей
ребро xkxt симплекса А'. Вершина щ принадлежит симплексу Д\ если от-
отрезок хк ut не длиннее ребра хк х\. Учитывая C9) и C6), можно переписать
условие хкщ < xkxt в виде:
хк + Tt(xt-xk) <хк + et(xt-xk).
Следовательно, условие принадлежности ии t G /(+) к А' сводится к не-
неравенствам
et >ти te /(+). D4)
Аналогичным образом получаем условие для us G А' при s G /<_):
es > 1, s € /(_>. D5)
Условие принадлежности вершин uts, t € /(+), J^/(_) многогранника
А симплексу А' заключается в том, что луч xkuts пересекает ребро
xsxt симплекса А'в точке х0, лежащей вне отрезка xkuts. Точка х0 пере-
пересечения отрезка x'sx'tn луча xkutsопределяется значениями аи ^, для
которых
аде; + A -а)*; = рхк + A -&)ии.
Здесь 0 < а < 1. Вершина uts области А принадлежит А\ если C < 0. В соот-
соответствии с C6) и D2) последнее равенство принимает вид
*[«,*, + 0 -es)xk] + A -ot)[etxt + A -et)xk] =
= fixk + (l-fi)[Tfixf + (l-rr,)xj, tei(+> sG/(_},
159
или
aesxs + A -a)etxt + [a(l -es) + A -a)(l -et)]xk =
= pxk + A -$)Ttsxt + A -0)A -т,5)*„ f e /(+), s G /(_}. D6)
Чтобы вычислить значения a и /3, определяющие точку jc0, приравниваем
коэффициенты при xs,xtn хкиз правой и левой частей равенства D6).
Получаем:
(!-«)**
где
1 -^s <*
es i-p ' et 1 - /3
ae, + A -a)ef = 1 -ft t G /(+), s G /(->
Третье из этих равенств является следствием первых двух. Поэтому его
можно опустить. Складьюая первые два равенства, получаем:
1ZI!L +I1L . _l_f rG/(+), *€/(_,. D7)
е5 ef 1-/3
Как мы видели, условие «rj G Д' эквивалентно неравенству /3<0 или
в силу D7) неравенству
1—12- + -^ < 1, Г G /(+), 5 G /(_). D8)
Таким образом, условия принадлежности вершин ии uS9 uts многогранни-.
ка А симплексу А' записываются в виде:
et > ти t G /(+),
е3 > 1, s G /(_),
1 г г <49>
|Д1
4.4. Вычислим отношение объемов симплексов, содержащих
I А|
области, "подозрительные на экстремум", на двух последовательных
шагах МС.
1Д'1
В соответствии с C7) = П et. Параметры е( должны быть
выбраны так, чтобы они обеспечили минимизацию или максими-
максимизацию
I А| 1
-Ц1 = П — E0)
1Д I '€/ е§
160
при А С Д\ Такой выбор ег позволяет из всех симплексов А', построенных
указанным способом (с вершиной хк и ребрами, идущими вдоль ребер А)
и содержащих область А, выбрать симплекс А1 минимального объема.
Введем новые переменные
1 1
X, = — - h t G /(+), х, - 1 - —э s е /(_).
et < es
Ясно, что \t > О, Х5 > О, поскольку согласно D5) es > 1, s ? /(_), а из гео-
геометрических соображений,определяемых идеей метода, et < I, I
В новых переменных:
|А|
—— = П A+Л,) П A-Х,). E1)
|А | »е/(+) ^е/(-)
Перепишем неравенства D9) в новых переменных. Имеем:
1 < 1+Хг < —, t е/(+),
о < х, < 1, s e /(_},
(l^rrj)(l-X5) + rr,0+Xr)<l, Г€/(+),
или, учитывая выражения D0) и D3) для rt и гГ5,
14>k I
O<X5<1, sG/(.)} E2)
Обозначим через //+ч множество тех t € /^+^, для которых *pt > 0,
и пусть /(_) = /(_). При Г G /(о) = /(_)\/(+) (т.е. при Г, для которых
<pf = 0) положим Хг = 0.
Таким образом, переменные \t9 t € /(+), Xs, s G /(_), которые оп-
определяют симплекс А' минимального объема, содержащий область Я,
являются решением задачи математического программирования:
П A+Х,) П (l-Xs)->max, E3)
E4)
Положим
Xf»*ft.
11. Д.Б. Юдин 161
Первое и второе из условий E4) заменятся неравенствами
1
Поскольку, по определению индекса к, \ ys | <
вия E4) заменятся неравенствами
|, то первые два усло-
услоТретье из условий E4) в новых переменных - тождественное неравен-
неравенство &<&.
Таким образом, задача E3)-E4) эквивалентна следующей одномер-
одномерной условной экстремальной задаче:
= П
П
-* max,
E5)
Пусть решение этой задачи #*. Координаты вершин симплекса А' вы-
вычисляются по формулам
где
\t
1
1
1-Х, 1-д*|
1.
О,
E6)
i = k.
Напомним, что формулы E6) относятся к случаю С, когда ук < 0
Целевая функция Л(#) задачи E5) логарифмически вогнута. Поэтому
решение #* задачи E5) можно получить дихотомией (последовательным
делением отрезка [0, 1/11*1] пополам). Как мы увидим ниже, чтобы га-
гарантировать решение требуемой точности любой выпуклой задачи методом
симплексов за число шагов, определяемое оценкой сложности МС, необ-
необходимо решать вспомогательные одномерные задачи E5) с высокой точ-
точностью.
4.5. Приведем теперь алгоритм построения симплекса А', представляю-
представляющий собой основной вычислительный этап каждого шага МС.
162
а) Вычисляем
<# = (Р,х - х«, ) + d, К i < п + 1,
и находим к: <рк = min<#. При \рк > 0 останавливаемся. Если при этом
А = 0, задача не имеет решения. Если А *= 0, то при этом | А | = 0, и задача
решена; х+ — ее решение. Третьего при ук > 0 не может быть,
б) Строим множества
в)
и переходам к (д).
г) При /(_) Ф ф решаем одномерную условную экстремальную задачу:
П (l+i>(p,> П A
1
_) = ф полагаем:
Пусть # - найденное (точное или приближенное) решение этой зада-
задачи с Л (д) > 1. Полагаем:
и переходам к (д).
д) Полагаем:
0,
При этом
\Фк.
4.6. Приведем оценку трудоемкости МС, "предполагая точное решение
вспомогательной задачи E5).
Обозначим:
11*
163
Задача E5) перепишется в виде:
П A+Х*,) П A+Х*д)-»тах,
е/ ,е/
При этом по выбору к gs > -1, s € /<_) 9gt>0,tG J^+y, а в соответ-
соответствии с C4)
Ясно, что трудоемкость МС при отказе от глубоких отсечений будет не
ниже, чем в случае, когда они допускаются. Поэтому для оценки сверху
трудоемкости МС положим d = 0.
Обозначим / = /(+) U /(_). Вспомогательная задача выбора параметра X
принимает вид
^(Х)= П A+Х*г)-»тах|0<Х<1. E7)
re/
При этом
*>-1, rGJ, 2&=1. E8)
re/
Функция In ф9 (X) = 2 ln(l + X&.) вогнута по#г. Поэтому ее минимум
re/
по gr> г € /, при условиях E8) достигается в крайней точке области опре-
определения gr, т.е. при одном из gr, равном I /1, и прочих gr, равных — 1. Здесь
|/| <л — число точек множества/. Таким образом,
meo=\J\9Ko<n.
Вспомним теперь, что
Л Л
где # - решение задачи E5) и соответственно X - решение задачи E7).
Поэтому
где X* — решение задачи
Легко видеть, что условный минимум ф0 (X) при условиях 0 < X < 1
1
совпадает с ее безусловным минимумом и достигается при X* = — . При
о
164
этом из неравенства E9) получаем:
In j!~L > in ф0 (x.) = (о _
2
a/ l /a2' l to'
1 / 1
^1
При не малых a (т.е. для задач большой размерности л)
1Д1 / 1 \ / 1\
In —- >lnll + —: )>ln( 1 + —;).
I A'I \ 2a2/ \ 2nV
Это значит, что за один шаг метода объем симплекса А' уменьшится (по
отношению к объему А) не менее, чем в П + —-2 ) раз.
За N шагов объем симплекса AN, содержащего очередную область,
"подозрительную на экстремум", уменьшится по сравнению с объемом
исходного симплекса Ао, содержащего область определения задачи, не
менее, чем в I 1 + —2 1 раз.
После N шагов естественно принять в качестве приближенного решения
задачи C2') выпуклого программирования лучшую (по значению целе-
целевого функционала /0) точку 5с, для которой /0 Eс) = min /0 (х/). Здесь
Xf — центр тяжести симплекса, содержащего область, "подозрительную
на экстремум" на i-м шаге, а 5 (N) - множество номеров итераций i <N,
на которых центр тяжести xt очередного симплекса удовлетворяет всем
условиям задачи C2').
Абсолютная погрешность е точки 5с в качестве приближенного решения
задачи C2') равна
е<GГТ) {niax/o-min/o}«(—т) {max/0 -min/0} .
j
Соответственно относительная погрешность
€
max/о - min/о V IA |
Таким образом,
или
N
N / 1
- 1пA+ —-
п \ 2п
165
откуда
F0)
v
4.7. Покажем, что замена точного решения вспомогательной задачи E5).
приближенным увеличивает трудоемкость МС.
Вычислим приближенное решение Ъ задачи E5), исходя из следующих
соображений. Имеем:
П (l+#<ft)>l + i> 2 <ft,
п (i-*ifti)>i-a s
Отсюда
где
5(+) = 2 <ft, ^ =2
В соответствии C4) имеем:
S(+)-?(_) + </>* = (л+l)d F1)
Поэтому
h($)> 1 + d[(w + l)d+ I ^ I] - d25(+M(_). F2)
Пусть /!(_) - число элементов множества /(_). Поскольку
В силу F1)
5(+) = 5(_) + (л + \)d + |^ |<(/!(_) + 1)|^ | + (п
Тогда
| + (п
где
Неравенство F2) принимает вид
h{*)> 1 +*|Л 1A +7)- ^2 1^ 12/1(-)(л(^+ 1 +т). F3)
Л
Приближенное решение # задачи E5) обращает в максимум правую часть
F3)прид<= [0,1/|^|].
Максимум правой части F3) по # достигается при
1+7
^1^1= 1 < 1
2и(_)(л(_) + 1+7)
166
и равен
Л(?)=Г +
4И(_) (Л(-) + 1+7) 4И(_
Поскольку/(+) Фф,то Л(_) + 1<й, Поэтому
Таким образом, отношение объемов симплексов А и А' при приближен-
приближенном решении вспомогательной задачи E5) равно
|А| а 1
Оценивая так же, как и в предыдущем пункте, трудоемкость МС, полу-
получаем следующую оценку числа шагов N, характеризующего относительную
погрешность v решения задачи C2') выпуклого программирования при
принятом способе приближенного 'решения вспомогательной задачи E5):
#<4л31п-. F4)
v
Сравнивая F0) и F4), видим, что приближенное решение одномерной
экстремальной задачи E5) вдвое ухудшает оценку трудоемкости МС.
§ 5. Другая версия метода симплексов
для выпуклого программирования
5.1. В [7, 10, 11] описаны другие версии метода симплексов для реше-
решения задач выпуклого программирования, основанные на ином способе
погружения усеченного симплекса в другой симплекс.
Рассмотрим ортогональный симплекс в Еп:
Вершины этого симплекса:
a:1 =
х = A,1,..., 1) - центр тяжести симплекса Sn.
Проведем гиперплоскость Но: (а, х - х) =0 через центр тяжести Sn.
Она рассекает симплекс Sn на две части:
Hl={xeSn\(a,x-x)>0) и H2*{xGSn\(a,x-x)<0).
Рассмотрим усеченный симплекс
S= {xeSn\(a,x-x)<0}.
Требуется погрузить S в л-мерный симплекс Г, объем которого был
бы меньше объема S".
167
Докажем вспомогательное утверждение.
Лемма 1. Среди вершин симплекса Sn можно укзазать вершины Z\ G Нх
и z2 € Н2 такие, что гиперплоскость Яо отсекает на лучах, исходящих из
точек Zi и z2 к другим вершинам 5", неотрицательные отрезки.
Доказательство. Симплекс Sn имеет п + 1 вершин. Гипер-
Гиперплоскость #о содержит не более, чем л - 1 вершин симплекса. В против-
противном случае Яо проходила бы через п вершин Sn и его центр тяжести х,
т.е. через п + 1 аффинно независимых точек, чего не может быть, пос-
поскольку размерность Яо равна л - 1. Множество Нх содержит по крайней
мере одну вершину Sn. Если бы это было не так, то все вершины Sn содер-
содержались бы в Яо U Н2 и х — центр тяжести Sn — принадлежал бы Н2 как
внутренняя точка симплекса 5", в то время как по условию х € Яо. Ана-
Аналогично #2 содержит хотя бы одну вершину Sn.
Пусть уг — некоторая вершина симплекса 5", лежащая в tft. Если най-
найдется такая вершина симплекса 5" (обозначим ее у2), что на луче, исходя-
исходящем из ух к у2у Яо отсекает отрицательный отрезок, то это означает, что
у2 Е Н\, и на луче, исходящем из у2кух, Но отсекает положительный отре-
отрезок. Действительно, пусть z - точка пересечения прямой, проходящей через
Ух и^2, с гиперплоскостью Яо. Тогда по предположению^ G [z,y2].
Если бы у2 Е Яо, то и ух Е Но в силу выпуклости Яо. Но ух €Нх, поэто-
поэтому у2 принадлежит либо Нх, либо Н2.. Если у2€.Н2, то поскольку z — гра-
граничная точка полупространства, пересечение которого с Sn есть Н2,ау2 —
внутренняя точка H2i то ух — внутренняя точка того же полупростран-
полупространства, т.е.Ух € Н2, что противоречит предположению^ €¦ Нх.
Следовательно, j>2 € Нх. Если существует вершина .уз симплекса Sn
такая, что на луче, исходящем из у2 в д>3, #0 отсекает отрицательный от-
отрезок, то уз также принадлежит Я^ Продолжаем процесс из точки уъ.
Через некоторое число шагов мы можем снова вернуться в пройденную точ-
точку. Но каждое ребро обходится только один раз. Поэтому в силу конеч-
конечности числа ребер Sn процесс за конечное число шагов приведет в точку
Zx € Нх, обладающую предписанным в условиях леммы свойством. Ана-
Аналогично Я2 содержит точку z2, обладающую тем же свойством. Лемма
доказана.
Назовем свойство вершин симплекса ?", установленное леммой 1.
свойством (а). Другими словами, будем говорить, что вершинах7
симплекса Sn обладает свойством (а), если xJ 4 S и гиперплоскость Яо:
(а, х - Зс) =0 отсекает на лучах, исходящих из xf к другим вершинам
симплекса, неотрицательные отрезки.
Не ограничивая общности, можно считать х° = @,..., 0) ф 5, т.е.
(а, х) < 0. В противном случае можно перенести начало координат в точ-
точку х7 ? 5, а векторы х1 - х*',..., хп*1 - х* ортогонализировать.
Лемма 2. Пусть х° $ S и обладает свойством (а). Тогда а{ <0 V i €
Е 1,п, причем если щ = 0, то вектор х* параллелен гиперплоскости Яо:
(я, х - 5с) = 0 и *' ? S.
Доказательство. Гиперплоскость Яо: (а, х - х) -О отсекает
на каждой координатной оси неотрицательный отрезок. Пусть на /-й оси
отсекается отрезок ненулевой длины. Если х' G 5, то (а, х7) < (д, х) и,
следовательно, д; < 0. Если х7 ф S, то по гипйгтву (а) 3 X > 0 такое, что
160
Ах' принадлежит гиперплоскости (а, х - х) =0. Следовательно, и в этом
случае а; < 0. Пусть теперь на /-й оси отсекается отрезок нулевой длины.
Это значит, что /-я координатная ось параллельна гиперплоскости
(а, х - х) = 0. Следовательно, расстояние от вершины х* до Но равно
расстоянию х° до этой гиперплоскости, т.е. (а, х1) « (а, х°) « 0. Отсюда
следует, что д;- = 0 и х; € 5.
5.2. Введем обозначения: / * {/ \at < 0}, р = 2 я, < 0. Пусть число ин-
/е/
дексов в множестве / равно пх.
Приведем следующую процедуру построения симплекса К, содержащего
усеченный симплекс S и имеющего объем меньший, чем объем Sn.
Симплекс V строим исходя из условий {а, х) < 0, ах < 0, i € 1, и, или,
что то же," 2 аг = р < 0. Выберем вершину симплекса К с координатами
р р
0<Ь{ф< —, где /,=argmin-, Z>/ = 0, /#/ф.
Л^ i я/
Остальные /i вершин (обозначим их Зс') определим из системы урав-
уравнений
где л-мерный вектору вычисляется по формулам
@,0,..., -,0,...,0) при /G/,
@1, b2,..., 0,-_ i, 1, bj+1,..., bn) при i f. I.
Докажем, что симплекс V с вершинами b, xl,..., х п 'содержит усечен-
усеченный симплекс S. Имеет место
Лемма 3. со (Ъ, хх, х2,..., хп) Э S.
Доказательство. Гиперплоскость Но пересекает / -ю координат-
координатную ось в точке —х'. Поэтому х * в S. Согласно F5) х * = х *.
Пусть xj e S. По лемме 2 af < 0. Из F5) следует, что х' при / Ф /•,
/ € /, является точкой пересечения луча, исходящего из точки Ь, с лучом,
исходящим из х'* и проходящим через хЛ Из определения точки Ъ следует,
что пересечение луча, исходящего из Л и проходящего через точку пересе-
чения гиперплоскости Яо с /-й координатной осью, с лучом х *х* проис-
происходит вне S п9 т.е. х' является выпуклой комбинацией х * = х $их'.
Пусть теперь х/ $ S и Л/ < 0. Тогда Яо пересекает отрезок [х *, xf] во
внутренней точке. В соответствии с F5) эта точка и есть х'. Рассмотрим
еще случай, когда х^ ф S nctj =0. Тогдах^ является пересечением гипер-
гиперплоскости, параллельной Яо и проходящей через й, Сребром х'х**. Таким
образом, все крайние точки S принадлежат соF, х!,..., хп), откуда и сле-
следует утверждение леммы.
169
5.3. Разрешим систему F5) относительно X. Получим
xf -b=\i(gi -b), Х/ = — , /?/, F6)
р1а(-Ъи
и
*'-6 = с', i4l, F7)
где с1 — вектор с компонентами с' = 0 при / Ф i ису=я + 1-4/$)/^ /.
Найдем объем симплекса V(b), построенного на векторах F6) — F7).
Он равен модулю определителя, составленного из координат векторов
F6) и F7), деленному на п!
W(b)\
Здесь пх — число элементов в /. Не ограничивая общности, можно счи-
считать/ = A,2,...,«!).
Перепишем выражение для | V(b) | в виде:
(/1 + 1 -bim)n Ji /?/a/
^^ П , , . .. F8)
п\ /=i
Лемма 4. Справедливо неравенство
л-1
inf
Доказательство. Пусть вначале число индексов в / пх > 1. Тог-
Тогда p/af > 1, и при Ь/ф = 1 из F8) следует:
п п.
( п \ п Р
Учтем неравенство между среднеарифметическим и среднегеометри-
среднегеометрическим и соотношение р/а{ > 1. Получим:
ft
1=1 p-at \Wj-l/ \n-l
i*i
Пусть теперь n x = 1. Тогда при й/# = 1
(п+1-Ъи)п пп
л! л!
Таким образом, во всех случаях
/ п \ V п \п~1
F9)
170
5.4. Алгоритм рассматриваемой версии метода симплексов для выпук-
выпуклого программирования построен по общей схеме метода отсечений.
На каждом шаге построенный к этому моменту симплекс ортогонали-
зируется в соответствии с условием (а) леммы 1. Через центр тяжести
ортогонального симплекса проводится гиперплоскость так, чтобы одно из
определяемых ею подпространств содержало все решения исходной выпук-
выпуклой задачи. Усеченный таким образом симплекс погружается описанным
выше путем в симплекс, объем которого меньше объема симплекса, пост-
построенного на предыдущем шаге, и тд.
Если на некотором шаге число элементов множества / пх = 1, то пара-
параметр Ь процедуры совпадает с единичным вектором, соответствующим
р
min — . Если пх > 1, то параметр Ъ = bjm является решением однопарамет-
рической выпуклой задачи:
- mf
Фи) =
п'
Р
О < fe,- < min —
Подробное описание вычислительных процедур, отвечающих изложен-
изложенной здесь версии метода симплексов в выпуклом программировании,
содержится в [10]. Там же указьюаются некоторые недостатки версии
и намечаются пути их устранения. Отмечается, что для задач линейного
программирования погружение допустимой области в симплекс представ-
представляется более естественным, чем в эллипсоид. Кроме того, начальный симп-
симплекс может быть сформирован неравенствами — ограничениями задачи.
Впрочем, такие же замечания могут быть сделаны и относительно версии
метода симплексов, изложенной в § 3.
Сравнение описанной здесь версии метода симплексов с методом эллип-
эллипсоидов, приведенное в [10], предполагает классическую версию метода
эллипсоидов [67]% Однако для описанной в § 1 настоящей главы более
экономной версии метода эллипсоидов (так назьюаемая версия с глубо-
глубокими отсечениями) выводы [10] нуждаются в уточнении.
§ 6. Метод Кармаркара
6.1. Изложенные выше метод эллипсоидов (МЭ) и метод симплексов
(МС) представляют собой методы выпуклого программирования. Однако
каждый из них можно приспособить для решения задач линейного програм-
программирования. Стандартные конечные методы линейного программирования
характеризуются, как известно, экспоненциальной вычислительной слож-
сложностью. В отличие от них версии МЭ и МС для решения задач линейного
программирования обладают полиномиальной сложностью.
Впервые полиномиальный алгоритм решения задач линейного програм-
программирования предложен Л.Г. Хачияном [48]. В основе этого алгоритма лежит
метод эллипсоидов. Однако, как показали многочисленные*расчеты, теоре-
171
тические преимущества полиномиального МЭ над экспоненциальным клас-
классическим симплекс-методом на практике не подтвердились. В литературе
нет сообщений, позволяющих сопоставить эмпирические оценки линейной
версии МС и стандартного симплекс-метода.
Совсем недавно (в 1984 г.) Н. Кармаркар [87] предложил полиномиаль-
полиномиальный метод линейного программирования. Практическая проверка подт-
подтвердила эффективность метода. В статье А. Шрайвера*) приведены теоре-
теоретические оценки трудоемкости версии Хачияна метода эллипсоидов для
линейного программирования и базовой версии метода Кармаркара. Пред-
Предполагается, что решению подлежат задачи с целыми коэффициентами мат-
матрицы условий А и вектора ограничений Ъ. Через Г обозначается наибольшее
значение абсолютной величины коэффициентов А и Ь. Предполагается
также, что Т > п, m <п (т — число ограничений, п — число переменных
задачи). В этих условиях трудоемкость решения задач линейного програм-
программирования по методу эллипсоидов определяется величиной О(Н*]п2Т),
а трудоемкость метода Кармаркара — О(п7 In2 Г) битовых операций.
За счет специальной организации вычислений по методу Кармаркара удает-
удается при сохранении идеи версии алгоритма снизить теоретическую оценку
трудоемкости метода Кармаркара до 0(л6'51п2 Т) битовых операций.
В [39] описан опыт использования метода Кармаркара на серии тесто-
тестовых задач. Эта работа и другие сообщения позволяют предполагать, что
метод Кармаркара во всяком случае не уступает классическому симплекс-
методу.
Обсуждение метода Кармаркара стимулировало последующие работы в
этом направлении.
62. Изложим идею метода Кармаркара. Пусть А — правильный симплекс
в Еп, w — его центр, a L — линейное многообразие.
Рассмотрим задачу линейного программирования
(с, х) -+ min | jc € Д П L. G0)
Метод Кармаркара непосредственно применим к задачам вида G0),
в которых
G1)
0. G2)
К этому виду может быть сведена произвольная задача линейного про-
программирования. При этом, однако, увеличивается размерность задачи.
Алгоритм Кармаркара решения задачи G0) строит последовательность
точек х , х1 ,..., х по формуле
*' = </>(*'-*), x°=w. G3)
Опишем операции, определяющие функцию \р.
Пусть к началу i-й итерации имеется точка х1 ~х € int А П L. Следующие
три этапа составляют содержание i-й итерации.
1. Произведем проективное преобразование Г/, сохраняющее симплекс
А и переводящее хг ~1 в центр w симплекса A, L - в некоторое линейное
¦)Schrejver A. The New Linear Programming Method of Karmarkar // CWI news-
newsletter. - 1985. -№8.^-P. 2-14.
172
многообразие Lt Э w, а линейную форму (с, х) - в дробно-линейную фор
му. Обозначим ее числитель через (сТг х).
2. Спроектируем вектор cTj на L/. Обозначим полученный вектор че-
через cTf и сдвинемся из точки w в yf в направлении cTf на расстояние, не
выводящее точку yt из симплекса А. В базовой версии метода это расстоя-
расстояние равно половине радиуса шара, вписанного в А.
3. С помощью обратного проективного преобразования Tf1 возвращаем-
возвращаемся в исходную систему координат. Точка х , в которую при этом перейдёт
уг, и есть очередное i -й приближение к решению.
Покажем, что намеченный итеративный процесс сходится к решению
задачи G0) со скоростью геометрической прогрессии со знаменателем
Обозначим вершины симплекса в Еп через Ь09 Ъг,..., Ъп и через щ (х) -
барицентрические координаты точких € А:
п п
о
п
п
(заметим, что при Ао = { х G En+11 jc > 0,2 xt = 1} барицентрические ко-
о
ординаты точки х относительно вершин Ао совпадают с декартовыми
координатами jc/ вЕп+1).
Исследуем поведение функции
(с,х) (с,х)
заданной на int А, при проективном преобразовании А на себя.
Для любых двух точек и1, и' €= int А имеется единственное проективное
преобразование А на себя, Переводящее и} в vi. Оно задается формулой
п в*0>)
о оь(и')
Под действием преобразования Г* функция g (x) переходит в
gTi(x) =g(Tjl (x)) = ^^, G4)
где вектор сТ{ выражается через компоненты вектора с и параметры преоб-
преобразований 7*, а линейное многообразие L преобразовывается в линейное
многообразие LT{ =L{. Легко видеть, что задача линейного программирова-
программирования
:)->min \xEACiLi,
173
которая сопоставляется преобразованием Т% задаче G0), также удовлетво-
удовлетворяет условиям G1) и G2), т.е.
= 0. G5)
Обозначим через К пересечение вписанного в А шара с LTi =-i/; это
шарв?; радиуса р.
Поскольку А лежит в шаре, радиус которого в п раз больше радиуса
вписанного в А шара, то и А П Lt принадлежит шару радиуса пр.
Следовательно, найдется точка zt € К, для которой
G6)
Минимальное значение линейной формы (стг х) на А П Lt (равное ну-
нулю в соответствии с G5)) достигается на границе А П Lt. Минимальное
значение линейной формы (cTj, x) на К достигается в точке z{ на границе
шара К и не превышает значения (cTf , zt) в любой точке К. Поэтому в
силу G6)
(сТ(> %) < f 1 - -\cTv w).
Аналогичное неравенство имеет место дня всех точек отрезка, соединяю-
соединяющего Zf и w, т.е. для всех г, 0 <г <1: х
(сТр rzt + A - г) w) = (сТр гл(т)) < П - - j(cr/, w).
Поэтому в соответствии с G4)
¦ <77)
Положим х* (г) = Tfl(zf (г)). Поскольку zf (г) е А П Lt, то по опре-
определению Z,/ х' (г) G А П Z, и по определению gjv имеем:
Учитывая G7), получим:
g(x'(T))< П—— = (р(г). G8)
V(Z(T))
При г = 0 Zf (r) совпадает с w — центром А, а К достигает максимума на
А как раз в центре. Поэтому
^-^/(т)Iг = о = 0. G9)
Таким образом, правая часть G8) при малых г убывает с ростом г (числи-
(числитель убывает линейно, а знаменатель в силу G9) меняется медленно).
174
Несложный подсчет показьюает, что у ( - J < кп<р @), кп = 1 - О ( - ).
Поэтому, положив х* =*' ( -J, получим из G8):
•->-<
(Мы учли, что V(z{@)) >
= F(w).) Таким образом,
а поскольку V (х) <V (w), x G Д, то (с, х') < к',, (с, w), т.е. метод сходится
со скоростью геометрической прогрессии со знаменателем кп = \ -О(-).
63. Приведем описание конструкции метода Кармаркара.
Ядро метода составляет итеративная процедура решения следующей за-
задачи:
п
п\
Здесь А = {х€Еп\х>0 2 х/ = 1} - симплекс в Еп, А - матрица
/= 1
размера тХп,с€Еп.
Начальная точка для решения 9^0 х° =(—,...,— )— центр симплекса Д.
Предполагается, и это существенно для метода Кармаркара, что
(II)
Ниже приводится процедура построения последовательности точек х°,
х1,..., такой, что
,**), (80)
где а > 0 - абсолютная константа. (Допускается, что (с, х°) > 0; в против-
противном случае х° уже есть решение задачи 9о») Таким образом,** удовлет-
удовлетворяет всем ограничениям задачи, кроме условия (II) (с, х*) =0, а невяз-
невязка в этом условии убывает в геометрической прогрессии со знаменателем
175
1
—of—)Гв соответствующей схеме МЭ знаменатель был бы 1 — О ( —г-11.
\п/ \ \лу/
Опишем процедуру решения задачи SV (Редукция общей задачи линей-
линейного программирования к задаче #о будет приведена в п. 6.5.)
а) Введем функцию
П
Здесь и далее, если не оговорено противное,
На into A g (x) определена.
б) Пусть i" € into A - точка, для которой
Ах =0, *(*)>0. (81)
Опишем способ перехода от точки jc к точке Тх, для которой
Рассмотрим проективное преобразование Г симплекса А:
Перечислим свойства преобразования Г.
A) Г - взаимнооднозначно отображает симплекс? А на себя: при этом
/1 1\т
х есть образ при отображении Г центра х° = ( —,...,-) симплекса А.
\п п/
B) Функция g (x) = g (Гх) имеет вид
Сс х}
(П*,I/П(ГЬ,I/Я
(82)
где с= {cixu c2x2,...,cnxH).
C) Условие
А(Тх) = 0 (83)
при х G А эквивалентно условию
Ах = 0. (84)
где А = AD, D — диагональная матрица с элементами хь ..., хп на диа-
диагонали.
176
D) По условию (II) существует точка х* G Д такая, что Ах* = 0 и
(с, х? ) = 0. Пусть х * G Д такова, что Г Зс * = х*; тогда очевидно
Ах* = 0 и (?*•)< 0. (85)
в) Рассмотрим в гиперплоскости П={х€?я| 2х/ =1}, натянутой на
1
симплекс Д, два шара Vo и Vq с центром в центре тяжести х° симплекса Д.
Шар Ко описан вокруг Д, его радиус г0, а радиус шара К^ /}г0, где
0 < 0 < (рис. 7.3). Заметим, что шар Ухцп^ху вписан в Д, так что
п — 1
при 0 < K < Vp целиком лежит внутри Д. Имеем
Л*°=0. _ _ (86)
(В самом деле, А (Гх°) = 0, поскольку Гх° = х, а Ах = 0 по предположе-
предположению (81). Согласно свойству C) преобразования Г, условия (83) и (84)
при х € Д эквивалентны, т.е.
А(Гх°) = 0 => Ах° = 0.)
г) Фиксируем 0 и решим задачу минимизации линейной формы ( с, х)
на пересечении полупространства i4x = 0 и щара V$
(с, jc) -> min | Ах = 0, х е Vp. (87)
Эту задачу легко решить (все рассмотрения ведутся в гиперплоскости П).
Рис. 7.3
Ах = 0 - плоскость, проходящая согласно (86) через центр х° "шара" Vq,
так что надо минимизировать линейную формулу (с, дс) на "круге"
{х Е Vp, Ах = 0). Для этого достаточно спроектировать вектор ~с на мно-
гообразие {лг€ П, Лх = 0}.
Обозначим решение этой задачи через х@.
6.4. Докажем, что приведенная конструкция (п. (а) - (г)) обеспечивает
процедуру построения последовательности хку удовлетворяющей усло-
условиям (80).
12. Д.Б. Юдин 177
Заметим, что точка у = *° + /3(д* - д°) лежит в V& (поскольку
| х * — х° | < г0 - ведь весь симплекс А содержится в Vo) и удовлетворяет
условию Ау = 0 (так как Лдс° = 0 и 2*"» ¦ 0, см. (85) и (86)). Поэтому
у - допустимый план задачи (87). Стало быть,
{с, х0) <(?,у) = (с,х°)A -р) + (с, х»H.
Но по (85) (с", х *) <0. Поэтому
lc.x,)<(l-fi)(c,x?). (88)
Из (88) и (82) следует:
A -0) -4 —L ¦ „_ L -
(П^),)" (Пх,)я
\п п)
A - am*0I— • (89)
/
Таким образом, обозначая tt = п (лгр);, имеем
П
Поскольку Xfi € А, то 2 tt = w. Кроме того,
1
2 (г, - IJ =л2 и, -х° |2 < w2P2rS =и2
Поэтому, полагая $ = , 0 < X < , Т/ = tt - 1, получаем
Д"
Z т, « 0, 2 т] < X2 -?- .
(90)
Оценим теперь ( П tt) снизу. При X < из (90) следует \rt | < -z.
Поэтому In (I +rj)>Ti- кт*, где к — абсолютная константа. Отсюда
1п(( П /,) ) > ? 2 (т, - кт?) —J S т» > - —- .
178
Итак,
i
0<X<
2\/l
При этих соотношениях из (89) следует:
2
п —
Выберем X, удовлетворяющую неравенствам
О < X < — , кХ2 - X < 0.
Рассуждения настоящего пункта приводят тогда к следующему выводу.
Для некоторых абсолютных констант X* и ц* (ц * > 0) при 0 =
п -1
конструкция п. а) - г) из 6.2 обеспечивает оценку
Напомним, что по построению х^ € Vp С int0A и Лх^ = 0. Полагая
Тх = Гхр, получаем в соответствии с определением ~g:
g(Tx)<e n~lg(x),
Тх G into А, Л(Тх) = 0,
чего мы и добивались в п. б) конструкции.
Таким образом, доказано, что схема а)-г) обеспечивает построение
последовательности хк, удовлетворяющей условиям (80).
Отправляясь от х°, строим х' = Тх*~1, так что при всех /
х1' G into А, Ах* = 0
По определению х° - центр тяжести А. Итак,
M*(fc-1)
(с,**) <(с,х°)е П'Х гк9
где гк = < 1, поскольку П х7- < — при х G А,
/ пп
12* 179
Последовательность х°, ...,**, построенная в соответствии с предъявлен-
предъявленной процедурой, удовлетворяет таким образом условиям (80). Следова-
Следовательно, (а)-(г) представляет собой итеративный алгоритм решения
задачи ?>0.
6.5. Приведем теперь редукцию общей задачи линейного программирова-
программирования к задаче 9*0, в которой предполагается выполнение условий (I) и (II).
Как известно, общая задача линейного программирования может быть
сведена к системе линейных равенств и неравенств, описывающих ограни-
ограничения пары двойственных задач. Другими словами, любую задачу линейно-
линейного программирования можно свести к задаче
(*i): Ах = ЬУ х > 0, х €?\
где А = || a/i \\ -т X Л-матрица, Ь E?w, Ь = (Ьх Ьт).
Будем предполагать, что априори имеется оценка нормы решения зада-
задачи &х. Подходящим масштабированием можно привести задачу к виду,
к
когда ее решение удовлетворяем условию 2 х, < 1.
1
Введем две дополнительных переменных хк+х и хк+2 и рассмотрим
следующие объекты:
— вектор
у € Ек+2: J'= (*!,...,**, xk+i, х*+2)т;
— точку
— матрицу А порядка тХ (к +2) такую, что
_ к
(Ay)j =
— вектор
Решение задачи ^i определяется решением следующей задачи
типа 3^0:
(Я): {пйп(с1у)\Ау = 0, G, у) <0jGA),
180
где
A={yGEk+2\y>0, 2
Заметим, что точка у0 = [ , ..., ), очевидно, удовлетворяет ус-
\к + 2 к + 2/
ловиям Л У* = 0, у0 Е Д, а задача д*0 имеет решение. Таким образом вы-
выполняется требование (I) к задаче $V При Ук+\ < 0 выполняется также
требование (И). ^
Если дс* = (х*9 ..., х?) - решение Л*1э для которого 2 х* < 1, то*
1
.у* = (**,...,*?, О, 1- S xj) -решение З^о-
Первые /: компонент любого решения задачи д*0 составляют решение
задачи &х. Таким образом, задача 3^ сводится к задаче типа $>0. При
этом выполняются все предположения, принятые относительно задачи 3V
Как видим, сведение общей задачи линейного программирования к задаче
типа д*0 связано с существенным увеличением размерности задачи.
6.6. Описание шага итеративной процедуры, проведенное в п. 6.2, пред-
предназначено скорей для аргументации идеи метода, чем для характеристики
вычислительной схемы.
Шаг алгоритма Кармаркара состоит из проективного преобразования,
оставляющего неподвижными вершины симплекса Дв?"и переводящего
текущее приближение хк к оптимуму в центр х* = w симплекса Д,
сдвига из центра симплекса в направлении преобразованного антиградиента
целевой функции на расстояние, равное половине радиуса шара, вписанного
в Д, и возвращения в исходную систему координат.
Пусть D — диагональная матрица с компонентами вектора хк на диагона-
IAD |
, где ет = A,..., 1). В матричной форме одна
итерация xk+l = ip(xk) определяется следующей последовательностью
операций:
1. с« = [I-B\BBTYlB]Dc9
св 1
2. Ь = х° —аг где г = — — радиус шара, вписанного
11 с II
в симплекс, a G @, 1) (рекомендуется <* = у для поглощения ошибок
округления и повышения устойчивости алгоритма),
Db
3. xk+l -
eTDb
181
Таким образом, на каждой итерации вектор хк переводится проективным
преобразованием, сохраняющим симплекс А, в его центр. Преобразованный
градиент Dc проектируется на подпространство ADx = 0, етх = 1 (опера-
(операция 1°). Затем производится сдвиг из центра симплекса в направлении
[ ) на
\ II св II /
антиградиента целевого функционала ( — ) на такое расстояние
а
—¦—H2ZZZZI" » чт°бы следующее приближение не вышло за пределы
у/2п(п - 1)
симплекса А (операция 2° ). И наконец, построенный таким образом век-
вектор Ъ переводится в исходную систему координат обратным проектив-
проективным преобразованием (операция 3°). Это и будет очередное приближе-
приближение xk+l.
Метод останавливается при достижении допустимого плана х с таким
значением линейной формы (с, х), что —'—^- < 2~q, где q - заданный
параметр, определяющий требования к точности решения задачи.
В [47] приведена модификация алгоритма Кармаркара, ориентирован-
ориентированная не на традиционные ЭВМ фон-Неймановского типа, а на параллельные
или конвейерные ЭВМ — на так называемые систолические вычислители —
специализированные вычислители, в которых задачи линейного программи-
программирования решаются аппаратно. Такой вычислитель имеет 2 п +^г (m+4)(m+l)
клеток (простых процессоров), тп ячеек памяти (л - число переменных,
т — число ограничений задачи). Время выполнения одной итерации равно
5 т + 2 п + О A) тактов. Число итераций не превышает величины порядка
п In— ), где М — максимум модуля исходных данных, а е — требуемая
точность.
§ 7. Проективный метод
7.1. Описанный в предыдущем параграфе метод Кармаркара (в дальней-
дальнейшем — метод К) указал новые пути повышения эффективности алгоритмов
решения задач линейного программирования. В настоящем параграфе изла-
излагается предложенная А.С.Немировским модификация метода Кармарка-
Кармаркара [36] (в дальнейшем метод N), делающая очередной шаг в этом направ-
направлении. Теоретическая оценка скорости сходимости алгоритма N для общей
задачи линейного программирования совпадает с оценкой скорости сходи-
сходимости метода К для задач, удовлетворяющих дополнительным условиям.
Как мы видели, метод К непосредственно применим к задачам вида:
182
при дополнительных условиях
(I) Лх° =Л w= 0, где х° = w= i е„Т =~ A,..., 1),
(II) L* = 0, где L* - оптимальное значение целевого функционала за-
задачи 3V
Другими словами, метод К непосредственно применим лишь к отыска-
отысканию неотрицательных решений системы линейных неравенств при дополни-
дополнительном допущении, что система Ах = О имеет решение х = еп .
Конечно, к такому виду можно свести произвольную задачу линейного
программирования (при наличии верхних оценок норм решений прямой и
двойственной задач). Но за это приходится платить существенным увеличе-
увеличением размерности исходной задачи.
В приведенном ниже описании метода N [36] приводится процедура
решения задачи ( #о) > не предполагающая выполнения условий (I) и (II).
Подчеркнем, что даже в том случае, когда требования (I) и (II) удов-
удовлетворяются, метод N отнюдь не вырождается в метод К.
Легко показать, что увеличивая число переменных лишь на единицу и
сохраняя количество ограничений, можно свести произвольную задачу
линейного программирования к задаче типа ( #о) • При этом естественно
предполагается, что известна априорная оценка сверху нормы решения, ко-
п
торую всегда можно представить в виде 2х;- < I. Чтобы свести задачу
1
линейного программирования
п
(с, х) -> min \Ах = Ьу х > О, 2 х;- = 1
/ = 1
к виду ( So), достаточно дополнить искомый вектор х (п + 1)-й компонен-
компонентой xn+i, положить сп+х = 0, дополнить матрицу А столбцом из нулей,
отвечающим дополнительной переменной хп+1, и вычесть из каждого из
элементов /-й строки матрицы условий А соответствующую компонен-
компоненту ty вектора ограничений Ь,
7.2. Изложим идею метода N.
Будем решать задачу ( %), не требуя выполнения условий (I) и (II).
Обозначим через 5В вписанный в А шар. Бго радиус р.
а(х)
Пусть f(x) = - дробно-линейная функция без особенностей в А,
Ь(х)
L — линейное многообразие в Еп. Рассмотрим две задачи:
У /(*) ¦+ min|jc G А П L, (91)
, L): f(x) -+ min |x G 58 П L. (92)
К первой из этих задач сводится (при заданной оценке сверху нормы реше-
решения) произвольная задача дробно-линейного (а стало быть, и линейного)
183
программирования. В частности, задача (д*0) является задачей вида
&(f,L.). В ней f(x) = (с, х), а линейное многообразие L опредечяется
п
системой линейных уравнений Ах = О, 2 х;- =1. Вторая задача имеет более
1
удобную для анализа область определения. Если шар да пересекается с ли-
линейным многообразием L, то решение задачи д* лежит на границе соответ-
соответствующего "круга". Если условия задачи & несовместны, то в качестве ее
"решения" будем «по определению принимать точку L, ближайшую
к центру тяжести w симплекса А. _
Метод N строит по определенным правилам последовательность { 9*t)
задач вида & и соответственно последовательность { 9% } задач вида &.
Обозначим через xf решение задачи #/.
Опишем правила построения задач последовательности (&{), точнее,
правила перехода от задачи ^/-i к S*j.
Пусть jc^i - решение задачи ^/-i, если она совместна, и ближайшая
к w — центру тяжести Д — точка Х^тт-если задача несовместна. Если
*f-i € 58, ^ е S - план задачи S^z-j, для которого //_iO>) <
< //^(xi-i), то и весь полуинтервал [у, X/_i) состоит из планов зада-
задачи 9 f _!, на которых значение // -i меньше, чем в точке Х{ _i. Стало быть,
[у, Xf^i) не пересекается с Ж.
Вектор {• (/ - 1) =jc/_i -w определяет полупространство
в котором находится решение задачи 3fii^l — точка, в которой значение /
меньше, чем в */_i. Ясно, что это неравенство выполняется при х^г ^58
уже для всех у € ?/__!. При этом ?T(i - 1)?(/ - 1) > Р2. Действи-
Действительно, при X/_i G ЭЖ ST(^' ~ 1M 0' - 1) = Р2 (в силу дробнолиней-
ности / решение совместной задачи & i-\ достигается на границе $) и
€*С# — 0€(* -0>Р2 при Sni/4 = 0.
Сопоставим вектору ?, определяющему полупространство (^— w, ?) >
^%т%> р2, проективное преобразование, переводящее симплекс Д в себя,
Г*(х) =
2 [1-7(O«/]JC/ 2
1 1
где
= max
184
В результате проективного преобразования ;гН*-1) дробнолинейная
функция //_i00 - целевой функционал задач ^^и^^! преобразо-
преобразовывается в ft(x) - целевой функционал задач S>t и 3%, а линейное
многообразие Z//-1 преобразовывается в L/. Это соответствует переходу
от задач S*/_i и &i-\ к задачам &i и З6/.
Обозначим решение задачи &t через X/ и рассмотрим вектор % (/) =
= X/ - w, определяющий полупространство (у — w, (• (/)) > ?t(i)?(i),
в котором лежат допустимые планы задачи д**, лучшие по значению
целевого функционала /(х), чем Xj.
Построим функцию
п
V(x) = П X).
/ = 1
Оказьгаается (и на этом основана вычислительная схема и оценка трудо-
трудоемкости метода АО, что для всякого у € Д, принадлежащего полупростран-
полупространству (у - w, %) > ?* ^ > р2, имеет место неравенство
(93)
где к > 1 -Абсолютная константа.
С другой стороны, функция К(х), которую можно рассматривать как
функцию Ляпунова рассматриваемого метода, не может беспредельно
расти. Ее максимум достигается в центре тяжести w = (—,..., — ) сим-
симплекса Д и равен rt~ n. На этом и основана идея метода N.
Преобразование jH'-O естественным образом - заменой перемен-
переменных — переводит задачу S*/_i в задачу &i аналогичной структуры.
Пусть задача #>0 невырождена в том смысле, что множество Lo *
п
= {х \ Ах = 0, 2 х/ = 1} пересекается с int Д. Обозначим
1
z* = arg max { К(х) | х G Lo n A),
так что V(z*) > 0. Обозначим, кроме того, через х* решение задачи 3*0>
и пусть 0 < € < 1, a ze = ez* + A - б)х* - близкий (при малом е) к опти-
оптимальному допустимый план Ро. Задача 5й, получается из #0 проективной
заменой переменных, сохраняющей симплекс Д. Пусть z€(i) - допустимый
план 9>ь отвечающий ze, a xt - план 9>0, соответствующий плану X/ зада-
задачи 3>ь если X/ е 5В, и х,» ¦ при X/ ^ 5В. Обозначим через х' лучший (по зна-
значению стх) среди планов хг9 ..., xt (при X/ = ¦ полагаем ст(«*) ¦ +°°).
Будем считать план х* i-м приближенным решением задачи д*0» форми-
185
руемым процедурой N. Оценим скорость сходимости стх* к стх* = с„.
Заметим для этого, что если при некоторых кие имеем
стхк > cTz€9 (94)
то при всех / < к либо xt ? 58, либо //(*/) >//(*е(О)- Поскольку z€(i) -
допустимый план 9>fi то отсюда следует, что при / < к
так что
Но TiWze(f) = ze(i+l), и следовательно,
Поскольку V(z) < V(w) при z E Д, получаем отсюда:
< Ж
к <
V(ze)
ИЛИ
1 V(w)
к < In —^-A (95)
1пк F(ze) v
Итак, (94) влечет за собой (95). Откуда следует, что неравенство
V(w)
V(z€)
1
к > In
Ык
влечет за собой
стхк < cTze.
Оценка скорости сходимости процедуры N вытекает отсюда (см. ниже
теорему N2) с помощью простых наблюдений:
V(z€) > enV(z*), cTz€ < с, + ecT(z* -х*).
7.3. Обсудим подробней метод N. Введем следующие обозначения:
Ех = {xGEn\i;xf = 1},
/
Lo = {xGE, \Ax = 0},
Ш = (с,*), Го = Lo П Д, YS = Yo U {*}.
Пусть 2) - группа диагональных матриц порядка п с положительными
элементами по диагонали. Приведем в соответствие каждой матрице
D € 9) проективное преобразование TD(x), переводящее симплекс Д
в себя:
TD(x) = {elD-lxYlD-lx.
Нетрудно показать, что
186
Приведем краткое описание метода N [36]. К i-й итерации (i> 1) метод
располагает следующими объектами: D(i — 1) Е SD и x(i — 1) ? Y?. При
/ = 1 D@) - la - единичная диагональная матрица, *@) E Yq - произ-
произвольный элемент К©.
Множества, векторы и функции, используемые в последовательных
итерациях процедуры, связаны следующими соотношениями:
/,,_, = [хЕЕ, \AD{i-\)x = 0},
г,_! = /:,__, пд, у;., - у,_, и {¦>,
6A-1) = />(/-IK.
(Проективное преобразование Tq(x) переводит линейную форму в дробно-
линейную.) Продолжим //_i и 7*0, />Е2)сДнаД*=Ди {¦}, положив
//_ 1 (*) = +°°, TD(*) = ¦. Легко видеть, что
х = Д*.
Опишем вычислительную процедуру 1-й итерации метода N.
ЦУ\ .
Вычисляем ортогональную проекцию w(i) центра тяжести w = — еп
п
исходного симплекса Д на многообразие I/_i. Если u(i) ф intA, то пола-
полагаем:
и переходим к N. 2°. В противном случае переходим к N. 3°.
N. 2°. Проверяем, пересекается цр симплекс А с гиперплоскостью П@ =
= {jc е Еп |?т(/)(х - м@) = 0). Если пересечение Д П П(/) = 0, принимаем
решение о несовместности задачи ^0 • Если АПпфФф, переходим к N. 6°.
N. 3°. Вычисляем ортогональные проекции a(j — 1), Ь (/ — 1) векторов
в(/ — 1), b(i - 1) на подпространство L{_x - tt(i) так, что сужение ф{_г
функции //__! на?/_! имеет вид:
Переходим к N. 4°^
N. 4°. Если//_! постоянная на /,/_ t, то полагаем
(здесь Э Д = { х € Д | 3 /: х{ = 0 }) и останавливаемся, объявив x(i) точным
решением задачи. В противном случае переходим к N. 5°.
N. 5°. Находим точку y(i) минимума дробно-линейной функции <?/_!
на пересечении симплекса Д с (не более чем двумерной) аффинной плос-
плоскостью Fh натянутой на точки u{i\a{i - 1), Ъ (/ - 1).
187
Выбираем какую-либо точку у (i) GLi_i ПА такую, что <Pi-i(y(i))<
< <P/_i E^@)- (В качестве y(i) можно взять, например, точку у (i) или
вершину Д П?;_ j, в которой <р/_ г не больше, чем в y(i).)
Обозначим G@ = — V^/_i(.y (О). Определим и(/) как ортогональную
проекцию к (/) на многообразие (х € Еп \qT(i)(x - .у (/)) = 0} и положим
?(/) w@ - w. Переходим к N. 6°.
N. 6°. Определим
{-
\ X
-1),еспи/о<*(/))>/о<?(/-1)),
x(t) в противном случае.
На этом 1-я итерация заканчивается.
7.4. Для характеристики и оценки метода N введем для { G Еп9 % Ф 0,
следующие функции:
Положим
Yo П
V(x) =
z* = a
S@ =
intA Ф 0,
• Uxh x e д,
i
igmax{F(x)|jc G Уо},
t
2g(?(/)),
l
(96)
Свойства метода N, используемые для решения задачи #>0> устанавливают-
устанавливаются следующими утверждениями [36].
Теорема Nt. Если метод N, примененный к задаче д*0> остановился на
некоторой итерации по правилу N. 2°, то задача несовместна, а в случае
остановки на итерации / по правилу N. 4° вектор x(i) является точным
решением задачи.
Теорема N2. Пусть YQ П int Д Ф ф. Тогда для всех /, для которых ме-
метод N не остановился на первых i шагах, выполняются следующие
188
соотношения
2 || «/) Hi || {(/) || ) ln| > /ln|,
(97)
где L* — оптимальное значение целевого функционала задачи &0.
Сравним полученные оценки с полученными в § 6 оценками эффектив-
эффективности решения по методу Кармаркара (методу К) задачи ?>0> удовлетво-
удовлетворяющей дополнительным требованиям:
(I) Ах° » Aw ¦ О,
(II) I* - 0.
Для задачи #0> удовлетворяющей условию (I), 0«S5l,az*ssw. В этом
случае из (96) и (97) следует, что для всех / имеем
-i*f} *•.»)-*•).
Этот результат совпадает с теоретической оценкой скорости сходимости
метода К (см. п. 6.3 § 6), где (ст, w) ¦ (с,*°), гк < 1 и в силу условия (II)
L* ш о.
Таким образом, оценка скорости сходимости метода N при решении*
задачи 3*0 > не обязательно удовлетворяющей условию (II), оказывается
такой же, как и оценка скорости сходимости метода К при решении задач
типа d*o > Для которых выполняется требование (II).
В работе [36] сообщается о сравнительном тестировании методов К
и N. Из приведенных расчетов вытекает следующий вывод. Несмотря на то
что область непосредственной применимости метода N шире, чем у мето-
метода К, эффективность метода N во всяком случае не ниже эффективности
метода К.
Для сравнения методов N и К в ситуациях, в которых они оба примени-
применимы (для задач типа 3°0, удовлетворяющих условиям (I) и (II)), целесооб-
целесообразно записать соответствующие вычислительные процедуры в одних
и тех же понятиях и терминах.
Итерацию метода К (см. § 6 п. 6.5) можно переписать в понятиях, вве-
введенных для изложения метода N, в следующем виде:
Здесь предполагается, что х@) я w, D@) = Id, (-(О - ортогональная проек-
проекция вектора (-/>(/- 1)с) на подпространство {х GEn \AD(i - 1)х ¦ 0,
(е т, х) ¦ 0}, f/ ~ константа, принадлежащая отрезку [0, l/ir(-f @I •
В базовой версии метода К 7/
189
Глава VIII
МАТЕМАТИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
В ПОРЯДКОВЫХ ШКАЛАХ
§ 1. Введшие
1.1. Принципиальные трудности в принятии решений возникают, как
только начинают появляться факторы неопределенности в постановке
задачи, а без них не обходится ни одна сколь-нибудь серьезная практичес-
практическая проблема выбора решений. Неопределенность может быть связана
с неполнотой информации об условиях задачи — об обстоятельствах, в кото-
которых следует принять решение. В таких ситуациях способы уточнения поста-
постановки задачи изучаются в стохастическом программировании. Неопределен-
Неопределенность может также вызываться отсутствием в исходной постановке задачи
информации о том, как примирить различные цели, к крторым стремятся
в многокритериальных задачах, как установить "компромисс" между
интересами различных "участников групповых решений, как определить
понятие "справедливость" при разрешении той или иной конфликтной
ситуации. В таких случаях уточнение постановки задачи требует дополни-
дополнительной информации, полученной от экспертов, от арбитров, в результате
моделирования или соглашения, основанного на так или иначе организован-
организованных переговорах. Далеко не всегда могут быть указаны объективные
обстоятельства, позволяющие однозначно уточнить постановку задачи.
Нередко основным источником дополнительной информации является
лицо, принимающее решение (ЛПР), субъективные предпочтения которо-
которого (основанные на его опыте, знаниях и идеологических установках)
оказываются единственным способом уточнения постановки задачи. В дру-
других случаях необходимая информация уточняется в процессе переговоров
представительной группы лиц, обладающих различными шкалами ценности.
Многолетний человеческий опыт выбора решений, обобщенный в раз-
различных прикладных дисциплинах, далеко не всегда связывается, да и не
всегда даже в принципе может связываться, с указанием (хотя бы нефор-
неформальным) четкой и для всех приемлемой цели выбора. Решения принимают
люди, и для них часто последовательное предпочтение одного из сравни-
сравниваемых вариантов другому - более естественный и более доступный путь
выбора решения, чем согласование интересов — построение агрегирован-
агрегированной цели и приближение к ней. При этом допустимое множество
альтернатив может ограничиваться некоторыми условиями предпочтения
выбираемых вариантов определенным, заранее заданным альтернативам,
характеризующим потенциальные возможности выбора. Так выявление
платежеспособного спроса - набора продуктов, подлежащих производству
190
и удовлетворяющих спрос населения, основывается на результатах наблю-
наблюдений за предпочтениями потребителей, а планирование производства
должно учитывать предпочтения отраслей промышленности, определяющих
множество допустимых (по ресурсам и технологии) планов.
Задачи подобного типа укладываются в схемы так называемого матема-
математического программирования в порядковых шкалах (МППШ). В § 2
обсуждются постановки задач МППШ. В § 3 излагаются методы решения
выпуклых задач МППШ, в которых бинарные отношения рефлексивны,
транзитивны и полны. Вычислительные методы существенно упрощаются
для задач линейного программирования в порядковых шкалах. Такие
задачи рассматриваются в § 4. § 5 посвящен более сложным выпуклым
задачам МППШ, в которых бинарные отношения, определяющие модель,
вообще говоря, произвольны.
1.2. Напомним определения некоторых понятий, используемых в на-
настоящей главе.
Бинарное отношение Л называется предпочтением (нестрогим) если оно
рефлексивно, транзитивно и полно.
Отношение R называется полунепрерывным сверху (снизу), если верх-
верхний срез GR(x) = (у G G\yRx) (соответственно нижний срез HR(x) =
= {у G G \xRy})замкнут в G Vx € G. Отношение R называется непре-
непрерывным на G, если оно одновременно полунепрерывно сверх и снизу,
или, что то же самое, если множество {(х, у) \xRy) замкнуто в G X G.
Во всей главе предполагается, что G — замкнутое подмножество Еп.
В §§ 2-3 рассматривается оптимизация (в смысле доминирования) по
предпочтению R. Пусть X&G. Элемент х €Е X называется наиболее (наиме-
(наименее) предпочтительным в X в смысле предпочтения R, если xRy(yRx)
\ty ex.
В [21] доказано следующее утверждение.
Если отношение предпочтения R непрерывно и множество X компактно,
то X содержит по крайней мере один наиболее (наименее) предпочтитель-
предпочтительный элемент. Множество всех наиболее (наименее) предпочтительных
элементов замкнуто.
В § 5 рассматриваются задачи математического программирования
в порядковых шкалах при произвольных отношениях R. В таких задачах
оптимум по R может не существовать (т.е. такого элемента х Е X, что
xRy Vу Е X может не оказаться). В этом случае под оптимизацией по
бинарному отношению R будем понимать вычисление максимального
элемента для какого-либо из значений к = 1 -г4 (см. гл. V, а также [71]).
Оптимизация по бинарному отношению в более широком смысле — так
называемая (Л, С)-оптимизация - рассматривается в п. 5.4.
Напомним, что точка х е X называется к-максималъным элементом
по отношению R, если SR(x) является максимальным по включению
элементом семейства { SR (х), xEX}9k=l+4.
Здесь множества SR(x) определяются через множества элементов H°R (х)
(строго подчиненных х по R\ ER(x) (эквивалентных х по R) и NR(x)
(несравнимых cxnoR) по следующим формулам:
и **(*) и
U NRQc),
191
Множества s?(x)y к ¦ 1 -г 4 порождают четыре множества
Я?(х) = (z € С|^(х) С ^(z)), * = 1*4.
Здесь символ С означает строгое включение. Поэтому х ф. 5В?(х). Заме-
Заметим, что расширению могут подлежать не только понятие максимизации
по бинарному отношению Ro> но и ограничения по бинарным отношени-
отношениям Rj. Вместо ограничения xRjU, выделяющего множество допустимых ре-
решений, можно рассматривать ограничения типа {х EX\Sr (х) Э Sr (и)},
для одного из * ¦ 1 -г 4. Выбор типа оптимизации и ограничений определяет-
определяется содержательными особенностями задачи.
Напомним еще некоторые определения, которые понадобятся в даль-
дальнейшем.
Полное отношение R на выпуклом множестве G называется вогнутым,
если выполяется одно из следующих эквивалентных условий:
(а) множества GR(x) точек у, предпочтительных х по/?, выпуклы
V* В G,
@) множества G? (х) точек>, строго предпочтительных х по Л, выпук-
выпуклы V х € G,
G) изхRy дляx,yEG следует
{Хх + (l-\)y}Ry, 0 < X < I,
(8) Vx,y,z изzE[x,y] следует z/*x или ztfy.
Если Л — произвольное бинарное отношение, то множества Sr (x) и по-
порождаемые ими 5В? (х), & = 1 -г 4, индуцируют 4 типа вогнутости бинарных от-
отношений. Бинарное отношение Л на выпуклом множестве GQE" называется
к-вогнутым, если G\ S^Qc) и5В* (к) выпуклы. Выпуклость 39* (х)требуются
из-за того, что в дальнейшем не предполагается транзитивность и вогну-
вогнутость (в традиционном смысле) бинарного отношения/?.
Введенное ранее определение вогнутости для полного отношения/?
удовлетворяет определению 2-вогнутого отношения. Различные типы вог-
вогнутости бинарных отношений соответствуют разным типам максимальных
(оптимальных) по R элементов.
Полное, непрерывное, вогнутое отношение называется регулярным,
если при непустом G^ (x) (множестве точек строго предпочтительных х)
точки, эквивалентные х, должны быть граничными для верхнего среза
GR (x), а не внутренними. Другими словами, отношение R регулярно, если
множество точек, эквивалентныхх, имеет пустую внутренность Vx EG.
§ 2. Постановка и подходы к решению задачи
математического программирования в порядковых шкалах
2.1. Приведем формальное определение задачи математического про-
программирования в порядковых шкалах (МППШ).
Пусть G - некоторое фиксированное компактное множество в EnyRj,
/ ¦ 0, 1, ..., /я, - рефлексивные, транзитивные и полные бинарные отно-
192
шения на некотором шаре, содержащем G;R0 - предпочтение лица, при-
принимающего решение; Rj, / = 1, ..., т, могут интерпретироваться как пред-
предпочтения лиц, принимающих участие в выборе решения, ограничивая
каждый по-своему множество допустимых планов. Некоторые из отноше-
отношений Rj могут определяться обычными функциональными неравенствами,
ограничивающими диапазон изменения различных компонент решения.
Будем считать, что jfy, / = 1, ..., т, непрерывны, а множество G имеет
непустую внутренность.
Обозначим через м;-, / = 1, ..., т9 заданные априори точки G и будем
считать, что х € G допустимо по /-му ограничению, если xRjUj. Соответст-
Соответственно назовем точку х € G допустимым решением, если xku,-, 1 </ < т.
Задача математического программирования в порядковых шкалах
(МППШ) представляет собой задачу выбора наилучшего решения (в смысле
отношения Ro) среди допустимых решений. В ней требуется найти век-
вектор jc* такой, что
x*Rox \xRfuh I < / < w, x*RjUh 1 < / < m\ x9 x* G G. A)
Пусть G —множество допустимых точек:
G = {x e G \xRjUh 1 < / < m).
Если G Ф 0, то множество Gm решений задачи A) непусто. Выберем неко-
некоторую метрику || • || в Еп и обозначим через р п. н (х) расстояние (в метрике
Ц-11) от точки х до множества решений задачи A).
Приближенное (погрешности не более е) решение задачи A) по опреде-
определению есть любая точка х G G9 не худшая (в смысле Ro) наихудшей точки
II * II € в ~
х € множества G#. Здесь G» = {х Е S | Рц. ц (х) < € }— окрестность мно-
жества точных решений Gm в G.
Назовем задачу A) а-регулярной, если \G\>an\G\ (\A\ лебегов
^-мерный объем А). Будем называть задачу регулярной, если она а-регу-
лярна при некотором а > 0, т.е. если G имеет непустую внутренность.
Дальше будем считать, что а = ( | G \ / | G |) '¦*.
Наша цель — предложить диалоговый метод решения задач МППШ.
Требуется привести процедуру, позволяющую по последовательно предъяв-
предъявляемым альтернативам и получаемой локальной информации о предпочте-
предпочтениях Rj установить за возможно меньшее число шагов е-приближенное
решение каждой предъявленной задачи A) фиксированного класса.
Из работ по традиционному математическому программированию
(см. [35, 66]) известно, что для достаточно широких классов нелинейных
задач не существует методов приближенного решения, трудоемкость кото-
которых приемлемым образом растет с ростом размерности задачи. Для
дискретных экстремальных задач существование таких методов весьма
проблематично (см., например, [68]). Этот вывод естественно переносится
и на задачи МППШ.
В связи с этим будем в дальнейшем рассматривать только задачи более
узкого, но важного для приложений класса — задачи выпуклого програм-
программирования в порядковых шкалах.
13. Д.Б.Юдин 193
Задача A) называется выпуклой задачей МППШ, если GCEn- выпуклый
компакт, int G Ф ф, а отношения предпочтения J?;-, 0< / < т, - вогнуты,
непрерывны и регулярны.
Если х ? Gm, х G G, то выпуклое множество GRo (х) = {у е G \ yRox)
к силу регулярности Ro имеет х своей граничной точкой, а его внутрен-
внутренность непуста. Аналогично, если для некоторого х € G не выполнено усло-
условие xRjUj, то х - граничная точка выпуклого множества G».(x) =
= {j G G| .y/fyx), внутренность которого непуста. В силу непрерывности
предпочтений Rj все множества G/?.(x), / = 0, 1, ..., т, замкнуты.
Таким образом, наши предположения о бинарных отношениях гаранти-
гарантируют существование функционала (ро(х) Ф 0 такого, что G#o(x) С
с { У I G - *, ?>о (*)) < 0 ) (ПРИ * € G \ G.), и функционалов </?/ (х) =? О
(при / > 1, xRjUj) таких, что G/^x) С {.у | (.у - х, </>/(х)) < 0).
Функционалы </?<>(*) и <р/(х) принадлежат соответственно множествам
Ф0(х) и Ф/(х) опорных направлений к множествам Gro(x) и Gr.(x)
в точке х.
Направления, определяемые функционалами ^/(х), / = 0, 1, ..., т,
совпадают с направлениями градиента (а в негладком случае — с направле-
направлениями опорных функционалов) выпуклых индикаторов, если таковые
имеются среди индикаторов, отвечающих заданным отношениям предпочте-
предпочтения Rj. Это направления роста предпочтений.
2.2. Диалоговые методы решения задачи выпуклого программирования
в порядковых шкалах различаются по возможностям источника информа-
информации, который считается доступным для них. Мы будем рассматривать два
типа таких источников — оракулы нулевого и первого порядка. Оба они
в состоянии по (любой) предъявленной паре альтернатив х, у G G сказать,
как эти альтернативы соотносятся друг с другом по каждому из предпочте-
предпочтений Rj, /. > 0, т.е. для каждого / > 0 указать, какой их трех мыслимых
случаев: xPjy, yPjX, xljy, имеет место. Оракул первого порядка, кроме
этого, может сообщить для всех / опорные функционалы <ру- (х) к соответ-
соответствующим предпочтениям в предъявленной ему точке х Е G. (Если эти
опорные функционалы не определены для данных х, /. — это возможно
лишь тогда, когда х не есть граничная точка множества GRAx), т.е.
х - наилучшая в смысле R, точка G, - то в качестве <р/ (х) сообщается
произвольный ненулевой функционал.)
Ниже будут построены методы, использующие как оракул первого, так
и оракул нулевого порядка. Предложенные методы допускают явную оцен-
оценку скорости сходимости, притом довольно высокую — как у геометриче-
геометрической прогрессии со знаменателем, зависящим лишь от размерности прост-
пространства. Этот факт заслуживает специального обсуждения. Дело в том, что
с практической точки зрения одна только сходимость любого численного
метода еще ничего не значит, — для практики важна ее скорость. Примени-
Применительно к оптимизации предпочтений этот вопрос связан со специфической
проблемой разумного измерения погрешности. В задачах оптимизации —
194
будь то оптимизация предпочтений или функции — имеется два основных
способа измерения погрешности приближений: отклонение приближенного
решения х от множества точных решений G0 (в какой-нибудь метрике G)
и отклонение показателей, которые мы оптимизируем, в точке х от их
оптимальных значений.
Первый способ кажется вполне универсальным. Известно, однако, что
эффективное в этом смысле приближение точного решения даже в задачах
минимизации выпуклых функций требует наложения на функцию дополни-
дополнительного условия типа строгой выпуклости. Лишь после этого удается
построить методы минимизации с явно выписываемой оценкой погрешно-
погрешности. Таким образом, оптимизируя предпочтение и интересуясь сходимостью
приближений к множеству точных решений по метрике G, мы должны бы-
были бы, желая получить конструктивные результаты, а не просто теорему
сходимости, наложить на предпочтение дополнительные к выпуклости усло-
условия (типа существования строго выпуклого индикатора). Это - неестест-
неестественный путь, так как указанное свойство трудно интерпретировать
в терминах самого предпочтения. Такое требование представляется ис-
искусственным.
Втордй способ — анализ отклонений показателей от их оптимальных зна-
значений — для предпочтений вовсе не годится. Само предпочтение различает
альтернативы слишком грубо ("лучше — хуже", но не "немного лучше —
заметно лучше"), и для выбора оптимального плана надо было бы сравни-
сравнивать значения какого-нибудь индикатора данного предпочтения. Но послед-
последнее бессмысленно, так как индикатор не определен однозначно. Выбрав
подходящий индикатор, мы можем для самого примитивного метода
обеспечить как угодно быструю сходимость по значениям этого индикато-
индикатора. Соображения такого рода привели автора [92] к выводу о том, что при
оптимизации предпочтений можно говорить лишь о сходимости, а вопрос
о ее скорости нельзя поставить разумно. Если бы этот вывод был правилен,
то вообще нельзя было бы говорить всерьез о численных методах оптимиза-
оптимизации предпочтений. Однако в действительности дело обстоит вполне благо-
благополучно. Представляется, что данное выше определение приближения
погрешности 6 весьма удовлетворительно решает проблему измерения
погрешности. Действительно, при малом е допустимый план, отстоящий
не более чем на е от множества точных решений, должен быть хорошим
приближением к оптимальному плану (как бы мы ни понимали слово
"хороший"). В частности, таким хорошим приближением должна быть
точка х € (пока что мы рассуждаем в духе первого способа измерения
погрешности). Но ведь на самом деле нас интересуют лишь свойства
альтернатив, выражаемые в терминах заданных предпочтений. Поэтому
любая допустимая точка G, которая в смысле предпочтения Ro не хуже
II • II _ м w
х€ , будет по крайней мере столь же хорошим приближением к оптиму-
II * II
му, как и само хе . Таким образом, приведенное понятие е-приближенно-
го решения вполне разумно с содержательной точки зрения (и не исполь-
использует никаких произвольно выбираемых индикаторов). В то же время, как
было сказано, отыскание е-приближенных в этом смысле решений можно
провести конструктивно, с явной оценкой числа шагов.
13* 195
Субоптимальные по числу обращений к источнику информации методы
решения задач выпуклого программирования в порядковых шкалах пред-
представляют собой естественное обобщение метода центров тяжести (МЦТ)
и модифицированного метода центров тяжести (ММЦТ, или, как его теперь
называют, метода эллипсоидов), первоначально разработанных примени-
применительно к задачам традиционного выпуклого программирования (см. [35]).
§ 3. Методы решения задач выпуклого программирования
в порядковых шкалах
3.1. Опишем теперь методы решения задачи выпуклого программирова-
программирования в порядковых шкалах, использующие оракул первого порядка. Как и
соответствующие методы оптимизации, они будут называться МЦТ и
ММЦТ. Методы работают по шагам, к /-му из которых (/ > 1) имеются:
выпуклый компакт G^i С Еп такой, что int G/_! Ф ф. При этом мы пред-
предполагаем, что int G Ф 0; это не ограничивает общности рассуждений.
Для МЦТ Со = G; для ММЦТ Go - какой-нибудь эллипсоид, содержа-
содержащий G, и все G/_, - также эллипсоиды. На /-м шаге последовательно про-
проводятся следующие действия.
1°. Находится Xf — центр тяжести Gf_i. Проверяется, справедливо л#
включение X/ G G (из последующего станет ясно, что для МЦТ X/ G G
при всех I, так что указанное включение выполнено автоматически;
не выполняться оно может лишь для ММЦТ). Если X/ E G, то переходим
к п. 2°, иначе — к п. 3°.
2°. Предлагается оракулу сравнить альтернативу х{ с альтернативой Uj ,
1 < / < т. Если при некотором / G 1, т условие XfRfUj не выполнено,
то установим щ = <р/(х/) и перейдем к п. 5°. Если при всех / € 1, т
имеем XfRjUj (точку х{ назовем в этом случае допустимой), то переходим
к п. 4°.
3°. Обращение к п. 3° происходит в случае X/ ф С. В этом случае можно
указать ненулевой линейный функционал щ, разделяющий xt и выпуклый
компакт G G С {у \ (у - х{, щ) < 0}. Кроме того, как отмечалось выше,
обращение к п. 3° возможно лишь для ММЦТ. В этом случае Gt_{ - эл-
эллипсоид. Определяем G/ как эллипсоид минимального объема, содержащий
"полуэллипсоид" {у G С/_! | (у - X/, щ) < 0}. Шаг окончен. Увеличи-
Увеличиваем i на единицу и переходим к п. 1°. (По поводу алгоритмической реали-
реализации правила п. 3° и метода ММЦТ в целом см. гл. VII § 1.)
4°. Обратившись к оракулу, находим щ = io(*f )• Переходим к п.5°.
5°. Определяем G{ как:
множество { х GG/_i I (х - X/, %) < 0} для МЦТ,
эллипсоид наименьшего объема, содержащий "полуэллипсоид9',
{х е G^x | (х - х,, щ) < 0} для ММЦТ.
Шаг закончен. Увеличиваем / на единицу и переходим к п. 1°.
В параллель с построением областей G/ будем еще строить точки х* —
наилучшие (в смысле Ro) среди допустимых точек х;-, / < /, построенных
196
на первых / шагах. Отметим, что построение х1, ..., х* требует O(i) обра-
обращений к оракулу.
Следующая теорема устанавливает скорость сходимости полученных
методов.
Теорема 1. При решении задачи выпуклого программирования в поряд-
порядковых шкалах методами МЦТ и ММЦТ для всякого е > О условие
х RoXe выполняется:
при применении МЦТ - для всех i > en In {d\\ . ц (G)/€a ),
при применении ММЦТ - для всех i>cn2 In @</ц . u (G)/ea).
Здесь с — абсолютная константа, d\\. ц (G) - диаметр G в метрике || • ||, /3 =
= (|Св|/|С|I/я.
Доказательство теоремы пЪлучается из рассуждений ( [35] гл. 2), отно-
относящихся к случаю обычных выпуклых экстремальных задач, внесением
очевидных изменений. Здесь ограничимся случаем безусловных задач
(т = 0), в котором идея конструкции проявляется наиболее выпукло.
Прежде всего, справедливы неравенства для объемов: | G/+1 I ^Яп I G/1,
где q71 = 1 - \\е для МЦТ и
q =
для ММЦТ. Это чисто геометрические факты (не зависящие от того, что
именно — предпочтение или функция - оптимизируется). Отсюда следует,
что | Gt | < qni | Go\. Пусть теперь 0 < в< 1 и таково, что
\Gi\<6n\G\ ( = 0W|G| при т = 0). B)
Отметим, что вtf|.|(G)-окрестность С*в) множества G^bG (которое при
т = 0 есть просто G) имеет объем, не меньший 0n\G\ (= 0W|G|): эта
/>*
окрестность содержит множество вида,, 0G + A — 0)дс* (x* GGJ, имею-
(в)
щее нужный объем. (При т > 0 аналогичная оценка объема G* была бы
@a)w|G|.) В условиях B) G/ не Может содержать G* . Стало быть,
@)
для некоторого x6G, имеем х ф G/. Из правил формирования G/
следует, что xsRox для дс G (Gs_! \ G5) C\G (для w > 0 аналогичное соот-
соотношение выполнялось бы для всякого допустимого х G (G,_! \ Gs) П G);
поэтому х'ЛоХ. Так как х лежит в Od ц. ц (С)юкрестности G, в G, то
~~ II • II / 41 • II
d . Итак, xRoxed (G. при выполнении B). Отсюда и из нера-
II II ^ '
венства для объемов G/ следуют утверждения теоремы.
3.2. При отсутствии достаточных содержательных (теоретических, экспе-
экспериментальных или интуитивных) оснований для построения опорных функ-
197
шюналов <р7- (х) в точках х Е G приходится ориентироваться на оракула
нулевого порядка, способного лишь сравнивать альтернативы по имеющим-
имеющимся предпочтениям. В этом случае мы все еще сможем предложить метод
с геометрической скоростью сходимости, однако эта скорость будет значи-
значительно хуже вести себя при увеличении размерности задачи, чем в случае
оракула первого порядка. Описываемый ниже метод является непосредст-
непосредственным обобщением метода решения выпуклых условно-экстремальных
задач при оракуле нулевого порядка (см. [35] гл. IX). Изложим конст-
конструкцию в геометрических терминах; алгоритмическое описание строится
по геометрическому так же, как и в [35].
Будем считать, что int G Ф 0. Пусть Go - эллипсоид, содержащий G и
& = ( I Go | /1G |I/я. Пусть хг - центр Go и О0 - система координат,
в которой Go - шар с центром в 0. Описываемый метод работает по шагам,
к /-му из которых имеются: эллипсоид G/_!, являющийся шаром радиуса
Г/ с центром 0 в координатах O/_i. Элемент объема в координатах 0/_i —
тот же, что и в координатах О0. Пусть Х/ — центр эллипсоида Gj_i
(в исходных координатах, в которых описана задача).
Все построения /-го шага описываются в евклидовой структуре этого ша-
шага, в которой 0/_1 — декартова система координат.
На /-м шаге проводятся следующие операции.
1°. Если шар Uf радиуса Г//A00п) с центром в хг не лежит целиком
в G, то находим щ G Uf \ G и строим гиперплоскость П/, разделяющую
jcJ и G. Обозначим через П/ полупространство с границей П,«, содержа-
содержащее G, и рассмотрим множество Wf ={ П/ HGi-i) (в евклидовой струк-
структуре 1-го шага это множество — шар без сферической "шапочки").
Выбираем в качестве G/ эллипсоид наименьшего объема, содержащий Wf,
а в качестве Of — систему координат, в которой Gj — шар с центром в 0,
притом такую, что элемент объема в координатах О/ — тот же, что и в ко-
координатах 0/_!. Шаг закончен.
2?. Пусть теперь J7/ С G. Впишем в ?/,- правильный симплекс А. Пусть
10, xt - допустимая точка,
Е 1, т такое, что UjRjXi, если xt недопустима.
Отметим, что для вычисления /(/) достаточно один раз обратиться к ора-
оракулу (мы считаем, что однократное обращение к нему доставляет результат
сравнения предъявленной точки с точками ии ..., ит по предпочтениям
/?!,..., Rm соответственно).
Пусть для краткости Rj (*) = R. Найдем худшую <везде далее "лучший"
и "худший", если не оговорено противное, относятся к предпочтению R)
среди вершин А; обозначим ее ух. Далее, говоря о выборе худшей точки
(из конечного их множества), мы имеем в виду, что для осуществления
выбора следует должное число раз обратиться к оракулу. Введем следую-
следующую терминологию. Правильной пирамидой А (у) с вершиной у Фхг бу-
будем называть симплекс, у которого:
198
1) одна из вершин — у; противолежащее основание — правильный
(п — 1)-мерный симплекс; боковые ребра, исходящие из у, равны по длине
и ортогональны радиус-векторам своих (отличных от у) концов;
2) У - Xj коллинеарно высоте А (у);
3) угол между высотой и боковыми гранями Д(у) равен урп = arccos(l/2/i),
т.е. грани касаются кругового конуса с осью у — */, вершиной у и раство-
раствором угла 2 <р„.
Построим правильную пирамиду А! = A(yi) с вершиной ух. Если у\
не является худшей из вершин A i, то обозначим через у2 худшук) из этих
вершин, построим правильную пирамиду А2 = А(уг) и посмотрим, явля-
является ли д^ худшей из ее вершин. Если нет, то обозначим через уг худшую
из вершин А2, построим А3 = А(у3) и т.д. Чуть позже мы увидим, что опи-
описываемый процесс через конечное число шагов оборвется построением
очередной правильной пирамиды Ак = А(ук)9 у которой ук окажется худ-
худшей вершиной. Пусть теперь Kt — круговой конус с осью (Xf,yk), верши-
вершиной^ и раствором угла 2ipn; тогда
3\91:х-ук = -Х{г-ук)9 \>09 zG^k) . C)
Пусть Gj - эллипсоид наименьшего объема, описанный вокруг Gi_l\Ki.
Обозначим через О\ систему координат с тем же, что и О0, элементом
объема, в которой G% — шар с центром в 0. Шаг закончен.
Параллельно построению точек д:/ будем строить точки х* — пучите
(по предпочтениюRo) среди точек {*/; /</,/(/) =0).
3.3. Имеет место следующее утверждение.
Теорема 2. В сделанных выше предположениях о решаемой задаче мате-
математического программирования в порядковых шкалах (вогнутость и регу-
регулярность) дня описанного метода при всяком е > 0 условие х*Rox^'^
выполняются для tfcex i > Cin2\n(Pd^.^(G)/ea), тогда как выполнение
шага требует не более c2ns\nn обращений к оракулу нулевого порядка.
Здесь сг ис2 - абсолютные константы.
Доказательство. 1. Убедимся, что множество*) Gt = {х €
€ G \xRqX*) при х1 Е Gm содержится в G/. Для доказательства проведем
индукцию по I. Для 1=0 утверждение тривиально ввиду Go D G. Пусть
оно верно для i = s — 1; докажем, что оно верно и для i = s. Прежде всего,
если на шаге s реализовался случай 1°, то доказывать нечего — в этом слу-
случае Gs П G = Gs-x П G. Пусть теперь на шаге s не реализовался случай 1°,
так что применялись правила п. 2°. Используем обозначения из их опи-
описания. Так как предпочтение R вогнуто и у\ — худшая из вершин А, то
xRyx при всех х€Д. D)
Далее, пусть построение правильных пирамид А2,... не кончилось к мо-
моменту /, т.е. определены пирамиды Al9..., А/. По построению у\Ру%9
УгРуз /• • • > Л-1 РУг< Кроме того, в метрике, в которой координаты 05_i —
евклидовы, по свойствам П — 3) правильной пирамиды**) l^+i - xs\ <
*) Еслих* не определено, т.е./ (s) > 0,s <i, то G* = G.
**) \//„ - угол между высотой и боковыми ребрами правильной пирамиды, так что
Фп в arctg ((л - Dtgtffe).
199
< sin^J^, - хв\9 т.е. \yt - xs\ < (sin^O l \yt - xs\. В то же время
У\Ру\, что в силу D) означает, что ух ? Д. Последнее невозможно при
(sin^wI < — (так как (l/nIj>i -xs\ — радиус шара,вписанного в А).
п
Итак, (sin^)' > —, откуда следует, что процесс построения пирамид
п
А/ действительно оборвется за конечное время, причем это время может
быть явно оценено. Эта оценка приводит к требуемой в теореме оценке
числа обращений к оракулу на одном шаге работы метода.
Пусть теперь к - номер последней пирамиды, построенной на рассмат-
рассматриваемом шаге. Как мы видели,
yiRy*. E)
Кроме того, у к — наихудшая из вершин Ак. В силу вогнутости и регуляр-
регулярности отношения R отсюда сразу следует, что в конусе, симметричном от-
относительно у % конусу направлений из ук в А, все точки (лежащие, разу-
разумеется, в G) не лучше ук. Указанный конус содержит Ks. Принимая во
внимание еще и E), получаем
xsRx при х еК5 П G F)
или, учитывая определение GS9
xsRx при х е (G5\GS_ 1) П G. G)
Отсюда следует, что при / (s) > 0 точки (GS\GS_X) П G не являются допус-
допустимыми для решаемой задачи вместе с точкой xs. Стало быть, из Gs С б
и Gs С Gs~l следует Gs С Gs, что и требуется. Пусть теперь f(s) = 0. Из
наших рассуждений следует на самом деле чуть более сильное, чем G),
соотношение:
ytPx, xG(G,\^!)nG. (8)
В рассматриваемом случае R=R0. Если теперь х3Роу% (а не просто xs Royi),
то xsPox при х € (Gs\G^t) П G, и, как и выше, Gs С Gs. Убедимся теперь,
что соотношение xsPoyi действительно имеет место. В самом деле, иначе
внутренняя точка множества А (именно, xs) была бы по Ro эквивалентна
худшей (в смысле Ro) точке этого множества. В силу регулярности Ro
последнее возможно лишь в случае, когда xs € G — лучшая в смысле Ro
точка G, что по исходному предположению не так. Итак, включение Gs CGS
при xs ф G, доказано.
2. Как и в [35], имеем \GS | <<аг.Л \G5^t |, где q = q(n) = 1 - djn2,
причем величины dn отделены от нуля. Пусть теперь 9 Е @, 1) и / тако-
таково, что
\Gg\<e*\G\. . (9)
ности, Gf Ф G и х* определено); стало быть, найдется Зс G G;\Gj. По до-
доказанному либо при данном / точка х* допустима и оптимальна в G в смыс-
смысле Ro, либо G1 С С/, так что х ф G*. Так как if e G^, то xRoxl'} # _ч.
0«ц.ц(С?)
200
Вместе с тем х Е G\G*, так что xfRox. Итак, при выполнении (9) имеем
во всех случаях: х* определено и х* RqX^'I ,лч . Кроме того, из сказан-
сказанийirG>
ий-ir
ного выше об объемах { Gf} следует, что (9) выполнено для всех7, удов-
удовлетворяющих оценке i > en2 \n(fi/a в) (с — подходящая абсолютная конс-
константа). Отсюда немедленно следует требуемая теоремой оценка погреш-
погрешности.
3.4. Отметим в заключение следующее. Пусть а Е (О, 1] и G — выпук-
выпуклый компакт в Еп с непустой внутренностью. Оказывается, что на семей-
семействе всех а-регулярных выпуклых задач математического программиро-
программирования в порядковых шкалах на данном G метод МЦТ в асимптотике по
е -> 0 улучшается по трудоемкости (т.е. по числу обращений к оракулу,
при котором гарантируется решение любой задачи указанного семейства
с погрешностью б) не более, чем в абсолютную константу раз (какие бы
мыслимые использующие тот же оракул детерминированные методы
не рассматривались в качестве конкурирующих). Аналогичные утверж-
утверждения верны и для ММЦТ (и версии последнего метода, ориентированной
на оракул нулевого порядка), но с заменой абсолютной константы на под-
подходящий полином от п. Таким образом, предъявленные методы теорети-
теоретически являются существенно неулучшаемыми по трудоемкости (по край-
крайней мере, в асимптотике по погрешности).
§ 4. Линейное программирование в порядковых шкалах
4.1. Изложим, следуя [59], предложенный в этой статье важный част-
частный случай модели МППШ — модель линейного программирования в поряд-
порядковых шкалах (ЛППШ). В ЛППШ существенно упрощаются проблемы,
связанные с информационным наполнением моделей и вычислительными
методами. Будем по-прежнему рассматривать рефлексивные, транзитив-
транзитивные и полные бинарные отношения.
Напомним некоторые определения.
Бинарное отношение R называется нетривиальным, если существуют
х, у G G такие, что хРу; монотонным, если из х > у следует, что xRy,
а из х >у *>хРу\ непрерывным, если множества Gr (х) = { у Е G\yRx }
и Hr(x) = {у Е G\xRy } замкнуты в G для всех х Е G. Кроме того, бу-
будем называть бинарное отношение R регулярным сверху (снизу), если
для х, у, z Е G, х Ф у из условий xIRy и z = Хх + A - \)у, X Е @, 1),
следует, что xRz (zRx). Бинарное отношение регулярное сверху и снизу
будем называть регулярным. Для непрерывных нестрогих предпочтений
регулярность сверху (снизу) означает, что int {y\yl&x} = ф9 если х не
является наилучшей (наихудшей) по предпочтению R точкой множества G.
Другими словами, предпочтение R регулярно сверху (снизу), если из
хРу следует, что для любой точки z G (х, у) zPy (xPz).
Назовем бинарное отношение R вогнутым, если Gr(x) - выпуклые
множетсва для всех х Е G, и выпуклым, если множества HR (x) — выпук-
выпуклы при всех х Е С Эквивалентное определение вогнутого отношения:
из xRy для х, у Е G следует, что (Кх + A - \)y)Ry для всех X Е [0, 1],
т.е. выпуклая комбинация х и у не хуже худшей из х и у. Эквивалентное
определение выпуклого отношения: из xRy для х, у Е G следует, что
201
xR(\x + A — \)y) для всех X G 10, 1J, т.е. выпуклая комбинациях и у
не лучше лучшей из х и у. Приведенные определения вогнутых и выпук-
выпуклых отношений являются естественным обобщением определений вогну-
вогнутых и выпуклых функций. Это оправдывает расхождение введенной здесь
терминологии с принятой в литературе, где отношение, названное нами вог-
вогнутым, назьюается выпуклым.
Будем назьюать бинарное отношение R линейным, если оно является
одновременно и вогнутым, и выпуклым (не следует путать введенное здесь
понятие линейного бинарного отношения с принятым в литературе поня-
понятием линейного порядка). Справедливы следующие утверждения.
Теорема 3. Пусть R — нетривиальное непрерывное регулярное нестро-
нестрогое предпочтение на/Г". Тогда следующие условия эквивалентны.
(I) Множество R — выпуклое подмножество Е2п.
(И) Для всех х G Еп множества GR (х) и HR (х), определяемые пред-
предпочтением R, выпуклы (т.е. R — линейное бинарное отношение).
(III) Предпочтение R имеет линейный индикатор.
Доказательство. A)=* (П). Пусть ух, у2 G Gr (х) для некото-
некоторого х G Еп, т.е. (уи х) G R и (y2f x) G R. Тогда для всех X G [0, 1]
в силу выпуклости множества R справедливо (\у\ + A — X)j>2, *) =
= \(уи х) + A - ХH>2, х) G R, т.е. Хух + A - \)у2 € G(x). Следова-
Следовательно, множество Gr (х) — выпукло. Аналогично показывается выпук-
выпуклость множества Hr (х).
(II) ^ (Ш). По теореме Никайдо [38] непрерывное предпочтение R
на связном множестве G имеет индикатор. Покажем, что R имеет линейный
индикатор. Обозначим G° (дс) ={ z \ zPx) и Н? (х) = {z | xPz). В силу не-
нетривиальности и полноты R для любого х?Еп множества G? (х) и Hr (x)
непусты. Из выпуклости GR (х) и Hr (х) и транзитивности R следует, что
G^ (x) и Н? (х) — вьшуклы. Таким образом, существует единственная
(в силу регулярности R) гиперплоскость, разделяющая Gr(x) и Hr(x)9
(HR(x) и G?(x)). Обозначим единичный направляющий вектор этой ги-
гиперплоскости через сх. Тогда для любых х, y.G En таких, что хРу справед-
справедливо {z | cxz > схх) П {z | cyz < cyy) = 0. Действительно, если это не
так, то существует z G Еп такой, что z e GR (x) и z G HR (у) С HR (x),
т.е. z G GR (х) П Н% (х), но GR (х) П Н° (х) = ф для всех xG?", Следова-
Следовательно, гиперплоскости { z \ cxz = cxjc} и { z \ cyz = суу) параллельны и
сх = су = с.
При этом если хРу, то сх > су, и {сх > су] ^^xRy. Таким образом,
/ (х) = сх — линейный индикатор предпочтения R.
(III) =» (I). Пусть (X!,7i), (x2,^2) G Д. Тогда для любого X G [0, 1]
с(Хх! + A - X)jc2) = Хсхц + A - \)сх2 > Хсуг + A - Х)о>2 = c(\yt +
+ A - Х)^2), т.е. Х(хь д>й) + A - X)(x2,j>2) ^ Д. Следовательно, /? -
выпуклое множество. Теорема доказана.
Следствие. Если линейное отношение предпочтения R монотонно,
то с > 0.
202
Замечание. Как было отмечено, требование регулярности R озна-
означает в данном случае, что внутренность классов эквивалентности, индуци-
индуцируемых предпочтением R, пуста. Отказ от этого требования не гарантирует
существования линейного индикатора у линейного предпочтения R.
Гарантируется лишь существование кусочно-аффинного (вообще говоря,
невыпуклого) индикатора R.
4.2. Назовем сигнализатором отношения предпочтения R функцию g:
G -*• Е1 такую, что из хРу следует g(x) > g(y) (это означает также, что
из g(x) > g(y) следует, что xRy). Условия теоремы 3 без требования ре-
регулярности линейного отношения предпочтения R определяют условия
существования линейного сигнализатора.
Теорема 4. Пусть R — нетривиальное непрерывное регулярное сверху
нестрогое отношение предпочтения на выпуклом компакте G С Еп,
Н*^(у*), GR{y*) - выпуклые множества для всех у* € D, где D -
множество лучших в смысле предпочтения R точек G. Тогда следующие
условия эквивалентны:
(I) Множество R(С) - сужение R на С = cl Я0 (у*) - выпуклое под-
подмножество if2п.
(II) GR (•) и HR() - вогнутые точечно-множественные отображе-
отображения на С
(III) R имеет линейный сигнализатор на С и вогнутый индикатор на G,
совпадающий с сигнализатором на С и постоянный на D.
(Напомним, что точечно-множественное отображение F: G ->2 * назы-
называется вогнутым на G, если для всех х%, х2 € G и любого X € [0, 1]
F(\Xl + A - X)xfr Э\Г(хг) + A - X)F(x2).)
Доказательство. (I) => (П). Для любых (х%9 У\), (х2, у2) ^
G R (С) и любого X G [0, 1] в силу выпуклости множества R (С) справед-
справедливо (Xxi + A - Х)х2, Хд*! + A - X)j>2) €R(C). Таким образом, имеет
место Gft(\xi + A — X)jc2) Э Хуг + A — Х).уа* Следовательно,
GR (X*! + A - Х)х2) DXGR (Xi) + A - X)GR (х2) для всех хи х2 G С
и любого XG [0,1]. Это означает, что GR ( •) - вогнутое точечно-множест-
точечно-множественное отображение на С. Аналогично имеем, что Hr ( •) - вогнутое точеч-
точечно-множественное отображение на С. При этом, очевидно, Gr (x) hHr(x) —
выпуклые компактные подмножества С при всех х € С, т.е. R — линейное
предпочтение.
(II) =* (III). Непрерывное бинарное отношение R на выпуклом компак-
компакте G имеет (в силу леммы Никайдо [38]) точку минимума х*. Причем
в силу регулярности сверху R дс* - граничная точка G, а из нетривиально-
нетривиальности R вытекает, что'у*Р'х*, где у* — некоторая максимальная точка
из 2). Не ограничивая общности, можно считать, что других точек экстрему-
экстремума на [jc*, jp*] нет, Из выпуклости Gr(x) и Hr(x) и регулярности
сверху R получаем, что для всех х € С таких, что у*Рх и хРх*9 множества
G^ (x) и Н^ (х) непустые и непересекающиеся и, кроме того, существует
единственная разделяющая их гиперплоскость. Гиперплоскость, разделяю-
разделяющая G® (х) и #? (х), nepeceKiafeT отрезок [х*, у.*] (так как х* и у* лежат
203
в разных полупространствах), причем в единственной (по регулярности
сверху предпочтения К) и, очевидно, внутренней точке [х\ у*].
Обозначим ее через Л(х), тогда существует представление Л(х) «
= х* + \р (х)(у * — х* ), где ^ (х) е @,1). В силу вогнутости точечно-множе-
точечно-множественного отображения #д(-) имеем для всех х,у € С и любого
X €Е [0, 1] Н(\х +A - \)у) = #*(Л(Х* + A - \)у)) Э XHR(x) +
+ A - Х)#я(дО = \HR(A(x)) + A - Х)Ял(Л(д;)). Таким образом, для
всех *, у.е С и любого Х€[0, 1] Л(Хх+A-Х).у)Д(ХЛ(х) + A-Х)ЛО0)
и, следовательно, ^(Хдс + A - \)у) > Х^(х) + A - Х)<рО>).
Аналогично в силу вогнутости точечно-множественного отображения
Gr() получаем, что для всех х, y.G С и любого X € [0, 1] справедливо
<р(Хх + A - Х).у) <X<^(jc) + A - Х)<рО0. Таким образом, <р(х) - аффин-
аффинная функция. Если xlx*9 то положим <р(х) = 0. Ясно, что если x/?y, то
<р (х) > ^ (у), и наоборот. Следовательно, у (х) - аффинный индикатор R
на С. Если продолжить его на G, то получим аффинный сигнализатор, а если
положить \р(у) = 1 при yly*, то получим вогнутый индикатор; из аффин-
аффинного сигнализатора получаем линейный.
(III) => (I). Так же, как и в теореме 3. Теорема доказана.
Замечание. Если предпочтение R, кроме того, регулярно снизу, то
C = G, R(C) =Л, а условие (III) теоремы заменяется на
(III)': R имеет линейный индикатор на G.
4.3. Рассмотрим задачу математического программирования в порядко-
порядковых шкалах:
тах{х \xRjUj, /= 1,...,т, х G G). A0)
Будем называть задачу A0) задачей линейного программирования в поряд-
порядковых шкалах, если все бинарные отношения, определяющие ее, являются
линейными предпочтениями, а область G - выпуклым многогранным мно-
множеством. Рассмотрим задачу традиционного линейного программирования:
е/* ^ */» /= 1>.••,"*, х Е G), A1)
где с/ - единичные направляющие векторы линейных сигнализаторов линей-
линейных предпочтений /fy, a bj = c/ii/, / € 0, т.
Из теоремы 3 вытекает следующее утверждение.
Теорема 5. Пусть все бинарные отношения RJf j = 0,..., ту определяющие
условия задачи A0 ), являются линейными предпочтениями на Еп9 а область
G - выпуклое многогранное множество. Тогда множество оптимальных ре-
решений задачи A1) является подмножеством множества оптимальных реше-
решений задачи A0). Если, кроме того, все предпочтения Rj регулярны, то
множества оптимальных решений задач A0) и A1) совпадают.
Из теоремы 4 получаем, что справедлива следующая
Теорема 6. Пусть все бинарные отношения Rj, j = 0, ..., т9 определяю-
определяющие условия задачи A0), являются нетривиальными, непрерывными, регу-
регулярными сверху линейными предпочтениями на выпуклом компакте
204
X С Еп и выполнено одно из трех условий теоремы 4, а область G С X -
выпуклое многогранное множество. Тогда множество оптимальных реше-
решений задачи A1) является подмножеством множества оптимальных решений
задачи A0). При этом, если все предпочтения R, регулярны снизу, то и
множество оптимальных решений задачи A0) включено в множество опти-
оптимальных решений задачи A1), т.е. эти множества совпадают.
Чтобы завершить конструктивное сведение задачи линейного программи-
программирования в порядковых шкалах к задаче традиционного линейного програм-
программирования, необходимо еще указать метод построения линейного сигнали-
сигнализатора (индикатора) регулярного сверху линейного предпочтения.
Приведем достаточно простую процедуру использования оракула нуле-
нулевого порядка для построения линейного сигнализатора. Напомним, что
оракул нулевого порядка для любой пары точек х9 у € Еп (или
х, у Е X С Еп) может указать, какое выполняется соотношение: хРу,
уРх или xly.
Рассмотрим симплекс с центром тяжести в некоторой точке х Е G такой,
что все его вершины */, / = 0,..., л, также лежат в G. Случай, когда все дс/
находятся только в GR(x) (или только в HR(x)), невозможен, поскольку
тогда точка х оказалась бы внутренней точкой множества QR (x) (соответ-
(соответственно HR(x))._Пусть к вершин симплекса лежат на разделяющей GR(x)
и Н?(х) гиперплоскости (это точки, эквивалентные х по предпочте-
предпочтению R). Тогда из оставшихся п + 1 — к вершин часть (кх > 1) лежит
в GR(x)9 а к2(к2 -п + \-к—кх> 1)-в#д(х). Следовательно, имеются
кхк2 > п — к отрезков на ребрах симплекса, соединяющих вершины, лежа-
лежащие по разные стороны разделяющей гиперплоскости. Возьмем произволь-
произвольные п - к - 1 из этих отрезков. С помощью оракула нулевого порядка и
метода деления пополам можно с любой заранее заданной степенью точно-
точности найти на каждом из этих отрезков точку, принадлежащую разделяющей
гиперплоскости. Полученные таким образом п — к — 1 вместе с к верши-
вершинами симплекса, лежащими на разделяющей гиперплоскости, и с точкой х
определяют п аффинно-независимых точек, которые однозначно задают
искомую гиперплоскость.
4.4. В качестве примера рассмотрим задачу линейного программирова-
программирования в порядковых шкалах:
тах{.у !>>! + 2у2 < 3, 2уг +у2 < 2,уи у2 > 0} , A2)
R
где бинарное отношение R задается следующим образом:
R ={z GE4 \zT = Кы, со G F*}, A3)
10 110 0
,010011
к =
0 0 10 10
0 0 0 10 1
205
Подобрав соответствующие со, нетрудно убедиться, что R рефлексивно,
транзитивно и полно. Кроме того, как видно из A3), множество R —
выпуклый компакт в Е*. Таким образом, R — линейное предпочтение и,
следовательно, по теореме 4 имеет линейный сигнализатор.
Рассмотрим симплекс с вершинами @,0), @,1), A,0). Его центр тя-
тяжести находится в точке A/3, 1/3). Вершина @,0) симплекса хуже, а
вершина @, 1) лучше, чем A/3, 1/3). Применяя метод деления пополам
на ребре симплекса @,0), @,1), получаем A/3; 1/3) Р @,1/2),
@,3/4) Р A/3, 1/3), A/3, 1/3) Р @,5/8), @,11/16) Р A/3, 1/3),
A/3, 1/3) Р @, 21/32), т.е. лежащая на разделяющей гиперплоскости точка
находится между @,21/32) и @,11/16). Продолжая процесс деления
пополам, можно получить точку @,2/3). Таким образом, функция
f(x) -хг/гх2 является соответствующим сигнализатором предпочтения R.
Мы получили, что задача линейного программирования в порядковых шка-
шкалах A2) эквивалентна задаче традиционного линейного программирования
+ дс2 l*i +2х2 < 3,2дг! +х2 < 2,хь х2 > 0). A4)
Решение задачи A4) достигается в точке х* = f — , 1 -г J; следовательно,
решение задачи A2) у
••(*¦•*)¦
§ 5. Задача математического программирования
в порядковых шкалах с произвольными бинарными отношениями
5.1. Выше при конструировании методов решения задач выпуклого и
линейного программирования в порядковых шкалах предполагалось, что
определяющие их бинарные отношения рефлексивны, транзитивны и
полны. Подобные допущения о бинарных отношениях, определяющих огра-
ограничения задачи, несущественны. Отказ от рефлексивности и полноты целе-
целевого бинарного отношения также не вызывает сколь-нибудь серьезных
трудностей. Другое дело - построение метода решения задач МППШ с не-
нетранзитивным целевым бинарным отношением Яо.3десь необходимы новые
подходы к определению оптимального по Ro элемента, к анализу схем
МППШ и синтезу методов решения задач МППШ. Соответствующие опреде-
определения fc-максимального элемента и fc-вогнутого бинарного отношения R
приведены в § 1.
Перепишем задачу A) математического программирования в порядко-
порядковых шкалах, введенную в § 1, в виде:
х -> max(R0)\xRjUf9 j G Т\~т, x G G. (l')
Расширим эту модель в соответствии с введенными в § 1 четырьмя типа-
типами максимальных элементов. Определим задачу МППШ к-го типа:
х -* тах(Я0, Srq())\xRjUj, / G T7m, x G G. A5)
Здесь Rj, /. G 0, т9 произвольные бинарные отношения на G. В задаче A5)
вычисляется ^-максимальный элемент относительно Ro на множестве допу-
допустимых планов.
206
Будем говорить, что задача A5) в порядковых шкалах является вогну-
вогнутой задачей типа к, если G — выпуклое подмножество Еп, Ro — А;-вогнутое
бинарное отношение, Rj, /. €Е 1, m, — 2-вогнутые бинарные отношения.
Введем на G вспомогательное бинарное отношение
S(k,R0) = {(х,у) GGX G\Sr9(x) D SroO>)},
к к к
т.е. xS(k, R0)y <ss^{SRo (x) Э SRq (y)}. Заметим, что при этом $я0 (х) =
~ Gs(k^ до)(*)> т.е. SHro(x) является строгим верхним сечением (срезом)
отношения S(k, Rq) - множеством элементов G, строго "лучших" х по
отношению S(k, R<>).
Тогда задача A5) эквивалентна задаче в порядковых шкалах, введенной
в § 1, при транзитивном целевом бинарном отношении S(k, Rq) и произ-
произвольных бинарных отношениях Rj в ограничениях:
х -» maoL(S(k,Ro))\xRjUj, / € 1,/и, x G G. A6)
Выделим два множества, соответствующих для каждой точки х поня-
понятиям множества элементов, существенно не худших х и существенно не луч-
лучших х относительно S(k,R0). В качестве первого из них примем
Gs(k,R0) (*) = со({х} U $?о (*)), а в качестве второго #5(*,я0) (х) =
= G\со({х} U 5В? (х)). Если Ro вогнуто, то множество Gs(k,R0) (x)
может содержать, кроме строго лучших, эквивалентные и несравнимые по
S(k, Ro) элементы, но не содержит элементы, строго худшие х по отно-
отношению S (к, Ro).
При к = 2 (т.е. при традиционной оптимизации) и вогнутом, непрерыв-
непрерывном и регулярном Ro замыкание со({ jc) U $? (х))совпадает с GR (jc) —
множеством элементов, не худших х по отношению Ro. Соответственно
G\co ({ х } U $?о (х)) совпадает с HRo (x).
Множетсво Н$ (k,R0) (*) будем называть хвостом точки х.
Введем определение е-оптимального решения задачи A5).
Отношение S(kf Ro) вводилось так, что х предпочитался у, если мно-
множество элементов, подчиненных точке х, включало множество элементов,
подчиненных точке у. ~ ~
Причина, по которой мы предпочитаем работать с Gs^kR ч и Н$(к,я )»
а не со стандартными верхними и нижними срезами отношения S(k, R0)y
кроется в том, что даже для ^-вогнутого Ro верхний срез в точке х для
S(k9 Ro) не обязан быть выпуклым. Кроме того, Gs^kR ^ (•) по опре-
определению привязан к х и учитывает возможную неполноту Ro, в то время
как стандартный верхний срез Gs (k,R0) (") в СИЛУ транзитивности S(k9 Ro)
один и тот же для всех элементов, эквивалентных х.
Обозначим через ЗЬ множество допустимых планов задачи A5).
Назовем точку х€ Е 3) еоптимальным решением задачи A5) fc-ro типа,
если
* 2) px(SS(kiRt)b>), Ss(kRt)(xe))<e.
207
Здесь рх (•, •) - расстояние по Хаусдорфу, HsiktRo) (•) = 3)\GS (*,л0) (О >
А — замыкание А.
Смысл введенного определения в том, что точка Х€ является е-оптималь-
ным решением задачи A5) тогда и только тогда, когда е-оптимален ее
хвост, т.е. если для некоторой точки у € G^kR ^ (х€) П SD хвост "боль-
"больше", чем у дсе, то не более, чем на €.
Введенный таким образом е-оптимальный план является и е-оптималь-
ным в смысле § 2. (Обратное не всегда верно. Однако для выпукло-вог-
выпукло-вогнутых бинарных отношений оба определения е-оптимального плана сов-
совпадают.)
Введем понятие обобщенного оптимального плана задачи A5).
Назовем последовательность {*„}* допустимых планов задачи A5)
обобщенным оптимальным планом задачи, если \fn€N xn является
\ '
—оптимальным планом задачи A5).
п
Имеет место
Теорема 7. Если множество допустимых планов задачи A5) непусто
и для некоторого х0 Е SD $д (*о) n 3) ограничено, то существует обоб-
обобщенный оптимальный план задачи A5).
Доказательство: Если 5Вд (х0) <^Я) = ф9 то х0 — оптимальный
план задачи A6) и стационарная последовательность {хп)Т, где хп = х0
N, является обобщенным оптимальным планом задачи.
Предположим теперь, что 5Э? (х0) ^ 3) Ф 0. Заметим, что i©?
не содержит полностью 3), Если бы это было не так, то это означало бы,
что х0 е Зй'к (х0), и, следовательно,
Пусть { Г^о (у), у е 2H } , где г?о (у) = 2)\53?о (у\ - максимальная
цепь подмножеств семейства { Гд (у), у € SD }, содержащая цепь из од-
одного множества Гд (х0). Существование максимальной цепи вытекает
из теоремы Хаусдорфа (см., например, [17]). Соответствующее этой мак-
максимальной цепи семейство { 3) П 53^ (у), у G 3H } является семейством
непустых вложеннных компактов. Поэтому пересечение множеств этого
семейства непусто. Обозначим его {0. Тогда Уп Е N найдется уп G 2H
такое, что
где рх — метрика Хаусдорфа.
Ясно, что {уп } Г - обобщенный оптимальный план задачи A5).
В дальнейшем будем считать задачу A5) вогцутой к-то типа, аС- вы-
выпуклым компактом. Предъявим к оракулу - источнику информации,
определяющей метод решения задачи A5) ?-го типа, следующие требования.
а) Оракул сообщает по запросу лица, принимающего решение (ЛПР),
Vx, у ? G, принадлежит ли х множеству GR.(y) для любого из бинарных
отношений Rj9 j G l,m, определяющих ограничения. Если х 4 GRf(y)9
208
оракул сообщает единичный направляющий вектор су(х, у) гиперплос-
гиперплоскости, проходящей через точку х и разделяющей х и GR.(y).
б) Оракул сообщает по запросу ЛПР о целевом бинарном отношении
ROi принадлежит ли точка х G G при заданном y^G множеству SB^ (у) =
= {z15?о (у) SrO(z)} (заметим, что всегдах? &%о (х)).
Если х $ 58^о (у), оракул сообщает единичный направляющий вектор
с? (х, у) гиперплоскости, проходящей через х и разделяющей х и$)д0 00 •
Если х € $?о (у), полагаем с* (х, у) = 0.
в) По запросу ЛПР для любого х G Еп оракул сообщает, принадлежит
ли х множеству G. Если х & G9 то оракул сообщает единичный вектор ги-
гиперплоскости, проходящей через х и разделяющей xnG.
5.2. Алгоритм решения задачи A5). Будем считать, что область опре-
определения задачи A5) непуста (ЗЬФ ф) и содержит внутреннюю точку z
вместе со своей г-окрестностыо — шаром радиуса г, a G входит в Go —
шар радиуса г0.
Приведем модификацию метода эллипсоидов для решения задачи A5)
fc-ro типа. Выделим алгоритм определения допустимого плана и алгоритм
вычисления еюптимального плана при фиксированном допустимом пла-
плане (е < г0).
I. Алгоритм определения допустимого плана
Ш а г 0. Полагаем Мо = Go> х0 - центр Go. Если х0 ^ 3), переходим к
шагу 1, а если х0 Е 3), полагаем xm = jc0 и останавливаемся.
Шаг /(/ > 0). Обозначим через Мх эллипсоид минимального объема,
содержащий множество
{XGM;.! |(rf(*/_!), X-Xl_x)>0}9
если */_ i ^ G, либо множество
если */_! G G, но при этом в точке Jt/_i нарушается/-е ограничение xRj щ.
Здесь d(*/_i) — направляющий вектор гиперплоскости, проходящей
через точку X/_i и разделяющей */_! и G, а с;- (*/_ t, uj) — единичный нап-
направляющий вектор гиперплоскости, проходящей через точку jc/_x и разде-
разделяющей X/ _ i kGr. (Uj) .
Обозначим через xt центр тяжести Мг. Если */ ^ 2), переходим к шагу
/ + 1, если jc/ € 2), полагаем х* = X/ и останавливаемся.
Ясно [74], что не позднее шага с номером Lo = ] 2п(п + 1) In — [
г
алгоритм определит допустимый план jc* =xLq задачи A5).
II. Алгоритм вычисления еюптимального плана при фиксированном до-
допустимом плане x*=xLo.
Шаг 0. Обозначим через Мо эллипсоид минимального объема, содер-
содержащий множество
^ф,хД *-*«,)> 0},
14. Д.Б. Юдин 209
где М+ — эллипсоид, построенный при определении допустимого плана
х«, =xLq. Обозначим через х0 центр тяжести Мо.
Положим Lx (е) = ]2п(п + 1) In - [, р = — , L(e) = Lt (е)г- Lo.
P 2r20
Если x<> Ф- 3)> полагаем L = 1 и переходим к пункту 1 шага 1. Если х0 Ей)
и x0S(k, R0)x*, полагаем хт = х0> L = 0 и переходим к пункту 2 шага 1.
Шаг 7(/>0).
Пункт 1. Обозначим через М\ эллипсоид минимального объема, содер-
содержащий множество
0},
если */_! Е G, но нарушается /*-е ограничение задачи A5), либо множество
если Х/_ i ^ G.
Обозначим через хг центр тяжести Мг. Если X/ ^ 2), то увеличиваем L
на 1, при L < Ь(ё) переходим к пункту 1 шага / + 1, при L> Ь{ё) — к
пункту 3 шага / + 1. Если xt Е 3) и хг S(k, Ro)x*> полагаем хт = Х\ (т.е.
принимаем хг в качестве начального допустимого решения), L = 0 и при
1> Ь(ё) переходим к пункту 3 шага / + 1, при KL(e) переходим к пункт
ту 2 шага / + 1.
Если Xj E 2) и **?(?, /?о)-*7> увеличиваем Z на 1 и при L> L(e) пере-
переходим к пункту 3 шага / + 1,а приL<L(e) — к пункту 2 шага / + 1.
Пункт 2. Обозначим через Мх эллипсоид минимального объема, содер-
содержащий множество
хг - центр тяжести Мг.
Если X/ ^ 3) , увеличиваем I на 1 и при L < L(e) переходим к пункту 1
шага / + 1, а при L> Ь(ё) — к пункту 3 шага / + 1.
Если X/ Е 2) и хх S(k, /?о)**> полагаем лс„ = jc/, Z, = 0 и при l> L(e)
переходим к пункту 3 шага / + 1, а при / < L(e) переходим к пункту 2
шага / + 1.
Если X/ Ей) ихлS(к,Ro)xt,увеличиваемZ, на 1,приL> L(e) перехо-
переходим к пункту 3 шага / + 1, приL<L(e) - к пункту 2 шага / + 1.
Пункт 3. Останавливаемся, принимаем х* в качестве е-оптимального
решения задачи A5).
5.3. Обоснование метода. Каждая точка z E 3) входит в S) вместе с
"конусом" co({z) U$ (х, г)), основанием которого является шар ра-
радиуса г. Пересечение окрестности z (шара Si (z, б) радиуса е с центром в
точке z) с "конусом" имеет объем, не меньший, чем объем шара радиу-
ег
са —г .
2г0
Как известно (см., например, [74]), для метода эллипсоидов справед-
справедлива следующая оценка отношения объемов эллипсоидов М*+1 и М^\
п-\
\Мк+1
\Мк\
210
п / п2 \ 2
аГ+Т\/|2 -1/
1 er
Если / > 2w (и + 1) In —, где р = —- , то объем М\ будет меньше началь-
Р 2г0
ного объема шара Мо = Go в рп раз, так что он не может содержать пере-
пересечение окрестности z — шара 58 (z, е) радиуса е с центром в точке z ESD —
с упомянутым выше "конусом".
Если некоторая точка хт не является е-оптимальной, то найдется точ-
точка z E 5Эд П 2) такая, что
5B(z, е)П2) С GWf*f)C*,)n 2)СМ,,
чего не может быть из-за соотношения объемов (здесь Мг — последний
эллипсоид, построенный методом).
При переходе от одного эллипсоида к другому точки, сравнимые с ис-
исходным допустимым решением, лучшие из сформированных к данному
моменту, сохраняются. Поэтому на вычисление допустимого и е-оптималь-
ного решения потребуется в сумме не более 2L\ (e) шагов.
5.4. Пусть теперь оптимизация по бинарному отношению понимается
в расширенном смысле, введенном в п. 1.5 гл. V. В терминах (R, С)-оп-
С)-оптимизации задача A ) математического программирования в порядковых
шкалах принимает вид:
^ 7 A7)
Введем, следуя п. 1.5 гл. V, множества
FRo,c(x)={y\G°Ro(y)CG°Ro(x) и
C(GRq (у) UNRq (у)) С C{GRp (x) U NRq (x))} .
Назовем задачу A7) вогнутой, если
1Q. G.— выпуклое множество,
2°. Rj - вогнутые (в традиционном смысле) бинарные отношения,
/G 1,т,
3°.FR с (*) ~ выпуклое множество V* Е'Еп.
Пусть 3) — множество допустимых планов задачи A7). Назовем точку
х*?D (Ro,С)-оптимальнымпланом задачи A7),если Jz ЕЯ) такого,что
2)cF,o)C(^) nSO ,
Как видим, определение ^-оптимального элемента может быть получено
из определения (Ro, С)-оптимума заменой FRq$с (•) на SBR (•). Анало-
Аналогичным образом определение (е, Ro, С)-оптимального элемента можно
получить из определения к -оптимального (для &-оптимизации) элемента,
заменив в нем $3R (•) на FR n t с (•). Введем множества
?*0,с(*) = oo({x)U FRoi ot oy
Назовем точку х€ G Э) (e,R0, Суоптимальным планом задачи A7), если
Px(HRotC(y\ HRo,c(x€))<€.
14* 211
Предъявим к оракулу, участвующему в решении задачи A7), требова-
требования, аналогичные требованиям а)-в) из п. 5.1 к источнику информации
о задаче A5), в которых множества SSkR (x) заменены naFR tc(x)- При
этом условии оказывается возможным использовать алгоритм из п. 53
для вычисления (б, Ro, С)оптимального плана задачи A7). Естественно,
что роль бинарного отношения S(k, Ro) будет в этом случае играть отно-
отношение
С(Л0)= {(t o)
C(GRv (у) U NRt(yH Э C(GRo (х) U NRt(x))) , A8)
т.е.
x(C(R0)y *=* iG^(y) D G%o(x) и
C(GRo(y) U NRo(y)) D C(GRo(x) U NRo(x))} .
В заключение сформулируем основные выводы параграфа. Введенная
здесь (R, С) оптимизация сводится к традиционной оптимизации по бинар-
бинарному отношению C(R), сформированному в соответствии с формулой A8)
по исходному бинарному отношению R и корректирующей функции вы-
выбора С( •). Для бинарного отношения R, для которого классическое опре-
определение Opt/? G теряет смысл, оптимизация по бинарному отношению C(R)
при естественном подборе корректирующей функции выбора интуитивно
представляется приемлемой.
Если исходное бинарное отношение R полно, а корректирующая функция
выбора монотонна, то оптимизация по бинарному отношению C(R) дает
тот же результат, что и оптимизация по R.
Таким образом, модели МППШ с произвольными вогнутыми бинар-
бинарными отношениями могут быть сведены при помощи вспомогательных
корректирующих функций выбора к стандартным моделям выпуклого
программирования в порядковых шкалах, для которых разработаны
конструктивные методы анализа.
Глава IX
ОБОБЩЕННОЕ МАТЕМАТИЧЕСКОЕ ПРОГРАММИГОВАНИЕ (ОМП)
§1. Введение
1.1. Традиционная схема математического программирования охваты-
охватывает многие широко используемые модели принятия решений. Формаль-
Формальная запись задачи математического программирования имеет вид
/о(х) -> max \fs(x) > uS9 s G V, х G G С Бт. A)
Здесь fs(x), s G О, г , — скалярные функции векторного аргумента х, опре-
определенные на заданном множестве G\us- фиксированные скаляры.
Для последующих обобщений удобно будет использовать следующую
эквивалентную запись задачи. Требуется найти такой вектор х*9 что
х* G G, /,(*•) > u^s G пТ /о(**) > /о(*) Vx € G:
W5> rei9r. B)
В настоящее время теория пртшятия решений существенно расширилась
и включила в себя такие разделы, как многокритериальная оптимизация,
групповые решения и теория игр. Оптимальный выбор в соответствующих
моделях не укладывается в традиционные рамки схемы A). Наметилась
тенденция разрабатывать свои частные подходы к вычислению "оптималь-
"оптимального" выбора (плана, управления, проекта) для каждого частного класса
моделей любого из разделов теории принятия решений. В то же время
развитие вычислительных методов в рамках этой теории требует унифи-
унификации подходов к оптимальному выбору. Представляется, что основой
гакой унификации может служить естественное обобщение схемы B),
в которой скалярные функции /5(х), s G 0, г , заменены на вектор-функ-
вектор-функции, скаляры м5 - на фиксированные векторы us, а неравенства и "опти-
"оптимизация" интерпретируются в терминах некоторых бинарных отношений
Rs, s = (O,l,...,r).
Назовем задачей обобщенного математического программирования
(ОМП) задачу,в которой требуется найти такой вектор**, что
х* G G, fs(x*)RsuSf s E 17^, /о(**)Яо/о(*) Vx G G:
fs(x)Rsus, s Е 177, C)
где /5(х) - вектор-функция в Е~5, a Rs — бинарное отношение на EHs ,
s G 0, г.
213
Если Ro неполно, то вместо соотношения fo(xm)Ro/0(х) следует ввести
в определение задачи ОМП соотношение /0(х) $ G% (/0(х*)), где
GR0(y) ~ строгий верхний срез RQ в точке у (множество точек G, "строго
лучших" по А о, чем у ).
По техническим соображениям удобно выделять ограничения, записы-
записываемые в виде обычных неравенств, gf(x) < 0, / е 1, к9 гдеяу(х) - скаляр-
скалярная функция вектора х. Таким образом, будем считать, что в задаче обоб-
обобщенного математического программирования требуется найти вектор х*
такой, что
*• €"С, fs(x*)RsuS9 s е 177, gi(x*) < 0, / G TJ9
fo(x*)Rofo(x) Vx E G: fs(x)RsuS9 s G 1^, D)
g;(x) < o, j e TJc.
Чтобы упростить запись задачи и исследование методов ее решения,
г п п
примем п = 2 л,, введем пространство Еп - Е ° X ... X ? г, вектор-
5=0
функцию
- i /oW, j\{X)9...,
и вектор
и, = { 0,..., 0, м„ 0,..., 0 ) .
5-1 Г
о * + 1
Введем, кроме того, отношения Rs на Еп\ если w, и Е Еп, то uRsu <==>
<=> {u)sRs(u')S9 где (-)j — проекция на ?1. Поставим в соответствие
ограничению fs(x)Rsus эквивалентное ограничение f(x)RsuS9 где us EEn
таково, что (us)s = us. В этих терминах постановка задачи D) принимает
вид: требуется найти такой вектор jc*, что
х* е g, f(x*)Rs"s, s е Г7, */(*•) < о, / е TJ,
V^ € С: f(x)Rsus, s € 17, E)
^у(д:) < 0, / e 1Д.
В случае неполноты Ло следует вместо f(x*)Rof(x) ввести /(х) ^
В дальнейшем отбросим знак ~над Rs и w5. Это не вызовет не-
недоразумений.
Пусть норма на Еп есть ||||оо - максимум модуля координат. Введем
некоторые обозначения: D - верхняя оценка ||-II«-диаметра f(G),
214
f(G) и
W= {у eEn\yi-D <у, <yt + Д / Е 1,л ), F)
Gg= {x eG\gf(x) < о, / е Г*"}, G)
B = {>> € НЧЭ* EG^: /(*)>>>), (8)
Сел) = {у eQ\yR,u» * е Г7>, (9)
Q* = { J> € С(Л) |^Ло« Vu G <2(*)> A0)
(предполагается, что G^ и Q(R) имеют непустую внутренность).
В этих обозначениях множество решений задачи E) определяется фор-
формулой (здесь и далее в этой главе, кроме § 8, предполагается, что отноше-
отношения RSi s Е 0, г , монотонны, a Ro — полно)
G.= ir\Q.)nGg). A1)
Точка хЕ2?т называется е-приближением решения задачи E), если
выполнены условия
х G Qg9 f(x) G Q(R)> f(pc)Roy(e), A2)
где у(е) — Лхудшая" по отношению Ro точка е-окрестности Q*. Эта ок-
окрестность имеет вид
G:= A-еH. + еб(Л) С {>> Е 0(ЛIРи.ц.(Л-< 2/)€ }, A3)
где р у. ц.,00 - расстояние (в метрике || • IU) от .у до Q#; Ql замкнута.
Ограничимся рассмотрением непрерывных отношений. Напомним, что
отношение R называется непрерывным, если множество { (jc, y)\xRy)
замкнуто в G X G.
1.2. Математическая теория принятия решений имеет дело с двумя
классами задач. К первому относятся те, которые определяются содер-
содержательной сущностью различных разделов теории принятия решений.
В них требуется при том или ином наборе условий установить бинарные
отношения Rj9 определяющие в заданных конкретных ситуациях следую-
следующие понятия: рационально агрегированный критерий (в задачах много-
многокритериальной оптимизации); рационально агрегированное предпочте-
предпочтение лица, принимающего решение ? (в теории групповых решений);
равновесие или компромисс (в теории игр).
В задачах второго класса отношения Rj (или механизмы, их обусловли-
обусловливающие) предполагаются заданными. Проблема здесь в разработке эконом-
экономных вычислительных методов, обеспечивающих конструктивный выбор
решения при условии, что вопросы, связанные с агрегированием крите-
критериев и предпочтений и установлением подходящих понятий компромисса,
уже ясйы.
Постановки задач первого класса существенно связаны с конкретными
особенностями ситуации, в которой принимается решение. Здесь вряд ли
можно говорить об унификации соответствующих моделей. Методы качест-
качественного анализа задач первого класса, по-видимому, не могут быть отор-
оторваны от их содержательной специфики и по необходимости должны быть
различными для разных разделов теории принятия решений. Что же касает-
215
ся подходов к задачам второго класса, для которых требуются вычисли-
вычислительные методы оптимального выбора при заданных oiношениях Rj или
механизмах их формирования, то они не зависят от специфики разделов
теории принятия решений и укладываются в схему обобщенного матема-
математического программирования и его расширения - многошагового ОМП
(см. гл. XII). Разработка и исследование методов ОМП и составляют со-
содержание данной главы.
§ 2. Подходы к анализу задач
обобщенного математического программирования
2.1. Во многих случаях (в частности, когда множество f(G) замкнуто
и связно в Еп, а отношения предпочтения Rj непрерывны) можно свести
(причем неоднозначно) задачу обобщенного математического програм-
программирования вида C) или D) к задаче традиционного математического
программирования вида A) или B). Во всех этих случаях бинарному
отношению R соответствуют скалярные функции V — индикаторы отно-
отношений такие, что
Г,ШМу)** W/C*)) > W/O0) v/,(x), fj(y) s f(G).
В таких случаях обобщенная задача может быть переписана в терминах
индикаторов бинарных отношений в виде традиционной задачи математи-
математического программирования. Однако подобное сведение, вообще говоря,
неконструктивно, да и нецелесообразно. Дело в том, что если отноше-
отношению R соответствует один индикатор, то ему отвечает и бесконечное мно-
множество других индикаторов, полученных один из другого с помощью
строго монотонных преобразований. Один и тот же порядок отвечает
бесконечному числу целевых функций с совпадающими экстремальными
точками. Это не позволяет вычислять приближенное значение оптимума
с погрешностью по целевому функционалу, не превышающей заданную.
Задание ограничений на выбор плана в порядковых шкалах оказывается
гораздо более гибким методом выделения множества допустимых реше-
решений, чем количественные отношения. Следует также учесть, что порядко-
порядковые отношения между характеристиками вариантов, из которых должен
быть выбран лучший, доступнее принимающему решение, чем количест-
количественные отношения. Содержательно бинарное отношение - более простой
объект, чем критерий.
Таким образом, практический интерес могут представлять главным
образом методы решения задач обобщенного математического програм-
программирования в их естественной форме, предполагающей задание целей и
ограничений набором бинарных отношений.
В данной главе предлагаются диалоговые методы решения задач обоб-
обобщенного математического программирования. Описываемые процедуры
позволяют по последовательно предъявляемым альтернативам и получае-
получаемой локальной информации о компонентах вектор-функции fs(x) и об от-
отношениях Rs установить за возможно меньшее число шагов 6-приближен-
6-приближенное решение предъявленной задачи фиксированного класса. Источник
информации о локальных характеристиках функций, входящих в условия
задачи, называется в дальнейшем "оракулом", а источник локальной ин-
216 I
формации о предпочтениях — лицом, принимающим решение (ЛПР). Диало-
Диалоговые процедуры решения задач обобщенного математического програм-
программирования . различаются по возможностям источников информации. Мы
будем рассматривать оракул первого порядка и ЛПР нулевого и первого
порядков. Оракул первого порядка способен для каждой предъявленной
альтернативы хЕ G указать значения компонент функций fs(x),gj(x) и
их градиентов (или опорных функционалов) в точке х. ЛПР нулевого и
первого порядков в состоянии по любой паре альтернатив х9у € G и соот-
соответствующим значениям вектор-функций fs(x)GEns определить, как
эти альтернативы соотносятся друг с другом по каждому из отношений
RS9 s = 0,1,... ,г, т.е. для каждого s указать, какой из трех мыслимых
случаев fs{x) Psfs(y)9 fs(y)Psfs(x) или fs(x)Isfs(y) (соответственно
для s > I fs(x)PsuS9usPsfs(x) или fs(x)IsUs) имеет место. ЛПР первого-
порядка, кроме того, может сообщить для всех s опорные функционалы
$s (х) к соответствующим отношениям (к множествам Gs (х) = {у €
G G | yRs x}) в предъявленной ему точке xG G.
2.2. Вначале будем рассматривать задачи обобщенного математического
программирования вида D) или E), в которых отношения R,,j = 0,1,...
... ,г, — нестрогие предпочтения. Под Q+ (см. A0)) в этом случае пони-
понимается множество "наибольших" (по Ro) элементов из Q(я). В § 8 будем
рассматривать задачи ОМП с произвольными бинарными отношениями.
Соответственно будет расширено понятие "наибольшие" элементы. Вряд
ли можно ожидать создания конструктивных методов решения задач
обобщенного математического программирования в столь общей поста-
постановке. Поэтому будем в дальнейшем (исключая § 8) рассматривать только
задачи более узкого, но важного для приложений класса - задачи обобщен-
обобщенного выпуклого программирования (ОВП), в которых бинарные отноше-
отношения Rj рефлексивны, транзитивны и полны.
Напомним необходимые определения.
Полное отношение R на выпуклом множестве G называется вогнутым,
если \fx9y9z EG таких, что z Фу и z - выпуклая комбинация х9у9 из
xRy следует zRy. В содержательных терминах вогнутость отношений тре-
требует, чтобы каждый элемент на отрезке предпочитался худшему из концов.
Напомним, что отношение R монотрнно, если из х^у следует xRy и из
х>у следует хРу9 где Р - строгое отношение, соответствующее нестрого-
нестрогому предпочтению R.
В соответствии с замечаниями п. 2Л непрерывные вогнутые отношения
на выпуклом компакте GCEn имеют индикатор. Вогнутость отношений
гарантирует квазивогнутость индикаторных функций, которые определяют-
определяются порядком с точностью до непрерьюного строго монотонного преобразо-
преобразования. Напомним, что функция V (х) называется квазивогнутой на выпук-
выпуклом множестве GCEn9 если множества{yG G \ V(y) > V(x)} выпуклы
VxGG.
Эквивалентное определение вогнутых предпочтений дается следующим
утверждением:
Бинарное отношение предпочтения R на выпуклом компакте G СЕп вог-
вогнуто в том и только в том случае, если для него существует строго квази-
квазивогнутый индикатор предпочтения V(x) —такая непрерывная строго ква-
217
зивогнутая функция V: G-+E1, что
xRy*=*V(x)>V(y).
Функция V(x) строго квазивогнута, если множества {хЕ G \ V(x)> а)
выпуклы \fa и множества {х Е G I V (х) = а } не содержат (при а < max V (x))
внутренних относительно G точек (последнее эквивалентно тому, что из
V(x) > V(y) следует V(kx+ (I -Х)д>)) > V(y)90<\<\).
Таким образом, D) является задачей ОВП, если G — выпуклое множест-
множество; RSbs = 0,1,...,г, - вогнутые отношения; gj(x),j = 1, 2,... ,к, -
выпуклые функции, компоненты fs (jc) , s = 0,1,..., г, — вогнутые функ-
функции.
Заметим, что к модели ОВП могут быть сведены многие задачи обоб-
обобщённого математического программирования с определенным образом
согласованными между собой невогнутыми бинарными отношениями Rs
и невогнутыми вектор-функциями fs.
2.3. Чтобы установить трудоемкость методов решения задач обобщенно-
обобщенного математического программирования, необходимо уметь не только дока-
доказывать сходимость методов, но и оценивать (это важно для организации вы-
вычислений) скорость сходимости. Для этого следует указать способ измере-
измерения погрешности плана и дать определение б-приближенного решения
задачи.
В главе VIII обсуждаются достоинства и недостатки основных способов
измерения погрешности приближений в задачах оптимизации функций и
оптимизации предпочтений.
Введенное выше определение €-приближенного решения задачи (см. A2))
естественным образом решает проблему измерения погрешности. При ма-
малом 6 допустимый план, вектора =f(x) характеристик которого отстоит
не более чем на 2?>€ от множества б», должен быть хорошим приближе-
приближением к оптимальному плану в любом содержательно разумном понимании
термина "хороший".
В частности, таким приближением должен быть план х с вектором харак-
характеристик f{x) =y(e). Но нас интересуют лишь свойства планов, выражае-
выражаемые в терминах предпочтений векторов их характеристик. Поэтому любой
план хЕ Gg, для которого f(x) Gfi^j и f(x)Roy(€)9 будет по крайней
мере столь же хорошим приближением к оптимуму, как и план х с векто-
вектором характеристик у (б).
Следовательно, определение A2) вполне разумно с содержательной точ-
точки зрения и не использует никаких произвольно выбираемых индикаторов.
В то же время удается сформировать конструктивные методы построения
е -приближенных в этом смысле решений и явно оценить трудоемкость
этих методов.
§ 3. Идея методов решения задач
обобщенного выпуклого программирования
3.1. Для решения задач традиционного выпуклого программирования
разработаны экономные методы: метод центров тяжести (МЦТ) и моди-
модифицированный метод центров тяжести (ММЦТ) или, как его теперь назы-
называют, метод эллипсоидов (МЭ) [35].
218
Идея этих методов в гл. VIII распространена на задачи выпуклого прог-
программирования в порядковых шкалах. Последние могут быть включены
в частную модель ОВП, в которой f(x) = х, а условия ranag/ (x) <0 отсут-
отсутствуют.
Предлагаемые в настоящей главе методы решения задач ОВП комбини-
комбинируют версии МЦТ (и ММЦТ), приспособленные к решению задач традицион-
традиционного выпуклого программирования и задач математического программи-
программирования в порядковых шкалах.
Приведем наводящие соображения, поясняющие идею и основные этапы
предлагаемых методов решения задач ОВП. /
Решение задачи ОВП (в предположении, что предпочтения Rs,s ? 0, г
монотонны) может быть получено как решение выпуклой экстремальной
задачи в порядковых шкалах, в которой область определения планов зада-
задана неявно. Для того чтобы удостовериться, принадлежит ли заданная точка
области допустимых решений задачи в порядковых шкалах, следует решить
систему выпуклых неравенств или, что практически то же самое, задачу
традиционного выпуклого программирования.
Пользуясь обозначениями п. 1.1 § 1, запишем соответствующую форму-
формулировку задачи обобщенного математического программирования в сле-
следующем виде.
Требуется найти точку у* Е Qm, где области б* и Q,Ry заданы соотно-
соотношениями (9), A0), а множество Q — неявно условиями (8). Кроме того,
найдя у*9 необходимо построить х* Е Gg: f(x*) >у*. Решение этой сис-
системы неравенств оказьюается одним из решений задачи обобщённого ма-
математического программирования. Множество всех ее решений описывает-
описывается, очевидно, соотношением A1).
Вычисление у* (задача I) — задача математического программирования
в порядковых шкалах, а определение х* (задача II) - задача традицион-
традиционного математического программирования. Трудности сочетания методов
решения задач I и II обусловлены неявной формой задания области Q.
Серьезные технические затруднения связаны также с выбором допустимых
погрешностей итеративного решения составляющих задач, при котор9м
экономным образом обеспечивается требуемая точность решения результи-
результирующей зйдачи.
3.2. Источники локальной информации, используемые при решении
неравенств или экстремальных задач в порядковых шкалах, могут быть
нулевого или первого порядков. В первом случае они выдают значения
функционалов задачи в опрашиваемых точках или ранжируют предъяв-
предъявляемые векторы. Во втором случае они, помимо этого, способны указать
опорные функционалы к функциям или предпочтениям в этих точках или
строить гиперплоскости, отделяющие предъявленные точки от множеств,
которым они не принадлежат.
Приведем грубую схему решения задачи ОВП. Начнем решение с вычис-
вычисления центра тяжести уг = у\ (W) II • II„-шара W= Wo. Чтобы установить,
принадлежит ли ух области Q, необходимо решить систему выпуклых
неравенств (задачу II) приу=У\. При этом могут возникнуть два случая:
система неравенств несовместна или имеет решение. В первом случае метод
решения задачи II выдает линейный функционал, по которому строится
219
гиперплоскость, отделяющая уг от Q. Функционал у формируется в соот-
соответствии со следующими соображениями.
Несовместность задачи II при данном у означает, что функция ау (х) -
= max (упл —/,(*)) имеет на Qg положительный минимум. Предпо-
1 </ <п A) '
ложим, что мы нашли этот минимум Зс и знаем Gg. Тогда в соответствии с
необходимыми условиями минимума ау (х) для некоторых <р/ > О имеем:
- 2 v>,(/;<*), x-x)>0 \fxGGg A4)
A5)
Пусть Й7(х) = (/;(*),*- Зс)+//(х);Л(л:) = (/|1(х),... ,/iw(x)), ^ A6)
Qy= { uGEn\3xe Gg: h(x)>u}. A7)
Очевидно, h(x) > /(*), так что Qy D Q. В то же время Qy однозначно
определяется по Gg и х, и коль скоро известно множество Gg и вектор х,
то можно построить и область Qy. Заметим теперь, что у $ Qy. В самом
п _
деле, 2^/(^G) - /*/(*)) достигает минимума по х G Gg при х = х (в силу
A4)) и этот минимум положителен (в силу A5)). Следовательно,
откуда
^(^(/)/) Q^ A8)
Таким образом, у = (<р1э..., </?„) разделяет^ и Q^,, а тогда и подавно
разделяет;; и Q С Qy.
В последующей итерации, которая строится по тому же принципу, роль
Wo = W будет играть область
Wt = {yewo | (^J-^i(^o)KO), A9)
если используется МЦТ, и эллипсоид минимального объема, содержащий
И>!,при применении ММЦТ для решения задачи I. Если же окажется, что
У\ е Q (и при этом из системы выпуклых неравенств будет установлен
хх Е Gg такой, что/(дгх) =у\)9 то проверяем (с помощью ЛПР) выполне-
выполнение условий yiRsuSi s = 1,..., г. Пусть какое-либо из них, скажем $е,
не выполняется и ?__— опорный функционал к предпочтению R_ в то^ке
У\ = f{*\) (т.е. опорный функционал к множеству WoCVi) = ( z G ^ol
zR-У i} ). Положим в таком случае:
s
^^{^e^oKI-^-AxOXO}. - B0)
Если же jHii ^ws Vs G { 1, ...,/•}, то находим |0 — ненулевой опор-
опорный функционал к предпочтениюRo в точкеух =/(хг) и полагаем
H^={^e^ol(b^-/(xi))<0}. B1)
220
При использовании МЦТ принимаем Wi = Wt и переходим к следующей
итерации, в которой роль у i =y\{Wo) играет д>2 ^УгО^х) — центр тяжести
области И7!, а при ММЦТ в качестве М/х рассматриваем эллипсоид мини-
минимального объема, содержащий Wi9 находим его центрy2(Wi), проверяем,
принадлежит ли у2 области Q, и тд.
3.3. На каждой итерации решения задачи обобщенного выпуклого прог-
программирования устанавливается, таким образом, принадлежит ли очередная
точка^области Q. Будем называть процедуру, проверяющую разрешимость
соответствующей системы выпуклых неравенств (решающую задачу II),
процедурой сепарации (разделения) sep. Процедура sep = sep(y{) позво-
позволяет по фиксированному вектору yt построить линейный функционал
<ру разделяющий уг и Wt (если система неравенств несовместна), или вычис-
вычислить jc/ G Gg такой, что /(*/) > >v, и перейти к проверке условийyiRsus.
Каждая итерация процесса решения задачи I позволяет перейти от облас-
области Щ-1 локализации решения к области Wf меньшего объема. Будем на-
называть итерацию процесса решения задачи I процедурой локализации Loc =
= Loc (Wi). Последовательное применение процедур Loc стягивает области
допустимых планов у к е-окрестности решения: | Wt\ < о)\ Wt^t |. При
1 с
использовании МЦТ со = 1 , а при ММЦТ со = 1 , где с > 0 -
е п
константа.
В §§ 4, 5 описываются минимальные требования к процедурам sep О)
и Loc (W), обеспечивающие возложенные на них функции. Методы МЦТ
и ММЦТ удовлетворяют этим требованиям, но отнюдь не исчерпывают
множество процедур sep и Loc.
Соответствующие версии МЦТ и ММЦТ являются подходящими реа-
реализациями процедур sep и Loc, если основное требование к методу - по
возможности сократить число обращений к ЛПР и к "оракулу". При иных
критериях качества метода решения ОВП целесообразно рассматривать дру-
другие реализации процедур sep и Loc.
В приведенном грубом и несколько идеализированном описании схемы
решения задачи ОВП, естественно, опущены многие детали алгоритма.
Строгое формальное изложение и обоснование метода (см. §§ 4 — 6)
построения б-приближенного решения задачи ОВП требует дополнительных
довольно тонких рассуждений, которые, однако, не меняют изложенной
здесь сути метода.
Как уже указывалось, технические трудности в формировании процедур
sep и Loc и в обосновании их роли в построении е-приближенного решения
задачи ОВП определяются в значительной мере необходимостью учета до-
допустимой погрешности. Процедуры sep и Loc, помимо точки у и области W
соответственно, зависят еще от параметра 5 > 0, характеризующего требо-
требования к качеству отсечения и локализации, при которых обеспечивается
заданная точность приближенного решения.
Приведем формальное описание требований к sep (.у, 5) и Loc(JV, S)
и обоснуем и оценим трудоемкость некоторых версий этих процедур.
221
§ 4. Процедуры сепарации
4.1. Процедура sep(j\ 5) использует в качестве входа у G Еп, 5 > 0 и
выдает на выходе либо (I, х), либо (II, </>), где I (соответственно И) - тип
выхода, х € Gg, у € Rn, II <р llj = 1, где II кр 11Х - сумма модулей координат <р.
Процедура sep(>>, 5) должна удовлетворять следующим требованиям:
Osep) Pi.iJ
для некоторого v
5
(iiisep) sep(^, 5) = (И, ф) =» sup <<д v) + 7
veQ 4
Опишем две версии процедуры сепарации: sepl9 основанную на идеях
МЦТ, и sep2, использующую принципы построения ММЦТ.
4.2. Правила, описывающие sepi на входе (у, 6), таковы:
1°. Вычисляем рн. ц^ (у, W). Если
4
5
то находим \р G Еп: II <р >i = 1 и (<р,^) = sup (<?, z) + —. Результатом
zGW 4
sepi(j>, 5) объявляем (II, ф).
2°. Пусть теперь
PB.IU(XH>)<^6. B3)
4
Будем строить последовательности выпуклых компактов Gt С Ет
с непустой внутренностью, выпуклых функций g № (х), / G { 1,..., к },
вогнутых функций /jO (*), / G {1,...,«} в соответствии со следующими
правилами:
a) при / = О Со = G,s}°>( • ) s - ~, К/ <к; /<°>( • ) = ?7 + Д К
b) при i > 1 строим центр тяжести х{ области G, _ х.
Возможны три попарно несовместных случая:
1/. 3/=/@е {1,...,*>: ^(^)>0,
'2,. V/€{l,...,*}f ^(х,)<0, но 3/ = /(/)€ {1,...,я>:
В случае 3/ переходим к d). В случае 1/, 2/ полагаем:
l Jc-jc,)}, /G
),х-дс,)> в случае 2,
222
Области Gf определяются следующими соотношениями:
{xeG/_1|g//>(x)<0, /€ <1,...,А;}} в случае \4>
G,= {xEGi_l\g]i\x)< 0,/G {1,...,*>;
fii0(x)>yi - 8, /е { 1,... ,я }} в случае 2,.
В sepi, как видим, G/ С G/ _ t.
Переходим к с).
с) Обозначим:
Вычислим pi. у^ (>>, б(/*). Если р„. йов (j\ G(/)) < C/4)8, то увеличиваем
i на 1 и снова обращаемся в Ь). В противном случае находим у Е Еп: \\<р 1Х =
8
= 1 и (<р, у) > sup (<P,z) + - . Полагаем septQ;, 8) = (И, у) и оста-
z€ Q\'> 4
навливаемся. л
d) Пусть обращение к d) произошло при / = /. Полагаем sep^^, 8) =
= (I, x«) и останавливаемся.
43. Правила, описывающие sep2, отличаются от правил процедуры sep}
пунктами 2° а) и 2° б). Кроме того, в правилах sep2 имеется еще пункт
2°е). Все остальные пункты правил sep2 идентичны соответствующим пунк-
пунктам правил sep^
Выпишем только те пункты правил sep2, которые отличают эту процеду-
процедуру от версии sePl:
2 а) при i=0 Go - эллипсоид, содержащий G, g> }( *), и//0)( • )
определяются так же, как и в sepi;
2° в) при/ > 1 G/ - эллипсоид, который строится следующим образом.
Строим центр X/ эллипсоида G/ _ г. Возможны 4 случая:
1;. XjEG и 1Ь
2,* дс,€Си2,,
3?. xtGG и 3/.
В случае 0/ полагаем:
€ { 1,
Находим опорный, функционал ?/ к рц. ц(х, G) в х = X/ (II- II — какая-
нибудь норма на Ет) и переходим к е).
В случаях 1* и 2/* определяем gf**(x) и // (jc), так же, как и для
в случаях 1/ и 2/ соответственно.
Кроме того, полагаем:
1/(/) случае 1*,
p) в случае
223
Если в случае 2f d/^.^jc,-) = 0, то ?,- — произвольный ненулевой функцио-
функционал на Ет.
Переходим к е).
В случае 3* переходим к d).
е) Полагаем Gt равным эллипсоиду наименьшего объема, содержащему
Переходим к с).
4.4. Убедимся теперь, что описанные процедуры sept и sep2 действитель-
действительно являются процедурами сепарации, т.е. удовлетворяют условиям (i^p) —
- (iiisep) •
Теорема 1. Процедуры sepi и sep2 удовлетворяют требованиям (isep) —
(iii)
(sep)
Доказательство. При выполнении неравенства B2) утверждения
теоремы очевидны. Будем в дальнейшем предполагать, что имеет место
неравенство B3).
Пусть рассматриваемая процедура кончила свою работу. Если при этом
тип результата оказался /, то это значит, что на шаге /, на котором проце-
процедура остановилась, имел место случай 3? C*) и результат процедуры есть
(/, xf). По определению 3^C,*) имеемх Е Gg и f(xf) >у - 6, где б = E, ...
..., б). Отсюда следует, что 3 и </(*/): Wv-y IL < б, т.е. условие (iisep)
выполнено. Л
Пусть теперь тип выхода будет П. Это означает, что на шаге i, на кото-
котором процедура остановилась,
*,z) + - B4)
4
и sep.(.y, 6) = (II,<p).
Очевидно, что gf\x) < gf(x)9 x G G9 / G {1,... f ft }, и //'>(*) > /,(х),
jcGGf le {1,...,n) .Поэтому еA) Э f(Gg) и Q{i) DQHW. Ясно, что из
B4) следует условие (iiisep).
Итак,в предположении, что процедура sep остановилась, доказано выпол-
выполнение условий (iisep) и (iiisep)- Остается проверить условие (isep)-
Пусть р„ л |вв(у, Q) < 5/2. Это значит, что 3 v G En, x G Gg: v < f(x) и
Wv-y IL <б/2. В частности, vt -yx>- 6/2, /G {1,... ,п) и fi{x) >yx- 6/2
/G{l,...,w).Ho тогда из х G Gg вытекает, что xG G^\ а из /}(*) >
>уг- 6/2 следует,что /Jf)(x)>У1 ~ 6/2, /G {1,...,п} .Положим:
( д>/-6/2при ^/-6/2>jF/-Z) и yj-dl
\ yt-D в противном случае.
Тогда и,- < ff\x) для всех /е{1,...,«}йи6^т.е.и€б(/). Вместе с
тем при ух - 6/2 € [У/ - Д ух + ?>] имеем i yt - vx |< 6/2. Если же ух - 6/2 <
<ух - Д т.е. j>/ - 6/2.< У/, то из ух> ух - D - C/4) б следует \ ух - vx \ <
< C/4) 6. Наконец, в случае ух - 6/2 >ух + D неравенство /}(*) > ух - 6/2
невозможно и, стало быть, всегда |ух - vx \ <C/4) б или р„. н (.у,
<C/4N.
224
Таким образом, при р,. и^Су, (?) < 5/2 тип результата sep непременно
есть/. Это и доказывает выполнение (/sen). Теорема полностью доказана.
Замечание. Если sep.( >>, 5) = (/, jc) , то по у и х можно указать v:
v < fix) и II v - у IL < 5 (условие (iigep))- Такое v будем обозначать/$(*).
4.5. Оценим теперь трудоемкость процедур sep % и sep2.
Теорема 2. Число шагов процедуры sepj не превосходит величины
Л/,(б)< cm In , B5)
осув
а число шагов sep2 не более
М2(Ъ)<ст2\п —. B6)
а-ув
Здесь
l/w l/m
О -
l
Доказательство. При выполнении условия B2) утверждения
теоремы очевидны. Будем в дальнейшем предполагать, что имеет место
неравенство B3).
По стандартным соображениям, используемым при изложении метода
и обосновании трудоемкости МЦТ и ММЦТ [35, 68], при i < / имеем:
I G,-| ^ j3'| Gq I, B8)
/ 1
где 0 = 0m < 1 ( для sep! 0m = 1 , для sep2
\ e
0W = 1- —, dm>0, dm > *
m m-*- °°
По тем же стандартным соображениям при х Е G \С,- имеем либо х $ G^\
либо 3/(jc) G {1,.. ., п } : ///'ЛОО < Уцх) ~ 8. Следовательно, если
G = {jcGG?|/(jc)> J-5},
то G С G/ при всех i. Кроме того, G^p ^>Gg при всех /.
Пусть if/ - решение задачи
): /(/)(jc) = min { /«(jc) -уг)-* max I jc G G<°.
{}
Введем для 0 <в < 1 множество GI>0 = A - в)i^ +BG<f\ Имеем:
\Gite\>e
Пусть
B9)
Тогда по B8) G,- e\G,- =^ 0, и, следовательно, существует точка jc,- € Gite\Gj.
В силу вогнутости/"(i)(jc) и jc/ G С,;0 имеем:
- в) + в inf / W(jc) . C0)
G
15.Д.Б. Юдин 225
Поскольку XfEG V\Gi9 то для некоторого / = /(*/) будет
<уг - 6, т.е.7(/)(*/) < - 5. Таким образом, из C0) следует:
7@(*#H - 0) <- 5 - в inf/@(x). C1)
G
Имеем:
G i
>inf min{/,(*)-.У/) >-{2Я + рЁ . (^, W))>J2Z>+ -
G / ¦'¦•• \ 4
(мы учли B3)).
Итак, в силу C1) из B9) вытекает, что
Отсюда
7@№)<~S + ^ C2)
1 — и
Если0 таково, что
2D0 8
ТГе< 4 ¦ C3>
то из C2) следует, что /^(*/) < ~ ^*» те- (по определению/^(х))
т{7/№)^<^
/ 4
или (по определению х{)
тЬ{/|(#)л
Но последнее означает, что
Таким образом, если в, i таковы, что вьшолнены неравенства B9),
то работа sep. на шаге i останавливается. Итак /, не превосходит первого
номера, для которого
Учитывая выражения для /3 в процедурах sept и sep2, получаем утвержде-
утверждения теоремы.
226
§ 5. Процедуры локализации
5.1. Процедура LocE, 5) использует в качестве входа множество S из
некоторого семейства п выпуклых компактов с непустой внутренностью
и параметр 6 > 0. Процедура Loc(S9 5) выдает на выходе результат одного
из трех видов (I, х, 5), (П, х, 5), (III, 5), где J, II, Ш - один из трех воз-
возможных типов результата, х GGg9 S = ф или S € п. При этом ддяШ:
y&S, дляII: 3s(y)G {1,... »: Щ(У)Р*(у)У> JWnhfd(x)Roy.
Процедура Loc называется охтягивающей на входе E,8), если
iS|<«|Sj. ' C4)
Опишем три версии процедуры локализации. Две из них - Loci и Loc2 -
используют источник информации первого порядка. Loci основана на идеях
МЦТ, a Loc2 - на принципах ММЦТ; Loc3 опирается на источник информа-
информации нулевого порядка и идеи ММЦТ.
5.2. В процедуре Loci в качестве п принимается семейство выпуклых
компактов в Еп с непустой внутренностью.
Правила, описывающие Loci на входе 5, 6, таковы.
1 . Вычисляем центр тяжести y(S) тела S и применяем sep. (>>(?), 5).
Бели результат sep. имеет вид (II, </?), то полагаем
y9yy(y
и результатом Loc^S, б) объявляем (III, S).
2°. Если результат sep. (y(S)9 6) есть (I, x), то проверяем выполнение
условий
Л(*)Д,и„*е{1,...,г>. C5)
Возможны два случая:
а) одно из условий C5), скажем s~-e, не выполнено, и %_ — опорный
функционал к предпочтению #_ в точке f& (x). В этом случае полагаем
и объявляем (II, х, S) результатом Loci;
б) все условия C5) выполнены, Д (х) Rsus V s G 1, г и sep. (у (S), 6) =
= (I, x). Пурть |o - ненулевой опорный функционал к Ro в точке fs(x).
Полагаем 5 = {д^ е S | ({0> У -/б(*)) <0) иобъявляем A,х, 5) резуль-
результатом процедуры Locj E,5).
5.3. В процедуре L0C2 в качестве ?1 принимается множество эллипсои-
эллипсоидов в Еп. Процедура Loc2 устроена в основном так же, как и Locx. Отли-
Отличие от Loci заключается лишь в том, что, построив S, принимаем в ка-
качестве S эллипсоид минимального объема, содержащий S (при условии,
4Toint 5 Фф). Если int5 = 0,полагаем 5 = ф.
5.4. Процедура Loc3 работает с ЛПР нулевого порядка. В Loc3 в качест-
качестве п служит, как и в Loc2, множество эллипсоидов в Еп.
Правила, описывающие Loc3 на входе 5, S, таковы.
1 . Вычисляем ^ E) - центр тяжести тела 5 - и применяем sep. (у E), 5).
Бели результат sep. имеет вид (П, ф), то полагаем:
и переходим к 3°.
15* 227
2 . Если результат sep.(,y (S), 5) есть (I, х)9 то находим s€ {0,...,/•}:
{sG {1,...,г>: «,Р,/б(jc),если такоеs имеется,
О, earn fs(x)Rsus, sG {l,...,r}.
Затем проводим следующее построение (в координатах 0$ в Еп с тем же
элементом объема, что и у исходных, в которых S - шар радиуса р с цент-
центром в 0).
Опишем вокруг Д (дс) правильный симплекс А такой, что радиус описан-
описанной вокруг А сферы равен р/A00л). Пусть .у1 — наихудшая (везде далее
"наихудший" в смысле Л_) среди вершин А. Обозначим для всех у G Еп,
У ^ /бОО через А(у) (^правильную пирамиду с вершиной .у с высотой,
коллинеарной у - /$(х), ребрами (боковыми) — 0$-ортогональными век-
векторами f$(x) — "у* (У1 — концы ребер, отличные от у), углом уп =
- arccos 1/Bи) между высотой и боковыми гранями. Если у - худшая из
вершин А(д>), то полагаем Ту -у и JCO0 = {z\y - z лежат в конусе до-
допустимых направлений из .у в А (у) } . Еслид> не является худшей вершиной
в А (у), то обозначим через Ту ту из вершин А (у), для которой уР^Ту.
Строим последовательность У1*_у2 = Ту1, уг = Ту2,... до тех пор, пока
не получим у1 -Ту1. Полагаем S = S \К (у) и переходим к 3°.
3°. Во всех случаях принимаем в качестве S эллипсоид минимального
объема, содержащий S. _
Если Т определено и равно нулю, то Loc3= (I,jc, S)~ Если J определено и
Т> 1, toLoc3= (П,д:,5).Если5"неопределено,тоЬосз = (П1,5).
5.5. Имеет место следующее утверждение, характеризующее описанные
процедуры.
Теорема 3. Процедуры Loci — Loc3 являются процедурами локализации.
Если S содержит II - IL-шар радиуса р с центром в у (S) (в центре тяжести
тела S), а 6 <р/100л, то коэффициент со стягивания LocfE, б) на входе
E,5) равен
1-е, с>0 для /= 1,
1 , с>0 для / = 2,3.
п
При этом Loc3 требует не более О (я5 Inn) обращений к источнику ин-
информации (к ЛПР).
Доказательство.
1°. Можно непосредственно убедиться, что процедуры LoCi - Loc3
удовлетворяют требованиям из п. 5.1 § 5 к процедуре локализации.
По стандартным соображениям, использованным в [35] для оценки
трудоемкости выпуклой оптимизации с "оракулом" нулевого порядка,
верна и оценка числа обращений к ЛПР для Loc3.
Проверим лишь свойство стягиваемости приведенных процедур локали-
локализации.
2°. Пусть S содержит II • IL -шар радиуса р. _
Если sep(j> (S), 8) = (II, \р), то при i = 1 S содержится в части 5, отсе-
отсекаемой от нее гиперплоскостью, проходящей через центр тяжести y(S)
тела; при i = 2, 3 S - эллипсоид минимального объема, описанный вок-
вокруг этой части.
228
Во всех этих случаях свойство стягиваемости обосновывается стандарт-
стандартными (для МЦТ и ММЦТ с источниками информации первого и нулевого
порядка) методами.
Пусть теперь sep. (у (S), 6) = (I, х).
При / = 2, 3 S содержит I • Вое-шар радиуса р с центром в у (S ). Посколь-
Поскольку S < р/lQOn, а ИД (х) -y(S) L <5, то /б(х) содержится в результате
S* подобного сжатия S Ky(S ) в 100 л раз. Значит, в координатах Os имеем
1/() — y(S)\< а/1 00 п, и вершина К (К - конус, удаляемый из S для
Рис. 9.1
получения S) лежит в шаре радиуса p/50/i с центром в нуле (в координа-
с
тах Os). Поэтому стягиваемость с со = 1 имеет место и здесь.
п
При / = 1 (и sepi(y(S)9 б) = (I, х)) S содержится в части, отсекаемой
от S гиперплоскостью П, проходящей через/6 (х) и пересекающей И * IL -шар
радиуса б с центром у (S). Поскольку р> 100и6,то /$(х) содержится в ре-
результате S* подобного сжатия S к у (S) в 100 л раз.
Пусть По — гиперплоскость, проходящая через y(S) параллельно П (см.
рис. 9.1). Можно считать, что По П S Ф ф (в противном случае \S \<
S | по свойствам МЦТ). Именно этот случай изображен на ри-
рисунке. Здесь 5 - заштрихованная, S - дважды заштрихованная, AS - од-
однократно заштрихованная, ? - незаштрихованная область.
Пусть о — максимальная из площадей сечений S гиперплоскостями,
параллельными По и заключенными между По и П. Тогда | AS|< ah
(h - расстояние между По и П). В то же время плоскость П, параллельная
По и отстоящая от нее на 100n/t, пересекает S (поскольку П пересекает
S*). Следовательно,
1
\SUAS\>-aW0nh=100ah
п
и
е-1
Но | S U AS |< 1S | (свойство МЦТ). Таким образом,
~~ е
229
\s\<ifli—[\s\y
e
что требуется. Теорема доказана.
Замечание. Утверждение о стягиваемости (с очевидными измене-
изменениями доказательства) остается верным и тогда, когда условие "S содер-
содержит ||-II со-шар радиуса 100л6 с центром в y(S)" заменено на условие
"при sep.(уE), 5) = A,х) вектора(S) + 100л(/б(х) -y(S)) лежит вS".
§ 6. Методы решения задач ОВП
6.1. В § 3 приведена грубая схема решения задач ОВП. В соответствии
с этой схемой решение задачи ОВП сводится к итеративной последова-
последовательности решений системы выпуклых неравенств и задач математическо-
математического программирования в порядковых шкалах. В § § 4, 5 сформулированы
требования к процедурам сепарации и локализации, используемым для ре-
решения задач. Там же построены две версии процедуры сепарации - sepi
и sep2 и три версии процедур локализации- Loci — Loc3. Комбинируя их,
можно получить шесть версий методов решения задачи ОВП.
Обозначим через $??м такой метод, отвечающий параметру 5 > 0 ка-
качества решения и использующий процедуру сепарации sepK(y, 5), к = 1, 2,
и процедуру локализации LocM (Q, 6), д = 1,2,3.
Пусть X/+1 = (I, II, III) — тип результата процедуры LocM (б/, 5). Метод
описывается итеративным процессом
/e/,5). C6)
Здесь xi+i определено лишь для Х/+1 Ф III. В C6) предполагается, что
при /1=1,
..г
им
Go .
о-шар, описанный вокруг W, при ц = 2,3.
Процесс обрывается в первый момент (обозначим его МE)), когда вы-
выполняется одно из следующих двух условий:
C7)
C8)
Остановка процесса 33?м в соответствии с C7) свидетельствует о том,
что решение локализовано в области QM столь малого объема, что обеспе-
обеспечена определяемая параметре^ 6 точность. Остановка процесса 5Э?М в со-
соответствии с C8) свидетельствует о том, что Ь > ер/50л(л + 1), где р —
радиус ||-1| оо -шара, содержащегося в Qxr)> Это значит, что множество е-
приближений слишком "тонкое" и не улавливается процедурой sep с выб-
выбранным параметром погрешности 5. Чтобы онаружить е-приближение,
необходимо остановить процесс решения с принятым 6 и начать новую
итерацию с меньшим значением 5.
230
Результатом работы &?м считается лучшая (в смысле Ro) среди точек
множества F = { /(jc/)| 1 < / <М, X/ = I}. Отметим, что результат Л?м
не обязательно определен. Если F = 0, результат метода не определен.
6.2. Исследуем процесс 5В?М. По условию Q(j?) имеет непустую внутрен-
внутренность иб(Л) содержит || И во-шар радиуса р. В таком случае ечжрестность
QH множества решений Qm задачи ОВП в Q(r) содержит ||• II«-шар радиу-
радиуса ер. Имеет место следующая теорема.
Теорема 4. Пусть результат $??м не определен или определен, но не яв-
является е-приближенным решением задачи ОВП. Тогда
6> — . C9)
50/ф + 1)
Доказательство. Проверим, что в условиях теоремы Q% С Q/
для любого / < МF). Для / = 0 это включение верно. Пусть теперь Ql П
^ (Qf\Qj+i) & Ф при некотором / < М. Это означает, что Эд/ G QJ: д; €
е G/\6/+i- Последнее невозможно при Х/+1 ^ I (поскольку при X/+i =
= III б/-цЭ Qj П б по определению процедуры Loc, а при Ху+1 = II Q/+i Э
Э Qj Г) С(/?))« Таким образом, X;+i = I и результат Я?м найден. Обозна-
Обозначим его х. По определениюх будем иметь/(jc)/*0/(*/+i)* Ддлее/(ху+1) X
X ЛоЛ (*/+i) • В силу того, что Х/+1 = I и у GQj\Qj+\, получаем (по опре-
определению процедуры Loc) /б (Xj+i)Roy. Итак, f(x)R<>y. Но из у G Q\
следует, что .уЛоДЧО (где у(е) — худшая по предпочтению Ro точка еюк-
рестности множества Q, вб(л)) и/(х)Л0>;(б), что противоречит условию
теоремы.
Мы пришли к выводу, что Ql С Qj V/<MF). Если в момент М(8) вы-
выполнено C7), то | QM(б) | < (blDf I W |, тогда как |??| > Bер)Л, пос-
поскольку Q^ содержит || || ее-шар радиуса ер. Из CJ С QM (б) вытекает, что
^ BD)n
или ер < 6, что и требуется в C9).
Пусть теперь имеет место C8). Это означает, что INL-расстояние От
у(Ом-г) Д° границы Qm-i меньше 100л5. Отсюда следует, в соответ-
соответствии с известными результатами о геометрии выпуклых тел (см. п. 6.3),
что Bм-1 содержится в слое между двумя параллельными гиперплоскос-
гиперплоскостями с ||41 «-расстоянием между ними, меньшим, чем (п + 1) 100л6. Но
этот слой обязан включать и IIIL-шар радиуса ер (содержащийся в Ql С
С Qm-i)> отсюда получаем, что 2ер < (п + 1) 100л5. Теорема доказана.
6.3. Докажем геометрический факт, использованный при обосновании
утверждения теоремы 4.
Пусть ум-\ = У (Qm-i) -центр тяжести выпуклого тела Qm-i- Как
уже указывалось, в ситуации C8) на границе Qm-i существует точка v
такая, что ||и - ум-\ II«< 100лб. Проведем через v опорную гиперплос-
гиперплоскость П к Qm-\ и коснемся Qm-i параллельной П опорной гиперплос-
гиперплоскостью П' (см. рис. 9.2). Пусть она касается Qm-i в точке и. Ясно, что
тело Qm-i лежит между Пи П'. Требуется доказать, что расстояние (в
норме НИ*,) между П и П' не превышает (п + 1)||и -ум+\ IU-
231
Проведем через ум-\ гиперплоскость По, параллельную П, и построим
конус К с вершиной и, основанием на П и сечением гиперплоскостью По,
равным Qm-i ^ По. Гиперплоскость По разбивает К на две части (К* и
К") и Qm-\ - также на две части {Qm-\ и Qm-i)- Ясно» что (?лг-1 c&*
Пусть п — нормаль к По. Вычислим и сравним между собой моменты
рассматриваемых тел относительно По. Очевидно,
\(n9y)\dy< / \(n,y)\dy
\{n,y)\dy> f \(n,y)\dy.
В силу того, что По проходит через центр тяжести Ум-\
тела Qm-i у моменты Qm-\ и Qm-i относительно По равны между собой:
\(*,У)\*У* I \(nfy)\dy.
Поэтому
\(n,y)\dy< f \(n,y)\dy.
Это значит, что По лежит ближе к вершине и конуса К, чем центр тя-
тяжести К (точнее, центр тяжести К лежит в К*). Следовательно, расстоя-
1
ние между П и П делится По в отношении, превышающем — : 1,
т.е.
что и доказывает высказанное утверждение
6.4. Теперь ясно, как организовать метод решения задачи ОВП. Пусть
8к — решение уравнения
In
= 2*.
232
Будем последовательно применять процедуры 5В?Д, 5В?М,... Пусть
#?м - результат 5В?м (он может быть и не определен). По теореме 4 при
всех к, для которых дк < ep/50/i(/i + 1), ic?M определен и является е-приб-
лиженным решением задачи ОВП. Пусть к(е) - минимальное к, для кото-
которого Ьк <бpi'50 л (л + 1), или, что то же, для которого
D / D \\
In — >1пE0я(л+1) )=
Ьк \ ре/
Тогда
In <2W(e): D0)
Отсюда видно, что точность решения е задачи ОВП с помощью процеду-
процедуры 59 ?м зависит от параметра 5 и характеристики р решаемой задачи —
радиуса || • II •• -шара, содержащегося в (?(я). Параметр р характеризует
массивность множества допустимых ограничениями планов. При заданном
б и известном р можно было бы выбрать б = 5Л(е) (р) так, чтобы проце-
процедура 58^ обеспечила решение требуемой точности. Если же р неизвестно,
то приходится строить итеративный процесс 8й%?> • •» ^бМ» • • • Как пока-
показывают оценки из § 7, решение погрешности е произвольной задачи ОВП
с любым р > 0 будет построено в некоторый момент к = к(е, р), и сум-
суммарная трудоемкость итерационного процесса 58?м,..., 58?^ оказывает-
оказывается по порядку такой же, как и у 58|м — процедуры, предполагающей зна-
знание р.
К сожалению, при априорно неизвестном р не видно, как^гарантированно
обеспечить прерывание итеративной процедуры в момент к = к(е, р). Мо-
Момент прекращения вычислений определяется в таких случаях из других
соображений, например, исходя из допустимых ресурсов машинного вре-
времени.
§ 7. Оценка трудоемкости метода
7.1. Посмотрим, чего "стоит" (в вопросах ЛПР о предпочтениях и в
вопросах оракулу первого порядка о fug) x j^e).
В соответствии с утверждением теоремы 3 для метода Щ^ решения
задачи ОВП имеет место неравенство
QMi6)<o>Mi6)\Qo\<o>Mid)nnl2\W\. D1)
В силу <37)
Учитывая D1), имеем:
233
ИЛИ у—
Л/E)<си'<">1п ——, D2)
5
где
( 1, /1=1,
/00 =
I 2, /1 = 2,3,
си'ОО _ верхняя оценка 1/(-1псо1/л).
Итак, число обращений к процедуре LocM в 58?м не превосходит ве-
величины у—
- . D3)
5
Число вопросов к ЛПР в процедурах Loci и Loc2 (при однократном
их применении) не превосходит одного, а в процедуре Loc3 не более
с/15 In п. Поэтому общее число вопросов к ЛПР при применении метода
$ LocM не превышает
^^1 D4)
5
где
f/Oi), /1=1,2, = @, /1=1,2,
'00- ¦ , /00-
[l(pt)n59 /Lt = 3; I 1, /i = 3.
При методе 53?м погрешность е будет обеспечена в первый момент
к(е) использования 58?м, для которого &к{е) <€р/50л(л + 1), или, что
то же, в первый момент к = к(е), для которого
Z>Vw" 50п(л+ \)\/nD
In—— >ln — . D5)
. bk ep
С ростом к числа, стоящие слева в неравенстве D5), удваиваются при
увеличении к на единицу. Ясно поэтому, что
1 ^^^i 50и(я + 1)л^Гд
In < 2 In . D6)
5 ер
Общее число вопросов ЛПР, которое следует задашь для получения
решения погрешности е9 в силу D4) не больше
* S In
сл^> (In л)Г<^> *i° 2 * < 2 слГ^> (In л
Д1
ер
(последнее неравенство — в силу D6) ).
234
50л(л+1)\/л1>
D7)
Итак, общее число обращений к ЛПР для получения решения погреш-
погрешности е не превосходит (при применении LocM) величины
(
ер
7.2. Каждое обращение к LocM "стоит" одного обращения к sepK (к = 1
или к = 2). При этом в процедуре $?? происходит обращение к
)
По теореме 2 одно обращение к sepK ( •, 5^) "стоит" не более
-Ц- =
аувк
К) ^ D9)
вопросов к оракулу. Здесь
Общее число вопросов к оракулу в $?? не превосходит, исходя из
D4) и D9), величины
К „(«*) = сп,'<"VO.) to f^ln ^ E0)
Общее число вопросов к оракулу до получения решения погрешности
в не больше
2
к = 1
L аУ \
2*«+1п— 1 =
ary J
D\fn \ D\fn I 1
Sk(e)
Учитывая D6), находим, что это общее число вопросов оракулу до полу-
получения решения погрешности б не превосходит величины
WKM(e, p) =
ер ocyep
235
7.3. Сравнивая оценку D4) и D7) (соответственно E0) и E1)), полу-
получаем упомянутый в п. 6.3 § 6 тезис о совпадении по порядку величин
суммарной трудоемкости итерационного процесса Я$*9Я%*9..., 5Вб*м и
трудоемкости процедуры Sy м, предполагающей знание параметра р.
§ 8. Задача ОМП с произвольными бинарными отношениями
8.1. По аналогии с расширением задачи математического программиро-
программирования в порядковых шкалах (см. гл. VIII, § 5) введем четыре типа задач
обобщенного математического программирования (ОМП)
тах(Я0, $*0(-)Щ(*)Д/И/> /Gl^ *GG. E2)
Здесь .//(•): G-* Eni, j G 0^7; Л/ - бинарные отношения на 2)/2
j G ой fc=l*4.
Назовем точку х, удовлетворяющую ограничениям задачи E2), е-опти-
мальным решением задачи ОМП Аг-го типа, если
#*<*,*.)()= 2)\со({.) и«5§(.)).
2) -множество допустимых планов задачи E2).
Так же, как и для задачи МППШ, можно показать, что е-оптимальный
план задачи ОМП в приведенном здесь смысле является и е-оптимальным
планом задачи ОМП в смысле A2) (см. § 2) и наоборот.
Из теоремы 7 гл. VIII следует, что если Э)Ф ф и/0 CD) — ограниченное
множество, то Ve > 0 существует е-оптимальное решение задачи E2).
8.2. Расширим несколько понятие вогнутой функции. Пусть R - бинар-
бинарное отношение на выпуклом множестве G СЕп,/( •): G -+Еп.
Назовем функцию/( •) Я-вогнутой Аг-го рода, если множества
M0(x)={yeG\f(y)Rf(x)}
и
Мt (X) = { у €G 15* (/(у)) Э 5*
выпуклы Vx
Назовем задачу E2) вогнутой задачей ОМП типа к, если/} ( •): G -+Enj\
/ е 1, г, /fy-вогнутые функции рода 2, а /0 ( • ): G -+Еп° - /?0-вогнутая
функция А:-го рода. Назовем задачу ОМП типа к нормальной, если:
а) G выпуклый компакт с непустой внутренностью,
б) // ( •) непрерывны, / G 0,г,
в) SRf(y)^S%,(y) открыты V^ G G, a S2Rf(y), S%.(y) замкнуты
e&jJ GO,г,
г) GRf(x) = GR.{y) VyGER.(x)9 VxGG, /Gl,r.
Пусть задача E2) — нормальная вогнутая задача ОМП типа к. Положим
Q(R,) = {(х, у) G G2 | /)(х) Rjfj(у)} и введем в рассмотрение следую-
236
щую задачу в порядковых шкалах, очевидно, вогнутую типа к:
х -+ max(Q(R0)9 SkQ(Ro)( •)) IxQ{Rj)bf, jET^ x EG. E3)
Теорема 5. Если множество 3) планов задачи E2) непусто и V/ Е~1, г,
3 bj Е Gтакие,что/у (bj) Е SRj. (ц)гто 3b/6G такие, что/) (bj) Е ЖЛ/. (и/),
т.е. задачи E2) и E3) эквивалентны.
Доказательство: Пусть х0 € 2) . Если для некоторого / Е 1, г
fj(x0) Е G%.(iij)9 то на отрезке [tj,x0] 3z:/)(z) €ER.(Uj). Предполо-
Предположим, что это не так. Тогда/у ([/у, х0 ]) связна как непрерывный образ связ-
связного множества, и по предположению
//([>/> *о]) С G%.(Uj) U S2Rj(uf).
Это противоречит связности /у ([Г;-, дг0 ]), поскольку G%. (itf) П ?&у (к/) = 0
по определению и G&. (ну) =^ 0 и 5J. (му) =? 0 . Следовательно, на отрезке
[tj, х0 ] существует точка bj такая, что /у {bj) Е ?/*у (му).
Будем называть задачу E3) ядром задачи E2).
В дальнейшем будем считать, что задача E2) ОМП удовлетворяет усло-
условиям теоремы 5. При наличии соответствующего оракула можно использо-
использовать приведенный в п. 5.3 гл. VIII алгоритм для решения ядра задачи
ОМП E2).
8.3. Без специальных условий, налагаемых на отношение Q(Rj), инфор-
информация о ядре E3) задачи E2) не может быть восстановлена по информа-
информации об Rj и /у. Достаточным условием для получения информации о Q(Rj)
по данным оракула о Rj и /у является монотонность Rj.
Будем говорить, что бинарное отношение R ^-монотонно, если
х^у *(xRy) л.(Я*(хJ 5*О0)
И
х>у~ (*eG&O0) л {SkR(x) D SkR(y)).
Теорема 6. Предположим, что:
а) задача E2) нормальна,
б) вд одно из ограничений задачи E2) не является избыточным,
в) Rj, / € 1, г, - 2-вогнутые и 2-монотонные бинарные отношения,
г) Ro ft-вогнутое и ^-монотонное бинарное отношение.
Тогда задача ОМП E2) имеет вогнутое типа к ядро.
Док азательство. Покажем, что в условиях утверждения Q(Rj),
/ Е 1, г, есть 2-вогнутое бинарное отношение на G.
Положим Qf = {у G G\fj{y) Rjfjix)} , xlt x2 E Qf, X Е [0, 1],хх =
= Ххг + A - X) х2 • Из вогнутости /у ( •) следует, что /у (хх) ^Xfj (*i)'+
+ A — Х)/у (х2 ), а из 2-вогнутости Rj вытекает, что
[Щх) + A -\Щхг)Щ#х)
И
Ся/V/(«Ci) + A -Х)//(*2» С СлЩх)).
Из 2-монотонности R, следует, что/.• (х\) е GR. {ft (x)), т.е. // (х\)Л//,- (х).
Рассмотрим множество Mf = {у G G \ S2R. (/) (у)) !D S2Rf (/у (х))} . За-
Зафиксируем XG @, l),Xi,x2 GM/jXx-Xjc! + A — X)jc2.
В силу 2-вогнутости Л/ имеем:
) D
Из 2-монотонности Rj и вогнутости // ( • ) следует
Таким образом, Л/; — выпуклое множество, а/у — Лу-вогнутая рода 2 функ-
функция. Аналогичным образом доказывается, что /0 (х) /?0-вогнутая рода А:
функция. Из теоремы 5 следует теперь, что задача E2) имеет вогнутое по
типу к ядро.
. 8.4. Приведем общую схему решения монотонной выпуклой задачи ОМП
А:-готипа (задачи E2)).
Будем считать, что вектор-функции //(•)> / е 0, г9 непрерывны на
выпуклом компакте G, а множество 3) планов задачи E2) непусто.
Введем вспомогательные бинарные отношения Rj, j G 0, г, на Ет,
г
т =
Д/ ={(^^I^ = (*<Ь Х%9 ... , Хг\ у = (y09yt,..-, Уг\
и рассмотрим вспомогательную задачу в порядковых шкалах
х -» max (До, $? (.))! **/«?, /ei^, xGF, E4)
где 2 = (м0, и\,. . . , ur), w0 е /о (^) > ^ — выпуклый компакт с непустой
внутренностью, содержащий со F(G),F( •) = { /0 ( •),Д ( • ),... ,/г ( •)}.
В качестве V можно взять, например, параллелепипед с гранями, парал-
параллельными координатным гиперплоскостям.
Предъявим к оракулу те же требования, что и в § 5 гл. VIII. Дополни-
Дополнительно предположим лишь, что если х ? со F(G), то оракул указывает еди-
единичный направляющий вектор, разделяющий х и со F(G). Чтобы унифици-
унифицировать алгоритм, удобно рассматривать задачу E4) с дополнительным
ограничением
х -+ max(?0, Sl(-))\ xR,u, jeYJ9
*Лг+1иг+1, xGV9 E5)
где ur+i - произвольная граничная точка со F(G), a
Задача E5) может быть решена с помощью алгоритма из § 5 гл. VIII для за-
задачи A5), если при этом, конечно, выполняются указанные там условия
и требования к оракулу.
е-оптимальное решение х€ задачи E5) индуцирует е-оптимальное реше-
решение задачи E2). Действительно, пусть х€ - е-оптимальное решение задачи
E5). Тогда х€ € со F(G). Следовательно, существуют xlf . . . , хп G G,
238
n n
\i,...,Xn € [0,1], S X/ = 1 такие, что хе = SXfF(jc/). В силу вогнутос-
1 1
п
п ~
ти F имеем F( 2 Х/ДГ/) ^ хе . В силу монотонности /?/,/ € 1, г, первые г
ограничений задачи E5) удовлетворены, а (г + 1)-е ограничение выполнено
по построению. Следовательно, БХ/Х/ - допустимое решение задачу E2).
Из неравенства F(S Х/Х/) ^х6 вытекает б-оптимальность решения 2 Х^ЛГ/.
1
Таким образом, е-оптимальное решение задачи E2) ОМП строится по
хе - в-оптимальному решению вспомогательной задачи E5), как решение
системы неравенств
F(x) ^x€9 xGG. E6)
Сделаем несколько замечаний.
Замечание 1. По аналогии с рассуждениями п. 5.4 гл. VIII можно
перейти от задачи ОМП с целевым бинарным отношением Ro к задаче ОМП
с целевым отношением C(R0) (см. A8) гл. VIII) и учесть таким образом
введенное в п. 1.5 гл. V расширение понятия оптимизации по бинарному
отношению — (R, С)-оптимизацию.
Замечание 2. Если F — не вогнутая вектор-функция, а так назы-
называемая выпуклообразная (т.е. функция, переводящая выпуклое множест-
множество в выпуклое), то изложенная схема решения задачи E5) сохраняется,
только неравенства в системе E6) заменяются равенствами.
Замечание 3. Учет (г + 1)-го ограничения в E5) требует дополни-
дополнительной информации от оракула. Однако, увеличив размерность задачи,
можно исключить потребность в дополнительной информации. Действитель-
Действительно, нетрудно проверить, что условие х Е соF(G) — Е™ эквивалентно
разрешимости системы выпуклых неравенств
E7)
Это значит, что (г + 1)-е ограничение в E5) можно заменить системой
неравенств E7) и задача E5) может быть переписана в виде
F(y)>x,yGG,
Замечание 4. В § 1 задача ОМП вида
/о(х) -> тах(Д0) I /,(*) Rauat s G17Я
*/(*)<0, /eiT», xGG
с помощью вспомогательных бинарных отношений Rs, векторов щ и вспо-
вспомогательной вектор-функции f(x) сведена к задаче вида
f(x)+m2K(R0)\ f{x)Rsiis, sGlTr;
gf(x)<0, jG\X xGG%
Решение последней задачи в § 3 — 6 сводится к решению последователь-
последовательности задач в порядковых шкалах и систем вьшуклых неравенств. Прием,
239
предложенный в настоящем параграфе, позволяет свести задачу ОВП к
решению одной задачи в порядковых шкалах более высокой размерности
где V — выпуклый компакт простой структуры (шар или параллелепипед),
содержащий f(G). Другой подход к сведению задачи ОВП к задаче МППШ
приведен в [72].
Глава X
ВЫЧИСЛИТЕЛЬНЫЕ МЕТОДЫ
МНОГОКРИТЕРИАЛЬНОЙ ОПТИМИЗАЦИИ
§ 1. Постановка задачи
1.1. В настоящей главе излагаются конструктивные методы анализа
выпуклых многокритериальных задач, в которых принцип агрегирования
показателей качества выбора использует предпочтения лица, принимающе-
принимающего решение (ЛПР). Этот подход в той или иной мере включает и другие
известные принципы определения понятия "решение многокритериальной
задачи9'.7 Многие из них отражают частные, специальным образом выражен-
выраженные предпочтения ЛПР над множеством значений компонент векторного
критерия качества.
1.2. Представляются естественными две постановки многокритериаль-
многокритериальных задач с агрегированием, основанным на предпочтениях ЛПР.
В первой постановке лицу, принимающему решение, последовательно
предъявляются пары планов дсь х2 ? С и он выбирает из векторов, удовлет-
удовлетворяющих-условиям задачи, лучший по предпочтению/?. В этой постановке
выбор оптимального плана х * многокритериальной задачи записывается
в следующем виде.
Требуется найти
x*EGCEn, gf(x*)<09 / = l,...,m;
x*Rx Vx€G: gf(x)<0 V/. (I)
Во второй постановке ЛПР последовательно предъявляются пары векто-
векторов f(xi)tf(x2)€Ek показателей эффективности (критериев качества)
планов Xi, x2 ? G, и он выбирает из планов, удовлетворяющих условиям
задачи, план х* с лучшим по предпочтению Ro вектором характеристик/^).
В этой постановке многокритериальная задача записывается так: требу-
требуется найти
x*eG, gf(x*)<0, /=l,...,m;
f(x*)Rof(x) VxeG: gf(x)<0 V/. (II)
Вторая постановка многокритериальной задачи (задача II) может быть
сведена к первой постановке (к задаче I). ЛПР, осведомленный о предпоч-
предпочтении Ro, вместе с источником информации о fj(x) эквивалентен ЛПР
с результирующим отношением предпочтения R. Какой же смысл имеет
специальное рассмотрение задачи (II)? Дело здесь в следующем. Разумно
предположить, что трудоемкость вычисления fj (и g.) существенно ниже,
16. Д.Б. Юдин 241
чем трудоемкость построения лицом, принимающим решение, ответа на
заданный ему вопрос. Вычисление fj и gf - обычно задача, решаемая алго-
алгоритмически, возможно, на имитационной модели. Сравнение векторов,
надо полагать, — творческая задача. Поэтому естественно строить диалого-
диалоговую процедуру решения многокритериальной задачи так, чтобы по возмож-
возможности минимизировать число обращений к ЛПР. С другой стороны, оказы-
оказывается, что это число растет с ростом размерности векторов, которые
должен сравнивать ЛПР. В модели (I) эта размерность - л, а в модели
(II) - к. Обычно к (размерность вектора показателей) существенно мень-
меньше п (числа параметров управления, компонент плана или конструктивных
параметров системы). Специальная структура модели (II) позволяет в этом
слушке получить более экономную (по числу обращений к ЛПР) процедуру
диалога, чем в случае общей модели ОМП.
13. Заметим, что записи (I), (II) еще не представляют собой полных
постановок задач. В этих формулировках указывается, что требуется найти,
но еще не сказано, с помощью какой информации можно строить искомые
решения. Будем в дальнейшем предполагать, что в нашем распоряжении
имеются два источника информации. Первый из них (будем его называть
оракулом) в состоянии для любого xGG (множество G задано априори)
сообщать значения и опорные функционалы ограничений gj(x),j = 1,. .. ,m,
в точке х (в задаче (II) еще и значения и опорные функционалы в х к
характеристикам //(*), *= 1, ...,*). Второй источник информации -
лицо, принимающее решение (ЛПР), — предоставляет информацию о пред-
предпочтении R в задаче (I) и о предпочтении Ro в задаче (II). Мы будем пред-
предполагать, что каковы бы ни были два предъявляемых ЛПР решения и, v
из области определения соответствующего предпочтения (т.е. из G для R
и из Ек для /?о), ЛПР в состоянии указать лучшее из них в смысле этого
отношения. Если каждое из них не хуже другого, то ЛПР должен сказать
об этом.
Ниже будут приведены итеративные процедуры аппроксимации искомых
наилучших решений. На каждом шаге процедуры предполагается возмож-
возможность обращения к указанным источникам информации. Приближенное
решение будет, таким образом, строиться в результате диалога с ЛПР.
При этом подготовка вопросов к ЛПР производится, в свою очередь, в
процессе диалога с оракулом. Процедуры различаются, в частности, типом
ЛПР. Рассматриваются ЛПР первого и нулевого порядка: ЛПР1 и ЛПР0.
Применительно к задаче (I) ЛПР} в состоянии для каждой пары векто-
векторов xjGG указать, какой из них предпочтительней в смысле отношения R.
Кроме того, ЛПР] может указать опорную в точке х гиперплоскость к
множеству G(x) ={yGG\yRx}, т.е. такой линейный функционал %х на
En,4ToG(x) Е {ye G\($Xfy -x)< 0}«((f, и) - значение функцио-
функционала ? на векторе и). При этом требуется, чтобы %х ФО, если Зу: уРх
(т.е. когда* не является лучшей в смысле R точкой G ).
Соответственно для задачи (II) аналогичные требования предъявляются
к отношению Ro. ЛПР! указывает для каждой пары точек х, у Е Ек пред-
предпочтительную в смысле Ro точку и, кроме того, может для Vj/E/^"предъ-
Vj/E/^"предъявить ненулевой функционал х\у на Ек такой, что множество G0(y) =
*{zGEk\ zRoy) лежит в полупространстве {z \ (tiy,z-y)<0).
242
ЛПР второго типа (ЛПР0) способно лишь указывать, какой из двух сравни-
сравниваемых векторов (х,у EGпо предпочтениюR или /(*),/(у) ЕЕк по предпоч-
предпочтению Ro) лучше. ЛПР0 не выдает информации об опорных функционалах
к множествам G(x) и Go (x).
§ 2. Метод решения задачи (I)
2.1. Будем предполагать, что в задаче (I) G — выпуклый компакт в
Еп> ?/(*), / = 1,.. ., /я, — выпуклые функции, R — непрерывное вогнутое
монотонное предпочтение тЕп.
Рассмотрим принципы построения интерактивных процедур оптимизации
предпочтения в задаче (I).
Пусть II * II — раз и навсегда фиксированная норма на if", II • II» — двойст-
двойственная норма на сопряженном пространстве линейных форм. Расстояние
р„ „(jc, Я) точки х до множества Я С Еп и диаметр d|( |( (Я) множества Я
определяются (в норме ИИ) соотношениями
р„ „(*,#)= inf Wx-yl d« „(Я)= sup llx-.yll (ЯСЯ").
у^Н " ху€Н
Будем считать, что сообщаемые источником информации опорные
функционалы gj(x) имеют равномерно по х G G ограниченные нормы.
Положим, что величины Lj = sup Wg'j{x) В* или верхние оценки Lj заранее
известны.
2.2. Определим понятие ^-приближенного решения задачи (I). Пусть
€" = (б0, €i,..., ew), €j >0, / = 0,1,... , w, - заданный вектор допу-
допустимых абсолютных погрешностей,
Gg = {х € G | gj(x) < 0, / = 1,..., т } — множество допустимых решений
((Алтаем, что G^#0),
С* = { х G Gg I xRy Vy€Gg } - множество точных решений задачи (I),
G6o = {х G Еп \ р\. и(*, G0) < е0 } - е0-окрестность точных решений задачи,
х(е0) -худшая (в смысле/?) точка G€q.
Назовем точку х ^-приближенным решением задачи (I), если выполнены
следующие условия:
(О XGG,
(ii) gj(x)<eh /=l,...,w,
(iii) xRx(e0).
Наша цель — при данном е" построить процедуру отыскания ?-прибли-
женного решения задачи (I).
2.3. Диалоговые, процедуры оптимизации предпочтения в задаче (I) ис-
используют две подпрограммы — разделения sepc(x, S) и локализации
7
Здесь*GJ5, б>0, QCEn.
Подпрограмма sep<- (х, 5) имеет вход х?Еп, 5>0и выход либо (I, jc) ,
либо (И, ф), где 1A1) - тип выхода х G Gi<p - функционал на Еп, || у ||, = 1.
16* 243
При этом должны выполняться условия:
Osep) PB.tt(G)<5/2^e(^5) (Ix)
(iiisep) sep(x,6) = (II,^)=> sup
G
isep)
или, что то же:
sep(x, 8) = (n,<p)=>G С { у \ (у, у - х) <- 8/4}.
Грубо говоря, подпрограмма разделения строит точку х €= G, если х близ-
близка (по норме II • II) к G (результат типа I) и строит гиперплоскость, разде-
разделяющую х и G, если х не близка к G (результат типа II).
Если G задано априори, то для построения подпрограммы sepG(jc, б)
достаточно уметь находить ближайшую (в метрике, порождаемой нормой
II • II) к точке х Е Еп точку irG (x) G G и разделять гиперплоскостями G и
не пересекающиеся с G II • ll-шары. (Здесь ^G(x) — проекция точки х G Еп
на множество G.) Имея х и б, строим nG (х). Если р и. й (х, С) = II х - irG (*) И^
< б, полагаем х = яс(*) и приписываем результату тип I. В противном слу-
случае, пусть (р, 11<р II* = 1, разделяет G и II • ll-шар радиуса 6 с центром в х;
тогда результату приписываем тип II.
Алгоритмическая реализация этих построений зависит от способа зада-
задания G и нормы II - II. Соответствующие пояснения приведены в [35] и [68]
при изложении модифицированного метода центров тяжести для решения
задач выпуклого программирования.
Подпрограмма разделения sepG(x, 5) может быть фрагментом более
сложной подпрограммы локализации Loc-(Q, б).
2.4. Подпрограмма локализации Loc-B, б) имеет на входе пару б > О
и выпуклый компакт Q С Еп из некоторого семейства ?2 выпуклых ком-
компактов с непустой внутренностью. На выходе подпрограммы Loc возможен
Л д А
один из двух результатов: (I, Q, х) или (II, Q). Здесь I (II) — тип результа-
результата, Q — выпуклый компакт из Еп либо принадлежащий 12, либо не имею-
имеющий внутренности (и, возможно, пустой), a jc G G. При этом выполняются
л
следующие условия: V у Е Q\Q и К§/4 (у) (б/4-окрестность>> (замкнутая)
в метрике II * II) справедливо одно из соотношений:
f 3iei9m:g,(y)>e,-26L,,
(?) */(*) < в/, / € 1, m, и xRy для некоторого у Е VB (у),
и результат имеет тип I.
Кроме того, в случае, когда имеет место результат типа I, выполняются
неравенства
?/(*)<е/у /= 1,...,/я. A)
Назовем подпрограмму Loa-(Q, б) со-стягивающей, где 0 < со < 1, если
QCft V5>0 e
ICKcolGi. B)
244
со-стягивающая подпрограмма Loc переводит выпуклое компактное мно-
множество Q е О, в вьшуклый компакт Q меньшего объема. При этом либо
QC 12, либо intQ = 0 (и, возможно, б = 0).
Действие подпрограммы локализации может быть, грубо говоря, оха-
охарактеризовано следующим образом.
Если Q\Q содержит II • И-шар малого радиуса, принадлежащий G, и для
всех точек II* ll-шара выполняется условие A), то процедура локализации
указьюает, помимо выпуклого компакта Q9 точку х, удовлетворяющую
условиям A) и не менее предпочтительную (в смысле отношения/?), чем
некоторая точка из этого I* ll-шара (результат типа I). В противном слу-
случае подпрограмма Loc ограничивается построением множества Q (результат
типа II).
2.5. Построим теперь метод Зй решения задачи (I), использующий неко-
некоторую подпрограмму LocF(G, 5);
Пусть число вопросов, задаваемых ЛПР подпрограммой Loc_B, 6)
на любом входе, не превосходитN< °°.
Метод 53 представляет собой конечно шаговый метод, трудоемкость
которого (число шагов, гарантирующее погрешность решения, не превы-
превышающую ? = (б0, €\9..., ет)) будет оценена ниже. К z-му шагу работы
метода имеется область Q(^t Ей. При этом Qo - какая-нибудь область из
S2, содержащая G. Обозначим через d диаметр Qo и положим
LQ = 1, 5 = min 6//4Z,,-,
0<f<m '
I 1 5 e0 1
7 = min -, , — . C)
[2 Sd d I
Ha j-и шаге строится Qt = Loc^^/^!, 5). Если | Qt\ > yn\ Qo |, то пере-
переходим к шагу i + 1. В противном случае считаем, что метод выдал F-приб-^
лиженное решение. Точка х определяется как лучшая (в смысле R) точка
Xf среди компонент выхода подпрограммы Loc, на шагах, для которых
тип результата был I.
Имеет место утверждение
Теорема 1. Пусть Loc?( •, • ) - со-стягивающая подпрограмма локали-
локализации. Тогда результат х работы метода $ есть ^приближенное решение
задачи (I), а число вопросов к ЛПР, гарантирующее построение х (трудо-
(трудоемкость 59), не более
п In 1/7 Г
L\ D)
Доказательство:1°. Поскольку подпрограмма Loc-^ о;-стяги-
вающая, то | Qt \ <со* | Qo |. По конструкции метода решение будет достиг-
достигнуто при | Qi | <7Я I Qo I • Из этих неравенств получаем, что метод остановит-
остановится после числа шагов, не превышающего величины N(e ) из D).
2°. Остается проверить, что х определено и представляет собой ?-приб-
лиженное решение задачи. Собственно говоря, требуется лишь проверить,
что х определено и х/?х(е0). В самом деле, из A) и определения х следует,
245
что если jc определено, то х € G и gj(pc) < щ,/ = 1,..., т. При xRx(e0)
отсюда вытекает, что х есть ^-приближенное решение задачи (I).
Пусть G7 = {х Е Qo \х = A - ?)*¦ + Ух', х* G G«, х' G Qo }. Тогда
|G7 |> 7я1бо1- С другой стороны, в силу правила остановки метода
$ \Gy\ > | Q*\ (i — число шагов работы метода 53 ). Стало быть, 3 3с =
= A - 7) *¦ + 7*\ *• G G*, x' G go такой, что х ? Q*. А это значит, что
Зс G 6/\G/+i при некотором i, 0 </ < /.
На шаге с этим номером / должно выполняться одно из условий (а) —
— G)^ В силу х € G7 имеем:
S
Случай (а), таким образом, исключается. Равным образом невозможен
и случай ф). В этом случае нашлось бы у, II jc -' j? IK 6/4 и / G 1, т такие,
410 f/(JO > €/ - 2j^/5 и j? G G. Поскольку P|.|Qc, G,) < 5/4, то
Рй • в(Я ^*) < 5/2 и #/ C0 <LjS/2, что дало бы е,- < 3L/S, а это противоре-
противоречит C).
Следовательно, и» "«»гя i имеет место случай G). В частности, результат
подпрограммы Loc имеет тип I их определено. Б силу G) имеемXjR~x для
некоторого х € FfiEc), и по правилу формированиях xRxt. Итак, ic/?Z
Но ри. |(х, G») <7^ + 8 <€0, так что хЛхг(б0). Теорема доказана.
Замечание. Рассмотрим случай, когда ограниченияgj(jc) <0 отсут-
отсутствуют. В этом случае результат х применения метода $, настроенного на
погрешность €0(е0 > 0), обладает следующим свойством. Если х0 Е G и
•Хо(ео) — худшая в смысле R точка И * И-шара радиуса е0 с центром в х0,
toxRx0(€0).
Подчеркнем, что этот факт вытекает из доказательства, но нет следует
из формулировки теоремы 1. Действительно, x+Rx0 прих*€ G«, но отсюда
еще не следует, что х (е0) Rx0(e0).
§ 3. Конкретные версии подпрограммы Loc
Рассмотрим несколько реализаций подпрограммы Loc, использующих
диалог с ЛПР! и ЛПР0.
3.1. Подпрограмма Loci, основанная на идее метода центров тяжести,
использует диалог с ЛПРх. Семейство ?2 в этой версии состоит из выпуклых
компактов в Еп с непустой внутренностью.
Процедура Loci устроена следующим образом. Имея Q и 5, вычисляем
центр тяжести x(Q) тела Q и применяем подпрограмму sepc(x(Q), 8).
л
Если выход подпрограммы sep - (П, ^>), то результат Loci - (II, Q), где
Q
Если выход подпрограммы sep - (I, x), выясняем у оракула значения
gt (*),/ = 1,... ,.m g}(x)J = 1,..., т.
Возможны два случая. Если gt (х) <€/,/ = 1,..., m, то обращаемся к
P за характеристикой предпочтения ^ в точке х (за опорным функцио-
246
налом к множеству G(x) = {у G G\yRx) в точке х). Пусть {а - ответ
JDIPi, а ^ч = 5^ при %* Ф О и ]? а - произвольный^ненулевой функционал на
Еп при ?* = о. В этом случае результат Loci - (I, Q, х), где х - уже получен-
полученный выход подпрограммы sep, а выпуклый компакт Q определяется-соот-
определяется-соотношением
/1,...,/я, (Is,*x(G))>.
Если же 3 / € 1, т: gj (х) > в/ при.8ерсг(х@,6) = (I, х), то объявляем
результатом Loc 1 - (II, й), где
Теорема 2. Loci является со-стягивающей подпрограммой локализации
1
с о)= 1 .
е
Доказательство.!0. Ясно, что х (Q) ^ int Q9 Q выпуклой и Q С Q.
При этих условиях значение со вычисляется с помощью стандартных оценок
для метода центров тяжести (см. [35] или [68]).
2°. Убедимся, что Loc 1 удовлетворяет требованиям процедуры локали-
локализации. Зафиксируем QG Я,5 >0и y^Q\Q. Пусть выход подпрограммы
sep — (II, у). Тогда в силу свойств sep:
sup (<a
X(EG
По определению Q из у G Q\Q следует:
Поэтому (у, у) > sup (у, z) + 6/4,итаккак II</>IL= 1,то справедливо (а).
Пусть теперь выход sep - (I, х) и gj (х) < €/,/ = 1,..., т, и при этом
не имеет места (а). Тогда 3 у G V6/4 (у) П G. Если при этом (|л, ^ - х (Q))T>
> 0, то выполняется G), поскольку IIх - х (Q) IKS. Если при тех же усло-
условиях (выход sep - (I, x), gj (x) <€j и (а) не имеет места) ( i$>y- x(Q))<
<0, то, учитывая, что у G Q\Q,
3/еТ^ $$
т.е.
- L,(ly-yl + I*©) - ? »)> еу - 2SL,.
Следовательно, вьшолняется условие (K).
Итак, если выход sep - (I, х) и gy (х) < еу, / s 1,..., m, то имеет место
одно из условий (а), (/}) или G). Кроме того, только в этом случае выход
Л д
Loc 1 есть (I, Q, х).
247
Пусть, наконец, выход sep - (I, х) и 1/ € 1, т: gj ф)л> €/. Если при
этом не имеет места (а) иу& Убц(у) ПС,товсилу y$Q, y€Q
У -
и выполняется соотношение (fi). Теорема доказана.
Подчеркнем, что в подпрограмме Loc 1 на любом входе Щ№\ задается
только один вопрос (Af= 1).
3.2. Подпрограмма Loc 2, основанная на модифицированном методе
центров тяжести, использует также диалог с ЛПР1. Семейство п в этой
версии - множество эллипсоидов в Еп.
Процедура Loc 2 устроена следующим образом. Пусть х @ — центр Q.
Применим подпрограмму sepG(x@, л6). Если выход подпрограммы
sep — (II, (^), то результат Loc 2 — {Н,0 где Q — эллипсоид минимально-
минимального объема, содержащий Q. а
Q = {х e
Если выход подпрограммы sep - (/, х), выясняем у оракула значения
?/(*)> / = !> • • • > ту 8j$), /=1,..., т. Возможны два случая. Если gj(x)<
< б/, / = 1, ..., w, то обращаемся к JlFIPj за опорным функционалом
A л Л л
% а к G(x) в точке л:. В этом случае результат Loc2 — (/, б, х), где Q —
эллипсоид наименьшего объема, содержащий Q.
Q = (л: е<21(?5, x-x(Q))< 0},
ах — выход подпрограммы sep.
Если же при sepG(x@, 5) = (/, х) 3/ € 1, m: g*(x) > ер то полагаем
Л Л ' '
Loc 2 = (II, 0, где Q - эллипсоид минимального объема, содержащий
Q - {*€<2IQf/Cx), *-*@) < е;>.
Теорема 3. Loc 2 — со-стягивающая процедура локализации с со s
= 1 -dn/n,dn>09 ]im dn>0.
Доказательст во. Стягивающие свойства процедуры Loc 2 выте-
вытекают из обоснования модифицированного метода центров тяжести (см.
[35]). Те же рассуждения, что и в доказательстве теоремы 2, позволяют
убедиться, что Loc 2 — подпрограмма локализации.
Отметим, что, как и в Loci, в подпрограмме Loc2 на любом входе
IfflPi задается только один вопрос (/У = 1).
В методе 58, использующем Loci, предполагается возможность опреде-
определять центр тяжести произвольного компакта ??/ Е ?2. Поэтому построение
множества Qt на шаге i в ситуации sepc(x((?/-i)> 6) = (I, xt) допускает
учет всех условий, позволяющих сократить объем Qt. (Это, правда, не
улучшает оценки трудоемкости метода.) В методе 3d, использующем
Loc2, множества Qt Е О, — эллипсоиды минимального объема, содержа-
л
щие Qf. Алгоритм построения этих эллипсоидов (см. описание модифици-
модифицированного метода центров тяжести в [35] или [68]) предполагает, что
248
Qi — "полуэллипсоид9', полученный сечением Qt-\ одной гиперплоскостью,
л
проходящей через центр Qi-\. Поэтому при построении Qt в версии да,
использующей Loc2, учитывается только одно линейное неравенство, вы-
л
секающее Qt из B/-i- Отсюда различие в соотношениях, определяющих
Л
Qi в описанных версиях метода 5В.
33. Подпрограмма ЬосЗ использует ЛПР0. В качестве семейства ft
принимается, как и в версии Loc2, множество эллипсоидов в Еп.
Пусть x(Q) - центр Q. Применим sepG(x@, S). Если выход подпрог-
л л
раммы sep - (II, <?), то результат ЬосЗ - (II, Q), где Q определяется так же,
как и в Loc2.
Если sepc(x(G), S) = (I, х) и 3/ G lTm: gflx) > ел,то результат ЬосЗ
строится так же, как и результат Ьос2 для этих условий. Если же
//, / = I, ... , т, то ЬосЗ = (I, <?,*),
где х получено процедурой sep, a Q строится следующим образом.
Пусть О — координаты в Еп, в которых Q есть шар радиуса 1 с центром
в 0. Примем О за декартовы координаты и проведем указанные ниже
построения, использующие полученную евклидову структуру.
Пусть W - шар радиуса 1/A00 п) с центром в х (здесь и далее все
построения в координатах 0), А - правильный симплекс, вписанный в W>
у0 - его наихудшая (в смысле К) вершина. Рассмотрим правильную пира-
пирамиду А0 с вершиной у0, высотой, коллинеарной у0 -х, углом \рп =
= arc cos 1/2 л между высотой и боковыми гранями и боковыми ребрами,
ортогональными радиус-векторам своих концов (лежащих на основании
пирамиды); радиус-векторы проводятся из х.
Пусть у1 - худшая (по предпочтению R) среди вершин Д°. Если У =
= у0, оборвем процесс. Если же у1 Ф у0, то построим А1 для у1 так же,
как Д° для у0. Если у1 - худшая (по К) среди вершин А1, то оборвем
процесс. В противном случае найдем с помощью ЛПР0 худшую верши-
вершину у2 пирамиды А1 и т.д. Как показано в [35], описанный процесс оборвет-
оборвется на некотором шаге построением правильной пирамиды А** у которой
ys — худшая (по К) вершина. Построим конус К, центрально-симметрич-
центрально-симметричный относительно ys конусу направлений из ys в А5. Пусть К - свит К
л л
на вектор (-х). Примем в качестве Q эллипсоид минимального объема,
содержащий Q\K.
Теорема 4. ЬосЗ представляет собой подпрограмму локализации, со-
стягивающую с со = 1 - djn, dn > 0, lim dn > 0. Реализация ЬосЗ
П-+ ее
требует не более N = сп5Ып обращений к ЛПР0, с - абсолютная кон-
константа.
Доказательство.. Второе и третье утверждения теоремы доказы-
доказываются точно так же, как и их аналоги в [35]. Необходимо доказать лишь,
что ЬосЗ действительно представляет собой процедуру локализации. В слу-
случае sepG (х@, 5) = (II, ф)п в случае sepG (x@, S) = (I, х), но 3/ е
249
G 1, m: gj(x) > €j доказательство проводится так же, как и для Loci.
Остается рассмотреть лишь случай, когда sepG (x(Q), 5) = (I, х) и при этом
gj(x) < e/, /sl и. Докажем, что в этом случае имеет место усло-
условие (у). Действительно, в этом случае gj(x) < €/, / €Е 1, т, и результат
Loc3 имеет тип I. Необходимо только проверить, что при у € Q\Q имеем
л А ~
xRy для некоторого у G V8(y). Но при у G Q\Q непременно 7 = У +
+ (jc - *(??)) Е?. По определению ^ ив силу вогнутости предпочтения R
(и поскольку ys - худшая по R вершина А5) имеем ysRy. Но по по-
построению xRy0 >y°Ryl,... ,ys~ lRys, т.е. x/*j>, что и требуется.
§ 4. Метод решения задачи (II)
4.1. Рассмотрим теперь задачу (II).
Требуется найти
x*GG9 gf(x*) < 0, / = 1,..., т:
f(x*)Ro№ Vjc G G: gf(x) < 0, / = 1,... ,m. (II)
Будем предполагать, что gy(x), / - 1, ..., m, - выпуклые липшицевы
функции на G, а/Дх), / = 1, ...,&, — вогнутые липщицевы функции
на С; Ro — вогнутое и монотонное предпочтение на Ек\ опорные функ-
функционалы gj (х), / = 1, ..., w, и //(*), / = 1, .•.., Л имеют равномерно по
х G G ограниченные нормы.
Снабдим Еп некоторой фиксированной нормой |Н|, а ?** - нормой
НЯи = max \yt\.
1 < i< к
Положим
I/= sup ||*/(*)IL, ht = sup \\fl{x)\\x
и предположим, что Lj и ht или их верхние оценки заранее известны.
Пусть Gf = {у GEk\3xEGg: f(x)>y), где, как и прежде, Gg =
{)
Поскольку предпочтение Л о предполагается монотонным, то оптималь-
оптимальный на G по Ro план является эффективным (оптимальным по Парето)
планом. Из монотонности Ro следует также, что точным решением зада-
задачи (II) служит такое х* G G, что /(**) - лучшая в смысле Ro точка СЛ
Пусть по-прежнему Ж = (е0, €i, .:.., ew), €y > 0, / = 0, 1,..., m. На-
Назовем х EG ^приближенным решением задачи (II), если
@ gj(x) < €/, / = l,...,m,
(ifyecnnGf^lyGGflyRoZ VzGGf}n Уо(ео)- худшая в смысле Ro
точка из е0-окрестности G{b норме || • ||«, то f(x)R0Уо(ео).
Обозначим через W ||||-шар радиуса d/2 = d0 max Л/ с центром
1 < /< к
в Уо = f(x0), где х0 какая-нибудь точка G, cf0 - диаметр G в норме || »||.
250
II • И «> -шар W представляет собой ft-мерный параллелепипед
W = {y еЕк\а,<у{<Ь,9 1=1,...,*}.
Положим
Gf** = {yeW\3xeG*>*: f(x) > у),
где G*'e = (х eG\gf(x) < €/, / = l,...,m}.
Очевидно, Gf>* П G{ Ф ф. Пусть у* GGf*e П G{ и К, - е0-окрест-
ность у * в метрике II • II«.
4.2. Построим метод отыскания ^-приближенного решения задачи (II).
Допустим, что мы умеем для любого 6 > 0 строить подпрограмму
sep /,?(Уу 8)» причем так, что в случае, когда результат у процедуры
sep /te (У> 5) имеет тип I, подпрограмма вместе с у выдает х G Ggf€ ,
для которого /EГ) > у.
Основываясь на рассуждениях п. 2.5, сформируем настроенный на по-
погрешность €0 и основанный на процедуре sep * f {у, Ь) метод оптимиза-
оптимизации предпочтения Ro на множестве G **€ . Метод использует со-стягиваю-
щую подпрограмму локализации Loc, каждый шаг которой "стоит" N об-
обращений к ЛПР. В качестве априорной верхней оценки диаметра Gff€
в норме || • || «о примем величину d.
В соответствии с выводами п. 2.5 метода сформируем е0-приближен-
е0-приближенное решение задачи не позднее, чем после
1 *ln<//e0 Г
вопросов к ЛПР (полагаем d > е0; только этот случай нетривиален).
В частности, используя Loci, получим W(e0) <ct к In d/e0; используя Loc2,
получим N(e0) < с2 к2 ]ny/Fd/€0. (В обоих случаях обращаемся к ЛПр!.)
Наконец, используя Loc3 и обращаясь к ЛПР0, получим ^(е0) <
< с3 к 7 In к In \fkd/e0, С/ - абсолютные, константы.
Обозначим черезу *(б0) худшую в смыслеRo точку Vm : y*(€o)Roy*(€o).
Тогда вследствие замечания к теореме 1 (область G f>e не содержит огра-
ограничений типа gj(y) < 0) имеем уЯоУ*(ео). В силу конструкции рассмат-
рассматриваемого метода у есть одна из точек у{ (у{ - результат типа I примене-
применения подпрограммы sep , ^ ). По сделанному выше предположению о про-
процедуре sep ff мы можем тогда указать х G Gg'€ такой, что f(x)>y.
Ясно, что х и есть искомое €~-приближенное решение задачи (II).
4.3. Построим две версии процедуры sep ftj: sepl и sep2. Зафикси-
Зафиксируем у GEk^и6>0и опишем последовательность действий, определяющих
подпрограммы sep 1 и sep 2.
251
Процедуры sep, имеют на входе у€Ек, 6 >0, а на выходе - либо
(I, у, х), либо (II, ip)9 где I (II) - тип результата, у € И>, Зс G G; «р - функ-
функционал тЕк: ipE(Ek)*9 \\<р\\г = 1.
1) Вычисляем р ||. й (;>, W). Если
Р||||(^И/)> C/4N, E)
то найдем у G (?*)*, IMIi = 1, такое, что (ср, у) > sup (<р, z) + 6/4,
и будем считать sepl = (II, <р). Если E) не выполняется, перейдем к 2).
2) Строим последовательности:
- выпуклых компактов Gt С Еп с непустой внутренностью,
- выпуклых функций я^ОО, s = 1,..., w,
- вогнутых функций ./у \jc), / = 1,..., к.
Построение Gh gj (x), )y (х) ведется в соответствии со следующими
правилами:
0°. Для sepl: Go = G\ для sep2 Go - эллипсоид, содержащий G. Для
обеих процедур *J0)(.) = -« 5=1 m; //o)@ = */, /= 1, ...,*.
При / > 1 множества G/ и функции gj1* и ^'* строятся по правилу 1°.
При этом для sepl G, С G/_i, а для sep2 G/ - эллипсоиды. Правила 2°г-
4° для обеих процедур одинаковы. Этап построения Gh g^ и f^ будем
называть шагом /.
Выпишем правила 1°-4° для шага /.
1°. Для sepl: на шаге i строится центр тяжести дс,- области G/_ x. При этом
может встретиться один из трех взаимоисключающих друг друга случаев:
1,. 3 s = 5@ е 1,/w: gs(Xi) > es,
2-. Vs 6f^ gs(Xi) < €s, но 3/ u
3{. Vs G l9m gs(Xi) <esn V/ G 1,*
В случае З/ переходим к 3°.
В случаях 1/, 2/ полагаем для s G 1, т :
4°(лг) = ma{g<il-1>Qc),gt(?c,Lg',(x,),x- x,)) F)
и для / € 1, к
АО(Х). U('-°W в случае 1,,
h \ min {ff1 -l \x), f, (Xi) + ( fjjxjlx-x,)} в случае 2,.
/¦//<*> G)
В случае 1,
С, = {дсес,_,|^°Aс)<в„ s=l,.:.,m}, (8)
а в случае 2t
Gt = {jcGG,., \gl°(x) < es, j=l,...,m; ff%)>y,-6}. (9)
252
Переходим к 2°.
2°. Пусть
Gf'« = {xeG\g(J\x) < eS9 5=1,. ..,дя)
и
с/'6' = {y'eW\3xeG*'?: ff\x)>y]9 /=1,. ..,*}.
Вычислим ри. !lee (у, G{•€ ). Если рц.№ee (y, Gf* € ) < C/4)б, то увеличи-
увеличиваем /на 1 и переходим к 1°. В противном случае находим у? G (Ек)*9
||</>|li = 1 такое, 4to((?,j>)> sup (<p,z) + 5/4n переходим к 4°.
3 . Пусть обращение к этому правилу произошло при i = i. Полагаем,
что процедура sep закончилась результатом A,^,^), где вектор у:у$ =
= max{j/, у,-Ь), /= 1,...,*,а х = дсг
4°. Пусть обращение к правилу 4° произошло при i = /. Полагаем, что
процедура sep закончилась результатом (II, ф).
На этом завершается описание sep 1. Далее будет показано, что оно кор-
Л
ректно, т.е. что при / < / Gt имеет непустую внутренность, а следовательно,
шаг / + 1 возможен.
Как уже указывалось, описание подпрограммы sep 2 отличается от
описания sep 1 только правилом 1°.
1° для sep2. На шаге / строим центр jc/ эллипсоида G,_ x. При этом может
встретиться один из четырех взаимоисключающих случаев.
О/. xt ф G,
1/.
2/.
з/
Xf G
G,
G,
is e 1,»и,
V S tl 1, YYl
\,k: f,(xt)
„ но
3/. X/ GjG, V$ G l,m
V/G lf* fj(Xi)>yf - 6.
В случае З/ переходим к 3°.
В случае 0,- полагаем:
ЛО - ?~1)(х)> //0W-//'"¦ °W. *el^; /gi^, A0)
обозначаем через г?/ ненулевой опорный функционал к Рц.ц(-, G) в точ-
точке Jt/ и переходим к 5°.
В случае 1/ определяем g^(x),s G 1, w, по F), полагаем г?/ равным
(ненулевому, поскольку min^s(jc) < 0) опорному в хг функционалу к
>
(),//()//(,/ ,
В случае 2t определяем g^' ( • ) по F), а/^''( • ) - по G). Полагаем
равным опорному в xf функционалу к/У)(-). Обозначим
\ произвольный ненулевой функционал на Еп, rjj = 0.
253
Переходим к 5°.
5°. Полагаем G,- равным эллипсоиду наименьшего объема, содержа-
содержащему множество
Переходим к 2°.
4.4. Убедимся теперь, что подпрограммы sep 1 и sep 2 - действительно
процедуры разделения, и установим их свойства.
Положим
l, min es/Lsd0}, A1)
Ks<m
0F)= min{l, 5/(8d0 max A.)}.
K/<fc
Имеет место следующее утверждение:
Теорема 5. sep 1 и sep 2 — процедуры разделения. При этом число шагов
sep 1 не превосходит
Л/1(?,5) = с/1AпA/у-(?)) + 1пA/0(б))+1), A2)
а число шагов sep 2 не больше
M2(et 5)= сл2Aп@/>Г(гH(б))+ 1, A2')
где 0 = (| Go I/I G | )* ln, а с - абсолютная константа.
Доказательство. 1°. Утверждение теоремы очевидно при условии
E). Поэтому далее считаем, что
A3)
2°. Допустим вначале, что рассматриваемая процедура закончена. Дока-
Докажем, что в этом случае справедливы предложения:
(i)EpmsepG/F=(I,y, х), то \\у - y\L<8J(x)>y, yGGf>T.
(ii) Если sep , т = (II, <р), то II у \\г = 1 и(<а у)> sup (<p,z)+ 6/4. A4)
В самом деле, посылка (i) может встретиться лишь тогда, когда на шаге
i имел место случай 3^. Но тогда gs (х?) < eSi s G 1, w, jcfA G G, и /;- (xf) =
=// (^") > Д'/ - 8>/ ^T^. Кроме Toro,/(G) СИ/, так что/,- (х ) > ahj eTJc.
Поэтому f(~x) > ~y. В силу A3) .yy > uj — C/4N. Если yj — 6 > д;-, то
jfy = j7- и yj < jy + 6, так что |д>у - 3^ | <max F, C/4N) = 6. Если же
>>у - 6 > ay, тод7 =>7 - 6 и | >у -ft | <6. Итак, II ,у -Я'« <6. Далее, в силу
/С* ) ^ Д^и >V^ aj имеем у? W, а тогда и ,у€: G^*e по определению G^*e
(следует учесть, что 5с Е G**e ). Утверждение (i) доказано.
Посылка (ii) может иметь место лишь при рц . ц^ (у, Gf*e) > C/4N.
Из правил формирования gf*) ,/у^1^ следует, что при всех / < i (а также
и при i = I, если не имеет места 3/) верны неравенства:
VjcSG g?>(x) < gs(x), s?l,m;
ff°(x) > ffic), i e~k. A5)
254
В частности, при указанных / Gft€ D Ggt€ .
Поскольку /;(/) (x) >ff (x), то Gf*7 D Gf:* при / < i0 (здесь ?0 = /,
если 3^ не имеет места; в противном случае /0 = i — 1). В случае, когда
Л Л
посылка (ii) верна, / 0 = /, и так как результат sep есть в этом случае функ-
функционал ^у разделяющий нужным образом G/>€ и .у, он и подавно обес-
обеспечивает требуемое разделение G^t€ и у. Утверждение (ii) доказано.
3°. Докажем теперь, что если /</ таково, что
|G,| <@(d)V(-€))n\G\, A6)
Л
ТО Iя/.
В самом деле, пусть / < /, условие A6) выполнено, и xt есть решение
задачи
(Pi): 7@(*) = впЛ^{//*>(*) - у,} -> max \xGGf>7. A7)
Обозначим йерез Gf множество Зс,- A - 6E)) + в E) Gf*'c . Заметим,
что Gf* Э Ggt€ . Поскольку max ?, (х) < Lsd0, min (max ^, (x)) < О,
xGG G s
то Ggt€ содержит подобный образ G с коэффициентом подобия ~р (ё").
Стало быть,
IGf' FI > vn(e) | G | и | Gt\ > 0F)F(e) I G |. A8)
Далее, /О — липшицево относительно нормы II- II с константой
max hj. Поэтому, если х G Gt \G;- (такое jc существует в силу A6)
/ е 1,*
и A8)),то
) - e(8)d0 max_ A, > /<0(^) _ 8/g.
/ е 1, к
С другой стороны, х G G^»e их/ ^ G,-. В силу последнего обстоятельства
и определения G/ возможно одно из двух. Либо 3 s Е 1, т: gf*) (x) >
> es, либо 3/ G 1, A:: f^1) (х) <у}- -д. Первая альтернатива нереализуема
из-за х € Gf>е. При второй альтернативе / ^ ^ (х) <— 5, и A9) приводит к
неравенству
/«(я,) < (-7/8N <(-3/4M. B0)
Итак, max _ ?(О(х) < (-3/4) 5, так что р„ . „ (j;, Gf*7) > C/4N.
Но так как / < /, это невозможно. Полученное противоречие доказывает
неравенство A6). Попутно доказана корректность sep 1.
4°. Покажем, что в случае р„ . ^ (у, Gf>€) <5/2 процедуры sep I, sep 2
не могут окончиться по правилу 4°.Предположим противное. Тогда выпол-
255
няется A3). В этом случае^кроме того, G* %ш D G^*e и рц . «^ (у, Gf '*) >
> C/4N. (Включение G^f€ Э Gft€ было доказано в п. 2° в предположе-
предположениях A3) и f </.) Если процедуры sep оканчиваются по правилу 4°, то
Го = /. Но неравенства pt . ioo (yf Gf>*) <5/2ирМоо (yf Gf*1) > C/4M
для Gf*€ D G*'€ невозможны одновременно. Это и доказывает утвержде-
утверждение настоящего пункта.
Итак, при Pi. йоо (у, Gf*€) <б/2 посылка (ii) невозможна. Этот вывод
вместе с (i), (ii) доказывает, что результат процедур sep 1 и sep 2 (если
он вообще определен) удовлетворяет требованиям к подпрограмме разде-
разделения, сформулированным в п. 2.3 § 2.
5°. Остается проверить, что результаты sep I, sep 2 всегда определены и
что справедливы оценки A2) и A2') для числа шагов этих процедур.
Заметим, что по построению Gf для sepl I С* I < f 1 ) I G/ -i I»
Go аС а для sep 2 \Gt\<fi(n) I Gt _t 19$(n) = 1 -dn/n, dn >0, \imdn =
= 1/2. Следовательно, для sep 1 при i > МХ(Ж,Ь)9 а для sep 2 при / >
> M2(F, 5) имеет место A6). В силу рассуждений п. 3° это означает, что
п <Мг (е*, 5) для sep 1 и п <Л/2(е", 5) для sep 2. Теорема 5 доказана.
4.5. Результаты п. 4.2—4.4 позволяют сформировать метод $ отыска-
отыскания еГ-приближенного решения задачи (II), т.е. решения задачи оптимиза-
оптимизации предпочтения Ro на множество G^*6 .
Положим d0 = d\ . i(G), 8 = A/4)е. В качестве метода 53 может быть
принят любой из методов п. 2.5, использующий в качестве подпрограммы
sePG/,7 (у, 5) процедуру sep 1 или sep 2. Эти процедуры, выдавая резуль-
результат у типа I, выдают также и х G G: gs(x) <es,s Е 1, m,f(x) > у. Резуль-
Результат 58 есть один из результатов типа I процедур sep f^ . Соответствующее
лГ является "ё -приближенным решением задачи (II).
Оценки, приведенные выше, позволяют сделать следующие выводы.-
Число обращений метода 59 к ЛПР не превосходит;
при использовании Loc 1 - О(к 1пA/бF))),
при использовании Loc 2 - О(к2 \п(к/0(д))),
при использовании Loc 3 - 0{кп In к 1п(Л/6@))).
Число обращений к оракулу (для вычисления значений g, /, g\ f в за-
заданных точках) не превышает (на одно обращение к ЛПР)
при использовании sep 1 — О(п 1пA/^(ёH(б))),
при использовании sep 2 — О(п2 1п(/}/?(еHE))).
Анализ свойств метода центров тяжести, имеющийся в [35], приводит к
следующим вьюодам. При известных функциях // и gf нельзя уменьшить
по порядку число вопросов к ЛПР, задаваемых методом с процедурой
Loc 1. Если функции /у и gt не заданы, то подготовка каждого вопроса к
ЛПР требует приближенного решения системы выпуклых неравенств, что
256
по трудоемкости эквивалентно решению задачи выпуклого программиро-
программирования той же размерности. Как видно из приведенных оценок и свойств ме-
метода центров тяжести, трудоемкость метода 38, использующего процеду-
процедуру sep 1, может быть лишь незначительно (на логарифмический член)
уменьшена по порядку, что является вполне приемлемой данью достаточно
сложной структуре задачи.
4.6. В заключение главы сделаем следующее замечание. В модели (I) и
(II) укладываются практически все известные постановки многокри-
многокритериальных задач. Тем не менее можно указать более широкий подход к
векторной оптимизации.
Понятие "решение многокритериальной задачи" в известной мере субъек-
субъективно и зависит от шкалы ценностей ЛПР, который не только принимает
решение, но и готов нести ответственность за его последствия. Формально
любая концепция выбора описывается функцией выбора. Поэтому можно
связывать многокритериальную оптимизацию не с предпочтением ЛПР,
а с функцией выбора на допустимом множестве значений векторного
критерия. Произвольная функция выбора может быть реализована много-
многошаговой схемой ОМП (схемой МйОМП - см. § 5 гл. VI и гл. XII). Это
значит, что в самом общем случае многокритериальная оптимизация сво-
сводится к решению задачи МнОМП.
Для функций выбора ЛПР, удовлетворяющих условиям наследования
и согласия (см. гл. III), механизм выбора-оптимизация бинарного отно-
отношения на предъявлении (на множестве допустимых решений). В этом
случае мы приходим к вычислительным методам многокритериальной
оптимизации, подобным описанным в настоящей главе.
17. Д. Б. Юдин
Глава XI
ЗАДАЧИ ОБОБЩЕННОГО ВЫПУКЛОГО ПРОГРАММИРОВАНИЯ
С ЛИНЕЙНЫМИ ПРЕДПОЧТЕНИЯМИ
§ 1. Введение
1.1. В предыдущих главах постановки и методы решения задач тради-
традиционного математического программирования обобщаются на случай век-
векторных целевых функций и функционалов ограничений. Модель матема-
математического программирования в порядковых шкалах представляет собой,
грубо говоря, модель обобщенного линейного программирования. В главе
IX рассматривается задача обобщенного математического (нелинейного)
программирования (ОМП) и предложены и оценены конструктивные мето-
методы решения задач обобщенного выпуклого программирования (ОВП).
Обе упомянутые схемы существенно расширяют возможности теории и
вычислительных методов принятия решений.
Следует, однако, подчеркнуть, что даже экономные методы решения за-
задач ОМП достаточно трудоемки. При решении задач немалой размерности
они требуют относительно большого числа обращений к лицу, принимаю-
принимающему решение (ЛПР), и к оракулу за локальной информацией о предпочте-
предпочтениях и функционалах условий задачи. В связи с этим представляет интерес
сузить классы изучаемых моделей, выделив наиболее часто встречающиеся
предпочтения и функционалы, и упростить таким образом решение соответ-
соответствующих задач.
Такие попытки предприняты в [59] (см. также § 4 гл. VIII), где рас-
рассмотрены задачи линейного программирования в порядковых шкалах, и
в настоящей главе, в которой изучаются методы решения задач ОВП с ли-
линейными (выпукло-вогнутыми) предпочтениями. Содержание этой главы
составляет предмет статьи [60].
1.2. Напомним некоторые определения. Пусть R —• бинарное отноше-
отношение на замкнутом множестве GQEn. Введем обозначения: GR(x) =
= {уев\ yRx},HR(x) ={yeG\ xRy}9G°R{x) = {yeG \УРх1Н%(х)*
= { у G G | хРу }, где уРх означает, что yRx9 но xRy.
Будем говорить, что бинарное отношение R
а) вогнуто, если GR (x) выпукло для всех х € G,
б) выпукло, если HR(x) выпукло для всехх Е G,
в) линейно (выпукло-вогнуто), если GR (х) и#д(*) выпуклы для всех
G
г) монотонно, если из х ^у следует, что xRy пюх>у следует, что хРу.
Если xRy и yRx, будем говорить, что х и у эквивалентны относительно
R, и записывать в виде xIRy.
258
Будем называть бинарное отношение R
а) нетривиальным, если существуют xit х2 ? G такие, что хгРк2>
б) непрерывным, если R замкнутое подмножество G X G,
в) регулярным, если для любой прямой / и всех х € G из того, что
I C\ GR(x) C\HR{x) Ф ф и / П G/j(x) содержит отрезок ненулевой длины,
следует, что / П G#(;jc) = 0 .
Будем называть нормальным предпочтением рефлексивное, транзитив-
транзитивное, непрерывное, регулярное, полное бинарное отношение R на замкну-
замкнутом множестве G СЕп.
Легко видеть, что поверхности безразличия (уровни эквивалентности)
линейных регулярных предпочтений R в немаксимальных относительно R
точках G — гиперплоскости. Если предпочтение R линейно во всем прост-
пространстве Еп, то эти гиперплоскости параллельны. Если R линейно только на
G, то эти гиперплоскости могут пересекаться вне G.
§ 2. Постановка задачи и идея метода
2.1. Рассмотрим следующую задачу ОМП:
/о(х)'—> max \fs(x)Rsus, seiy, xGG. A)
R° n
Здесь G — выпуклый компакт в Em,fs: G-+E s — вогнутая непрерывная
функция, s Е 0, г, Rs — нормальное, линейное монотонное предпочтение на
выпуклом компактеSDS СЕп*9 s6O,r.
Будем предполагать выполненными следующие соотношения:
fs(G)U{us) С mtSDS9 se~n fo(G)CintSDo;
int 3)s Ф ф, sG 0, r.
Пусть €, 5i, . . . , 5r — заданные константы, 5 = E^ \.. ,5r), e >0,8 > 0.
Будем называть точку х0 ? G (e, 6)-оптимальным решением зада-
задачи A), если выполнены следующие условия:
), GRs(us)) <8S9 se ~П
2)HRo(fo(xo))DV(€, GRo(f0(x))) Ф ф V
Здесь Go - множество допустимых планов задачи A),а V(e, GR (fo(x))) -
е-окрестность GRo(fo(x)).
Условие 2) в этом определении означает, что дс0 является е-оптималь-
ным решением задачи A) в смысле гл. 1Х,т.е./0(х0) не хуже худшего
вектора из е<-окрестности GRq (fo(xm))t где х* - некоторое оптимальное
решение задачи A).
Приведем метод решения задачи A), использующий специфику линей-
линейных предпочтений и потому более экономный по числу обращений к ЛПР,
чем изложенный для более общего случая в гл. IX.
2.2. Пусть z0 и Zi - оценки снизу и сверху соответственно оптимального
значения fo(x), причем хотя бы одна из них лежит в int SD0, Поставим в
соответствие исходной задаче A) задачу
г > max | с0(г)/о(х) > co(z)z,
*о
csfs(x) > csus, sG\9r, xGG, ze[zOfzx]\ B)
17* 259
Здесь co(z) - единичный направляющий вектор гиперплоскости, разделяю-
разделяющей HRo(z) и Gr B) (гиперплоскости безразличия), с, - единичный
направляющий вектор гиперплоскости, разделяющей HRa(ug) и Gd(us).
В силу линейности/?, GRs(us) = {ts G 9)s \ csts > csus) , s € T^r, т.е.
Gr (us) — пересечение полупространства csts > csus и SK. Аналогично
GRO(Z) - ( to G 9)o I co(z)to > co(z)z). Следовательно,задача B) экви-
эквивалентна задаче
z > max | /0(x)Roz, fs(x)Rsus, s€l,r;
xGG; zGlzo.z,]. C)
Последняя, как легко видеть, эквивалентна задаче A). Стало быть, и
задача B) эквивалентна исходной задаче A). Поскольку z меняется на
отрезке [г0, zx]\ то для решения задачи B) можно применить одномер-
одномерный метод центров тяжести - дихотомию. Действительно, для всех z Е
е [*o>*i] zi^ Gro(z)- Поэтому если для некоторого г'G [г0, ?,] систе-
система ограничений задачи B) имеет непустое множество решений, то опти-
оптимальное z E [z\ zt]. Если система ограничений задачи B) несовместна,
то оптимальное z ? [z0, z']. Поэтому эта система ограничений при любом
фиксированном z является системой выпуклых неравенств.
Таким образом, для решения задачи B), эквивалентной исходной за-
задаче A), требуется получить оценки z0 и zt и затем, последовательно
применяя дихотомию, проверять совместность систем выпуклых нера-
неравенств. Легко видеть, что если Rs монотонно, то с^ > 0, s GO, г.
По предположению us G int 3),, s e 1, г. Поэтому cs > 0, s Е 1, г. Если
хотя бы одна из точек z0, Zj принадлежит int SDOf то в силу выпуклости
3H az0 + A - о) ZiE int Я>о ДляО<<*< 1.Посколькуг0 vkzx -оценки
(снизу и сверху) оптимального значения fo(x), то для достижения опти-
оптимального плана достаточно двигаться вдоль отрезка [г0, г i ] \ Если в качест-
качестве г0 принять /о(*о)> где х0 — 5-допустимое решение, то снова в силу
исходных предположений г0 Е int 3H-
§ 3. Алгоритм метода
3.1. Рассмотрим вначале случай ЛПР первого порядка.
Ш а г 1 (получение оценок г0 и г г) \ За одно обращение к ЛПР первого
порядка находим c,,s6 1,r. Вычисляем произвольное решение х0 систе-
системы выпуклых неравенств
csfs(x) > csu59 sej^, xeG. D)
Полагаем z0 * /0(х0).
Затем находим е/2-оптимальное (в смысле гл. VIII) решение следующей
задачи в порядковых шкалах
z > max I z Е 3H E)
и берем его в качестве z г.
260
Ш а г 2. Полагаем ах = г0, bx =* *i, if i = . Проверяем совмест-
совместность системы выпуклых неравенств
*о(О/о(*) > co(t)t; csfs(x) > csus, s€Г7, xGG F)
при f = tx. Если система F) совместна при t = tx, полагаем я2 = 'i r &2 = *>i.
h = ~" (#2 + *г)- В противном случае полагаем а2 = tfi, ?2 = *i> *2 =
= %(я2 + Ъг) и переходим к выяснению совместности системы F) при
/=Г2.
Шаг / + 1. Имеем отрезок [ah b{\, tt = %(<*/ + ft|).
Если система F) совместна при t = th полагаем д,.ц = ti9 b^x = bl9
tl+1 = %(a/+1 + */+i); в противном случае j/+1 = alt bl+l = /,, f/+1 =
1
Если bi -а\ <е/2, процесс останавливается; в противном случае пере-
переходим к шагу / + 2.
Покажем, что при непустом множестве допустимых решений описанный
процесс приводит к е-оптимальному решению в смысле гл. МП (т.е. к
(б, 6) -оптимальному решению в принятой здесь терминологии).
Пусть процесс остановился на (/ + 1)-м шаге. Это значит, что при t -щ
система F) разрешима и справедливо соотношение aiR0f0(xm)R0bj9 где
х. — произвольное оптимальное решение задачи A). Его существование
следует из непрерывности предпочтений и функций и компактности G.
Следовательно,при / > I + 1 р(а~ f GRo(fo(xm)))<е/2.
3.2. Приведем теперь алгоритм метода для случая ЛПР нулевого по-
порядка.
Опишем сначала процедуру имитации ЛПР первого порядка по ответам
ЛПР нулевого порядка. Для этого (т.е. для построения гиперплоскости,
разделяющей GRg (у) и HRg (у)) можно использовать следующую процеду-
процедуру, идея которой была предложена в [59].
В силу непрерывности Rs на 3)s имеются точки максимума и минимума
относительно предпочтения Rs. Пусть у0 - одна из минимальных точек, а
ух - одна из максимальных. В силу включения fs (G) С intS)s и монотон-
монотонности Rs справедливо соотношение у%Р5уК5Уо Для всех у Е fs(G). Более
того, соотношение у iPsyPsyQ справедливо для всех j> G int SD5.
Пусть у G int 2)j. Построим симплекс с достаточно малым ребром ys
так, чтобы все его вершины лежали в 2M, а центр тяжести совпадал су.
Предположим, что ? вершин симплекса лежат н? разделяющей гипер-
гиперплоскости между GRs (у) и HRg (у). Поскольку у не максимальный эле-
элемент Э)8 относительно Rs> то в силу вогнутости Rs оставшиеся вершины
не могут все лежать в G%g (у). Существуют по крайней мере ns - * пар вер-
вершин, в которых одна из вершин лежит в G°Rg (у)9 а другая - в H%s(y).
Исподьзуя ЛПР нулевого порядка и деление отрезка (соответствующего
ребра симплекса) пополам, можно с любой наперед заданной точностью
261
получить ns — к пар точек, в которых точки пары лежат в разных полу-
полупространствах, определяемых гиперплоскостью, разделяющей GRs(y) и
Нц8(у). Если бы мы могли точно указать точки, лежащие на пересе-
пересечении отрезков, определяемых этими парами точек, с разделяющей гипер-
гиперплоскостью, то, присоединив к ним к точек (вершин симплекса, изначаль-
изначально лежащих на гиперплоскости), можно было бы получить п аффинно-не-
зависимых точек, принадлежащих гиперплоскости (гиперплоскости без-
безразличия) и однозначно ее определяющих.
Пусть s Е 1, г. Построим гиперплоскость безразличия в точке и5. Обо-
Обозначим через S(n) правильный симплекс в Еп с вершинами в точках
A,0,. . .,0), @, 1,0, .. .,0),.. . , @,0,. . . ,0, 1), (а, а,..., а). При
а = — [1 + A + пI/г] симплекс правильный. (Действительно, длина реб-
pa S(n) равна 2Уг. Для правильного симплекса (а - IJ + (п - 1)а2 =
Рассмотрим симплекс, подобный S(ns), с центром тяжести в us и реб-
ребром 7s- Обозначим через /35 диаметр 3)s. Пусть максимальное расстояние
между точками в парах, о которых речь шла выше, не превышает as. Обо-
Обозначим через jj, . . . , ans_k точки в парах, лежащих "выше" разделяющей
гиперплоскости, через b%9 . . . , Ьп^_к9 -лежащие "ниже" разделяющей ги-
гиперплоскости, а вершины симплекса, лежащие на ней, через г1э . . . , tk.
Пусть по-прежнему cs — единичный направляющий вектор гиперплоскости
безразличия. Определим c's как решение задачи
к
и - us) |2 -» min | csaj > c'sus,
.
c'sPj <c'suS9 /G1, ns-k; c; > 0, II4II =1. G)
Из построения видно, что расстояние в метрике Хаусдорфа между гипер-
гиперплоскостью безразличия и ее аппроксимацией по точкам tt, ay, bj не превы-
превышает^.
Несложные вычисления показывают, что радиус шара, вписанного в
симплекс S (п), в B/1 (п + I))Уг раз меньше длины ребра.
Поскольку диаметр SDS равен 05, то шар с центром в щ радиуса 05 со-
содержит 3)s. Следовательно, симплекс с длиной ребра &sBns(ns + 1)) ,
подобный S(ns)y тем более содержит S)s. Внутри этого симплекса рас-
расстояние по Хаусдорфу между пересечением симплекса с истинной гипер-
гиперплоскостью безразличия, проведенной через uS9 и пересечением симплекса с
аппроксимацией этой гиперплоскости не превосходит — &Bл5(ля +1))Уа.
7s
Следовательно, для того чтобы расстояние между любой точкой пересе-
пересечения аппроксимирующей гиперплоскости с 3)s и GR (us) не превышало
5;/2, достаточно принять as удовлетворяющим неравенству
— М?п,{п. + 1))й <^ . (8)
Уз *
262
Отсюда
+ О)* '
Обозначим через cs единичный направляющий вектор аппроксимирую-
аппроксимирующей гиперплоскости, построенной при as, удовлетворяющем (8). Из по-
построения вытекает, что множество допустимых решений системы выпук-
выпуклых неравенств
включает в себя множество допустимых решений задачи A) и входит в
множество 6-допустимых решений задачи A), т.е. таких, что выполняется
условие B) определения (б, 5)-оптимального решения задачи A).
3.3. Опишем теперь результирующий алгоритм.
Шаг 1. Определяются описанным выше методом направляющие векто-
векторы c's,sG l,r.
Ш а г 2. Определяются оценки сверху и снизу оптимального значения
fo(x) относительного-
Для получения оценки снизу находим произвольное решение систе-
системы (9). Полагаем z0 =/(х0). В качестве г х берем е/2-оптимальное решение
задачи в порядковых шкалах E).
Шаг / + 1. Шаг проводится аналогично (/ + 1)-му шагу алгоритма
для ЛПР первого порядка.
Пусть в точках z0 и zx построены симплексы, подобные S(n0), с цент-
центрами тяжести в точках г0 и гг соответственно и длинами ребер 7оо и 7oi •
Положим 7о = min (Тоо> То Г)- Тогда в каждой точке z G [г0, zt] можно
построить вследствие выпуклости 3H симплекс с центром тяжести в z,
подобный S (п0), с длиной ребра 7о- Следовательно, чтобы обеспечить тре-
требуемую погрешность (в смысле определения из п. 2.1), достаточно выби-
выбирать погрешность Oq дихотомии на ребрах симплекса в промежутке
0<ао<
где j30 - диаметр
Доказательство сходимости приведенной процедуры к (б, б)-опти-
б)-оптимальному решению задачи A) проводится так же, как и для ЛПР первого,
порядка.
§ 4. Оценка трудоемкости методов
Число обращений алгоритма из п. 3.1 к ЛПР первого порядка не превос-
превосходит г + 1 + iog2 — . Здесь / - длина отрезка [z0, zx ].
Число обращений к ЛПР нулевого порядка алгоритма из п. 3.3 не пре-
превышает
1))*
+1 +J log2 ИХ I log2 - I .
263
Определение оценок г 0 й г х оптимального значения fo(x) значительно
упрощается, если fo(G) содержится в некотором параллелепипеде, входя-
входящем в int 9H. В этом случае вследствие монотонности Ro можно в качест-
качестве г 0 взять вершину параллелепипеда с минимальными компонентами,
а в качестве z х ^ с максимальными компонентами.
§ 5. Некоторые частные случаи
5.1. Пусть Ro - линейное (выпукло-вогнутое) монотонное нормальное
предпочтение на Е °. Как вытекает из результатов § 4 гл. VIII, задача A)
в этом случае сводится к обычной задаче традиционного выпуклого про-
программирования. Действительно, в этом случае Ro имеет линейный индика-
индикатор соу с с0 > О (см. теорему 3 из § 4 гл. VIII), и, следовательно, зада-
задача A) эквивалентна следующей стандартной задаче выпуклого программи-
программирования:
* max\csfs(x) > csuS9 s G 1,г; x е G. A0)
Поскольку Со в этом случае не зависит от z, то для определе-
определения (б, 5)-оптимального решения требуется г + 1 обращение к ЛПР перво-
первого порядка. При работе с ЛПР нулевого порядка число обращений соот-
соответственно равно
2<2я,(я,*1))*0,
Здесь 60 = е, /3, — диаметр некоторого выпуклого компакта, внутренность
которого содержит fs (G).
5*2. Пусть теперь Яо - линейное нормальное нетривиальное монотонное
бинарное отношение на выпуклом компакте 2H с E"° (a не на Еп°, как
выше);. Обозначим через ут одну из максимальных точек 3H относитель-
относительно Ло. В силу монотонности До замыкание Я? (у.) есть 2H. Тогда в силу
теоремы 4 § 4 гл. VIII Ro имеет линейный сигнализатор *) на 3H и вогну-
вогнутый индикатор на 3)о, совпадающий с сигнализатором на Я? (у+) и по-
постоянный на множестве {z\zIRo ym). Следовательно, и в этом случае зада-
задача ОВП A) также сводится к обычной задаче традиционного выпуклого
программирования.
53. Откажемся теперь от требования регулярности бинарного отноше-
отношения R и. рассмотрим линейное непрерывное предпочтение на Еп. Докажем,
что и в этом случае R имеет линейный сигнализатор на Еп.
Пусть R нетривиально (для тривиального предпочтения утверждение
очевидно). Обозначим через у0 точку, не являющуюся минимальной
(по R). Тогда ЯдОо) ^ Ф и существует гиперплоскость, разделяющая
GrCVo) и Н^(у0). Обозначим ее единичный направляющий вектор через
с(у0). И вообще, обозначим через с(у) единичный направляющий вектор
гиперплоскости, разделяющий G^ (у) и HR (у), если у - не максимальный
элемент Еп относительно R, и G^(y) и Н%(у), если у — максимальный
*) Напомним, что сигнализатор бинарного отношения R, определенного на G
это функция*: G-+E1 такая, что из хРу следует g(x)>g (у).
264
элемент Еп относительна R. Очевидно, что с(у) s c(z) для всех у, z € Еп9
поэтому отбросим аргумент в обозначении направляющего вектора. Линей-
Линейная функция ifi(y) -суш будет искомым сигнализатором R на Еп.
Будем говорить, что R нестрого монотонно, если из х ^у следует xRy
и для любого х G Еп существует z > 0 такой, что zPjc. Для нестрого моно-
монотонного предпочтения Я очевидно, что с > 0.
Таким образом, даже при отсутствии регулярности можно свести задачу
обобщенного математического программирования с вогнутыми fs{x\
s €Е 0, г, и линейными непрерывными нестрого монотонными предпочте-
предпочтениями к обычной задаче традиционного выпуклого* программирования.
Модифицируем метод "симплекса" построения разделяющей гиперплос-
гиперплоскости для случая нерегулярности предпочтения Я.
Пусть ЭЬ С int2), 3), и SO- выпуклые подмножества Еп, для всех
У е 3) У\ РуРуо и хотя бы одна из точек уй, у х принадлежит int 3).
Если У\Ру, то на отрезке [у, уг ] методом деления пополам с помощью
ЛПР нулевого порядка найдем ближайшую к yt точку, эквивалентную^.
Применим в точке у метод симплекса» описанный выше для случая регуляр-
регулярного предпочтения, и найдем направляющий вектор с (у) гиперплоскости,
разделяющей G%(y) и HR(y). Полупространство \z\c(y)z > с(у)у) со-
держит G&(y).
9 сдучае, когда ylRyi9 найдем на отрезке [у0, у\ ближайшую к у0
точку, эквивалентную у. Применим в этой точке метод симплекса. Полу-
Получим направляющий вектор гиперплоскости, разделяющей GR(y) mH°R{y).
Проведем все вычисления с точностями, принятыми для случая регуляр-
регулярного предпочтения. Полученное при этом решение задачи A0) будет
(е, 5) оптимальным решением.
Таким образом, условие регулярности R, введенное выше, оказывает-
оказывается несущественным при сведении задачи ОВП с линейными, непрерывными,
нестрого монотонными предпочтениями, определенными на всем Еп,
к традиционной задаче выпуклого программирования.
§ 6. Ядро задачи ОВП
6.1. Изложенный выше метод решения задач ОВП с линейными пред-
предпочтениями эффективен тогда, когда имеется возможность оценки zQ
и zx (имеется опытный ЛПР, способный давать нижние и верхние оценки
вектора /0(*), или известен параллелепипед, содержащий fo(G)y - концы
одной из его диагоналей определяют z0 и zt). В противном случае возни-
возникает необходимость в решении вспомогательной задачи в порядковых
шкалах. Используя, однако, специфику линейных предпочтений, можно
свести задачу ОВП к некоторой задаче в порядковых шкалах — к ее
"ядру" - и исключить необходимость во вспомогательных задачах для
вычисления z0 и zx.
Разберем для простоты случай ЛПР первого порядка.
Построим по предпочтению Ro и вектор-функции /0() предпочтение Qo
следующим образом: xQoy <s^fo(x)Rofo(y).
При линейном предпочтении RQ и вогнутой вектор-функции /о(-) по-
построенное таким образом предпочтение Qo вогнуто.
265
Обозначая по-прежнему через cs единичные направляющие векторы ги-
гиперплоскостей, разделяющих GRg(us) и HRs(us), перепишем исходную
задачу A) в виде
х > max \csfs(x) > csus, s G IJT; x G G. A1)
Qo
Будем называть задачу A1) математического программирования в по-
порядковых шкалах ядром исходной задачи ОВП A). Векторы с5 вычисля-
вычисляются с помощью процедуры из п. 3.2 по информации ЛПР нулевого поряд-
порядка для Rs.
Для предпочтения Qo мы располагаем только ЛПР нулевого порядка.
Оказывается, однако, что в рассматриваемом случае и нет нужды в ЛПР
первого порядка для Qo. Действительно, в силу линейности Ro
[У I co(x)fo(y) > co(x)fo(x)} = {у \fo(y)Rofo(x)} - GQo(x).
Здесь со(х) - единичный направляющий вектор гиперплоскости, отделяю-
отделяющей GRo(fo(x)) от#ло(/0(х)).
Таким образом, по ЛПР первого порядка для исходной задачи можно
эффективно строить само множество Gqo(x), а не его аппроксимацию.
Ядро задачи A) является задачей в порядковых шкалах достаточно прос-
простой структуры: ее ЛПР для каждой точки х указывает множество Gqo(x)
всех точек, не худших х.
6.2. Приведем алгоритм решения задачи A1), основанный на принци-
принципах метода центров тяжести.
Ш а г 0. Полагаем 2H ={у \у GG,csfs(y)> csus - 8S9sgT^7). На-
Находим хо — центр тяжести 3H — и со(хо). Если 3H = 0, то множество
5-приближенных планов пусто. Если 3H Ф ф, переходим к следующему
шагу. '
Шаг/. Полагаем % = 3>г^х П {^|со(х:/_1)/оG) > oGi
X/о(•*/_!) +'еЬ Если 3>i = 0, принимаем в качестве е-приближенного р
шения точку х^ t. Если 3>г Ф 0, находим хг - центр тяжести 3)х — и пере-
переходим к следующему шагу.
Очевидно, что алгоритм сходится к (е, 6)-оптимальному решению
за конечное число шагов.
Как видим, допущение о линейности предпочтений существенно упроща-
упрощает процедуру решения задачи ОМП.
Глава ХП
МНОГОШАГОВЫЕ СХЕМЫ
ОБОБЩЕННОГО МАТЕМАТИЧЕСКОГО ПРОГРАММИРОВАНИЯ
§ 1. Введение
1.1. Современная теория принятия решений представляет собой синтез
моделей и методов, возникших в различных дисциплинах - математичес-
математическом программировании, теории игр, исследовании операций, автоматичес-
автоматическом регулировании. Исторически сложились различные подходы и, соот-
соответственно, различные языки теории принятия решений — язык критериев,
язык бинарных отношений, язык функций выбора. В терминах критериев
и бинарных отношений описываются механизмы выбора — конструктив-
конструктивные методы принятия решений. В терминах функций выбора определяют-
определяются принципы отбора рациональных решений, отвечающие различным поня-
понятиям "рациональности", "равновесия", "компромисса". В простейших
задачах принятия решений удается сопоставить принцип принятия решений
и механизм выбора. В литературе (см. например, [89], также гл. III) рас-
рассмотрены условия, при которых функция выбора может быть реализована
оптимизацией по скалярному критерию или оптимизацией но бинарному
отношению. Эти случаи охватывают, однако, ничтожно малую часть воз-
возможных функций выбора. Представляет интерес установление связи между
произвольными функциями выбора и механизмами выбора. Такая взаимо-
взаимосвязь обеспечивает каждому принципу принятия решений соответствующую
вычислительную процедуру выбора. Без установления этой связи не может
быть речи об автоматизации процессов принятия решений.
Настоящая глава посвящена построению и обсуждению механизма,
позволяющего точно реализовать функцию выбора на конечном числе
вариантов, и приближенно, но с любой заранее заданной степенью точ-
точности — произвольный принцип выбора на компактном множестве ва-
вариантов.
Традиционная схема математического программирования охватывает
многие предложенные практикой модели принятия решений. Речь идет
о моделях, формализованных в терминах критериев. В рамки математичес-
математического программирования укладываются задачи проектирования техничес-
технических систем фиксированного назначения, задачи планирования при четко
сформулированном критерии качества плана, задачи синтеза одноцелевых
систем управления. Однако при исследовании теоретических проблем
экономики, социологии, военного дела и других дисциплин, в которых
приходится учитывать много целей и интересы ряда лиц, роль традиционной
оптимизации оказывается более скромной.
267
Один из подходов к выбору "компромиссных" решений, учитывающих
субъективные факторы лиц, принимающих решение, или другие факторы,
не поддающиеся измерению, основан на использовании бинарных отноше-
отношений. Язык бинарных отношений применим, если выбор может быть произ-
произведен только по информации о результатах попарного сравнения вариантов.
Схема обобщенного математического программирования, изложенная
в гл. IX, позволяет распространить некоторые методы традиционного
математического программирования на более сложные ситуации, когда
качество решения и ограничения на область его определения характеризу-
характеризуются не скалярными, а векторными функционалами. Модели обобщенного
математического программирования описываются на языке бинарных от-
отношений.
В более общем случае выбора, когда язык бинарных отношений непо-
непосредственно не применим, в частности, когда результат сравнения пары
вариантов зависит от других возможных вариантов решения (от "кон-
"контекста94 ситуации), либо когда попарное сравнение вариантов лишено
смысла (например, если требуется выбрать "типичный" наиболее часто
встречающийся вариант), используется язык функций выбора. Функции
выбора могут быть в принципе описаны таблицей, сопоставляющей каждеш
допустимой ситуаций (каждому предъявленшо X, принадлежащему заранее
заданному множеству предъявлений) решение или некоторое множество
возможных вариантов решения. Другой вид задания функции выбора -
это перечень ее свойств - аксиоматические требования к рациональному
решению. И тот, и другой подходы представляют собой достаточно уни-
универсальную возможность для определения понятия "рациональное реше-
решение". Однако описывая результат выбора, язык функций выбора не отра-
отражает структуру механизма, лежащего в основе выбора, и не указывает
вычислительную процедуру, позволяющую автоматически по предъявлен-
предъявленной ситуации установить рациональное решение.
В; настоящей главе предлагаются и исследуются механизмы принятия
решений, позволяющие точно или приближенно реализовать произвольные
функции выбора. Предложенные модели могут быть использованы для
экстраполяции поведения человеко-машинных систем по результатам
наблюдений, для прогнозирования спроса по результатам выборочного
обследования, для построения экспертных систем в различных областях
интеллектуальной деятельности, особенно в ситуациях, в которых приня-
принятие решений должно производиться в условиях, вредных для организма.
1.2. В § 5 гл. VI была введена удобная для последующего изложения
запись несколько расширенных схем математического программирования
в порядковых шкалах (МППШ) и обобщенного математического програм-
программирования (ОМП).
Пусть G представляет собой множество всех вариантов, которые могут
встретиться в процессе выбора в заданном классе задач. Подмножества
X С G будем, как и ранее, называть предъявлениями. Они характеризуют
ситуации, в которых производится выбор.
Пусть R - некоторое бинарное отношение на множестве G. Будем рас-
рассматривать разные типы оптимальности по отношению R. Выбор типа
оптимальности в каждом конкретном случае определяется содержатель-
содержательными особенностями задачи и свойствами соответствующих бинарных
268
отношений. Так, например, оптимизация по доминированию означает
х е OptjPom(Jir) ~ (х е X) л (уу е X xRy)9
а оптимизация по блокировке
х € Opt|!(*) «(хб Х)л (\fy € X yRx).
t|
Имеют место соотношения
Opt|'(Jf) pW, р?() p
R R ——_
где Rd - бинарное отношение, двойственное к R: R d s R ~l.
В главе V введены другие определения оптимизации по бинарному от-
отношению, при которых можно говорить о максимальном по R элементе
х € X даже в том случае, когда множества Opt?om(AT) и Opt®!(*) от-
отзываются пустыми.
В соответствии с введенными там показателями имеем еще четыре
типа наибольших элементов:
х 6 Qpt?(*) ~ (х е X)л (\/у € X S*(x) D S*(y))9 k= 1 *4,
где множества 5^ (х) определяются через множества элементов #? (х) -
строго подчиненных х по R, ER (х) - эквивалентных х по Л,
не сравнимых с дс по Л с помощью следующих неравенств:
В принципе, можно говорить еще о четырех типах оптимизации по R,
если в определении Opt?(T) заменить доминирование по включению
блокировкой по включению:
х е Optf(Т) ~ (х g лг)л (уу е х s*(y) ф »*(*)).
Если под оптимизацией по R подразумевается не максимизация, а мини-
минимизация, то в определении Opt^(jf) вместо множества s?(x) элементов,
подчиненных элементу х, следует использовать множества G\s?(x) эле-
элементов, "доминирующих" х.
Аналогичным образом вводятся множества AdmRtu(X) элементов
х Е X, допустимых (admissible) по ограничению, определяемому бинарным
отношением R и параметрами и G U.
Так, допустимость по доминированию:
jc G АЛп^дК-ЛГ) «¦* (х 6 ЛГ)Л (Vii € tf xRu);
допустимость по блокировке:
х G Adml1 ^(ЛГ) <=> (х е Х)л (Vw G i/ uRx).
Имеют место соотношения
= Adm » (ЛГ), Adm»1 ^(ДГ) = Admjj" (*)•
269
В зависимости от содержательных особенностей задачи могут быть ис-
использованы еще четыре типа допустимости:
х€ Adm?fV{X)~(хеХ)л(VuGU S%(x)DS%(u))f
если допустимые элементы х доминируют параметры w E J7, и
xGAdm* tU(X)<*(xeX)/K(\/uGU SkR(u)j>SkR(x))9
если допустимые элементы х не блокируются параметрами u^U.
В п. 1.5 гл. V описан еще более общий подход к оптимизации по бинар-
бинарному отношению — так называемая (R, С)-оптимизация Opt^tC^(Jf).
По аналогии с приведенными здесь рассуждениями может быть введена и
(R, С) -допустимость Adm fy Уу(X).
В дальнейшем будем опускать символ, означающий тип оптимизации
или допустимости, предполагая, что они фиксированы и определяются в
каждом отдельном случае содержательными соображениями.
1.3. Введенные определения "оптимизация по Ло" и "допустимость по
Rp9 ир "позволяют записывать задачу математического программирования
в порядковых шкалах (расширенную, допускающую использование не
только пересечения множеств, определяемых отдельными ограничениями,
но и их объединения) в следующем виде:
Opt*o(Z)|Z= Пи AdmRsf>Us.(X). A)
Используя монотонные теоретико-множественные функции, можно
переписать задачу в более удобном для анализа виде. Для этого введем
некоторые определения.
Под ^-местной теоретико-множественной операцией F(Xl9...> Хк)
на множестве G будем понимать функцию, аргументами и значениями ко-
которой являются подмножества G, удовлетворяющую при любых х, у 6G,
Xj> Yj ^GJ & Tjf, условию
Операцию F будем называть монотонной, если
{ (Хг Э ГОЛ... *(Хк Э Yk)} =>F(Xi9... 9Xk)DF(Yu..., Yk).
Среди монотонных функций имеются две тривиальные: F(Xx>..., Хк) =
= ф и F (Xi,..., Хк) = G. В дальнейшем будем рассматривать только нетри-
нетривиальные монотонные операции F. Известно, что всякая такая операция,
и только такая, может быть представлена в виде ип посредством конечного
числа двуместных операций. Это значит, что задачу A) ОМП можно перепи-
переписать в виде
Opt*o (Z) | Z = F(Adm? ~ (ЛГ)), B)
ь...,Rq), и=(и19...,ия)9
^(Z)) = F(Adm* ltUl(X)t..., AdmRq§ Uq(X)).
270
Здесь q — общее число отношений RSJ (и множеств ^
Здесь и в дальнейшем при рассмотрении более общих моделей будем
использовать наряду с задачей B) ОМП схему ОМП, которая также запи-
записывается в виде B), но в ней X Q G произвольно. Таким образом, схеме
ОМП соответствует множество задач ОМП, каждая из которых получается
фиксацией X.
§ 2. Многошаговая схема
обобщенного математического программирования (МнОМП)
2.1. На практике в сложных задачах управления, планирования и проек-
проектирования решение часто принимается соответствующим образом сформи-
сформированной организационной структурой. Это может быть иерархическая
последовательная структура, когда на каждом следующем уровне уточняет-
уточняется решение, принятое на более высоком уровне. Это может быть параллель-
параллельная структура, когда по одной и той же информации параллельно прини-
принимаются решения, отражающие различные аспекты управления и мнения,
опыт и .предпочтения различных специалистов, а затем принятые решения
сравниваются, обобщаются и так или иначе агрегируются. В зависимости
от характера задачи подготовка окончательного выбора может производить-
производиться и с помощью других организационных структур, которые обеспечивают
"демократическое" решение проблемы, учитывающее знания и шкалы
ценностей лиц и коллективов, заинтересованных в решении.
Формализация подобного подхода к выбору решения приводит к много-
многошаговым схемам ОМП, у которых на каждом шаге t используется не толь-
только результат предыдущего шага t — 1, но й других предшествующих шагов.
2.2. Опишем общую многошаговую схему ОМП.
Пусть число шагов равно к> 2 [69]. На шаге t,t G 1, ft, решается задача
Opt^oCZW) rzW -f<f)(Adm5 Wf^(ДГ^0)), C)
где
/(O = Ui...-\Jq),xVp>,pe lTq, -результат шага /p,/p< f,
= X — предъявление. Результатом (решением) схемы является X* '.
Обозначим через Jt множество всех/р таких, что Х^р* используется на
шаге t. Набор / = (Jx,..., Jk) будем назьюать информационной структу-
структурой схемы. Она определяется особенностями решаемой задачи и возмож-
возможностями переработки и хранения информации.
Представляется, что прикладным задачам принятия решения чаще других
будут соответствовать классы многошаговых схем обобщенного математи-
математического программирования (МнОМП) с последовательной, параллельной,
последовательно-параллельной и древовидной информационными структу-
структурами. Будем их обозначать ПсОМП, ПрОМП, ПсПрОМП и ДрОМП соответ-
соответственно. При необходимости будем указывать в скобках класс Q исполь-
используемых бинарных отношений (например, ПсОМП (L) - класс задач
МнОМП с последовательной информационной структурой, использующих
271
отношения строгого (линейного) порядка). Напомним определения этих
типов информационных структур (см. п. 5.2 гл. VI).
Для класса ПсОМП многошаговых схем с последовательной информа-
информационной структурой /f= {f-l),fei,jfc. Для класса ПрОМП многоша-
многошаговых схем с параллельной информационной структурой Jt =.-.. = Jk-i =
= {0},/fc = {l,...,fc — 1}.В классе ПсПрОМП информационная структу-
структура соответствует многошаговой схеме, состоящей из нескольких независи-
независимых последовательных ветвей (от шага Г до s\, от S\ + 1¦ до 52,..., от
st-i + 1 цо st = к - 1), результаты которых используются лишь на шаге
к. Для нее Jx = /,i+1 = ... = /,r_1 + i = {0}, Jk = { su..., sk),Jf =
= { t — 1} в остальных случаях. Приведенные классы схем являются част-
частными случаями многошаговой схемы ДрОМП с древовидной информацион-
информационной структурой. Структура ДрОМП задается двумя условиями:
1) 3 s, I <s <fc — 1, для которого Jj =/2 = .. . = /* = (О);
2) каждое число / €= 1, к — 1 входит ровно в одно множество Jt9t>f.
§ 3. Схемы МнОМП и функции выбора
3.1. Схемы МнОМП представляют собой широкий класс механизмов вы-
выбора. Возможности реализации функций выбора (ФВ) из того или иного
класса существенно зависят от информационной структуры схемы МнОМП.
Схеме S соответствует ФВ Сд(Х)9 значением которой на предъявлении X
является результат Х^ последнего шага. Приведем несколько, примеров
механизмов выбора и укажем схемы МнОМП, реализующие ФВ, соответ-
соответствующие этим механизмам^
1°. Выбор по оптимизации бинарного отношения
CR(X) = ОрЦ(*). D)
Уже отмечалось, что имеют место различные определения оптимизации
по бинарному отношению. Предполагается, что тип оптимизации фикси-
фиксируется и в записи не указывается.
2Р. Последовательный выбор по набору бинарных отношений (супер-
(суперпозиция). Набору отношений R = (Rb ... 9Rk) соответствует ФВ
.). E)
3°. Параллельны^выбор по набору бинарных отношений (композиция).
Набору отношений R = (Rt,..., Rk) и монотонной теоретико-множествен-
теоретико-множественной операции F (Yt,..., Yk) соответствует ФВ
... гСЯк(ХI F)
4°. Последовательно-параллельный выбор. Последовательности наборов
отношений /?!,..., Rk и монотонной теоретико-множественной операции
F соответствует ФВ
Все перечисленные ФВ используют выбор по оптимальности. Нередко
используется и выбор по допустимости.
272
5°. Выбор по допустимости. Бинарному отношению R С G2 и множеству
эталонных вариантов UCG отвечает ФВ
= AdmRtU(X). (8)
Как и в случае выбора по оптимальности, имеются различные определе-
определения понятия допустимости по бинарному отношению. Предполагается, что
тип допустимости фиксируется и в записи не указывается.
Нетрудно видеть, что к
Rit
Это значит, что последовательный выбор по допустимости сводится к
параллельному. Отсюда следует также, что и последовательно-параллель-
последовательно-параллельный выбор по допустимости сводится к параллельному. Заметим, что при
выборе по оптимальности все эти три механизма существенно различны.
Они реализуют разные классы ФВ. Таким образом, к перечисленным типам
выбора добавляется еще один.
_ 6°. Параллельный выбор по допустимости. Набору бинарных отношений
R = (Ri,..., Rk)t набору множеств U = (Ui9..., Uk) и монотонной теоре-
теоретико-множественной операции FfYu ..., Yk) соответствует ФВ
^(9)
Все перечисленные ФВ могут быть реализованы схемами МнОМП.
Последовательный выбор E) реализуется схемой ПсОМП, на шаге
Г (г € 1, к) которой производится безусловная оптимизация по отношению
Rt. Формально на шаге t решается задача
где R° — тривиальное отношение доминирования, для которого все вариан-
варианты эквивалентны, а г/ — произвольный вариант из U.
Последовательному выбору соответствует последовательная информа-
информационная структура. \
Параллельный выбор F) реализуется схемой ПрОМП, на шаге t(t€
€ 19к) которой производится безусловная оптимизация по отношению Rt
(вычисляетсяJT*'' =CRt(X))9 а на последнем шаге Л+ 1 решается задача
OptRo(Z«+lb\Z<k+1> = F(AdmRotU(#»),...,Ad
ще R° и и имеют тот же смысл, что и для последовательного выбора.
Параллельному выбору отвечает параллельная информационная струк-
структура.
Последовательно-параллельный выбор по оптимальности G) реализуется
многошаговой схемой ПсПрОМП с параллельно-последовательной инфор-
информационной структурой.
Параллельный выбор по допустимости (9) реализуется одношаговой
схемой
b
Как видим, многошаговые схемы ОМП обладают достаточно широкими
возможностями. Мы увидим ниже, что с помощью схем МнОМП можно
реализовать практически произвольную ФВ на конечном множестве вариан-
вариантов.
18. Д.Б.Юдин 273
3.2. За исключением § 6 будем дальше в этой главе рассматривать
случай, когда множество G конечно. Будем называть класс механизмов
выбора полным, если для любой ФВ С() найдется реализующий ее меха-
механизм из этого класса.
Пусть С(Х) - произвольная ФВ на множестве G. Будем называть ва-
вариант х GG приемлемым, если существует предъявление X ? G, для кото-
которого х € С(Х). Все содержательные механизмы выбора, основанные на
сравнении вариантов, обладают следующим свойством: если предъявляется
единственный вариант и он приемлем, то он выбирается. Формально это
свойство записывается в виде
(ЗХ)(х Е С(Х)) - С({х}) = { х). A0)
Класс всех ФВ, обладающих свойством A0), мы обозначили в п. 4.2
гл. III через 2°. Будем назьюать класс механизмов выбора полным в ослаб-
ослабленном смысле, если для любой ФВ из 2° найдется реализующий ее меха-
механизм из этого класса. Различие между понятиями полноты и полноты
в ослабленном смысле проявляется лишь в одноэлементных ситуациях,
когда проблем с выбором не возникает.
Назовем ФВ С(») однозначной, если приX&Gмножество С(Х) состоит
не более чем из одного варианта. Соответственно класс механизмов выбора
назовем 1-полным (в ослабленном смысле), если для любой однозначной
функции из 2° существует реализующий ее механизм из рассматриваемого
класса.
Будем обозначать через МнОМП (Q) класс всех многошаговых схем
ОМП, в которых используются бинарные отношения только из фиксирован-
фиксированного класса отношений Q. Будем рассматривать три класса отношений L,
W и R(L С W С R) - классы отношений строгого порядка, слабого порядка
и произвольных отношений. Как мы видели, отношения из классов L
и W играют особую роль, поскольку каждое из них может быть представ-
представлено индикатором. Отношение L является строгим порядком в том и толь-
только в том случае, если оно обладает индикатором со строгой шкалой (при-
(принимающим при разных х разные значения). Отношение W является слабым
порядком тогда и только тогда, когда оно обладает индикатором с нестро-
нестрогой шкалой (который при разных х может принимать Одинаковые
значения).
3.3. Основной результат настоящей главы составляют следующие ут-
утверждения, уже упоминавшиеся в п. 5.3 гл. VI.
Теорема 1. Класс МнОМП (W) полон (в ослабленном смысле).
Теорема 1'. Класс МнОМП (L) 1-полон (в ослабленном смысле).
Таким образом, какова бы ни была функция выбора (полученная,
например, по результатам наблюдений за действиями диспетчера, экспер-
эксперта, диагноста или опытного специалиста в любой другой области), всегда
можно построить реализующую ее многошаговую схему. В случае, когда
ФВ не является однозначной, каждое отношение из соответствующей схемы
МнОМП может быть выбрано из класса W, т.е. является слабым порядком.
Усилить этот результат, заменив класс W fta L, нельзя, поскольку отношение
строгого порядка, по которому производится оптимизация на последнем
шаге, оставляет не более одного варианта, а неоднозначные ФВ так не мо-
могут быть реализованы. Однако для произвольной ФВ из 1° возможна
274
реализация схемой МнОМП, в которой на всех шагах кроме последнего
используются отношения строгого порядка, а на последнем — слабого
порядка. Этот вывод следует из доказательства теоремы 1. Из теоре-
теоремы 1' вытекает, что в важном частном случае однозначных ФВ в реализую-
реализующем их механизме МнОМП всегда можно обойтись отношениями строгого
порядка (см. [69], [70] ).
3.4. В § 5 гл. VI приведены без доказательства некоторые утверждения
о числе ФВ, которые могут быть реализованы схемой МнОМП с ограничен-
ограниченной информационной структурой, какой-либо из тех, которые обсужда-
обсуждались в предыдущем параграфе. Доказательства этих результатов можно
найти в {56, 57,70].
Аргументация утверждений теоремы 1 и 1' представляет собой некото-
некоторую модификацию рассуждений из п. 6.4 гл. III. Там по произвольной
ФВ С Е 2° был построен набор функций С/, отвечающих значениям /, для
которых С^(Х^) Ф 0. Функция С,- правильно реализует выбор варианта /
(см. гл. ДИ A0». В случае С^(Х^) ф const она задается выраже-
выражениями (8) - (9) гл III, а при CW(JT w) =1 С, полагается равной X.
Как и в п. 3.1 настоящей главы, можно построить схему, на некоторых
шагах которой реализуются функции Ct{X) в соответствии с соотноше-
соотношениями (8) и (9) гл. III для всех / таких, что C(/)(Z(/)) ф const. Добавим
к ней еще один шаг:
OptRo(Z)\Z = U AdmL/, №(Х)),
г\с«\х«Ъфо
где Яо является некоторым строгим порядком Z,o, если С — однозначная
функщш, и — тривиальным слабым порядком Wo = 0, если СЕ Z° — произ-
произвольная функция. , Полученная схема реализует С(«). Действительно,
AdmLiti(Ci(X)) выделяет единственный элемент /, причем лишь в тех
предъявлениях X, для которых * е С(Х). Отсюда следует, что множество Z
совпадает е С(Х). Последующая оптимизация по Ro является фиктивной
и не изменяет выбора. В случае, когда Ro - слабый порядок, это очевидно,
а для однозначных функций выбора этот вывод вытекает из того, что Z
содержит не более одного варианта.
§ 4. Оценка качества прогноза
выбора механизмами заданного класса
4.1. В настоящей главе исследуются процедуры принятия решения, реали-
реализующие любую концепцию рациональности, выраженную функцией выбора.
Показано, что произвольная функция выбора может быть представлена
оптимизирующим механизмом — схемой МнОМП. Необходимо, однако,
отметить следующее. Если имеется явное описание функции выбора для
всевозможных предъявлений, то вопрос о построении механизма выбора
не встает - выбор для любого предъявления определен. Тогда в чем же
практическая ценность полученных результатов?
Изучение систем и процессов, представляющих интерес для естествен-
естественных (да и для общественных) наук, обычно основывается на наблюдении
18* 275
последовательности реализаций состояний системы, возможно, при различ-
различных начальных условиях и различных состояниях среды. Часто реально
наблюдаемый выбор можно рассматривать как выбор на "достаточно
представительном" множестве предъявлений. Это дает основание пред-
предполагать, что механизм выбора, восстановленный по накопленному мате-
материалу, будет удовлетворительно работать и на других предъявлениях.
Таким образом, результаты главы могут быть использованы для кон-
конструирования правдоподобных гипотез о механизмах, определяющих
поведение наблюдаемых процессов, и для выявления их скрытых законо-
закономерностей. Предложенные методы могут быть использованы для экстра-
экстраполяции поведения человеко-машинных систем и, в частности, для прогно-
прогнозирования спроса. Принятая здесь методология позволяет заменить
известное из математической экономики понятие "выявленное предпочте-
предпочтение" более широким понятием "выявленный механизм выбора". На основе
наблюдений за работой опытного диспетчера, оператора или диагноста на
достаточно представительном множестве ситуаций можно построить модель
их поведения. Экстраполяция механизмов выбора может быть использо-
использована в задачах принятия решений в условиях дефицита времени, когда
эксперты достаточно подробно разрабатывают некоторое (представитель-
(представительное) множество сценариев и стратегию лиц, принимающих решение, а сис-
система должна обеспечить оперативный выбор линии поведения, причем
не обязательно в ситуациях, предусмотренных сценариями.
4.2. Во всех указанных случаях построение механизма выбора из неко-
некоторого класса JH* механизмов, способных точно или приближенно реализо-
реализовать изучаемую функцию выбора С(Х) на множестве G, производится
на основе информации о выборе на ограниченной представительной выбор-
выборке 5В= { Хх,..., XN } € BG)N предъявлений. Сам же механизм выбора
предполагается использовать при произвольных предъявлениях X ?G.
Представляет интерес анализ качества выбора (при тех или иных ста-
статистических гипотезах о предъявлениях) в теде ситуациях, в которых он
не наблюдается, и оценка длины N выборки, гарантирующей заданное
качество прогнозирования полной функции выбора по наблюдаемой частич-
частичной. Приведем две такие оценки, отвечающие различным характеристикам
качества прогноза.
Первая оценка предложена в [57].
Фиксируем некоторое понятие "ошибки" реализации функции выбора
С(Х) механизмом выбора М на предъявлении X. Будем задавать ошибку
функцией гс(М9 X), равной 1, когда "реализация См (X) ошибочна", и О,
когда "ошибки нет". Примерами таких функций являются
гс(МуХ) = О ~ СМ(Х) = С(Х),
гс(М,Х) = 0 ~ {(СМ(Х) ? С(Х)л
л (С(Х) Фф*> СМ(Х) Фф))
и др.
Пусть ФВ С() наблюдается на множестве предъявлений S = { Хх,...
..., XN). Обозначим через vNtC(M, 38) частость ошибок, возникающих
при реализации ФВ С (•) механизмомМ на выборке 59,
N * =
276
Примем, что выборка 53 - последовательность независимых случайных
предъявлений, появляющихся с вероятностью Р(Х). Величина Рс(Ю =
2 гс(М> Х)Р(Х) представляет собой вероятность ошибки, возни-
кающей при реализации ФВ С() механизмом М.
При фиксированном механизме М имеет место следующая версия закона
больших чисел - неравенство Хеффдинга[14,85]:
%
Пусть М принадлежит некоторому априорно заданному классу Л меха-
механизмов. Вероятность 9 того, что хотя бы для одного механизма М GJC
выполнено неравенство
не превышает An{Jt)e~2e*N, где Л„ (Л) - число всюду определенных
ФВ на «-элементном множестве G, реализуемых механизмами класса JC,
Найдем N из условия 5^ < т? < 1. Имеем
N> (
где Нп{Л) = log2 |Л„(ЛО1 - энтропия класса UK. Здесь
мощность множества А п (Л ).
Таким образом, с вероятностью 1 - т? можно утверждать, что если
объем N выборки удовлетворяет последнему неравенству, то Р(М) <
^ pn9 с(М9 Ж ) + € для любого механизма М EJt. Отсюда видно, что чем
меньше энтропия класса Лу тем меньше достаточный объем выборки,
позволяющий по наблюдаемой частичной ФВ прогнозировать полную ФВ.
Наоборот, чем более универсален класс механизмов - чем больше энтро-
энтропия кдасса Л, тем больше информации требуется для построения меха-
механизма, восстанавливающего произвольную ФВ на G с погрешностью, не пре-
превышающей заданную.
4.3. Приведем еще одну оценку достаточной длины выборки, отвечаю-
отвечающей другой характеристике качества прогноза полной ФВ по частичной.
Пусть на выборке S3 = { Хг, ..., XN) наблюдается частичная ФВ
С*(ЛГ), IG®. Эта частичная ФВ выделяет из класса Л механизмы выбо-
выбора М, для которых
СМ(Х,) = СМд, /=1,...,ЛГ. * (И)
Пусть Р(Х) — распределение вероятностей предъявлений X Е 2**9 X Ф 0,
а Хх, ..., XN — независимые, в совокупности распределенные по Р(Х)
предъявления. Поскольку Хх, ..., XN - случайная выборка, то и меха-
механизмы М G Л у удовлетворяющие A1), выбираются случайным образом
и зависят от С«,, Хх, ..., XN, т.е. М = М(С„, Хх, ..., XN), где М - спо-
способ построения механизмов. Обычно способ построения М определяет
А
не любые механизмы из Л9э. некоторый подкласс Л С Л, реализующий
произвольные функции выбора, представимые механизмами из Л.
Назовем величину
277
дефектом качества прогноза полной функции выбора С+(Х) по выбор-
выборке 59.
Установим, при какой длине ЛГ выборки 5В дефект W(C0, Хх, ..., XN)
качества прогноза полной ФВ Сф (•) с вероятностью, не менее 1 - ту, не
превысит б(О<€<1,О<т7<1 - заданные числа). Соответствующая
длина N выборки 59 должна гарантировать выполнение неравенства
& = ?> (С„ €) =
,... ,XN) | W(C.f Xl9...tXN)>e)<n.
Имеет место следующее утверждение.
Теорема 2. При длине N выборки 53, удовлетворяющей неравенству
N > — <1п | UT | — 1пт?}, A2)
€
обеспечивается с вероятностью 1 - т? прогноз полной функции выбора с
дефектом не более е.
Доказательство. Пусть Л — множество механизмов выбора из
Jtc дефектом прогноза, большим 6.
Л={МеЛ:Рх{Хе2с \СМ(Х)ФС.(Х)}>€).
По определению величины 3* = #>(С*, е)
€) = Рг
Пусть для Л/G ^ Дм - событие { (ДГ,,..., XN)\CM(Xf) = С,(ЛГ/),/в
= 1,..., iV}. Из того, чтоМ =Л/(С*, Хь ... ,XN) €^следует, что событие
/?м имеет место. Поэтому
2 Рт(Вм).
Очевидно, ?т(Вм) < A - б)я. Отсюда
2 PrEM)<U \(l-€)N<\Jt\(l-e)N.
Таким образом,
,е) = Рг{№,. .. ,ВД Н/(С, ЯГЬ .. • ,XN)>
<\Jl\(l-€)N<\Je\e-€N
1 а
При 7V> — (In \М | — In г?) имеем
6
что и требовалось доказать.
Следует заметить, что аналогичная оценка достаточного (для обучения)
объема представительной выборки получена из иных соображений в тер-
терминах распознавания образов в статье В.Н. Вапника и А.Я. Червоненкиса
"Об одном классе алгоритмов обучения распознавания образов" (Авто-
(Автоматика и телемеханика. - 1964. - № 6. - С. 937 - 945).
278
Введем обозначение
in\Je\
In2
Л
Подчеркнем, что К(Л)> вообще говоря, отличается от введенной в § 5
гл. VI и использованной в предыдущем пункте энтропии Hn(Jt) класса
М, измеряемой двоичным логарифмом числа всюду определенных ФВ,
реализуемых механизмами из UP. Неравенство A2), переписанное в виде
1
показывает, что чем меньше 3C(Jt), тем меньше достаточный объем выбор-
выборки 58, гарантирующий малый дефект прогноза:(т. е. порождающий
ошибочные значения ФВ на малом числе предъявлений). Наоборот,чем ши-
шире класс JC механизмов выбора, тем больше требуется информации для
удовлетворительного прогнозирования ФВ на ненаблюдаемых предъяв-
предъявлениях.
Величина Ж(Л) существенно зависит от используемого метода М пост-
построения механизмов выбора, и без указания метода М она не может быть
подсчитана. Если метод Л/ таков, что построенным с его помощью разным
механизмам М соответствуют различные функции выбора С^(*), то
3C(J$) =#иМ0 (где Нп(М) - энтропия класса JC,см. § 5 гл. VI или п. 4.2
гл. XII). Это условие выполнено, например, для механизмов выбора по би-
бинарному отношению. Для них величина ЗС совпадает с энтропией Нп клас-
класса механизмов. В общем случае имеет место неравенство
Напомним (в обозначениях из § 5 гл. VI) оценки энтропии для некоторых
классов механизмов выбора:
Нп (МпОМП) - п 2п~1,
- n2log2n< Hn (ПсОМП) <rt2log2/i,
4 лг—
Нп (ПрОМП) - V— 2п'х.
7Г
#„(ОМП)~я2.
Энтропия класса механизмов оптимизации по произвольному бинарному
отношению равна п2, а энтропия класса механизмов оптимизации по стро-
строгому или слабому порядку асимптотически приближается величиной
п Iog2/i.
Классы МнОМП, ПсПрОМП и ДрОМП являются универсальными и
постановка задачи прогнозирования механизмами этих классов лише-
лишена практического смысла. Однако, если ограничить у схем МнОМП число
шагов г, то энтропия #„(т-ОМП) оценивается величиной [57]
#„(т-ОМП)<2т+1+ги2
279
и при малых г задачи синтеза и прогноза функций выбора становятся дос-
достаточно конструктивными.
4.4. Приведем пример выявления механизма выбора М из некоторого
класа JC механизмов, позволяющего восстановить полную функцию выбо-
выбора по частичной.
Рассмотрим случай, когда класс М механизмов состоит из бинарных от-
нолений - слабых или линейных порядков. Конкретный механизм М,
реализующий концепцию выбора в задачах изучаемого класса, должен быть
восстановлен по результатам наблюдений за решениями эксперта (ЛПР)
на представительной выборке предъявлений или по некоторому архиву,
хранящему опыт рациональных решений некоторого подмножества задач из
рассматриваемой проблемной области.
Ситуации, в которых механизм выбора принадлежит классу бинарных
отношений, характерен для многокритериальных задач. Формальные под-
подходы к решению таких задач обычно сводятся к оптимизации вектора
критериев по бинарному отношению, отражающему предпочтения ЛПР.
Пусть в результате наблюдения за решениями экспертов (ЛПР) введено
упорядочение на выборке значений целевого вектора в допустимых точках
Х( Е X, Результаты наблюдений позволяют построить орграф Г с ^верши-
^вершинами, отвечающими целевым векторам выборки. Орграф определяет не-
неполное бинарное отношение R на множестве значений вектора-критерия
/(*) = {// (*) ) Л= 1 • Орграф используется для построения индикатора
соответствующего слабого порядка. Этот индикатор может быть затем
распространен на множество всех значений целевого вектора, отвечающих
допустимым решениям задачи.
Построение индикатора существенно упрощается при достаточно ес-
естественном предположении о наличии среди индикаторов искомого бинар-
бинарного отношения линейной формы.
пусть/*={/,*>Г=1 ={//(**)>?>/> = {/{>Г=1 М/Н*/)>7 -
две вершины орграфа Г, *Г/* предпочтительней/' по отношению Л. В при-
принятых предположениях это означает, что существует линейная форма
т
X ctfi такая, что
/ = 1
т , т
2 <¦,/*> 2 cj\. (¦)
Рассмотрим систему линейных неравенств вида (¦), где к, j пробегают
номера всех пар вершин графа Г, соединенных ориентированным ребром.
Решение системы линейных относительно с/ неравенств может быть получе-
получено стандартными методами линейного программирования. Функция
т
? с///(х)может теперь рассматриваться как искомый индикатор бинарного
/ i
отношения на множестве значений вектора {/Д*)}/^ г V х Е X Решение
многокритериальной задачи сводится, таким образом, к вычислению опти-
оптимального плана задачи традиционного математического программирования
*//()-> max
= 1
280
Выбор предельно упрощается, если предъявление X состоит из конечно-
конечного числа вариантов.
Решение системы неравенств (*) может оказаться тривиальным: сх = ...
... = ст = 0. Чтобы избежать этого, достаточно в правую часть хотя бы одно-
одного из неравенств системы добавить положительный свободный член (напри-
(например, +1) • Выбор неравенства, в которое добавляется свободный член, опре-
определяется содержательным смыслом задачи: оно отвечает таким / и к9
что Xj заведомо предпочтительнее варианта хк.
§ 5. Синтез многошаговых схем выбора
5.1. Как уже указывалось, при реальных значениях я, N, е, т? вряд ли
можно восстановить по результатам наблюдений схемы МнОМП с не малым
числом шагов. Кроме того, вычислительная сложность решения задач
МнОМП быстро растет с увеличением числа шагов. В связи с этим возникает
проблема аппроксимации ФВ функциями, реализуемыми схемой МнОМП
с малым числом шагов.
Ниже приводятся без доказательств полученные до сих пор результаты
по син*езу и аппроксимации ФВ простейшими схемами МнОМП. Они сфор-
сформулированы и доказаны в [57] и в цитированных там источниках.
Задача синтеза схем МнОМП состоит в том, чтобы по заданной ФВ
С( • ) G 2° построить реализующую ее схему. Синтез схемы обычно произ-
производится на основе реально наблюдаемого выбора. Поэтому функция С(Х)
может быть задана не на всех предъявлениях, а на некотором подмножестве
S С 2е. Такую функцию С(Х), X G 58 будем записывать-в виде (С, 58)
и называть частичной, а при 58 = 2 е — полной. Для частичной ФВ усло-
условие, характеризующее класс 2°, записывается в виде
((зхеЗЗ)хес(Х))л({х} е53)=>
Таким образом, в задаче синтеза по частичной ФВ (С,53) Е 2° требуется
построить многошаговую схему S, для которой С$(Х) = С(Х), X G58.
По уже упомянутым соображениям практический интерес представляют
одно- и двухшаговые схемы ОМП и частный случай задачи ОМП- задача
безусловной оптимизации (БО)
OptR(X) \XCG.
Если множество допустимых предъявлений ограничено множеством
$С 2е, то задача БО записывается в виде
Оптимизацию и допустимость по бинарному отношению можно, вообще
говоря, понимать в любом из указанных в § 1 смысле. Однако для более
компактного изложения нам удобно будет в этом лараграфе (там, где не
оговорено противное) понимать под Opt^CJ) и AdmRtU(X) оптимиза-
оптимизацию и допустимость по блокировке.
В случаях, когда исследуемые ФВ не представимы простейшими схема-
схемами МнОМП, будем рассматривать приближенные реализации (аппроксима-
(аппроксимации) ФВ в классах этих схем.
281
5.2. Напомним некоторые определения из § 5 гл. III.
Мажорантой (минорантой) частичной ФВ (С, 53) называется всякая пол-
полная функция С* (соответственно С»), для которой С*(Х) Э С(Х), X Е58
(соответственно С.(Х) С С(Х), X е 58).
Верхней (нижней) аппроксимацией ФВ (С, 58) на классе 2 полных ФВ
называется функция Св ? Q (соответственно Сн G Q) такая, что для любой
мажоранты С* & Q (миноранты С*€ Q) выполнено: V X Съ(Х) С С*(Х)
(соответственно VX Сн (X) Э С*(Х)).
Подчеркнем, что включения СВ(Х) Э Сн (X) иС*(Х)Э С*(Х) гаранти-
гарантируются только для X €= Si.
Нижняя (верхняя) аппроксимация в классе Q существует не всегда.
Поэтому вместо нижней (верхней) аппроксимации часто приходится до-
довольствоваться "неулучшаемыми" максимальными минорантами (мини-
(минимальными мажорантами). Миноранта С**Е СФВ (С59) называется макси-
максимальной в классе Q, если не существует миноранты С* € Q, С* Ф С* *, такой,
что VX С**(Х) С СЩ(Х). (Соответственно мажоранта С**(Х) Е Q ФВ
(С 58 ) называется минимальной в классе Q, если не существует мажоранты
С е Q,C* ФС*\ такой, что \fX С**(Х)ЭС*(Х).) Максимальные мино-
миноранты и минимальные мажоранты могут определяться неоднозначно.
Рассмотрим следующие три пары задач синтеза и аппроксимации.
al) синтез частичных ФВ, представимых схемами безусловной оптимиза-
оптимизации (БО) (случай (С, 58) ё БО),
а2) аппроксимация произвольной ФВ функциями из класса БО (случай
^)
61) синтез ФВ, представимых схемами ОМП (случай (С, 58) Е ОМП),
62) аппроксимация произвольной ФВ функциями из класса ОМП (слу-
(случай (С58) ? ОМП),
в1) синтез ФВ, представимых двухшаговыми схемами ОМП (случай
(С,58)е2-ОМП),
в2) аппроксимация произвольной ФВ функциями из класса 2-ОМП
(случай(С,58)^2-ОМП).
5.3. Приведем результаты, относящиеся к задаче синтеза ФВ, представи-
представимых схемами БО, и к задаче аппроксимации ФВ (С, 58) $ БО.
Обозначим ФВ, представимую бинарным отношением R, через CR (X).
Пусть (С$) - произвольная частичная ФВ на множестве G = { 1, 2,...
°
Введем множества
2,-= U X,
и построим отношение блокировки R, положив
^ = ^X2^ , A3)
где GR (i) означает { / | jRi У . Имеет место. v
Георема 3. Если (С, 53) € БО, то С реализуется отношением R, т.е.
С(Х)=С&(Х),Хе®.
Свяжем с ФВ (QS8) отношение доминирования R:
называемое выявленным отношением Самуэлсона.
282
Л V . Л v
Легко видеть, что R = Ra (отношения R и К двойственны). Отсюда вы-
вытекает известный факт, доказанный Рихтером.
Теорема 3 . Если (С, S3) Е БО, то С реализуется выявленным отношени-
отношением Самуэлсона.
Имеет место следующее необходимое и достаточное условие реализуе-
реализуемости частичной ФВ схемой БО.
Теорема 4. ФВ (CySB) G БО тогда и только тогда, когда
V/ vxe® iec(X) «*
Необходимое и достаточное условие реализуемости полной ФВ схемой
БО было приведено в теореме 1 гл. IV. Повторим его здесь для замкнутос-
замкнутости изложения.
Теорема 5. Полная ФВ С Е БО тогда и только тогда, когда она обладает
свойствами наследования
VJT, Y (XC Y)=>C(X)DC(Y)CiX
и согласия
V.Y, Y C(XU Y)DC(X)nC(Y).
Пусть теперь ФВ (С,8д) Ф БО. Приведем результаты, устанавливающие
возможности приближенной реализации ФВ в классе БО. Имеет место:
Теорема 6. Для любой ФВ (С,3d) существует верхняя аппроксимация в
классе БО. Она реализуется отношением блокировки R A3) (а также
отношением доминирования R, представляющим собой выявленное отно-
отношение Самуэлсона).
Нижняя аппроксимация произвольной ФВ существует не всегда.
Теорема 7. Нижняя аппроксимация ФВ (С, 53) в классе БО существует
в том и только в том случае, когда
где отношение блокировки R, реализующее нижнюю аппроксимацию,
когда она существует, определяется формулой
В тех случаях, когда нижней аппроксимации не существует, вместо нее
используют какую-либо максимальную миноранту. Метод нахождения всех
максимальных минорант приведен в [57].
5.4. Обсудим результаты, относящиеся к синтезу одношаговых схем
ОМП для частичных ФВ (С,ЗВ), представимых такими схемами, и к аппрок-
аппроксимации ФВ (С,$) $ ОМП. Будем называть класс ФВ, представимых схе-
схемами ОМП, классом ОМП.
Пусть G* С. G — некоторое подмножество вариантов. Назовем продол-
продолжением отношения RG> C_G' X G' на множество G отношение
RG>tGCGXG:(itj)eRG,G~(i,j)eRG,.
Свяжем с множеством G* отношение блокировки WG > С G X G:
\ jeG\G'}, A4)
являющееся слабым порядком. Сопоставим произвольной (не обязательно
283
из 2°) ФВ (С, 58) множества
U XUli), iGG,
и введем отношение блокировкиRG' С G' X G', положив
GkG.{i)=G'V% t€G'. A5)
Кроме того, построим по ФВ (С,59) последовательность множеств
и обозначим через G*""* результат стабилизации этой последовательности,
т.е. G*"~* = G$~', где s определяется из условия G *~ ] = g?~'.
Положим G(+) = G\G(-). Имеет место
Теорема 8. Если ФВ (С, S3) € ОМП, то она реализуется схемой ОМП вида
TjjfiRG(+)G - продолжение отношения A5) npnGf = G^+^; WG(+) полу-
получено по фо'рмуле A4), w - произвольный вариант из G^+*.
Пусть теперь ФВ (С>В) $ ОМП. Возникает вопрос об аппроксимации
(С, 83) функциями из класса ОМП. Оказывается, в классе (МП >ie сущест-
существует ни верхней, ни нижней аппроксимаций. Можно, однако, строить верх-
верхние аппроксимации в ослабленном смысле.
Пусть G' С G. Обозначим через <?'-ОМП класс полных ФВ, реализуемых
схемами ОМП, в которых: множество допустимых вариантов совпадает с
G' (т.е. ПиАЛпд v (G) = G'). Будем называть верхнюю аппроксима-
р р р
цию в классе G'-ОМП верхней G '-аппроксимацией. Если она существует,
то она единственна.
Для ФВ (СЯ) имеет смысл рассматривать верхние G'-аппроксимации,
лишь если G Э G@), где
G(o) = W
Имеет место
Теорема 9. Для любого G' Э G*0* верхняя G'-аппроксимация ФВ
(С, ЗЭ) в классе ОМП существует и задается схемой
Opt;* (Z)|Z- Adm^ (JT),
где ^G# c - продолжение отношения A5), H^G# построено в соответст-
соответствии с A4), и -вариант изG#.
Назовем почти точной верхней аппроксимацией в классе ОМП полную
ФВ С' такую, что для любой мажоранты С* ФВ (С,$) и любого неодно-
неодноэлементного предъявления X С\Х) Э С'(Х). Поскольку в одноэлемент-
одноэлементных предъявлениях проблем с выбором не возникает, то почти точная верх-
верхняя аппроксимация может использоваться в качестве верхней. Имеет
место
284
Теорема 10. Верхняя G-аппроксимация является почти точной. Она полу-
получается безусловной оптимизацией по RG, т.е. С9(Х) = Cg (X).
Назовем сужением ФВ (С, 58) на множество G9 CG функцию (С1,5В1)
на множестве G9, где
= ( Л
AT ЦГ'еЭГП Gf
Обозначим сужение через (С,58)G#.
Построение нижней аппроксимации и максимальных минорант ФВ (С,58)
в классе ОМП сводится к соответствующим конструкциям для ее сужения
(С,58) (+ч в классе БО и может быть проведено намеченными выше
методами.
Имеют место следующие утверждения.
Теорема 11. Нижняя аппроксимация ФВ (С, Ж) в классе ОМП сущест-
существует тогда и только тогда, когда существует нижняя аппроксимация С^
в классе БО функции (С, 58) ,+х. При этом, если С^ реализуется отноше-
отношение jR r+v С G *+* X G **\ то нижняя аппроксимация ФВ (С,5В) в классе
ОМП реализуется схемой
°Р*« ,rt B)|Z = Adtn^ (X), A6)
где R (.x - продолжение отношения Л ,.v, W ,.ч построено в соот-
GiA>\ G . G^+J G^ '
ветствии е A4) 9 и — произвольный вариант из G <+*.
Теорема 12. Между максимальными минорантами в классе ОМП ФВ
(С,5В) и максимальными минорантами в классе БО ее сужения (С,58.) (+,
gv '
имеет место взаимно однозначное соответствие. При этом, если максималь-
максимальная миноранта функции (С, 58.) ,+ч реализуется некоторым отношением
R (+v, то соответствующая ей максимальная миноранта ФВ (С, SB) реали-
реализуется схемой ОМП A6).
5.5. Приведем теперь результаты, относящиеся к задаче синтеза ФВ, пред-
ставимых схемами 2-ОМП, и к задаче аппроксимации ФВ(С, 58) ? 2-ОМП.
Имеет место
Теорема 13. Если ФВ представима двухшаговой схемой ОМП, т.е. если
(С, 58) 6 2-ОМП, то она может быть реализована двухшаговой последова-
последовательной схемой.
Однако выяснение вопроса, содержится ли ФВ (С, 58 ) в классе 2-ОМП,
при немалом числе вариантов в G связано с трудностями. Из результата
[53] следует, что этоЖФ-полная задача. Тем более сложной задачей являет-
является синтез двухшаговой схемы. Можно ожидать конструктивных подходов,
по-видимому, лишь к синтезу относительно частных двухшаговых схем.
285
Пусть, например, известно, что наблюдаемая ФВ (С,SB) G 2-ОМП может
быть получена при помощи двухшаговой схемы (не известной нам), в кото-
которой на втором шаге оптимизация производится по качественному отноше-
отношению R о .В этом случае реализация ФВ в классе 2-ОМП может быть
проведена эффективно.
Пусть С'(Х) = С% (X) — почти точная верхняя аппроксимация функ-
Л Л
ции (Cf Si) на классе ОМП (см. теорему 10). Образуем ФВ CC.S), где
$={* \X=C'(X\ XG®}, C(f)= а П С(Х),
X | X = С\Х)
и в соответствии с теоремой 8 построим по ней схему ОМП. Име^т место
Теорема 14. Если ФВ (С, 58), реализуется двухшаговой схемой, в кото-
которой R о является качественным порядком, то она реализуется двухшаго-
двухшаговой последовательной схемой, полученной приписыванием схем ОМП
для С1 и(С,«).
Пусть теперь ФВ (С, 58) ? 2-ОМП. В силу того, что пересечение и объеди-
объединение полных ФВ из 2-ОМП не обязательно содержится в 2-ОМП, в классе
2-ОМП не существует ни верхней, ни нижней аппроксимации (утвержде-
(утверждение 18 из гл. III). Тем самым построение приближенных реализаций таких
ФВ в классе 2-ОМП усложняется^
Для построения приближенных реализаций ФВ в классе 2-ОМН может
оказаться полезной следующая
Теорема 15. Если ФВ С\, С2 ? ОМП, то последовательная двухшаговая
схема, полученная приписыванием друг к другу схем для С% и С2, реали-
л л
зует ФВ С, удовлетворяющую включениям Сх (X) Э С(Х) ЭС2(Х) для
всех X, для которых Сг (X) ЭС2(Х).
Пусть теперь требуется реализовать ФВ (С, © ). Примем в качестве Сх и
С2 ее мажоранту и миноранту в классе ОМП. Тогда VJT E5B будут вы-
выполняться соотношения Сх (X) Э С(Х) Э С2 (ЛГ). В соответствии с теоре-
л
мой 15 ФВ С также будет удовлетворять соотношениям
СЛХ) э с{Х) э с2(Х), хеЯ,
и при подходящем выборе мажоранты и миноранты может оказаться "близ-
"близкой" к (С, 58). В качестве С% естественно выбирать почти точную ап-
аппроксимацию, а в качестве С2 — одну из максимальных минорант.
§ 6. Функции выбора на компактном множестве вариантов
6.1. Основные результаты настоящей главы (теоремы 1 и 2) о реализа-
реализации произвольной ФВ схемой МнОМП доказаны для дискретного случая,
когда ФВ задана на конечном множестве G вариантов. Эти результаты мо-
могут, однако, быть распространены (но уже как приближенные с оценкой
погрешности) на произвольные ФВ, заданные на компактном множестве G.
286
Оказывается, для любой ФВ, заданной на произвольном множестве <7,
можно V е > 0 построить 6-аппроксимацию, для которой существует
реализующая ее схема МнОМП. Задача упрощается в случае выпуклого
компактного множества G и ФВ с выпуклыми предъявлениями. Ниже об-
обсуждаются оба эти случая. В п. 6.2 рассматривается непрерывный выбор
на компактном множестве, а в п. 6.3 - выпуклый выбор на выпуклом
компакте.
6.2. Непрерывный выбор на компактах.
Пусть G — компакт в Еп, являющийся замыканием связной области,
K(G) — семейство всех связных компактных подмножеств С, а С( •) —
функция выбора на G, т.е. С(): K(G) -+K(G), С(Х) С X, { ХФ Ф) =*
=> {С(Х)Фф)и С( •)непрерывна в метрике Хаусдорфа. Под е-аппрокси-
е-аппроксимацией Се(Х) функции выбора С(Х) будем понимать ФВ Cf():
K(G) ^K(G) такую,что VXGK(G) РХ(С(Х), Се(Х)) < е.
Будем предполагать, что С( *) определена и непрерывна на K(SD), где
3) — параллелепипед с гранями, параллельными координатным плоскостям.
Имеет место
Теорема 16. Для функции выбора С( *) и Ve > 0 существует схема
МнОМП, реализующая некоторую ее е-аппроксимацию.
Дoкaзaтeльqтвo. В силу компактности 3) семейство К B)) явля-
является компактным в метрике Хаусдорфа. Поэтому Ve > 0 36 (е) > 0 та-
такие, что
pAX, Y) < Ь (е) => p(C(X)f C(Y)) < — \IXt
* x л
Зафиксируем е>0 и положим€i
Произведем последовательность сечений 30 (а вместе с ним и G).
Шаг 1. Проведем через центр тяжести 2) сечение, параллельное плос-
плоскости jcw_i =0.
Исходный параллелепипед Sb разбивается на два: 3H и 3)%. Соответ-
Соответственно G разбивается на два подмножества: 2H n G, S)x ft G.
Ш а г 2. Проведем через центры тяжести 2Hи ^ сечения, параллель-
параллельные координатной плоскости jcw_2 = 0. Получим 4 множества: 2)Оо» 2)оь
®ю> 2)ц- Соответственно G разбивается на 4 подмножества: G П 2)Оо>
Шаг/:. Имеем 2*~! множеств вида 2)Л л^.л^ , где /% G {0, 1}.
Проведем через их центры тяжести сечения, параллельные координатной
плоскости хп_к = 0 лри к < п и xn__modn(k) = 0 при к > п. Таким образом,
для каждой точки х G 2) получим последовательность содержащих ее вло-
вложенных подмножеств:
Й) ЗЗ) > Z) 3 5) ч 3 П 7^
Поскольку diam 3)и н л, = diam 2), то д: является единственной
2
точкой пересечения последовательности вложенных компактов A7).
287
diam2)
Зафиксируем к такое, что < ех. Обозначим через Nk множест-
f—1
2
во двоичных дробей с к знаками после запятой. Если г G Nk имеет вид
О, hxh2... hk> то 3)hi hi...hfc будем обозначать через Я)г. Построим отобра-
отображение
, xeSOr).
Л
Определим на множестве &{Nk) всех подмножеств Nk функцию С():
(
о, *,*;...*
Очевидно, что <р( • ) монотонно, т.е.
Тогда имеем:
С(ЛГ) (С( U Я)г))Я<р( U
Л
Таким образом, С( •) - дискретная функция выбора на #*.
При фиксированном & функция С( -) однозначно определяется функ-
функцией выбора С( * ). Для С( • ) по теореме 1 существует реализующая ее
схема МнОМП. Построим по функции С( •) функцию Се( • ):
U 3)Г)ПХ
Оценим в метрике Хаусдорфа расстояние между С(Х) и С€(Х):
( и
РЛС( U »ДС( U Dr)OJf)). О»)
х (Х) (ДГ)
В силу непрерывности С( •) и выбора А: имеем
p(Xf U SDr)<et
х е(Х)
и первое слагаемое в A8) меньше et. Поскольку X С U 3)г и
diam S)r < et VrG <р(ДО> то и второе слагаемое в A8) также меньше €i.
Следовательно,
Рх(С(Х),Се(Х))<2€г<€.
Поэтому Св() является €-аппроксимацией функции выбора С().
6.3. Выпуклый выбор на выпуклых компактах.
Пусть G — выпуклый компакт в Еп.
Обозначим через K(G) семейство всех компактных подмножеств G,
а через U(G) - семейство всех вьшуклых компактных подмножеств G.
Пусть С( •) - функция выбора на G с выпуклыми предъявлениями, т.е.
С(Х)^Х \fXeil(G).
288
_ Будем считать, что С( •) определена на более широком множестве
U(G, г) - на замыкании т-окрестности G, т.е.
С(): K(U(G,t))->K(U(G,t)).
Положим, кроме того, что С( •) непрерьюна в метрике Хаусдорфа
Рх (
р (т?, ?) = max { maxp(,y, ?), max р(х, т?)}
х e e*
и является выпуклым выбором на U(G, r), т.е.
С(Я) ? лг V*G n(?/(G, г)).
Введем определение. _ __
Отображение Q( •): II<J7(G, r)) -* II(l/(G, г)) назовем е-аппроксима-
цией функции выбора С( * ), если
V*G U(U(G, г)) рх(С€(I), CW)< *..
Дли выпуклого выбора на выпуклых компактах утверждение 16 дока-
доказывается проще, чем для общего случая непрерывного выбора на компак-
компактах. Значительно проще и построение е-аппроксимации ФВ. Приведем
соответствующие рассуждения.
Ш соответствии с теоремой Бляшке (см. ХадвигерГ. Лекции об
объеме, площади поверхности и изопериметрии. — М.: Наука, 1966, а также
Макаров и Рубинов [32]) снабженное метрикой Хаусдорфа семейство
П ($2) всех компактных подмножеств компактного множества ?2 также
компактно. Это значит, что множество K(U(G, r)) компактно и функция
выбора
равномерно непрерывна на K(U(G, r)). Поэтому для любого фиксирован-
фиксированного е > 0 существует 6 > 0, не зависящее от X, такое, что
V* YeK(U(G,T)).
Положим €\ = min f — ,5, г j и зафиксируем некоторую ei-сеть St
на U(G, т).
Поставим в соответствие каждому предъявлению ДГ€ I1(G) выпуклый
многогранник Ge(X) с вершинами в точках в!-сети S% такой, что X Я
хЩ
Обозначим через С( *) дискретную функцию выбора на Sl9 определен-
определенную следующим образом:
С(Х) = ех Св(С(со ДГ)) П X VXSSt,
где ехК - множество крайних точек К.
Функция С( *) однозначно определяется функцией выбора С( -) при
фиксированной ег -сети St. Для нее по теореме 1, как для функции выбора
на конечном множестве вариантов, существует реализующая ее схема
МнОМП.
19. Д.Б. Юдин 289
По функции выбора С() на дискретном множестве вариантов по-
построим функцию С€():
С€(Х) = со C(G€(X) П St) VXe 1I(C).
По определению Ge(X) множество co(Ge(X) П 5t) совпадает с
Поэтому
С6(ЛГ) = со G€(C(G€(X))) = Ge(
Имеем:
Px(G€(C(G€(X))lC(X)) <Px(G€(C(Ge(X)))>
-у + у =6.
Следовательно, однозначно восстанавливаемая по функции выбора
С( •) на дискретном множестве вариантов функция Се( •) является е-ал-
проксимацией исходной функции выбора С( •).
6.4. В заключение параграфа и главы отметим, что функция выбора пред-
представляет собой многозначное (множественно-множественное) отображение
и в нетривиальных случаях не может быть представлена удобной аналити-
аналитической (формульной) записью или компактной таблицей. Естественное
представление функций выбора (или классов функций) - аксиоматическое
описание их свойств.
Дальнейшее развитие исследований должно привести- к процедурам
принятия решений по аксиоматически сформулированныу свойствам
функции выбора, отражающим приемлемую для лиц, принимающих ре-
решение, концепцию понятия "компромисс". Представляется, что четкая
постановка и анализ такой проблемы придадут новый импульс разверты-
развертыванию работ по теории и методам принятия решений в многокритериаль-
многокритериальных задачах, при групповом выборе и в конфликтных ситуациях.
ЗАКЛЮЧЕНИЕ
1. Основные главы книги, в которых изучаются различные вычислитель-
вычислительные процедуры принятия решений в сложных ситуациях, рассчитаны глав-
главным образом на математиков-вычислителей. Заключение хотелось бы
ориентировать на лиц, принимающих решения, на прикладников, заинтере-
заинтересованных в перспективах повышения эффективности принятия решений
при многих, порой противоречивых требованиях к выбору, при необходи-
необходимости согласовывать интересы участников переговоров, которые руковод-
руководствуются различными шкалами ценностей.
Подчеркнем, что на намеченные здесь предложения следует смотреть
скорей как на некоторую программу исследований, вытекающую из со-
современного состояния теории принятия решений, чем на изложение аргу-
аргументированных рецептов.
Жизнь человека, коллектива и общества в целом — сплошная цепь реше-
решений. Многие решения, особенно личного характера, принимаются инстинк-
инстинктивно и при соблюдении требований "здравого смысла" слабо сказываются
на состоянии лица, принимающего решение, и на его окружении. Иное дело
производственные и социальные решения - особенно в нестандартных
ситуациях.
Чем интенсивнее взаимосвязи в коллективе, тем более сильное влияние
на судьбу коллектива приобретает решение каждого его члена. Когда в тес-
тесной комнате скапливается много людей, трудно шагнуть, чтобы не на-
наступить при этом кому-нибудь на ногу.
Рациональное решение — это слаженная работа коллектива, соответствие
проекта своему назначению, эффективное управление, достижение до-
договоренности и разрешение конфликта. Чем выше на иерархической лест-
лестнице располагается лицо, принимающее решение, тем серьезней могут
оказаться последствия принятого решения. Выбор решения в сложных
ситуациях требует научной поддержки.
2. Можно считать, что подходы к принятию решений оформились как
самостоятельная дисциплина, точней, как межнаучная проблема, во второй
половине нашего века. В результате исследований, проводимых математика-
математиками, психологами, экономистами и социологами, возникли две ветви этой
дисциплины — теория принятия рациональных решений (математическая
теория выбора решений) н психологическая или поведенческая теория
выбора. Первая из них требует ответа на вопросы "что следует называть
19* 291
рациональным решением?" и "как принимать рациональные решения?".
Вторая теория отвечает на вопросы "как в действительности люди прини-
принимают личностные и организационные решения?" и "какие ошибки они при
этом совершают?".
Серьезные последствия принятых решений во многих ответственных
ситуациях заставляют задумываться над синтезом разных ветвей теории
принятия решений. При построении математической теории необходимо
учитывать выявленные психологические особенности личности. Важно
также, чтобы строго аргументированные выводы математической теории
решений стимулировали с помощью соответствующих механизмов
организацию воспитания и образования, культурные и законодатель-
законодательные акты.
Целесообразность применения математики в психологии в настоящее
время общепризнана. Гораздо меньше внимания уделяется учету влияния
психологических фактов в формальных системах поддержки принятия
решений. Стоит в связи с этим напомнить, что, обсуждая аналогичные
проблемы синтеза принципов нейрологии и вычислительной техники,
Джон фон Нейман подчеркивал, что "... изучая нейрологию, можно узнать
о машинах гораздо больше, чем узнать о нейрологии, изучая машины".
Следует полагать, что взаимное проникновение методологии и резуль-
результатов математической и психологической теорий принятия решений -
необходимое условие эффективного согласования целей, Провозглашае-
Провозглашаемых обществом, и практических решений, принимаемых исполнительной
властью на разных уровнях. Синтез выводов математической и психологи-
психологической теорий поможет наметить пути устранения расхождений между
словом и делом, между призывами и действиями. 4
3. Каждая постановка задачи принятия решения предполагает, что извест-
известны цель или множество целей выбора, заданы условия, которые вы-
выделяют область допустимых решений, и имеется некоторая информация
об интересах лиц, участвующих в выборе. Интересы лиц, принимающих
решения, естественно, могут различаться между собой.
В случае, когда цель выбора одна, и интересы лиц, участвующих в вы-
выборе решения, совпадают, принципиальных трудностей нет. Подготовка
решения связана с техническими трудностями, обусловленными слож-
сложностью поиска компонент * решения, которое удовлетворяет условиям
задачи и обеспечивает (с погрешностью, не превышающей заданную) до-
достижение цели. Проблемы появляются, когда целей несколько, или инте-
интересы лиц, принимающих решение, не совпадают. В подобных ситуациях
далеко не всегда существуют объективные соображения, позволяющие од-
однозначно произвести рациональный выбор. Субъективные элементы -
шкалы ценностей лиц, принимающих решение, - играют в таких случаях
важную, если не решающую роль.
В сложных технических, экономических и социальных проблемах приня-
принятие решений связано с концептуальными и вычислительными трудностями.
Большой объем информации, которую нужно учитывать, заставляет решать
подобные задачи на нескольких уровнях. Выбор по необходимости становит-
становится иерархическим. На верхнем уровне определяется, что следует в заданных
условиях считать рациональным выбором. Объектами выбора здесь являют-
являются такие обобщенные понятия, как функция выбора или аксиоматически
292
определенные категории "компромисс", "равновесий", "справедливость"
применительно к условиям изучаемого класса задач.
На последующих этапах требования к компромиссному выбору уточня-
уточняются (дезагрегируются). Окончательное решение принимается на послед-
последнем этапе (на низшем уровне) в терминах объектов или действий, подлежа-
подлежащих выбору.
В обсуждаемой схеме процесса принятия решений предполагается, что
для каждого конкретного класса задач выбора должны разрабатываться
(вначале на содержательном, а затем и на формальном уровне) возмож-
возможные требования к понятию "компромисс". Лицо, принимающее реше-
решение, должно отобрать из них те требования, которые с его точки зрения
определяют рациональный выбор. Формально требования к выбору форму-
формулируются в виде множества аксиом, любые непротиворечивые наборы ко-
которых отражают возможные определения понятия "компромиссное", "рав-
"равновесное", "рациональное" решение в задачах соответствующего класса.
В неформальных терминах социальных задач глобального масштаба подоб-
подобные системы аксиом - это конституции, кодексы законов, нормы поведе-
поведения, принятые обществом.
В каком-то смысле можно смотреть на мировую литературу, да и на
всю человеческую культуру в целом, как на выражаемые теми или иными
средствами взгляды на понятие "справедливость", существовавшие в раз-
различные эпохи, для различных классов и у разных народов.
Ясно, что ведущую роль в разработке понятия "рациональный выбор"
должны играть специалисты, обладающие знаниями и опытом в соответ-
соответствующем классе прикладных задач. Роль математика здесь ограничена
формализацией требований к выбору, исключением логических противоре-
противоречий и оценкой последствий, к которым приводит та или иная аксиоматика,
определяющая справедливое решение. Это крайне сложные и тонкие задачи.
Дело в том, что изменение некоторых нюансов в аксиомах рационального
выбора может приводить к совершенно неожиданным и неоправданным
решениям. Исследование возникающих здесь проблем - одна из основных
задач теории выбора.
4. Рассмотрим двухуровневую систему принятия решений. На верхнем
уровне формируется концепция выбора, способствующая принятию реще-
ния в интересах системы в целом. При необходимости разрабатывается
также набор допустимых мероприятий, воздействующих соответствующим
образом на предпочтения (шкалы ценностей) лиц, принимающих решение
на нижнем уровне.
ЛПР верхнего уровня выбирает из предъявляемого ему множества
наборов аксиом — требований к рациональному выбору — набор непроти-
непротиворечивых аксиом, отвечающих (по его мнению) интересам системы. Каж-
Каждый такой набор, определящий понятие "компромиссное решение", по-
порождает класс функций выбора на множестве объектов, подлежащих
сравнению и оценке.
Накопленный опыт и неформальные знания, фиксируя рациональный
выбор на некотором Ограниченном множестве предъявлений, сужают класс
функций выбора, удовлетворяющих аксиоматически установленной кон-
концепции рациональности, и при необходимости корректирует требования
к "справедливому" компромиссу.
293
Мы уже знаем, что произвольной функции выбора соответствует меха-
механизм выбора - многошаговая схема обобщенного математического
программирования. Этот механизм позволяет точно или, по крайней мере,
с любой заранее заданной степенью точности реализовать решения, рацио-
рациональные с точки зрения накопленного опыта и обусловленные функцией
выбора или породившей ее системой аксиом.
Возможны различные подходы к построению механизма выбора на ниж-
нижнем уровне. В принципе механизм может быть реализован в виде автомата,
системы программ для ЭВМ или предписаний для исполнителей.
В этом случае решение на нижнем уровне полностью отвечает установлен-
установленным требованиям к рациональному выбору. Такая система выбора реше-
решений носит, однако, административный характер и не использует человече-
человеческий фактор на уровне исполнителей.
Механизм выбора на нижнем уровне может быть также реализован в
виде некоторой организационной структуры - управляющего органа
с участием лиц, принимающих решение. Их личные предпочтения зачастую
не согласованы с интересами системы, сформулированными на верхнем
уровне. При такой реализации процесса принятия решений вышестоящий
ЛПР должен не только определить понятие "рациональный выбор", но и
позаботиться о корректировке предпочтений ЛПР нижнего .уровня и о
согласовании их с интересами системы. Такой механизм выбора решений
демократичен. Он так или иначе учитывает предпочтения всех лиц, участ-
участвующих в принятии решений. Однако организация согласованной про-
процедуры выбора в этом случае значительно сложней. Одна из причин, услож-
усложняющих процесс принятия согласованного, решения, — необходимость
защиты от манипулирования (от преднамеренного рассогласбвания реше-
решения в интересах отдельных лиц, участвующих в принятии решения). Под-
Подробный обзор работ по манипулированию выбором и методам защиты от
манипулирования содержится в [25].
В каждом фиксированном классе проблем управления конкретные
условия принятия решений определяют подходящую процедуру выбора
и соответственно распределение задач между ЛПР и автоматом.
5. Принятие решений на нижнем уровне может проводиться по раз-
разным схемам — при непосредственном сравнении объектов, подлежащих
выбору, или при сравнении тех или иных векторов их характеристик.
Формальные аналоги этих схем - математическое программирование в
порядковых шкалах и обобщенное математическое программирование.
При автоматизированном решении задачи, когда концепции рациональ-
рациональности, установленной на верхнем уровне, приводится в соответствие реа-
реализуемый на ЭВМ формальный механизм выбора, можно обеспечить один
и тот же результат при работе по любой из указанных схем. Предпочтения
на множестве объектов однозначно индуцируют предпочтения на множестве
векторов-критериев, характеризующих объекты. Бели же механизм выбора
на нижнем уровне реализован в виде некоторого управляющего органа и
решение принимают люди, то разные схемы будут, как правило, приводить
к разным результатам. И чем сложнее задача, тем большим может оказать-
оказаться расхождение между решениями, отвечающими разным постановкам.
Выбор по непосредственному сравнению объектов может существенно
отличаться от выбора, основанного на сравнении векторов-характеристик
294
объектов. Объясняется это, в частности, тем, что, как бы тщательно ни
выбирались характеристики объектов, информация о векторах-критериях
качества решения дает неадекватное описание объектов выбора. Некоторая
информация об объектах теряется при описании их набором характеристик,
и некоторая информация, не имеющая непосредственного отношения к
сравниваемым объектам, привносится при этом в модель. Кроме того, вы-
выбор подходящей системы критериев качества в известной мере субъективен.
Но не в этом главная причина расхождения результатов выбора при
использовании управляющим органом разных схем принятия решения.
Главное, но-видимому, в том, что человеческое мышление не приспособ-
приспособлено эволюцией к естественному с формальной точки зрения переходу
от предпочтений на множестве объектов к предпочтениям на множестве
наборов их характеристик.
В зависимости от специфики решаемой задачи и психологических осо-
особенностей и практического опыта ЛПР для него более привычным и в не-
некотором смысле более объективным может оказаться либо выбор по не-
непосредственному сравнению объектов, либо по сопоставлению векто-
векторов-критериев.
При постановке задачи в терминах обобщенного математического
программирования выбор вектора критериев существенным образом
сказывается на решении. Непродуманная система показателей, спущенная
планирующим органом предприятию, может стимулировать решения, не
отвечающие интересам общества. Если, например, среди показателей, по
которым оценивается выполнение плана металлообрабатывающего пред-
предприятия, содержится вес сданного металлолома, то администрация не
будет заинтересована во внедрении металлосберегающей технологии, со-
сокращающей отходы металла в стружку.
6. Заметим, что в предлагаемых на страницах монографии вычисли-
вычислительных методах выбор на любом уровне (как это следует из описанных
в предыдущих главах процедур принятия решения) происходит в прсщессе
диалога между специалистом по математической теории решений и ЛПР
соответствующего уровня.
Чем более мощным оказывается множество допустимых решений и чем
выше размерность сравниваемых векторов, тем больше потребуется эле-
элементарных актов диалога для того, чтобы выявить функцию выбора или
предпочтения ЛПР и получить таким образом решение требуемого качества.
Обычно множество объектов, из которого производится выбор, существен-
существенно шире множества наборов характеристик объектов. Кроме того, раз-
размерность вектора критериев обычно гораздо ниже размерности вектора,
идентифицирующего объект выбора. Чем выше уровень принятия ране-
ранений, тем более обобщенными характеристиками оперирует ЛПР, тем короче
диалог, определяющий выбор. Это как раз и согласуется со степенью ответ-
ответственности и дефицита времени лиц, принимающих решение на разных
ступенях иерархической системы управления.
Следует полагать, что на верхнем уровне, где выбору подлежит концеп-
концепция рациональности решения в изучаемом классе ситуаций, число заранее
подготовленных специалистами аксиом, из которых должна быть отобрана
непротиворечивая система свойств компромисса, будет относительно не-
невелико. Следовательно, можно надеяться, что ответственному ЛПР, осна-
295
щенному системой математической поддержки принятия решений, которая
позволяет оценивать возможные последствия выбора, удастся выразить
свое отношение к концепции рациональности за приемлемое время.
7. Приведенные рассуждения аргументируют следующий подход к вы-
выбору рационального решения в сложных ситуациях.
Вначале формируется частичная функция выбора, отражающая накоплен-
накопленные знания и опыт принятия рациональных решений в изучаемом классе
ситуаций. Для пополнения частичной функции выбора разрабатывается
(в содержательных, а затем и в формальных терминах) множество ак-
аксиом - интуитивно приемлемых возможных свойств понятия "рациональ-
"рациональный выбор-' в рассматриваемом классе задач принятия решений. На следу-
следующем этапе в результате диалога специалиста по теории принятия решений
с ЛПР из исходного множества аксиом выделяется некоторое подмноже-
подмножество - логически непротиворечивая система аксиом, характеризующая
точку зрения ЛПР на концепцию рациональности в изучаемом классе проб-
проблем и согласованная с исходной частичной функцией выбора. Каждой не-
непротиворечивой системе аксиом отвечает функция выбора или некоторое
множество функций выбора. Произвольной функции выбора можно при-
привести в соответствие многошаговую схему обобщенного математическо-
математического программирования - механизм, обеспечивающий рациональный (с точ-
точки зрения ЛПР) выбор решения.
Каждый из перечисленных этапов подготовки решения связан со слож-
сложными математическими задачами. Одна из наиболее ответственных и тру-
трудоемких задач заключается в следующем.
Прежде чем предъявлять ЛПР множество аксиом — возможных требо-
требований к понятию "рациональный компромисс", необходимо их тщательно
исследовать и выяснить, не приведут ли безобидные и, на первый взгляд,
вполне естественные аксиомы к неожиданным и нежелательным выводам.
А такие случаи возможны.
Приведем и обсудим некоторые системы аксиом, выражающие возмож-
возможные требования к определению рационального группового решения в раз-
разных классах задач. В одном случае естественные, казалось бы, требования
приводят к парадоксальному выводу. В других случаях выбор, определяе-
определяемый аксиомами о рациональном компромиссе, соответствует накоплен-
накопленному опыту и интуиции. (В рассматриваемых примерах отсутствует пред-
предварительный этап, фиксирующий априорные знания и опыт.)
8. Первый пример известен под названием парадокса Эрроу. Ему по-
посвящена обширная литература. Мы приведем интерпретацию парадокса,
принадлежащую Экланду [58].
Пусть имеется вектор Я благ и требуется справедливо распределить его
между т членами общества. Каждый член общества понимает справедли-
справедливость по-своему в соответствии со своим предпочтением Rh i = 1, ..., т9
на множестве векторов распределений благ. Другими словами, каждый
индивидуум может указать для любой пары X и Y распределений благ
между членами общества, какое из них является для него более пред-
предпочтительным.
Задача заключается в установлении компромиссного (группового)
предпочтения RT9 отражающего общественное мнение по поводу "справед-
"справедливого" распределения благ.
296
Какие требования следует предъявить к "справедливому" групповому
решению?
Следующие аксиомы — свойства рационального группового предпочте-
предпочтения — представляются естественными.
I. Аксиома полноты. Групповое предпочтение RT должно быть полным
бинарным отношением, т. е. RT должно позволять сравнивать любую пару
X и Y распределений благ между членами общества и указывать более
предпочтительное из них, если таковое имеется.
П. Аксиома транзитивности. Групповое предпочтение X должно быть
транзитивным отношением: если X предпочтительней для общества, чем К,
a Yпредпочтительней Z, тб X предпочтительней Z:
(XRT Y) Л (YRTZ)\*> XRTZ.
Ш. Аксиома определенности. Групповое (общественное) предпочтение
RT должно полностью определяться набором индивидуальных предпочте-
предпочтений R( членов общества
RT = &(Ri9... ,Rm).
IV. Аксиома единогласия. Бели все члены общества предпочитают рас-
распределение к распределению Y, та и для общества X предпочтительней Y:
У ft XRtY=>XRTY.
V. Аксиома независимости. Результат сравнения распределении X и Y
не зависит от того, какие еще возможны распределения вектора благ
между членами общества. Формально, пусть Rf и Л/, / = 1,.. . ,т, два
семейства индивидуальных предпочтений, a RT = &(R\,... ,Rm) и RT =
= SP(Ri, 1.., Rm) - соответствующие групповые предпочтения; тогда
Другими словами, результат сравнения любой пары распределений не за-
зависит от контекста выбора.
Все сформулированные аксиомы представляются вполне естественны-
естественными. Тем не менее из них вытекает следующее неожиданное утверждение.
Аксиомы I-V не противоречивы в том и только в том случае, если об-
общественное предпочтение RT совпадает с индивидуальным предпочтением
Rf одного из членов общества.
Это утверждение назьюается в литературе парадоксом Эрроу, а условие,
при котором аксиомы I — V совместны — правилом диктатора.
И.Экланд [58], обсуждая возможности согласования индивидуальных
и групповых интересов, замечает, что легче согласовать идеи, Чем потреб-
потребности. Проще добиться единогласия в политике, чем в экономике.
Участники экономической системы эгоистичны, и не существует естествен-
естественного приспособления их потребностей друг другу.
Наиболее критичной аксиомой среди перечисленных свойств рациональ-
рационального коллективного выбора является аксиома V — аксиома независимости.
Оказывается, имеет место следующее утверждение.
Если выполняются требования I—IV, то существует правило формировав
ния группового предпочтения по индивидуальным предпочтениям, отлич-
отличное от правила диктатора. Однако при этом не удовлетворяется аксиома
независимости (аксиома V).
297
В последние годы появился ряд работ (см., например, [45, 96]), позво-
позволяющих в какой-то мере ослабить (но не устранить) эффекты, связанные
с парадоксом Эрроу.
Приведенные рассуждения показывают, сколь осторожно нужно подхо-
подходить к установлению свойств рационального компромисса. Система аксиом
рационального выбора должна удовлетворять дополнительным требовани-
требованиям, которые, в частности, обеспечивают устойчивость определяемого аксио-
аксиомами компромисса.
9. Рассмотрим теперь другой пример аксиоматического определения
требований к рациональному групповому выбору. Приведенный ниже
набор аксиом конструктивен и служит основанием для построения меха-
механизма выбора.
В теории принятия решений (в частности, в теории группового выбора)
часто возникает необходимость в определении понятия "близость" между
упорядочениями. Обсудим пример аксиоматического определения рацио-
рационального согласования индивидуальных и группового упорядочений.
Достаточно естественным свойством такого согласования может быть
минимальное отклонение "справедливого" группового упорядочения от
индивидуальных упорядочений. Все дело в том, как определить "метрику"
в пространстве упорядочений - "расстояние" между упорядочениями.
Ниже под упорядочениями будем подразумевать бинарные отношения Л,
матрицы || Гц || которых удовлетворяют следующим свойствам:
1) Г0я+1,О или-1,
2)ty = -r/7,
3) если Гу>0 и /у* > О, то rik > О, причем г# = О только, если Гц =
В [19] сформулированы следующие требования к рациональному оп-
определению "расстояния" d(RltR2) между упорядочениями Ri и R2 на
конечном множестве объектов.
Аксиома L d(R t, Л* ) > О, причем d(R \,R2) = Q тогда и только тогда,
когда /?i = R2.
Аксиома DL d(R и ** ) e d(R2, R i).
Аксиома Ш. d(jRuR2) +d(R2,Rz) > d(Rt ,A3) (неравенство треуголь-
треугольника), причем равенство достигается в том и только в том случае, когда
iR2J *=* *)/1)+ *^3)> 0, где rfj1) и г^3) - элементы матриц для Rx и R3.
Второе условие в аксиоме III содержательно означает, что R2 лежит на
"прямой", соединяющей R1hR$.
Аксиомы -1—III, - это обычные требования, предъявляемые к любой
"метрике". . ,
Аксиома JV. 'Тасстояние" не зависит от переименования объектов. Если
упорядочения Rx и R2 получены из R\ hR2 одной и той же перестановкой
объектов, то
d(RlfK2)*d(Rl9R2).
Аксиома V. Если два упорядочения совпадают на всех парах объектов,
кроме некоторого подмножества 5 пар объектов, то расстояние между
любыми двумя упорядочениями на множестве всех пар объектов совпа-
совпадает с расстоянием между этими упорядочениями на подмножестве S.
298
Аксиома VI. Минимальное положительное расстояние между двумя
упорядочениями равно единице.
(Последняя аксиома используется лишь для масштабирования - для
выбора единицы измерения расстояний.)
Оказьюается, что аксиомы I—VI единственным образом определяют
"расстояние" между упорядочениями Rx и R2. Имеет место утвержде-
утверждение [19]:
d(RuR2)=j S Ir^-r^l.
В [75, 76, 79, 80, 95] рассматривались несколько иные системы аксиом
и предъявлялись другие требования к бинарным отношениям. Соответ-
Соответственно получены видоизмененные выражения для "расстояния" в прост-
пространстве упорядочений.
Полученный результат может быть использован для постановки и анали-
анализа различных задач теории принятия решений. В частности, он определяет
возможные цодходы к групповым решениям. Как уже указывалось, Пред-
Представляется вполне естественным, что рациональное с точки зрения коллекти-
коллектива упорядочение должно быть наименее отклоняющимся от индивидуаль-
индивидуальных упорядочений членов коллектива. Согласимся с тем, что "расстояние"
между групповым и индивидуальными упорядочениями удовлетворяет
аксиомам I—VI. Тогда выбор "справедливого" группового упорядочения
Яг по индивидуальным упорядочениям Л/, / = 1,..., т, сводится к реше-
решению следующей задачи дискретного программирования:
т
2 <f(Rr-?f)-»inin|J?r€/>.
Формальная запись выражения для области D фиксирует тот факт, что
искомая матрица || r\j || упорядочения ЯТ упоЪпетортъуатъню&1)+3).
10. Приведем еще один пример непосредственногоп^ехода от системы
аксиом, определяющих понятие "рациональное решение", к описаняв? соот-
соответствующего механизма принятия решега^^Нт!Я|Цб^^^азд№ю^оо1эт?з6ва-
ния интересов и мнений при определении коэффициента трудового участия
членов бригады в работе коллектива.
Эффективность бригадной форм!>1 организащда т^гда^ существенно
зависит от того, й какой мере оплата труда будет, по 1л*снию шенов бри-
бригады, определяться их рудовым акладом^ Ш^^
трудового участия (КТУ) представляет собой задачу группового выбора.
Опишем предлагаемый в [18] аксиоматический подход кд "Справедливо-
"Справедливому" установлению КТУ (предполагается, что размер оплаты тцуда про-
участвуют в определении КТУ каждого }
1
венно считать, что 0 Кк^ < J, Щ,Лц **1 °Vf.. Задаад_группрврго выоора
299
заключается в построении отображения, переводящего матрицу К = || kif ||
индивидуальных решений в вектор к = (кг,'..., ?т) группового решения.
В [18] сформулированы следующие требования (аксиомы) к рациональ-
рациональному преобразованию F.
I. Аксиома универсальности. Отооражение F определено для любых
(лХт)-матриц ^ = 11^11, 0<Л/у<1, 2 Л/у = 1 V/.
П. Аксиома инвариантности. Если вектор к = (кг, 1.., )fcm) определяет
групповое решение — результат применения отображения F к матрице К,
то вектор 0к при любом 0 > 0 также является групповым решением.
) т
(В дальнейшем будем считать, что 2 fc/ = 1.)
1
Ш. Аксиома независимости. Бели все участники выбора не меняют свое-
своего выбора относительно КТУ какого-либо члена бригады, как бы ни скла-
складывались их мнения относительно других работников, то не меняется и
групповое решение о КТУ этого работника.
Формально аксиома независимости формулируется следующим образом.
Если при изменении матрицы К = || ki}- Ц остается неизменным /-й столбец,
то не меняется и /-й элемент вектора к группового решения. Отсюда
следуем, что отображение F матрицы К = || кц || 9 вектор к = (к\,..., кт)
может быть заменено набором частных отображений Ff каждого столбца
матрицы || кц || в соответствующий элемент к{ вектора к группового ре-
решения.
IV. Аксиома равноправия. Все члены бригады равноправны относитель-
относительно процедуры выбора, т.е.
Л( •)-*¦¦.-ib(-)-
V. Аксиома единогласия. Если все участники выбора дают одну и ту же
оценку некоторому члену бригады, то эта же оценка сохраняется и в груп-
групповом решении. « ; . .
VI. Аксиома симметрии. Все участники выбора (члены совета бригады)
равноправны.
Имеет место следующее утверждение.
При выполнении аксиом I-VI КТУ ft/ /-го члена бригады, определяемый
групповым решением, совпадает со средне-арифметическим значением
коэффициентов кф установленных каждым из участников выбора,
1 "
*У = — 2 кц.
В [18] рассматривается более общий случай, не требующий выполнения
аксиомы VI (симметрии). Аксиомы I—V определяют целый класс допусти-
допустимых процедур группового решения.
I1. Рассмотренные выше примеры аксиоматического подхода к опреде-
определению рационального группового решения иллюстрируют возможности
построения механизма выбора по заданным требованиям к нему. Анало-
Аналогичным образом можно по аксиоматическим требованиям к концепции
"рациональности" строить функции выбора, отвечающие разным принципам
300
агрегирования показателей в многокритериальных задачах, тем или иным
подходам к согласованию интересов при групповом выборе и различным
определениям понятия "компромисс" в конфликтных ситуациях.
Концепция выбора — многогранная категория. Какие бы требования
ни предъявлялись к концепции рационального решения, всегда можно
ожидать, что, по крайней мере в отдельных ситуациях, появится необходи-
необходимость выяснить, удовлетворяет ли функция выбора некоторому дополни-
дополнительному свойству, естественному для рационального решения в этой си-
ситуации. Потребуется установить, вытекает ли это свойство из исходного
аксиоматического определения функции выбора и совместимо ли оно с
эшк аксиомами. Возникает вопрос, всегда ли это можно сделать, в какой
мере конечный набор аксиом может исчерпывающим образом охарактери-
охарактеризовать качество выбора? Другими словами, всегда ли знание аксиомати-
аксиоматически определенного принципа рациональности позволяет обоснованно при-
Теорема Гё'деля о неполноте системы аксиом дает основания дня сомне-
сомнений в существовании положительного ответа на этот вопрос. Гёдель пока-
показал, чт в широком классе достаточно богатых формальных систем всегда
найдется утверждение (назовем его утверждением X), истинность или лож-
ложность которого нельзя проверить, исходя из набора аксиом, определяющих
правила вывода (доказательства) "истинности" или "ложности" в системе.
Расширив набор аксиом, добавив к исходному набору еще одну (например,
аксиому об истинности утверждения X), получим новую систему аксиом,
в которой, однако, обязательно найдется другое утверждение Х\ невыво-
дамое из новой системы аксиом. Хотя расширенная система аксиом позво-
позволяет вывести больше истинных предложений, чем старая, тем не менее
всегда можно найти утверждения, недоказуемые и в новой системе аксиом.
Другими словами, не существует конечного набора аксиом, определяющих
правила логического вывода "истинности" утверждений, достаточного для
того, чтобы с его помощью вывести все истинные утверждения богатой
формальной теории.
Таким образом, самая страстная мечта Лейбница -о возможности соз-
создания такой вычислительной машины, которая могла бы решать все мате-
математические, а заодно и философские проблемы, - дказывается неосу-
неосуществимой.
Гёдель доказал свою теорему для аксиом арифметики (для системы
постулатов о свойствах целых чисел). Однако суть его утверждения перено-
переносится и на многие другие системы, удовлетворяющие некоторым вполне
правдоподобным допущениям. Имеются основания (правда, пока скорей
интуитивные, чем доказательные) ожидать, что и система принятия реше-
решений, определяемая аксиоматическими требованиями к функции выбора,
удовлетворяет этим допущениям. Многие математические проблемы могут
быть сформулированы в терминах выбора. Так, например, можно опреде-
определить функцию выбора, которая бы из любого конечного множества утверж-
утверждений арифметики выбирала истинные. Если бы эта функция была конечно
аксиоматизируемой, то отсюда следовало бы, что можно построить конеч-
конечную систему аксиом для арифметики. Но это противоречит теореме Гёделя.
Таким образом, существуют содержательные функции выбора, не допус-
допускающие полного описания с помощью конечного набора аксиом. Можно
301
думать, что эта ситуация имеет место и для функций выбора, возникающих
в задачах принятия решений. Другими словами, теорема Гёделя наводит
на мысль, что любая конечная непротиворечивая система аксиом рациональ-
рационального выбора неполна. Однако идея доказательства теоремы Гёделя не
может быть непосредственно использована дпя обоснования этой гипотезы.
Дело в том, что Гёдель, говоря о неполноте систем аксиом — фундаменте
формальных теорий, предполагает, что понятие "истинности" является
исходным и не связано с набором аксиом и правил вывода, используемых
для установления истинности или ложности утверждений теории. В теории
же рационального выбора не предполагается априорного задания понятия
"рациональность".
Тем не менее представляется, что утверждение о неполноте произвольной
непротиворечивой системы аксиом рационального выбора справедливо
Формальным основанием для такого вывода может служить близкое к
теореме Гёделя утверждение (доказанное Чёрчем) о неразрешимости
проблемы проверки истинности формул в исчислении предикатов.
Примем, что аксиомы, определяющие рациональный выбор, выделяют
класс функций выбора на достаточно богатом (по крайней мере счетном)
множестве предъявлений. Каждая аксиома рационального выбора обычно
записывается с помощью формулы исчисления предикатов (т.е. посредст-
посредством предикатов, кванторов и логических связок). Пусть имеется некото-
некоторый набор аксиом (формул) At,'..., Ак и пусть В - некоторое свойство
функции выбора. Свойство В может быть также представлено некоторой
формулой В исчисления предикатов: Требуется проверить, вытекает ли
свойство В из набора аксиом Ах,... >Ак и совместимо ли свойство В с
системой Al9•'... ,Ак. Проверка первого утверждения сводится к выясне-
выяснению истинности формулы А1 л ... л Ак ->?, а проверка второго утвержде-
утверждения - к установлению выполнимости формулы Л 2 л ... лАк л/^япи, что
то же самое, к проверке тождественной истинности формулы Ах v ...
...vAkvB).
Известно, что задача установления истинности формул в исчислении пре-
предикатов алгоритмически неразрешима. Это утверждение доказано и приме-
применительно ко многом более частным моделям. Общая схема принятия
решений весьма широка и, по-видимому, утверждение Чёрча справедливо
и для нее. Это значит, что невозможно построить регулярную процедуру,
позволяющую выяснить; обладают ли все функции выбора, заданные
системой аксиом, некоторым свойством В, рациональным с точки зрения
ЛПР, имеются ли в этом классе фушсций выбора такие, которые этим
свойством обладают, либо это свойство противоречит аксиомам. Конечно,
можно расширить исходную систему и ввести аксиому, постулирующую,
например, истинность (рациональность) свойства В. Но и в новой системе
аксиом ситуация повторится.
Таким образом, произвольная непротиворечивая система аксиом рацио-
рационального выбора неспособна обеспечить "достаточно исчерпывающее"
описание "рационального" выбора. Стало быть, в любой сколь угодно тща-
тщательно продуманной системе планирования или управления могут встре-
встретиться ситуации, когда решений, входящих в компетенцию верхнего уров-
уровня, окажется недостаточно для "рационального" выбора на нижнем уровне.
В таких ситуациях ЛПР на нижнем уровне будет вынужден дополнить
302
исходное аксиоматическое определение функции выбора требованием,
уточняющим понятие "рациональное решение". Другими словами, на лю-
любом уровне управления может возникнуть необходимость самостоятельно-
самостоятельного выбора ответственного решения. По-видимому, подобные ситуации
отнюдь не исключения. Их учет и определяет роль человеческого фактора
в планировании и управлении.
Итак, какими бы свойствами мы ни наделяли понятия "компромисс",
"равновесие", "справедливость", какие бы требования ни предъявлялись
к этим категориям, всегда найдутся ситуации, когда этих требований ока-
окажется недостаточно для решения вопроса о компромиссном, равновесном,
справедливом выборе.. Появится необходимость во введении дополнитель-
дополнительных свойств рационального выбора. И модификация требований к рацио-
рациональному решению может продолжаться сколь угодно долго. Говоря слова-
словами Пола Розенблюма, "Человеку никогда не избавиться от необходимости
пользоваться своим умом, сколько бы он ума ни приложил к этому".
ДОПОЛНЕНИЕ
теория принятая решений и синтез знаний
, 1. Вычислительные методы теории принятия решений, изложенные в
монографии, могут рассматриваться как конструктивная основа рациональ-
рационального выбора. Традиционно в теорию принятия решений включаются опти-
оптимизация по скалярному и векторному критерию, групповые решения и
разрешение конфликтов (теория игр). Число приложений этих дисциплин
все расширяется и охватывает в настоящее время большое количество задач
в технике, экономике и социальных науках. Все эти задачи так или иначе
связаны с установлением концепции выбора и построением вычислитель-
вычислительных методов реализации решения. Соответствующие понятия — функция
выбора и механизм выбора — позволяют с единой точки зрения подходить
к различным задачам планирования, управления, проектирования и ор-
организации.
Имеются основания ожидать, что некоторое обобщение этих понятий
позволит существенно расширить область приложения теории принятия
решений и использовать их в информатике, в теории искусственного интел-
интеллекта и в естественных науках. Речь идет о так называемой "инженерии
знаний" или, точнее, о "синтезе знаний".
Проблемы искусственного интеллекта и теории принятия решений
близки. Понятие "интеллект" собственно и подразумевает способность
принимать рациональные решения.
Исторически сложилось так, что языки теории принятия решений и
теории искусственного интеллекта различны. Если первая дисциплина
оперирует главным образом со строгими формальными понятиями, то
проблемы искусственного интеллекта обсуждаются в основном на нефор-
неформальном уровне. Однако в последние годы различие в подходах к этим
проблемам постепенно сглаживается.
В современной вычислительной технике и теории искусственного интел-
интеллекта понятие "база данных" совершенствуется и эволюционирует в "базу
знаний". Это новое понятие определяется пока главным образом на эври-
эвристическом уровне и существенно связано с рассматриваемой проблемной
областью и с конкретными способами приобретения, передачи и представ-
представления знаний. Известные подходы к представлению знаний посредством,,
например, системы продукций, фреймов, семантических сетей ограни-
ограничивают область применения базы знаний имеющимися техническими воз-
возможностями ее реализации. Архитектура экспертных систем определяет
304
структуру базы знаний и классы задач, для решения которых она может
быть использована.
2. По-видимому, целесообразно поставить вопрос о базе знаний шире -
четче определить это понятие и установить достаточно общие и гибкие
структуры фиксации и расширения знаний. Важно также разобраться в
требованиях, которые должны быть предъявлены к методам синтеза знаний
из разных источников, или знаний, характеризующих различные аспекты
одних и тех же явлений и объектов.
В теории принятия решений базу знаний естественно определить как
пару — функция выбора и реализующий ее механизм выбора. Напомним,
что функция выбора (ФВ) - это теоретико-множественное отображение,
сопоставляющее каждому предъявлению (заданному в терминах возмож-
возможных решений) рациональное решение.
Представляется, что формальная аналогия между многими проблемными
областями и классами задач принятия решений создает предпосылки для
определения базы знаний в соответствующих классах задач. Самые разно-
разнообразные проблемные области можно рассматривать как множества одно-
однородных (в том или ином смысле) задач или ситуаций, которые непосред-
непосредственно или с помощью некоторого преобразования записываются в тер-
терминах множества априорно возможных решений (реакций, гипотез, за-
закономерностей, диагнозов). Такие представления задач или ситуаций
класса будем называть предъявлениями. Цель исследования - выделить из
предъявлений подмножество рациональных решений (наиболее правдо-
правдоподобных гипотез, закономерностей, диагнозов, реакций) или, что то же
самое, построить ФВ на предъявлениях соответствующей проблемной
области.
В тех случаях, когда ситуации могут быть непосредственно выражены в
терминах множества априорных решений (или априорных реакций), есте-
естественно по аналогии с теорией принятия решений понимать под базой
знаний функцию выбора соответствующей проблемы.
В случаях, в которых не удаётся описать ситуации в виде предъявле-
предъявлений, можно расширить понятие ФВ. Обобщенная функция выбора (ОФВ)
содержит дополнительное преобразование, приводящее в соответствие
ситуациям класса некоторые предъявления (множества априорно воз-
возможных в этих ситуациях решений)
Традиционная теория выбора классифицирует ФВ и сопоставляет раз-
разным классам ФВ механизмы выбора. Ряд результатов классической теории
может быть расширен и перенесен на ОФВ. Для класса ОФВ, удовлетво-
удовлетворяющих условиям, аналогичным условиям наследования и согласия, могут
быть построены механизмы выбора и оценены объемы частичных ОФВ,
позволяющие восстановить полную ОФВ.
В терминах ОФВ и реализующих ее механизмов естественно опреде-
определить понятие "база знаний" дня многих классов задач, непосредственно
не связанных с теорией принятия решений. База знаний в некоторой проб-
проблемной области характеризуется парой - ОФВ (в относительно простых
случаях - ФВ) и реализующий ее механизм выбора. Упоминаемые в ли-
литературе эвристические определения базы знаний для частных способов
представления знаний укладываются в эту схему.
20. Д.Б. Юдин 305
3. В терминах ОФВ и отвечающих им механизмов выбора могут быть
и исследованы разнообразные задачи пополнения знаний и
новых знаний в результате согласованного объединения зна-
, поступающих от разных источников или отражающих разные аспекты
явлений. Будем называть такие задачи задачами синтеза зна-
знании. Ишнювн идеи синтеза знаний применительно к проблемным областям,
в коториж база знаний может быть определена в терминах традицион-
традиционная ФВ> В более сложном случае, когда для представления знаний необ-
необходима ОВД*, приведенные ниже принципы в основном сохраняются, хотя
ш гребут известного уточнения.
Будем называть задачу пополнения знаний от одного источника (пе-
(переход от частичной ФВ к полной ФВ) одномерной задачей синтеза, а за-
согяаеованного объединения знаний от п источников (порождение1
или установление правдоподобных гипотез) п-мерной зада-
задачей ааа^м знаний.
Некоторые формальные задачи одномерного синтеза при разных
допущениях о свойствах ФВ (представляющих знания) рассмотрены»
в § 2 (и. 2.5) главы Ш и § 4 главы XII. Результаты в этом направлении.
мтуж быть существенно расширены для различных проблемных областей
ж обобщены на случай, когда база знаний определяется в терминах ОФВ.
Пуск* теперь мы имеем две ФВ (или ОФВ), относящиеся к одной и
то* же или двум близким проблемным областям. Они соответствуют
источникам знаний по одной проблеме или разным аспектам од-
того же изучаемого объекта. Пусть эти ФВ С% (•) и С2 (•) заданы
вютвенно на множествах G\ и G2. Возникает вопрос, какие новые
ш (какую новую ФВ С(-)) можно при тех или иных условиях син-
на декартовом произведении G = G\ X G2 по ФВ, заданным
соответственно на G\ и G2. Ясно, что новые знания должны в существен-
существенном определяться заранее сформулированными условиями согласова-
согласования, шящщцрующими синтетическую ФВ С( ) по координатамФВС\ (•)
в теории принятия решений имеются многие логически-
интуитивно приемлемые определения таких понятий,
компромисс, справедливость. Точно так же рациональ-
доштадования при синтезе знаний определяются неоднознач-
иншуитивно рациональные условия согласования приводят,
иягшшски приемлемым гипотезам о новых закономерностях.
Пар* ФВ СцС*$ иС2(") вместе с условием согласования определяет
синтеза знаний. При определенных (достаточно есте-
«яиппивк координатных ФВ и условий согласования синте-
га G\ X G2 устанавливается по ограниченной инфор-
С2(). Разработка правил вычисления ФВ С(-) на
d (•) на Gi и С2 (•) на G2 и составляет предмет
е знаний.
образом определяется л-мерная задача синтеза знаний,
примеры рациональных с нашей точки зрения условий
(а) Есзшш предъявление X синтетической ФВ С() может быть пред-
ш вире декартова произведения предъявлений Хх иХ2 координат-:
ных ФВ Ci(-) иС2(), то С(Х) = С(Хг ХХ2) = Сг (ДГ,) ХС2(ЛГ2).В
противном случае С(ЛГС JTi ХЛГ2) 2 (Ci (*i) ХС2 (ЛГ*)) ПХ
(б) Некоторое уточнение условий (а) согласования состоят в том,
что в синтетический выбор включается все, что выбирается по воем коор-
координатным ФВ, и не включается то, что не выбирается ни по одной из коор-
координатных ФВ.
(в) Пусть X С G = Gi X G2 - предъявление синтетической ФВ С().
Обозначим
С! (У) = Рг-^ [С, (Pr^C/ (X))) Г\С( (X)
и, соответственно,
\
С? (X) = Рг? [С, (PrGi С2° (X))] П С2п (X).
Здесь Рг^У - проекция Y на А. Во введенных отображениях записывается
следующее интуитивно оправданное условие согласования:
С(Х)=С2'(Х)иС?(Х).
(г) Некоторая модификация условий (в) имеет вид
С(Х) СС(Х)С [С2' (X) U С/' (X)] U С (ЛГ),
где
С(Х) = [С, (РтОгХ)X С2 (PrGaX)} ПХ
Рассматриваются и другие более перспективные, но сложные в реали-
реализации принципы согласования. Получены достаточные условия, которым
должны удовлетворять ФВ, и принципы согласования, позволяющие по
ограниченной информации о координатных ФВ восстановить синтетиче-
синтетическую ФВ С{Х) или по крайней мере ее сечение (теоретико-множествен-
(теоретико-множественное отображение С. (Г) CC(X)VX CG).
5. В заключение уместно сделать следующие замечания.
В одномерном синтезе знаний - в задачах расширения и пополнения
знаний, отвечающих одной ФВ, вряд ли можно ожидать, что в обозримом
будущем экспертная система способна в сложных ситуациях подготав-
подготавливать "более эффективные" решения, чем опытный талантливый эксперт.
В многомерном синтезе знаний ситуация иная. Коммуникационные
барьеры в обмене информацией тормозят синтез знаний, которыми
обладают специалисты различного профиля. Эволюция жизни довела до
совершенства человеческий мозг, но мало преуспела в создании совершен-
совершенных форм согласования мнений и синтеза знаний в коллективах.
Имеются основания предполагать, что целенаправленный многомер-
многомерный синтез знаний проще организовать с автоматами фиксированной струк-
структуры и предсказуемым поведением, чем с неформально мыслящими людь-
людьми. Напрашивается вывод, что в сложных задачах синтеза знаний искус-
искусственный интеллект в обозримом будущем имеет более благоприятные
перспективы, чем живой мозг. Во всяком случае симбиоз мозга и схемы
многомерного синтеза знаний сулит ускоренное накопление знаний в
любой проблемной области, в которой его удастся реализовать.
20* 307
СПИСОК ЛИТЕРАТУРЫ
А. Цитируемая литература
1. Айзерман М.А. Некоторые новые задачи общей теории выбора: Обзор одного нап-
направления исследований // Автоматика и телемеханика. - 1984. - № 9.-С. 5-43»
2. Айзерман М.А, Малишевский А.В. Некоторые аспекты общей теории выбора.
Препринт. - М.: ИПУ, 1980.
3. Айзерман МЛ., Малишевский AS. Проблемы логического обоснования в общей
теории выбора: Общая модель выбора,и его классически-рациональные основа-
основания. Препринт. - М.: ИПУ, 1980.
4. Айзерман М.А, Малишевский АЛ. Проблемы логического обоснования в общей
теории выбора: Уровни и критерии классической рациональности выбора. Пре-
Препринт. - М.: ИПУ, 198Z
5. Айзерман М.А., Малишевский AJB. Проблемы логического обоснования в общей
теории выбора: Примеры анализа рациональности механизмов выбора. Препринт. -
М.: ИПУ, 1982.
6. Александров П.С. Введение в теорию множеств и общую топологию. - М.: Наука,
1977.
1\ Александров И.А., Анциферов Е.Г., Булатов В.П. К методам центрированных се-
сечений //Тезисы докладов конференции по математическому программирова-
программированию. - Свердловск, 1981. - С 72-73.
8. АаескеровФ. Т., Завалишин Н.В., Литваков БЖ О разложении функций выбор» па
системе более простых функций // Автоматика и телемеханика. - 1979. - № 3. -
С 107-118.
9» Алескеров Ф.Т., Завалишин КВ., Литваков Б.М. О разложении функций выбора
по системе интервальных.выборов // Автоматика и телемеханика. -1981. - № 7* -
С. 155-160.
10. Ащепков Л.Т., Белов Б.И., Булатов B.IL, Васильев О.В., Срочко В.А., Тарасе*
ко ЯД Методы решения задач математического программирования и оптималь-
оптимального управления. - Новосибирск: Наука, 1984. ,
IUБулатов В.П., Шепотько И.О. Метод центров тяжести ортогональных симплексов
для решения задач выпуклого программирования. Методы оптимизации и их при*
ложения. - Новосибирск: Наука, 1982. - С 79-84.
12. Бурбаки И. Общая топология. - М.: Наука, 1968.
13. Вагнер В.В. Теория отношений и алгебра частичных отображений // Теория полу-
полугрупп и ее приложения. Вып. 1. Изд-во Саратовского университета, 1965.-С 3-1781*
14. Вапник В.Н., Червоненкис А.Я. Теория распознавания образов. - М.: Наука, 1974.^
15. Вилкас Э.Й. Несколько замечаний о ситуации равновесия бескоалиционной игрц|
л лиц // Литовский мат. сб. - 1967. - Т. 7, № 4. - С. 583-587.
16. Воробьев ИМ. Основы теории игр. Бескоалиционные игры. - М.: Наука, 1984.
И.Данфорд Я, Шварц Т. Линейные операторы: Общая теория. - М.: ИЛ, 1962.
18. Каримов И.А. Экономико-математический анализ коэффициентов трудового учЩ
стая // В сб. Принятие оптимальных решений в экономических системах. - ГорШЙ!
кий:ГГУ, 1985.-С 33-39.
308
19. Кемени ДМ., Сиелл Дж. Кибернетическое моделирование: Некоторые приложе-
приложения* - М.: Сов. радио, 1972.
20. Кини P.JL, Райфа X. Принятие решений при многих критериях: предпочтения и за-
замещения. - М.: Радио и связь, 1981.
21. Киру та А.Я, Рубинов А.М., Яновская Е.Б. Оптимальный выбор распределений в
сложных социально-экономических задачах. - Л.: Наука, 1980.
22. Кузьмин В.Б. Построение групповых решений в пространствах четких и нечетких
бинарных отношений. - М.: Наука, 1982.
23. Курош А.Г. Лекции по общей алгебре. - М.: Наука, 1973.
24. Левин А.Ю. Об одном алгоритме минимизации выпуклых функций // ДАН СССР. -
1965. - Т. 160, № 6.-С. 286-290.
25. Летна ЗМ Манипулирование выбором вариантов: Теория агенды // Автоматика
и телемеханика.;- 1984. - № 4. - С. 5-22.
26. Литваков БМ. Механизмы выбора, использующие множественно-графовые струк-
структуры // Автоматика и телемеханика. - 1980. - № 9, - С. 145-152.
27. Литваков БМ. Аппроксимация функций выбора // I Всесоюзное совещание по
статистическому и дискретному анализу нечисловой информации, экспертным
оценкам и Дискретной оптимизации, Тезисы докладов. - М.- Алма*Ата: ВНИИТИ,
1981,-С. 342-343.
28. Литваков БМ. Аппроксимация функций выбора // Автоматика и телемехани-
телемеханика. ^ 1984. - №9,
29. Литваков БМ. Аппроксимация функций выбора на ограниченном множестве
предъявлений // Автоматика и телемеханика. - 1985. - № 2. - С. 124-129.
30. ЛъюсРЛ, Райфа X Игры и решения. - М.: ИЛ, 1961.
31. Макаров ИЖ, Винограбская ТМ.,Рубчинский АЖ, Соколов В.Б. Теория выбора
и принятия решений. - М.: Наука, 1982.
32. Макаров В.Л., Рубинов AM. Математическая теория экономической динамики и
равновесия. - М.: Наука, 1973.
33. Миркин Б.Г. Проблема группового выбора. - М,: Наука, 1974.
34. Наумов Т.Е. Существование оптимального выбора на компактном множестве
альтернатив // Автоматика и телемеханика. - 1985. - № 3. - С. 5-27.
35. Немировский А.С., ЮдинД.Б. Сложность задач и эффективность методов оптими-
оптимизации. - М.: Наука, 1979.
316. Немировский А. С Об одном алгоритме типа Кармаркара // Изв. АН СССР. Тех-
Техническая кибернетика. - 1987. - № 1. - С. 105-118.
37. Фон Нейман Дж., Моргенштерн О. Теория игр и экономическое поведение. - М.:
Hayiqfc, 1970.
3$. Шкаидо X. Выпуклые структуры и математическая экономика. - М.: Мир, 1972.
39. НурмиНский КА„ Андрусенко Н.К, Стецюк П.И. О новом полиномиальном алго-
алгоритме линейного программирования // Кибернетика. - Киев: Наукова думка,
ДО$> с; 118-120.
40. Подиновский В.В., Ногин В.Д. Парето-оптимальные решения многокритериаль-
многокритериальных здшч. - М.: Наука, 198?.
41. Риге Щ. Бинарные отношения, замыкания, соответствия Галуа // Кибернетический
сборник. -1963.- №7.
42. СмаллШРЖ Принцесса или тигр. - М.: Мир, 1985.
43. Сунпес #„ Зинес Дж. Основы теории измерений // Психологические измерения. -
М.: Мир, 1967.
44. Тангян А.С. Модели социального выбора с конечным и бесконечным числом уча-
участников. Препринт ЦЭМИ АН СССР. - М.: 1979.
45. Тангян АС. Агрегирование в модели социального выбора. Препринт ЦЭМИ АН
СССР.-М.: 1979.
46. Фишберн #. Теория полезности для принятия решений. - М.: Наука, 1978.
47. Фрумкин М.А. Систолический вычислитель для решения задач линейного програм-
программирования // Изв. АН СССР. Техническая кибернетика. - 1988. - № 1. - С. 51 -
59.
48. Хачиян Л.Г. Полиномиальный алгоритм линейного программирования // ДАН
СССР. - 1979. - Т. 244, № 5. - С. 1093-1096.
49. Хачиян Л.Г., Тарасов СП., Эрлих ИМ. Метод вписанных эллипсоидов // ДАН
СССР. - 1987. - Т. 298, № 5. - С. 1081-1085.
309
50. трейдер Ю.А. Равенство, сходство, порядок. - М.: Наука, 1971.
51. Шоломов Л А. Логические методы в задачах согласованного выбора. Препринт
ВНИИСИ. -М.:1978.
52. Шоломов Л А. Применение логических методов в задачах последовательного
выбора. Препринт ВНИИСИ. - М.: 1980.
53. Шоломов JLA. Логические методы композиции функций выбора. Препринт
ВНИИСИ. -М.: 1981.
54. Шоломов ЛА. О сложности одного механизма выбора со свойством универсаль-
универсальности // Труды ВНИИСИ. - 1984. - № 11. - С. 63-68.
55. Шоломов Л.А. Оценка сложностных характеристик одного механизма выбора с
участием нескольких лиц // Изв. АН СССР. Техническая кибернетика. - 1985. -
№2.-С. 3-13.
56. Шоломов ЛА., Юдин ДБ. Сложность многошаговых схем обобщенного матема-
математического программирования // Изв. АН СССР. Техническая кибернетика. -
1988. -№1. - С 13-22.
57. Шоломов ЛА., Юдин ДБ. Синтез многошаговых схем выбора // Автоматика и
телемеханика. - 1986. - № 10. - С 115-126.
58. Экланд И. Элементы математической экономики. - М.: Мир, 1983.
59. Юдин АЛ, Цой Э.В. Линейное программирование в порядковых шкалах // Изв.
АН СССР. Техническая кибернетика. - 1984. - № 1. - С 15-19.
60. Юдин АЛ, Цой Э.В. Задача обобщенного выпуклого программирования с линей-
линейными предпочтениями // Изв. АН СССР. Техническая кибернетика. - 1985. -
№ 1. - С. 34-41.
61. Юдин АЛ. Методы согласования потребительских предпочтений с технологиче-
технологическими и ресурсными возможностями общества // Межвузовский сборник. Ана-
Анализ и моделирование экономических процессов. - Горький: Изд. ГГУ, 1987.-
С.5-14.
62. Юдин ДБ. Математическое программирование в порядковых шкалах // Изв. АН
СССР. Техническая кибернетика. - 1982. - № 2. - С. 3-16.
63. Юдин ДБ. Вычислительные методы многокритериальной оптимизации // Изв.
АН СССР. Техническая кибернетика. - 1983. - № 4. - С. 3-16.
64. Юдин ДБ. Методы обобщенного выпуклого программирования и оценка их тру-
трудоемкости // ДАН СССР. - 1983. - Т. 272, № 1. - С. 40-43.
65. Юдин Д.Б. Обобщенное математическое программирование // Экономика и мате-
математические методы. - 1984. - Т. 20, вып. 1. - с. 148-167.
66. Юдин ДБ., Немировский А.С Оценка информационной сложности задач матема-
математического программирования // Экономика и математические методы. - 1976, -
Т. 12, вып. 1. - С. 128-142.
67. Юдин Д.Б., Немировский А.С. Информационная сложность и эффективные реше-
решения выпуклых экстремальных задач // Экономика и математические методы, -
1976. - Т. 12, вып. 2. - с. 357-369.
68. Юдин ДБ., Горяшко А.П., Немировский А.С. Математические методы оптимиза-
оптимизации устройств и алгоритмов АСУ. - М.: Радио и связь, 1982.
69. Юдин ДБ., Шоломов ЛА. Многошаговые схемы обобщенного математического
программирования и функции выбора // ДАН СССР. - 1985. - Т. 282, № 5. -
С 1065-1069.
70. Юдин ДБ., Шоломов ЛА. Обобщенное математическое программирование и
функции выбора // Изв. АН СССР. Техническая кибернетика. - 1985. - № 3. -
G 3-16.
71. Юдин ДБ., Цой Э.В. Модели обобщенного математического программирования с
произвольными бинарными отношениями // Изв. АН СССР. Техническая кибер-
кибернетика. - 1987. - № 1. - С. 24-37.
72. Юдин ДБ., Цой Э.В. Обобщенное выпуклое программирование // Экономика и
математические методы. - 1988. - № 5.
73. Arrow Я/. Rational choice functions and orderings //Econometrica. -1959.- V. 26. -
P. 121-127.
74. Bland R.G., Go Id farb D., Todd M.G. The ellipsoid method // A survey Operations Rese-
Research. - 1981. - V. 29,No 6. - P. 1039-1091.
75. Bogart K.P. Preference structures. I. Distances between transitive preference relations
//Math. SodoL - 1973. - V. 3. - P. 49-67.
310
le.Bogart K.P. Preference structures. II. Distance between asymmetric relations // SIAM
J. AppL Math. -1975. - V. 29,No 2. - P. 254-262.
77. ChernoffH. Rational selection of decision functions // Econometrics - 1954. -No22.
78. (Ни РЖ, Murray W., Sounders MJL, Wigth М.И. A numerical investigation of ellipsoid
algorithm for largescafe linear programming // Proc. of a IIASA workshop "Large-
Scale Linear Programming9' B-6 June 1980) / Eds G.B. Dantzfe; М.АЛ. Dempster,
MJJCaffio. - Laxenburg: IIASA, 1981. - P. 487-509.
79. Cook W.D., Setfbrd LM Priority ranking and consensus formation // Manag. Sci -
1978. - V. 24,Npl6. - P. 1721-1732.
80. Cbok WJ)., Krees M. Ordinal ranking with intensity of preference // Manag. Sci -
1985. - V. 31.Nol. -P. 20-32.
bX.Debree G. Representation of Preference ordering by a numerical function // Decision
Processes. - New York, 1954.
82. Debree G. Theory of Value. - New York, 1959.
bZ.Fbhburn P. Representfebfe choice function // Econometrics - 1976. - V. 44,No5. -
P. 1033-1043.
84. Hkaguchi Г. On the dimension of partially ordered sets // Sci Rep. Kanazawa Uni-
University. -1951. -V. 1. - P. 2.
85. Hoeffding W. Probability inequalities for sums of bounded random variables // Ame-
American Statistical Assoc Journ. March. -1963. - P. 13-30.
86. Jamhon D.T., Lou J.JL Semiorders and the theory of choice // Econometrica. - 1973. -
V.4i,No$. -P. 901-912.
87. Karmarkar N. A new polynomial-time algorithm for linear programming // Combina-
torioa. -1984. - V. 4,No4. - P. 373-395.
88. Schroder E. Vorfesungen uber die Algebra der Logik: Ш. Algebra und Logik der Rela-
Relative. - Leipzig: Teubner, 1895.
89.&ft A.K. Choice functions and revealed preference// Rev. boon. Studies. - 1971. -
V. 38,3A15).-P. 307-317.
90. Sen AIL Social choice theory: A re-examination // Econometrica. - 1977. - V. 45,
Nol.-P.J21-127.
91. Uzawa H. A note on preference and axioms of choice // Annals of the Institute of Sta-
Statistical Mathematics. - 1956. -No 8.
92. Wehrung G. Interactive Identification and Optimization Using a Binary Preference Re-
Relation // Oper. Res, - 1978. - V. 26. - P. 2.
93. Whtteheod AN., RauelB. Principia Mathematka. - Cambridge University Press, 1910.
94. Yamnitsky В., Levin LA An old linear programming algorithm runs in polynomial
time // 23rd Annual Symp. Found. Comput. Set Chicago III, 3-5 Nov. - Sehrer Spring,
1982. - P. 327-328.
95. Yofing H.P. An axiomatization of Borda's rub // J. Econom. Theory. - 1974. - V. 9,
Ndl.-P.43-52.
96. FUhburn P. Arrow's Impossibility Theorem: Coucise Proof and Infinite Voters // Journ.
Ec. Theory. -1970. - V. 2, No 11.
Б. Дополнительная литература по задачам и методам теории принятия
решений
ЭТ.Айзершн М.А., Алескеров Ф.Т. Задача Эрроу в теории группового выбора // Ав-
Автоматика и телемеханика. - 1983. - № 9. - С. 104-129.
9Ь.Айзерман М.АГ Алескеров Ф.Т. Функциональные локальные операторы в теории
голосований. 1-Ш // Автоматика и телемеханика. - 1984. - № 5. - С 79-88;
1984. - № 6. - С 105-114; 1984. - № 1, - С 108-120.
99. Алескеров Ф.Т. Формальные модели построения коллективных решений // II
Всесоюзная конференция по статистическому и дискретному анализу нечисловой
информации и экспертным оценкам. - М.: ВИНИТИ, 1984. - С 10-20.
100. Бедельбаев АЛ., Дубов Ю.А., Шмульян B.JL Адаптивные процедуры принятия
решений в многокритериальных задачах // Автоматика и телемеханика. - 1976. -
№ 1.-С 136-145.
101. Белкин А.Р., Левин ММ Комбинаторно-графовые модели обработки информации
при принятии решений. - М.: Научный совет по комплексной проблеме "Кибер-
"Кибернетика" АН СССР, 1985.
311
102. Бенайон Р., Ларичев О.И., Монголъфье Ж, Терпи Ж. Линейное программирование
при многих критериях: Метод ограничений // Автоматика и телемеханика. -
1971. -№ 8. -С. 108-114.
103. Березовский Б. А., Борзенко В.И., Кемпнер Л.М. Бинарные отношения в много-
многокритериальной оптимизации. - М: Наука, 1981.
104. Березовский Б.А., Травкин СИ. Модель многокритериальной оптимизации ^до-
^доминирующим показателем // Автоматика и телемеханика. - 1981. - № 4. -
С. 142-146.
105. Бондарева ОМ. О теоретико-игровых моделях в экономике. - Л.: Изд-во ЛГУ,
1974.
106. Борисов В.И. Проблемы векторной оптимизации // Исследование операций: Мето-
Методологические аспекты. - М.: Наука, 1972.
107. Борисов А.Н.,ЛевченковА.С. Интервальные метопы оценки решений. - Рига: Зи
натне, 1982.
108. Борисов А.Н., Алексеев А.В., Крумберг О.А. и др. Модели принятия решений на
основе лингвистической переменной. -Рига: Зинатне, 1982.
109. Ватель И.А., Ерешко Ф.И. Математика конфликта и сотрудничества. - М. Знание,
1973.
110. Вилкас ЭЛ. Многоцелевая оптимизация // Мат. методы в социальных науках.
1 Вып. 10. - Вильнюс: Изд. ин-та математики и кибернетики АН ЛитССР, 1976. -
С 9-17.
111.Вилкас Э.Й., Маймишс КЗ. Решения: теория, информация, моделирование. - М.:
Радио и связь, 1981.
112. Виноградовы ТМ. Среднее значение числа неподчиненных решений в многокри-
многокритериальных задачах // Изд. АН СССР. Техническая кибернетика. - 1976. - № 2. -
С. 36-38.
113. Волкович В*Л.. Многокритериальные задачи и методы их решения // Тр. семинара
кибернетика и вычисл. техника. Сложные системы управления. Вып. 1. - Киев:
Наукова думка, вып. 1,1969.
114. Вольский В.Н., Литваков БМ. Соотношение турнирных и графо-доминантных ме-
механизмов выбора // Автоматика и телемеханика. - 1986. - № 3. - С 136-145.
115. Воробьев КН. Коалиционные игры // Теория вероятн, и ее применения. - 1967. -
Т, 12,вып. 2. -С 289-306.
116. Воробьев Н.Н. Современное состояние теории игр // УМН. - 1970. - Т. 25, № 2. -
С. 81-140.
111.Воробьев Я#. Теория игр: Лекции для экономистов-кибернетиков. - Л.: Изд.
ЛГУ, 1974.
118. Воробьев НЖ Основы теории игр: Бескоалиционные игры. - М.: Наука, 1984.
119. Гаврилец Ю.Н. Целевые функции социально-экономического планирования. -
М.: Экономика, 1983,
120. Гафт ММ Принятие решений при многих критериях. - М.: Знание, 1979.
121. Гермейер Ю.Б. Введение в теорию исследования операций. - М.: Наука, 1971.
122. Гермейер Ю.Б. Игры с непротивоположными интересами. - М.: Наука, 1976.
123. Глотов В.А., Павельев В.В. Векторная стратификация. - М.: Наука, 1984.
124. Горелик В.А., Кононенко А.Ф. Теоретико-игровые модели принятия решений
в эколого-экономических системах. -М.: Радио и связь, 1982.
125. Гороховик В.В. К проблеме векторной оптимизации // Изв. АН СССР. Техниче-
Техническая кибернетика. - 1972. - № 6. - С 63-70.
126. Гранберг AS. Проблема транзитивности индивидуальных и групповых пред-
предпочтений при построении целевых функций // Количественные методы в социоло-
социологии. - М.: Наука, 1966.
121. Данилов В.И. Модели группового выбора (обзор) // Изв. АН СССР. Техническая
кибернетика. - 1983. - № 1. - С 143-164.
128. Данилов В.И. Аксиома Билля в теории выбора // Изв. АН СССР. Техническая ки-
кибернетика. - 1985. - № 3. - С 26-31.
129. Данилов В.И., Сотсков А.К Рациональный выбор и выпуклые предпочтения //
Изв. АН СССР. Техническая кибернетика. - 1985. - № 2. - С. 14-23.
130. Демьянов В.Ф., Малоземов В.Н. Введение в минимакс. - М.: Наука, 1972.
131. Дубов Ю.А, Травкин СИ., ЯкимецВ.Н. Многокритериальные модели формирова-
формирования и выбора вариантов систем. - М.: Наука, 1986.
312
132. Евланов ЛГ. Теория и практика принятия решений. - М.: Экономика, 1984.
133. Емельянов СВ., Ларичев О.И. Многокритериальные методы принятия решений. -
М.: Экономика, 1984.
134.Емельянов СВ., Наппельбаум Э.Л Методы исследования сложных систем: Логи-
Логика рационального выбора // Техническая кибернетика. Итоги науки и техники.
Т. 8. - М.: ВИНИТИ, 1977. - С. 5-108.
135. Емельянов СВ., Наппельбаум Э.Л Методы анализа сложных систем: Выбор в ус-
условиях неопределенности // Техническая кибернетика. Итоги науки и техники.
Т. 9. - М.: ВИНИТИ, 1977. - С 169-242.
136.Емельянов СВ., Наппельбаум Э.Л Методы управления сложными системами:
Принципы рациональности группового выбора // Техническая кибернетика. Ито-
Итоги науки и техники. Т. 10. - М.: ВИНИТИ, 1978. - С. 120-214.
137. Жуковин BJE. Модели и процедуры принятия решений. - Тбилиси: Мешшереба,
13$. Жуковин В.Е. Многокритериальные задачи принятия решений с неопределенно-
неопределенностью. - Тбилиси: Мецниереба, 1983.
139. Каплинский АЛ, КрасненкерА.С О формировании диалоговых алгоритмов век-
векторной оптимизации // Автоматика и вычислительная техника. - 1977. - № 5. -
С. Ш-127.
140. Коэелецкий Ю. Психологическая теория решений. - М.: Прогресс, 1979.
141. Каноненко ЛФ. Роль информации о функции цели противника в играх двух лиц
с фиксированной, последовательностью ходов // ЖВМ и МФ. - 1973. - Т. 19. -
№12.-С311-317.
142. КрасненкерА.С Метод локальных улучшений в задаче векторной оптимизации //
Автоматика и телемеханика. - 1975. - № 3. - С. 15-19.
143. КрасненкерА.С. О качестве алгоритмов векторной оптимизации // Автоматика и
телемеханика. - 1984. - № 3. - С 168-172.
144. КрасненкерА.С. Об алгоритмах случайного поиска в задачах векторной оптимиза-
оптимизации //Изв. АН СССР. Техническая кибернетика. - 1985. - № 3. - С. 185-188.
145. Кукушкин Н.С, Морозов В.В. Теория неантагонистических игр. - М.: Изд. МГУ,
1984.
146. Кукушкин Н.С, Меньшиков И.С, Меньшикова О.Р., Моисеев Н.Н. Устойчивые
компромиссы в играх со структурированными функциями выигрыша // ЖВМ и
МФ. - 1985» - Т. 25. - № 12. - С. 1761-1775.
147. Кукушкин Н.С., Меньшикова О.Р., Меньшиков КС. Конфликты и компромис-
компромиссы. - М.: Знание, 1986.
148. Ларичев ОЖ Наука и искусство принятия решений. - М. Наука, 1979.
149. Ларичев О.И. Принятие решений как научное направление // Системные исследо-
исследования. - М,: Наука, 198Z
150. Ларичев О.И., Поляков О А. Человеко-машинные процедуры решения многокри-
многокритериальных задач математического программирования (обзор) // Экономика и
мат. методы. - 1980. - Т. 16, вып. 1. - С. 129-145.
151. Ларицев О.И., Мошкович КМ, О возможностях получения от человека непроти-
непротиворечивых оценок многомерных альтернатив // Дескриптивное исследование
процедур принятия решения при многих критериях. - М.: Тр. ВНИИСИ. - 1980. -
№9. -С. 58-66.
152. Ларичев О.К, Никифоров А.В. Аналитический обзор процедур решения много-
многокритериальных задач математического программирования // Экономика и мат.
методы. - 1986. - Т. 22, вып. 3. - С. 308-323.
153. ЛевченковB.C. Теория группового выбора: Алгебраический подход. - М.: Пре-
Препринт ВНИИСИ, 1985.
154.Литвак Б.Г. Экспертная информация: Методы получения и анализа. - М.: Радио
и связь, 1982.
155. Миркин Б.Г. Федерации и транзитивность группового выбора // Модели социаль-
социально-экономических процессов и социальное планирование. 4 М.: Наука, 1979. -
С 104-119.
156. Моисеев Н.Н. Элементы теории оптимальных систем. - М.: Наука, 1975.
157. Моисеев Н.Н. Математические задачи системного анализа. - М.: Наука, 1981.
158. Муллен Э. Теория игр с примерами из математической экономики. - М.: Мир,
1?85.
313
159. Озерной ВМ. Принятие решений (обзор) // Автоматика и телемеханика. -
1971.-№11.-С 106-121.
160. Озерной ВМ., Гафт MS. Методология решения дискретных многокритериальных
задач // Многокритериальные задачи принятия решений. - М.: Машиностроение,
1978. -С 14-47.
161. Панкоеа Л.А., Петровский AM., Шнейдерман MJL Организация экспертизы и ана-
анализ экспертной информации. - М.: Наука, 1984.
162. Подиновский В.В. Об относительной важности критериев в многокритериальных
задачах принятия решений // Многокритериальные задачи принятия решений. -
М.: Машиностроение 1978. - С. 48-82.
163. Подиновский BJB. О построении множества эффективных стратегий в многокри-
многокритериальных задачах с упорядоченными по важности критериями // ЖВМ и МФ. -
1978,-№4.-С908-915.
164. Подиновский В.В. Коэффициенты важности критериев в задачах принятия реше-
решений // Автоматика и телемеханика. - 1978. - № 10. - С 130-141.
165. Подиновский КВ., Гаврилов ВМ. Оптимизация по последовательно применяе-
применяемым критериям. - М.: Сов. Радио, 1975.
166. Полищук ЛИ. Карты паретовской границы, порожденные расслоениями прост-
пространства критериев // Методы анализа взаимодействия в экономических систе-
системах. - Новосибирск: Наука, 1980. - С. 78-100.
167. Полищук ЛИ. Методы обобщенного градиента в диалоговых процедурах вектор-
векторной оптимизации // Автоматика и телемеханика. - 1981. — № 5. - С. 109-118.
168. Полищук ЛИ. Об обобщенных критериях с коэффициентами важности в задачах
векторной оптимизации// Автоматика и телемеханика. - 1982. - № 2. - С 55-
60.
169. Поспелов Г.С., Ириков ВА. Программно-целевое планирование и управление. -
М.: Сов. радио, 1976.
170. Розен В.В. Применение теории бинарных отношений к теории игр // Математи-
Математическое моделирование экономических задач. — Новосибирск: Наука, 1971
С 127-152.
П1.Руа Б. Проблемы и методы принятия решений в задачах с многими целевыми
'функциями // Вопросы анализа и процедуры принятия решений. - М.: Мир,
1976. - С 20-58.
172. Соболь ИМ., Сгатников РМ. Выбор оптимальных параметров в задачах со многи-
многими критериями. - М.: Наука, 1981.'
173. Соболь ИМ, Сптников РМ. Наилучшие решения - где их искать? - М.: Знание,
1982.
174. Салуквадзе М.Е. О задаче линейного программирования с векторным критерием
качества // Автоматика и телемеханика. - 1972. -JP 5. - С. 99-105.
175. Танеян A.Q Иерархическая модель группового выбора. Экономика и мат. мето-
методы. - 1980. - Т. 16, вып. 3. - С 519-534.
176. Хоменюк ВЛ. Элементы теории многоцелевой оптимизации» - М«: Наука, 1978.
177. Федоров В.В. Численные методы максимина. - М.: Наука, 1979.
US. Щевяков А.Ю., Кирута АЛ. Моделирование сбалансированности и согласования
плановых решений в сфере народного благосостояния. - М.: Наука, 1986.
179. Яновская Е.Б. Смешанное расширение бинарного отношения // Мат. методы в со-
социальных науках. Вып. 6. - Вильнюс: Ин-т математики и кибернетики АН ЛитОСР,
1975. - С 152-166.
ОГЛАВЛЕНИЕ
Предисловие 3
Глава I
Бинарные отношении 7
§ 1. Введение 7
§ 2. Действия над бинарными отношениями 8
§ 3. Способы задания бинарных отношений 10
§ 4. Свойства бинарных отношений . . . 11
§ 5. Связи между свойствами бинарных отношений 13
Глава II
Специальные бинарные отношения 16
§ 1. Упорядочения и безразличие 16
§ 2. Слабый порядок 17
§ 3. Эквивалентность 19
§ 4. Качественный порядок. 21
§ 5. Интервальный порядок и полупорядок 24
§ 6. Другие специальные бинарные отношения 25
§ 7. Особенности бинарных отношений на непрерывных множествах 31
Глава Ш
Функция выбора 33
§ 1. Введение 33
§ 2. Классификация функций выбора 37
§ 3. Операции над функциями выбора 43
§ 4. Декомпозиция функций выбора 45
§ 5. Аппроксимация функций выбора 48
§ 6. Логическое описание функций выбора 51
§ 7. Некоторые утверждения о функциях выбора на непрерывных мно-
множествах 57
Глава IV
Классические условия рационального выбора 61
§ 1. Нормальные функции выбора 61
§ 2. Взаимосвязь между условиями рационального выбора 64
§ 3. Аксиомы классического рационального выбора 68
315
Глава V
Оптимизаций по бинарному отношению и индикаторы 72
§ 1. Определения/9-и/{-оптимальности 72
§ 2. Условия существования Р- и Л-оптимальных элементов (случай конеч-
конечных множеств G) 79
§ 3. Условия существования Р- и /{-оптимальных элементов (случай беско-
бесконечных множеств G) 80
§ 4. Условия существования Р- и /{-оптимальных элементов на выпуклых
компактах 82
§ 5. Численное представление бинарных отношений 83
§ 6. Индикаторы бинарных отношений (функции полезности) 86
§ 7. Условия существования вогнутого индикатора предпочтений 95
§ 8. Общие условия существования Р- и Л-оптимального выбора на ком-
компактном множестве вариантов 99
Глава VI
Обзор вычислительных методов теории принятия решений 104
§ 1. Введение 104
§ 2. Традиционное математическое программирование 106
§ 3. Математическое программирование в порядковых шкалах (МППШ) . . 110
§ 4. Обобщенное математическое программирование (ОМП) 113
§ 5. Многошаговые задачи обобщенного математического программирова-
программирования 118
§ 6. Актуальные задачи теории выбора решений 12S
Глава VII
Вспомогательные вычислительные методы 127
§ 1. Метод эллипсоидов (МЭ) 128
§ 2. Метод вписанных эллипсоидов (МВЭ) 136
§ 3. Метод симплексов (МС) для решения систем линейных неравенств... 152
§ 4. Метод симплексов для решения общей задачи выпуклого програм-
программирования 157
§ 5. Другая версия метода симплексов для выпуклого программиро-
программирования. . . . \ 167
§ 6. Метод Кармаркара 171
§ 7. Проективный метод 182
Глава VIII
Математическое программирование в порядковых шкалах 190
§ 1. Введение ; 190
§ 2. Постановка и подходы к решению задачи математического программи-
программирования в порядковых шкалах 192
§ 3. Методы решения задач выпуклого программирования в порядковых
шкалах 196
§ 4. Линейное программирование в порядковых шкалах 201
§ 5. Задача математического программирования в порядковых шкалах
с произвольными бинарными отношениями 206
Глава IX
Обобщенное математическое программирование (ОМП) 213
§ 1. Введение 2ДЗ
§ 2. Подходы к анализу задач обобщенного математического програм-
программирования 216
§ 3. Идея методов решения задач обобщенного выпуклого программи-
программирования '. 218
316
§ 4. Процедуры сепарации 222
§ 5. Процедуры локализации 227
§ 6. Методы решения задач ОВП 230
§ 7. Оценка трудоемкости метода 233
§ 8. Задача ОМП с произвольными бинарными отношениями 236
Глава X
Вычислительные методы многокритериальной оптимизации 241
§ 1. Постановка задачи 241
§ 2. Метод решения задачи (I) 243
§ 3. Конкретные версии подпрограммы Loc 246
§ 4. Метод решения задачи (П) 250
Глава XI
Задачи обобщенного выпуклого программирования с линейными предпочте-
предпочтениями 258
§ 1. Введение 258
§ 2. Постановка задачи и идея метода 259
§ 3. Алгоритм метода 260
§ 4. Оценка трудоемкости методов. . . .' 263
§ 5. Некоторые частные случаи 264
§ 6. Ядро задачи ОВП 265
Глава ХП
Многошаговые схемы обобщенного математического программирования .... 267
§ 1. Введение 267
§ 2. Многошаговая схема обобщенного математического программиро-
программирования (МнОМП) 271
§ 3. Схемы МнОМП и функции выбора 272
§ 4. Оценка качества прогноза выбора механизмами заданного класса.... 275
§ 5. Синтез многошаговых схем выбора 281
§ 6. Функции выбора на компактном множестве вариантов: 286
Заключение 291
Дополнение • 304
Список литературы 308
Ibjwm издание
Шккт Давид Беркович
ВЫЧИСЛИТЕЛЬНЫЕ МЕТОДЫ ТЕОРИИ ПРИНЯТИЯ РЕШЕНИЙ
Серия 'Теория и методы системного анализа", выпуск 25
Заведующий редакцией Л.А. Русаков
Редактор Л,А. Шоломов
Художественный редактор ТМ. Кольченко
Технические редакторы: С.& Геворкян, С.Н. Воронина
Корректоры: Т.Г. Егорова,Н.П. Круглова, Т.В. Обод
Набор осуществлен в издательстве
1 в* наборыо-печатающих автоматах
ИЕН* 12601
Сдяя& в набор 08.06.88. Подписано к печати 19.09.88. Т-18740
Фурмт 60 X 90/16. Бумага книжно-журнальная
Гаришура Пресс-Роман. Печать офсетная
Усл. печ. л. 20,0* Усл. кр. -отт. 20,0 . Уч.-иэд. л. 22,26
Тираж 61S0 экз. Тип. зак. 283 Цена 3 руб.
Ордена Трудового Красного Знамени
издательство "Наука"
Главная редакция физико-математической литературы
1I7O71 Москва В-71, Ленинский проспект, 15
Четвертая типография издательства "Наука"
6Э0077 г. Новосибирск-77, ул. Станиславского, 25
YUDIN D.B.
NUMERICAL METHODS OF DECISION MAKING
Moscow: Nauka, 1989
1. The summary of the monograph
The monograph is devoted to the numerical methods of decision making to complex
situations arising in control, planning, and design problems. In conventional optimization
theory, mathematical programming, the objective and the feasible solution set are vappastd
to be known. This situation is encountered, however, only in relatively simple psobfems.
The major difficulties involved in modern somehow complex problems are connected with
establishing the principle of a rational choice. In practice, the solution process has to Mt a
number of targets, to match interests of several persons, to resolve conflicting situations. Soch
problems fall outside the classical optimization scheme. Normally, the aggregation of criteria
(the just choice) is specially defined for every class of problems and ad hoc choice media-
nisms, i.e., numerical methods of achieving a tradeoff, are developed. The first problem
consisting of formalization of the rational choice has been studied in the papers written in ne-
cent years. The notion of the choice function which can describe any choice concept te de-
developed, along with the conditions under which the choice function can be realized in die
form of optimization with a scalar-valued objective. Only a negligible part of possible
choice concepts turns out to satisfy these conditions. A little broader class of the choice
functions can bo realized by use of binary relations. However, the binary relations do not ex-
exhaust the totality of the choice functions.
Few years ago the author suggested a new choice mechanism, a scheme of generalized
mathematical programming (GMP), and developed efficient methods of solving the convex
GMP problems. In a GMP problem a scalarvalued objective is replaced by a binary relation
defined for a vector-valued objective and the inequality constraints by constraints on vector-
valued functionals with respect to a binary relation. This GMP scheme was later extended
in various directions. Specifically, a multistep GMP scheme was developed to realize any
choice function on a finite number of alternatives and to approximate any choice concept
on a compact set of variants to any desired accuracy.
The description of the choice concepts and, primarily, the choice mechanisms, i.e., the
numerical methods of decision making, constitutes the subject of this monograph.
2. Contents and some comments
Introduction. Hie state of the art of mathematical decision making theory is described and
most important problems of this theory are formulated.
Chapter 1. Шпагу relations.
Chapter 2. Special binary relations
Chapter 3. Choice functions.
Chapter 4. Classical conditions of rational choice.
Chapters 1 to 4 systematically present well-known facts concerning binary relations and
choice functions. The fragmentary results known from periodicals and stated in different
terms are collected here on a unified basis.
Chapter 5. Optimization subject on a binary relation and indicators.
The classical definitions of optimization with respect to partial orderings are extended to
the case when there exists no traditional optimization subject to a binary relation. The
319
extended optimization with respect to a binary relation is intuitively justifiable and corres-
corresponds to solutions which are more stable in a sense. The chapter also centres on the inter-
interrelation between various binary relations and their indicators, the utility functions.
Chapter 6. A survey of the numerical methods of decision making.
This chapter presents a classification and a qualitative characterization of the numerical
methods of choice theory. The subject matter is basically described in terms of applied prob-
problems and is to facilitate the reading of subsequent chapters 8-12 devoted to thorough descri-
description and discussion of the algorithms of decision making in complex situations.
Chapter 7. Auxiliary numerical methods.
This chapter deals with the efficient methods of linear and convex programming developed
in the most recent years. These methods can be used as an auxiliary means for the numerical
procedures of decision making described ijt this book. The application of these methods
is demonstrated in the subsequent chapters. Among them there are the method of ellipsoids
advanced by Yudin and Nemirovsky in 1976, the method of inscribed ellipsoids developed
by Khachian and others.ln 1986, the method of slmplexes whose various versions were pub-
fished at the outset of the 1980s by Levin and Yamnitsky in the USA and Bulatov and others
in the USSR, the Karmarkar method, 1984, and its efficient modification the projection me-
method suggested by Nemirovsky in 1986. These methods and the estimates of their efficiency
are interesting on their own.
Chapter 8. Mathematical programming in order scales.
Chapter 9. Generalized mathematical programming.
Chapter 10. Numerical methods of multiobjectrve optimization.
Chapter 11. Generalized mathematical programming problems with linear preferences.
Chapter 12. Multistep schemes of generalized mathematical programming.
Chapters 8 to 12 are based on the original works of the author and his students. Thii
is a closed cycle of papers on the numerical methods of decision making in complex situa-
situations.
ш conclusion, some unsolved problems in the field under consideration are stated and
approaches to solving them are presented.