Текст
                    Н.Н. ВОРОБЬЕВ
ТЕОРИЯ
ИГР
ддя экономистбв-кйбе' чкоз

Н.Н. ВОРОБЬЕВ ТЕОРИЯ ИГР ДЛЯ ЭКОНОМИСТОВ-КИБЕРНЕТИКОВ МОСКВА ’’НАУКА” ГЛАВНАЯ РЕДАКЦИЯ ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ 1985
ББК 22.18 В 25 УДК 519.6 Рекомендовано Министерством высшего и среднего специального образования СССР для использования в учебном процессе студентами вузов, обучающимися по специальности ’’Эконо- мическая кибернетика” Воробьев Н.Н. Теория игр для экономистов-кибернетиков. — М.: Наука, Главная редакция физико-математической литературы, 1985. -272 с. В книге излагаются на элементарном математическом уровне основные факты теории игр в соответствии с программами по курсу теории игр для спе- циальности ’’Экономическая кибернетика” университетов и высших экономи- ческих учебных заведений. Ее можно использовать как учебное пособие для слушателей курса лекций, а также при самостоятельном изучении предмета. Книга может представлять интерес для работников различных специальностей, занимающихся применением математики к вопросам принятия оптимальных решений. Ил. 100. Библиогр. 49 назв. Рецензенты: кафедра прикладной математики и вычислительной техники Ленинградс- кого института текстильной и легкой промышленности им. С.М. Кирова; кандидат физико-математических наук В.В. Розен 1702070000-162 В----------------77-85 053(02)-85 © Издательство ’’Наука”, Главная редакция физико-математической литературы, 1985
ПРЕДИСЛОВИЕ Главная цель данной книги состоит в том, чтобы предоставить в распо- ряжение студентов экономических специальностей достаточно простое и доступное руководство, содержащее элементарное изложение основ мате- матического аппарата теории игр. Уровень математических требований, предъявляемых читателю, примерно соответствует уровню математической подготовки экономистов по специальности ’’Экономическая кибернетика” к концу второго курса. Именно в этом смысле и следует понимать адресова- ние этой книги экономистам-кибернетикам. Вместе с тем ее могут использо- вать студенты и научные работники других экономических и инженерных специальностей, а также студенты-математики, для которых она может по- служить пособием при начальном, предварительном изучении теории игр. Основу первого варианта книги, вышедшего под названием ’’Теория игр. Лекции для экономистов-кибернетиков” (Изд. ЛГУ, 1974), составил курс лекций, многократно читавшийся автором студентам третьего курса спе- циальности ’’Экономическая кибернетика” экономического факультета Ленинградского государственного университета им. А.А. Жданова. Предла- гаемый читателю новый вариант курса составлен по тому же общему плану, что и предыдущий, но отличается от него большей систематичностью и за- вершенностью изложения. Всюду, где это возможно, автор стремился при- дать теоретико-игровым рассуждениям надлежащую математическую стро- гость и разумную общность. Формальные требования, предъявляемые к конкретным математическим знаниям читателя данного руководства, весьма скромные. Они не выходят за пределы элементарных вопросов линейной алгебры и математического анализа й начальных сведений по теории вероятностей. Исключения состав- ляют лишь теоремы о неподвижной точке и рассуждения, связанные с ин- тегралом Стилтьеса. Впрочем, при всей своей глубине они достаточно наглядны и ’’правдоподобны”. Один раз употребляется теорема Хелли о пересечениях выпуклых множеств. Автор полагает, что включающий ее комбинаторный вариант рассуждений в конечном счете оказывается более естественным, чем линейно-алгебраический. Безусловно необходимым предполагается владение читателем ’’математической азбукой”, т.е. умение читать математические выражения и понимать взаимосвязь их отдельных частей. Приводимые в книге математические рассуждения являются не только элементарными, но, за немногими исключениями, и сравнительно просты- 1 3
ми. Однако тривиальными их назвать никак нельзя, а при формировании теории игр они складываются в довольно сложную логическую структуру. Отчетливое представление о ней в целом может потребовать от читателя известных усилий. Вместе с тем понимание каждого отдельного места кни- ги, по-видимому, не составит труда: в доказательствах теорем упомянут практически каждый логический шаг, а решение каждой задачи доведено до завершающей формулы или хотя бы до расчетной методики. Теория игр относится к математическому обеспечению социально-эко- номической проблематики. Поэтому применительно к ней можно говорить о различных аспектах математического обеспечения. В данной книге вни- мание обращается на концептуальный, методологический, методический и алгоритмический аспекты; бегло затрагиваются аспекты проблемный и модельный; напротив, информационный, программный, технический и организационный аспекты не рассматриваются вовсе. В процессе изучения теории игр учащемуся приходится осваивать до- вольно большое число новых для него и во многом непривычных понятий. Кроме того, практика преподавания теории игр экономистам и, тем более, самостоятельное ее изучение допускают различные по объему и по содер- жанию варианты программ. По этим двум причинам автор в построении дан- ного курса допустил некоторые черты ’’концентризма”, воспроизведя отдельные идеи и даже логические конструкции первой главы в более общем виде в последующих главах книги. По тем же мотивам основному тексту книги предпослано ’’Введение”, излагающее в несколько тезисной форме содержание и назначение курса теории игр. Начальный характер курса и его ориентация- на читателя-экономиста предопределили и отбор включенного в нее материала. Так (даже если го- ворить только об элементарных вопросах теории игр), за его рамками осталась теория динамических (позиционных) игр, как менее важная для экономистов, а также вопросы устойчивости конфигураций в кооператив- ной теории и теория игр без побочных платежей (в том числе — теория арбитражных схем), которые следует рассматривать при дальнейшем, более глубоком изучении теории игр. * Весь содержащийся в книге материал по своему объему существенно превосходит то, что удается прочесть за один семестр при одной лекции в неделю. Однако для преподавателя не составит труда выделить те вопро- сы, которые можно перенести на практические занятия или исключить из курса вовсе. Чтобы облегчить ему решение этой задачи, параграфы и пунк- ты книги, содержащие более сложный (и в соответствии с этим — менее обязательный) материал, отмечены знаком *. Места, носящие вспомога- тельный, не относящийся к теории игр, или же иллюстративный характер, набраны петитом. Соображения, положенные в основу списка рекомендованной литерату- ры, видны из его структуры. Автор весьма благодарен А.И. Соболеву, внимательно прочитавшему рукопись и сделавшему немало критических замечаний. Автор надеется на дальнейшую критику со стороны читателей. Вырица, 1984 г. Н.Н. Воробьев
ОСНОВНЫЕ ОБОЗНАЧЕНИЯ Основной рассматриваемый в данной книге объект — игра — представляет со- бой теоретико-игровую конструкцию, в образовании которой участвуют мно- жества с элементами различной природы. Для элементов большинства вводи- мых далее множеств мы будем использо- вать следующие обозначения: i, j, к - игроки в бескоалиционной игре; xv x'i> УЬ • • - чистые стратегии игро- ка i в бескоалиционной игре; Xj, X'j, Yf,... - смешанные стратегии игрока i в бескоалиционной игре; х, х',... — чистые стратегии иг- рока 1 в антагонистической игре; у,У\ • • • - чистые стратегии иг- рока 2 в антагонистической игре; X, Y - смешанные стратегии игро- ков 1 и 2 в антагонистической игре; х, х', у,.. . - ситуации (в чистых стратегиях) в бескоалиционной игре; X, X', Y,. .. - ситуации в смешанных стратегиях в бескоалиционной игре. Таким образом, чистые стратегии и составленные из них ситуации обозна- чаются строчными светлыми буквами, а соответствующие им смешанные стра- тегии - светлыми прописными буквами. Множество, по словам Г. Кантора, есть ’’многое, понимаемое как единое”. Для некоторых конкретных множеств вводятся специальные обозначения: ф - пустое множество; { а, Ь, с,. .. } - множество, состоящее из элементов а, Ь, с; { а } — множество, состоящее из един- ственного элемента а\ обычно оно будет для простоты обозначаться как а\ {а: у (а)} - множество всех элемен- тов вида а, обладающих свойством <р; R - множество всех вещественных чисел, Rn — множество всех вещественных л-МСрных векторов; R” - множество всех неотрицатель- ных л-мерных векторов. Основные соотношения между мно- жествами и действия над ними описы- ваются следующим образом: деЛ - принадлежность элемента а множеству Л; IЛ I - число элементов в конечном множестве Л; Л С В — множество Л является под- множеством (частью) множества/?; Л и В - объединение (сумма) мно- жеств Л и В\ п UЛ/ - объединение множеств Л1Э 1=1 Л3,.. ., Лл; Л п В — пересечение (общая часть) множеств Л и В; п П Л/ — пересечение множеств Лх, /=1 Л3,. . . , Ап\ А\В - разность множеств Л и В\ А КВ - Декартово произведение мно- жеств Л и В, т.е. множество всех пар вида (д, £), где а еЛ и b £/?; п П Л/ — декартово произведение / = 1 множеств Л j ,Л2„„,Лл, т.е. множество всех упорядоченных систем вида (дх, д^>..., > где аг Лj, д2 G Л2>.. • . ., , дп G Ап ; /: Л ->В — функция, заданная на мно- жестве Л со значениями в множестве В\ ВА - множество всех функций вида /: А-+В- / = {1,2,...,«} - множество всех игроков в бескоалиционной игре; / = { 1, 2,. .. , тп/}- множество всех чистых стратегий игрока' i в бескоали- ционной игре; X/ - множество всех смешанных стратегий игрока i в бескоалиционной игре; 5
х, у - множества всех чистых страте- гий игроков 1 и 2 в антагонистической игре; X, Y - множества всех смешанных стратегий игроков 1 и 2 в антагонисти- ческой игре; х - множество всех ситуаций в бес- коалиционной игре; X множество всех ситуаций в сме- шанных стратегиях в бескоалиционной игре. Таким образом, стратегии и ситуации обозначаются светлыми буквами, а мно- жества всех стратегий и ситуаций — по- лужирными. Множества всех ситуаций, стратегий или иных теоретике-игровых объектов, описывающих в том или ином смысле оптимальные решения игр, получают спе- циальные обозначения рукописными буквами: ^•(Г) - множество всех ситуаций в игре Г, приемлемых для игрока/; ^(Г) — множество всех ситуаций равновесия в игре Г; р (Г) - множество всех ситуаций, оптимальных-по Парето в игре Г; &ЧГ) - множество всех оптималь- ных стратегий игрока 1 в антагонисти- ческой игре Г; (Г) - множество всех оптималь- ных стратегий игрока 2 в антагонисти- ческой игре Г; fp, и (Г) - значение антагонистичес- кой игры Г; ир( • ) — характеристическая функция бескоалиционной игры Г; - кооперативная игра с характе- ристической функцией и; и (Г) — характеристическая функция, соответствующая кооперативной игре; vR — простейшая характеристическая функция с минимальной выигрывающей коалицией R; х — дележ в кооперативной игре; х(К) - обозначение для суммы S хр i<EK где х — дележ, а К — коалиция; ev(K, х) — эксцесс дележа х щ\я коа- лиции К в условиях характеристической функции и; (6(г) - с-ядро кооперативной иг- ры v; <R(u) — Н—М-решение кооператив- ной игры и; Ф(и) - вектор Шепли кооперативной игры V.
ВВЕДЕНИЕ § 1. БЕСКОАЛИЦИОННЫЕ ИГРЫ 1.1. Большинство наук, отражая явления объективной действительности, создают содержательные представления о них. Математика же на основе этих содержательных представлений формирует свои, формальные (мате- матические, знаковые) модели. Переход от содержательных представле- ний к формальным моделям, называемый также математизацией этих представлений, является процессом абстрагирования. Как и всякое абстрагирование, этот переход сопровождается отвлечением от некоторых черт рассматриваемого явления, как бы ’’стиранием” этих черт. Вместе с тем, чтобы формальная, математическая модель какого-либо явления оставалась все-таки его моделью, необходимо, чтобы она отражала, вос- производила все существенные его черты. Далее мы будем говорить об общественных, социально-экономических явлениях. Не следует называть таковыми просто любые явления, происхо- дящие в человеческом обществе, в его условиях. Так, функционирование какого-либо технического устройства, сам по себе некоторый технологи- ческий процесс не могут квалифицироваться как общественные явления, хотя они осуществляются в конкретных общественных условиях и связаны со многими в полном смысле этого слова общественными явлениями. В основе технологических процессов лежат лишь те или иные физические, химические или биологические закономерности, а протекают они вне прямой зависимости от общественных отношений. Точно так же нельзя считать общественным явлением, скажем, организацию телефонной связи, хотя она есть показатель определенного уровня развития общества и удов- летворяет определенные общественные потребности. Подробно этому и многие задачи, традиционно считающиеся экономи- ческими, поскольку в их формулировках фигурируют экономические понятия (обычно — деньги), в действительности являются технико-эконо- мическими. В качестве примера приведем известную транспортную задачу, которую можно, никак не затрагивая ее содержательного существа, пере- формулировать как задачу о минимизации работы (энергии), затрачивае- мой на суммарное перемещение однотипных масс из определенного их ис- ходного расположения в заданные места. 1.2. Одна из характерных черт всякого общественного, социально-эко- номического явления, оказывающегося таковым по существу (а не просто потому, что оно осуществляется в условиях человеческого общества), сос- тоит в множественности, в многосторонности интересов, затрагиваемых исходами этого явления, в наличии сторон, наделенных различными интере- 7
сами, или хотя бы в наличии нескольких различных активных точек зрения на явление и его исход. Так, приходится считаться с различием личных, коллективных и общест- венных интересов, ибо уже сам тезис о подчинении личных интересов об- щественным предполагает различие тех и других. В классовом обществе имеются различные классовые интересы. В условиях плановой системы хозяйства необходимо сочетать отраслевые и региональные интересы, а также подчас противоречащие друг другу интересы отдельных ведомств.. Планирование работы предприятия по нескольким показателям и отчет- ность по каждому из них отражает оценки различных сторон деятель- ности предприятия. Основные трудности внедрения и распростра- нения нововведений предопределяются противоречием между сегодняш- ней выгодой и будущим эффектом. В этом смысле можно сказать, что лю- бое социально-экономическое явление наделено чертами конфликта. Обратим внимание на то, что всякая заинтересованная сторона должна *• обладать различными возможностями действовать, удовлетворять свои интересы. В противном случае, если у нее имеется только одна такая воз- можность, она перестает играть роль стороны в рассматриваемом про- цессе и превращается в обстоятельство, влияющее вполне опре- деленным, однозначным образом на протекание этого процесса. Следовательно, всякая претендующая на адекватность математическая модель социально-экономического явления должна отражать присущие ему черты конфликта: различие интересов участвующих в нем сторон, а также разнообразие тех действий, которые эти стороны могут осуществ- лять во имя достижения своих целей. Это значит, что социально-экономичес- кое явление при его математическом моделировании должно наряду с воз- можными другими представлениями допускать еще и представление в виде конфликта, т.е. такое, в котором отражены следующие его компо- ненты : а)г заинтересованные стороны; б) возможные действия каждой из сторон; в) интересы сторон. В условиях наиболее общего (и тем самым — наиболее простого) математического описания конфликта перечисленные его компоненты должны описываться при помощи наиболее общих и простых математичес- ких объектов. Такими математическими объектами являются м н о ж е с т- в а. 1.3. Дадим формальное описание указанных компонент конфликта, вво- дя при этом принятую терминологию и обозначения. Заинтересованные стороны будут далее называться игроками или лицами, а множество всех игроков будет обозначаться через/. Далее в этой книге мы ограничимся рассмотрением случая, когда множество I ко- нечно. Не нарушая общности, можно принимать, что I ={1, 2,.. ., п}. Любое возможное для игрока 1^1 действие называется его стратегией; множество всех стратегий игрока i обозначим через xz«. В условиях конф- ликта каждый игрок z G/ выбирает некоторую свою стратегию xz- Gxz, в результате чего складывается набор стратегий х = (хх,..., хл), называемый ситуацией, Множество всех ситуаций является, очевидно, декартовым про- изведением П X/ и обозначается через х. /ег 8
Заинтересованность игроков в ситуациях проявляется в том, что каждо- му игроку i ЕI в каждой ситуации х G х приписывается число, выражаю- щее степень удовлетворения его интересов в этой ситуации. Это число назы- вается выигрышем игрока i в ситуации х и обозначается через Hj (х). Со- ответствие Н^. x-*R называется функцией выигрыша игрока /.В этих условиях протекание конфликта состоит в выборе каждым игроком i GI его стратегии xz G и в получении им в сложившейся ситуации х = = (х15... ,хЛ) из некоторого источника выигрыша Я/ (х). Вообще говоря, оценка игроком i ситуации х путем указания выигрыша Ht (х) не всегда возможна практически и даже не всегда имеет смысл (если, например, она выражается в эмоциональных, эстетических или этических категориях). В таких случаях иногда удается вместо прямых численных оценок ситуа- ций указывать на их сравнительную предпочтительность для от- дельных игроков. На этом пути создается теория игр с предпочтениями, более широкая, чем излагаемая далее теория игр с выигрышами. Однако математическая теория игр с предпочтениями, с одной стороны, сложна, а с другой — пока еще недостаточно разработана. Здесь мы рассмотрим только игры с выигрышами. Таким образом, всякий конфликт будет нами представляться в виде системы </, {xz}ze/> {Hi}i&1 >. (1.1) Такая система называется бескоалиционной игрой или просто игрой. Обыч- но бескоалиционная игра обозначается греческой буквой Г (быть может, с некоторым индексом или пометкой), соответственно начальной букве английского слова game (игра). 1.4. В принципе можно говорить и о бескоалиционной игре Г с одним игроком (п = 1). В этом случае каждая стратегиях! единственного участ- ника игры уже составляет ситуацию х, так что Xi = х, и игра Г из (1.1) фактически оказывается просто функцией: Н-Нх : x = xi ~>R. Из этого обстоятельства вовсе не следует, что теория функций как раздел математи- ки должна или может входить составной частью в теорию игр. В действитель- ности эти области математики подходят к своим предметам с достаточно различных точек зрения. 1.5. Среди всех бескоалиционных игр естественным образом выделяется класс антагонистических игр, в которых число игроков равно двум, а значе- ния их функций выигрыша в каждой ситуации равны по величине и проти- воположны по знаку: Я1(х1,х2) = -Я2(х1,х2). Очевидно, запись игры в виде (1.1) применительно к антагонистичес- кой игре приобретает вид <{ 1,2}, {xt, х2}ЛНь ~НГ}>, или, исключая ин- формацию, содержащуюся в самом факте антагонистичности игры, — вид < Xi , х2, Нх > . Чтобы сократить употребление индексов, множества стратегий игроков 1 и 2 антагонистической игре будут обычно обозначаться через х и у, функ- ция выигрыша Hi — через Н, а сама игра записывается в виде < х, у, НУ. 1.6. Бескоалиционная игра, в которой множества стратегий каждого игрока конечны, называется конечной бескоалиционной игрой (конечной 9
игрой). Если для конечной бескоалиционной игры двух лиц ставить в со- ответствие стратегиям игрока 1 строки некоторой таблицы, стратегиям игрока 2 — ее столбцы, а клетки таблицы заполнять значениями функции выигрыша игрока 1, тсТ полученная таблица называется матрицей выигры- шей игрока 1. Если клетки этой же таблицы заполнить значениями функ- ции выигрыша игрока 2, то получится матрица выигрышей игрока 2. Эта пара матриц полностью описывает конечную бескоалиционную игру двух лиц. Поэтому такие игры называются биматричными. Если биматричная игра является антагонистической, то матрица выигры- шей игрока 2 полностью определяется матрицей выигрышей игрока 1 (со- ответствующие элементы этих двух матриц отличаются только знаками). Поэтому биматричная антагонистическая игра полностью описывается един- ственной матрицей (матрицей выигрышей игрока 1) и в соответствии с этим называется матричной. § 2. ПРИМЕРЫ БЕСКОАЛИЦИОННЫХ ИГР 2.1. Рассмотрим несколько примеров бескоалиционных игр. Целью этого рассмотрения является конкретная иллюстрация не только самого понятия бескоалиционной игры, но и вариантов тех трудностей, с кото- рыми приходится сталкиваться при анализе таких игр. 2.2. Зачет. Пусть игрок 1 — Студент — готовится к зачету, а игрок 2 — Преподаватель — принимает его *). Будем считать, что у Студента две стра- тегии: хорошо подготовиться (X) или плохо (77), а у Преподавателя — то- же две стратегии: поставить зачет (+) и не поставить его (—). В основу оценки значений функций выигрыша игроков можно положить, например, следующие соображения, отраженные в матрицах выигрышей. Выигрыши Студента + _ X Г 2 -1 " (оценили по за- (обидно) слугам) П 1 О (удалось слов- (получил по _ чить) заслугам) _ Выигрыши Преподавателя (все нормально) П -3 (дал себя об- _ мануть) -2 (проявил не- справедли- вость) -1 (Студент при- дет еще раз) - Этой модели более всего соответствует случай остающегося после бесе- ды сомнения преподавателя в добросовестности студента и отсутствие реальной возможности проводить дальнейшее доскональное выяснение его знаний. Эта игра — биматричная. В ней 7={1,2},х1 ={Х, П} и х2 = {+, — }. Зна- чения функций выигрыша игроков приведены в матрицах. 2.3. Орлянка. Игрок 1 выкладывает монету на стол, а игрок 2, не видя монеты, угадывает, какой стороной (т.е. ’’орлом” (О) или ’’решкой” По принятой в теории игр традиции нарицательные названия игроков считаются как бы их собственными именами и потому пишутся с прописной буквы. Употреби- ечьны также имена: Природа, Случай и т.п.
(Р)) вверх она положена. В случае угадывания он получает от игрока 1 од- ну единицу выигрыша, а в противном случае уплачивает ему единицу. Эта игра — антагонистическая. В ней Xj = х2 ={О, Р } , а Н (О, б?) = Н (Р, Р) = —1иН(О, Р) =Н (Р, О) = 1, или в матричной форме: о р О -1 1 р L 1 -1 2.4. Пример игры на открытом квадрате. Пусть каждый из игроков 1 и 2 выбирает число из открытого интервала (0, 1), после чего игрок 1 получает от игрока 2 сумму выбранных чисел. В этой антагонистической игре, очевидно, х = у = (0, 1), так что множест- во ситуаций хХх = (0, 1) X (0,1) является множеством пар чисел (х,у), где 0 < х, у < 1,т.е. открытым единичным квадратом. Очевидно, для этой игры Н (х, у) =х + у. 2.5. Два бандита. Игроками 1 и 2 являются преступники (’’банди- ты”), находящиеся в предварительном заключении по подозрению в тяж- ком преступлении. Прямых улик, однако, против них нет, и возможность их обвинения в значительной мере зависит от того, сознаются ли преступни- ки сами. Если оба они сознаются, то будут, несомненно, осуждены на длитель- ный срок тюремного заключения, однако при этом признание учитывается как смягчающее обстоятельство (потери каждого из игроков в этом случае оценим в —8). Если они оба не сознаются, то за отсутствием улик обвине- ние в тяжком преступлении будет снято, но следователь сможет доказать их виновность в совершении менее значительного преступления, в резуль- тате чего оба получат некоторое наказание (потери составляют —1 для каждого). Если, наконец, сознается лишь один из преступников, то по законам той ’’модельной” страны, в которой происходят описывае- мые события, он будет выпущен на свободу (потери равны 0), а его упорствующий партнер получит полную меру возмездия (потери рав- ны —10). Эта игра — биматричная, В ней каждый игрок имеет по две стратегии: признаваться (77) или нет (И). Матрицами выигрышей игроков являют- ся: П Н для игрока 1 П Н -8 0 -10 -1 для игрока 2 2.6. Семейный спор. Два экономических партнера (игроки 1 и 2) договариваются о совместном проведении одного из двух действий, Dx или D2, каждое из которых требует совместного, участия обоих партнеров. В случае совместного осуществления действия D} игрок 1 получает одну единицу полезности, а игрок 2 — две единицы. Наоборот, в случае совместного осуществления D2 игрок 1 получает две единицы, а игрок 2 — лишь одну. Наконец, если игроки выполнят различные действия, то выиг- рыш каждого из них равен нулю. Таким образом, мы имеем биматричную 11
игру с матрицами выигрышей Во многих популярных сочинениях по теории игр эту игру интерпрети- руют как одновременный выбор супругами совместного вечернего развле- чения: посещения соревнований по боксу или же балета, причем в посеще- нии бокса муж заинтересован в большей степени, чем жена, при посещении балета наблюдается обратная картина, а в случае непреодоленного разногла- сия вечер вообще оказывается испорченным. Ввиду такой интерпретации описанная игра часто называется ’’семейным спором”. 2.7. Морра плиц. Игрой ’’морра” называется игра любого числа лиц, в которой все участники одновременно показывают (’’выбрасывают”) по некоторому числу пальцев, делая это молча (’’немая морра”) или же называя по некоторому числу каждый (’’громкая морра”). Ситуацией, очевидно, является здесь система чисел показанных пальцев, а в случае- ’’громкой морры”, кроме того, система названных чисел. Каждой ситуа- ции приписываются выигрыши, которые игроки в условиях этой ситуа- ции получают (из ’’банка”). Далее рассматривается следующий конкретный вариант ’’немой морры”. Пусть в игре участвует п игроков, каждый из которых показывает один или два пальца. Каждый игрок выигрывает показанное им число, если все остальные игроки показали другое число; он выигрывает нуль во всех остальных случаях. Очевидно, в этой игре 2Л ситуаций. Каждый игрок получает положитель- ные выигрыши в двух из них. § 3. ОПТИМАЛЬНОСТЬ 3.1. Изучение конфликтов, а в соответствии с этим — игр в только что определенном смысле слова, можно проводить с различных точек зрения: дескриптивной, состоящей в выяснении того, какие ситуации факти- чески складываются (или могут складываться) в тех или иных конфликтах; нормативной, устанавливающей, какое поведение игроков следует считать оптимальным (разумным, целесообразным); конструктив- ной, указывающей, как осуществлять нужные (например, оптимальные) стратегии или ситуации, и прогностической, занимающейся предска- занием фактического исхода конфликта. Теория игр как математическая дисциплина в ее современном состоянии занимается нормативным изучением игр. Основными задачами теории игр можно считать поэтому следующие три: выработку принципов оптимальности, установление их реализуемости (т.е. установление существования оптимальных в этом смысле ситуаций) и на- хождение их реализаций. 3.2. Различные теоретико-игровые концепции оптимальности формально отражают те или иные содержательные представления об оптимальности, являясь их математическими моделями. Поэтому понятия оптимальности в теории игр и оптимального решения игры не являются однозначными, ап- 12
риорными, абсолютными. Вместе с тем эти понятия являются объективны- ми, т.е. каждый вариант оптимальности поддается точному описанию при помощи недвусмысленных математических формулировок. 3.3. Основными содержательными чертами оптимальности в применении к исходу или к множеству исходов конфликта можно считать интуитив- ные представления о в ы годност и, устойчивости и справед- ливости. В простейшем случае, когда в игре имеется лишь один игрок, выгод- ность можно понимать, пожалуй, единственным образом, а именно как максимизацию значения функции выигрыша по всему множеству страте- гий-ситуаций .При этом под максимумом функцииН: х-+ Rпонимается такое значение переменной х Е х, что при любом у Е х будет Н (у) <Н (х). Если такой максимум функции отсутствует (т.е. максимальное значение не достигается), то, как известно, для любой ограниченной функции су- ществует ее супремум, к которому можно подойти сколь угодно близко (ближе, чем на произвольное е > 0). 3.4. Очевидно, описанные выше точки максимума обладают и свойством устойчивости: отклонение игрока от своей наиболее выгодной, мак- симизирующей стратегии может разве лишь уменьшить его выигрыш. Формально это выглядит как объявление максимумами функции Я: x-*R таких значений переменного х Е х, что ни для какого другого у Е х не будет Н(х)<Н(у). В случае, когда приходится говорить не о максимуме, а лишь о супре- муме функции, соответствующие стратегии-ситуации оказываются е-устой- чивыми (в том смысле, что отклонение игрока от такой ситуации хотя и может увеличивать выигрыш игрока, но не более чем на е > 0). 3.5. Иногда представляется целесообразным говорить не об отдельных значениях переменного, максимизирующих данную функцию Н: x-*R, а о мн о же с тв е всех таких значений в целом. Это множество будем обозначать через Понимая оптимальность как устойчивость, можно дать определение множеству всех максимумов функции Я как такому множеству значений переменного х, которое обладает следующими двумя свойствами. Внутренняяустойчивость: прих', хЕ ^Х(Я) не может быть ни Я (х) < < Я (х ), ни Я (х ' )< Я ( х ). Внешняя устойчивость: по любому у х (Я ) найдется такое х Е 7ох (Я), что Я (у) < Я (х). Нетрудно проверить, что несмотря на некоторую вычурность такая фор- мулировка определяет максимумы функции эквивалентно определениям из пп. 3.3 и 3.4. 3.6. Обратим внимание на следующие тривиальные свойства операции максимизации й’ : 1°. Независимость от посторонних альтернатив*): если уСх, тоуП %?Х(Я) С $у(Я). *) Независимость от посторонних альтернатив является важным свойством раз- ного рода оптимумов и выступает в довольно различных: формах. Здесь и далее мы имеем дело лишь с одним из вариантов этого свойства. 13
2°. Конфинальность: если у Сх и по каждому х G х найдется та- кое^ G Y, что Н (х) (у), то ^у(Я)С ^Х(Я). Далее мы увидим, что эти чрезвычайно простые соображения остаются в силе для многих теоретико-игровых принципов оптимальности и оказы- ваются важными источниками приемов нахождения их реализаций. 3.7. Заметим, наконец, что говорить в случае одного игрока о справед- ливости просто не имеет смысла: формально для единственного участника игры справеделивой будет любая ситуация. 3.8. До сих пор мы говорили о тех детерминированных случаях, когда выигрыш игрока однозначно зависит от выбранной им стратегии-ситуации. Вместе с тем распространено и представляет интерес явление, когда вы- игрыш Н (х) зависит не только от стратеги и-ситуации х, но и от разного рода случайных обстоятельств, являясь тем самым случайной вели- чиной. Вопрос о численной оценке случайного выигрыша представляется дос- таточно нетривиальным и допускает различные ответы. Мы не будем глу- боко вдаваться в его анализ и примем в качестве такой оценки матема- тическое ожидание случайного выигрыша. Такой подход пред- ставляется естественным с точки зрения закона больших чисел: ма- тематическое ожидание выигрыша при повторных реализациях си- туации можно понимать как средний ожидаемый выигрыш на одну реали- зацию. 3.9. Пусть теперь игра нетривиальна, т.е. в ней участвует более одного игрока. Тогда содержательные представления о выгодности и устойчивости, не говоря уже о справедливости, могут быть формализованы весьма различ- ным образом. Можно, например, оптимальной ситуацией считать такую, на которой одновременно достигают своих максимумов функции выигрыша каждо- го из игроков. Условие оптимальности в этом смысле для ситуации х*в игре Г из (1.1) формально можно записать как #г(х)^#Кх*) для любых i G I ихЕх. (3.1) Выгодность такой ситуации ясна. Ее устойчивость также очевидна: лю- бое отклонение от нее игроком или группой игроков может привести разве лишь к уменьшению выигрышей всех участников игры (и в том числе — отклонившихся). Справедливость этой ситуации вытекает из симметричности вхождения всех игроков в условие (3.1), Разумеется, такая справедливость неполна, так как в ситуации х * игроки могут иметь различные выигрыши. Говоря точнее, мера справедливости ситуации в этом и в подобных случаях отра- жает меру справедливости самой игры: если правила игры таковы, что они предоставляют одному игроку большие выигрыши, чем другому, то ника- кая справедливость внутри игры не скомпенсирует ущемленного положе- ния второго игрока. Его стремление к справедливости должно поэтому заключаться не в каком-либо оптимальном поведении в рамках правил игры, а в изменении самих этих правил. Как известно, это обстоятельство имеет большое идеологическое значение, но его детальное рассмотрение выходит за пределы нашего предмета. 14
Нетрудно видеть, однако, что существование в бескоалиционной игре ситуаций, оптимальных в только что описанном смысле, является сравни- тельно редким исключением (как и любое совпадение максимумов не- скольких функций). В сущности как формально, так и содержательно реа- лизуемость этого принципа оптимальности соответствует слабости конф- ликтных черт моделируемого явления, близости целей его участников и, в конечном счете, возможности анализировать этот конфликт, минуя теорию игр. Из приведенных в J 2 примеров бескоалиционных игр только в первом имеется ситуация, оптимальная в указанном смысле (Студент хорошо подготовился, а Преподователь поставил ему зачет). В остальных приме- рах, соответствующих житейски достаточно реальным случаям, оптимальных в описанном смысле ситуаций нет. Естественно поэтому искать другие пред- ставления об оптимальности, быть может, не столь бесспорные, но зато бо- лее часто реализуемые. § 4. РАВНОВЕСИЕ 4.1. Одной из плодотворных форм реализаций представлений об опти- мальности можно считать понятие равновесия, состоящее в следую- щем. Ситуация назвается равновесной, если ни один из игроков не заин- тересован в том, чтобы ее нарушить, отклониться от нее. Формально это можно записать следующим образом. Пусть Г = </, {xj ze/, {Я,} /ет> (4.1) — бескоалиционная игра, а х- (Xj,.. . ,xw) - некоторая ситуация в ней. Если xj — произвольная стратегия игрока i, то положим X II x'i = (%! , . . . , Xj_ ! , x'i, xi+1,..., X„). Таким образом, x II х\ есть результат замены в ситуации х стратегии х,- иг- рока i на его стратегию хр. Ситуация х* называется равновесной (или ситуацией равновесия), если Я/(х* Их?)<^Яг-(х*) при любых/ Е/ и xz Е xz . (4.2) 4.2. Если игра Г из (4.1) является антагонистической, то ситуация х* имеет вид (х*,у*) и соотношение (4.2) может быть переписано в виде Я(х, у*)^Я(х*,у)<^Я(х*,у)при любыхxG хи у Е у (подробно об этом будет рассказываться в п. 4.2 гл. 1). В случае антаго- нистической игры ситуация равновесия называется ее седловой точкой. Функция выигрыша игры во всех ее седловых точках принимает одно и то же значение, которое называется значением игры и обозначается через иг. Значение антагонистической игры Г (см.п. 4.5 гл. 1) есть тот наибольший выигрыш, который игрок 1 может в ней уверенно получить. Тем самым оно равно той справедливой плате, которую игроку 1 естественно уплатить за возможность принять участие в игре Г. 4.3. Именно ситуации равновесия могут быть предметом устойчивых договоров между игроками. Всякая попытка зафиксировать в договоре неравновесную ситуацию будет означать, что хотя бы у одной из догова- ривающихся сторон найдется такая стратегия, что выбор ее вместо пре-
дусмотренной договором увеличит выигрыш этого игрока. Тем самым возникают мотивы к нарушению договора. Далее, ситуации равновесия являются для каждого игрока выгодными: соотношение (4.1) можно записать как Я/(х*) = max Ht(x* II Xi) | для любого/ Е/, х i т.е. каждый игрок i в ситуации х* получает свой наибольший выигрыш (в той мере, в какой это от него самого зависит). Наконец, равновесная ситуация может пониматься в том же смысле и с теми же оговорками, что и оптимальная ситуация из п. 3.9, и как справед- ливая: в систему (4.2) определяющих ее соотношений все игроки входят симметрично. 4.4. Принцип оптимальности в бескоалиционной игре, состоящий в осу- ществлении игроками ее ситуаций равновесия, является более слабым и чаще реализуемым, чем принцип, описанный в п.3.9. Из примеров, приве- денных в § 2, только в примерах из пп. 2.3 и 2.4 игра не имеет ситуаций равновесия. Однако каждый из примеров пп. 2.3 — 2.6 порождает пробле- матику, занимающую заметное место в теории игр. 45. Если в бескоалиционной игре ситуаций равновесия нет, как это, например, имеет место в игре из п. 2.4, то мы встречаемся с неразрешимой задачей, т.е. с задачей, решение которой отсутствует в классе уже имею- щихся объектов. Вместе с тем история математики полна примерами того, как встреча с неразрешимой задачей приводила к такому расширению класса имеющихся объектов, в котором нужное решение задачи содержа- лось. Пожалуй, первым примером задачи такого рода оказалось деление целых чисел, в классе имевшихся к тому времени целых чисел не всегда выполнимое. Для того чтобы задача деления одного числа на другое была всегда разрешимой, пришлось расширить понятие числа и ввести в рас- смотрение наряду с целыми еще и дробные числа. Сходным образом, при отсутствии в игре ситуаций равновесия, состав- ленных из имеющихся у игроков стратегий, естественно поставить вопрос о таком расширении понятия стратегии, чтобы среди ситуаций, состав- ленных из новых, обобщенных стратегий заведомо нашлись бы равновес- ные. 4.6. Отсутствие ситуации равновесия в игре из п. 2.4 напоминает доста- точно знакомую картину возможного отсутствия максимума функции на открытом множестве, например, функции Н (х) = х на интервале (0,1). Однако если присоединить к этому интервалу предельную точку х= 1, то максимум рассматриваемой функции достигаться будет, и именно на этой предельной точке. Оставаясь же в пределах исходного интервала, мы можем, как это было отмечено в п. 3.3, неограниченно к этому макси- муму приближаться. Ввиду непрерывности данной функции Н тем самым мы для любого е>0 указываем ”е-максимум” этой функции, т.е. такие значения аргумента хе, что выбор вместо хе другого ее значения может увеличить значение функции// не более чем на с. Очевидно, в рассматривае- мом случае можно взять произвольно хе Е (1 — е, 1). Точно так же и в условиях игры из примера п. 2.4 присоединение к ин- тервалам (0, 1) изменения переменных х и у их предельных точек х- 1 и У = 0 превращает пространство ситуаций игры в ’’полузамкнутый” квадрат 16
(0,1] X [0,1), на котором седловая точка функции Н(х9у) = х + ууже будет достигаться, а именно в точке с х*= 1 и у*=0. При этом ”по непрерывности” будет Н(1, 0) = 1. В исходном же открытом квадра- те при любом е > 0 найдется такая е-седловая точка (х€,у€), что любое из- менение стратегии хе игрока 1 не сможет увеличить его выигрыш по срав- нению с выигрышем в этой е-седловой точке более чем на е, а любое из- менение стратегии у€ игрока 2 не сможет уменьшить более чем на е его потери. Для этого, очевидно, достаточно взять хе G (1 — е, 1) и у€ G (0, е). Таким образом, отсутствие ситуаций равновесия в игре из примера п. 2.4 в известной мере преодолевается введением е-седдовых точек, су- ществующих при любом е > 0. 4.7. Отсутствие седловых точек в игре из п. 2.3 также приводит к нераз- решимой задаче, но и е-седловых точек здесь при некоторых положитель- ных е ввести не удается, и неразрешимость задачи требует несколько нетрадиционных обобщенных стратегий. Такими обобщенными стратегиями оказываются выпуклые комбинации исходных стратегий, которые называются смешанными стратегиями. Исход- ные же стратегии называются при этом чистыми. При этом значения функ- ций выигрыша на ситуациях, составленных из смешанных стратегий, опре- деляются путем продолжения их первоначальных значений ”по полилиней- ности”. Так сконструированная игра обычно называется смешанным расши- рением исходной игры. Одной из удобных интерпретаций смешанной стратегии является ее представление как случайного выбора игроками их чистых стратегий, причем случайные выборы различных игроков независимы в совокупности, а выигрыш каждого из них в ситуации в смешанных стратегиях определяет- ся как математическое ожидание случайного выигрыша. Нетрудно проверить, что в игре в ’’орлянку” из п. 2.3 ситуация равнове- сия (в данном случае ее можно называть седловой точкой) в смешанных стратегиях существует. Она составлена из смешанных стратегий игроков, состоящих в выборе каждым из них обоих своих чистых стратегий с поло- винными вероятностями. Как легко подсчитать, значение получившегося смешанного расширения игры равно нулю (см., например, § 18 гл. 1). 4.8. Игра ’’два бандита” из п. 2.5 ситуацию равновесия имеет: эта ситуа- ция состоит из первых стратегий игроков. Каждый из них несет в этой ситуации потери, равные 8. Однако в неравновесной ситуации, состоящей из вторых стратегий игроков, потери каждого из них будут равны единице. Таким образом, равновесная, устойчивая ситуация оказывается невыгодной, а выгодная — неравновесной. Нахождение в этой игре ситуации, которая одновременно являлась бы устойчивой и выгодной, оказывается тем самым неразрешимой задачей, которая, как мы уже можем себе пред- ставить, требует некоторого расширения понятия стратегии. Однако ситуация равновесия в чистых стратегиях здесь уже имеется, так что введение смешанных стратегий в данном случае делу не поможет, и приходится искать новое обобщение понятия стратегии. Таким обобще- нием может служить понятие условной стратегии, называемой также метастратегией, состоящей в том, что игрок выбирает свою исходную стра- тегию не априори, а в зависимости от того, какую стратегию выбирают другие участники игры. 2.Н.Н. Воробьев 17
В получившейся игре (’’метаигре”) можно снова говорить о метастра- тегиях, которые по отношению к исходной игре будут уже ’’вторыми метастратегиями”, и т.д. Оказывается (см. п. 19.3 гл. 3), что в бескоалици- онных играх двух лиц в должным образом выбранной третьей метаигре существуют выгодные ситуации равновесия. В частности, в надлежащем втором метарасширении игры ’’два бандита” существует ситуация равнове- сия, в которой каждый из игроков несет единичные потери (см. п. 16.4 гл. 3). 4.9. Игра ’’семейный спор” из п. 2.5 имеет две ситуации равновесия: состоящую из первых стратегий игроков и из их вторых стратегий. Тем самым возникает проблема выбора одной из них. Однако ни одна из этих двух ситуаций равновесия в чистых стратегиях не является справедливой: в одной из них больший выигрыш получает игрок 1, а в другой — игрок 2. Вместе с тем оба игрока входят в данную игру симметрично (если переменить имена игроков и названия их страте- гий, то игра перейдет сама в себя) . Значит, рассматриваемая игра в смысле своих правил является справедливой, и естественно потребовать, чтобы оптимальный ее исход также был справедливым, т.е. чтобы оба игрока получали в нем одинаковые выигрыши. Правда, в смешанных стратегиях здесь удается найти еще и третью, справедливую ситуацию равновесия (см. п. 13.1 гл. 3), но она оказывается менее выгодной, чем каждая из указанных чистых стратегий. Тем самым возникает противоречие между выгодностью и устойчивостью, с одной стороны, и справедливостью — с другой. Это противоречие может быть разрешено путем выбора одной из выгодных (и желательно — равновесных), хотя и несправедливых ситуа- ций с последующей компенсацией, которую оказывшийся привилегирован- ным в этой ситуации игрок выплачивает своему ущемленному партнеру. Развитие этой стороны вопроса приводит к построению так называемой кооперативной теории бескоалиционных игр. § 5. КООПЕРАТИВНАЯ ТЕОРИЯ 5.1. Каждая бескоалиционная игра Г = <Л (Х,),6,, (51) описывает некоторый, вообще говоря, достаточно сложный конфликт, не всегда поддающийся не только детальному изучению, но и даже точному описанию. Поэтому представляется естественным выбирать в этом кон- фликте отдельные его аспекты и подвергать их специальному анализу. Быть может, самым простым будет при этом выделение некоторого множества игроков К С /, называемого коалицией (бескоалиционное^ рассматриваемых игр в том и состоит, что никакие коалиции первоначально в правилах игры, т.е. в ее задании в виде (5.1), не предусмотрены), и рассмотрение антагонистической игры ПЛ) коалиции К как единого игрока против ее ’’окружения” 1\К в целом. При этом комбинации стратегий игроков из К (и из Г\К) составляют стратегии К (соответственно стратегии /\К).а сумма выигрышей игроков из Л' - в ы и г р ы ш к о а л и ц и и К. Значение v(K) (см. п. 4.2) этой игры естественно понимать как силу коалиции К в общей игре Г.
5.2. Соответствие K*-+v(K) для каждой коалиции КС1ъ условиях бескоалиционной игры Г из (5.1) называется ее характеристической функ- цией и обозначается через иг. Характеристическая функция иг дает представление о возможностях коалиций и отдельных игроков в условиях игры Г даже без указания множества стратегий и функций выигрыша в ней. Это напоминает написание уравнения химической реакции, которое уже дает важную информацию о происходящем процессе, оставляя ”за кадром” его интимную сущность, представления о молекулах как пространственных конфигурациях атомов, судьбы передаваемых электронов, игру электро- магнитных сил и т.д. Поэтому говорят даже о задании игр ”в форме харак- теристической функции”, противопоставляя его заданию игр ”в нормальной форме”, т.е. в виде (5.1), и в других формах, о которых в данной книге говориться не будет. Изучение характеристических функций игр и состав- ляет содержание кооперативной теории игр. 5.3. В рамках такой кооперативной теории исходами игры будут некото- рые распределения суммарного выигрыша, называемые дележами. Харак- теристическую функцию, рассматриваемую совместно с некоторым мно- жеством дележей, принято называть кооперативной игрой. Для коопера- тивных игр конструируются соответствующие принципы оптимальности и рассматривается связанная с ними проблематика. В некоторых из этих принципов оптимальности воплощаются представ- ления об устойчивости, которые получаются перенесением на соотношения между дележами приведенных в пп. 3.4 и 3.5 вариантов описания максиму- ма функции. Однако применительно к дележам эти варианты определения перестают быть эквивалентными и порождают различные принципы опти- мальности. 5.4. Вводимые принципы оптимальности имеют некоторые недостатки (если вообще можно говорить о недостатках достаточно естественно возни- кающих объектов): они не всегда реализуемы, а в тех случаях, когда реализуемы, могут допускать целые множества реализаций, причем каждая реализация может состоять из .многих дележей. К тому же реализации этих принципов могут не удовлетворять условиям справедливости в том смысле, как она определялась выше. Все сказанное заставляет искать новые принципы оптимальности. При этом плодотворным оказывается следующий путь: не переносить на случай дележей те или иные формулировки для максимумов на числовых мно- жествах, выясняя, какими свойствами полученные принципы оптимальнос- ти будут обладать, а наоборот, фиксировать те свойства (в том числе — некоторые черты справедливости), которые желательно видеть у интере- сующих нас принципов оптимальности, и конструировать принцип, который этими свойствами заведомо будет обладать. Такой подход к вопросу по су- ществу является аксиоматическим. § 6*. ПОСТАНОВКА ПРИКЛАДНЫХ ЗАДАЧ ТЕОРИИ ИГР 6.1. Принципиальная возможность применять теоретико-игровые методы к решению реальных задач возникает всякий раз, когда мы наблюдаем явление с множественными интересами его участников. Как отмечалось 2* 19
в п. 1.2, таким оказывается практически любое общественное, социально- экономическое явление. Однако констатация такого простого и едва ли не бесспорного факта еще не означает фактической возможности использовать теоретико-игровые методы для решения практических задач. На самом деле указание на возможность описания некоторых явлений в виде бескоали- ционных игр означает всего лишь соотнесение обширному классу явлений объективной действительности некоторого (также весьма обширного) класса математических моделей. Переход к уточнению этого соотнесе- ния, к установлению соответствия между более конкретными содержатель- ными явлениями, с одной стороны, и их конкретными математическими моделями — с другой, оказывается достаточно сложным. На недооценке трудностей этого процесса и было основано распростра- нившееся вскоре после создания основ математического аппарата теории игр представление об уже сложившейся возможности сформулировать в мате- матическом виде, на теоретико-игровом языке любую (или почти любую) социально-экономическую задачу. Дело, как казалось, оставалось за немно- гим: усовершенствовать математическую или хотя бы вычислительную технику. 6.2. Фактически речь здесь должна идти о нескольких различных аспек- тах математического обеспечения экономических и социально-экономичес- ких задач. Саму идею использования теоретике-игровой конструкции для описания той или иной группы социально-экономических явлений следует отнести к концептуальному аспекту математического обеспечения, которое состоит в формировании исходной системы базовых понятий и установлении в нем такой иерархической упорядоченности и логической структуры, которая поддавалась бы представлению в математическом виде. В случае теории игр такими базовыми понятиями являются, во-первых, понятия игрока (стороны в конфликте), стратегии (способа его действий) и выигрыша (оценки складывающейся ситуации), объединяемые в единое понятие игры, как это описывается, например, в п. 1.3, а, во-вторых, поня- тия оптимальности, как формального представления некоторого синтеза содержательных понятий выгодности, устойчивости и справедливости. Различные варианты понятий игры и оптимальности порождают различные разделы теории игр и различные подходы к их изучению. Формально они выделяются из общей теории игр ’’структурными” признаками, которые формулируются в абстрактных математических терминах. К таким призна- кам относятся те или иные ’'структурные” свойства множеств стратегий игроков. Например, представляет интерес говорить о топологических (в том числе — компактных), линейных (и в том числе евклидовых данной размерности) или измеримых пространствах стратегий. К структурным свойствам игры можно отнести также конечность множеств стратегий игро- ков. Структурным же свойством игры можно считать такое свойство функ- ций выигрыша, как их непрерывность (или полунепрерывность). 6.3. Первым шагом в направлении учета соответствия приятия игры более конкретным классам явлений может служить построение теоретико- игровых моделей. Под ними понимаются такие классы игр, которые,как и их компоненты, допускают некоторые единообразные содержательные 20
интерпретации. Фактически именно теоретико-игровые модели и состав- ляют большинство конкретных классов игр, изучение которых является предметом конкретных разделов общей теории игр. Разработка и анализ таких классов игр, являющихся теоретико-игровы- ми моделями, называют модельным аспектом математического обеспече- ния прикладных задач. Теоретико-игровые модели выделяются наложением на компоненты игры, помимо структурных условий, еще и дополнительных условий, более конкретных, чем структурные, но имеющих тем не менее качественный характер. Целая коллекция таких условий касается функций выигрыша игроков. К их числу относятся такие свойства функций выигрыша, как их выпуклость или другие особенности формы аналогичного характера, типич- ные расположения множеств точек разрыва в остальном непрерывных функций выигрыша и т.д. Часто теоретико-игровая модель представляет собой конечно-параметрический класс бескоалиционных игр. Некоторые классы кооперативных игр также имеют характер моделей. На протяжении данного курса нам придется неоднократно встречаться с теоретико-игровыми моделями. 6.4. Последующие шаги в конкретизации игр, подлежащих рассмотрению в связи с той или иной теоретико-игровой задачей, заключаются в последо- вательной, а в идеале — в полной индивидуализации игры. Фактически это обычно проявляется в установлении значений параметров при рассмотре- нии конечно-параметрических классов игр. Совокупность приемов и методов такой (полной или частичной) иденти- фикации задачи называется ее информаццонным обеспечением. Информационное обеспечение имеет тесные, хотя подчас и довольно сложные связи с модельным аспектом обеспечения. Информационное обеспечение опирается, с одной стороны, на прямые измерения значений параметров задачи и на статистические выводы, сделан- ные на основании таких измерений, а с другой - на модельные рассмотре- ния, согласно которым значение параметра получается как решение не- которой задачи. В качестве одного из простейших примеров укажем на вычисление конкретных значений некоторой функции (информацион- ное обеспечение) на основании ее задания дифференциальным уравне- нием с соответствующими начальными условиями (модельное обеспе- чение). Переход от постановки прикладных задач к их решению требует привлечения дальнейших аспектов математического обеспечения. §7*. ПРОБЛЕМАТИКА ТЕОРИИ ИГР 7.1. Имея экономическое и социально-экономическое происхождения, теория игр тем не менее является математической дисциплиной, одним из разделов математики. Поэтому она ставит перед собой математические задачи и решает их математическими средствами. Исходным материалом таких задач являются конкретные игры или классы игр (например, игры, определяемые с точностью до некоторых параметров, принимающих значения из заданных областей). Это могут быть бескоалиционные игры, кооперативные игры или же игры в иных формах, которые мы не вводим в рассмотрение. 21
7.2. Первый вопрос, который возникает по поводу любой игры или любого класса игр, заключается в выборе для этой игры (класса игр) принципа оптимальности. Говоря математически, речь идет здесь о том, по какому закону следует играм из некоторого класса ставить в соответ- ствие те или иные их исходы, их ситуации, которые и будут квалифициро- ваться как оптимальные. Выше мы видели, что говорить о едином принципе оптимальности не приходится, и это является не недостатком имеющегося представления об оптимальности, а свидетельствует о содержательной противоречивости и поэтому о множественности вариантов этой концепции. Подчеркнем, что здесь речь идет не только о свободном (или лучше сказать, обдуманном) выборе предмета исследования, но чаще о решении опреде- ленной математической задачи: нахождении отображения (класса игр в класс их исходов), обладающего определенными свойствами естественнос- ти, убедительности. Самой постановкой такого вопроса теория игр существенно отличается в настоящее время от других разделов математики, где категория целесооб- разного если и встречается, то носит пока еще неформальный, интуитивный характер. 7.3. После выбора для рассматриваемого класса игр принципа оптималь- ности проблематика теории игр в принипе перестает отличаться от пробле- матики других математических дисциплин. Она состоит в установлении зависимости между свойствами самих игр, с одной стороны, и свойствами их оптимальных исходов, реализаций выбираемых принципов оптимальнос- ти — с другой. Наиболее слабой формой такой зависимости является констатация реализуемости принципа оптимальности (т.е. существование оптимальных, исходов) для заданных классов игр. Наиболее сильной формой оказывает- ся исчерпывающее описание всех реализаций принципа оптимальности (оптимальных исходов) для всех игр данного класса. Можно сказать, что этот круг задач составляет методический аспект тео- ретико-игрового обеспечения прикладных задач. 7.4. Наконец, вопрос об эффективном, алгорифмическом нахождении реализаций принципов оптимальности составляет алгорифмический аспект теоретико-игрового обеспечения задач. Относящиеся к этому аспекту воп- росы исследуются преимущественно стандартными математическими мето- дами, хотя, разумеется, теория игр, подобно любой другой математической дисциплине, постоянно вырабатывает свои собственные приемы решения задач.
Глава 1 МАТРИЧНЫЕ ИГРЫ § 1. АНТАГОНИСТИЧЕСКИЕ ИГРЫ 1.1. Определение. Тройка Г = <х,у,Я>, (1.1) где х и у — непустые множества и Н: х X у -> R, называется антагонистичес- кой игрой. При этом элементы множеств х и у называются соответственно страте- гиями игроков 1 и 2 в игре Г, элементы произведения х X у (т.е. пары стратегий вида (х, у), где х G х и у G у) — ситуациями в ней, а функция Н — функцией выигрыша игрока 1, а также функцией выигрыша самой игры Г. □ В данной главе будут рассматриваться только антагонистические игры. Поэтому указание на их антагонистичность мы иногда будем опускать. Содержательно игру Г из (1.1) можно понимать как процесс, состоящий в выборе игроками 1 и 2 своих стратегий х Е х и у Е у и в получении игроком 1 от игрока 2 суммы (полезности) Я (х, у). Так как всякое дей- ствие, выполняемое одним лицом, отличается от действия, выполняемого другим лицом, мы можем считать, что множества х и у не пересекаются. 1.2. Между различными игроками могут иметь место те или иные соотно- шения /Простейшее из них, отражающее диалектическую связь тождествен- ного и иного, состоит в том, что одна и та же игра может рассматриваться с различных точек зрения. Определение. Антагонистическая игра Г' = <х',у',Я'> (1.2) называется аффинно эквивалентной антагонистической игре Г из (1.1), если х = х, у' = у и существуют такие вещественное а и положитель- ное к, что Н' = кН + а. (1.3) Аффинная эквивалентность игры Г' игре Г обозначается через Г' '"Т. □ Содержательно аффинно эквивалентные игры отличаются друг от друга лишь точками начала отсчета полезностей, приобретаемых (или теряемых) игроками в результате игры, а также масштабами измерения этих полез- ностей. .Поэтому аффинно эквивалентные игры мы можем рассматривать как различные формальные описания одной и той же игры. 1.3. Теорема. Отношение аффинной эквивалентности между играми является отношением эквивалентности, т.е. обладает свойствами:
Г ~ Г (рефлексивность) ; из Г' ~Г следует Г ~ Г' (симметрия) \ из Г' ~ Г и Г" ~ Г' следует Г" ~ Г (транзитивность). Доказательство. Для доказательства рефлексивности достаточно в (1.3) положить к .* 1 и а = 0. Для доказательства симметрии заметим, что из (1.3) следует причем, очевидно, 1/к > 0. Наконец, для доказательства транзитивности выразим Г” ~ Гг в виде Н" = к’Н' + а , где к’> 0. Вместе с (1.3) это дает нам Н" = кк‘Н + ка+а, причем кк'> 0. Тем самым Г" ~ Г. □ Из доказанного следует, что множество всех игр с данными множества- ми стратегий всех игроков разбивается на попарно непересекающиеся клас- сы аффинно эквивалентных игр. 1.4. Другой вид эквивалентности затрагивает игроков и их стратегии. Определение. Игры Г = (х,у,Я>и Г'= <х' у\Н'} называются изо- морфными, если существуют такие однозначные отображения лх: х х' и я2: У Учто Н’^х, тт2у) = Н(х, у) . Пара отображений тт = (Л1, л2) называется при этом изоморфизмом Г на Г'. Игры Г и Г' называются зеркально изоморфными, если существуют такие однооднозначные отображения тгх: х->у'и л2: у >х'что Н'(л2,у, Л1Х) = —Н(х,у). Пара отображений п = (ttj , тт2) называется зеркальным изоморфизмом Г на Г'. Если л — изоморфизм или зеркальный изоморфизм Г на Г', то принято писать Г'= л Г. □ Изоморфизм игр означает по существу просто некоторое переименова- ние каждым из игроков своих стратегий. Зеркальный изоморфизм означает еще и перемену ролей игроков. 1.5. Отношение изоморфности игр, подобно отношению аффинной экви- валентности, является отношением эквивалентности. Теорема. Изоморфность игр обладает свойствами рефлексивности, симметрии и транзитивности. Доказательство. Рефлексивность изоморфности вытекает из того, что в качестве изоморфизма л = (л15 л2) можно в этом случае взять пару тождественных отображений. Симметрия следует из того, что одно- однозначные отображения имеют однооднозначные обращения, а транзитив- ность — из того, что композиция однооднозначных отображений также является однооднозначной. Определение. Изоморфизм антагонистической игры на себя назы- вается автоморфизмом. □ 1.6. Нетрудно проверить, что если одна игра зеркально изоморфна дру- гой, то вторая игра зеркально изоморфна первой. Точно так же, если две игры зеркально изоморфны третьей, то они изоморфны между собой. Оба 24
эти простые утверждения не представляют особого интереса. Однако нетри- виальная возможность зеркальной изоморфности игры самой себе представ- ляется важной и приводит к следующему определению. Определение. Антагонистическая игра, зеркально изоморфная самой себе, называется симметричной. Зеркальный изоморфизм симметричной игры на себя называется зер- кальным автоморфизмом (или симметрией). □ В симметричной игре игроки имеют равные возможности, и одинаковое их использование приводит к одинаковым результатам. 1.7. Следующее соотношение между играми отражает диалектическую связь целого и части: одна игра может являться как бы частью другой. Определение. Игра Г'из (1.2) называется подыгрой игры Г из (1.1), если х'С х, у'С у, а функция Я*: x'Xy'->R является суже- нием функции Н. Поскольку подыгра Г'игры Г вполне определяется подмножествами х' и у множеств стратегий игроков в игре Г, ее можно называть х' X у'- подыгрой игры Г. хХ у"-подыгру игры Г иногда называют у'-подыгрой, а х X у-подыгру — х"-подыгрой. □ 1.8. В данной главе мы будем иметь дело лишь с такими антагонистичес- кими играми Г из (1.1), в которых множества стратегий игроков х и у конечны. Определение. Антагонистические игры, в которых каждый игрок имеет конечное множество стратегий, называются матричными играми. Это название объясняется следующей возможностью описания игр такого рода. Составим прямоугольную таблицу, в которой строки соот- ветствуют стратегиям первого игрока, столбцы — стратегиям второго, а клетки таблицы, стоящие на пересечении строк и столбцов, соответствуют ситуациям игры. Если поставить в каждую клетку выигрыш первого игро- ка в соответствующей ситуации, то получим описание игры в виде некото- рой матрицы. Эта матрица называется матрицей игры или матрицей вы- игрышей. □ Процесс ’’игры в матричную игру” удобно представить себе следующим образом: задается матрица Л; игрок 1 выбирает некоторую строку этой матрицы, а игрок 2 — некоторый ее столбец. Эти выборы осуществляются игроками независимо друг от друга. После того как выборы произведены, игрок 1 получает от игрока 2 выигрыш, равный числу, стоящему на пересечении выбранных строки и столбца. Разумеется, если это число отрицательное, то речь идет о фактическом проигрыше игрока 1. Матричная игра полностью определяется своей матрицей выигрышей. Поэтому игру с матрицей выигрышей А мы будем обычно обозначать через Гл или Г (Л). Если Л является m X «-матрицей (т.е. имеет тп строк и п столбцов), то будем говорить, что Гл есть тп X «-игра. Ясно, что матрицы выигрышей в изоморфных друг другу матричных играх отличаются друг от друга разве лишь порядками строк и столбцов, а в зеркально-изоморфных друг другу играх — еще и транспонированием с переменой знаков всех элементов. 1.9. В определении антагонистической игры в п. 1.1 множества страте- гий х и у не были наделены какой-либо структурой; в частности, на них не вводилось отношение порядка. Сама же запись матрицы предполагает 25
некоторый порядок ее строк и столбцов. Поэтому одна и та же конечная антагонистическая игра может быть описана различными матрицами, отли- чающимися друг от друга лишь порядком строк и столбцов. Так как на протяжении данной книги нам не придется заниматься ни формальным введением на множествах стратегий структуры порядка (самое большее, мы ограничимся теми структурами порядка, которые присущи этим множествам содержательно), ни преобразованиями игр, сохраняющими эти структуры, мы в данном вопросе ограничимся сделан- ным замечанием. 1.10. Как это обычно бывает, имеются свойства игр, не зависящие от мощности множества стратегий. Некоторые из этих свойств, описанию которых посвящены параграфы 2—6 данной главы, будут нами установ- лены для произвольных антагонистических игр. § 2. ОПТИМАЛЬНОСТЬ В АНТАГОНИСТИЧЕСКИХ ИГРАХ 2.1. Целью теории антагонистических игр, как и теории любого класса игр, является выработка для таких игр достаточно естественных представ- лений об оптимальности ситуаций и стратегий игроков и установление зависимости между свойствами игр, с одной стороны, и свойствами опти- мальных в сформулированном смысле ситуаций — с другой. Наиболее слабой формой такой зависимости можно считать признаки существования оптимальных ситуаций, т.е. реализуемости соответствующих понятий оптимальности, а наиболее сильной — пути (алгорифмы) их нахождения и перечисления. 2.2. В основу выработки понятия оптимальности для антагонистической игры можно положить следующие соображения. Если игрок 2 имеет в игре Г = (х, у, Н) только одну стратегию у0 (т.е. У = {У о}), то оптимальной стратегией игрока 1 будет та его стратегия, для которой функция Я(-, у о) : х -> R достигает на х своего максимума. Такое положение дел усложняется лишь незначительно, если игрок 2 имеет более одной стратегии (I у| >1), но можно говорить о случайном выборе им своей стратегии, т.е. об известном игроку 1 априорном вероят- ностном распределении Y на у. Будем для наглядности считать, что множество всех стратегий игрока 2 конечно: у = {У1, . . . , уп}. В этом случае вероятностное распределение Y состоит в приписывании каждому jy некоторой вероятности Y(y-), причем ¥(У1) + . . . + У (уп) = 1. Тогда за выигрыш игрока 1 при выборе им своей стратегии х естественно принять ожидаемый выигрыш — математическое ожидание выигрыша S Y(y)H(x,y) У У — и выбирать стратегию х так, чтобы максимизировать этот ожидаемый выигрыш. Заметим, что случайный выбор стратегии игроком также можно пони- мать как некоторую его стратегию. Систематическое рассмотрение таких стратегий занимает важное место в теории игр. К этом вопросу мы вер- немся в § 8. 26
2.3. Если игрок 2 имеет в игре Г более одной стратегии и априорные вероятности их использования игроку 1 неизвестны или даже вовсе не имеет смысла говорить об этих вероятностях, то все только что сказанное неприменимо. Однако на основе сказанного естественно считать, что оптимальность для игрока 1 состоит, во всяком случае, в некоторой максимизации, и остается только открытым вопрос, что именно следует максимизи- ровать. Говоря формально, это означает, что оптимальной стратегией игрока 1 в случае произвольной игры Г из (1.1) будет та его стратегия, на которой достигается максимум от некоторого функционала /, определенного на семействе всех функций вида ,у), где у Е у. Очевидно, функционал f должен сочетать в себе черты экзогенной характеристики задачи, связанной с априорным подходом к ней и универ- сальной для всего рассматриваемого класса теоретико-игровых задач, и черты ее эндогенной характеристики, вытекающей из ее конкретных условий. Мы рассмотрим два варианта функционала/. Если, как в п. 2.2, множество у конечно: у ={У1, .. ., Уп}> то функцио- нал / превращается в функцию fn от п переменных: fn (Н(х, у t), .. . 2.4. На первый взгляд представляется достаточно правдоподобным, чтобы функция fn была некоторым взвешенным средним своих аргумен- тов, т.е. некоторой выпуклой комбинацией: п fn (Н(х, У1),.. . ,Н{х, уп)) = у.), £а, = 1, (2.1) / = 1 где коэффициенты cq, . . ., ап ^0 — одни и те же для всего класса игр с |у| = п. Очевидно, такая функция / оказывается ’’жестко” экзогенной. Покажем, что такой подход приводит к противоречию. Ввиду равноправия стратегий игрока 2 функция fn должна быть симмет- ричной функцией своих,, аргументов. Это значит, что СЦ = .. . = = 1/и, так что 1 " fn(H(x,y^ .. . чН(х, упУ>=— S H(x,yf). (2.2) п j = 1 Такой выбор функции fn отражает высказанные еще Лапласом пред- ставления о целесообразности, состоящие в том, что если мы не знаем, в каких условиях приходится принимать решение (т.е. выбирать стратегию игрока 1 в игре, не зная, какую стратегию выберет игрок 2), то будет разумным ориентироваться на ожидаемый выигрыш в предположении равновероятной реализации каждой из стратегий игрока 2. Рассмотрим далее вместо игры Г из (1.1) игру Г" = <х, у',Я'>, получа- емую из игры Г присоединением к множеству у ={У\, - >Уп} нового эле- мента уо, причем Н(х, jo) = Н(х, у О для всеххЕ х. Фактически стратегию у о можно считать как бы ’’вторым экземпляром” стратегии у!. 27
Применяя к новой игре все проведенные выше рассуждения, мы по- лучим /л+1 (Я(х, уо), Я(х, п), • • • ,yj) = п 2 1 " = S а;Я(х,7у)=-----~Н(х,у1) +------2 Я(х,^-). (2.3) Но задача выбора игроком 1 оптимальной стратегии в условиях игры Г' по существу ничем не отличается от аналогичной задачи в игре Г (можно сказать, что в игре Г' по сравнению с игрой Г одна из стратегий просто дважды упоминается). Поэтому естественно, что оптимальные стратегии игрока 1 в играх Г и Г' должны совпадать, и поэтому должно быть /п(Н(х,У1),...,Н(х,уп)) = =fn+1 (Н(х,у0),Н(х,У1),... ,Я(х,у„)). Это, однако, противоречит соотношениям (2.3) и (2.2). 2.5. Вместе с тем, участвуя в антагонистической игре Г = <х, у, Н), игрок 1 может рассуждать следующим образом: ’’Предположим, что я выберу стратегию х; тогда в худшем для меня случае я получу min//(x,y). у Поэтому естественно, чтобы я выбрал такую стратегию х Е х, при которой этот минимум будет максимальным: max min//(x, у}. Этот ’’максимин” х у я получу уверенно, даже в том наименее благоприятном для меня случае, когда я ничего не знаю о намерениях противника, а он о моих, напротив, — все”. Такая схема рассуждения соответствует выбору в качестве функции fn оператора минимизации: fn (Н(х, У1Н(х, Уп)) = min Н(х, yf). (2.4) 1^7^ п Подобно линейной функции из (2.1), оператор минимизации однороден (степени 1). Кроме того, он симметричен, и эта симметрия, как легко убедиться, уже не приводит к противоречию того типа, который был опи- сан в п. 2.3. Такой выбор функции fn отражает сформулированное А. Вальдом пред- ставление о том, что принятие решения в условиях неопределенности разумно ориентировать на реализацию наименее благоприятной, мини- мизирующей альтернативы. Такой принцип оптимальности, основанный на максимизации минимального выигрыша, носит название принципа максимина, а выбираемая игроком 1 на его основе стратегия — максимин- ной стратегией. В соответствии с принципом максимина игрок 1 в игре Г может обеспечить себе максиминный выигрыш max min Н(х, у). XСху Су . Если отказаться от предположения о конечности множества у и о дости- жимости участвующих в последнем выражении экстремумов и соответст- вующим образом видоизменить проведенные рассуждения, то мы получим, что игрок 1 может в игре Г уверенно получить выигрыш, сколь угодно 28
близкий к максимину sup inf Н(х,у). (2.5) х£х у^у Этот максимин называется нижним значением игры Г и обозначается через иг. 2.6. Сходным образом в той же игре Г может рассуждать и игрок 2: ’’Предположим, что я выберу стратегию^; тогда в худшем случае я поте- ряю тахЯ(х, у). Поэтому мне естественно выбрать такую стратегию у, X при которой этот максимум будет минимальным: min тахЯ(х, у). Я не У х дам своему противнику выиграть больше, чем этот ’’минимакс”, даже в том наименее благоприятном для меня случае, когда я ничего не знаю о его намерениях, а он о моих — все”. Таким образом, разумной стратегией игрока 2 можно считать ту, при которой наибольшие его потери окажутся минимальными. Такой принцип оптимальности, основанный на минимизации максимальных потерь, назы- вается принципом минимакса, а выбираемая в соответствии с этим принци- пом стратегия игрока 2 — его минимаксной стратегией. Заметим, что при- нимаемый игроком 2 принцип минимакса является таковым с точки зре- ния игрока 1; с собственной же точки зрения игрока 2, оценивающего свой выигрыш — И, его следовало бы называть также принципом макси- мина. Поэтому часто говорят об использовании принципа максимина обои- ми игроками в антагонистической игре. После сделанной оговорки употреб- ление этого оборота не должно будет приводить нас к недоразумениям. Минимаксные потери игрока 2 в игре Г будут равны min max Н (х, у). У G У х G X Если, как и выше, снять предположение о достижимости экстремумов, то игрок 2 может сделать так, чтобы его потери не превосходили мини- макса inf sup Я(х,у). (2.6) у е у х е х Этот минимакс называется верхним значением игры Г и обозначается через v г. Минимакс (2.6) можно понимать также как такой выигрыш игрока 1, что получению им большей суммы может воспрепятствовать игрок 2. Естественно считать, что максимин (2.5) не должен превосходить мини- макса (2.6). В следующем параграфе это предположение будет доказано. 2.7. Смешанные экстремумы (2.5) и (2.6) (т.е. верхнее и нижнее значе- ния игры) обладают непосредственно проверяемыми свойствами инва- риантности. Теорема. Если Г = (х, у, Н) и Гг = <х\ у', Я'), причем Г ~ Г* и соблюдается (1.3), то иг/=^иг+а, (2.7) йг, =kvY+a. (2.8) 29
Если Г9 = я Г, где я — изоморфизм, то vr.=vT, vY,=vY. (2.9) Если Г = я Г, а я — зеркальный изоморфизм, то иг- = -Уг, vY, = -иг. (2.10) Доказательство. Для доказательства (2.7) достаточно написать v г, = sup infН' (х, у) = sup inf (kH(x, у) + а) = X У X у = к sup inf Н(х, у) + а = kv +а. X у Соотношение (2.8) доказывается аналогично. Если я — изоморфизм Г на Г', то v , = sup inf El'fjtx, тту) = sup inf H(x, у) = v г, ТТХ тту X у и мы получили (2.9), а если я — зеркальный изоморфизм, то v , = sup inf Н'(ттх, тту) = sup inf (—Н(х, у)) = -inf sup//(x, у) = -vr ттх тту ’ух ух дает (2.10). □ § 3. НЕКОТОРЫЕ СВОЙСТВА ЭКСТРЕМУМОВ 3.1. Из сказанного в предыдущем параграфе видно, что для антагонистической игры Г = < х, у, Н> существенный интерес представляют минимаксные характеристики ее функции выигрыша: sup inf Н(х, у), inf sup Н(х,уУ (3.1) л£х У^У yGyxGx Разумеется, здесь и дальше во всех случаях, когда будет установлена достижимость тех или иных экстремумов из (3.1), мы получим основание называть супремумы - максимумами, а инфимумы — минимумами. 3.2. Далее нам понадобится следующая лемма о монотонности экстремумов. Лемма. Ecnuf,g\ z->R и при любом zE z имеет место (3.2) то sup/(z)^ sup g(z), (3.3) z ez z£z inf f(z)^ inf g(z). (3.4) z G Z z z Доказательство. Возьмем произвольное e > 0 и найдем такое ze е z, что Sup /(z)^ /(zc) + e. z e z Тогда в силу (3.2) должно быть sup f(z)< f(ze) + e^ s(ze)+ei sup g(z) + e, z GE z z G Z и ссылка на произвольность е > 0 доказывает неравенство (3.3). Неравенство (3.4) доказывается аналогично. □ 30
3.3. Следствие. Пусть f, g: z -> R и a G R Тогда, если при любом z G z имеет место f (z) <>а, то sup f(z} <, а, Z GZ а если при любом z G z имеет место a #(z), to a< inf #G0- z G z Для доказательства первой части утверждения достаточно положить в предыдущей лемме g (z) = а, а для доказательства второй части - положить f (z) = а. □ 3.4. Теорема (неравенство минимаксов). Если Н: xXy-*R, то sup inf Н(х,у}< inf sup Н(х,у). (3-5) xGxyGy yGyxGx Доказательство. Пусть х — произвольный фиксированный элемент мно- жества' х. Тогда для любого у G у должно быть Н(х,у)^ sup Н(х, у). X G X Ввиду фиксированности х G х слева здесь стоит функция от у, и мы оказываемся в условиях второй части леммы п. 3.1, согласно которой inf Н(х,у)< inf sup Н(х,у). у Gy у Gy XG X Справа здесь находится константа, а значение х было выбрано произвольно. Значит, мы находимся в условиях первой части следствия п. 3.2, применение которой дает нам (3.5). □ 3.5. В конце п. 2.6 было отмечено, что неравенство (3.5) представляется естест- венным с теоретико-игровой точки зрения. Продолжим его анализ. Если в соотношении (3.5) имеет место равенство, то игрок 1 получает ровно столь- ко, какой предел его устремлениям кладет игрок 2. В этом случае использование игроками соответственно принципов максимина и минимакса (а, как отмечалось в п. 2.6, в таких случаях принято говорить об использовании принципа максимина обоими игроками) приводит к полному определению значений выигрышей игроков в антагонистической игре. Такую игру принято называть вполне определенной, а принцип максимина применительно к ней - реализуемым. Если же неравенство (3.5) является строгим, то игрок 1 может обеспечить себе получение меньшей суммы (максимин), чем предел, граница его выигрыша, устанав- ливаемая игроком 2 (минимакс). Разность между минимаксом и максимином ока- зывается тем количеством, разумное (” оптимальное”) разделение которого между игроками остается открытым. В этом случае использование игроками принципа мак- симина не приводит к определению значений выигрышей игроков и остается нереа- лизуемым. 3.6. В дальнейшем нам понадобится еще одно следствие леммы п. 3.2. Лемма. Если f,g: z~* R и при любом z G z |/(z) -g(z)\ g e, (3.6) TO | sup/(z) - sup#(z)| e (3.7) z z (справедливо и аналогичное неравенство, относящееся к инфимумам, но оно нам не понадобится). Доказательство. Неравенство (3.6) можно записать в виде двойного нера- венства #(z) - e^f(z) ^g(z) + е, или, пользуясь леммой п. 3.2, sup#(z)- sup/(z)^ sup#(z) + e, z z z что и означает (3.7). □ 31
3.7. Приведем в заключение следующее очевидное утверждение. Лемма. Если f: x->R и у с х, то inf /(z)^ inf /(z), (3.8) zEx zGy sup /(z)^ sup /(z). (3.9) zGy zex § 4. СИТУАЦИИ РАВНОВЕСИЯ (СЕДЛОВЫЕ ТОЧКИ) 4.1. Подойдем к вопросу об оптимальности поведения игроков в антаго- нистической игре с несколько иной стороны. Впрочем, как это выяснится в следующем параграфе, этот новый подход окажется равносильным тому максиминному (минимаксному) подходу, который был изложен в § 2. Естественно считать в антагонистической игре оптимальной такую ситуа- цию, от которой ни для одного из игроков невыгодно отклониться. Такие ситуации вводятся посредством следующего определения. Определение. В антагонистической игре Г = <х,у,Я> (4.1) ситуация (х*, у *) называется приемлемой для игрока 1, если Н(х, У*)<Н(х*, у*) при любом хе х. (4.2) Аналогично ситуация (х*у*) называется приемлемой для игро- ка 2, если Н(х*, у*) < Я(х*> у) прилюбомуЕу. (4.3) Множество всех ситуаций в игре Г, приемлемых для игрока 1, обозначает- ся через 1 (Г ), а приемлемых для игрока 2 - через 2 ( Г ). Эпитет ’’приемлемый” представляется в данном случае вполне естествен- ным: если ситуация не является приемлемой для игрока, то он может, изме- нив свою стратегию, увеличить свой выигрыш, т.е. с выгодой для себя отка- заться от этой ситуации. 4.2. Определение. В антагонистической игре Г = < х, у,Н > ситуа- . ция (х*, у *) называется равновесной или ситуацией равновесия, или седло- вой точкой игры, если она приемлема для каждого из игроков, т.е. если имеет место двойное неравенство, являющееся объединением неравенств Т\- - V 1 х । 1 \ 1 ? XI Я--Х ° Iх X >4 С I \_1X_LE 1 / 1 Si Н /0 /У а у/ Рис. 1.2 32
(4.2) и (4.3): Н(х, у*) < Я(х*, у*) Я(х*, у) при любых х G х и у G у. (4.4) Множество всех ситуаций равновесия игры Г обозначается через Й’(Г). Очевидно,^ (Г) = ^(Г) П &2(Г). Применительно к матричным играм говорят о седловых точках матрицы выигрышей. □ 4.3. Неравенство (4.4) выражает следующее свойство функции// в точке (х*,у*): при любом изменении значения переменной х значение функ- ции Н может только уменьшиться, а при изменении значения перемен- ной у — только увеличиться. Если представить себе поверхность, описывае- мую функцией Н в координатах х и у, то ситуациям равновесия будут соот- ветствовать седлообразные точки поверхности (рис. 1.1). Следует иметь в виду, что понятие седловой точки в теории игр отличает- ся от аналогичного понятия в геометрии двумя чертами. Во-первых, в гео- метрии седлообразность точки не зависит от направлений, в которых функ- ция двух переменных возрастает или убывает. В теории игр, напротив, для того чтобы точка была седловой, необходимо, чтобы на ней достигался максимум именно по первой координате и минимум по второй. Во-вторых, в геометрии седлообразность точки носит аналитический ха- рактер и связана с обращением в нуль соответствующих производных. В теории игр аналитичность экстремумов не обязательна. Кроме того, не- редко седловая точка оказывается на границе области задания функции. Например,, для функции Н(х, у) = х +у, заданной на квадрате 0 < х, у < 1, точка [1, 0] является седловой (рис. 1.2). В связи с этим поучительно вспомнить пример из п. 2.4. введения. 4.4. Множество ^(Г) всех седловых точек антагонистической игры Г обладает двумя важными свойствами, которые существенно упрощают ана- лиз антагонистических игр по сравнению с неантагонистическими. Теорема. Если в антагонистической игре Г = < х, у,Н ) взять (х'.у*), (х°,у°)е<$(Г\ (4.5) то, во-первых, //(%*, у*) = Н(х°, у°), (4.6) а, во-вторых, (х*,_у°)£^(Г) и (х°, j'*)G<£(r). (4.7) Доказательство. Из определения седловой точки в (4.4) следует, что при любых х G х и у G у имени место неравенства Я(х, j/*) < Н(х*, j/*) < Н(х*,у), (4.8) Н(х, у°)< H(x°,y°)<H(xQ, у). (4.9) Положим в(4.8) слева х = х°, справа у = у0, а в (4.9) слева х = х* и справа у = у *. Тогда будет Н(х\у*)<Н(х*,у*)< < Н(х*, yQ} < H(x\yQ) <Н(х°, j/*), (4.10) откуда следует (4.6). З.Н.Н. Воробьев 33
Далее, из (4.8) и (4.10) следует, что при любом xG х выполняется Я(х, у*) < Н(х*, у*) = Я(х°, у*), а из (4.10) и (4.9) - что при любом у G у выполняется Я(х°,у*)=Я(х°,у°) <Я(х°,у). Оба эти неравенства дают Н(х, у*) < Н(х°, у*) < Я(х°, у), т.е. (х°, у*) G Г£(Г). Соотношение (х*,у0) G ^(Г) получается симметричными рассуж- дениями. □ 4.5. Первое из установленных в этой теореме свойств множества всех ситуаций равновесия антагонистической игры, выражаемое равенством (4.6), иногда называется равноценностью ситуаций равновесия. Общее зна- чение функции выигрыша на множестве $(Г) всех ситуаций равновесия (седловых точек) игры Г есть как бы обусловленный объективно прави- лами игры Г выигрыш игрока 1 (проигрыш игрока 2) в ней. Поэтому оно называется значением игры и обозначается через v г или v ( Г ). Значение v г игры Г можно интерпретировать как разумную, ’’справедли- вую” плату, которую естественно взимать с игрока 1 в пользу игрока 2 за участие игрока 1 в игре Г против игрока 2. Подчеркнем, что свойство равноценности ситуаций равновесия не под- дается обращению: из (х*, у*) G ^(Г) и Н(х, у) = Я(х*, у*) вовсе не следует, что и (х, у) G (Г). Например, в 2 X2-игре с матрицей выигрышей 1 21 0 1 I левый верхний угол является, седловой точкой, а правый нижний — нет. 4.6. Второе же установленное в теореме п. 4.4. свойство седловых точек дает основание для следующих рассуждений. Очевидно, Й"(Г) С хХ у. Обозначим соответственно через §(Г) и <0Т(Г) проекции Й’(Г) на х и на у, т.е. положим §(Г) = {х: xGx и при некотором у Gy будет (х, у) G ^(Г)}, <£Г(Т)={у: у Gy ипринекотором xGx будет (х, у) G^r)}. Определение. Стратегия игрока 1 из §(Г) и стратегии игрока 2 из <^(Г) называются оптимальными стратегиями соответствующих игро- ков в игре Г. □ Ясно, что (Г) С S (Г) Х^Г( Г). Предположим, что (х*,у°) G <§(Г) X X ^Г(Г). Тогда по определению найдутся такие у* G у и х° G х, что (х*,у*) G ^(Г) и (х°,у°) G й’(Г). Но тогда по теореме п. 4.4 будет (х* у0) G 'й’(Г), и мы получаем ^(Г) D §(Г) X <У(Г). Следовательно, й*(Г) = §*(Г) X ^(Г). Такая возможность представления множества 'й(Г) называется его прямоугольностью. Заметим, что всякое прямоугольное подмножество декартова произведе- ния разлагается в декартово произведение подмножеств сомножителей 34
единственным способом. Поэтому если в двух играх Г и Г' множества седловых точек совпадают, то совпадают и множества оптимальных страте- гий каждого из игроков: §(Г) = §(Г') и <^(Г) = <^(Г'). Прямоугольность множества всех ситуаций равновесия антагонистиче- ской игры означает, что ситуацию равновесия в игре составляет любая пара оптимальных стратегий игроков в ней. Другими словами, прямоугольность множества <$(Г) означает взаимозаменяемость оптимальных стратегий: в ситуации равновесия игроки могут заменять составляющие ее оптималь- ные стратегии на любые другие свои оптимальные стратегии; при этом не изменяется ни факт равновесности ситуации, ни выигрыши игроков в ситуации. В качестве примера приведем 3 X 3-игру Г с матрице л выигрышей ~1 2 Г О W0 о _1 3 1_ Седловыми точками являются здесь все четыре угловых ситуации. То, что прямоугольное множество ^(Г) выглядит здесь несвязным, не имеет значения; порядок строк и столбцов матрицы может быть произвольно изменен (см. п. 1.9). § 5. ИНВАРИАНТНОСТЬ СЕДЛОВЫХ ТОЧЕК 5.1. Оптимальность поведения игроков в антагонистической игре, выра- жающаяся в выборе ими оптимальных в смысле п. 4.6 стратегий, оказывает- ся инвариантной относительно основных указанных в § 1 отношений между играми: аффинной эквивалентности, изоморфизма и отношения быть подыгрой. Точная формулировка этой эквивалентности заключается в следующих теоремах. 5.2. Теорема. Если Г = <х,у,Я> и Г' = <х,у,Я'> (5.1) - две аффинно эквивалентных игры, причем Н9 = кН + а, (5.2) к>Ь, то £(Г') = Ж),Ж') = ^(Г) и vrl=kvr + а. Доказательство. Приемлемость ситуации (х*, у *) для игрока 1 в игре Г означает, что она удовлетворяет соотношению (4.3). Но тогда должно быть и кН(х,у*) + а <^кН (х*, у*) + а для любого х€ х, т.е. в силу (5.2) Н9(х, у*) <Я'(х*,у*) для любого х G х. Таким образом, (х*,у*) € ^1(Г'), так что 2>i (Г) С (Г г). Из симметрии аффинной эквивалентности следует, что должно выполняться и противоположное включение; следовательно,(Г) — (Г'). Аналогично получается, что (Г) = 2 (Г 9). Следовательно, (Г) = (Г) А <g2 (Г) = (Г') А 2 (Г9) = (Г9). (5.3) 3 35
Таким образом, аффинно эквивалентные игры имеют одни и те же сед- ловые точки. Согласно п. 4.5 отсюда следует, что v (Г ') = kv (Г) + а, а согласно п. 4.6 — что §(Г) = 5’(Гг)и<^(Г) = <£Г(Г'). □ 5.3. Теорема. 1) Если я - изоморфизм игры Г = < х, у,Я > на игру Г 9 = < х\ у\ Н 9 >, то ^(Г') = я^(Г), /=1,2, £(Г')=я^(Г), и(Г') =и(Г). 2) Если я - зеркальный изоморфизм Г на Г 1, то ШГ')=яШ ^2(Г') = я^(Г), , (5.4) ^(Г') = яг£(Г), и(Г') =~и(Г). (5.5) Доказательство. 1) Пусть я = (яп я2) — изоморфизм Г на Г 9 . Соотношение (х*, у * ) G i (Г ) означает, что Н (х, у *) < Н (х*, у * ) при любом х G х. При переходе к ситуациям игры Г 9 на основании опреде- ления изоморфизма получаем Н'^уХ, я2у*) ^Я*(Я1Х*, я2у*) при любом х G х, или, ввиду однозначности отображения я1? при любом я^ G х'. Это значит, что (я^*, я2у*) G (Г '). Таким образом, я^1(Г) С (Г'). Но по симметрии изоморфизма должно быть и ^(Г') Ся^ (Г), так что ^(Г') = я^ (Г). Аналогично устанавливается, что Й’г (Г ') — я^2 (Г), после чего можно применить (5.3). Наконец, если (х*, у * ) G ^(Г), то, во-первых, Я(х*,у*) = »(Г), (5.6) а, во-вторых, по доказанному я(х*, у*) = (яхХ*, я2у*) G$2(Г'), и поэтому Я(я1х*,я2у*) = и(Г'). (5.7) На основании определения изоморфизма левые части (5.6) и (5.7) рав- ны; отсюда следует, что v ( Г 9) = и(Г). 2) Устанавливается почти такими же рассуждениями. Единственное от- личие состоит в том, что вместо приравнивания левых частей равенстъ (5.6) и (5.7) следует воспользоваться равенством Я(х*, у*) = = -Я(я2у*,Я!Х*). □ 5.4. Первая часть доказанной теоремы означает, что с точки зрения приемлемости и равновесности ситуаций или оптимальности стратегий игро- ков изоморфные игры не отличаются друг от друга. Вместо класса всех изоморфных друг другу игр достаточно рассматривать какую-нибудь одну игру из этого класса: все ее оптимизационные свойства будут присущи и всем изоморфным ей играм. 36
Вторая часть доказанной теоремы приводит к более глубоким (хотя, в сущности, столь же простым) следствиям. Из нее вытекает принцип двой- ственности для антагонистических игр, который может быть сформулиро- ван следующим образом. Пусть некоторый класс игр является ’’зеркально-замкнутым”, т.е. вместе с каждой своей игрой содержит зеркально изоморфную ей (так как все игры, зеркально изоморфные данной, изоморфны друг другу, мы, в со- ответствии с только что сказанным, можем говорить об одной зеркально изоморфной игре). Таким классом является, например, класс всех антаго- нистических игр или класс всех матричных игр. Пусть, далее, Т — теорема, справедливая для всех игр из класса Про- изведем в формулировке Т следующие переименования: Игрок 1 -> Игрок 2 Игрок 2 -► Игрок 1 Функция Н -+ Функция —Н, и обозначим полученную теорему через Т *. Тогда теорема Т * также спра- ведлива для всех антагонистических игр из класса СК . Теорема Т* будет называться двойственной к теореме Т. Очевидно, и наоборот, теорема Т двойственная к теореме Т*. Ввиду такой возможности мы далее будем все общие теоремы о свойст- вах оптимальных стратегий игроков и их связях со значением игры форму- лировать и доказывать лишь для стратегий игрока 1. Описанную связь между утверждениями, относящимися к стратегиям игрока 1, и утверждениями, относящимися к стратегиям игрока 2, мы да- лее будем называть принципом двойственности для антагонистических игр. 5.5 Следствие. Если антагонистическая игра Г симметрична {т.е. имеет зеркальный автоморфизм}, то S (Г) = (Г) uv (Г) = 0. Это вытекает непосредственно из (5.4) и (5.5). 5.6. Инвариантность седловых точек относительно соотношения между игрой и ее подыгрой выражается в виде следующей простой, но принци- пиальной теоремы, которая называется теоремой о независи- мости от посторонних альтернатив. Теорема. Если в (5.1) Г9 является подыгрой Г, то ^•(Г) П(х'Ху')С ^-(Г'), i = 1,2, (5.8) £(Г)П(х'Ху')С^(Г'). (5-9) Доказательство. Если ^(Г) П (х',у') = ф, то (5.8) выпол- гяется тривиальным образом. Возьмем теперь (х*,у*) Е (Г) п А (х* Ху1). Поскольку (х*,у*) есть приемлемая ситуация для игрока 1 в игре Г, должно быть Н (х, у * ) < Н(х*,у*) при любом х е х. Тем бо- лее это соотношение должно выполняться при любом х Е х'. Но у * Е у', так что функцию Н можно понимать в этом неравенстве как Н9. В ре- зультате мы получаем (х*, у *) Е (Г'). Случай i — 2 рассматривается аналогично, а (5.9) получается пересече- нием частей включений из (5.8). □ 37
5.7. Как показывает следующий пример, включение (5.8), при всей тривиальности его доказательства, обращению не поддается. Пусть Г = Гл и Г 9 =' Гл*, где Г1Д 2 [1 J 0 О 2 1 а А9 - обведенная подматрица матрицы А. Здесь, очевидно, пересечение ^(Гл) П П (х* Ху*) состоит из единственной ситуации, соответствующей элементу матрицы из ее левого верхнего угла, а ^(Г*) состоит из всех (четырех) ситуаций матрицы А9. 5.8. Переносить свойство независимости от посторонних альтернатив с седловых то- чек на оптимальные стратегии игроков, вообще говоря, нельзя: соотношение <^(Г) П П х* с (^(Г*) выполняться не обязано. В качестве примера достаточно рассмотреть игры гл и ГА9, где [1 1 21 _ 3 J J ’ а А9 — обведенная подматрица. Здесь $(Л) Ох9 состоит из обеих стратегий игро- ка 1, а с? (А9) — только из одной (именно, второй) его стратегии. 5.9. Вместе с тем для некоторых видов подыгр перенесение свойства независимости от посторонних альтернатив на оптимальные стратегии возможно. Теорема. Пусть Г - игра, а Г * - ее подыгра из (5.1). Тогда изу' = у следует ^(Г) П х' С $(г'). (5.10) Доказательство. Отвлекаясь от тривиального случая <^(Г) Пх’ = ф, возь- мем х е $ (Г) П х* и'произвольное у Е <£Г(Г). Тогда (х,у). е $ (Г) П ^Т(Г) = = ^(Г), и по теореме п. 5.2 (х,у) е ^(Г), т.е. хе $(Г₽). □ §6. СЕДЛОВЫЕ ТОЧКИ И МИНИМАКСЫ 6.1. Оказывается, что максиминный (минимаксный) подход к оптималь- ности в антагонистических играх равносилен стремлению игроков к седло- вым точкам в них. Эта равносильность выражается следующей теоремой. Теорема. Для того чтобы функция Н(х,у) на произведении хХу имела седловые точки, необходимо и достаточно, чтобы существовали (т.е. достигались) минимаксы max inf Н(х, у), minsup#(x, у) (6.1) х у ух и выполнялось равенство max inf Н(х, у) = min sup Н(х, у). (6.2) х у ух Доказательство. Необходимость. Пусть функция Н име- ет седловые точки и (х*, у *) — одна из них. Это значит, что Н(х, у*)<Н(х*,у*)<Н(х*, у), х£х, у&у. (6.3) Здесь Н (х*, у *) является константой. Поэтому, применяя к левой стороне этого неравенства утверждение п. 3.3, мы получаем supH(x,y*)^H(x*, у*) (6.4) X 38
и далее inf sup Н(х, у) <J sup H(x, у*) Я(х*, у*). (6.5) У x х, Применяя такие же рассуждения к правой стороне неравенства (6.3), мы получим в итоге Я(х*,у*)< inf£f(x*,y)< sup infЯ(х, у), (6.6) У х у т. е. inf sup Я(х, у) < sup inf Н(х, у), ух X у Но согласно теореме п. 3.4 противоположное неравенство также справед- ливо. Поэтому inf sup Н(х, у) = sup inf Я(х, у). (6.7) ух X у Значит, в неравенствах (6.5) и (6.6) крайние части равны. Следовательно, равны друг другу все части этих неравенств. В частности, inf sup Я(х, у) = sup Н(х, у *). У X X Таким образом, в выражении inf supН (х, у) инфимум достигается У X (именно, при у = у*), и ено может быть записано как min sup Н (х, у). У х Точно так же из (6.6) вытекает, что inf Н(х*, у) = sup inf Н(х, у), (6.8) у X у и поэтому вместо sup inf Н (х, у) мы можем записать max inf#(x, у). х У х у Ввиду сказанного равенство (6.7) может быть переписано как min sup Н(х, у) = max inf H(x, у), у X x у а это и требовалось. Достаточность. Пусть теперь минимаксы (6.1) существуют и равны. Обозначим через х* и у * значения переменных, на которых в них достигаются внешние экстремумы. Тогда будет max inf Я(х, у) = inf Я(х*, у). х у у Но, кроме того, ЫЯ(х*,у)<Я(х*,у*), У так что max inf Н(х, у) = inf Я(х*, у) < Я(х*, у* ), (6.9) х у у ~ и аналогично Н(х*, у*) < sup Н(х, у*) = min sup Н(х, у). (6.10) - X у X _о
Ввиду предположенного равенства минимаксов (6.1) все сравниваемые в (6.9) и (6.10) выражения равны друг другу. В частности, sup Н (х, у*) = = Н (х* у *). Это значит, что при любом х должно быть Я(х,у*)<Я(х*,у*). (6.11) Точно так же из (6.9) имеем inf Н(х*, у) = Я(х*, у*), откуда Я(х*,у*)<Я(х*,у). У (6.12) Неравенства (6.11) и (6.12) означают, что (х* у*) есть седловая точка функции Я. □. 6.2. Следствие I. В качестве компонент седловой точки могут быть независимо друг от друга взяты .любые х * и у *, на которых достигаются внешние экстремумы в минимаксах (6.1). Это было получено в ходе доказательства достаточности в предыдущей теореме. В теоретико-игровой терминологии это выглядит так: если игра с функ- цией выигрыша Я имеет седловую точку, то внешний максимум в макси- мине шахшГЯ(х, у) достигается на оптимальных стратегиях игрока 1, х у а внешний минимум в минимаксе min sup Я(х, у) — на оптимальных У X стратегиях игрока 2. 6.3. Следствие 2. Если (х* у * ) и (х°, у °) - седловые точки функ- ции Н, то ситуации (х* у0) и (х°, у*) также будут седловыми точками этой функции (см. рис. 1.3) . У (х°,у*) (х*,у*) О ..о__ У \ Т _____L. 1 Х° X* X Рис. 1.3 Это немедленно следует из предыдущего. Описанное свойство множества седловых точек называется его прямо- угольно стью. 6.4. Следствие 3. Значения функции во всех ее седловых точках равны друг другу. Действительно, из (6.10), (6.11) и (6.12) вытекает, что значения функ- ции в ее седловых точках равны общему значению ее минимаксов, которые в случае существования седловых точек достигаются. Таким образом, общее значение минимаксов функции выигрыша игры (если эти значения равны) равно значению игры. Поэтому исход игры, имеющей седловую точку, является предопределенным: он не зависит от искусства или глубины психологического анализа игроков, а зависит един- ственно от условий игры, которые исчерпываются заданием функции выиг- рыша Я. Это дает основание называть игры, имеющие седловые точки 40
(или для которых выполняется хотя бы равенство (6.2)), вполне опре- деленными. 6.5. В результате в ходе доказательства теоремы п. 6.1 были воспроизве- дены другим способом все утверждения теоремы п. 4.4. 6.6. Некоторое обобщение следствия из п. 6.4 содержится в следующем утверждении. Теорема. Если минимаксы (6.1) для функции Н существуют, т.е. если max inf Н(х,у) = inf#(xmax, .у), (6.13) х у у min sup Н(х, у) = sup Н(х, ^min), (6.14) у х у ТО max inf Н(х, у) Н(хт ах, уm in) min sup Н(х, у). (6.15) х у ух Доказательство. По (6.13) мы имеем max inf Н(х, у} = inf Я(хтах, у) ^H(xmax,ymin), х у у т.е. левую сторону (6.15). Правая сторона получается аналогично из (6.14). □. Мы видим, что выбор игроком 1 оптимальной стратегии дает ему выиг- рыш не меньший, чем значение игры, что бы ни делал при этом игрок 2. Равным образом выбор игроком 2 его оптимальной стратегии всегда причи- няет ему ущерб не больший, чем значение игры. Следовательно, выбор каж- дым из игроков своей оптимальной стратегии не имеет смысла скрывать от противника. 6.7. Содержательные рассуждения участников антагонистической игры Г = < х, у, Н), приводившиеся-в пп. 2.4 и 2.5, в связи с теоремой п. 6.1 мо- гут быть в случае игры с седловыми точками видоизменены следующим образом. Игрок 1 может сказать: ’’Пусть я выберу стратегию х; тогда в худшем сЛучае я получу min Н(х, у). Поэтому осторожность требует выбора с моей у стороны стратегии, на которой достигается max min Н(х, у). (6.16) х у Этот максимин я получу обязательно, как бы ни складывались обстоя- тельства”. Аналогичные рассуждения приведут игрока 2 к тому, что больше мини- макса min max Н(х, у) (6.17) у х он игроку 1 не даст. Так как, однако, в нашем случае минимаксы равны, при разумной игре каждого из участников итогом игры будет уплата игроком 2 игроку 1 41
вполне определенного числа (значения игры). Поэтому антагонистические игры с седловыми точками иногда называются вполне определен- ными. § 7. МАТРИЧНЫЕ ИГРЫ 7.1. Обратимся теперь непосредственно к рассмотрению матричных игр. Матричную игру с матрицей выигрышей Я будем, как указывалось, обозна- чать через Гд. Если не оговорено противное, матричная игра будет считать- ся т X w-игрой. Стратегии игрока 1 обозначаются номерами соот- ветствующих строк, а стратегии игрока 2 — номерами столбцов, z-я строка матрицы А обозначается через 4/, /-й ее столбец — через Ац, а элемент, стоящий на их пересечении, — через . Очевидно, ситуацией в матричной игре можно считать пару чисел (/,/), где i — номер строки матрицы выигрышей, / — номер ее столбца. Ввиду конечности множеств стратегий в матричной игре все относящие- ся к ее стратегиям экстремумы достигаются, так что минимаксы (2.5) и (2.6) могут быть записаны как max min , min max . (7.1) i i i i 12. Ситуация (z*, / *) в матричной m X «-игре является равновесной (седловой точкой), если для любого z = 1,..., т и любого / = 1,. .. . . . , « ZZ^y ♦ j* ZZy ♦ j. 7.3. В соответствии с теоремой п. 6.1 для существования в матричной игре седловых точек необходимо и достаточно, чтобы были равны мини- максы (7.1) : max min zzfy = min max aif- ; общее значение этих минимаксов i i j i равно элементу матрицы, соответствующему ее седловой точке. Если же эти минимаксы различны и внешние экстремумы в них дости- гаются на некоторых г* и /*, то (ср. п. 6.6) maxminz7z-y <. minmaxzz/y. i j i i 7.4. Проверка существования седловых точек матрицы и их нахождение могут быть проведены по следующей схеме: ai 2 Q\n —> minzzjy 7 1 °2 2 ' ’ * a2n r > mine 2/ 7 max min ax am\ am2 amn —> min^ i j — 7 maxfl/j maxfl/2 ... maxzzfn min max 42
Если полученные минимаксы различны, то в игре ситуаций равнове- сия нет. Если они равны, то все ситуации равновесия получаются как пары стратегий игроков, на которых в минимаксах достигаются внешние экстремумы. § 8. СМЕШАННЫЕ СТРАТЕГИИ 8.1. Если минимаксы элементов матрицы Л, т.е. maxminaz-y и i i min max а^ , отличны друг от друга, то на основании теоремы п. 6.1 игра с 7 i этой матрицей выигрышей ситуаций равновесия не имеет. В этом случае игрок 1 может обеспечить себе выигрыш max min , а i i игрок 2 может не дать ему больше, чем min max . Вопрос же о разделе 7 i между игроками разности min max — max min (а в рассматриваемом / i i i случае она положительна) остается, таким образом, открытым. Поэтому естественно, чтобы игроки в таких случаях искали дополнительные страте- гические возможности для уверенного получения в свою пользу возможно большей доли этой разности. Оказывается, что для этого им целесообразно выбирать свои стратегии случайно. 8.2. Определение. Случайная величина, значениями которой яв- ляются стратегии игрока, называется его смешанной стратегией. □. Таким образом, задание смешанной стратегии игрока состоит в указа- нии тех вероятностей, с которыми выбираются его первоначальные стра- тегии. Выбор игроком одной из своих стратегий с вероятностью 1, а каждой из остальных — с вероятностью 0, очевидно, означает выбор им этой выде- ленной стратегии. Поэтому каждая из первоначальных стратегий игрока также является его смешанной стратегией, их иногда называют чистыми стратегиями. Так как смешанная стратегия игрока описывается вероятностной схе- мой выбора им своих чистых стратегий, ее можно представить в виде вектора, компонентами которого являются вероятности, т.е. вещественные неотрицательные числа, сумма которых равна единице. В m X и-игре произвольную смешанную стратегию игрока 1 мы будем обычно обозначать буквой X, полагая X(i) = Таким образом, х=а1,...,и), (8.1) где (8.2) тп S ^ = 1. (8.3) f = 1 Смешанные стратегии игрока 2 будут обозначаться через Y и для них будет приниматься У(/) = т?7-. Таким образом, Y = (’?!, ••• ,4m), (8.4) 43
где щ ^0,...,т?„^0, (8.5) S т?.. = 1. (8.6) 7 = 1 8.3. Условие (8.3) можно записать в более компактном виде. Будем да- лее обозначать через Jp р-мерный вектор, каждая компонента которого рав- на единице: Jp = (1,..., 1). Тогда равенство (8.3) можно при помощи матричного произведения переписать как XJ =1, где т означает транспонирование вектора (т.е. в данном случае превращение векгор-строки в вектор-столбец), а равенст- во (8.6) — так: JnYT=l. 8.4. Совокупность всех векторов вида (8.1) образует, как известно, m-мерное евклидово пространство. Множество тех векторов, которые подчинены условиям (8.2) и (8.3), составляет (m — 1)-мерный симплекс, натянутый на орты £(1) = (1,0, ...,0), £(2) = (0,1,..., 0), = (0,0, .., 1). Такой симплекс мы иногда будем называть фундаментальным. В случае m = 2 фундаментальный симплекс является отрезком (рис. 1.4), в случае m = 3 — треугольником (рис. 1.5), в случае m = 4 — тетраэдром. Иногда бывает удобно рассматривать фундаментальный симплекс сам по себе, вне его связи с объемлющим его евклидовым пространством. В этом случае координаты ,..., его точек можно понимать как те неотрица- тельные массы, которые следует поместить в вершины симплекса для того, чтобы центр тяжести этих масс попал в данную точку. Поэтому координаты Ь ,..., точек симплекса обычно называются барицентрическими коор- динатами. В наших условиях в роли таких масс выступают вероятности. Чистым стратегиям игрока соответствуют такие точки, в которых одна из барицентрических координат равна единице, а остальные — нули. Оче- видно, эта точки являются вершинами фундаментального симплекса. 44
Фундаментальные симплексы смешанных стратегий игроков 1 и 2 в мат- ричной игре Г = <х,у,Н) обозначаются соответственно через X и Y. За- метим, что X и Y являются компактами. 8.5. Далее для нас окажется важным следующее понятие. Определение. Множество тех номеров i (чистых стратегий игро- ка 1), для которых в смешанной страгетии X = (51, ..., компоненты положительны, называется спектром смешанной стратегии X и обозна- чается через supp X. Аналогично спектром стратегии Y = (rfr, . . . , г]п) игрока 2 называ- ется множество supp Y тех его чистых стратегий /, для которых ??/ > 0. □ Очевидно, множество всех смешанных стратегий игрока 1 из X, спектры которых содержатся в данном множестве х С х, составляет некоторую грань симплекса X, а именно ту его грань, на которой обращаются в нуль все барицентрические координаты, соответствующие стратегиям из раз- ности х\х\ Эту грань мы будем обозначать через Хх>; вместе с тем эту же грань можно понимать и как множество всех смешанных стратегий X игрока 1 в х'-подыгре исходной игры. При этом оба описанных представле- ния этой стратегии в виде вектора X = (51, ..., ^п) будут отличаться друг от друга лишь наличием (при ее понимании как стратегии в исходной игре) или отсутствием (при ее понимании как стратегии в подыгре) неко- торого числа нулевых компонент вектора. Во всех случаях, когда это не сможет привести нас к недоразумению, мы не будем различать смешанные стратегии со спектром, содержащимся в данном множестве х стратегий в некоторой игре и соответствующие им стратегии х'-подыгры. Все сказанное можно с соответствующими изменениями повторить и применительно к составляющим фундаментальный симплекс Y смешанным стратегиям игрока 2 и граням Yy, этого симплекса. § 9. СМЕШАННОЕ РАСШИРЕНИЕ МАТРИЧНОЙ ИГРЫ 9.1. По любой матричной игре можно построить игру, стратегиями кото- рой являются смешанные стратегии исходной матричной игры. Определение. Пара (X Y) смешанных стратегий игроков в матрич- ной игре, где X и Y как случайные величины являются независимыми, называется ситуацией в смешанных стратегиях в этой игре. □ Если конкретно мы имеем дело с m X и-игрой Гд и стратегиями X = = (51, ..., Y = (т?!, ..., Tin) игроков в ней, то в условиях ситуации в смешанных стратегиях каждая обычная ситуация (в чистых стратегиях) (Z, j ) по определению оказывается случайным событием и, ввиду независи- мости X и Y, реализуется с вероятностью . Поскольку в этой ситуации игрок 1 получает выигрыш а^ , математическое ожидание его выигрыша в условиях ситуации в смешанных стратегиях (X У) равно тп п 2 2 (9.1) i=i /=1 1 Это число принимается за выигрыш игрока 1 в ситуации в смешанных стра- тегиях (X У) и обозначается через Я(Х Y). 9.2. Таким образом, мы приходим к новой игре, которую можно описать следующим образом. 45
Определение. Смешанным расширением матричной игры Г = = <х, у, Н) называется антагонистическая игра Г = <Х, Y, Н), в которой множествами стратегий игроков являются множества их смешанных страте- гий в исходной игре, а функция выигрыша игрока 1 определяется (9.1). В обозначениях матричных произведений выражение (9.1) можно пе- реписать как m п пг 2 S а^= S ^А,ГТ = ХАУТ. i=1 7 = 1 i=1 9.3. Вспоминая определение приемлемых ситуаций в антагонистической игре, получаем, что ситуация (Z*, У*) в смешанном расширении матричной игры является приемлемой для игрока 1 тогда и только тогда,, когда при любом х G х выполняется неравенство XAY*T <X*AY*T. (9.2) Эта ситуация приемлема для игрока 2 тогда и только тогда, когда X*AY*T^X*AYT при любом YGY. (9.3) Наконец, она является седловой точкой (ситуация равновесия) тогда и только тогда, когда выполняется двойное неравенство XAY*T £X*AY*T^X*AYT при любых XGX и YGY. (9.4) Произведение X*AY*T является значением смешанного расширения матричной игры. 9.4. Лемма (о переходе к смешанным стратегиям). Если Y - произвольная стратегия игрока 2, а - некоторое число и AhYT^a, (9.5) то для любой смешанной стратегии X = (£х, . . . , ) G X игрока 1 XAYT^a. Доказательство. Умножим каждое из неравенств (9.5) почлен- но на YT а^ (ввиду того, что 0, знак неравенства не из- меняется) и сложим все полученные неравенства. Получим m m 2 ^iAi.YT=XAYr^a S =a, i=1 7 = 1 а это и требовалось. □ 3 амечание. Совершенно так же осуществляются переходы к сме- шанным стратегиям в неравенствах вида AhYT i = 1,... ,т, ХА- <а, j=l,...,n, ХА. >а, j=l,...,n. 9.5. Лемма о переходе к смешанных стратегиям позволяет сводить ус- ловия приемлемости и равновесности ситуаций, заданные в смешанных стратегиях, к аналогичным условиям, заданным в чистых стратегиях. Т е о р е м а. Для того чтобы ситуация (I* У*) была в игре ГА при- емлемой для игрока 1, необходимо и достаточно, чтобы при всех i = ЛА
= 1,..., т выполнялись неравенства ЛЛУ*Г <X*AY*T. (9.6) Для ее приемлемости для игрока 2 необходимо и достаточно, чтобы при всех / = 1,... ,п выполнялись неравенства X*AY*T £.Х*А'Р (9.7) а для ее равновесности необходимо и достаточно, чтобы при всех i = 1,... ...,m и j = 1,... ,п выполнялись двойные неравенства AitY*T<Л*АТ*т<.Х* A.,-. (9.8) Доказательство. Необходимость очевидна, так как неравенство (9.6) является частным случаем неравенства (9.2). Для доказательства достаточности применим к неравенству (9.6) лемму о переходе к смешан- ным стратегиям. Это даст нам неравенство (9.2). Аналогично сопоставле- ниям (9.3) с (9.7) и (9.4) с (9.8) доказываются остальные утверждения теоремы. □ 9.6. Матричная игра, очевидно, является подыгрой своего смешанного расширения. Для седловых точек этих игр справедливо обращение свойст- ва независимости от посторонних альтернатив (п. 5.4). Кроме того, это свойство распространяется и на оптимальные стратегии игроков (см. п. 5.6). Теорема. Если Г = <Х, Y, И) - смешанное расширение матричной игры Гд = Г, то ^(Г) =(хХу)Г> ^(Г), (9.9) ^(Г)’(хХу)П«,(Г), (9.10) $(Г) = (хХ у) Л 'й(Г), (9.11) §(Г) = хЛ §(Г), (9.12) <^(Г) = уЛ <^(Г), (9.13) н(Г) = и(Г). (9.14) Доказательство. Далее, как обычно, i* и /* будут считаться чистыми стратегиями игроков 1 и 2. Включение (/*,/*)€ .(Г) означает, что а..* ^.а.„ i = 1, . . . , m. — «Л* J J ~ . Тем самым Г и/* в ролях X* и У* удовлетворяют неравенству (9.6), равносильному приемлемости ситуации для игрока 1 в игре Г. Значит, (/*,/*) G ^i(f) , и мы получаем (9.9) . Аналогично с помощью (9.7) получаем равносильность (/*, /*) Е rS2(T) и(/*,/*)е «2(Г),т.е. (9.10). Такое же использование (9.8), превращающегося теперь в ai^ = ai*j* ='ai*i тя (9.15) (или просто пересекание (9.9) и (9.10)), дает (9.11). Представление £(Г) = (хХу) Л 'Й(Г) = = (х X у) Л ( § (f) X У(Г)) =(хП 8 (Г)) X (у Л У(Г)) дает нам (9.12) и (9.13).
Наконец, (9.15) означает, что число я.* .*, являющееся значением игры Г, оказывается при этом значением функции выигрыша в одной из седло- вых точек Г, т.е. значением игры Г. □ Таким образом, из наличия у матричной игры значения следует его наличие и в ее смешанном расширении, а также равенство этих двух зна- чений. Это дает нам основание говорить просто о значении матрич- ной игры Гх, обозначая его просто через v А и прибавляя, когда это нужно, слова ”в чистых стратегиях” или ”в смешанных стратегиях”. Подчеркнем, что в ходе доказательства этой теоремы мы опирались лишь на теорему о независимости от посторонних альтернатив (п.5.3) и на лемму о переходе к смешанным стратегиям. Поэтому справедливость каждого из утверждений доказанной теоремы не связана с конечностью антагонисти- ческой игры Г, а справедливость первых трех ее утверждений — даже с антагонистичностью Г. 9.7. На смешанные расширения распространяется отношение аффинной эквив ал ентности. Теорема. Если две матричные игры Гл и Гв аффинно эквиваленты, то их смешанные расширения также аффинно эквивалентны. Доказательство. Предположим, что Гл Это значит, что у Г; и Гв совпадают множества чистых стратегий первого игрока, а также множества чистых стратегий второго игрока. Поэтому у них должны совпа- дать также и множества смешанных стратегий игроков. Далее, пусть для каждой ситуации (/,/) будет ai} = kb у + а, где к > 0. Тогда, умножая это равенство на ^ri- и суммируя по всем i =1, . . . , m и / = 1,..., п, мы получаем m п m п m п Z X = 2 2 ayrif. = к Е S ^Ьу-п+а, i = ij = 1 i = 1/ = i i = i j = i или XA YT = kXBYT +a при любой ситуации (X, Y) в смешанном расшире- нии игры Гл . Это и означает аффинную эквивалентность смешанных расширений игр. □ 9.8. На смешанные расширения естественным образом распространяются отношения изоморфизма и зеркального изоморфизма игр. Теорема. Если я - изоморфизм матричной игры Г = { х, у, Н ) на матричную игру Г' = < хуЯ'}, Г и Г' - смешанные расширения этих игр и для любых IG Х,х€ х, У G Y д у у положено (у Х)(ттх) = Х(х) , (9.16) (яУ)(яу)=У(у), (9.17) то так продолженное отображение я оказывается изоморфизмом Гна Г'. Аналогичное утверждение имеет место для зеркального изоморфизма игр Дока з а т е л ь с т в о. Запишем Я(Л\У> 1 X Х(х)Н(х, y)Y(y). (9.18) л- х г е у Но х пробегает х (ау пробегает у) тогда и только тогда, когда ях пробегает 48
х' (а я у пробегает у'); по предположенной изоморфности1 игр Г и Г' должно быть Н(х,у) = Я'(ях, яу). Поэтому с учетом (9.16) и (9.17) мы можем переписать (9.18) как Н(Х, У) = Z S (яХ)(ях)Я'(ях, тту)(7г Y)(yy) = Н'^Х, tiY) . ттх €= X ' тту £у' Случай зеркального изоморфизма игр рассматривается аналогично. □ 9.9. Далее мы докажем, что ситуация равновесия в смешанном расшире- нии существуют для любой матричной игры. Ввиду сказанного в п. 6.1 для доказательства этого достаточно устано- вить существование и равенство минимаксов max inf XAYT и min supX4yr. (9.19) у у у х Фактически нами будет далее доказано существование и равенство мини- максов max min XAYT и min max XAYT. (9.20) x y y x § 10. СУЩЕСТВОВАНИЕ МИНИМАКСОВ В СМЕШАННЫХ СТРАТЕГИЯХ 10.1. Нашей ближайшей задачей является доказательство существования в матричных играх ситуаций равновесия в смешанных стратегиях. Согласно теореме п. 6.1 для этого необходимо и достаточно установить существова- ние и равенство минимаксов max inf ХА Yт и min sup XAYT. х Y у x В этом параграфе будет доказано существование (достигаемость) внешних экстремумов в написанных минимаксах,, а в § 13 — их равенство. 10.2. Лемма. При любом Yq G Y имеет место sup XAYq = max Aj. YqT, (10.1) x i а при любом Xq EX — inf Xo A Y T = min Xq A.(10.2) у / Доказательство. Очевидно (см.,например,п.3.6), max Л,. Yq sup XAYq . i х Если предположить, что это неравенство — строгое, то найдется такое е > 0, что A^.Yq < sup XAYq —е х при любом i = 1,... ,тп. Но тогда по лемме о переходе к смешанным стратегиям (п. 9.4) будет XAY? < sup XAY? — е X при любом IGX. Возможный согласно следствию из п. 3.3 переход к 4.Н.Н. Воробьев 49
супремуму по X Е X дает нам sup ХА У? < sup ХА У? - е, X X чего не может быть. Равенство (10.2) доказывается аналогично. □ 10.3. Следствие 1. Существуют (достигаются) экстремумы max ХА при любом Уо Y, х min Xq A Yt при любом XQ Е X. у Это вытекает непосредственно из равенств (10.1) и (10.2). □ 10.4. Следствие 2.-Для существования в смешанном расширении матричной игры ситуаций равновесия необходимо и достаточно доказать существование и равенство минимаксов max minX4.z и min max Aj. YT. (10.3) x j Y i Это следует из n. 9.6 и равенств (10.1) и (10.2). □ 10.5. Лемма. Значение max ХАУТ (10.4) X является непрерывной функцией У, а значение min XAYT - непрерывной Y функцией X. До казательство. Ограничимся доказательством первого утверж- дения леммы. Согласно лемме из п. 10.2 нам достаточно доказать непрерыв- ность по У переменной тахЛ,-. Ут, (10.5) i являющейся функцией от У. Очевидно, что при любом i скалярное произведение At. YT в силу его линейности всюду непрерывно по У. Так как i принимает конечное число значений, все скалярные произведения At. YT всюду равностепенно непре- рывны по У. Это значит, что по любому е > 0 найдется такое 6, что при | У' - У" | < 5 будет | Af. Y'T - At. Y"T | < e при любом i = 1,. .., тп. Но тогда по лемме п. 3.6 должно быть и I тахД-. Y’T — max Ah Y"T | < e, i i а это и требовалось. □ 10.6. Теорема. Минимаксы max пппХ4Уг и min max XAYT сущест- вуют, х y Y х Доказательство. По предыдущему max ХА YT есть непрерывная х функция У. Будучи задана на компакте Y, она принимает наименьшее значение, т.е. достигается минимакс min maxX4 YT. y x В силу аналогичных причин достигается и максимин max пйпХ4Уг. □
§ 11. ВЫПУКЛЫЕ МНОЖЕСТВА 11.1. Приведем некоторые вспомогательные сведения о выпуклых множествах *). Определение. Выпуклым множеством в векторном (линейном) пространст- ве называется такое множество S, что для любых U, V G S и произвольного XG [0, 1 ] выполняется kU+ (1 - X) V G S (см. рис. 1.6), т.е. вместе с любыми двумя своими точками U и V множество S содержит весь соединяющий их прямолинейный отре- зок. □ Примерами выпуклых множеств могут служить замкнутые полупространства R” т.е. множества всех векторов Z G R", для которых UZT с при заданных t/G Rn и cGR. Выпуклые множества имеют большое значение в теории игр. Далее нам понадобят- ся следующие свойства выпуклых множеств. 11.2. Если множество S — выпуклое, Х19 ..., Х^ ES, и ,.'.. , - неотрицатель- к к ные числа, для которых S = 1, то вектор Z az- А), называемый выпуклой комбина- il г=1 цией векторов Х19 .... Х^, также принадлежит 5. Совокупность всех выпуклых комбинаций данных векторов называется их выпуклой оболочкой. Выпуклые оболочки конечных множеств называются выпуклыми многогран- никами. 11.3. Пересечение любого семейства выпуклых множеств само является выпук- лым. В частности, выпуклыми являются пересечения замкнутых полупространств. Оказывается, что все такие ограниченные пересечения и только они суть выпуклые многогранники **). 11.4. Имеет место следующая теорема об отделимости выпуклых множеств. Если S и Т — два непересекающихся выпуклых множества, то существует разделяющая их гиперплоскость, т.е. такая гиперплоскость UZT = с, что UZ? > с при Z G S, UZT < с при Z G Т. 11.5. Определение. Точка U называется крайней точкой выпуклого мно- жества S, если C7G 5 и не найдется таких двух различных точек U',U" Е S, что U = = (U' + U")/2. □ Справедлива следующая теорема Каратеодори ***).Если S - выпуклое замкнутое ограниченное подмножество R" то каждая его точка представима в виде выпуклой комбинации не более чем п + 1 его крайних точек. *) Более обстоятельную информацию о выпуклых множествах можно почерпнуть из книги Р. Рокафеллара ’’Выпуклый анализ” (М., ’’Мир”, 1973), а также из любого достаточно подробного учебника по линейному программированию. **) Соответствующее доказательство читатель может найти в книге: Ашма- нов С.А. Линейное программирование. - М.: Наука, 1982. *♦*) См., например: Рокафеллар Р. Выпуклый анализ. - М.: Мир, 1973, с. 169. 4* 51
11.6. Частным случаем выпуклого множества является выпуклый конус. Определение. Выпуклым конусом в векторном пространстве называется такое множество С, что каковы бы ни были U', U" G С и неотрицательные Л' и , имеет место \'U' + Х"£/" G С. □ Очевидно, нулевой вектор 0 принадлежит всякому выпуклому конусу. Определение. Если заданы векторы Ц, ..., то являющаяся выпуклым к конусом совокупность всех векторов вида S X- Uif где X- > 0 при i = 1,.. ., к, назы- 1 = 1 вается выпуклым конусом, натянутым на векторы ЦU^. □ § 12. ЛЕММА О ДВУХ АЛЬТЕРНАТИВАХ Лемма (о двух альтернативах). Какова бы ни была тХп- матрица А, имеет место одна из двух возможностей („альтернатив”) : 1) существует такой вектор X G X, что XAj 0для всех f = Y ... 2) существует такой вектор Y G Y, что A^Y7 <& для всех i = 1,... ,m. Доказательство. Составим выпуклую оболочку фундаменталь- ного симплекса X (т.е. всех векторов ,. .., ) и всех векторов A.j и обозначим ее через Л. Нам могут при этом представиться две возмож- ности: а) 0 4 Л (рис. 1.7). В этом случае точка 0 (согласно п. 11.4) отделима от множества Л некоторой гиперплоскостью. Мы можем считать, что эта гиперплоскость проходит через точку 0, а все множество Л лежит по одну сторону от нее. Пусть UZT = 0 — уравнение этой гиперплоскости, и для любого / Л UZ?>0. (12.1) В частности, должно быть UEW г>0 для каждого i = 1, ..., m. Рас- смотрим числа UE^ т = щ (i- 1, ... , тп). Так как все эти числа поло- жительны, их сумма также положительна: m и- S и> 0. i = 1 Составим теперь вектор (Uy um \ ---- L и---и / Очевидно, что X G X. 52
Поскольку м>0, из (12.1) следует, что XZT = — UZT > о и для любой точки Z G Л. В частности, это будет и для всех точек A.f. XA.j > > 0, и мы нашли требуемый вектор X. б) 0 е Л (рис. 1.8). В этом случае (согласно п. 11.2) точка 0 может быть представлена в виде выпуклой комбинации вершин многогранника Л , т.е. в виде выпуклой комбинации А. х,..., А.п, £(1),..., Е("7). Пусть S а/Л./ + £ е,Е(/)=0. • (12.2) j=i |=1 Здесь ап, elt ... ,ет 0и п т S af.+ S е, = 1. (12.3) /=1 ' /=1 Равенство (12.2) является векторным. Расписывая его покоординатно, получаем S оьл,-+е,=0. (12.4) / = 1 Ввиду того, что ef- > 0, должно быть Z 0. (12.5) Далее мы имеем a- S а-^>0. (12.6) / = 1 Если бы было а = 0, то ввиду неотрицательности каждого из чисел а- все они должны были бы быть равны нулю: а- = 0 (/ = 1,..., м). Но тогда из (12.4) следовало бы, что и все числа равны нулю, а это противоречит равенству (12.3). Следовательно, в действительности в (12.6) имеет место знак строгого неравенства. Положим .теперь aj/a = r]- и составим вектор У= (тп, ...» 7?н). Как легко проверить, Y Е Y. Ввиду того, что а> 0, мы можем левую часть (12.5) разделить на а, не нарушив знака неравенства. В результате мы получим п S ту atj =А/. YT < 0 для всех г = 1.....т. Следовательно, вектор Y является искомым. □
§ 13. ТЕОРЕМА О МИНИМАКСАХ Теорема. Какова бы ни была матрица А, max min Х4 У7= min maxX4 У7. х Y у х Доказательство. Применим к матрице А лемму о двух альтер- нативах. Предположим, что осуществляется первая альтернатива, т.е. существует такой вектор X0, что X0X.zgO, /=1,...,и. (13.1) Переходя на основании леммы п. 9.4 к смешанным стратегиям, мы получим Х0А YT « О (Уб Y). Так как это неравенство справедливо для любого вектора У Е Y, в силу следствия п. 3.3 должно быть ттХ0ЛУт^О (13.2) ' и тем более max min ХА YT > 0. х Y Пусть теперь осуществляется вторая альтернатива, т.е. существует такой вектор У0,что Л/.У^ 0, i= (13.3) Переход к смешанным стратегиям дает нам ХА Yq 0 для всех ХЕ X. Поэтому должно быть и max ХА Yq 0, и тем более х min max ХА YT 0. (13.4) Y х Мы видим, что в зависимости от осуществления той или иной альтерна- тивы выполняется неравенство (13.2) или неравенство (13.4). Следова- тельно, хотя бы одно из этих неравенств должно соблюдаться. Поэтому не может быть так, чтобы оба эти неравенства не выполнялись. Иными слова- ми, не может выполняться двойное неравенство max min ХА YT < 0 < min max XA YT. (13.5) x y y x Возьмем теперь произвольное вещественное число t и рассмотрим матрицу 'ац - г #12 - t ain-t' л(0 = а21 — f а22 ~ t • а2п - t am2 ~ • • • п ~ t Напишем для матрицы A (Z) неравенство (13.5) : max min XA(t)YT < 0 < min max XA(t)YT. (13.6) x y y x 54
Но в нашем случае XA(t)Yr = X X ^(aij-tyrij = i- 1 / = 1 т п т п = S S S 2 = XAYT-t. (13.7) z = 1 / = 1 i = 1 7 = 1 Поэтому (13.6) равносильно тахтт(Х4У7- t) < 0 < min тах(Х4У7- t), x y y x или, что то же самое, max min ХА YT <t< min max X4 YT. x y y x По-прежнему обе стороны написанного неравенства не могут быть верными одновременно, каково бы ни было число t. Но это значит, что между мини- максами max пйпХЛ YT и min maxX4 YT нельзя вставить ни одного чис- х y Y х ла, которое было бы строго больше первого из них и строго меньше второ- го. Такое может оказаться только тогда, когда второй минимакс не пре- восходит первого: minmaxX4y7^ max min Х4 У7(13.8) Y х х Y Вместе с тем на основании неравенства минимаксов (теорема п. 3.4) должно быть тахттХ4У7^ max min Х4 У7(13.9) х Y х Y Неравенства (13.8) и (13.9) вместе дают нам max min ХА YT = min max XA YT, x y y x что и требовалось. □ О смысле выражения ’’полная определенность игры” см. приложе- ние 1. § 14. ЗАДАЧА РЕШЕНИЯ МАТРИЧНЫХ ИГР 14.1. Доказанная в предыдущем параграфе теорема о минимаксах ут- верждает, что во всякой матричноД игре игроки имеют смешанные опти- мальные стратегии. Однако никаких явных путей для вычисления таких стратегий эта теорема не указывает. В этом смысле она оказывается типич- ной ’’теоремой существования”. Проанализируем складывающееся в связи с этим положение дел. 14.2. Установление существования в матричных играх оптимальных стра- тегий игроков означает, прежде всего, реализуемость принципа максимина. По существу это выражает тот ’’метаматематический” факт, что принцип мак- симина не противоречит конструкции матричной игры и ее смешанного рас- ширения. Этот факт может стать побудительным мотивом к поискам опти- 55
мальных стратегий игроков в той или иной матричной игре и даже алгорифма описания множеств всех оптимальных стратегий в любой матричной игре. Если точное нахождение оптимальной стратегии игры не удается, то уве- ренность в их объективном существовании увеличивает ценность и их при- ближенного определения. 14.3. Вместе с тем неэффективная теорема существования сама по себе представляет лишь весьма ограниченную практическую ценность и нуж- дается в более эффективном ’’восполнении” (каковым может служить, например, фактическое определение объекта, существование которого доказано). Более того, с некоторой, достаточно последовательной ’’кон- структивистской точки зрения, такое неэффективное доказательство может даже оспариваться. Впрочем, для матричных игр все эти проблемы получают достаточно удовлетворительное и притом сравнительно простое решение. § 15. СВОЙСТВА ЗНАЧЕНИЯ ИГРЫ И ОПТИМАЛЬНЫХ СТРАТЕГИЙ ИГРОКОВ 15.1. Теорема. Для матричной игры имеет место соотношение vA = max minXA.j = тштахЛ/.К^, (15.1) X j Y i причем внешние экстремумы достигаются на оптимальных стратегиях игроков. Для доказательства достаточно заметить, что по определению значения игры (см. пп. 4.5 и 6.4) vA = max min ХА Yт = шттахХ4Уг, (15.2) X Y Y X а внутренние экстремумы можно по лемме п. 10.2 заменить на экстремумы, распространенные по множествам чистых стратегий. После этого остается вспомнить (см. п. 6.2), что внешние экстремумы в (15.2) достигаются именно на оптимальных стратегиях игроков. О Из этой теоремы получается много полезных свойств значения игры и оптимальных стратегий игроков. 15.2. Т е о р е м а. Для любой матрицы А maxminzfy ^ vA min max агу. (15.3) i i j i Доказательство. Из (15.1) и леммы п. 3.7 следует, что vA = max min ХА^>, max min а^. x j i j Правая половина соотношения (15.3) доказывается аналогично. □ 15.3. Теорема. Если игрок 1 имеет чистую оптимальную страте- гию iQ, то vA = max min = min aiQ j. (15.4) i i i Если игрок 2 имеет чистую оптимальную стратегию jQ, то vA = min maxа^ = max atj . (15.5) j i i 0 56
Для доказательства (15.4) достаточно вспомнить, что согласно теореме п. 15.1 в рассматриваемом случае максимум достигается на чистой страте- гии: X = z. Это и означает (15.4). Аналогично доказывается (15.5). □ Теоретико41гровой смысл доказанной теоремы весьма прозрачен. Пер- вый игрок получает максимин выигрыша, если противник знает применяе- мую им чистую стратегию. Но если некоторая его чистая стратегия опти- мальна, то это значит, что он может ее применением и ограничиться, а его противник может действовать с учетом этого обстоятельства. Выражаясь йесколько вольно, можно утверждать, что наличие у игрока чистой опти- мальной стратегии отражает некоторые неблагоприятные для него условия игры, не позволяющие ему ’’запутывать” противника. 15.4. Вернемся к формулировке теоремы из п. 15.1. Из нее следует, что для любых X Е X и Y Е Y должно быть тпХА • <ivA ^тахЛлУг. (15.6) Кроме того, для оптимальности стратегии X необходимо и достаточно, что- бы левая сторона этого соотношения обращалась в точное равенство: minX4e/- = vA, (15.7) а для оптимальности стратегии Y необходимо и достаточно, чтобы точным равенством оказалась правая сторона соотношения (15.6): иА =тахЛлУг. (15.8) i 15.5. Иногда бывает удобно проверять оптимальность стратегий X и Y, записывая равенства (15.7) и (15.8) в виде неравенств, которые в дейст- вительности оказываются равносильными равенствам: minXAtJ>vA9 (15.9) / vA ^тахЛ,Уг. (15.10) i В самом деле, в (15.9), равно как ив (15.10), строгого неравенства быть не может, так как это противоречило бы определению значения игры (именно, противоречило бы соотношению (15.6)). 15.6. Неравенства (15.9) и (15.10) можно записать соответственно в виде XA^va длявсех / = 1,...,л, (15.11) vA ^A^Y1 длявсех / = 1,...,ти, (15.12) так что эти неравенства также оказываются необходимыми и достаточными признаками оптимальности стратегий игроков. 15.7. Следующие критерии оптимальности стратегий игроков в матрич- ной игре не предполагают знания значения этой игры. Теорема. Если X и Y - соответственно стратегии игроков 1 и 2, а v - некоторое число, причем тахЛ/ЧУг<Lu<minX4 (15.13) i ' i то X и Y - оптимальные стратегии игроков, a v = vA. 57
Доказательство. Из (15.6) и (15.13) следует, что шах Л,- Y т = v = vA =minX4 i " А j и, в частности, выполняются равенства (15.7) и (15.8). □ 15.8. Условие (15.13) можно заменить на эквивалентное ему. Следствие. Если X и Y - стратегии игроков 1 и 2, a v - чис- ло, причем AiYT^v^XA,/ (15.14) для любых i = 1,... ,m и / = 1, . .., л, то X и Y — оптимальные стратегии игроков, a v = vA. Для доказательства достаточно заметить, что соотношения (15.14) и (15.13) равносильны. □ 15.9. В формулировках утверждений пп. 15.7 и 15.8 упоминание о ’’не- котором числе и” можно опустить. Теорема. Если X и Y - стратегии игроков \и2,то для их оптималь- ности достаточно соблюдения неравенства : m?cxAi YT =minХА (15.15) / / Для доказательства достаточно в качестве ’’числа и” взять любой из стоя- щих в (15.14) экстремумов. □ 15.10. Как и в теореме п. 15.7, от неравенства между экстремумами можно перейти к неравенствам между конкретными значениями выиг- рышей. Следствие. Если стратегии Хи Y игроков 1 и 2 таковы, что AiYr<XA,/ (15.16) для любых z = l,. . . ,т и / = 1,... ,п, то эти стратегии оптимальны. Это следует из того, что утверждения (15.16) и (15.15) равносильны. □ 15.11. Отметим в заключение одну простую связь между значениями иг- ры и ее подыгр. Теорема. Если Гл есть х-подыгра игры Гл, а Гл + - ее у-подыгра, то va-^va ^va+. (15.17) Доказательство. Согласно (15.1) должно быть vA - = max min Х'А max min ХА ,• = и л , X’ j ’’ X j •’ А где максимум по X* берется по множеству Xх всех смешанных стратегий игрока 1 в игре Гл -, а максимум по X — по множеству всех его смешанных стратегий X в игре Г4. Ссылка на п. 3.6 доказывает левое неравенство в (15.17). Правое неравенство в (15.17) устанавливается аналогично. □ 58
§ 16. МНОЖЕСТВА ОПТИМАЛЬНЫХ СТРАТЕГИЙ ИГРОКОВ В МАТРИЧНЫХ ИГРАХ 16.1. Теорема. В матричной игре Гл множества оптимальных страте- гий игроков $ (А) и (А) являются выпуклыми непустыми много- гранниками. Доказательство. Согласно п. 15.6 множество § (А) является множеством всех решений системы неравенств (15.10), т.е. пересечением конечного числа замкнутых полупространств. Кроме того, оно является ограниченным. Тем самым согласно п. 11.3 это множество является выпук- лым многогранником. То, что выпуклым многогранником является множество S (А), уста- навливается аналогично ссылкой на систему неравенств (15.11). □ Заметим, что многогранность и выпуклость множеств оптимальных стра- тегий игроков в матричной игре являются элементарными и как бы не- посредственно наблюдаемыми фактами (мы здесь оставляем в стороне возможные рассуждения по поводу нетривиальное™ утверждений о том, что ограниченное пересечение конечного числа замкнутых полупространств конечномерного евклидова пространства есть выпуклый многогранник, т.е. выпуклая оболочка конечного числа точек — вершин; это наглядно и как бы очевидно). Напротив, доказательство непустоты этого многогран- ника потребовало, как мы видели, известных усилий. Эта теорема истори- чески не сразу поддалась доказательству, и даже высказывались сомнения в ее справедливости. 16.2. Из доказанной в п. 16.1 теоремы вытекает, что если значение vA игры Гл заранее известно (например, если оно может быть найдено на ос- новании каких-либо общих свойств матрицы выигрышей Л), то многогран- ники S (Л) и S’ (Л) для этой игры можно считать заданными, хотя, быть может, и ”в недостаточно явном виде” (т.е. своими гранями, а не верши- нами). § 17. СПЕКТРЫ СТРАТЕГИЙ И ДОПОЛНЯЮЩАЯ НЕЖЕСТКОСТЬ 17.1. Нахождение оптимальных стратегий игроков в матричных играх (т.е. описание множеств S (Л) и S (Л) для тех или иных матриц Л или целых классов матриц) является, вообще говоря, достаточно трудоемким делом. Попытки систематического описания множеств оптимальных стратегий игроков приводят к их определению не посредством универсальных фор- мул, а лишь посредством альтернативных формул: перебирается достаточно обширный список формул, по каждой из них находится некоторый ’’кан- дидат в оптимальные стратегии”, который и проверяется на оптимальность (например, по критериям, приведенным в § 16). Численное же нахождение оптимальных стратегий в матричных играх требует значительного объема вычислений, который быстро растет с уве- личением размеров матрицы выигрышей игры. Из сказанного вытекают две задачи: во-первых, систематизировать и тем самым сократить поиски аналитических выражений для оптимальных стра- тегий игроков и, во-вторых, уменьшить число чистых стратегий игроков 59
в игре, попытавшись с самого начала отбрость те из них, которые заведомо не будут участвовать в формировании каких-либо оптимальных статегий. 17.2. Т е о р е м а. Пусть (X*, У*) - приемлемая для игрока 1 ситуация в матричной игре ГА, причем X* = (£i, .. ., Тогда 1) из AtY*T <X*AY*T (17.1) следует = 0, т.е. что чистая стратегия i не принадлежит спектру смешан- ной стратегии X *; 2) если AbY*T = X*AY*T для i = ilf...,ik, то X°AY*T = X*AY*T для любой смешанной стратегии X® игрока 1 со спектром { ... ,ik} {т.е. в этом случае ситуация (XQ, У*) также оказы- вается приемлемой для игрока 1). Для ситуаций, приемлемых для игрока 2, имеет место двойственное утверждение. Доказательство. 1) Из определения приемлемости ситуации (X*, У*) для игрока 1 (см. п. 4.2) следует, что At Y*7 <Х*АУ *г для любого i = 1, ..., m. Умножив каждое из этих неравенств на , мы по- лучим (17.2) а просуммировав по всем i - 1,.. . , m - S ^Ai.Y*T =X*AY*T Z h)X,AY,7’=X,AY,r i = 1 i = 1 В действительности здесь, очевидно, имеет место равенство. Так как оно было получено суммированием нестрогих неравенств одного смысла, каж- дое из этих неравенств (17.2) должно быть точным равенством: A; ,Y*T = = ^iX*AY*T. В случае £/>0 отсюда следовало бы AbY*т = X*ЛУ *т, что противоречило бы (16.1). 2) Получается непосредственным использованием леммы о переходе к смешанным стратегиям. □ 17.3. Следующее свойство оптимальных стратегий игроков в матричной игре называется ’’дополняющей нежесткостью” по аналогии со сходным свойством решений пар двойственных задач линейного программирования (ср. далее в § 26). По своей формулировке и своему доказательству оно сходно с частью 1) теоремы предыдущего пункта и двойственным ей ут- верждением. Теорема. Если У - оптимальная стратегия игрока 2 в игре Гл и для стратегии i0 игрока 1 имеет место Aif>.YT<vA, (17.3) то чистая стратегия i0 не может принадлежать спектру какой-либо опти- мальной стратегии X = (£i,. .. , £„) игрока 1, т.е. должно быть £,о=0. (17.4) 60
Доказательство подобно доказательству теоремы из п. 17.2. Согласно п. 15,6 для всех i = 1,.. ., т должно быть Ai.YT^vA. (17.5) Почленное умножение каждого из таких неравенств на & дает нам ^A,,Yt^^va, (17.6) а после суммирования по i = 1,. . ., т — т т 2 ^Ai.YT=XAYT^{ 2 ?,-)ил=ил. 1=1 1 = 1 Из оптимальности стратегий X и Y следует, что в этом соотношении имеет место точное равенство. Но это может быть лишь в том случае, если равенствами являются все суммируемые неравенства (17.6), и в том числе е1-оЛ,о.Уг = ^оил. Если теперь > 0, то обе части этого равенства можно разделить на , получив Aj ,YT = vA, что противоречит (17.3). Значит, должно выполнять- ся (17.4). °П 17.4. Теоремы о дополняющей нежесткости часто применяют в следую- щей эквивалентной, так сказать, ’’контрапозитарной” форме: если чистая стратегия iQ игрока 1 входит в спектр некоторой оптимальной его страте- гии, то для любой оптимальной стратегии игрока 2 должно бытьЯ/о.Уг = = vA. Аналогичный вывод делается из вхождения в спектр какой-либо оп- тимальной "стратегии игрока 2 некоторой его чистой стратегии. 17.5. Существенно более деликатным является доказательство утвержде- ния, обратного теореме п. 17.3. Предварительно мы докажем следующую лемму, которая известна под названием леммы Фаркаша. к Лемма. Пусть Z,..., Z и Z — такие г -векторы, что для произвольного г-век- iT Т тора W из условий WZ 0 при i = 1, . .. ,k следует WZ 0. Тогда Z принадлежит выпуклому конусу С, натянутому на векторы Z 1, . . . , ZK. Доказательство. Предположим, что Z ф С. Это значит, что найдутся такие вектор W и число с, что WUT>c длявсех UG С (17.6) и WZT = c. Очевидно, ОеС Поэтому из (17.6) следует, что с < 0. Т Если бы теперь нашлось такое S е С, что WS <0, то, умножая вектор S на доста- точно большой положительный скаляр t (произведение tS по-прежнему будет принад- т лежать конусу С), мы получили бы, что ^(^5) может стать меньше любого наперед заданного отрицательного числа и, в частности, стать меньше, чем с: W(tS)T<c, (17.7) а это противоречит (17.6). Значит, для всех S G С должно быть WS 1 0 и в том числе WZ1Т 0 для всех Т i = 1, . . ., к. Но тогда по условию должно быть и WZ > 0, а это противоречит тому, что WZT - с < 0. □ 17.6. Обратимся непосредственно к доказательству интересующего нас утверждения. 61
Теорема. Пусть сл - значение игры Г^. Если для любой оптималь- ной стратегии Y* = (т?15... .т]^) игрока 2 бу дет rij q = 0, то найдется такая опти- мальная стратегия х* = (£i, .. . , £w) игрока 1, что х*А >vA. (17.8) /о л Доказательство сильно напоминает доказательство леммы о двух альтернативах (см. п. 13.1). Не нарушая общности, мы можем считать что vA =0. Рассмотрим конус С, натянутый на п + m — 1 векторов: на орты Е^ и на столбцы матрицы Апри / Ф/0 • Предположим сначала, что — А,^ G С. Тогда вектор -^7о можно пред- ставить в виде линейной комбинации векторов, порождающих конус: -Л- = S etE(t) + S а.А.„ (17.9) 0 1 = 1 /*/о где е7-^ 0 (z = 1, .. ., m), а7 0 (/ Ф j 0). В покоординатной записи ра- венство (17.9) приобретает вид -zz,7 = + Z а.ац для z = l,...,m, ] *Jo откуда S оу а^ + atj = — ezSO для z = l,...,m. i * io ° Деля почленно это неравенство на 1 + S а,- >0 и полагая 7 * /о мы получим Aj,Y т 0 = vA для всех i = 1, . .., m, так что стратегия Yиг- рока 2 оптимальна, причем ту > 0. Значит, должно быть — А.^ С. Тогда по лемме предыдущего пункта найдется вектор Z = (f i,. . ., fn), для которого ZE(i}T^0, i = (17.10) ZA4 ^0, / = !,...,и, /=/7о, (17.11) но -ZA <0. (17.12) Jo Неравенство (17.10) означает 0, а из (17.12) следует, что Z Ф 0. Значит, сумма компонент вектора Z положительна, и мы можем разделить на нее почленно неравенства (17.11) и (17.12) и, полагая m _х = S fz) , % = (?!,...,5W), i = 1 получить XA.j 2^0 = vA, XA.jQ > 0 = vA. Таким образом, стратегия X является оптимальной стратегией игрока 1 и притом удовлетворяет требуемому условию (17.8). □ 62
§ 18. 2 X 2-ИГРЫ 18.1. Анализ матричных игр, как, впрочем, и любых многопараметричес- ких игр, оказывается нетривиальным даже в простейших случаях. Рассмотрим матричную игру, в которой каждый из игроков имеет по две чистые стратегии. Матрица выигрышей этой игры имеет вид Г L «2 1 а\2 «2 2 (18.1) Пусть X — произвольная смешанная стратегия игрока 1 (в частности, эта стратегия может быть и чистой). Если £ — вероятность выбора игроком 1 своей первой чистой стратегии в условиях X, то вероятность выбора им вто- рой стратегии есть 1 — £. Поэтому стратегию X можно представить в виде (£, 1 — ?)• Аналогично, если Y — произвольная смешанная стратегия игро- ка 2, то она имеет вид (т?, 1 — т?). Таким образом, стратегия X однозначно определяется числом £, а стратегия Y — числом ??. Чистым стратегиям соот- ветствуют, очевидно, значения параметров 0 и 1. Мы будем в соответствии со сказанным обозначать ситуацию (X, Y) парой чисел (£,??). Геометрически всякую ситуацию (£0, Л о) в смешанных стратегиях та- кой игры Гл можно понимать как точку на единичном квадрате (рис. 1.9). Ситуациям в чистых стратегиях соответствуют вершины этого квадрата. 18.2. Ситуация (X, У) является седловой точкой в игре Гл, если она приемлема для каждого из игроков. Поэтому для описания всех седловых точек в игре мы опишем множества ситуаций, приемлемых для отдельных игроков, и изобразим их на единичном квадрате всех ситуаций. Пересече- ние двух этих множеств и будет составлять множество всех седловых точек игры. 18.3. Займемся описанием ситуаций, приемлемых для игрока 1 в 2 X 2-игре Гл. Приемлемость ситуации (X У) для игрока 1 в 2 X 2-игре Гл означает (например, в силу леммы о переходе к смешанным стратегиям), что Ai.YT ^XAYT, (18.2) A2YT ^XAYT. (18.3) Положим X = (£, 1 — О и рассмотрим отдельно три случая. а) £ = 1. Зде.сь £ > О (18.2) обращается в тождественное равенство, так что необходимым и достаточным условием приемлемости ситуации (X У) 63
для игрока 1 оказывается неравенство (18.3). Это можно записать как A1.YT^A2.YT. (18.4) б) £ = 0. Здесь 1 — £ > 0, так что в тождественное равенство обращает- ся (18.3), и условием приемлемости ситуации (X, У) оказывается (18.2) или, что то же самое, A!.Yt^A2.Yt. (18.5) в) 0 < £ < 1. В этом случае как £ > 0, так и 1 — £ > 0. Поэтому по тео- реме п. 17.3 о дополняющей нежесткости оба неравенства (18.2) и (18.3) обращаются в равенства, и условием приемлемости становится A^Yt = A2.Yt. (18.6) 18.3. Опишем варианты приемлемости ситуаций в более явном виде. Заметим для этого, что в любой ситуации (X, У) = (£, т?) в смешанных стра- тегиях 2 X 2-игры Гл мы имеем XAYT = (t,l -$) [ 011 йХ2 ] (7?, 1 -т?)г = а2 1 а22 J = |Т?в11 +5(1 - 7?)«1 2 +(1 -$)П«21 +(1 -0(1 -7?)«22 = = ?77(а11 -Д12 -а21 + а22) + %(а12 -а22) + т?(д2, -а22) + а22. (18.7) (18.8) (18.9) (18.10) Поэтому соотношения (18.4), (18.5) и (18.6) можно соответственно записать как т)С >а1э г]С , riC =«!, где 67 — ^11 — #12 — #2 1 + ^2 2 И ОЦ “#2 2 —^12- (18.11) Таким образом, приемлемые для игрока 1 ситуации в игре могут быть одного из трех типов: (1,7?), где 77С :>ai, (0,77), где 7?С ^ai, где т?С =ai, a $G(0, 1). 18.4. Если С - 0, но Qi Ф 0, то (18.10) не имеет места, так что выполня- ется либо (18.8), либо (18.9), и притом со знаком строгого неравенства. Поэтому множество всех т] дает приемлемые ситуации либо с £ = 1, либо с £ = 0, смотря по тому, какое из чисел окажется больше, -#22 или #12. Если же С = 0 и = 0, то все соотношения (18.8) - (18.10) выполня- ются тождественно, и приемлемыми для игрока 1 будут вообще все си- туации. Перечисленные случаи изображены на рис. 1.10. 18.5. Обратимся к случаю, когда С Ф 0. Тогда из (18.10) следует т? = -ai/C, Это значение г/ мы далее будем обозначать через т?*. С учетом (18.11) 64
(18.12) должно быть #2 2 “ а1 2 ??* = ------------.------ ^11 ~ 2 — а2 1 + а22 Тогда перечисленные в п. 17.3 типы приемлемых для игрока 1 ситуаций приобретают следующий вид: (1. ’?), где 77^77*, если С>0, если С<0; (0,77), где 77^77*, если ОО, т?^т7*, если С<0; (?,’?*), где £ е[0,1]. > (18.13) Если отвлечься от того, что число 77 является вероятностью и поэтому должно принадлежать сегменту [0, 1 ], то во всех вариантах случая С Ф О множества (18.13) составляют трехзвенные зигзаги, а множества при- емлемых для игрока 1 ситуаций суть пересечения этих зигзагов с единич- ным квадратом ситуаций. Возможные случаи изображены на рис. 1.11. Далее назовем трехзвенный зигзаг левым, если при подходе к его средне- му звену оно будет расположено слева по направлению движения (рис. 1.11 а — д), и правым — в противном случае (рис. 1.11 е - к). 18.6. Описание ситуаций в игре Гл, приемлемых для игрока 2, делает- ся симметрично проведенному в пп. 18.3—18.5 описанию приемлемых си- туаций для игрока 1. Приемлемость ситуации (X, У) в игре Гл для игрока 2 означает, что Х4.1^ЛЛУ7’, Х4.2 ^XAYt. (18.14) Положив Y = (77, 1 — 77), мы приходим к рассмотрению трех случаев: а) 77 = 1. В этом случае приемлемость ситуации (X, У) равносильна неравенству Х4.!^Х4.2. (18.15) б) т? = 0. Приемлемость ситуации (X У) Для игрока 2 означает, что ХАл^ХА,2. (18.16) в) 0 < т? < 1. Приемлемость ситуации (X У) для игрока 2 означает, что ХАЛ =Х4.2. (18.17) Согласно (18.7) соотношения (18.15), (18.16) и (18.17) могут быть соответственно переписаны в виде £С^а2> £CJ>a2, %С = а2, где число С определяется, как ив (18.11), а а2 -а22 - «21 • Случай С = 0 разбирается так же, как и при рассмотрении ситуаций, приемлемых для игрока 1. В случае С Ф 0 положим £ * = а2/С, т.е. в наших обозначениях аХ \ — а\ 2 - ^2 1 +^22 Приемлемые для игрока 2 ситуации составляют пересечение единичного 5.Н.Н. Воробьев 65
квадрата с зигзагом, состоящим из трех звеньев: (5,1), где 5^££*> если ОО, 5^£*> если С<0; (5,0), где 5^5*, если ОО, 5^=£*> если С<0; (£*>*?), где ?? е [0,1] (рис. 1.12). Обратим внимание на то, что в каждой игре зигзаги, на которых рас- положены приемлемые стратегии игроков, оказываются одной и той же ориентации, т.е. являются либо оба правыми, либо оба левыми. Нам остается воспроизвести рассуждения п. 18.2. 18.7. Заметим, что при СФ 0 и 5*, т?* G(0,1) пересечением зигзагов яв- ляется единственная точка с координатами (5*, т?*), которая и будет един- ственной седловой точкой в игре. Г 2 1 1 _ Например, для игры Гл с А = I мы имеем С = 4 Ф 0, - 3, т? - = 3/4, а2 =2 и 5* =1/2. Поэтому зигзаги приемлемых ситуаций имеют Рис. 1.11 Рис. 1.12 66
Рис. 1.14 Рис. 1.13 Рис. 1.15 вид, изображенный на рис. 1.13; соответствующая ситуация равновесия — точка их пересечения — единственная. 18.8. В 12 0' 111. качестве второго примера рассмотрим случай игры Гл с А = . Здесь С— 2 ^0, Qi =1, 7?* = 1/2, а2 =0, £* =0 Поэтому множество всех ситуаций равновесия в этом случае имеет вид отрезка, состоящего из ситуаций (0,77), где 77= [0, 1/2 18.9. Рассмотрим, наконец; игру Гл с А = (рис. 1.14). Здесь С = 0, прием- 1 2 0 1 лемыми для игрока 1 являютсявсе ситуации вида (1,77), а приемлемыми для игрока 2 — все ситуации вида (1,0- В игре имеется единственная ситуация равновесия в чистых стратегиях: (1, 1) (рис. 1.15). 18.10. Проведенный анализ дает основания к несколько иному, упрощенному алго- рифму перечисления ситуаций равновесия в 2 X 2-игре, основанному на иной класси- фикации случаев. Из сказанного выше следует, что таких основных и без труда распознаваемых случаев — два. 1) В игре Гд нет седловых точек в чистых стратегиях. В этом случае игра имеет единственную седловую точку в смешанных стратегиях (X*, Y*) - (£*, 77*), где, как и выше, £* = а2/Си7]*=а1/С. Заметим, что этот факт отражает примечательное свойст- во 2 X 2-игр: если в такой игре один из игроков имеет чистую оптимальную стратегию, то другой игрок тоже имеет чистую оптимальную стратегию. Чтобы не запоминать выражений для С, а, и а2, удобно выводить соответствующие формулы каждый раз заново, пользуясь формулами (18.16) и (18.6), которые явля- ются одной из форм выражения дополняющей нежесткости и в специальном запомина- нии не нуждаются. 2) В игре Гд есть седловые точки в чистых стратегиях. Пусть для определенности одна из них состоит из первых чистых стратегий игроков. Тогда vA =а1Х, и по опре- делению седловой точки должно быть а21 < а12. Смотря по тому, реализуются в этом соотношении строгие неравенства или точные равенства, нам могут предста- виться четыре варианта рассуждений. а) д21 < < а12. Здесь для первой чистой стратегии игрока 2, которая по усло- вию оптимальна, мы имеем д21 -A.2.YT< - vA. Значит, по теореме п. 17.3 о дополняющей нежесткости вторая чистая стратегия игрока 1 не может входить в спектр какой-либо его оптимальной стратегии. Следовательно, первая его чистая стратегия является его единственной оптимальной стратегией. По аналогичным соображениям единственной оптимальной стратегией игрока 2 является первая его чистая стратегия. б) я21 - < д12. По тем же причинам, что и в случае а), здесь у игрока 1 имеется единственная оптимальная стратегия (именно, его первая чистая стратегия). Чтобы 5 67
смешанная стратегия Y - (rj, 1 - 77) игрока 2 была оптимальной, необходимо и доста- точно соблюдение неравенства А 2 . Y т= а2л ri + а22 (1 -77) vA = atl,'' откуда и находятся соответствующие значения 77. в) д21 < -я12- Симметрично предыдущему здесь единственная оптимальная (первая чистая) стратегия имеется у игрока 2, а условием оптимальности смешанной стратегии X- (£, 1 — £) игрока 1 будет Х4.2 = £я12 + (1 - О а22 ^иА " г) я21 = аг1 ~^12- Этот случай распадается в свою очередь на три подслучая. ri) а22 < up. При этом, очевидно, С Ф 0, у игрока 1 единственная оптимальная стратегия, а оптимальными стратегиями игрока 2 будут все его стратегии. г2) а22 > иг- Здесь также С Ф 0; единственная оптимальная стратегия здесь будет у игрока 2, а оптимальными стратегиями игрока 1 будут все его стратегии. г3) а22 =vp. Здесь С - осх -а2 - 0. Все ситуации оказываются равновесными, а все стратегии игроков — оптимальными. 18.11. Приведем пример, иллюстрирующий нахождение оптимальных стратегий игроков в случае 1) из предыдущего пункта. Рассмотрим игру Гл с матрицей выигрышей А = 1 5 . Максимин элементов этой матрицы равен 2, а минимакс равен 3. Поэтому седловых точек в чистых стра- тегиях в этой игре нет, и мы действительно имеем дело со случаем 1). Обозначим искомую оптимальную стратегию игрока 1 через (£*, 1 -£*). Тогда выражающее дополняющую нежесткость равенство (18.6) принимает вид £*• 3 + (1 — £*) • 2 = = £*• 1 + (1 - £*) -5, откуда £* = 3/5 и 1 - £* = 2/5. Значение vA этой игры равно 13/5. Аналогично соответствующее равенство для оптимальной стратегии (-ч* 1 — 77*) игрока 2 имеет вид Зт7*+1 • (1 -rf) = 2д*+5 • (1 -77*), (18.19) откуда 77* = 4/5 и 1 - 77*= 1/5. Заметим, впрочем, что, зная значение vA игры, равенства (18.19) можно и не выписывать. В данном случае должно быть A j. Y* ¥ vA, как, впрочем, и Л2. Y*= vA. Первое из этих равенств имеет вид Зт7*+ 1 (1 - 77*) = 13/5, откуда и следует тре- буемое. § 19. ГРАФОАНАЛИТИЧЕСКИЙ МЕТОД РЕШЕНИЯ 2Х/7-ИГР 19.1 Рассуждения предыдущего параграфа показывают, что полный, перечисляющий всевозможные случаи анализ даже для такого простого класса игр, как 2 X 2-игры, оказывается достаточно нетривиальным. Пере- ход к играм большего формата существенно увеличил бы его громозд- кость. Естественно поэтому, что большинство алгорифмов решения игр должно иметь достаточно сокращенный вид и опираться на те или иные соображения, основанные на наглядности. Кроме того, оказывается, что для перечисления всех ситуаций равнове- сия игры основную трудность составляет нахождение спектров оптималь- ных стратегий игроков, после чего остается сравнительно несложная и традиционная работа. Для некоторых классов матричных игр представляет практический ин- терес графоанал итический метод решения, названный так пото- му, что в нем графически определяются качественные особенности решения (спектры оптимальных стратегий игроков, форма множеств оптимальных стратегий и т.д.), после чего, пользуясь знанием этих особенностей, полную характеристику решения игры можно найти уже чисто аналитически. 68
19.2. В основе описываемых далее графоаналитических методов лежит следующее соображение, основанное на том, что согласно теореме п. 15.1 в матричной игре Гл должно быть v = maxminX4..- - min max Af. YT, (19.1) A x j y i причем внешние экстремумы достигаются на оптимальных стратегиях игроков. Опишем способ нахождения оптимальных стратегий игрока 1 в т X п- игре. Рассмотрим для этого m-мерную призму, основанием которой являет- ся (т — 1)-мерный симплекс X стратегий игрока 1 в Гл , а вдоль образую- щей откладываются значения функции выигрыша// (рис. 1.16). Графиком каждой из функции XA.j является гиперплоскость, а графиком функции minX4.y — ’’минимальная” огибающая всех таких гиперплоскостей. Эта i огибающая ограничивает сверху некоторое ’’обелискообразное” тело (см. рис. 1.17). Наибольшая //-координата точек этого тела есть согласно (19.1) ид, а проекции этих точек на основание призмы — оптимальные стратегии игрока 1. Разумеется, при больших значениях т такой способ неприменим, но при т = 2 он представляется достаточно практичным. Воспроизведем в деталях рассуждения в этом случае. 19.3. Рассмотрим игру, в которой игрок 1 имеет две чистые стратегии, а игрок 2 — произвольное число п чистых стратегий. Матрица выигрышей этой игры имеет вид *12 А = (19.2) _ а2\ с122 Фундаментальный симплекс смешанных стратегий игрока 1 представляет собой в рассматриваемом случае сегмент [0, 1], в котором координата точки, описывающей смешанную стратегию игрока 1, есть вероятность ис- пользования им первой чистой стратегии. Пусть игрок 2 выбирает свою чистую стратегию/. Тогда выигрыш игро- ка 1 будет зависеть от выбранной им смешанной стратегии X, т.е. фактичес- ки от вероятности £ выбора им первой чистой стратегии: XA.j =^a{j + + (1-О*2Л 69
Графически зависимость этого выигрыша от £ изображается прямой линией. Каждой чистой стратегии / игрока 2 соответствует своя прямая (рис. 1.18). Ясно, что если матрица (19.1) имеет одинаковые столбцы, то прямые, соответствующие таким стратегиям игрока 2, будут совпадать. Ради простоты будем все совпадающие столбцы считать одной стратегией. Г рафиком функции minXd.y = min (£я1;- + (1 - £)я2/) / i будет нижняя огибающая всех прямых, соответствующих стратегиям игрока 2 (на рис. 1.18 она выделена жирной линией). Очевидно, этот гра- фик представляет собой ломаную, обращенную выпуклостью вверх. Наи- высшая точка этой ломаной будет соответствовать тому значению, на котором достигается max min ХА.; = maxmin(^lz- + (1 — £)я2/). xi t i Абсцисса этой точки является, таким образом, оптимальной смешанной стратегией игрока 1, а ее ордината — значением игры. Если же таких выс- ших точек будет более одной, то, очевидно, огибающая ломаная будет иметь горизонтальный участок (рис. 1.19). Множество оптимальных стра- тегий игрока 1 будет состоять из всех абсцисс этих точек. 19.4. Описанное построение позволяет находить также оптимальные стратегии игрока 2. Здесь может представиться несколько различных случаев. Пусть сначала огибающая ломаная имеет верхний горизонтальный учас- ток, соответствующий чистой стртегии /0 игрока 2. Очевидно, это может быть лишь при я1/о =^2/0- В этом случае игрок 2 имеет единственную оптимальную стратегию, которая является чистой. Предположим теперь, что огибающая ломаная завершается ’’пиком”. Если абсциссой ’’пиковой” точки является 0 или 1 (рис. 1.20), то опти- мальная стратегия первого игрока — чистая (в случае, изображенном на рис. 1.20, это точка 0), а оптимальными стратегиями игрока 2 будут те его чистые стратегии, которые соответствуют прямым, подходящим к 70
пиковой точке с положительным наклоном. Разумеется, все их смеси также будут оптимальными стратегиями игрока 2. Аналогичная картина наблюдается в том случае, когда ’’пик” имеет абсциссу 1. Пусть, наконец, абсцисса пика отлична как от нуля, так и от единицы. Это значит, что в верхней „ее точке пересекается не менее двух прямых, из которых одна имеет положительный наклон, а другая — отрицательный (рис. 1.21). Пусть H = aiji + £(^1/, H = a2jt +K«i/2 a2ji) — эти прямые. Если игрок 2 откажется от использования всех своих осталь- ных стратегий, то в получившейся 2 X 2-игре как значение, так и единст- венная оптимальная стратегия игрока 1 будут теми же, что и в первоначаль- ной игре. Это значит, что, пользуясь только двумя стратегиями Д и /2, игрок 2 может воспрепятствовать игроку 1 получить больше, чем иА. Следовательно, оптимальная стратегия игрока 2 в исходной игре может быть получена путем смешивания только двух его чистых стратегий j\ и /2 • Таким образом, оптимальная стратегия игрока 2 в новой 2 X 2-игре является оптимальной его стратегией и в исходной 2 X и-игре. Для ее вычис- ления можно воспользоваться формулой (18.12), которая в данном случае приобретает вид ~a^it +а^1г § 20. ГРАФОАНАЛИТИЧЕСКИЙ МЕТОД РЕШЕНИЯ т X 2-ИГР 20.1 Пусть теперь в матричной игре две чистые стратегии имеет игрок 2, а игрок 1 — произвольное их число т. Это значит, что матрица выигрышей такой игры имеет вид «и я12 #21 а22 ат2 71
Анализ игры такого вида сходен с проведен- ным в предыдущем параграфе анализом 2Х и-игр. Произвольная смешанная стратегия игрока 2 имеет здесь вид Y = (77, 1 - т?), и их множество можно описать сегментом [0, 1]. Если игрок 1 выбирает свою z-ю чистую стра- тегию, а игрок 2 — смешанную стратегию Y, то выигрыш игрока 1 будет, очевидно, равен Aj. YT = ai}ri+ ai2 (1 — 77). Зависимость этого вы- игрыша от 77 графически описывается прямой линией. Графиком max At. YT = max (aix 77 + al2(l - 77)) будет верхняя огибающая всех прямых, соответствующих чистым стратеги- ям игрока 1 (рис. 1.22). Абсциссой нижней точки этой ломаной будет значение 77*, соответствующее оптимальной стратегии игрока 2, а ордина- той - значение игры иА. 20.2 . Графоаналитический способ, подобный описанному, можно приме- нить к решению игр, в которых один из игроков имеет три чистые стратегии. Однако получающиеся при этом построения оказываются весьма громозд- кими. Для их проведения необходимо пользоваться методами начертатель- ной геометрии. Если каждый из игроков имеет более трех чистых стратегий, то графо- аналитическое решение игры практически невозможно. § 21. ГРАФОАНАЛИТИЧЕСКИЙ МЕТОД РЕШЕНИЯ 3 X 3-ИГР 21.1. 3 X 3-игры встречаются во многих вопросах. Поэтому умение их решать, притом без обращения к общим методикам (например, к симплекс-методу линейного программирования, о возможности использования которого см. в § 26) и, тем более, к вычислительной технике, представляется важным. Разумеется, такой подробный анализ, которому были в § 18 подвергуты 2 X 2-игры, здесь оказывается практически неосуществимым ввиду обилия и разнообразия могущих встретиться случаев. Поэто- му мы ограничимся описанием способа решения такой игры, не доводя его до расчет- ных формул, к которым он приводит в каждой из своих реализаций. Итак, пусть нам дана игра с 3 X 3-матрицей выигрышей А. В основу ее решения мы положим следующие соображения. 21.2. Прежде всего, как это уже неоднократно отмечалось, для значения vA всякой матричной игры Г^ должно быть и = max min Х4.у, (21.1) А X j причем внешний максимум достигается на оптимальных стратегиях игрока 1 и только на них. В нашем случае Xявляется вектором вида (£ t, £ 2, £ 3), где ^0, (21-2) + h + = I- (21.3) Обозначим множество всех таких векторов через X (см. п. 8.2). Тогда равенство 72
(21.1) можно переписать в виде и = max min А хеХ ' Z4.1' !> = -max min- ^1а11 + ^2^21 + £зД31 УЛ.2 £1^12 %2а22 + £з^32 хеХ £1д1э + £2^23 + £зсзз . (21.4) Рассмотрим теперь равенства XA.i = Х4.2, Х4.2 = Х4.3, Х4.3 =X4.V (21.5) (21.6) (21.7) Каждое из них в условиях (21.3) является либо тождеством, либо уравнением прямой, разбивающей плоскость (21.3) на две полуплоскости, в каждой из которых одна из сравниваемых линейных форм принимает большие значения, чем другая. Осуществив все такие разбиения плоскости (21.3) и произведя сравнения значений форм на соответствующих полуплоскостях, мы можем описать области плоскости, на которых меньшее значение оказывается у данной формы (т.е. у первой, второй или третьей) или одновременно у нескольких данных форм. Обозначим область, в ко- торой минимальные значения будут у формы хА через у. Это значит, что мы полагаем ХА.! Для Хе min ХА.; j = 1, 2, 3 Х4.2 Х4.3 для Хе$2, для Хе ЗС3. Вообще говоря, среди множеств могут быть совпадающие, а также пустые. Если система уравнений (21.3), (21.5), (21.6) (уравнение (21.7), очевидно, явля- ется следствием двух предыдущих) имеет единственное решение, то области и £К3 имеют вид углов (рис. 1.23). Если же эта система имеет бесконечное множество решений, то области принимают вид полос и полуплоскостей (рис. 1.24). Применяя введенные обозначения, мы можем переписать (21.1), или, что то же самое, (21.4), в виде v. = max min ХА.; = А ХеХ /=1,2,3 = max{ max ХЛ4, max Х4.2, max ХЛ.3} . (21.8) yeXjA'X УеЛ’г^Х хеЯ‘3пх 21.3. Нам остается найти в (21.8) внутренние максимумы и сравнить их между собой. Заметим, что каждое из множеств n X есть пересечение треугольника с углом, полосой или полуплоскостью. Поэтому оно либо пусто, либо состоит из един- ственной точки, либо является отрезком, либо треугольником, либо, наконец, вы- пуклым четырехугольником. Рис. 1.23 Рис. 1.24 73
Но максимум линейной формы на любом выпуклом многограннике, и в том числе на отрезке, треугольнике или выпуклом четырехугольнике, должен достигаться на его вершине (это утверждение известно из линейного программирования и широко применяется там; фактически оно равносильно опирающейся на лемму о переходе к смешанным стратегиям из п. 9.4 лемме из п. 10.2). Поэтому для нахождения мак- симума в (21.8) достаточно найти вершины многоугольников А X, вычислить в них значения соответствующей формы XA.j и сравнить эти значения между собой. Вершины же каждого многоугольника j n X суть либо вершины X, принадле- жащие ^Cj, либо вершина^- (если она есть), принадлежащая X, либо же точки пере- сечения сторонку со сторонами X. Все эти точки могут быть без труда перечислены. Вершинами треугольника Xявляются точки 1 = (1,0, 0), 2 = (0, 1,0), 3 = (0,0, 1). Принадлежность той или иной точки X из их числа данному множеству Ж j прове- ряется без труда путем установления того, что XA.j — наименьшее число среди ХА.^, ХА,2 и Х4«з (и во всяком случае, не большее, чем остальные). Далее, если одно из множеств Ж j имеет вершину, то мы имеем дело со случаем, изображенным на рис. 1.23. При этом все множества должны иметь общую и притом единственную вершину. Принадлежность ее множеству X устанавливается проверкой соблюдения для ее координат уравнений (21.2) и (21.3). Наконец, уравнение стороны Ж j имеет вид XA.j = XA.j , (21.9) /1 /2 а уравнение стороны X tz = 0. (21.10) Комбинируя все уравнения вида (21.9) с уравнениями (21.10) и учитывая условия (21.2) и (21.3), мы можем найти все точки и этого типа. Как видно из рис. 1.23 и 1.24, наибольшее число точек, в которых придется факти- чески вычислять и сравнивать значения линейных форм, равно семи. Общее число комбинаторно различных вариантов оказывается здесь весьма большим. Мы не будем их перечислять. 21.4. После того как значение игры найдено, нахождение оптимальных стратегий игрока 2 не представляет большого труда. Именно, для этого нужно найти те значения вектора Y = (т^, т)2, т?3) * которые удовлетворяют обычным соотношениям: П1, П2,7?3 .> 0, (21.11) +'т?2 + т?3 = 1 (21.12) (множество всех таких векторов составляет треугольник, который мы обозначим через Y) и для которых max At.YT = v . (21.13) « = 1,2,3 С этой целью достаточно найти области и5>3 плоскости (21.12), на кото- рых из трех форм Aj.YT наибольшее значение принимает соответственно форма А р YT, А2. Yт или А 3. Y и определить пересечение каждой из этих областей с тре- угольником. Точки этого пересечения и составляют множество оптимальных стратегий игрока 2. 21.5. Разумеется, при фактическом нахождении значения игры и оптимальных стратегий игроков в ней по описанному выше способу может возникать большое число возможностей сократить и упростить рассуждения и вычисления. Перечислять здесь эти возможности едва ли целесообразно. 21.6. Пример. Пусть 1 2 2 0 0 0 Уравнение (21.5) в данном случае имеет вид ХА3=^ +'2£3 +'2£2 =ХА.^ или ^2 = £3. 74
Аналогично уравнение (21.6) записывается как ХД.2 + 2^ = 2^ ='ХА.Ъ т.е. 2£2 =£1- Наконец, из уравнения (21.7), которое оказывается следствием двух предыдущих, следует, что £ i - 2 £ 3. Значит, области ,Ж2 и^3 будут выглядеть так, как это изображено на рис. 1.25 (здесь точка 0 имеет координаты (1/2, 1/4, 1/4)). Вычисление значений формы ХА. j в точках 7, 2 и 0 дает нам (1,0,0) (1,0, 2)г=1, (0,1,0) (1,0, 2)г = 0, (1/2, 1/4, 1/4) (1, 0, 2)г = 1, а вычисление значения формы Х4.2 в точке 3- (0, 0,1) (1,2, 0)г=1. Значит, именно векторы (1, 0, 0) и (1/2, 1/4, 1/4) являются оптимальными стратегия- ми игрока 1. Следовательно, на основании сказанного в предыдущем параграфе мно- жество всех оптимальных стратегий игрока 1 есть отрезок, соединяющий соответ- ствующие точки 1 и 0. Значение игры равно 1. Обратимся к нахождению оптимальных стратегий игрока 2. Приравнивание соот- ветствующих линейных форм дает нам сначала Лр YT = +'rj2 + 2??3 = 2i72 = A2. Y откуда 1 + n3 = 2 t?2 ; далее A2-YT = 2ri2 = 2r}1 -A3. YTt так что rir -rj2; наконец, из A ]. Yr = A 3. Yт следует 1 + rj3 = 2i?i. Значит, области £2 и £3 имеют вид, изображенный на рис. 1.26. Здесь С= (2/3, 0, 1/3), Г = (0, 2/3, 1/3), = (1/3, 1/2, 0). Вычисление в точках 77, V и W значений формы А р Гадает нам (1, 1, 2) (2/3, 0, 1 /3) т = 4/3, (1,1,2) (0*, 2/3, 1/3) т = 4/3, (1, 1, 2) (1/2, 1/2, 0) т = 1, (I, 1, 2) (0, 0, 1) т = 2, а вычисляя в точках 2 и I соответственно значения форм Л2. YT и A3. YT, получаем (0, 2, 0) (0, 1, 0) т = 2, (2, 0, 0) (1, 0, 0) т = 2. Таким образом, единственной оптимальной стратегией игрока 2 оказывается точка W = (1/2, 1/2, 0). 75
§ 22. ДОМИНИРОВАНИЕ СТРАТЕГИЙ 22.1. Из сказанного выше видно, что с ростом формата матричной игры весьма резко возрастает сложность анализа игры и трудоемкость ее решения. Поэтому любые приемы, позволяющие сводить решение игры к решению другой игры, меньшего формата, представляются весьма полез- ными. Если выражаться более точно, то здесь, говоря о ’’сведении”, мы имеем в виду две задачи. Во-первых, более легкую: построить по игре 1^ такую ее подыгру Глчто (Ar) С (4), а, во-вторых, — более трудную: построить по игре ГА такую ее подыгру >, что (Af) = <& (А). При этом в обоих случаях, в соответствии со сказанным в п. 8.5, мы отождествляем смешанные стратегии игроков в подыгре Гл > со смешанными стратегиями этих игроков в игре , получаемыми из стратегий в игре Гл > путем надле- жащего их пополнения нулевыми компонентами. Одна из возможностей такой редукции игр основана на двух вариантах понятия доминирования стратегий. Определение. Говорят, что в матричной игре стратегия X1 игрока 1 доминирует его стратегию X" (а стратегия X" до минируется стратегией X’), если для любой чистой стратегии/ игрока 2 Х’АX "A.j. Аналогично, стратегия У'игрока 2 доминирует его стратегию Y", если для любой чистой стратегии i игрока 1 At. Y’T < Aj. Yt,T. В частности, чистая стратегия г игрока 1 доминирует его чистую страте- гию i", если для любого / а чистая стратегия j7 и игрока 2 доми- нирует его чистую стратегию/ ”, если для любого i < а^-". □ Обратим внимание на то, что отношение доминирования касается стра- тегий одного и того же игрока, а доминирования стратегий игрока 1 и игрока 2 находятся в отношении двойственности для антагонистических игр (ср. п. 5.4). Далее мы будем для определенности говорить, как прави- ло, о доминировании стратегий игрока 1. 22.2. Игроки могут не употреблять в играх своих доминируемых стра- тегий. Точный смысл этого высказывания содержится в следующих утверж- дениях. Т е о р е м а. Если в игре стратегия одного из игроков Хг доминирует его стратегию X”, и стратегия X" оптимальна, то стратегия X* также опти- мальна. Доказательство В соответствии с соображениями двойственнос- ти пусть речь идет об игроке 1. В силу доминирования, указанного в усло- вии, мы имеем X"A.j<L X’A.j при любом / = 1,..., п, (22.1) откуда min X"A.j< minAT'A,-. (22.2) / i Но в силу оптимальности X"должно быть (теорема п. 15.1) min X"A.j=vA. / Значит, по (22.2) и min X’ A.j, т.е. стратегия X'является оптимальной. □ / 22.3. В применении к чистым стратегиям неупотребление доминируемых стратегий может означать следующее. 76
Теорема. Если чистая стратегия i0 игрока доминируется его (чистой или смешанной) стратегией X (отличной от z0), то сущёствует оптималь- ная стратегия Х° этого игрока, в которую z0 входит с нулевой вероят- ностью. Доказательство. Как и выше, ограничимся рассмотрением страте- гий игрока 1. Пусть X- (£i,..., £w). Составим векторX'= (£\,.. ., £^), ----- при I #=Z0, ~ 1 - (22.3) . О при i - io. Очевидно, 0 для всех z, и m t ii 1 s —— =------------ z &=i, i=l iVi0 1 ~ 1 — i^i0 так что вектор Xf является смешанной стратегией игрока 1. При этом z0 supp X’. Предусмотренное условиями теоремы доминирование означает XA.j ^aioj при любом /, что можно переписать как m m %iaij = KiaiQp i~ 1 i= 1 Отбрасывая теперь справа и слева общее слагаемое 0/ и деля обе час- ти получаемого неравенства на (положительное!) число 1 — 5/0, имеем m S £z ац = S aij>:aiQj прилюбом,/, (22.4) 0 i=i т.е. aioj ^*XfA.j при любом j. Это и означает, что X' доминирует стратегию z0. Далее, согласно лемме о переходе к смешанным стратегиям отсюда по- лучается Aio.YT^XrAYT прилюбом у G у. (22.5) На основании доказанного мы можем предполагать, что доминируемая стратегия не содержится в спектре доминирующей стратегии, т.е. что пос- ледняя по существу является стратегией игрока 1 в (x\z0)-подагре Г = = игры Гл. Возьмем (X*, У) G $ (А ). Это значит, что Ai.YT^X*ATYTпри всех z ^z0 и/Gy. (22.6) Обозначим через Xстратегию игрока 1 в игре Г, получаемую изХотбрасы- ванием ее нулевой /0-й компонеты. Из (22.6) следует, что ХА Yт Х*А Yт£ X*A.j при всех j 6 у. (22.7) Так как векторы X и X отличаются только лишней нулевой компонен- той у X, соотношение (22.6) можно переписать как Л/. YT Х*А YT <±X*A.j привсех z=#z0 и/Gy. (22.8) 77
Аналогично, учитывая (22.5), мы можем (22.7) переписать как Л,0. YT<iXA YT = XA YT^X*AYT<X*A.I при / G у. (22.9) Наконец, объединение (22.8) и (22.9) дает нам (X*, У) G (Г). Опти- мальная стратегия Хявляется искомой. □ 22.4. Следствие. Пусть чистая стратегия i0 игрока 1 в игре Гл до- минируется некоторой его стратегией X, отличной от iQ,A - матрица, получаемая из А отбрасыванием ее стороки i0, и ХЕ % (Л). Тогда стра- тегия X, получаемая из X вставлением нуля на место 10-й компоненты, принадлежит (А). Кроме того, vA =vА. Аналогичное утверждение справделиво для доминируемых стратегий игрока 2. Доказательство. Из теоремы п. 22.3 следует, что в игре Гл у игрока 1 существует отптимальная стратегия XQ, спектр которой не содер- жит стратегии i0. Для нее min X°A.j = vA. (22.10) 7 Эту стратегию можно рассматривать также как смешанную стратегию иг- рока 1 в игре ГА (ср. п. 22.1), и для нее, как и для любой его стратегии, должно быть (22.11) 7 Вместе с (22.10) это дает нам vA Но согласно п. 16.11 должно быть и vA 2^va , так что в действительности va~Va, и в соотношении (22.11) оказывается равенство. Значит, min XA.J- = min XA.j = vA - vA, i i откуда x E 8 (A). □ § 23. СТРОГОЕ ДОМИНИРОВАНИЕ СТРАТЕГИЙ 23.1. Перейдем к рассмотрению второй из сформулированных в п. 22.1 задач. Определение. В матричной игре с матрицей выигрышей А страте- гия X' игрока 1 строго доминирует его стратегию Х"~ (а стратегия У” стро- го доминируется стратегией Х')9 если для любого jEy X’A.j >X"A.f. Стратегия У'игрока 2 строго доминирует его стратегию Y" если для любого i Е х Aia Y’ < Л/. У" Сходным образом переносятся на случай строгого доминирования фор- мулировки о доминировании чистых стратегий игроков. □ Анализ строгого доминирования стратегий игроков оказывается проще проведенного в предыдущем параграфе анализа их (нестрогого) домини- рования. 23.2. Игроки не должны употреблять в играх своих строго доминируе- мых стратегий (ср. эту формулировку с первой фразой п. 22.2). Точный смысл этого высказывания содержится в следующих утверждениях. 78
Теорема. Если в игре стратегия X" одного из игроков строго до- минируется его стратегией X1, то стратегия Хп не может быть оптимальной. Доказательство. Будем снова говорить о стратегиях игрока 1. Предусмотренное условиями теоремы строгое доминирование стратегий означает, что Xм A.j <Х'А., при любом/ Е у, откуда (ср. п. 3.2) min X " A.j < min XfA j <ivA, / 7 и стратегия X " не может быть оптимальной. □ 23.3. Теорема. Если чистая стратегия z0 игрока строго доминирует- ся в игре Гл (чистой или смешанной) стратегией X, то для любой оптималь- ной стратегии Х* = (£i,...,£w) этого игрока должно быть = 0. Доказательство. Пусть X и z0 — стратегии игрока 1. Из условия доминирования при любом / должно быть aiQj <XA.j. Возьмем какую- нибудь оптимальную стратегию Y * игрока 2 и перейдем в написанном не- равенстве к смешанным стратегиям: Aio.Y*T<XAY*T. (23.1) Из оптимальности У* следует, что ХА Y*T ^vA, что вместе с (23.1) дает At .YT <vA, и нам остается сослаться на теорему п. 17.2 о дополняющей нежесткости. □ 23.4. Следствие. Пусть чистая стратегия i игрока 1 в игре Г А строго доминируется некоторой его стратегией, а А -^матрица, получаемая из А отбрасыванием ее строки А^. Тогда § (А) = § (А ). Доказательство. По последней теореме каждая стратегия из § (И) не содержит в своем спектре стратегии z. Поэтому ее можно рас- сматривать как стратегию в игре . По теореме о независимости от посто- ронних альтернатив (п. 5.5) она должна принадлежать § (А). Значит, § (А) С § (Л). Обратное же включение было доказано в п. 22.4 даже при более слабом предположении нестрогого доминирования. □ § 24. ВПОЛНЕ СМЕШАННЫЕ СТРАТЕГИИ 24.1. Как отмечалось, знание спектра оптимальной стратегии существен- но облегчает ее нахождение. Далее мы рассмотрим один класс игр, в ко- торых это соображение проявляется наиболее наглядно. Определение. Стратегия игрока называетя вполне смешанной, если ее спектр состоит из множества всех стратегий игрока. Ситуация равновесия (седловая точка) в игре называется вполне смешан- ной, если она состоит из вполне смешанных стратегий игроков. Игра называется вполне смешанной, если каждая ситуация равновесия (седловая точка) в ней является вполне смешанной. □ Хотя в данной главе изучаются лишь антагонистические игры, но данное определение умышленно сформулировано так, чтобы быть применимым к любым бескоалиционным играм. 24.2. Теория вполне смешанных матричных игр в значительной мере исчерпывается следующей теоремой. Теорема. Пусть в nYn-матричной игре Гл матрица выигрышей А является невырожденной. 79
Тогда, если игрок 2 имеет в Гл вполне смешанную оптимальную страте- гию, то игрок 1 имеет в ней единственную оптимальную стратегию X, для которой *) /„Л-1 (24.1) (24.2) Х = -1 т J п при ЭТОМ ля-v; Если же в Гл вполне смешанную оптимальную стратегию имеет игрок 1, то игрок 2 обладает в ней единственной оптимальной стратегией У, для которой п (24.3) причем также выполняется (24.2). Доказательство.В условиях первой части теоремы для оптималь- ной стратегии X игрока 1 ввиду существования вполне смешанной опти- мальной стратегии игрока 2 согласно теореме о дополняющей нежесткости должно быть XA.j = vA для всех j = 1,.. ., п. Запишем эту систему ра- венств в виде ХА = vA Jn, откуда ввиду невырожденности матрицы А X = vAJnA~*. (24.4) Почленное умножение этого равенства слева на J J дает нам XJTn=vAJnA-4^. (24.5) Так как X — стратегия, левая часть здесь равна единице. Поскольку тем самым левая часть отлична от нуля, должно быть JnA~xJ^ 0, и из (24.5) мы получаем (24.2). Подстановка найденного выражения для vA в (24.4) дает нам (24.1). Вторая часть теоремы доказывается симметрично. П 24.3. В качестве примера рассмотрим игру с диагональной матрицей выигрышей - аг 0 0 - О а2 ... О А = а1 1 „О 0 ... ап _ называемую диагональной игрой. Диагональную игру можно интерпретировать как следующую игру поиска. Игрок 2 прячет в одном из п мест предмет, причем в /-м месте прячется предмет ценности aj. Игрок 1 производит поиск этого предмета также в одном из мест. Найдя предмет, игрок 1 тем самым выигрывает его ценность, а не найдя — не получает ничего. 24.4. Матрица выигрышей А диагональной игры Г^, очевидно, является невырож- денной. Для нее 1 О О О О с;1 Л"1 = (24.6) о о а п - *) Здесь, как и всюду (см. п. 8.3), Jn есть /i-мерный вектор, каждая компонента которого равна единице. 80
Покажем, что игрок 1 имеет в игре вполне смешанную оптимальную стратегию. Возьмем сначала для этого смешанную стратегию JT0 = (1/«,..., 1/и). Тогда aj vA > min Лг°Л.у = min --- > 0. / / п Если теперь предположить, что для оптимальной стратегии Х*= (tt,. .. , при не- котором i будет ^z-=0, то, как легко подсчитать, окажется Х*Л.у=0, а это противо- речит тому, что по доказанному 0 < ид = min X*A.j < X*A.i . i Значит, в игре все оптимальные стратегии игрока I являются вполне смешан- ными (мы доказали даже несколько более того, что нам требовалось), и мы оказы- ваемся в условиях второй части теоремы п. 24.3. Поэтому согласно (24.6), (24.2) и и 1 ч-i Е — I и а/ 1 (24.3) мы получаем vA Но теперь оказываетя, что и игрок 2 имеет в игре Гд вполне смешанную оптималь- ную стратегию, и мы можем воспользоваться первой частью теоремы п. 24.3, согласно которой 24.5. Описываемый формулой (24.8) результат на первый взгляд может показа- заться парадоксальным, так как согласно ему игрок 1 должен с большими вероят- ностями искать менее ценные предметы. Однако этот парадокс разрешается, если принять во внимание оптимальную стратегию игрока 2, описываемую формулой (24.7). Из этой формулы видно, что при своих оптимальных действиях игрок 2 чаще всего прячет как раз наименее ценные предметы. Поэтому естественно, что игрок 1 должен стремиться найти именно их. Заметим, что векторы оптимальных стратегий игроков 1 и 2 в диагональной игре равны друг другу. Говорить о том, что оптимальные стратегии игроков в данном слу- чае совпадают, едва ли уместно, так как они выражают совершенно различные дейст- вия того и другого. Совпадают здесь только вероятности обращения игроков к одно- му и тому же месту. 24.6. Класс всех диагональных игр при всей их простоте и элементарности может в некотором смысле считаться универсаль ным. Именно, любая вполне сме- шанная стратегия является оптимальной в некоторой диагональной игре. Действительно, вполне смешанная стратегия Z =(^1,. .., £п) является оптималь- ной стратегией каждого из игроков в диагональной игре ГА, где ^Г1 0 ... 0 0 . . . 0 0 0 ... Гл1 J 24.7. Иногда оказывается, что проверка невырожденности матрицы выигрышей игры затруднительна. Имея в виду такие случаи, желательно исключить проверку невырожденности матрицы из решения игры. В связи с этим представляется полезной следующая лемма. Лемма. Если в матричной пХ п-игре оба игрока имеют вполне смешанные оптимальные стратегии, а для одного из них вполне смешанны- ми являются все оптимальные стратегии, то матрица А оказывается невы- рожденной. 6.Н.Н. Воробьев 81
Доказательство. Пусть в п X я-игре Гл вполне смешанными яв- ляются все оптимальные стратегии игрока 1. Ввиду существования вполне смешанной оптимальной стратегии игрока 2, как и раньше, все оптималь- ные стратегии игрока 1 суть решения уравнения ХА = vAJn. Это уравнение заведомо разрешимо (ибо оптимальные стратегии у игрока 1 существуют!). Поэтому если бы матрица А была вырожденной, то решения уравнения сос- тавляли бы целое подпространство положительной размерности. При этом некоторые решения находились бы на пересечении этого подпространства с границей фундаментального симплекса смешанных стратегий X. Но точки этой границы соответствуют смешанным стратегиям, имеющим нулевые компоненты, т.е. не являющимся вполне смешанными, а это противоречит предположенному. □ Эта лемма представляет собой любопытный пример утверждения, позво- ляющего судить об алгебраических свойствах некоторой матрицы А по теоретико-игровым свойствам игры Г А. 24.8. Доказанная лемма позволяет модифицировать теорему п. 24.2 следующим образом. Теорема. Если в пХ п-матричной игре Гл оба игрока имеют вполне смешанные оптимальные стратегии, причем для одного из них все оптималь- ные стратегии являются вполне смешанными, то матрица А выигрышей невырожденная, оптимальные стратегии X и Y в игре являются единственными и могут быть определены по формулам (24,1) и (24.3). Значение vA игры Гл определяется по формуле (24.2). 24.9. Следующее понятие приводит к удобному признаку полной сме- шанности игры. Определение. Будем говорить, что в «Хи-игре Гл имеется домини- рующая диагональ, если для некоторого вещественного q > 0 будет ац>Ц’ aij~.q при i Ф j, (24.9) и имеется сильно доминирующая диагональ, если, кроме того, найдется такая смешанная стратегия XQ игрока 1, что Х°А >qJn.O (24.10) Использование в п. 24.4 при рассмотрении диагональной игры вектора XQ = (1/«,. . ., 1/и) показывает, что диагональ в этой игре оказывается сильно доминирующей. В сущности, доказательство следующей теоремы является обобщением анализа диагональной игры. Теорема. Игра с сильно доминирующей диагональю является вполне смешанной. Доказательство. Пусть в игре ГА имеется сильно доминирующая диагональ. Тогда согласно (24.10) будет vA -max min JM.7>min X°A.j>q. (24.11) * 7 7 Предположим теперь, что в ГА игрок 1 имеет оптимальную стратегию, не являющуюся вполне смешанной. Пусть, например, Х*= (^,. . ., £л) — такая стратегия, и = 0. Тогда в силу (24.9) мы получаем »а -min Х*Л.7-^Х*Л./о - Z ^aiio<q, j & а это противоречит (24.11). Значит, все оптимальные стратегии игрока 1 являются вполне смешанными. 82
Но уже из существования одной вполне смешанной оптимальной стра- тегии у игрока 1 согласно теореме о дополняющей нежесткости (см. п. 17.3) следует, что для любой оптимальной стратегии Y *= (т?1,. .. ,??л) игрока 2 должно быть Л/. Y*T =vA прилюбом i = 1,...,и. (24.12) Но если о = 0, то ввиду (24.11) будет Л/о-Г’Г = ,5 ajoj^^q<vA, что противоречит (24.12). □ § 25. МАТРИЧНЫЕ ИГРЫ И ЛИНЕЙНОЕ ПРОГРАММИРОВАНИЕ 25.1. Решение матричной игры можно свести к решению стандартной задачи линейного программирования. Рассмотрим игру с т X и-матрицей выигрышей А. Не нарушая общности, можно считать, что все элементы этой матрицы положительны (если это не так, то мы можем,, прибавив ко всем элементам некоторое достаточно большое число, рассматривать получившуюся игру, которая аффинно эквивалентна первоначальной). Пусть X - произвольная стратегия игрока 1 в этой игре. Положим vx = min XA.j и заметим, что из положительности элементов А j следует положительность vх для любой стратегии X. Таким образом, мы имеем 0<Ух<хЛ7-, /=1,..., п. (25.1) Кроме того, согласно теореме п. 15.1 оптимальность стратегии X равно- сильна тому, что vx ~ max Vx'=v4. (25.2) х' Рассмотрим теперь вектор Х= (llvx)X. Неравенства (25.1) дают’ нам XA.j^Y (25.3) То, что X — стратегия, означает XJ? =l/vx, (25 А) а также Х>0. (24.5) Из (25.2) и (25.4) следует, что стратегия X будет оптимальной тогда и только тогда, когда i'jJ, ->min. (25.6) В результате (25.3), (25.5) и (25.6) определяют некоторую стандарт- ную задачу линейного программирования. Ее значение есть число, обрат- ное значению первоначальной игры, а всякое ее решение после соответ- ствующей нормировки (т.е. после деления на значение задачи) является оптимальной стратегией игрока 1. 6 83
т 25.2. Аналогично, вводя для каждой стратегии Yигрока 2 v у = тахЛ?-.У 1 и полагая Y = (1/иу) У, мы приходим к задаче линейного программи- рования Ai,YT < 1, i= 1, . . . ,т, У ^0, Jn YT -> max, которая двойственна к предыдущей. Следовательно, решения двойственной к (25.3), (25.5) и (25.6) задачи линейного программирования и только они суть оптимальные стратегии игрока 2 в игре с матрицей А. 25.3. В предыдущих пунктах мы убедились, что решение матричной иг- ры может быть сведено к решению пары двойственных друг другу задач линейного программирования. Покажем, что и наоборот, если пара двойст- венных задач имеет решения, то их множество полностью описывается множеством решений некоторой матричной игры. Тем самым будет уста- новлено, что теория матричных игр в некотором смысле эквивалентна тео- рии стандартных задач линейного программирования. Пусть нам дана пара двойственных задач линейного программирования ХА<.В, (25.7) X >0, (25.8) ХСТ -> шах, и AYT>CT, (25.9) Г>0, (25.10) BY1 -+ mm, где X и С — m-мерные векторы, У и В — д-мерные векторы, а А — тХп- матрица. 25.4. Умножая неравенство (25.7) справа почленно на неотрицательный вектор У г, мы получаем XAYT^BYT, (25.11) а умножая неравенство (25.8) слева почленно на X, — XAYT >ХСТ, (25.12) Из (25.11) и (25.12) следует, что XCT^BYT (25.13) при любых X и У, удовлетворяющих неравенствам (26.7) — (25.10), Следо- вательно, если в (25.13) имеет место равенство, ХСТ = BY 7 , то ХСТ при- нимает наибольшее значение, допускаемое неравенствами (25.7) и (25.8), a BYT — наименьшее значение, допускаемое неравенствами (25.9) и (25.10) . Иными словами, X и У оказываются в этом случае оптимальными решениями для рассматриваемых задач линейного программирования. 255. В связи с парой задач (25.7) - (25.8) и (25.9) - (25,10) линейного программирования мы будем рассматривать (т + л + 1) X (m + n + 1)-мат- 84
рицу М, записывая ее в следующей блочной (клеточной) форме: О Эта матрица кососимметричная; поэтому матричная игра с такой матри- цей выигрышей будет симметричной. Следовательно (см. п. 5.5), ее значе- ние должно быть равно нулю, а оба игрока имеют в ней одинаковые оп- тимальные стратегии. Далее мы будем их называть просто оптималь- ными стратегиями, не указывая ни игрока, ни самой игры. Пусть Z = (U, V, ?) — оптимальная стратегия, причем U является т-век- тором, V — w-вектором, a t — скаляром. То обстоятельство, что Z — стра- тегия, означает, что Z>0, ZJ^ + n+1 = l, (25.14) а ее оптимальность — что ZM^vM = 0. (25.15) 25.6. Подробное описание связи между разрешимостью пар двойствен- ных задач линейного программирования и нахождением их решений, с од- ной стороны, и решениями матричных игр — с другой, содержится в следую- щей теореме. Теорема. Пусть даны пара двойственных задач линейного програм- мирования ХА <^В, Х>^ ХСТ шах,. . . ("прямая задача99) AYT>CT Y^O, BYT min;. .. ("двойственная задача”) и описанная выше соответствующая им матрица М. Тогда 1) если Z- (U,V,t) — оптимальная стратегия, в которой Г > 0, то 1 1 Х= — Г, Y= — V (25.16) t t являются соответственно оптимальными решениями прямой и двойствен- ной задач; 2) если для каждой оптимальной стратегии Z = (U9 К, t) оказывается t = 0, то обе задачи линейного программирования оптимальных решений не имеют; 3) если X и Y — решения прямой и двойственной задач линейного прог- раммирования и 85
то (m + п — 1) - вектор Z = (rX г У, О есть оптимальная стратегия в игре Г/н- Доказательство. 1) Запишем соотношения (25.14) и (25.15) в блочной форме: (U, V, f)>09 (.и, v,t)JTm + n+l = i, (25.18) (U, V, t) 0 -A CT AT 0 -BT -С в 0 или, выполняя действия над блоками, и>0, Г2>0, Г^О, UJTm + VJTn+t = \, Al/T - tCT >0, -UA +tB^Q, UCT - BVT^0. (25.19) (25.20) (25.21) (25.22) (25.23) По условию t > 0. Следовательно, на t можно делить числа, а также - почленно — соотношения. Деля на t векторы Uи V, мы получаем (25.16), а деля (25.22), (25.21) и (25.19) — формулировки прямой и двойствен- ной задач из условий теоремы. Поэтому, согласно сказанному в п. 25.4, должно выполняться (25.13). Но из (25.23) следует, что ХСТ> BYT9 так что в (25.13) в действитель- ности имеет место равенство. Следовательно, X и У составляют пару оп- тимальных решений пары двойственных задач. 2) Пусть теперь для каждой оптимальной стратегии Z = (U9V9t) имеет место t = 0. На основании теоремы, следующей из леммы Фаркаша (см. п. 17.5), получаем, что для некоторой оптимальной стратегии / = (С/, У, t) в (25.23) должно возникнуть строгое неравенство: UCT — В VT > 0. Таким образом, система (25.21) — (25.23) может быть переписана в виде A Vr^0, (25.24) L'A^O, (25.25) UCr>BVr. (25.26) Относительно знака стоящих в (25.26) чисел нам могут представиться две возможности. Предположим сначала, что ист>о. (25.27) Возьмем произвольное a > 0 и являющийся допустимым решением прямой задачи вектор X. Рассмотрим вектор X + aU. На основании (25.25) и нера- 86
венства, описывающего ограничения прямой задачи, должно быть (X + aU)A =ХА+ aUA^B, а на основании (25.19) и неотрицательности вектора X X + aU ^0. Следовательно, X + aUявляется одним из допустимых решений сформу- лированной прямой задачи. Но при неограниченном возрастании а произве- дение (X + aU) Ст = ХСТ + aUCT также неограниченно возрастает. Таким образом, в этом случае прямая задача не имеет оптимального решения. Ввиду того, что левая часть (25.13) может стать больше любого наперед заданного числа, не найдется и такого Y, для которого это неравенство выполнялось бы при всех X. Следовательно, и двойственная задача не имеет даже допустимого (и тем более оптимального) решения. Если предположить, что BVT < 0, то аналогичные рассуждения покажут отсутствие оптимального решения у двойственной задачи и отсутствие допустимого решения у прямой. 3) Пусть теперь X и Y — оптимальные решения нашей пары двойствен- ных задач. Возьмем t и Z в соответствии с (26.17) и (26.18). Очевидно, 0HZJ^+n + 1 = 1з так что Z есть стратегия в игре Гм. Кроме того, 0 А ZM=(tX,tY, 0 -А Ст ’ 0 -Вт В 0 = t(YAT — С, —ХА + В, ХСТ-YBT). На основании (25.9), (25.7) и (25.13) все компоненты вектораZM неотри- цательны, т.е. не меньше значения игры. Поэтому Z есть оптимальная страте- гия рассматриваемой игры, и требуемое установлено. Теорема доказана. □ Из нее следует, что любой метод решения задач линейного программиро- вания может быть без труда приспособлен для решения матричных игр. § 26. СИММЕТРИЯ В ИГРАХ 26.1. При анализе и решении игр, в том числе матричных, существенную пользу может принести учет тех или иных комбинаторных свойств игр. Одним из них является симметрия игры, т.е. наличие у нее зеркального автоморфизма (см. п. 1.6). Для симметричных игр отпадает надобность в специальном нахождении значения игры: оно согласно п. 5.5 равно нулю. Также согласно п. 5.5 для таких игр достаточно находить оптимальные стратегии лишь для одного из игроков. Вместе с тем класс симметричных игр можно считать универсальным в том смысле, что по всякой игре Г можно построить такую симметричную игру Гс, что решение игры Гс равносильно решению игры Г. Именно, каждое решение игры Г получается элементарным образом из некоторого 87
решения симметричной игры Гс, а применение этого процесса переработки к любому из решений игры Гс дает некоторое решение игры Г. Процесс переработки игр в симметричные им называется симметризаци- ей. Мы опишем здесь один прием симметризации. Другой, принципиально иной вариант симметризации будет приведен в п. 26.7. Оба эти варианта симметризации в действительности применимы к произвольным антагонис- тическим играм, но будут сформулированы и доказаны только для матрич- ных игр. 26.2. Рассуждения предыдущего параграфа фактически уже содержат некоторый прием симметризации игры. В самом деле, согласно сказанному в пп. 25.1 — 25.2 решение всякой матричной игры может быть сведено к решению пары двойственных друг другу задач линейного программирова- ния. А на основе сказанного в пп. 25.3 — 25.6 решение такой пары задач сводится к решению некоторой симметричной игры. Опишем в явном виде последовательное проведение этих двух приемов. Нам сейчас понадобится конструкция, которая по существу является проецированием меры, заданной на декартовом произведении на состав- ляющие его декартовы сомножители. Именно, пусть Z — мера на произведении х X у, где х ={ хг, . . . , хт } и У У1, • • • ,Уп ) • Ее можно описать системой неотрицательных чисел -Z(xhyj), Xj^x, yj^y, составляющих в сумме единицу. Проекцией меры Z на сомножитель х называется мера X на х, для которой Х(*т) = Ъ = X i = 1 а ее проекцией на у — мера У на у, для которой m 26.3. Опишем следующий прием симметризации матричных игр. Пусть Г - < х, у, Я > = Гл — матричная m X и-игра. Положим Гс=<хХ у, у Хх,Нс>=ГАС, где Hc((xf у'), (л х')) = Н(х, у) ~ Н(х \у') , т.е. Ас есть mn X ^-матрица"В = \\Ь^ II (z, i' = 1,.. . ,т\/,/' = причем = вц - ауу. Симметричность игры Гс очевидна. Симметризацию игры Гс игры Г можно интерпретировать следующим образом. Пусть два лица, А и В, разыгрывают одновременно две партии игры Г, причем в одной партии А выступает в роли игрока 1, а в другой партии - в роли игрока 2, тогда как Б выступает в противоположных ролях. Тем самым множество всех стратегий А в этой паре игр есть множество всех пар вида (х, у), где х G х иу Е у, т.е. декартово произведение х X у. Множеством всех стратегий Б будет по тем же причинам произведение у X х. Общим выигрышем А в обеих партиях является, очевидно, алгебраическая сумма его выигрышей в этих партиях. Так описанные множества стратегий и функция выигрыша А, очевидно, и задают игру Гс. 88
26.4. Во введенных обозначениях имеет место следующая теорема Теорема. Пусть Z - смешанная стратегия игрока 1 в игре Гс, а X и Y - ее проекции на хи у. Тогда ZE § (Ас) = £Г(АС) равносильно тому, чтобы было хЕ § (А) и ZE (А). Доказательство. Включение ZG § (Ас) равносильно тому, что при любой чистой стратегии {у, х') = (/, i') игрока 2 в Гс имеет место со- отношение Н(Z, (у, л/)) = ZB (j ру 0. Это в свою очередь означает, что при любых /'Ех и /Еу будет i j j i = = XA - А,'.УТ£ 0. i f Все это можно переписать как ХА.j^Ap. YT при любых i' Е х, у Е у. Но согласно теореме п. 15.10 последнее означает, что X Е § (А) и УЕ ff(A). Требуемая равносильность доказана. □ 26.5. Можно указать еще на один способ симметризации матричных игр, основанный на иной идее. Пусть Г = < х, у, Н) = Гл - матричная m X и-игра. Возьмем какой-нибудь объект 6 , не являющийся стратегией какого-либо из игроков в Гд, и положим* Г=(хиу U0, xUyUfl,# С) = Г(АС ), где значения функции Нс описываются следующей таблицей: X У е X 0 -Н(х, у) 1 У Н(у, х) 0 -1 , (26.1) 0 -1 1 0 т.е. матрица Ас есть (m + п + 1) X (т + п + 1)-матрица: 0 А _JT] J т - АТ 0 JT J n (26.2) Jm -Jn 0 - Игра Г(ДС), очевидно, является симметричной. В терминах исходной игры Гд игра Г(АС ) поддается простой интерпретации. Пусть два лица, А и Б, договариваются о разыгрывании партии игры Гд следующим образом. Сначала они независимо друг от друга выбирают либо свои роли, игрока 1 или игрока 2 в игре Гл, либо же нейтральную ’’стратегию неучастия” 0. При этом если А и В выбирают различные роли, то они после этого факти- чески разыгрывают игру Гд в соответствии с выбранными ролями. Если А выбирают роль игрока 1, а Б — стратегию 0 , то А выигрывает у Б единицу; если А выбирает роль игрока 2, а Б — стратегию 0 , то А проигрывает единицу; если стратегию 0 выбирает А, то получается симметричная карти- 89
на, как это видно из таблицы (26.1) и матрицы (26.2); наконец, если А и Б выбирают одну и ту же роль или же одновременно стратегию 0 , то выиг- рыш каждого из них равен нулю. 26.6. Переход от произвольной матричной игры Гл к симметричной матричной игре Г(ЛС ) является операцией симметризации в смысле, сфор- мулированном в п. 26.1. В этом можно убедиться на основании следующих рассуждений. Не ограничивая общности рассмотрений (см. п. 5.2), с самого начала можно предполагать, что иА > 0. Пусть Z1 =(t/i,F15n)e Z2=(U2,V2,t2)G У(Л‘), где, как и выше, 17ь U2 суть ли-векторы, Иь V2 - и-векторы, a tlf t2 - вещественные числа. Предположим сначала, что для всех Zi € § (Лс) будет = 0. Тогда, как это следует из части 2) теоремы п. 25.6, двойственные друг другу задачи линейного программирования XA^Jn, Х^> 0, XJ^ -> min, AYT^j£, Y>0, Jn YT -> max не имели бы оптимальных решений (а одна из них — даже и допустимых!) . Однако, согласно сказанному в пп.25.1 и 25.2, эти решения — оптимальные стратегии соответствующих игроков в игре Гл , а эти стратегии, как извест- но, существуют. Значит, найдется такое Zj G § (Ас) , для которого h > 0. Далее, оптимальность стратегии Z2 означает, что 0 А 1 —Ат 0 JT J п *2^ 11Л о Jm - 0 _ т.е. A,Y2T-t2^0, — U2A ,j + t2 0, u2JTm-JnvT2^o. i = 1,. . . , m, (26.3) (26.4) (26.5) Из 11 > 0 по свойству дополняющей нежесткости следует, что в (26.5) имеет место точное равенство: U2JTm =JnVT2. (26.6) С другой стороны, t2 Ф 1, так как последняя чистая стратегия игрока 2 в игре Г(ЛС) оптимальной не является. Поэтому части равенства (26.6) положительны, и на них можно почленно делить неравенства (26.3) и (26.4) : А 1 'j VT Jпу 2 U2 1 A ,.+t2 ----Т ^0, JnVT2 UlJT 90
откуда, учитывая (26.6), V_l : t_2 h < А Ai'jnVT2 ^JnVT2 U2J^n ~ U2J^n 'Z (26.7) для всех / = 1,... ,m и j = 1, .. . ,n. Векторы U2/(U2J^) и являются стратегиями игроков в игре Гл. Поэтому соотношение (26.7) приводит нас в условия утверждения п. 15.8, согласно которому Е2 с0 V2 ^2 ^2 ----— Е о (Л),-----7- Е J (Л), ----— =-----— - • U2JTm Jn У2 U2JTm Jn VT2 Так как по предположению vA > 0, то должно быть и t2 > 0, и притом для всех оптимальных стратегий Z2. По соображениям симметрии должно быть и 11 > 0 для любой оптималь- ной стратегииZi игрока 1 в игре Г(ЛС). Таким образом, мы в нашем случае неизменно оказываемся в условиях части 1) теоремы п. 25.6, и оптимальная стратегия каждого из игроков в игре Г(ЛС ) порождает седловую точку в игре^л . Пусть, с другой стороны, X Е S (А) и У Е У (А), кроме того, vA > 0. Тогда согласно п. 25.1 и 25.2 векторы X-XfvA и Y = Y/vA являются решениями пары двойственных задач линейного программирования, и по ним в соответствии с формулами (25.17) и (25.18) мы получаем некото- рую .оптимальную стратегию любого из игроков в симметричной игре Г(ЛЪ-
Глава 2 БЕСКОНЕЧНЫЕ АНТАГОНИСТИЧЕСКИЕ ИГРЫ § 1. БЕСКОНЕЧНЫЕ АНТАГОНИСТИЧЕСКИЕ ИГРЫ 1.1. В этой главе будут рассматриваться общие антагонистические игры, т.е. системы вида Г = <х,у,Я>, (1.1) где х и у — произвольные множества, элементы которых называются соот- ветственно стратегиями игроков 1 и 2, а Н: х X у -> R — функция, называе- мая функцией выигрыша игрока 1 (см. п. 1.3 введения). Она называется также функцией выигрыша самой игры Г. В этой книге рассматриваются только игры с ограниченными функциями выигрыша. Таким образом, исходные термины и обозначения теории общих антаго- нистических игр совпадают с соответствующими терминами и обозначения- ми теории матричных игр. Содержательно число Н(х,у), где х£х, а у Gy, обозначает выигрыш игрока 1 (проигрыш игрока 2) в ситуации (х, у). 1.2. Необходимость рассмотрения бесконечных (в том числе — антаго- нистических) игр требует некоторых методологических обоснований. Во многих естественных (а в последнее время — и в общественных) науках широкое распространение получил прием, заменяющий рассмотре- ние конечных множеств с очень большим числом элементов рассмотрением бесконечных множеств. Этот прием позволяет применять к широкому классу задач мощный аппарат математического анализа. Поэтому, если мы встречаемся с большим числом стратегий у игрока, то независимо от того, будем ли мы считать, что он в действительности располагает в игре конечным или бесконечным множеством стратегий, методологически естественно, а практически полезно считать множество его стратегий бесконечным. Под бесконечной антагонистической игрой мы будем понимать такую антагонистическую игру, в которой хотя бы один игрок имеет бесконеч- ное множество стратегий. С теоретико-игровой точки зрения именно свойство антагонистичности игры оказывается решающим предположением, определяющим основные направления и результаты ее анализа (см. теорему п. 4.4 гл. 1). Различие между конечными и бесконечными антагонистическими играми представ- ляется в этом смысле второстепенным и скорее техническим: для исследо- вания бесконечных игр приходится применять более сложный математичес- кий аппарат, заменять линейно-алгебраические соображения функциональ- но-аналитическими (в том числе анализ систем линейных алгебраических 92
уравнений анализом интегральных уравнений, которые в благоприятных случаях поддаются сведению к системам дифференциальных уравнений). 1.3. Определение. Если х и у — топологические пространства, то игра Г = < х, у, Я > называется топологической. Если при этом функция выигрыша Я непрерывна на пространстве ситуаций х X у (в смысле тополо- гии произведения, т.е. по двум переменным сразу), то топологическая игра Г называется непрерывной. □ Упомянем специально класс антагонистических игр, в которых х = у = = [0,1]. В этих играх ситуации суть пары чисел (х, у), где х, у G [0, 1]. 1 х Рис. 2.1 Такие пары естественно понимать как точки единичного квадрата. Поэто- му описываемые игры называются играми на единичном квадрате (рис. 2.1). 1.4. Как и во всякой вообще антагонистической игре, принципом опти- мального поведения игрока можно считать его следование ’’максиминному” образу действий. Как было установлено в § 6 гл. 1, этот принцип реализует- ся в игре Г = < х, у,Я> тогда и только тогда, когда существуют и равны смешанные экстремумы max inf Н(х,у) и min 8ирЯ(х,У). (1.2) хЕх уЕу убухЕх Для конечных антагонистических (матричных) игр существование этих экстремумов было нами доказано в §10 гл. 1, и все дело заключалось в установлении их равенства или хотя бы в нахождении путей преодоления их неравенства. § 2. СИТУАЦИИ 6-РАВНОВЕСИЯ, 6-СЕДЛОВЫЕ ТОЧКИ И 6-ОПТИМАЛЬНЫЕ СТРАТЕГИИ 2.1. Для бесконечных антагонистических игр даже существование сме- шанных экстремумов (1.2), вообще говоря, не обязательно имеет место. Рассмотрим в качестве примера игру Г = <х, у,Я>, в которой х = у = = (0, 1), а Я(х, у) =х+у (см. пример из п. 2 введения, проиллюстрирован- ный рис. 1.2 в п. 4.3 гл. 1) . Здесь, очевидно, седловой точкой ’’была бы” ситуация (1, 0), если бы 1 и 0 входили в число стратегий игроков. Именно на этих стратегиях игро- ков и могут достигаться внешние экстремумы в выражениях из (1.2). Значением игры в этом случае было бы число 1. Поскольку, однако, в 93
действительности внешние экстремумы в (1.2) здесь не достигаются, все эти возможности непосредственно не реализуются. Ясно вместе с тем, что игрок, выбирая в качестве свежей стратегии число, достаточно близкое к единице, уверенно получит выигрыш, достаточно близкий к значению игры. Точно так же игрок 2, выбирая число, достаточно близкое к нулю, сделает свои потери сколь угодно близкими к значению игры. Поэтому в описываемой игре можно говорить об оптимальности стратегий игроков ”с точностью до произвольного е > О”. Соответствующие понятия поддают- ся точной формализации. 2.2. Определение. Ситуация (х€9у€) в антагонистической игре Г = < х, у, Н > называется ситуацией е-равновесия, если для любых страте- гий х и у соответственно игроков 1 и 2 имеет место неравенство Н(х, уе)-е^Н(хе,уе)^Н(хе,у) + е. (2.1) Точку (хе,уе), ддя которой выполняется соотношение (2.1), называют также е-седловой точкой функции Н. □ 2.3. Определение. Стратегии х€ и уе, составляющие ситуацию е-равновесия в антагонистической игре, называются е-оптимальными стра- тегиями. □ Этот термин отражает тот факт, что такие стратегии являются оптималь- ными ”с точностью до е ”. Именно, если отклонение от оптимальной стратегии никакой пользы игроку принести не может, то его отклонение от е’-о пт и ма л ь н о й стратегии может увеличить его выигрыш, но не бо- лее чем на е. 2.4. Пусть игры Г = < х, у, Н) и Г' = < х, у,Н’) аффинно эквивалентны, т.е. имеет место Н' -кН + я, где к> 0. Тогда из (2.1) следует, что всякая ситуация е-равновесия в игре Г является ситуацией £е-равновесия в игре Г'. 2.5. Из (2.1) и определения изоморфизма антагонистических игр (см. п. 1.4 гл. 1) следует, что изоморфные игры имеют одни и те же ситуа- ции е-равновесия. Точно так же из (2.1) и определения зеркального изоморфизма следует, что если (хе , уе) является ситуацией е-равновесия в некоторой игре, то (Тб>хс) будет ситуацией е-равновесия в зеркально изоморфной к ней игре. § 3. е-ОПТИМАЛЬНЫЕ СТРАТЕГИИ И МИНИМАКСЫ 3.1. Связь е-седловых точек общих антагонистических игр с минимакса- ми есть обобщение описанной в п. 6.1 гл. 1 связи с ними седловых точек матричных игр. Критерий существования у функции выигрыша е-седловых точек при любом е > 0 напоминает критерий существования седловых точек. Теорема. 1) Если (хе, уе) — е-седловая точка функции Н: хХ у -> -> R, то inf//(xe,j>) + 2е L> sup inf//(x, у), У X у sup Я(х, Ус) — 2е inf sup Н(х, у). х ух (3.1) (3-2) 94
2) Если при всяком е > 0 функция Н имеет е-седловые точки, то sup inf Н(х, у) = inf sup Н(х, у). .(3.3) х у ух 3) Если выполняются соотношения (3.1), (3.2) и (3.3), то (х€, уяв- ляется 4е~седловой точкой функции Н. 4) Если имеет место равенство (3.3), то при любом е > О функция Н имеет е-седловую точку. Обратим внимание на следующую особенность доказываемых фактов. Согласно части 1) теоремы, на компонентах е-седловых точек внешние экстремумы минимаксов достигаются не с точностью до е, а лишь с точ- ностью до 2е. В свою очередь, согласно части 3) теоремы, погрешность в до- стижении внешних экстремумов минимаксов при оценке седловой точки также должна увеличиваться вдвое. Доказательство. Пусть (х€, у€ ) — е-седловая точка функции Н. Это означает, что Н(х, уе)-е <1Н(х€,уе)<^Н(хе,у) + е. (3.4) Кроме того, при любом х, очевидно, inf//(x, у) - е <^Я(х, у€) — €. (3.5) У Из (3.4) и (3.5) следует, что inf Н(х, у) — е ^Я(х, уе) — е <^Я(хе, у) + е. у Переход в этом неравенстве к супремуму по х и к инфимуму по у дает нам sup inf Н(х, у) — е X у ^supZ/(x,ye) -е < inf//(xe,y) + е. (3.6) х у Сравнение крайних частей последнего неравенства дает нам сразу (3.1). Сходным образом получается и (3.2), и первая часть теоремы доказана. Перейдем теперь в правой части неравенства (3.6) от значений функций нахе и у€ к экстремумам: inf sup Н(х, у) — e sup inf Н(х, у) + е. У х х у Ввиду произвольности е > 0 отсюда следует inf sup Н(х, у) sup inf Н(х, у). ух X у Но обратное неравенство имеет место всегда (см. п. 4 § 6 гл. 1), так что справедливо (3.3) и тем самым — вторая часть теоремы. Далее, из (3.1), (3.2) и (3.3) следует, что sup Н(х, уе) - 2е inf Н(хе, у) + 2е, х у т.е. при всех х и у Н(х,уе)-2е < Я(хе,у) + 2е. (3.7) 95
В частности, полагая х — хе, мы получаем Н(хе, j’e) <^Жхе, у) + 4е ПРИ любом у. Аналогично, полагая у — у€, мы имеем Н(х, ге) - 4 е Я(хе, уе) при любом х. (3.8) (3-9) Неравенства (3.8) и (3.9) дают нам Н(х,уе) -4е ^Я(хе,уе) <Ж(хе, у) + 4е, а это и требуется. Наконец, каково бы ни было е > 0, значения хе и уе, для которых вы- полняются неравенства (3.1) и (3.2), можно найти всегда (на основании определения экстремумов). Следовательно, если справедливо равенство (3.3), то мы оказываемся в условиях предыдущего рассуждения, согласно которому у функции должна быть 4е-седловая точка. Нам остается заме- тить, что е > 0 было взято произвольно. □ 3.2. Напомним (ср. пп. 2.5 и 2.6 гл. 1), что смешанные экстремумы sup inf Н(х, у) и inf sup Н(х, у) х у у X называются соответственно нижним и верхним значениями антагонистиче- ской игры Г = <х,у,Я > и обозначаются через иг и Up. В этой системе терминов ч. 1) теоремы п. 3.1 можно переформулировать следующим образом: Если (хе, уе) — е-седловая точка функции Н, то Н(хе, у)^ Рг — 2е при любом у Gy, (3.10) Н(х, уе) йг + 2е прилюбом xGx. (3.11) Согласно ч. 3) теоремы п. 3.1 условия (3.10) и (3.11) являются доста- точными для 4е-оптимальности стратегий х€ и у€. §4 . СМЕШАННЫЕ СТРАТЕГИИ 4.1. Уже рассмотрение матричных игр показывает, что существуют анта- гонистические игры без ситуаций равновесия (и даже без ситуаций е-равно- весия при достаточно малых е > 0) в первоначально заданных стратегиях игроков. Но каждую конечную (матричную) игру можно дополнить до бесконеч- ной игры, например, путем предоставления в распоряжение каждого игрока любого числа доминируемых стратегий (см. § 22 гл. 1). Очевидно, такое расширение множества стратегий игрока в действительности не будет озна- чать расширения его возможностей, и фактическое его поведение в расши- ренной игре не должно будет отличаться от его поведения в первоначальной игре. Тем самым мы получили сразу достаточное количество примеров бес- конечных антагонистических игр, не имеющих седловых точек. Имеются и другие источники примеров такого рода. Таким образом, для реализации в бесконечной антагонистической игре принципа максимина необходимо, как и в случае конечной (матричной) игры, некоторое расширение стратегических возможностей игроков. Для 96
класса матричных игр введение смешанных стратегий игроков, т.е. вероят- ностных мер на множествах их чистых стратегий, оказалось как необходи- мым (п. 22.6), так и достаточным (п. 14.2). Для бесконечных антагонисти- ческих игр введение аналогичных смешанных стратегий также окажется достаточно плодотворным, хотя, как можно показать, существуют беско- нечные антагонистические игры, не имеющие ситуаций равновесия (и даже ситуаций е-равновесия при достаточно малом е > 0) даже в смешанных стратегиях. Пример такой игры будет приведен в п. 28.7. 4.2. Пусть Г = < х, у,77 ) — произвольная (вообще говоря, бесконечная) антагонистическая игра. Как и в случае конечных игр, смешанными страте- гиями игроков в Г являются вероятностные распределения на множествах их чистых стратегий х и у, а ситуациями в смешанных стратегиях в Г — пары таких вероятностных распределений, которые являются стохастиче- ски независимыми. 4.3. Введение вероятностного распределения на конечном множестве оказывается весьма простым делом. Для его задания достаточно приписать каждому элементу множества некоторую неотрицательную вероятность так, чтобы сумма всех этих вероятностей была равна единице. Такого рода распределения и соответствующие им смешанные стратегии игроков далее будут называться конечными. В остальных случаях следует действовать более аккуратно: необходимо задать некоторое достаточно широкое семейство подмножеств множества стратегий игрока и приписать каждому подмножеству из этого семейства некоторую вероятность выбора чистой стратегии именно из него. Такое приписывание вероятностей должно подчиняться некоторым условиям, свя- занным с так называемой ’’измеримостью” функции выигрыша. Связанные с этим рассуждения в полном своем объеме оказываются достаточно слож- ными. Однако мы на них сейчас останавливаться не будем и ограничимся следующим предположением, которое в рамках рассматриваемых в данном курсе вопросов полностью соблюдается. Пусть X и Y — смешанные стратегии игроков 1 и 2 в игре Г. Выигрыши Н(Х, у), Н(х, У) и Н(Х, У) являются по определению математическими ожиданиями Я(Ху) = /Я(х,уЖ(х), Я(х, У) = /Я(х,у)<7У(у), х у Я(Х У) = f Н(х, Y)dX(x) = f H(Xf y)d Y(y) = x у = f f H(x,y)dX(x)dY(y). X у Мы будем считать, что все написанные здесь интегралы существуют, каковы бы ни были вероятностные распределения X и У. Все эти интегралы являются интегралами Стилтьеса. Читатель, не знакомый с этим понятием, может каждый раз под дифференциалом dX(х) понимать либо вероятность появления точки х в условиях распределения X, либо вы- ражение fx(x)dx, где /%(х) - плотность распределения Xв точке х. Ясно, что если при всех х дифференциал dX(x) употребляется в первом смыс- ле, то интеграл Стилтьеса превращается в сумму конечного или счетного чис- ла слагаемых, а если во втором смысле, то в обычный интеграл (Римана). 7.Н.Н. Воробьев 97
Более точные рассуждения проводятся в § 9, где они нам и понадобятся. 4.4. Определение. Пусть Г = < х, у, Н > - антагонистическая игра, а ( А"*, У*) — некоторая ситуация в смешанных стратегиях в ней. Она назы- вается ситуацией равновесия в смешанных стратегиях (или, синонимично, седловой точкой в смешанных стратегиях), если для любых смешанных стратегий X и Y соответственно игроков 1 и 2 выполняется неравенство Н(Х, Y*)^H(X*, У*) ^Н(Х*, У). 4.5. В связи со смешанными стратегиями в бесконечных антагонистиче- ских играх можно сформулировать и доказать утверждения, аналогичные тем, которые в связи со смешанными стратегиями в матричных играх были приведены в § 9 гл. 1. Аналогом леммы п. 9.3 гл. 1 является следующая лемма. Лемма (о переходе к смешанным стратегиям). Если Н(х, Y)<^a при всех xGx, (4.-1) то Н(Х, У) а для всех смешанных стратегий X игрока 1. Доказательство осуществляется интегрированием неравенства (4.1) по х с интегрирующей функцией Х(х): fH(x, Y.)dX(x) <>afdX(x), что и дает X X требуемое. □ Точно так же можно переходить к смешанным стратегиям в неравен- ствах вида Н(х, У)>л при всех хЕх, Н(Х, у) <* а при всех у Е у, Я(Х у) > а при всех у Е у. 4.6. Как и в случае матричной игры (см. п. 9.5 гл. 1), равновесность ситуации может выражаться через отклонения игроков ”на чистые стратегии”. Теорема. Для того чтобы ситуация У*) была ситуацией равно- весия в смешанных стратегиях в антагонистической игре Г = <х,у,Я>, необходимо и достаточно, чтобы при всех х Е х и у Е у имело место неравенство Я(х, У*)^Я(Х*, Y*)^H(X*,y). Доказательство. Необходимость очевидна. Для доказательства достаточности следует перейти к смешанным стратегиям на основании предыдущей леммы. □ 4.7. Сформулируем и докажем аналог леммы п. 10.2 гл. 1. Лемма. Пусть Г = < х, у,Я > - антагонистическая игра. Какова бы ни была смешанная стратегия У игрока 2, должно быть sup Н(х, У) = sup Н(Х, У), (4.2) х X где супремум слева распространяется на все чистые стратегии игрока 1, а справа - на все его смешанные стратегии. 98
Аналогично, какова бы ни была смешанная стратегия X игрока 1, должно быть infH(X,y) = infH(X, У), у у где инфимум слева распространяется на все чистые стратегии игрока 2, а справа — на все его смешанные стратегии. Доказательство проводим только для первой части леммы. Поскольку область смешанных стратегий шире области чистых, должно быть (см. п. 3.6 гл. 1) sup#(x, У)^ sup#(X У). (4.3) х X Предположим, что здесь имеет место строгое неравенство sup#(x, У) < sup#(X У). х X Это значит, что при некотором малом е > 0 будет и supН(х, У) < swpH(X, У) —е, х х т. е. при всех х Е х Н(х, У) < sup#(X У)-е. х Но тогда, переходя к смешанным стратегиям, мы получаем sup#(X У) < sup#(X У)-е, X X а этого не может быть. Следовательно, в (4.3) имеет место равенство. □ 4.8. Утверждение о том, что если среднее значение совпадает с макси- мальным, то и все усредняемые значения также совпадают с ним, представ- ляется достаточно естественным; однако оно несколько нетривиально и требует специального доказательства. Лемма. Пусть Г = <х,у,Я > - антагонистическая игра, Y- произ- вольная смешанная стратегия игрока 2, а супремум sup/7(Jf, У) дости- х гается на (вообще говоря, смешанной) стратегии Х°. Тогда множество тех хёх, для которых Н(х, У) < Н(Х\ У), (4.4) в условиях распределения XQ реализуется с вероятностью 0, т. е. X* (си) = 0. Аналогично, для произвольной стратегии Xигрока 1 и достигаемости ин- фимума inf Н(Х, У) на стратегии У0 множество тех у G у, для которых Y Н(Х, У0) < Н(Х,у), в условиях У0 реализуется с вероятностью 0. Доказательство. Возьмем исчезающую (т.е. убывающую и сходя- щуюся к нулю) последовательность > е2 > ... > еп > ... > 0 и обозначим 7* 99
через со„ множество тех х, для которых выполняется неравенство Н(х, У) < Я(х°, У) - е„. (4.5) оо Очевидно, С С ... С С ... и U соп = со. В силу непрерывности п = 1 вероятностного распределения Х° отсюда следует, что lim = п -> 00 = Х°(<о). Если теперь предположить, что Х°(со) > 0, то должно найтись такое п, что и Х° (oj„) > 0. Далее мы имеем: Н(Х°, Y)=fH(x, Y)dXQ(y) = х = f H(xf Y)dX°(x) + f H(x,Y)dX°(x). . X \ COn В пределах множества con выполняется (4.5), а на остальной части х — неравенство (4.4). Следовательно, Н(Х°, Y)£ f (Я(Х°, Y) — en)dX°(x) + f Н(Х°, Y)dXQ(x) = <л)п X \ = -en f dX°(x)+H(X°f Y)( f dX°(x) + f dX°(x)) = OJn GJn X \ = -en f dX°(x)+H(X°,Y), ИЛИ Н(Х°-, У) + еХ°(и>„)^Я(Х°, У), чего не может быть, поскольку е > 0 и Х° (со„) >0. Вторая часть леммы доказывается аналогично. □ 4.9. Лемма. В антагонистической игре Г = < х, у,Я > при любой сме- шанной стратегии Y игрока 2 максимумы шахЯ(х, Y) и тахЯ(Х, У) (4.6) х х существуют или не существуют одновременно, и если существуют, то равны. Точно так же при любой смешанной стратегии X игрока 1 минимумы min#(X, у) и min#(X К) существуют или не существуют одновремен- У Y но, и если существуют, то равны. Доказательство. Рассмотрим равенство (4.2). Если в нем дости- гается левый супремум, то тем самым достигается и правый, ибо всякая чистая стратегия является и смешанной. Предположим, что в (4.2) достигается правый супремум. Тогда мы на- ходимся в условиях леммы п. 4.8, согласно которой множество тех х, для которых выполняется равенство Н(х, К) = тахЯ(2Г, К), имеет полную х меру и потому непусто. Следовательно, достигается и левый супремум. 100
Значит, максимумы (4.6) действительно существуют или не существуют одновременно. Если же они существуют, то они равны соответствующим супремумам, которые согласно лемме п. 4.7 равны друг другу. Вторая часть леммы доказывается аналогично. □ §5 . СВОЙСТВА ЗНАЧЕНИЯ ИГРЫ И ОПТИМАЛЬНЫХ СТРАТЕГИЙ ИГРОКОВ 5.1. Приводимые в этом параграфе утверждения по существу повторяют аналогичные высказывания, сделанные в § § 15 и 18 гл. 1 по поводу матрич- ных игр. Определение. Если имеет место равенство supinf#(X y) = infsup#(X У), X Y Y X то общее значение этих смешанных экстремумов называется значением игры с функцией выигрыша Н. □ Из теоремы § 3 следует, что для существования у игры значения необхо- димо и достаточно, чтобы при любом е > 0 в ней была бы е-седловая точка (в смешанных стратегиях). 5.2. Теорема. Для любой антагонистической игры Г = <х,у,Я > , имеющей значение vr , sup inf Н(х, y)^vr inf sup#(x, у). (5.1) X у ух Доказательство. Согласно лемме п. 4.7 для любой стратегии X игрока 1 inf Н(Х,у) = inf H(Xt У). Поэтому у у sup inf Н(х, у) sup inf Н(Х, у) = sup inf H(X, У ) = иг, х у ' Ху X Y и левая сторона (5.1) доказана. Правая сторона этого неравенства доказы- вается аналогично. □ 5.3. Теорема. Если в антагонистической игре Г = < х, у, Я > игрок 1 имеет чистую оптимальную стратегию х*, а игрок 2 - произвольную (т.е., вообще говоря, смешанную) оптимальную стратегию, то иг = max inf Н(х, у) = пипЯ(х*,у). (5.2) х у у Аналогично, если игрок 2 имеет чистую оптимальную стратегию у*, а игрок 1 - произвольную оптимальную стратегию, то иг = min sup Н(х, у) = max Н(х, у* ). ух х Доказательство мы проведем для первой части теоремы. Пусть У* — оптимальная стратегия игрока 2. По определению опти- мальных стратегий vv=H(x*, Y*) = mnH(x*, У). Y 101
Тем самым, учитывая лемму п. 4.9 и предыдущую теорему, мы имеем иг = тшЯ(х*, у) sup inf Н(х, у) иг > (5.3) У X у так что иг = inf Я(х*, у) = sup inf Н(х, у). У X у Следовательно, стоящий справа внешний экстремум достигается (именно, при х- %*), и иг = max inf Я(х, у). (5.4) х у Теперь (5.3) и (5.4) дают нам (5.2). □ 5.4. Теорема. Пусть иг - значение игры Г = <х,у,Я >, я и - произ- вольное число. Если XQ - некоторая стратегия игрока 1,тоиз v H(XQ, у) для любого у G У (5.5) следует и^иг. (5.6) Если Уо - стратегия игрока 2, то из Н(х, Уо) v для любого х G х следует иг и. Доказательство проводится для первой части теоремы. Применяя к (5.5) переход к смешанным стратегиям, мы получаем для любой смешанной стратегии У игрока 2 и H(XQ, У). Следовательно, v inf Н(Х0, У), и у тем самым v <; sup infН(Х, У). (5.7) X Y Но по теореме 5.2.. sup inf//(X Г)^иг- <5-8) X У Из (5.7) и (5.8) следует (5.6). □ 5.5. Теорема. Пусть иг - значение игры Г = <х,у,Я >. Для того чтобы стратегия X* игрока 1 была оптимальной, необходимо и достаточно, чтобы было Н(Х*, у)^> Up при всех у Gy. (5.9) Аналогично формулируется критерий оптимальности стратегии игрока 2. Доказательство. Необходимость. Из оптимальности X* следует, что infН(Х*> У) = sup infН(Х, У) = иг. у х у и поэтому выполняется (5.9). Достаточность. Переходя к (5.9) к смешанным стратегиям, полу- чаем для любой смешанной стратегии У игрока 2 Я(Х*, У) иг , и, следо- вательно, infH(X*, У) ^иг = sup inf#(X У). У X У 102
т.е. на X* достигается максимум функции inf Н(Х, К), что ввиду теоремы Y п. 6.1. гл. 1 и означает оптимальность стратегии X*. □ 5.6. Как и в случае матричных игр (см. § 17 гл. 1), для общих антагони- стических игр важную роль играет понятие спектра смешанной стратегии, которому здесь, однако, приходится дать более общее определение. Определение. Пусть Г — антагонистическая игра. Чистая страте- гия z о игрока в ней называется точкой концентрации его смешанной стра- тегии Z , если Z (z 0) > 0. Очевидно, точки спектра любой смешанной стратегии в матричной игре (см. п. 8.5 гл. 1) суть ее точки концентрации. Пусть теперь множество стратегий игрока в игре Г является топологи- ческим пространством. Тогда чистая стратегия z0 называется точкой спектра смешанной стратегии Z, если для любой измеримой окрестности са точки z о имеет место соотношение Z (со) = f dZ (z ) > 0. □ со Очевидно, в топологических играх точки концентрации смешанных стра- тегий являются точками их спектров. Обратное, вообще говоря, неверно. Точки (чистые стратегии), в которых смешанная стратегия имеет положи- тельную плотность, являются ее точками спектра, но не являются ее точ- ками концентрации.- Множество всех точек спектра смешанной стратегии Z будет, как и в случае матричной игры, обозначаться через supp Z. 5.7. Для случая точек концентрации смешанных стратегий теорема п. 17.3 гл. 1 (свойство дополняющей нежесткости) переносится на общие антагонистические игры дословно. Теорема. Пусть Г - антагонистическая игра, имеющая значение иг. Тогда если х0 е х, Yе<^(Г) и Н(х0, Y)<vr. (5.10) то х0 не может быть точкой концентрации какой-либо оптимальной страте- гии игрока 1. Очевидно, справедливо и двойственное утверждение о точках концентра- ции оптимальных стратегий игрока 2. Доказательство. В силу оптимальности стратегии Y Е Y для всех х Е х должно быть Н{х, У)^иг. (5.11) Почленное интегрирование этого неравенства по мере X на множестве х\х0 дает нам f Н(х, Y)dX(x)^vr f dX(x). (5.12) х =ёх0 x ¥= x0 Кроме того, (5.10) дает Я(х0, У)Х(хо) < пгДх0) (5.13) (здесь Х(х0) Ф 0, так как в противном случае точка х0 заведомо не могла бы быть точкой концентрации). Складывая (5.12) и (5.13), мы получаем /Я(х, фХ(х)=ВДТ) = иг < ”г SdX(x) = vTi X X чего не может быть. Значит, Х(х0) = 0. □ 103
5.8. Для произвольных точек спектра оптимальной стратегии свойство дополняющей нежесткости имеет место лишь в том случае, когда функция выигрыша обладает свойством непрерывности, хотя бы ограниченным. Лемма. Пусть Г - антагонистическая игра <х,у,//> со значе- нием иг. Если У* - некоторая оптимальная стратегия игрока 2, а чистая страте- гия xQ игрока 1 такова, что H(xQ,Y*)<vr, (5.14) и функция Н( •, у*) непрерывна в точке х0, то xQ не может быть точкой спектра какой-либо оптимальной стратегии игрока 1 в Г. Доказательство. Пусть X* — некоторая оптимальная стратегия игрока 2. Тогда Н(Х*, Y^ = v=m^H(X, Y*). 1 х Следовательно, по лемме п. 4.8 для множества со всех х, для которых Н(х, У*)<иг, (5.15) должно быть Х*(си) = 0. (5.16) Далее, по условию функция Н(х, У”) в точке х0 непрерывна. Поэтому из (5.14) следует, что найдется такая окрестность gj>0 точки х0, что для всех х G выполняется (5,15). Так как из (5.16) следует, что и JT(g;0) = O. (5.17) Но если бы х0 была точкой спектра стратегии ЛГ* то было бы Jf*(cjo) >0, и противоречие с (5.17) доказывает лемму. □ 5.9. Как следствие этой леммы мы получаем следующую теорему. Теорема. Пусть Г * — антагонистическая игра с непрерывной функ- цией выигрыша Н и значением Up. 1) Если У* - некоторая оптимальная стратегия игрока 2, а чистая стра- тегия х0 игрока 1 такова, что H(xQ, У*) < v г, то х0 не может быть точ* кой спектра какой-либо оптимальной стратегии игрока 1 в Г. 2) Если X* - некоторая оптимальная стратегия игрока 1, а чистая стра- тегия yq игрока 2 такова, что Н(Х*, у^) > и г, то у0 не может быть точ- кой спектра какой-либо оптимальной стратегии игрока 1 в Г. Доказательство. Из непрерывности функции Н следует непре- рывность функций Я( •, У *) и Н(Х *, •), и нам остается сослаться на лемму п.5.8. □ § 6. ЕСТЕСТВЕННАЯ МЕТРИКА НА МНОЖЕСТВАХ СТРАТЕГИЙ 6.1. Истинное отличие в игре одной стратегии игрока от другой его стратегии состоит не во внешних содержательных чертах этих стратегий, а в различии между последствиями, к которым эти стратегии приводят, т.е. в различии между выигрышами, которые получит игрок, употребляя ту или иную стратегию. Это дает основание ввести на множестве пар стра- тегий игрока 1 в антагонистической игре Г = <х, у, Н) следующую функ- 104
цию Pi: х X х -> R : P1(X1,X2)= sup \H(X!,y) -H(x2,y)\. (6.1) yer Эта функция, как легко убедиться, является симметричной: Р1(Х1,х2)= sup |Я(Х1,х)— Н(х2,у) | = У 6 Y = sup |Я(х2,^)-Н(х2,у) | =Р1(х2,Х1). у е Y Кроме того, она удовлетворяет неравенству треугольника. Действи- тельно, каковы бы ни были стратегии xt, х2 и х3, Pl(Xi,X2) + Р1(х2,х3) = = sup |Я(х1>у)-Н(х2,у) | +sup |Я(х2,^)— Н(х3,у) У У ^sup( |Я(Х1,^)-Н(х2,у) | + \Н(х2,у) -Н(х3,у) | )!> У sup(|H(Xj, у) -Н(х2,у)+Н(х2,у) -Н(х3,у) | ) = У — sup |Я(Х1,^) -Н(х3,у) | =р1(Х1,х3). У Наконец, функция рг очевидным образом удовлетворяет условию неотрицательности: pi (xt, х2) 2? 0. Правда, из обращения Pi(xx, х2) в нуль не следует, что стратегии х} и х2 совпадают. Однако Pi(xi, х2) = 0 означает, чтоЯ(х1л у) = Н(х2,у) при любом у G у, т.е. что последствия выбора игроком 1 стратегии хг и стратегии х2 во всех ситуациях будут одними и теми же. Таким образом, фактически никакой разницы между стратегиями хх и х2 нет, и их можно считать не различными стратегиями игрока, а двумя экземплярами одной и той же его стратегии. Если принять, что стратегии хх и х2, для которых Pi(xx, х2) ~ 0, с самого начала отождествлены, то из Pi(xi, х2) =0 будет следовать xt = х2. Таким образом, в условиях ука- занного предварительного отождествления функция pi удовлетворяет веем условиям расстояния, и ее можно считать метрикой на прост- ранстве стратегий игрока 1. 6.2. Определение. Метрика на пространстве стратегий игрока 1, определяемая по формуле (6.1), при условии отождествления стра- тегий Xi и х2, для которых р(хх, х2) =0, называется естественной метри- кой в пространстве стратегий игрока 1 (ее называют также внутренней метрикой или метрикой Хелли). □ Аналогично можно ввести естественную метрику (метрику Хелли) на множестве всех стратегий игрока 2. Для этого достаточно положить Р2(У1,У2)= sup \Н(х, У!)-Н(х, у2) I х G X и отождествить те стратегии ух и у2 игрока 2, для которых р2 (yi,у2) = 0. Топология, порожденная естественной метрикой в пространстве стра- тегий каждого из игроков, называется естественной топологией, а так- же внутренней топологией. 105
6.3. Естественная метрика может иметь весьма запутанный характер и довольно сильно нарушать наглядное, ’’внешнее” расположение стратегий. Приведем несколько примеров. Пример 1. В диагональной игре с матрицей выигрыша s: и © Л <3* г В 1 о о : q о : о Q о . о II мы имеем рх (i, j) = р2 (i, /) = max {aj\ В частности, если ах = . .. = ап = 1, то естественные расстояния между любыми двумя стратегиями каждого игрока в этой игре равны единице. Отсюда, между про- чим, следует, что стратегии игроков в этой игре невозможно представить, если требо- вать сохранения расстояний между ними, точками на прямой (а можно — лишь точка- ми в (п - 1)-мерном пространстве, где они будут являться вершинами (п - 1)-мер- ного симплекса). Пример 2. В игре на единичном квадрате с функцией выигрыша Н(х, у) = (х -у)2 должно быть pl(zl,z2) = p2(zl,z2) = max КГ-z,)2 -(/-z2)2| = o S 1 = max I-2z(zx - z2)+zj - z2 I = max I zt - z21 I zt + z2 - 2t I = °<t< 1 = I Zj - z2 I max {I zx + z2 I, I zx + zx - 2 |}, а так как 0 < zx + z2 2, внутренние знаки модулей можно снять: Pi(zx, z2) = |zx -z2 I max{(zx + z2),(2 - (zx + z2))} = I Zj -Z2 | (Zj +z2), если zi +Z2 = I Zj - z2 | (2 - (Zj +z2)), если z, + z2 1. Пример 3. В игрена единичном квадрате с функцией выигрыша 2х— у, если х >у, Н(х,у) = 0, если х=у, х - 2у, если X <у, (6.2) как легко убедиться, также должно быть pl(zl, z2) = р2 (zt, z2 ). Вычислим (Xj, х2): Pi(xlfx2)= max \H(xlty) -Н(х2,у)\. ° gy i Будем для определенности предполагать, что х2 > х2. Тогда, разбивая промежуток максимизации [0, 1] на 3 части: [0, ], [хп х2 ] и [х2, 1] и подставляя для каждой из них свое выражение для функции выигрыша Я согласно (6.2), получаем Pi(xit х2) = max { max I (2xt - у) - (2x2 - y)|, 0 <.y max { l(xr - 2y) - (2x2 -y)l, max |(хх - 2y) - (x2 - 2y)|} = xi = У ^x2 x2^y £ 1 = max { max I 2xx - 2x2 I, max | xt - 2x2 -y |, max | xr - x2 I} . x2^y< 1 Из x2 > x; и у > 0 следует, что выражения, стоящие под знаками модуля, отри- цательны, и эти знаки модуля можно снять (с переменой знака на противоположный); кроме того, под первым и третьим внутренними максимумами здесь стоят выражения, 106
не зависящие от у, а второй максимум достигается при у = х2. Следовательно, Pi (*i /х2) = max {2х2 - 2хх, Зх2 — х2, х2 - хх }, откуда Pi (Xj, х2) = Зх2 - хх. (6.3) При х1 < х2 симметрия метрики дает нам рх (хх, х2) = Зхх - х2. При хх = х2, разумеется, будет рх (хх, х2) = 0. Как отмечалось, pl{zi, z2) = p2(zх, z2), и специальных вычислений расстояний в метрике р2 не требуется. По поводу сказанного заметим прежде всего, что функция рх (хх, х2) при хх =х2 ¥= ¥= 0 не является непрерывной (сходное можно сказать и о функции р2 (у х, у 2)). Кроме того, из (6.3) следует, что при хх, х2 > 1/2 имеет место рх(хх, х2) > 1,так что естественное расстояние между любыми двумя различными стратегиями каждого из игроков из промежутка (1/2,1] превосходит единицу (сколь бы близкими ’’фи- зически” эти стратегии ни были). 6.4. По естественным метрикам Pi ир2 на пространствах стратегий игро- ков в антагонистической игре Г = < х, у,7/> можно определить естественную метрику р на пространстве ситуаций, положив, например, для хь х2 хи УьУг Gy P((^i>J’i),(^2.>’2)) = max{Pi(x1,x2), p2(yi,y2)}. Естественная метрика р на пространстве ситуаций антагонистической игры порождает на этом пространстве внутреннюю (естественную) топологию. Проверка того, что функция р: (х X у) X (х X у) -+R действительно об- ладает всеми свойствами метрики, не составляет труда и предоставляется читателю. Теорема. В любой антагонистической игре Г = < х, у, Н) функция выигрыша является непрерывной (и даже равномерно непрерывной) функцией ситуации во внутренней топологии на пространстве ситуаций. Доказательство. Достаточно заметить, что для любой пары си- туаций (%1, х2) и (уь у2) в игре Г имеет место неравенство \H(xlfyi)-H(x2ty2)\^ ^\H(xl,yl)-H(x2,y2)\ + \H(x2,y1)-H(x2,y2)\^ ^Pi(xi,x2) + p2(yi,y2)^2p((x1,yl),(x2,y2)). □ Таким образом, отмеченная в примере 3 п. 6.3 разрывность естественной метрики по исходной топологии в пространстве стратегий как бы ’’съедает” первоначальную разрывность функции выигрыша по этой исходной топо- логии. § 7. ВПОЛНЕ ОГРАНИЧЕННЫЕ ИГРЫ 7.1 .Определение. Метрическое пространство z с метрикой р на- зывается вполне ограниченным, если при любом е > 0 в z найдется ко- нечная е-сеть, т.е. такое конечное множество ге,что для каждого z Е z су- ществует такое ze е z€, что p(z, z€) < е. Вполне ограниченные пространства часто называются также условно компактными. Если они являются подмножествами некоторых метричес- ких пространств и имеют в них компактные замыкания, то они называют- ся предкомпактными. □ 107
Вполне ограниченные пространства являются весьма распространенными. Например, как нетрудно проверить, любое ограниченное подмножество ко- нечномерного евклидова пространства является в евклидовой метрике вполне ограниченным. Как подмножество объемлющего евклидова прост- ранства, оно, очевидно, является предкомпактным. 7.2 *. Поучителен следующий критерий полной ограниченности пространства. Для его рассмотрения напомним полезное определение. О п ределение. Последовательность элементов z t, z2,... метрического прост- ранства z называется сходящейся в себе, если по любому е > О найдется такое N, что при т,п> N имеет место p(z^, zn) < е. Теорема. Для того чтобы метрическое пространство z было вполне ограничен- ным, необходимо и достаточно, чтобы из любой последовательности его элементов можно было выбрать сходящуюся в себе подпоследовательность. Доказательство. Необходимость. Возьмем последовательность Zj, z2, ... элементов z и произвольное е > 0 и построим в z конечную е/2-сетъ Ввиду ее конечности в ней найдется такая точка z€, что вблизи нее (а именно, на расстоянии, не превосходящем е/2) окажется бесконечно много элементов последовательности Пусть это будут элементы z^ .z^ kN kN+l . . Тогда для любых m,n> N будет p(zk ,ze)<e/2, tn p(zkn, ze) < e/2, и no неравенству треугольника мы получаем ’ zk ) < 6 m n (7.1) Таким образом, по любому е > 0 можно из заданной последовательности выделить соответствующую этому е подпоследовательность, для которой имеет место (7.1). Чтобы получить подпоследовательность, которая подходила бы к любому е > О, воспользуемся приемом, известным под названием диагонального процесса. Пусть > е2 > .. . > еп > .. . _ сходящаяся к нулю последовательность положи- тельных чисел, az,^, z2°),. .. - заданная последовательность элементов пространст- ва z. Согласно предыдущему в ней можно выделить такую подпоследовательность z^\ zp\ , что, начиная с некоторого места, будет p(z^\ z^ ) < . Но, приме- няя то же рассуждение к последовательности z^\ z^\ ... и числу е2, мы можем выделить в- ней такую подпоследовательность zp\ z/2\ ... , что, начиная с некото- рого места, будет p(z^2\ < е2. Продолжая этот процесс, мы получаем построение бесконечной серии последова- тельностей элементов z: z^z™... zp\z<k\... (7.2) в которой каждая является подпоследовательностью предыдущей и для каждого к = 1,2, ... , начиная с некоторого места, будет P(4fc>- 4fc)) < <*• (7.3) Составим теперь по (7.2) (’’диагональную”) последовательность z^\ zp\ ... (к) о ..., zk , ... Эта подпоследовательность исходной последовательности является искомой. Действительно, по любому е > 0 найдется такое к, что ек < е, а по этому к — такое N, что при m, п > N выполняется (7.3). Но, начиная со своего fc-го члена, эта диаго- 108
нальная последовательность оказывается подпоследовательностью fc-й последователь- ности из (7.2). Значит, найдется такое N, что при т,п> N будет p(z(m) z(n))<et<6. Достаточность. Пусть пространство z не является вполне ограниченным, т.е. при некотором е > 0 в нем не найдется конечной е-сети. Будем индуктивно строить последовательность элементов z следующим образом. Возьмем z, Gz произвольно. Пусть элементы , . .., zk уже построены. Обозначим через zk объединение их е-ок- рестностей; zk ¥= z (ибо иначе точки zx, . .., zk составили бы конечную e-сеть в z), и мы можем взять zk+i е z\ zk. В построенной последовательности z t, z2,... каждый член отстоит от любого из остальных более чем на е, так что никакой сходящейся в себе подпоследовательности из нее выделить не удастся. □ Доказанная теорема выявляет однотипность понятия полной ограниченности прост- ранства и его компактности: в компактном пространстве из любой последовательнос- ти можно выбрать сходящуюся подпоследовательность, а во вполне ограниченном пространстве - лишь сходящуюся в себе подпоследовательность. Очевидно, всякое компактное пространство является вполне ограниченным. 7.3 *. Из теоремы предыдущего пункта немедленно вытекает удобный признак того, что метрическое пространство z не является вполне ограниченным. Именно, это будет так, если найдется такое е > 0 и такая бесконечная последовательность элемен- тов z j, z 2,... пространства z с метрикой р, что р (zit zk) > е при любых различных i и к. В частности, не являются вполне ограниченными пространства стратегий игроков в игре из примера 3 в п. 6.3. 7.4 . Определение. Антагонистическая игра Г = < х, у, Н) назы- вается вполне ограниченной, если пространства стратегий обоих игроков в естественной метрике вполне ограничены. □ * Оказывается, что для полной ограниченности антагонистической игры достаточно потребовать полной ограниченности в естественной метрике пространства стратегий хотя бы одного из игроков. Теорема. Если в игре Г = <х, у,Я> пространство стратегий одного из игроков вполне ограничено в естественной метрике, то пространство стратегий другого игрока также вполне ограничено в своей естественной метрике. Доказательство. Пусть х в естественной метрике Pi вполне огра- ничено. Возьмем произвольное е>0 и найдем конечную е/3-сеть%1,..., хт в х. Поставим теперь в соответствие каждому у G у m-мерный вектор <р(у) = (Я(Х! , у),..., Н(хт ,у)). Ввиду ограниченности функции выигрыша множество всех таких векторов образует ограниченное подмножество ^-мерного евклидова пространства, и поэтому вполне ограничено в евклидовой метрике рЕ. Следовательно, в этом множестве существует конечная е/3-сеть в метрике рЕ. Пусть У1,..-,Уп (7.4) — те стратегии игрока 2, которым соответствуют векторы, составляющие эту сеть. Покажем, что они составляют е-сеть у в естественной метрике рг. Возьмем для этого произвольную стратегию у игрока 2. По условию найдется такое у^ из списка (7.4), что PfCv’O’), <рО/))<е/3. 109
Но Pe-Cs^O), ^0/)) = п = ( 2 (H(xi,y)—H(xi,yjy)2')1/2 ^sup\Н(хьу)-Н(хь y-)| 1 = 1 i Значит, и sup | H(xh y) - H(xt,7y)| < e/3. i Поставим в соответствие каждому xG х то X/ из е/3-сети, для которого Pi(x, X/) < е/3,и обозначим его через хе. Мы будем иметь Рг(у,У/) = sup I Н(х, у) - Н(х, у,) | = sup | Я(х, у) - Н(хе, у) + Н(хе, у) - X X - Н(хе, у,) +Н(х£, yf) - Н(х, yf)| < sup | Н(х, у) - Н(х£, у)| + X + sup | Н(х£, у) - Н(хе, yf) | + sup | Н(х£, у ) - Н(х, у,) | X X <е/3 + е/3 +е/3 = е. Таким образом, по любому е > 0 в пространстве у построена конечная е-сеть. Следовательно, это пространство является вполне ограниченным. □ § 8. ОСНОВНАЯ ТЕОРЕМА О ВПОЛНЕ ОГРАНИЧЕННЫХ ИГРАХ 8.1. Вполне ограниченные антагонистические игры оказываются с точки зрения принципа максимина в некотором смысле близкими к разрешимым. Теорема. Если антагонистическая игра Г = < х, у, Н > является вполне ограниченной, то при любом е > 0 в ней существуют е-оптимальные смешан- ные стратегии с конечным спектром. Доказательство. Возьмем произвольное е > 0 и составим е-сети Хе= {хь...,Хт}, уе ={у!, . . . ,У„} (8.1) в соответствующих естественных метриках в пространствах х и у. Рассмот- рим хе X уе-подигру Ге, которая является конечной, т.е. матричной, и по- этому имеет ситуации равновесия в смешанных стратегиях. Пусть (Х€, Уе) — одна из них. Здесь = (Ji,..., |w), a Fe = (r?i,. .. ,т?л), причем есть вероят- ность выбора стратегии xzGxe, а ту —вероятность выбора стратегии У/&Уе- Равновесность ситуации (Х€, Уе) в игре Ге означает, что H(xb Ye)^H(Xe> ^е)^.^(^е>Л)ДЛЯВсехХ/ехеиУ/еУе- (8.2) При любом х G х для соответствующей близкой ей стратегии хе G хе долж- но быть pi (х, х€ ) < е, т.е. sup I Н(х, у) - Н(хе, у) | < е, У и в том числе для всех / = 1,... , п \Н(х,у^-Н(хе,у/)\<е, 110
откуда Н(х, у,) — е^.Н(хьу;), i = 1, ... ,т; j=l,...,n. Поэтому п п H(xit Ye)= S Н(хьу^> S (Н&уЦ-еУщ- i=i i=i п = S H(x,yi)ni-e = H(x, y6)-e. /-1 Точно также устанавливается, что при близкой к у стратегии уе =у, G €Уе ЩХе,у^ЩХе,у) + е. Таким образом, подставляя в (8.1), мы получаем, что Я(х, Уе)-е^Я(Уе, Уе)^Я(Хе,у) + е при всех х и у £ у, а это и требовалось. □ 8.2. Следствие. Всякая антагонистическая вполне ограниченная игра имеет значение. Для доказательства достаточно к установленному в последней теореме результату присоединить утверждение части 2) теоремы п. 3.1. 8.3. Обратим внимание на то, что нахождение е-оптимальных стратегий во вполне ограниченной игре Г распадается на два этапа: 1) построение в множествах стратегий игроков в игре Г е-сетей из (8.1) и составление соответствующей матричной игры Ге; 2) решение матричной игры Г€ . Осуществление первого этапа непосредственно не связано с теоретико- игровыми рассуждениями и в сущности относится к теории функций. Теоретико-игровой здесь, пожалуй, следует считать разве лишь саму воз- можность построения таких е-сетей, а по ним — матричной игры Ге. Проведение второго этапа может сопровождаться разве лишь техничес- кими трудностями, связанными с размерами получающихся матричных игр. Таким образом, приближенное (и притом сколь угодно точное) решение вполне ограниченных игр может быть сведено к (точному) решению той или иной матричной игры. § 9*. КОМПАКТНЫЕ ИГРЫ 9.1. Определение. Антагонистическая игра Г = < х,у,Я> называет- ся компактной, если пространства стратегий обоих игроков в естественной метрике компактны. □ Очевидно, в компактной антагонистической игре множество всех ситуа- ций в описанной в п. 6.4 естественной метрике (топологии) также являет- ся компактным. Так как всякое компактное пространство является вполне ограничен- ным, каждая компактная игра является вполне ограниченной игрой. Поэ- тому к компактным играм применимы результаты § 8: в каждой такой 111
игре игроки имеют при любом е > 0 е-оитимальные стратегии, являющиеся смесями конечного числа чистых. Известно, что всякая заданная на компакте непрерывная функция при- нимает свои экстремальные значения. Естественно предполагать, что в слу- чае компактной игры в формулировке теоремы п. 8.1 можно ’’перейти к пределу” и установить существование в таких играх оптимальных страте- гий игроков. Это предположение подтверждается, хотя и не вполне три- виальным образом. Продолжим рассуждения, начатые в п. 4.3. 9.2. Проведем необходимые вспомогательные построения. Пусть z компактное пространство, a«$(z) сьалгебра всех борелевских под- множеств, т.е. такое семейство подмножеств z. которое а) содержит все открытые подмножества z; б) вместе с любыми подмножествами z , и z 2 содержит их разность zt \z2; в) вместе с любой счетной последовательностью подмножеств z1,z2,... содер- жит их объединение и 7п. п Каждое подмножество из $ (z) будет далее называться измеримым. Мы будем рассматривать вероятностные меры на пространстве z, понимаемые как функции ц : 33 (z) >R, обладающие следующими свойствами: а) счетная аддитивность: для любых, попарно псп ере се кающихся подмножеств z ।, z2, . . . из .Я? (z) имеет место м( U Z„)= Г M(Zz/). б) неотрицательность: для любого z0 G 33 (z) должно быть д (z0) 0; в) нормированиесть: д (z) = 1. 9.3. Пусть /: z>R - непрерывная функция, а д - вероятностная мера на z. Тогда все множества вида {z: /(z) > а) являются открытыми, а все множества вида{г: а < f (z) ^h}, во всяком случае, измеримыми, и на них поэтому определе- ны значения меры д. Рассмотрим всевозможные разбиения сегмента {inf/(z); sup f (z)]: z z inf f(z) = c0 < Cj < . . . < cn = sup /(z), и соответствующие им суммы п $п = ск 1Д({- а i</(z)<cA}), 4=1 ~ ск ( { z : ек 1 < < ск } )• * = 1 Если а q j ->0 при всех Л - 1, .... л, то суммы sn и Sn имеют, и при- том один и тот же, предел, который называется интегралом {Лебега - Стилтъеса) от функции / номере ц на множестве z. Этот интеграл обозначается через/ДгУ7д(г). z В наших рассуждениях этот интеграл будет называться математическим ожиданием функции / от случайной величины z, распределенной в соответствии с мерой д. 9.4. Возвращаясь к теоретико-игровой терминологии, мы будем вероят- ностные меры на множествах стратегий игроков называть их смешанными стратегиями, а интегралы (математические ожидания) y)dX(x) и х f Н(х, y)dY(y) понимать соответственно как выигрыши //(X у) и Н(х, У), у 112
Множество всех смешанных стратегий игроков 1 и 2 в антагонистичес- кой игре Г = < х, у, Я) будем, как и в гл. 1, обозначать через X и Y. 9.5. Справедливо следующее утверждение. Лемма. Если функция II: xXy-*R непрерывна по х на х и по у на у, то интегралы Н(Х, у) и Н(х, У) являются соответственно непрерывными функциями от у и от х. Доказательство. Функция//(х, • ), непрерывная на компакте х, должна быть, как известно, и равномерно непрерывна на нем. Возьмем произвольное е > 0 и найдем в соотвествии с равномерной не- прерывностью функции II такое 6 > 0, что |Я(х,П)-Я(х, v2)|<e при любых X, J4 И у2 , если ТОЛЬКО ! У1 - У2 I < S. Тогда | Я(Х, Г! ) Н(Х, у2 )1 = I fll(x, yt)dX(x) - fH(x, у2) JX(x)| = X X = |/(//(х,^1) -Н(х, 1-2W)I^ X < f I И(х, у!) II(x, у2) I dX(x) < e f dX(x) = e. “X X Следовательно, функция II (X, у) непрерывна под. Аналогично доказывается непрерывность функции Н(х, У) по х. □ Из сказанного следует, что к функциям Я(х, У) и Н(Х, у) применимы рассуждения п. 9.2, так что можно говорить об интегралах и от них: /Я(х, y)JX(x) =fflf(x,y)dY(y)dX(x), (9.1) X X у fII(X,y)dY(y) = f f II(x, y)dX(y)dY(x). (9.2) У ух Появление этих двух повторных интегралов дает повод говорить о двой- ном интеграле f fI/(x,y)d(XXY)(x,y), (9.3) х X у где X X У - мера на произведении х X у, проекции которой У и Уна хи у независимы. Последний оборот, однако, страдает некоторой неточностью: мы уже видели, что мера задается не на бесструктурном множестве, а на из- меримом пространстве, т.е. значения меры определены на составляющих не- которую п-алгебру измеримых множествах. В данном случае в качестве такой о-алгебры на х X у следует взять наименьшую борелевскую о-алгеб- ру 53 (х X у), содержащую все произведения вида х X у', где х G 53 (х) и у' G S3 (у). Но тогда, чтобы реально говорить о двойном интеграле (9.3), необходимо, чтобы функция от двух переменных Я( •, • ): х X у -> R была измеримой в смысле 53 (х X у), т.е. чтобы при любом XGR было {(х, у): Я(х, у) > X} G 53(х Ху). _____ Это требование не является тривиальным, т.е. не обязано выполняться само собой, а соблюдается при тех или иных специальных предположениях. 8. Н.Н. Воробьев 113
Сделанные предположения о компактности *) пространств х и у во внутрен- ней естественной топологии эту измеримость гарантируют. Мы не будем останавливаться на доказательстве этого факта, которое является доволь- но сложным. Все сказанное дает нам право говорить о двойном интеграле (9.3). Оба повторных интеграла (9.1) и (9.2) оказываются равными этому двойному интегралу (это составляет содержание известной теоремы Фубини). Общее значение всех этих трех интегралов естественно обозначать через Н(Х, У). 9.6. Определение. Если Г = < х, у, Н) — антагонистическая игра, то ее смешанным расширением называется антагонистическая игра Г = = < X, Y, Н), где X и Y — множества смешанных стратегий игроков в иг- ре Г, а значения Н(Х, У) определяются как общее значение интегралов (9.1), (9.2) и (9.3). □ 9.7. На множествах X и Y стратегий игроков в смешанном расширении Г = < X, Y, Н) антагонистической игры Г = < х, у, Н) можно согласно ска- занному в п. 6.1 ввести естественную метрику, положив для Х2 X p1(jr1,Jf2) = sup |Я(2ГЬ У)-Я(Х2,У)| геУ и для Уь У2 Е Y Р2(^,У2)= sup \Н(Х, У1)-Я(ХУ2)1. хеХ Оказывается* **), что если исходная играТ = <х, у, Н) компактна, то ее смешанное расширение Г = < X, Х,Н) также компактно. Поэтому в компактной игре из каждой последовательности смешанных стратегий можно выделить подпоследовательность, сходящуюся к некото- рому пределу, также являющемуся смешанной стратегией. Кроме того, оказывается***), что если функция Н( •, у) непрерывна, а последовательность Xif Х2, ..., Хпъ_смешанных стратегий игрока 1 сходится к некоторой предельной стратегии Хо, то при любому Е Y lim Я(Хл,у)=Я(Х0,у). (9.4) п -* 00 Аналогичный предельный переход имеет место для сходящихся смешан- ных стратегий игрока 2. 9.8. Заметим, наконец, что множество всех смешанных стратегий игро- ка 1 в произвольной антагонистической игре является, как и в матричной *1 В действительности достаточно существенно более слабого предположения о сепарабельности пространств х и у. (Напомним, что топологическое пространство на- зывается сепарабельным, если оно содержит счетное всюду плотное подмножество. То, что всякое вполне ограниченное, а тем более компактное пространство сепарабель- но, вытекает непосредственно из определений.) **) Доказательство см. в монографии А. Вальда ’’Статистические решающие функ- ции” (русск. пер. в кн. ’’Позиционные игры” М., ’’Мир”, 1967, с. 367). В основе этого доказательства лежат рассуждения, известные для случая х = у = R как первая теорема Хелли (см., например, учебник Б.В. Гнеденко ’’Курс теории вероятностей”, М., Гос- техиздат 1961, с. 234). ***) В основе этого доказательства лежат рассуждения, известные для случаях = у = = R как вторая теорема Хелли (см. тот же учебник Б.В. Гнеденко, с. 236). 114
игре, выпуклым, т.е. любым двум смешанным стратегиям X' и X" игрока 1 и числу ХЕ [0,1] можно поставить в соответствие его смешанную страте- гию Х\ = XX1 + (1 — Х)АГ", для которой при любом борелевском множест- ве х С х чистых стратегий игрока 1 имеет место Ух(х) = ХХ'(х) + (1-Х)У"(х). Из определения интеграла Лебега — Стилтьеса (см. п. 9.3) немедленно следует, что при любой чистой стратегии у игрока 2 выполняется Н(ХК, у) = ХН(Х у) + (1 - Х)Н(Х ", у). Аналогичны двойственные рассуждения о выпуклости множества сме- шанных стратегий игрока 2. § 10. ОПТИМАЛЬНЫЕ СТРАТЕГИИ ИГРОКОВ В КОМПАКТНЫХ ИГРАХ 10.1. Теперь мы можем доказать теорему, анонсированную в конце п.9.1. Т е о р е ма (”о с н о в н а я теорема” теории компактных игр). В компактной игре игроки имеют смешанные оптимальные стра- тегии. Доказательство. Пусть Г = < х, у, Н > — компактная игра. Она является вполне ограниченной, и потому, на основании сказанного в п. 8.1, при любом е > 0 в ней имеются ситуации е-равновесия в смешанных страте- гиях. В частности, отсюда следует, что игра Г имеет значение иг . Возьмем сходящуюся к нулю убывающую последовательность 6i > е2 > >... >е„>... >0и найдем по каждому п = 1, 2, .. . ел-седловую точ- Согласно части 1 теоремы из § 3 (формула (3.1)) тГЯ(У„,У) + 2ел^иг, у так что при любой чистой стратегии у игрока 2 Н(Хп, у)+ 2e„^vr. (10.1) Ввиду указанной в п. 9.7 компактности множествах смешанных страте- гий, из последовательности Xi,X2,... (10.2) можно выбрать подпоследовательность, сходящуюся к некоторой страте- гии (функции распределения) XQ. Не нарушая общности, можно считать, что (10.2) уже является выбранной подпоследовательностью. Перейдем теперь в (10.1) к пределу: lim Н(Хп , у) + lim 2еп > vr. п оо п О Согласно формуле (9.3) первый из этих пределов естьЯ(Т0, у), а вто- рой, очевидно, равен нулю. Таким образом, при любому G Y оказывается Н(Х$, у) иг. Следовательно, по теореме п. 5.5 Xq есть оптимальная стра- тегия игрока 1 в рассматриваемой игре. Симметричные рассуждения приводят к доказательству существования оптимальной стратегии у игрока 2. □ 8* ' 115
10.2. Сделаем к сказанному комментарий, аналогичный сделанному в п. 8.3. Нахождение оптимальной стратегии в компактной игре Г распадается на 3 этапа: 1) построение в множествах стратегий игроков в игре Г е-сетейиз (8.1) для ’’исчезающей” последовательности значений еп I 0 и составление соот- ветствующих матричных игр Ге из (8.2); 2) решение матричных игр Ге, состоящее в нахождении седловых то- чек (Хе, Ус) в них; 3) выделение сходящихся подпоследовательностей из последователь- ностей Х€(е I 0) и Уе(е I 0) и нахождение их пределов. Принципиальная простота осуществленного в доказательстве теоремы из п. 10.1 третьего из этих этапов не должна вводить нас в заблуждение. Соответствующее доказательство является весьма неконструктивным (’’не- эффективным”) , и взятое само по себе никаких методов нахождения опти- мальных стратегий игроков, как пределов последовательностей их е-опти- мальных стратегий, не дает. 10.3. Заметим в связи со сказанным, что множество всех (смешанных) оптимальных стратегий каждого из игроков в компактной антагонисти- ческой игре является выпуклым (см. п. 16.1 гл. 1) и замкнутым в смысле естественной топологии. Действительно, если X* и Х2* — две оптимальные стратегии в игре Г = = < х, у, Н), то для них имеют место неравенства вида (5.9) : H(X?,y^vr, (10.3) H(X2*,y)^vr (10.4) при любой стратегии у Е Y. Возьмем произвольно ХЕ [0, 1 ] и положим Хк = XX* + (1 - Х)^2 . Тогда из (10.3) и (10.4) будет следовать ад,у) = ХЯ(Х1*^) + (1 -Х)Я(Х2*,у)^иг при любому Е Y,a это и означает оптимальность стратегии Х\. Замкнутость множества всех оптимальных стратегий вытекает из не- прерывности функции Н в естественной топологии (см. формулу (9.4). □ § 11. ВНЕШНЯЯ ТОПОЛОГИЯ. НЕПРЕРЫВНЫЕ КОМПАКТНЫЕ ИГРЫ 11.1. Помимо описанной в § 6 внутренней (естественной) топологии, порождаемой на пространствах стратегий игроков функцией выигрыша, на этих множествах может быть (через метрику или как-либо иначе) ап- риори определена еще и некоторая исходная, внешняя по отношению к игре топология. Множество ситуаций оказывается в этом случае декарто- вым произведением топологических пространств и тем самым — тоже то- пологическим пространством. Наличие у функции выигрыша тех или иных топологических свойств (например, непрерывности) может предопределять некоторые полезные особенности внутренней топологии. Это обстоятельст- во представляется важным потому, что свойства внешней топологии обна- руживаются более непосредственным образом, чем свойства топологии внутренней (ср. примеры из п. 6.3). 116
Определение. Антагонистическая игра Г = (х,у,Я> (ИЛ) называется непрерывной компактной игрой, если множества стратегий х и у являются компактными пространствами в некоторой (’’внешней”) топологии, а функция выигрыша Н непрерывна на х X у в смысле порож- денной топологии декартова произведения. 11.2. Лемма. Непрерывная компактная антагонистическая игра Г = = < х, у, Н) является компактной и во внутренней топологии. Доказательство. Пусть х2,... — последовательность страте- гий игрока 1, сходящаяся к его стратегии х0 во внешней топологии. Тогда в силу предположения о непрерывности функции Н при любому Е у долж- но быть lim Н(хп,у} = H(xQ, у). (П-2) п -> °° В силу компактности х X у эта сходимость оказывается равностепенно непрерывной по у G у, так что lim sup \Н(хп,у)-H(xQ,y)\ =0, п со у т.е. р! (х„, х0) 0. Это значит, что последовательность стратегий хь х2,... сходится к х0 и во внутренней метрике (топологии). □ 11.3. Применение теорем п. 8.1 и 10.1 дает нам следующее утверждение. Теорема. Непрерывная компактная антагонистическая игра имеет при любом е > 0 е-оптималъные стратегии игроков, являющиеся смесями конечного числа чистых, а также смешанные оптимальные стратегии. 11.4. Практически теорему п. 11.3 приходится применять в следую- щем частном виде. Теорема. Если в игре Г = < х, у, Н > множества стратегий игроков х и у являются выпуклыми многогранниками в конечномерных евклидовых пространствах, а функция выигрыша Н непрерывна на хХу,то в этой игре игроки имеют оптимальные смешанные стратегии, а также — при любом е > 0 - оптимальные стратегии, являющиеся смесями конечного числа чистых. Частным случаем этой теоремы является тот, когда х и у — единичные кубы конечномерных евклидовых пространств. Наконец, ’’самым частным” случаем, к которому приложимо сделанное заключение, составляют здесь игры на единичном квадрате (см. п. 1.2). § 12. ВЫПУКЛЫЕ ФУНКЦИИ ОДНОГО ПЕРЕМЕННОГО 12.1. Никаких общих методов для точного нахождения решений беско- нечных антагонистических игр, и в том числе непрерывных игр на единич- ном квадрате, пока не найдено. Известны только отдельные индивидуаль- ные приемы, годные лишь для тех или иных сравнительно узких классов игр. Один из таких классов составляют антагонистические игры с выпук- лыми функциями выигрыша. Они представляют также известный при- кладной интерес. Далее мы рассмотрим несколько примеров таких выпук- лых игр. 117
Сначала мы построим достаточно простую теорию выпуклых игр на единичном квадрате, а затем рассмотрим некоторые вопросы, относящие- ся к случаю более общих выпуклых игр. Определение. Вещественная функция определенная на числовом проме- жутке z, называется выпуклой, если для любых z', z" &z и любого X G [0, 1 ] <p(Xz' + (1 - X)z") < X^(z') + (1 - X)^>(z"). (12.1) Если при z* ¥= z" и при X Ф 0 и X ¥= 1 в (12.1) имеет место строгое неравенство, то функция у называется строго выпуклой. Геометрически выпуклость функции соответствует ее выпуклости вниз. Всякая дуга графика выпуклой функции не поднимается выше стягивающей ее хорды (рис. 2.2). Аналитически выпуклость дважды дифференцируемой функции соответствует неотрицательности (а в случае строгой выпуклости - положительности) ее второй производной. Симметричным, а с точки зрения антагонистических игр - двойственным (см. п. 5.4 гл. 1) понятию выпуклой функции является понятие вогнутой функции. Определение. Вещественная функция определенная на числовом проме- жутке z, называется вогнутой на нем, если при любых z', z" ez и любом Хе [0, 1] <p(Xz' + (1 - X)z") Xtp(z') + (1 - X)«p(z") (т.е. если выполняется неравенство, противоположное (12.1)). Свойства вогнутых функций симметричны свойствам выпуклых функций. Поэто- му мы ограничимся рассуждениями по поводу выпуклых функций. Соответствующие формулировки и доказательства, относящиеся к вогнутым функциям, мы предостав- ляем читателю. 12.2. Лемма. Если <р - выпуклая функция на сегменте [л, £>] ,z1;. ..,z„e [а, b], и X,,. .. , Хл - вещественные числа, для которых п S \ = 1, 1 = 1 то п п ₽( S S ^(z,.). 1 = 1 1=1 Это утверждение получается в результате непосредственного применения индуктив- ных рассуждений к определению выпуклой функции. 12.3 . Лемма. Выпуклая функция у при увеличении аргумента не может перехо- дить от возрастания к убыванию. Доказательство. Предположим, что zx < z2 <z3, но <p(Z.) <<p(z,), 1 2 • (12.2) *^(23 ) < *^(^2 ) • 118
Найдем такое Л е [0, 1], 4Toz2 = Xz, + (1 — X)z3. Тогда на основании выпуклости функции $ будет <^(z2) = <p(Xz1 +(1 X^z,) + (1 - Л) ^(z,) < max ), ^(z3) }, что противоречит (12.2). □ 12.4 . Следствия. 1) Выпуклая функция состоит не более чем из двух монотон- ных частей ; если их две, то убывание предшествует возрастанию. 2) Множество точек, на которых выпуклая функция принимает минимальные зна- чения, замкнутой связно (т.е. является сегментом, быть может, пустым}. Действительно, если между двумя точками минимума выпуклой функции окажет- ся точка, не являющаяся ее минимумом, то функция где-то слева от этой точки будет возрастать, а где-то справа - убывать. Это, однако, противоречит предыдущему. 3) Строго выпуклая функция достигает своего минимального значения не более чем в одной точке. 12.5 . Рассматриваемые в данной книге выпуклые функции являются функциями выигрыша в тех или иных играх и потому ограничены (единственное исключение, с которым мы встретимся в § 2, будет проанализировано особо). Ограниченность вы- пуклых функций помогает достаточно элементарно доказать их непрерывность в сле- дующем смысле. Лемма. Если выпуклая функция [а, &] ->Rограничена, то она непрерывна в любой точке z0 ^(a;b). До казательство. Разрывность ограниченной функции в точке z0 означает, что найдется такая сходящаяся к z0 последовательность z,, z2, . .., что lim </?(z„) = Z Ф ^(2o)« co Будем для определенности считать, что </?(z0) - t = 2b > 0, и рассматривать после- довательность Zj, z2,. . ., начиная с того места, когда y(zn} <t + d (рис. 2.3). Пусть некоторое число h меньше, чем расстояние от z0 до а или Ь. Возьмем произ- вольно большое К > 0, найдем такой номер пк, что I zn& - z0 | < h/K, и возьмем точку ~ zq + (zo ~ znJ (К — 1) €= (а, Ь} . Л. Л. Очевидно, К - 1 1 * z° ~ к ZnK+ к ZnK' так что из выпуклости функции следует К-1 х 1 * . ^(zo)^ V- ~ *(znKh К К К откуда К -1 1 * Г + 26 < —— (Г + 6) + - ¥>(z„ ), A A ИЛИ <p(z„>>K(t + 2S)-(K-l)(t + d)=K6+t+6, К т.е. с ростом К значения функции <p(z* ) неограниченно возрастают. Это, однако, А противоречит предположению об ограниченности функции <р. □ Заметим, что, как это видно из рис. 2.4, на концах сегмента своего задания выпук- лая функция не обязана быть непрерывной. Вместе с тем, очевидно, на концах а и b сегмента своего задания выпуклая функция должна быть полунепрерывной сверху, т.е. lim <p(z) < у(а} (12.2) z-+a и аналогично при z -*Ь. 119
12.6 . Выпуклые функции имеют достаточно простые аналитические свойства. Лемма Если выпуклая функция является дифференцируемой, то ее производ- ная не убывает. До каз ательство. Мы установим даже несколько более точные факт: если в некоторой точке z выпуклая функция р имеет левую и правую производные, то зна- чение левой производной не превосходит значения правой. Рис. 2.4 Действительно, пусть значение левой производной в точке z больше значения пра- вой производной. Это значит, что найдется столь малое Д > О, что v?(z) - v?(z - Д) <^(z + Д) - </>(z) откуда 1 ~ sp(z - Д) + 1 ( 1 - <^(z + A)>^(z) = <J - (z - Д) + что противоречит выпуклости □ 12.7 . Следствие. Если производная выпуклой функции обращается в некото- рой точке в нуль, то функция в этой точке достигает своего аналитического миниму- ма, являющегося при этом наименьшим ее значением. Если выпуклая функция является дважды дифференцируемой, то ее вторая произ- водная неотрицательна. 12.8 . Лемма. Если функция выпукла на сегменте [a,b},aZ - произвольная вероятностная мера на [с, b ]j, то Ъ b у( fzdZ(z))< f.p(z)dZ(z). а а Доказательство следует из леммы п. 12.2 и непрерывности выпуклой функции путем предельного перехода. □ 12.9 . Лемма. Если функция ч>(х,у) выпукла по у при любом значении хе е [а; b ], а X - произвольная вероятностная мера на [а\ Ъ], то интеграл Ъ = у) = J V(x, y)dX(x) а также является выпуклой функцией. Доказательство. Возьмем произвольное Хе [0, 1]. На основании выпук- лости функции р мы имеем для любых yt, у2 Ь Ш +(1 -Х)У,) = f *(Х. + (1 -X)j4)dX(x)^ а b f (*¥>(•*, Л) + (! — К)*р(х, yty)dX(x) = а b b ~^S + d -X) f ip(.x,yi)dX(x) = X^(yi) + (l-К)ф(у2), (12.3) a a а это и требовалось. □ 120
12.10 . Лемма. Если функция <р(х, у) строго выпукла по у при любом значении x^[a,b], а X - произвольная вероятностная мера на [а,Ь], то интеграл ^(у)~ b = f <р(х, y)dX(x) также является строго выпуклой функцией, а Доказательство этой леммы аналогично доказательству предыдущей. Выполнение в формуле (12.3) строгого неравенства обеспечивается тем, что Vj +(1 - Х)у2) < + d для всех значений х, а множество всех х имеет в смысле X положительную меру. □ 12.11 . Лемма. Если функция <р(х, у) выпукла по у при любом значении х, то верхняя огибающая функций </?(•, у) sup <р(х, у) также является выпуклой. х Доказательство. Для любых x,ylty2 и Хе[0, 1] мы имеем <^(х, Ху! + (1 ~Х)У2)^Х^(х,^1) + (1 -Х)^р(х,у2), или, переходя к супремумам, sup Хух + (1 - X)y2)^ sup (Х<р(х,у1) + (1 - Х)<р(х,у2) g х X ^Х sup <р(Х, У j ) + (1 - X) sup y2), X x а это и требовалось. □ § 13. ВЫПУКЛЫЕ ИГРЫ НА ЕДИНИЧНОМ КВАДРАТЕ. ЧИСТЫЕ ОПТИМАЛЬНЫЕ СТРАТЕГИИ ИГРОКА 2 13.1. Определение. Непрерывная антагонистическая игра на еди- ничном квадрате с функцией выигрыша Я называется выпуклой, если функция Н(х, • ): у -> R выпукла при любом значении х G х. □ Как и во всякой непрерывной игре на единичном квадрате (см. послед- нее следствие в п. 11.4), в выпуклой игре игроки имеют смешанные опти- мальные стратегии. В этом и в следующих параграфах будут описаны строение и способы нахождения оптимальных стратегий игроков в вы- пуклых играх на единичном квадрате. Ясно, что все теоретико-игровые утверждения, относящиеся к играм на единичном квадрате, могут быть перенесены на игры, в которых прост- ранствами чистых стратегий игроков являются произвольные сегменты. 13.2. Согласно принципу двойственности для антагонистических игр (см. п. 5.4 гл. 1) выпуклым играм соответствуют вогнутые в смысле сле- дующего определения. Определение. Непрерывная игра на единичном квадрате с функ- цией выигрыша Н называется вогнутой, если функция Я( •, у): X -> R вогнута при любом значении у Е у. □ Далее нами будет строиться теория выпуклых игр. Очевидно, теория вогнутых игр будет двойственной к ней, и ее положения получаются естест- венным образом из соответствующих положений теории выпуклых игр. 13.3. Теорема. В выпуклой игре на единичном квадрате игрок 2 име- ет чистые оптимальные стратегии. Множество всех таких стратегий состав- ляет сегмент. Доказательство. Рассмотрим выпуклую игру Г с функцией выиг- рыша Я. Пусть иг — значение Г, X * — одна из оптимальных стратегий игро- 121
ка1,а У*— игрока 2. Тогда Н(х, Y*)^H(X*> У*) = иг для любого хе [0,1]. (13.1) В условиях смешанной статегии У* игрока 2 чистая его стратегия у ока- зывается случайной величиной, принимающей к тому же числовые значения. Поэтому можно говорить о математическом ожидании этой случайной ве- личины: y*=fydY*(x). (13.2) о На основании леммы п. 12.8 мы имеем при любом хе [0,1 ] Я(х,у*)=Я(х,/ус?У*(у))^ о 1 (13.3) ^/Я(х,у)с/У*(у)=Я(х, У*). о Вместе с (13.1) это дает нам Я(х, у *) для всех х е [0, 1]. Следова- тельно, по теореме п. 5.5 у* является оптимальной стратегией игрока 2. Если теперь у' и у" — чистые оптимальные стратегии игрока 2, то по тео- реме п. 5.5 должно быть Я(х, у') Я(х, у") < иг при любых хе [0, 1]. Отсюда ввиду выпуклости функции Н(х, •) при лю- бом Л £ [0,1 ] Н(х, Ху' + (1 -Х)У')<ЛЯ(х,/) + (1 -Х)Я(х,у")^уг для всех х. Последнее означает оптимальность чистой стратегии Ху' + + (1-Х)/. Наконец, в силу непрерывности функции Н(х, •) множество тех значе- ний у, для которых Я(х, у) ^иг, должно быть замкнутым. Остается заметить, - что выпуклое замкнутое подмножество сегмента само должно быть сегментом. □ 13.4. Следствие. В выпуклой игре vv = min maxЯ(х, у) = max Н(х, у *), (13.4) ух X где у* - оптимальная чистая стратегия игрока 2. Это вытекает из теоремы п. 5.2, причем достижимость внутреннего мак- симума обеспечивается непрерывностью функции Н по х. □ 13.5. Следствие. Чистые оптимальные стратегии у * игрока 2 в вы- пуклой игре суть решения уравнения vr =maxH(x,y*). (13.5) X Действительно, для того чтобы стратегия у* игрока 2 была решением уравнения (13.5), необходимо и достаточно, чтобы было Я(х, у*) иг для всех х. Но ввиду теоремы п. 5.4 это равносильно оптимальности стра- тегии игрока 2. □ 122
ЭЯ(х» Эу § 14. ВЫПУКЛЫЕ ИГРЫ НА ЕДИНИЧНОМ КВАДРАТЕ. ОПТИМАЛЬНЫЕ СТРАТЕГИИ ИГРОКА 1 14.1. Займемся описанием оптимальных стратегий игрока 1. Далее через Ну(х, у) обозначаются значения частной производной функ- ции выигрыша Я по у. При у = 0 это выражение понимается как правая производная, а при у = 1 — как левая. Мы будем предполагать, что эта про- изводная существует для всех значений х и у. Пусть снова у* — одна из оптимальных стратегий игрока 2. Согласно теореме п. 5.8 в спектры оптимальных стратегий игрока 1 мо- гут входить только такие чистые стратегии х, для которых H(x,y*) = vv. (14.1) Чистые стратегии 1, удовлетворяющие этому равенству, иногда назы- вают существенными. Множество всех существенных стратегий игрока 1, очевидно, является компактным. 14.2. Лемма. Если у* — оптимальная стратегия игрока 2 в выпуклой игре с функцией выигрыша Н, дифференцируемой по у, и у*> 0, то сущест- вует такая существенная стратегия х' игрока 1, что = Я;(х>*)^0. (14.2) у = У* Доказательство. Предположим, что для каждой существенной стратегии х0 игрока 1 Hy(xQ, у*) >0. Это значит, что для всякой сущест- венной стратегии х0 функция Ну(х0, • ) в точке у* строго возрастает. Сле- довательно при значениях у, меньших чем у* и близких к у*, бу- дет Н(х0,у)<Н(х0,у*). Говоря точнее, по каждой существенной стратегии х0 найдутся такие е(х0)>0 и 5(х0)>0> что Н(х,у) <Н(х, у* )-е(хо) при всех х, для которых | х — х01 <5 (х0) - Ввиду компактности множест- ва всех существенных стратегий оно покрывается конечным числом таких 5 (х0) -окрестностей. Пусть е — наименьшее из всех соответствующих чисел е(х0). Тогда будет Н(х,у)<Н(х,у*) - е. (14.3) Пусть теперь JV* — оптимальная стратегия игрока 1. Так как (14.3) по предположенному справедливо для всех существенных стратегий игрока 1, и в том числе для всех точек спектра АГ*, мы имеем, интегрируя, Н(Х\у) <Н(Х*,у* ) - е = vr - е, а это противоречит оптимальности стратегии X *. □ 14.3. Аналогично доказывается следующее симметричное утверждение. Лемма. Если в условиях предыдущей леммы у* < 1, то существует такая существенная стратегия х" игрока 1, что Ну(х", у*)^0. 14.4. Объединяя эти леммы, мы получаем следствие. 123
Следствие. Если в условиях предыдущих лемм 0 < у * < 1, то най- дутся такие существенные стратегии х' и х" игрока 1, что Н^х,у*) ^0, (14.4) (14.5) 14.5. Теорема. Пусть Г — выпуклая игра с функцией выигрыша Н, дифференцируемой по у при любом х, у* — чистая оптимальная стратегия игрока 2 в ней, a vr - ее значение. Тогда: 1) если у* = 1, то среди оптимальных стратегий игрока 1 имеется чистая стратегия х', для которой Ну(х , 1)< 0; 2) если у* = 0, то среди оптимальных стратегий игрока 1 имеется чистая стратегия х",для которой Ну (х" ,0)^0; 3) если 0 ^у* S 1, то среди оптимальных стратегий игрока 1 найдется такая, которая является смесью двух существенных стратегий х' и х". Для этих стратегий Я;«у*)^0, Я;(х>*)^0. При этом стратегии х' и х" употребляются с вероятностями а и 1 — а, где а находится из уравнения аЯДх>*) + (1 -а)Я;«^*) = 0. (14.6) Доказательство. Пусть сначала у* = 1. Тогда по лемме п. 14.2 найдется существенная стратегия х игрока 1, для которой выполняется (14.2). Следовательно, вблизи у* = 1 функция Н(х, у) убывает. Но вы- пуклая функция не может переходить от возрастания к убыванию. По- этому Н(х, у) убывает на всем сегменте [0, 1], достигая при у = 1 своего минимума. Это значит, что Н(х, у*)^Н(х', у) при всех у Е [0,1]. (14.7) С другой стороны, из существенности х следует неравенство Н(х, х*) ^7/(х', у*) при всех хЕ[0,1]. (14.8) Неравенства (14.7) и (14.8) означают, что (х, у*) есть седловая точка, и случай 1) разобран. Случай 2) разбирается при помощи симметричных рассуждений. Перейдем к случаю 3). Здесь мы на основании следствия п. 14.4 располагаем существенными стратегиями х и х", которые удовлетворя- ют соответственно неравенствам (14.4) и (14.5). Рассмотрим функцию /«) = ^;(x',y*) + (i -?)я;(х",г). Неравенства (14.4) и (14.5) означают, что f (0) ^0, /(1) 0. Так как функция / непрерывна (в данном случае она просто линейна), найдутся такие а* Е [0, 1 ], что Да*) = 0. Возьмем теперь смешанную стратегию игрока 1, состоящую в выборе стратегии х с вероятностью а* и стратегии х" с вероятностью 1 — а*, и обо- значим ее через X *. 124
По лемме п. 12.9 Н(Х*,у) = а*Я(хг,у) + (1-а*)Я(х",у) является выпуклой по у функцией. Ее производная по у в точке у = у * равна Ну (X *, у) = а*Ну (х, у) + (1 - а* ) Ну (х", у) = 0. Следовательно, в точке у* функция//(X* у) имеет экстремум; ввиду выпуклости функции этот экстремум должен быть минимумом. Таким образом, Н(Х*,у*)^Я(Х*,у) привсех у £[0,1]. (14.9) С другой стороны, в силу существенности стратегии х' Н(Х*, у*) =Н(х', у*) = vr = max Н(х, у* )2^ Н(х, у*) привсех х£ [0,1]. х (14.10) Соотношения (14.9) и (14.10) означают, что ситуация (X* у*) является равновесной, а стратегия X * — оптимальной. □ § 15. СТРОГО ВЫПУКЛЫЕ ИГРЫ 15.1. Определение. Непрерывная антагонистическая игра Г на единичном квадрате называется строго выпуклой, если ее функция выиг- рыша Н(х, у) строго выпукла по у при любом значении х. 15.2. Теорема. В строго выпуклой игре Г игрок 2 имеет единствен- ную оптимальную стратегию, которая является чистой. Доказательство. Пусть X * — оптимальная стратегия игрока 1 и ф(у)=Н(Х*,у). Чтобы чистая стратегия у* была точкой спектра какой-либо оптимальной стратегии игрока 2, согласно теореме п. 5.9 необходимо выполнение ра- венства i//(y*) = min ф(у) = сГ. у Но на основании леммы п. 12.10 функция ф(у) является строго выпук- лой, а по следствию 3) из п. 12.4 ее минимум единствен (обозначим его через у*). Поэтому спектр всякой оптимальной стратегии игрока 2 исчер- пывается точкой у*. Это значит, что кроме у* игрок 2 никаких оптималь- ных стратегий не имеет. □ § 16. ОБЩАЯ СХЕМА РЕШЕНИЯ ВЫПУКЛЫХ ИГР НА ЕДИНИЧНОМ КВАДРАТЕ. ПРИМЕРЫ 16.1. На основе сказанного в# § § 13 и 14 решения выпуклых игр естест- венно находить по схеме, состоящей из следующих пунктов. 1°. Проверка функции Н(х, •) на выпуклость. Если эта функция задана аналитически и дважды дифференцируема, то естественно попытаться проверить неравенство Ъ2Н(х, у)/ду2 2^0. В некоторых случаях представляется целесообразным изобразить графи- ки функций Н(х, •) при различных значениях параметра х и проверить выпуклость каждой такой функции геометрически. 125
2°. Из соотношения vr = min max H(x, у) (16.1) у x нахождение у* как значения переменного, на котором достигается справа минимум, и нахождение vr как значения этого минимума. 3°. Нахождение решений уравнения иг=Я(х,у>*) (16.2) (к этому моменту стратегия у* и значение игры vr уже будут найдены) и составление парых' их" его решений, для которых дН(х', у) ду дН(х",у) ду 4°. Для каждой найденной пары х' и х" составление уравнения ЭЯ(х',у) дН(х",у) -------- +(1 — а) -------------- ду у=у^ ду = 0 у = у* (16.3) и нахождений его решений а *. Решение этого уравнения либо единственно, либо — любая точка сегмента [0,1]. 16.2. Пример. Игра на единичном квадрате с функцией выигрыша Н(х,у) = (х -у)2. (16.4) 1°. Здесь д2Н (х, у)/Ьу2 = 2 > 0, так что игра с функцией выигрыша (16.4) являет- ся строго выпуклой. 2°. Значение этой игры находится по формуле (16.1) : иг = min max(x -у)2. У х Пусть у0 — фиксированная стратегия игрока 2. Выражение (х — у0)2 достигает своего максимума при х = 1, если у0 S 1/2, и при х = 0, если у0 ^.1/2. Иными словами, (1 -у2), если У£ 1/2, тах(х - у)2 = • X У2, если у а. 1/2. Значит, • v = min { min (1 - у)2 , min у2} . 0<y<U/2 ’ 1/2<у^1 Здесь первый из внутренних минимумов достигается при у = 1/2, а второй - также при у = 1/2. Каждый из этих минимумов принимает значение 1/4. Поэтому Гр = = min {1/4, 1/4} = 1/4, и значение игры найдено. При этом единственной чистой опти- мальной стратегией игрока 2 оказывается у * = 1/2. 3°. Переходим к определению оптимальных стратегий игрока 1. Поскольку здесь 0 < у* = 1/2 < 1, по классификации случаев из теоремы п. 14.5 мы имеем дело со случаем 3). Будем искать существенные чистые стратегии игрока 1. Для них выпишем уравнение (12.1), которое в данном случае выглядит так: (х- 1/2)2 =1/4. Решая это уравнение, мы находим две существенные стратегии игрока 1: - 0, х2 =1. Следовательно, оптимальная стратегия игрока 1 должна быть вероятностной* смесью его чистых стратегий 0 и 1. Дифференцируя функцию выигрыша по у, мы имеем Э(хх -у)2 -Эу = 1 > 0, у = 1/2 9(х2 -у)2 эу = -1 <0 у = 1/2 126
(как и следовало ожидать из теоретических соображений, установленных в § 14, значения этих частных производных оказываются разных знаков). 4°. Составляем уравнение (16.3). В данном случае оно имеет вид а • 1 + (1 - - а) (—1) = 0, т.е. 2а - 1 =0, откуда а* = 1/2. Таким образом, оптимальная стратегия игрока 1 состоит в выборе им своих чистых стратегий 0 и 1 с вероятностью 1/2 каждая. 16.3. Пример. Игра Г на единичном квадрате имеет функцию выигрыша Н(х, у) - у3 - Зху + х3. 1°. Здесь д2Н(х,у)/ду2 =6у >0, так что игра с функцией выигрыша (14.2) строго выпукла, за исключением точки у - 0. 2°. Согласно (16.1) v - min max (у3 - Зху + х3). Далее, при любом уЕ [0, 1 1 У х ЪН (х, у)/Ьх = 3х2 - Зу. Таким образом, при функция выигрыша по х убывает, а при х > >Jy возрастает. Следовательно, каково бы ни было у, максимальное значение функции выигрыша достигается либо при х = 0, либо при х = 1. Поэтому max (у3 - Зху + х3) =хпах{у3, у3 - Зу + 1}. х Очевидно, при у < 1/3 этот максимум достигается при х = 1, а для у > 1/3 - при х = 0. Итак, у3 - Зу + 1, если max Н(х, у) = X з У если Значит, v = min { min (у3-Зу + 1), о£у£1/з ril/3, у> i/з. min j'3 } ; 1/3 <7 <1 вычисляя внутренние максимумы, мы находим, что каждый из них достигается при у = 1/3 и равен 1/27. При этому * = 1/3. 3°. Для определения существенных чистых стратегий игрока 1 составим уравнение = Н(х, у *), т.е. 1/27 = 1 /27 - х + х3, откуда хг = 0, х2 =1 (третий корень, равный -1, очевидно, не может быть стратегией в рассматриваемой игре). Наконец, Эу3 Эу = 1/3 > о, у = 1/3 Э(у3 -Зу + 1) ъу = 1/3-3 = -8/3 <0. у=1/3 4°. Параметр а находится из уравнения а • 1/3 + (1 - а)(-8/3)=0, откуда а* = 8/9. Значит, оптимальная стратегия игрока 1 состоит в выборе х = 0 с вероятностью 8/9 и х = 1 с вероятностью 1/9. § 17. БОРЬБА ЗА РЫНКИ 17.1. Рассмотрим игру Г на единичном квадрате со следующей функцией выигрыша: к1(х—У), если х>у, #(х,у) = (17.1) к2 (У — *), если где >0, к2 > 0. Эту игру можно интерпретировать как борьбу двух фирм за рынки сбыта в условиях капиталистической экономики. Пусть одна из фирм (игрок 1) пытается вытеснить другую фирму (иг- рок 2), имеющую два рынка сбыта, с одного из этих рынков. Общая сумма средств, выделяемых игроком 1 на эту цель, принимается'равной единице. 127
Стратегии игрока 1 состоят в распределении этих средств между двумя рынками. Если на первый рынок направляется сумма х, то на второй направляется оставшаяся сумма 1 — х. Пусть игрок 2 для удержания рын- ков также располагает единичной суммой средств, и его стратегия будет состоять в выделении суммы у на первый рынок и 1 —у на второй. Будем считать, что игрок 1, добившись превосходства в средствах на одном из рынков (очевидно, на обоих рынках сразу он такого превос- ходства одновременно добиться не может), вытесняет своего противника с этого рынка и получает выигрыш, равный избытку своих средств, кото- рый берется с коэффициентом, характеризующим важность рынка (мы принимаем, что этот коэффициент равен кг для первого рынка и к2 для второго). Очевидно, в формальной записи функция выигрыша данной игры и задается соотношением (17.1). 17.2. Покажем, что рассматриваемая игра является выпуклой. Фикси- руем для этого некоторое х = х0. График зависимости Н(х0,у) от у пред- ставляет собой пару прямолинейных отрезков, как это изображено на рис. 2.5 (в случае, если х = х0 или х0 = 1, один из этих отрезков стягивается в точку). Очевидно, что при любомх0 Я(х0, •) является выпуклой функ- цией от у, так что игра с функцией выигрыша Я выпукла. 17.3. Мы имеем maxЯ(х, у) = max { maxfc^x - у), max к2(у -х)} = X X > у X у = тах{к1(1 -у),к2у]. Поэтому = min max Н(х, у) = у х = min maxU^l -у)Д2(у)}. у График функции тах{^!(1-у), к2у} выделен на рис. 2.6 жирной ломаной. Первый член под знаком максимума с ростом у убывает, а вто- рой возрастает. Поэтому при малых значениях у максимум достигается на первом члене, а при больших у — на втором. Следовательно, минималь- ное значение этот максимум принимает при таком у*, для которого 128
^1(1 — У*) = к2у*,т.е. при Таким образом, найденное у* является единственной (чистой) оптималь- ной стратегией игрока 2. Мы видим, что оптимальная стратегия игрока 2 состоит в распределении имеющихся средств между рынками и притом пропорционально важности рынков. 17.4, Значение игры Г вычисляется без труда: v = шахЯ(х, у*} = ----- . г X кх+к2 17.5. Для нахождения оптимальной стратегии игрока 1 определим его существенные стратегии, пользуясь уравнением (16.2). Случаи х ^.у* и х < у* будем рассматривать порознь. Для х уравнение (16.2) принимает вид (' kt \ клк2 х----------) = ——— , кг + к2 ) ki +к2 откуда х = 1. Если же x^j^*, то уравнение (12.1) превращается в соотношение к2 (_kJ— \ +к2 ) +к2 ’ откуда х = 0. Таким образом, существенными стратегиями игрока 1 оказываются в данном случае хг = 0 и х2 = 1, так что игрок 1 имеет в данной игре един- ственную оптимальную стратегию, являющуюся смесью двух чистых. Находим теперь нужные значения частных производных: ЭЯ(0,.у) ду ЭЯ(1,У) ду Уравнение (16.3) для данной игры приобретает вид + (1 — л) (—ki) = = 0, откуда . к1 а =-------— к\ + к2 Таким образом, оптимальная стратегия игрока 1 состоит в концентра- ции всех его средств на одном из рынков, причем вероятность выбора рынка обратно пропорциональна его важности. Этот результат не должен удивлять: чем важнее рынок, тем больше средств вложит противник в его сохранение и тем меньше свободных средств останется на нем после вытеснения противника, т.е. тем менее значимой будет победа над ним. 9.Н.Н. Воробьев 129
§ 18. РАСПРЕДЕЛЕНИЕ ПРОИЗВОДСТВЕННЫХ МОЩНОСТЕЙ В УСЛОВИЯХ ЧАСТИЧНОЙ НЕОПРЕДЕЛЕННОСТИ 18.1. Пусть суммарная производственная мощность двух однотипных предприятий, намеченных к строительству в двух различных пунктах, фиксирована (положим ее для определенности равной единице) и равна суммарной потребности в производимой предприятиями продукции в этих двух пунктах. Точная потребность в каждом пункте неизвестна (она может выясниться лишь после пуска проектируемых предприятий). Если производственная мощность в некотором пункте равна у, а потребность в этом пункте равна х, то напряженность работы предприятия можно изме- рять отношением х/у. Цель распределения производственных мощностей естественно видеть в минимизации наибольшей напряженности работы обоих предприятий, т.е. в минимизации максимума шах!—, -------(18.1) I У 1 -У ) Этой же задаче можно дать иную содержательную интерпретацию, пони- мая отношение х/у как время работы предприятия производственной мощности у до удовлетворения потребности х. Цель распределения про- изводственных мощностей будет тогда состоять в минимизации времени полного (т.е. в обоих пунктах) удовлетворения потребностей. Таким образом, поставленную задачу можно описать игрой, в которой игрок 1 (’’природа”, ’’обстоятельства”) выбирает значение х, игрок 2 (проектировщик) — значение у, а значение функции выигрыша Я(х, у) (в данном случае она описывает потери проектировщика) равно (18.1). Если проектировщик решает эту задачу, точно зная истинное распреде- ление суммарной потребности (т.е. зная значение х), то он, очевидно, примет х = у, и каждое из предприятий будет, с одной стороны, загружено полностью, а с другой — работать без перегрузки. Естественно предполо- жить, что если проектировщик располагает частичной информацией о распределении потребностей, то при оптимальных действиях он может добиться перегрузки тем меньшей, чем уже та область, в которой заведомо находятся возможные распределения. Пусть проектировщику известно, что потребности в первом пункте заключены в сегменте [я, Ъ], где 0 < а b < 1. Мы имеем дело с игрой, в которой множество стратегий игрока 1 есть сегмент [а, Ь]. Из соображе- ний здравого смысла ясно, что проектируемая мощность предприятия, создаваемого в первом пункте, не должна быть меньше, чем а (иначе оно всегда будет запаздывать с окончанием своей доли работы), и (по симмет- ричным причинам) не должна превосходить Ь. Следовательно, мы можем считать, что множество стратегий игрока 2 в этой игре есть также сегмент [a, Z?], и мы имеем дело с игрой на квадрате [a, b] X [а, Ъ]. В соответствии со сказанным в п. 13.1 эту игру можно решать по той же схеме, что и игры на единичном квадрате. Можно считать, что разность b — а составляет потери в эф- фективности функционирования рассматриваемой системы, происходя- щие от неполноты знания условий ее работы. Отсюда следует практи- 130
ческий вывод: неполнота информации об усло- виях работы системы влечет экономические по- тери, которые в принципе поддаются расчету, хотя и не всегда так просто, как в рассмат- риваемом случае. Если затраты на получение надлежащей информации меньше, чем потери от ее отсутствия, то информацию следует приобре- тать. В противном случае этой информацией лучше пренебречь . Согласно (18.1) функция выигрыша в этой игре имеет вид [ х Н(х,у) - max — (18.2) 18.2. Данная игра является выпуклой. В самом деле, фиксируем неко- торое значение х = х0 • Тогда ч (*о 1-*о H(xq,у) = max / — , ----- I У 1 -У График этой функции представляет собой пару дуг гипербол (рис. 2.7). При приближении х0 к а или Ъ одна из этих дуг гипербол стягивается в точку. Таким образом, Я(х0, у) является выпуклой функцией, и сама рассматриваемая игра — выпуклая (и притом — строго выпуклая). 18.3. Для нахождения оптимальной стратегии игрока 2, которая, как известно (см. § 14), является в данном случае единственной, рассмотрим минимум выражения [ х 1 — х max Н (х, у) = max < — , ------- а=:х~ь а<х<^Ь (у 1 — у или, пользуясь тем, что две одноименные операции экстремизации (в от- личие от разноименных — максимизации и минимизации) можно выпол- нять в любом порядке, max Н(х, у) - ь ( х 1— х 1 ( Ь 1 — а = max J max — , max ----------> = max {_ , __ У a^x^b 1 — у ) [у ’ 1 — у Единственной оптимальной стратегией игрока 2 будет та его чистая стратегия, на которой достигается минимум ( b 1 -а min max Н(х, у) = min max < —, ------------ а^.У^ь у b (y 1 — у Очевидно, этот минимум достигается на .у* являющемся корнем уравнения b 1 — а У 1 -у 9 131
т.е. при b 1 + Ь -а 18.4. В этом случае иг = 1 + (Ь - а), (18.3) (18.4) т.е. ожидаемая дополнительная перегрузка равна b — а. 18.5. Для выяснения того, какие стратегии игрока 1 будут существен- ными, заметим, что, как легко проверить, согласно (18.3) должно быть а < у*^ Ь, причем равенство возможно лишь в случае а = Ь, Так как это соответствует случаю полной определенности, который не представляет специального теоретико-игрового интереса, будем считать, что а <у* < Ь. Очевидно, существенными стратегиями игрока 1 оказываются х-а и х = Ь. Для определения их вероятностей в единственной оптимальной сме- шанной стратегии вычислим производные ЬН(а, у) _ 1 - а (1 + b - а)2 by у = у. (1-у*)2 ~а дЩЬ, у) _Ь _ \\-b-a)2 9У у = у, у*2 b Искомые вероятности находятся из уравнения (1+6-а)2 „ (1+6-а)2 1 -а b откуда 1 -а а =----------. 1 + b —а (18.5) 18.6. Заметим, что как оптимальное поведение проектировщика в этой игре, так и уровень перегрузки в седловой точке (т.е. значение игры) совпадают с теми, которые возникли бы, если бы нагрузки на каждое предприятие оказались максимально возможными — b на первое и 1 - а на второе — хотя в действительности одновременно такой загрузки пред- приятий условия задачи не предусматривают. 18.7. Например, если проектировщику известно, что потребность в первом пункте может колебаться oi 30 до 60% от суммарной, т.е. что а = 0,3, a d = 0,6, то он должен согласно (18.3) поместить там 0,6(1 + 0,6 - -03)"1 =0,46, т.е. 46% от производственной мощности. Коэффициент пере- грузки, определяемый значением игры, будет равен, ввиду (18.4), 1 + 0,6 - — 0,3 = 1,3, а наименее благоприятное стечение обстоятельств будет, в соответствии с (18.5), состоять в появлении полной суммарной потреб- ности в первом пункте с вероятностью (1 — 0,3) (1 + 0,6 — ОЗ)'1 =0,54. 132
§ 19. ИГРА НА ЕДИНИЧНОМ КВАДРАТЕ С ВЫПУКЛОЙ НЕОГРАНИЧЕННОЙ ФУНКЦИЕЙ ВЫИГРЫША 19.1. Говоря даже чисто формально, в игре из предыдущего параграфа случай, когда’я = 0 или b = 1, рассматривать нельзя ввиду обращения в нуль знаменателей в дробях из (18.1) и (18.2). Однако, как мы сейчас увидим, отличие выпуклой игры на единичном квадрате с неограниченной функцией выигрыша от ранее рассмотренных выпуклых игр чисто формальным и остается, потому что стратегии игрока 2, на которых его потери стано- вятся уже очень большими, оказываются доминируемыми и могут быть исключены из рассмотрения. Итак, будем рассматривать игру Г = <х,у,Я>, (19.1) в которой х = [0, 1 ], у = (0,1), все функции Н(х, •) выпуклы, равностепен- но непрерывны по х и для каждой из них (равностепенно по х) выполняют- ся предельные соотношения lim Н(х,у) = +«>, (19.2) у->0 lim/Z(x,j) = +°° (19.3) у->1 или хотя бы одно из них. Для определенности мы будем считать, что вы- полнены оба соотношения (19.2) и (19.3). Покажем, что анализ игр такого рода сводится к анализу уже рассмот- ренных выше выпуклых игр. 19.2. Введем в рассмотрение вспомогательную игру Ге = <х, уе, Яе>, где х, как и выше, есть сегмент [0, 1 ], уе = [е, 1 — е], а Н€ есть сужение на х X уе функции выигрыша Нигры Г из (19.1). Теорема. Найдется такое достаточно, малое е > 0, что $(Г) = ^(Ге). Доказательство. Фиксируем некоторое значение е>0 и по- строим игру Ге. Игра Ге является выпуклой и непрерывной. Пусть (Хе*, Уе) — некоторая ее седловая точка, a v€ — ее значение. Найдем далее такое е Е (0, е), что при^ >1 — е, а также при у < е H{x,y)>ve (19.4) при любом хЕ [0, 1]. В силу соотношений (19.2) и (19.3) такое е найти можно. Заметим, что ввиду утверждения из п. 15.11, справедливого, оче- видно, и для бесконечных игр, с убыванием е и е < е неравенство (19.4) остается в силе. Мы имеем Н[х, у*е) Н(Х*, у'е) = ve < Н(Х'е, у) (19.5) при хб [0, 1] нуЕ [е, 1 — е]. Очевидно (см. п. 15.11 гл.1),ие есть неубы- вающая функция е. Следовательно, при достаточно малом е двойное нера- венство (19.5) остается в силе и при у Е (0, е) U (1 — е, 1), т.е. (Х*,у*) Е Е $(Г). Пусть, наоборот, (X* J*) € $(Г). Тогда по теореме о независимости от посторонних альтернатив (см. п. 5.5 гл. 1) будет и (X*, у*) Е $(Ге) для всех е у * и е 1 — у *. □ 133
193. Из доказанной теоремы следует, что если в условиях игры из § 18 взять а = 0 или b = 1, то эти же значения можно придать параметрам игры и в ее описываемом формулами (18.1) —(183) решении: при а = 0 будет b 1 у* = ---- , и = 1 + Z>, а =-------, 1 + £ г 1+Ь при b = 1 1 1 -а у* =----- , и = 2 - я, а = ------------ , 2-а г 2-а а при а = 0 и b - 1 I 1 у* = — и = 2, а = ~ . 2 г 2 Таким образом, в последней, наименее благоприятной для проектиров- щика игре наименее благоприятное для него положение наступает в том случае, когда вся потребность сосредоточена в одном из пунктов, причем равновероятно в каждом пункте. При этом одно из предприятий будет вынуждено простаивать, а другое — работать с двойной перегрузкой. § 20* ВЫПУКЛАЯ РАЗРЫВНАЯ ФУНКЦИЯ ВЫИГРЫША 20.1 . Пусть в выпуклой игре Г на единичном квадрате функции Н (х, •) : y-*R не обязательно непрерывны. Тогда, как это было установлено в п. 12.5, точками разрыва каждой из этих функций могут быть разве лишь точки 0 или 1 (в которых эти функции должны быть полунепрерывны сверху). Рассмотрим вспомогательную игру Г = < х, у, Н), где Н(х,у) = Н(х,у) lim Н(х,уп), Уп^У если у 6 (0, 1), если у = 0 или у = 1. (20.1) 20.2 . Игра Г, очевидно, является выпуклой и непрерывной. Согласно сказанному в п. 13.2 игрок 2 имеет в ней чистые оптимальные стратегии, составляющие некоторый сегмент [у*, у * ]. Для всех точек у* этого сегмен- та должно быть max Н (х, у*) = min maxH(x,y) =v . х ух Г” Далее для простоты анализа мы будем предполагать, что сегмент [у*, У*] состоит из единственной точки у*. Рассмотрим возможности, которые нам при этом могут представиться: а) у*Е (0, 1). В этом случае в игре Г игрок 1 имеет оптимальную стра- тегию X* (являющуюся смесью не более чем двух чистых). По определе- нию седловой точки игры Г должно быть Н(х,у*) (Х*,у*) < Н(Х*,у) для всех xG [0,1] иу Е [0,1]. Переходя от функции Н к функции Н согласно формуле (20.1), мы полу- чаем Я(х,у*) < Я(Х*,у*) <; Я(Х*,у) для всех хЕ [0,1] и у G (0, 1). 134
С другой стороны, из полунепрерывности сверху функции Н(Х*9 •) в точках у = 0 и у = 1 следует, что последнее неравенство остается в силе и при у = 0 и у - 1. Это означает, что ситуация (ЛГ*,у*) является седловой точкой в исходной игре Г. б) j*= 0. В этом случае игрок 1 также имеет чистую оптимальную стра- тегию. Обозначая ее через х* мы имеем Н (х, 0) Н (х*, 0) < Н (х*, у) длявсехх,у€ [0,1]. Осуществим переход к функции выигрыша //. Заметим для этого, что ввиду равностепенной непрерывности функций Н(х, •) по всякому е>0 найдется такое 6, что при 0 < у€ < 6 будет Н(х9уе) -е^ Н(х*9уе) ^Н(х*9у) + е для всех x,^G[0, 1], откуда, согласно (20.1), Н(х9у€) -eg Н(х*,уе) g Н(х*9у)+е для всех xG [0, 1], у G (0, 1). Как и в случае а), полунепрерывность сверху дает здесь возможность распространить написанное неравенство на значения у = 0 и у = 1. Таким образом, в этом случае игра Г имеет при любом е > 0 ситуацию е-равновесия (2е-седловую точку) в чистых стратегиях. в) К тому же выводу, что и в случае б), мы приходим при у* = 1. □ § 21*. ВЫПУКЛЫЕ ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ 21 Л. Нашей ближайшей целью является распространение методики решения вы- пуклых игр на единичном квадрате на аналогичные игры, в которых множествами стратегий игроков являются подмножества конечномерных евклидовых пространств. В основе такого обобщения будет лежать тот факт, что можно говорить о выпуклых функциях нескольких переменных (или, что то же самое, — о выпуклых функциях от векторного переменного), причем как определение, так и основные свойства этих функций те же, что*и для выпуклых функций одного переменного. Определение. Вещественная функция <р, определенная на выпуклом под- множестве z конечномерного евклидова пространства, называется выпуклой, если при любых Zj, z2 ez и А е [0,1 ] (Xzt +' (1 - X) z2) (zt ) + (1 - X) (z2). □ Ясно, что сужение любой выпуклой функции на отрезок прямой является выпук- лой функцией на этом отрезке. Естественным образом определяются на любом выпуклом множестве z и вогну- тые функции. 21.2. На случай произвольного выпуклого подмножества конечномерного евкли- дова пространства дословно переносятся формулировки и доказательства лемм пп. 12.2 и 12.3 и - с несущественными изменениями - доказательство леммы п. 12.5. Остается в силе и аналог следствия п. 12.7 о том, что из обращения в нуль всех первых частных производных выпуклой функции в некоторой точке следует, что в этой точке достигается аналитический минимум, являющийся притом наименьшим значением функции. Из непрерывности выпуклой функции и аналогов леммы п. 12.2 следует аналог леммы п. 12.6. Лемма. Если функция выпукла на z с Rn, a Z — произвольная вероятностная мера на z, то <p(J zdZ{z}} f <p(z) dZ(z). (21.1) z z Аналоги утверждений n.n 12.7-12.11 также остаются в силе. 135
Из следствия п. 12.7 следует, что всякий локальный минимум выпуклой функ- ции является ее наименьшим значением. 21.3. Лемма. Если zC R" а z ->R - выпуклая функция, то множество ipa = {z: i?(z) а} является выпуклым. Доказательство. Пусть zlf z2 & и A G [ О, 1 ]. Тогда по выпуклости функции v? должно быть «р (Xz2 + (1-Х) z2)< X* (zj + (1 - (z2) £ Ха+ (1-Х)а т.е. Xz2 + (1 - X)z2 □ § 22*. ВЫПУКЛЫЕ ИГРЫ С ВЕКТОРНЫМИ СТРАТЕГИЯМИ. ЧИСТЫЕ ОПТИМАЛЬНЫЕ СТРАТЕГИИ ИГРОКА 2 22.1. Определение. Непрерывная игра Г = <х,у,Я>, (22.1) в которой х и у являются компактными подмножествами конечномерных евклидовых пространств, а множество у выпукло, называется выпуклой игрой, если функции Н (х, •) выпуклы при любом значении х G х. Анализ таких игр во многом напоминает анализ выпуклых игр на еди- ничном квадрате, проведенный в предшествующих параграфах. 22.2. Теорема. В выпуклой игре Г = < х, у, Н) игрок 2 имеет чистую оптимальную стратегию. Доказательство. Так как рассматриваемая выпуклая игра компактна, согласно теореме п. 10.1 она имеет значение уг, а игроки 1 и 2 — оптимальные (вообще говоря, смешанные) стратегии X* и У*. Тогда Н(х, У*)^ Н(Х*, У*) = иг для любого xG х. (22.2) Составим, как и при доказательстве теоремы п. 13.2, чистую стратегию y'=fydY*(y). (22.3) У Применяя к выпуклой функции Н(х, •) и мере У* неравенство (21.1), мы получаем при любом х G х Я(х,Г)=Я(х, fydY*(y))< У < fH(x,y)dY*(y)=ff(x, У*), (22.4) у что вместе с (22.2) дает Я (х,у*) иГ при любом xGx. Согласно теореме п. 5.5 это означает оптимальность стратегии у* игро- ка 2. □ Буквально так же, как и в теореме п. 13.2, устанавливается, что мно- жество всех чистых оптимальных стратегий оказывается в рассматривае- мом случае выпуклым и замкнутым. 22.3. Как и в § 13, из доказанной теоремы получаем следствие. Следствие. В выпуклой игре Г из (22.1) имеет место равенство и = min max Я(х, у) = max Н(х, у*), (22.5) ух X где у* — оптимальная стратегия игрока 2 eV. 136
Все чистые оптимальные стратегии игрока 2 в Г суть решения уравнения v = max Н(х, у). □ (22.6) X 22.4. Для простоты дальнейших рассмотрений мы ограничимся случаем, когда оптимальная стратегия у* игрока 2 в выпуклой игре Г является единственной. Это будет, например, в том случае, когда функция выигры- ша Я строго выпукла (ср. § 15). Охарактеризуем положение оптимальной стратегии у* игрока 2 в и-мер- ном множестве всех его стратегий у. Точка у* является либо внутренней в множестве у, либо принадлежит границе у и тогда содержится в пересечении у с некоторой опорной к у гиперплоскостью. В случае, когда имеется несколько таких пересечений, будет выбирать то из них, которое имеет наименьшую размерность. Ясно, что если эта размерность равна нулю, то у* будет крайней точкой у, а если она положительна, то у* будет внутренней точкой соответ- ствующего пересечения. Обозначим это пересечение через у*, допуская при этом и крайние случаи: у* = у* и у* = у. Для наглядности заметим, что если у есть выпуклый многогранник, то у* есть наименьшая по размер- ности (или, что то же самое, по включению) грань у, содержащая у*. Пусть размерность у* равна г. Тогда по теореме Каратеодори (см. п. 11.5) найдутся такие г +1 крайних точек у0, У1, ..., уг множества у, что у* является их выпуклой комбинацией: у*=£х?у/, 0 = 1,...,/*), £х;=1. (22.7) 1=0 1-1 Для дальнейшего нам будет полезно дополнить этот набор стратегий еще п — г точками Уг+i, ..., уп, которые вместе с имеющимися составля- ют вершины некоторого «-мерного симплекса (т.е. являются точками общего положения). Поэтому вблизи у* каждая точка у Gy может быть представлена в виде п п у=Ъ\у^ Х^О (z = l,...,«), Sxf = l, (22.8) i=i /=1 т.е. в виде функции у -у (Хо, Х1? ..., Х„) от барицентрических координат Хо, Xj, ..., Хп, причем при у =у* последние п — г координат должны обра- щаться в нуль. § 23*. ВЫПУКЛЫЕ ИГРЫ С ВЕКТОРНЫМИ СТРАТЕГИЯМИ. ОПТИМАЛЬНЫЕ СТРАТЕГИИ ИГРОКА 1 23.1. Усложнение, которое наблюдается в описании и нахождении опти- мальных стратегий игрока 1 при переходе от выпуклых игр на единичном квадрате к векторным выпуклым играм, выходит за пределы обычных усложнений, возникающих при переходе от оптимизационных задач одной переменной к оптимизационным задачам нескольких переменных: не поддается распространению на векторный случай теорема п. 14.5. Ее роль будет играть следующее утверждение. 137
23.2. Теорема. В выпуклой игре Г = < х, у, Н) ч где у G R”, игрок 1 имеет оптимальную стратегию, являющуюся смесью не более чем п+ 1 чистых. Доказательство этой теоремы несколько напоминает по своей схеме доказательство теоремы из п. 10.1. Выпуклая игра Г является непрерывной, а потому (см. п. 11.2) вполне ограниченной. Следовательно, согласно теореме п. 8.1 она имеет значе- ние иг, а при любом е > 0 игрок 1 имеет в ней е-оптимальную стратегию с конечным спектром. Пусть Х€ — такая стратегия, а ={х0, xlf ..., л* } — ее спектр. Очевид- но, для любого у G Y должно быть vv-e^H(Xefy}= £ Xe(Xi}H(xhy)^ max H(xhy). (23.1) z = 0 OSiSt Положим для каждого jq G xe Уе(*i) ={У- H(xhy)< vY-e} . В силу выпуклости функции Н(х, ) каждое из множеств уе (х,) является t выпуклым (п. 21.3). Кроме того, из (23.1) следует, что Cl ye(jQ) = ф. 1 = 0 Но пересечение конечного семейства выпуклых подмножеств может быть пустым лишь в том случае, когда пусто пересечение некоторого его подсе- мейства из и+1 подмножеств *). Пусть для определенности хе={х0, Xi, .. ., хп} — набор стратегий игрока 1, для которых множества уе (jq) составляют это подсемейство. Для него должно быть max Н(хьу) при любом у G у, O^i^n и тем боле — е max Н(Х, у) для любого у G у, (23.2) 1 х еХе где Хе — совокупность всех смесей стратегий из х€. Рассмотрим вспомогательную игру Ге = (Х€, у, Н€), где при любыхХ€ G G Хе и у G Y п Не(Хе,у)= S (23.3) i = 0 На основании (23.3) игра Ге является вогнутой (см. п. 13.5). Следовательно, по п. 13.2 она должна иметь некоторое значение и(Ц), для которого согласно (23.2) будет vY - е <, и(Ге) = inf Я(Хе*,у), у где X* — оптимальная стратегия игрока 1 в Ге. *) Это утверждение составляет содержание известной теоремы Хелли о выпуклых множествах. См., например, Рокафеллар Р. ’’Выпуклый анализ”, М., ’’Мир”, 1973, с. 203, или Данцер Л., Грюнбаум Б., Кли В. ’Теорема Хелли”, М., ’’Мир”, 1968. 138
Таким образом, иг — е Я(Х*, у) при любом у G у, т.е. согласно п. 3.1 стратегия Х^9 понимаемая как смешанная стратегия игрока 1 в исходной игре Г, является в ней его 2 е-оптимальной стратегией (с (п + 1) -элементным спектром). Возьмем теперь убывающую последовательность > е2 > . •. > >еп > . . . ->0 и построим для каждого п- 1, 2, ... е„-оптимальную стра- тегию Хп игрока 1 со спектром, состоящим из п + 1 стратегий. Для каждой такой стратегии мы имеем иг -еп<Н(Хп,у) для всех у Gу. (23.2) Но множество всех таких смешанных стратегий составляет компакт (он является подмножеством компакта Хл+1). Поэтому из последова- тельности Хг, Х2, . .. можно выделить сходящуюся подпоследовательность с пределом Хо. Замечая, что функция Н(ХП9 у), будучи суммой п+1 непрерывных сла- гаемых, непрерывна по ХП9 и переходя в (23.2) к пределу по п, мы полу- чаем t>r Н(Х09 у) для всех у G у, т.е. Хо является искомой оптимальной стратегией игрока 1. □ 23.3. Напомним еще раз (см. п. 14.1), что точками спектра оптимальной стратегии игрока 1 в игре Г могут быть только его существенные стратегии, т.е. решения уравнения Я(х,Г) = »г (23.3) (где у*, как и раньше — оптимальная стратегия игрока 2). Поэтому общая схема нахождения смешанной оптимальной стратегии игрока 1 должна состоять в перечислении корней уравнения (23.3) и нахождении таких их смесей X которые были бы оптимальными стратегиями игрока 1 (в соот- ветствии с доказанным достаточно рассматривать смеси не более чем п + 1 чистых стратегий). 23.4. Для нахождения ’’весов”, с которыми корни уравнения (23.3) должны входить в оптимальную стратегию Х9 воспользуемся тем, что необходимым условием оптимальности Х9 очевидно, является условие приемлемости ситуации (Х*,у*) для игрока 2, т.е. неравенство Н(Х,у*) ^Н(Х,у) при всех уЕу. (23.4) Это значит, что на у* достигается наименьшее значение функции Н(Х, •). Как было отмечено в пп. 12.9, 21.2, функция Н (Х9 •) является выпуклой. Следовательно, если эта функция дифференцируема (в том смысле, что она имеет первые частные производные по всем компонентам стратегии у игрока 2), то, согласно сказанному в п. 21.2, наименьшее ее значение долж- но быть аналитическим минимумом в той опорной гиперплоскости, в которой лежит стратегия^* (см. п. 22.4). Формально это означает, что условиями для определения вероятностей чистых стратегий, составляющих смесь X, должна быть система из урав- нений ЭЯ(Х у) ЭХ/ - X = О для i = 0, 1,. .., г (23.5) 139
и неравенств дН(Х,у) I ---------- - — 0 Для 1 = г + 1 > • • •,и (23.6) 9Xf \у = у. (здесь X — лагранжев множитель, соответствующий связи Хо + Xj + ... ... + Хл = 1 между переменными). Если выбрана такая комбинация п+1 корней уравнения (23.3), что система соотношений (23.5) —(23.6) разрешима, то соответствующая смешанная стратегия X является оптимальной для игрока 1. В противном случае взятая комбинация корней уравнения (23.3) оптимальной смешан- ной стратегии игрока 1 составить не может, и следует перейти к другой такой комбинации. При этом теорема п. 23.2 гарантирует, что нужная комбинация из п + 1 корней уравнения (23.3) существует. В следующих двух параграфах действие этого приема будет продемонст- рировано на примере задачи, являющейся обобщением рассмотренной в § § 18 и 19. § 24*. ОПТИМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ ОГРАНИЧЕННЫХ РЕСУРСОВ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ 24.1. Пусть к некоторой системе может быть предъявлено п видов требо- ваний, составляющих наборы чисел вида х = (х1э ..., х„), которые могут быть произвольными элементами компактного множества х С R". Для удовлетворения таких наборов требований в системе имеются однородные ресурсы, общее количество которых примем равным единице. Долю ре- сурсов, предназначенных для удовлетворения требования xf, обозначим через Таким образом, п У =(У- У = (У1, • ,Уп)г 2 Уп = 1}- (24.1) 1 = 1 Заметим, что фактическая размерность множества у равна п — 1. Мы будем рассматривать теоретико-игровой вариант задачи, при кото- ром распределение ресурсов у приходится осуществлять, не зная, какой именно набор требований х Е х будет фактически к системе предъявлен. Последствия от распределения ресурсов у при наборе требований х можно оценивать разными способами. Мы ограничимся следующей поста- новкой задачи. Выполнение требования xz- при выделенных для этого ресурсах у,- достигается при некоторой ’’напряженности”, возрастающей по xf и убы- вающей по yf. Мы обозначим ее через /*/(xz,yz). Эту функцию мы будем считать неотрицательной, строго возрастающей по xz при любом допусти- мом значении yf и строго убывающей и строго выпуклой по yz- при любом допустимом X/. Напряженность функционирования системы в целом при предъявлении к ней набора требований х и распределении ресурсов у естественно оценить как наибольшую напряженность при предъявлении к ней каждого из требований, т.е. считать Н(х,у)= max Щх^у^. (24.2) 1 140
Функция Я(х, •) является максимальной огибающей семейства выпук- лых функций и поэтому (см. п. 12.11 и 21.2) также выпуклой. Таким об- разом, антагонистическая игра Г = <х,у,Я> (24.3) является выпуклой игрой. 24.2. В выпуклой игре Г из (24.3) игрок 2 обладает чистой оптимальной стратегией j*, и мы имеем и = min sup Н (х, у) = sup Н (х, у *) = sup max F. (xz, у z). L у x x x l^i^n Вспомним, что одноименные экстремумы можно переставлять. Поэтому иг = max sup Fz(xz, у* ), 1 ^.1 X а так как каждая из функций Fz-( • ,jz) возрастает, то уг = min max Fz- (sup xz, jz) = max Fz(sup xi9y *). (24.4) у i ^Ln x i =1 ^2П x Отсюда видно, что значение у г игры Г и оптимальная стратегия у* игрока 2 в ней зависят не от множества х стратегий игрока 1 в целом, а разве лишь от набора супремумов (sup хх,. .., sup хл), х е х х е х который далее будем для краткости обозначать через х° = (х?, . . . , хл) (рис. 2.8). Рис. 2.8 В частности, иг и у* будут здесь теми же, что и в тривиальной вспомо- гательной ’’игре” Г° = <{ х0} , у,Н >, в которой игрок 1 имеет единственную стратегию х°. Формула (24.4) приобретает здесь вид ur = min max Fz(x?,jz) = max Fz(x?,j^). (24.5) 24.3. Сделаем замечание, аналогичное замечанию из п. 18.6. Эффект, оказываемый неопределенностью с областью х, при выборе распределения у с целью минимизации функции Н из (24.4), оказывается равносильным тому, что каждое из требований /начинает предъявляться к системе в своей максимальной интенсивности х?. Иными словами, при ’’минимакс- 141
ном” распределении ресурсов следует предполагать, будто каждая доля ресурсов воспримет ’’свои” максимальные требования, а ’’оглядываться” на фактические резервы по восприятию других требований не следует. 24.4. Естественно предположить, что при полном отсутствии ресурсов по обеспечению какого-либо из требований напряженность работы системы становится большей, чем при оптимальном распределении ресурсов. Это значит, что для оптимального распределения^* все компоненты^/должны быть положительными. В условиях сделанного предположения справедлива следующая лемма. Лемма. Для каждого i = 1,... ,п должно быть »г=Ъ(*ьУГ). (24.6) Доказательство. Предположим, что для некоторого к Fk(x°k,y*k)<vr. (24.7) Согласно сделанному выше допущению ук> 0. Возьмем теперь столь малое е > 0, что uFk(xk, yk'~e)<vr, и составим новую стратегию у° игрока 2, положив для i = к, для i =£ к. (24.8) Тогда по строгой монотонности каждой из функций Fz(x^, • ) для i Ф к будет Fi(xly^<Fi{xai,y*), (24.9) так что max Fi(x°i,y°t)< max Fi(x9,.y?) gur. i Ф к i Ф к Последнее неравенство вместе с (24.7) дает max Fi{x°i,y°i')<vT, 1 а это противоречит (24.5). □ 24.5. Теперь мы можем найти оптимальную стратегию^* игрока 2 в игре Г (она та же, что и в ’’игре” Г°). Каждая из функций Fz(x°, • ) строго монотонна и непрерывна. Поэтому она имеет обратную, также строго монотонную и непрерывную функцию, которую мы обозначим через Из (24.6) следует, что T/=^z(^r), *=1,...,и. (24.10) Эта формула имеет достаточно естественный содержательный смысл. Функция <Pi ставит в соответствие достигнутому по линии требования i результату иг затраченные на удовлетворение этого требования ресурсы^/ Она характеризует как бы ’’ресурсоемкость” требования i. При этом оптимальное распределение ресурсов по требованиям должно быть таким, чтобы все требования обеспечивали в соответствии с их ресурсоемкостями один и тот же результат: значение игры иг< 142
Далее, суммируя (24.10) по i, получаем п 1= 2 ^(уг) = <Х^г)- i = 1 (24.11) Но сумма ip функций также является строго монотонной и непрерывной и, в свою очередь, имеет обратную <р-1. Из (24.11) следует, что ~ (1), и подстановка (24.10) дает нам У* (24.12) 24.6. Вернемся к исходной игре Г. Ввиду компактности пространства х и тривиальной непрерывности компоненты Х/по х все супремумы sup xz х е х достигаются. Пусть sup X/ достигается на х , так чтох= xf®. х ех Вообще говоря, sup xz- может достигаться на различных стратегиях х е х z .ч игрока 1, так что выбор стратегии хш неоднозначен. Однако все эти стратегии имеют равные ье компоненты, а только они и участвуют в выражении для функции выигрыша. Поэтому мы можем все такие страте- гии отождествить или, что то же самое, ограничиться рассмотрением произ- вольно выбранного представителя множества всех таких стратегий. Далее мы будем считать, что стратегии х^ при i = 1,... ^зафиксированы од- нозначно. 24.7. Перейдем к нахождению оптимальной стратегии X* игрока 1 в игре Г. В ее спектр могут входить лишь стратегии вида х<’\ ПустьX* = = (1ь • • м tn),где & - вероятность соответствующей стратегии х^ . Лемма. Для оптимальной стратегии X* = (^,..., £„) должно быть > 0 (z = 1,.. ., п). Доказательство. Предположим, что = 0 (а в наших условиях у к > 0). Возьмем некоторое 0 < е <у к и построим стратегию yQ игрока 2 в соответствии с (24.8); Для этой стратегии ввиду 0 и (24.9) будет Н(Х*,у°) = 2 И*(0У) = 2 I/ max i = 1 i Ф к п < S max F^\ y*) = S ЬН(х^,у*) = H(X*,y*), i ф к i^j<n J ' i = i что противоречит оптимальности стратегии у*. □ 24.8. Нам остается фактически найти компоненты оптимальной страте- гии X* игрока 1. Составим для этого все уравнения вида (23.5) (ввиду установленной положительности всех компонент неравенства вида (23.6) здесь отсутствуют), которые в данном случае приобретают вид к Ъук = Полагая для краткости ЪУк — Х = 0, к= 1,... ,п. (24.13) 143
мы перепишем систему равенств (24.13) в виде — X = 0, к = 1, . . . , п, " 1 откуда %к = X/jD*., k = 1,... , п. Суммируя, получим 1 = X S — , так что и окончательно 1 / « 1 \-1 =- ( Б — Dk\i = 1 Di / к = 1,... ,п. § 25’.ПРИМЕРЫ РАСПРЕДЕЛЕНИЯ ОГРАНИЧЕННЫХ РЕСУРСОВ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ 25.1. Опишем некоторые из тех интерпретаций, которые может иметь игра, проана- лизированная в предыдущем параграфе. Как и в примере из § 18, можно рассматривать распределение капиталовложений по созданию (или наращиванию) производственных мощностей предприятий при неопределенности набора производственных заданий, где целью является скорейшее выполнение заданий всеми предприятиями, или минимизация наиболее интенсивных перегрузок в работе предприятий при выполнении ими работ в заданный срок. При этом, разумеется, зависимость производственной мощности предприятия от капи- таловложений У[ должна быть такой, чтобы функция (^ (У))’1 являлась строго выпуклой. 25.2. Можно дать игре из § 24 интерпретацию в терминах строительной механики. Пусть мы имеем дело с конструкцией, в которой ’’опасными” могут считаться ее элементы 1, 2, . . . , п (остальные элементы таковыми не считаются, например, потому, что их размеры, назначаемые не по соображениям безопасности, а по иным, конструктивным, технологическим или эксплуатационным соображениям, не связаны с нагрузками на эти элементы и обеспечивают безопасность их работы, далеко превос- ходящую необходимый уровень), и в случае нагрузки х еХ в них возникают соответ- ственно усилия xt,. .. , хп. Пусть на элемент/выделена доля материала у,- (т.е., как обычно, у; > 0 wyt + . . . . ..+у„ = 1). Будем далее для простоты считать, что предельная допустимая нагрузка на эле- мент i конструкции известна и зависит от характеристики yt- его поперечных разме- ров. В качестве такой характеристики мы будем принимать площадь поперечного сечения элемента, считая, что с изменением у; это сечение остается геометрически по- добным самому себе. Обозначим через Ff- (xz,yz) долю от предельной нагрузки на элемент i конструкции, которая возникает в нем при усилии xz и площади его поперечного сечения У[. Функ- ция Ffai, •) часто оказывается выпуклой. Например, если X/ есть сжимающее или растягивающее усилие, а призматический стержень/ работает на прочность, то Fz(xz,yz) = Л pacTxz/yz, где Л с тем или иным индексом - здесь и далее коэффициент, характеризующий механические качества материала, а также, если это существенно, продольные размеры элемента. Если xz- — сжимающее усилие, а элемент i работает на продольную устойчивость, то Fj (xz, yt) = А у^х^у?. Наконец, если xi - изгибающее усилие в балке /, то Fy (Хр yz-) = ^изг*//^2. Нетрудно в задачах такого рода интерпретировать принцип максимина как известный принцип равнопрочности. 25.3. Рассмотрим, наконец, интерпретацию той же игры в терминах следующей статистической задачи. Пусть дана система из п независимых в совокупности случайных величин Хх, . . . ..., Хп, система дисперсий (D^ ,.. . , ЬХп} которых составляет вектор х из некото- рого компакта х. Поставим вопрос о равномерно наиболее точном (в смысле миними- 144
зации дисперсий оценок) определении средних MXZ- (z = 1,.. ., ri) на основании доста- точно большого числа наблюдений, каждое из которых может быть произведено на любой из случайных величин X/ при условии, что набор дисперсий этих случайных величин является в пределах х неопределенным. Очевидно, рассматриваемая задача состоит в нахождении оптимальной стратегии у игрока 2 в игре Г = < х, у, Н), для которой х - компакт в R , п У= { У-У = <УУп^ ЛёО, £ yi = N} i = 1 (число N объявляется достаточно большим, чтобы не рассматривать эффекта от его ограниченной дроби мости), а для х G х и у G у имеет место равенство DXZ Я(х, у) = max *-- . 15u^n У] Значение этой игры будет требуемой минимальной дисперсией. § 26. ИГРЫ С РАЗРЫВНЫМИ ФУНКЦИЯМИ ВЫИГРЫША 26.1. Отмеченная в п. 8.3 принципиальная возможность сколь угодно точного реше- ния вполне ограниченных игр, и в том числе — согласно п. 11.4 - непрерывных игр на единичном квадрате, распространению на игры на единичном квадрате с разрывны- ми функциями выигрыша, вообще говоря, не поддается. В § 20 нами были рассмотре- ны выпуклые игры с разрывными функциями выигрыша при конкретных значениях стратегий игрока 2. Модифицируя эти рассуждения, можно без труда показать, что игры на единичном квадрате, в которых функция выигрыша Я терпит разрывы лишь вдоль конечного числа отрезков вида х = const или у = const, являются вполне ограни- ченными, и их решение напоминает решение непрерывных игр. 26.2. Существенно иначе обстоит дело, если функция выигрыша игры на единичном квадрате разрывна вдоль каких-либо отрезков (прямолинейных или криволинейных), не параллельных ни одной из сторон квадрата ситуаций. Следующая теорема обобщает конкретный факт, отмеченный в связи с примером 3 из п. 6.3. Теорема. Пусть Г — игра на единичном квадрате, функция выигрыша Н кото- рой имеет скачки положительной величины вдоль дуги кривой у = ф(х),гдеф - непре- рывная строго возрастающая функция, для которой lim Н(х — t, Дх)) - lim Я(х + t, /(х)) > е > 0 (26.1) z-*0 f —* О в некоторой окрестности (а; /3) точки х G х. Вне кривой у ^f(x) в этой окрестности функция Н предполагается непрерывной. Тогда игра Г не является вполне ограниченной. Доказательство. Предположим для определенности, что Н(х - 0,Дх)) > Я(х + 0, /(х)), 10.Н.Н. Воробьев 145
и найдем по непрерывности f и на основании (26.Г) столь малое 6 > 0, что, во-первых, а < х — д <х + Ь < (3, и, во-вторых, для х' е (х - 6,х + 6) имеет место неравенство Н(х',у') Н(х",у")>е!3 (26.2) для всех таких пар (х', у'), что х' G (х - е,х + е), у' G (/(х - е);/(х + е)) иу' > Дх'), и всех таких пар (х",у") , что х" G (х - е, х + е), у" G (fix — с), Дх + е)) иу" < fix") (рис. 2.9). Если теперь х' < х ", то по монотонности функции f должно быть и fix') < fix "), и можно выбрать некоторое у е if(x'), Дх") ). Согласно условию (26.2) Hix', у) - - Hix", у) > с/3, так что и Pi <х',х") = sup I Hix', у) - Н(х”,у) | > е/3. У еУ Таким образом, расстояние между любыми двумя стратегиями х', х" G (х — е, х + е) превосходит е/3, и уже этот интервал стратегий игрока 1 не является вполне ограниченным во внутренней топологии. Тем более не является таковым пространство всех стратегий игрока 1. □ 26.3. Из сказанного следует, что игры с разрывными функциями выигрыша не описываются матричными играми даже приближенно, и для их решения следует разра- батывать принципиально новые методы. Далее будет приведено два примера таких игр. § 27. ПРОСТЫЕ ИГРЫ 27.1. Определение. Антагонистическая игра Г-<х,у,//> (27.1) называется простой, если ее функция выигрыша Н принимает ровно два значения. □ Очевидно, всякая простая игра аффинно эквивалентна игре, в которой функция выигрыша принимает значения 0 или 1. Далее мы ограничимся рассмотрением только таких игр. Простые игры соответствуют таким явлениям порогового типа, когда игрок 1 в той или иной ситуации получает либо ’’все” (его выигрыш равен единице) , либо ’’ничего” (выигрыш равен нулю) . Ясно, что всякая простая игра Г полностью характеризуется множеством zr единиц своей функции выигрыша, т.е. множеством zr = {(х, у): Н(х, у) = 1 } . Поэтому такую игру можно обозначить через < х, у, z >. Игрок 1, выбирая свою конкретную стратегию х0, выигрывает единицу, если стратегия у игрока 2 попадает в ”х0-сечение” zr |х0 множества zr, т.е. если yEzr |х0 ={у\ (x0,y)£zr} (см. рис. 2.10). Поэтому разумное, максиминное поведение игрока 1 в простой игре должно состоять в наиболее полном (’’густом”) покрытии всего множества у х-сечениями. В свою очередь игрок 2, выбирая свою конкретную стратегиюу0, теряет единицу, если стратегия 2 игрока 1 попадает в ’>0-сечение” zr |j^0 множест- ва zr, т.е. если * xEzr |j/0 ={х: (x,y0)ezr } . 146
Поэтому разумное, минимаксное поведение игрока 2 в простой игре должно состоять в наиболее редких укладках у-сечений в множестве х стратегий игрока 1. 27.2. Сказанное дает нам основание ввести следующие определения. Определение. Пусть к — целое положительное число. Семейство подмножеств множества у называется покрытием кратности к множест- ва у. если каждая стратегия у С у входит не менее чем в к множеств из числа . Семейство 33 подмножеств х называется укладкой кратности к в множестве х, если каждая стратегия х Е х входит не более чем в к множеств из 30 . Ясно, что всякое покрытие является вместе с тем покрытием любой меньшей кратности, а всякая укладка — укладкой любой большей кратнос- ти. Поэтому мы далее под кратностью покрытия будем понимать его наи- большую кратность, а под кратностью укладки — ее наименьшую крат- ность. Покрытия кратности 1 называются просто покрытиями, а укладки кратности 1 — просто у кладками. Если х * С х и семейство х-сечений zr, соответствующих стратегиям из х* составляет покрытие у кратности к, то будем говорить, что х* порождает покрытие у кратности к. Аналогично, если у* Су и семейство у-сечений. соответствующих стратегиям у Су*, составляет укладку в х кратности к, то будем говорить, что у* порождает укладку в х кратности к. □ § 28. ОЦЕНКИ ЗНАЧЕНИЙ ПРОСТОЙ ИГРЫ 28.1. Через множества стратегий, порождающих кратные покрытия в у и кратные укладки в х, можно оценивать верхнее и нижнее значения прос- той игры Г = < х, у, z ). Эти множества связаны также со спектрами опти- мальных стратегий игроков. 28.2. Т е о р е м а. Если для простой игры Г = < х, у, z > ex существует r-элементное множество, порождающее покрытие у кратности к, то уг к/г. Доказательство. Пусть множество {*>, • • . , хг} порождает покрытие у кратности к. Возьмем стратегию X* ЕХ, для которой A (xz ) = = 1/г при каждом i - 1,. . . , г. Для любого у Е у мы тогда имеем Я(Х*,у) = — £ Н(хг-,у). (28.1) Г /1 10' 147
Ввиду того, что мы имеем дело с покрытием у кратности к, стратегия у принадлежит не менее чем к множествам из числа у|х,. Поэтому хотя бы для к из соответствующих значений i должно быть Н(хь у) = 1, а остальные слагаемые в сумме из (28.1) неотрицательны. Значит, Н(Х\уУ^к!г. (28 2) Отсюда сразу получается, что v г = sup inf Н(Х, у) к/г. х у 28.3. Двойственным к доказанной теореме можно считать следующее утверждение. Теорема. Если в у существует s-элементное подмножество, порож- дающее укладку в х кратности k, wvr <Jc/s. Д о к а з а т е л ь с т в о. Пусть множество} уь . . , у5}порождает укладку в хкратности к. Возьмем стратегию У*, для которой У*(у7-) = 1/s при любом j = 1,... , s. Тогда для любого х G х мы имеем 1 * Я(х, У*)= — S Я(х,у7). (28.3) s / = 1 Здесь мы имеем дело с укладкой кратности к. Поэтому любая стратегиях может принадлежать не более чем к из множеств х |у7, так что в сумме из (28.3) отличными от нуля могут быть не более к слагаемых. Поэтому Н(х, Y*)<k/s. (28.4) Отсюда следует, что йг = inf sup Н(х, У) k/s. □ 28.4. Объединение утверждений двух последних теорем дает нам следую- щее следствие. Следствие. Если для игры Г одновременно в х существует п-эле- ментное подмножество х*, порождающее покрытие у кратности к, а в у — п-элементное подмножество у*, порождающее в х укладку кратности к, то игра Г имеет значение, равное k/п, а смешанные стратегии X* и У*, для которых соответственно элементы из х* и у* выбираются с равными вероят- ностями 1/п, являются оптимальными. Доказательство. То, что уг = ur = ТГ -kin, непосредственно следует из теорем пп. 28.2 и 28.3. Далее, полагая в (28.2) г = п, мы получа- ем Я(Х*, у) > А;/п при любому Gy, а полагая в (27.5) s = n,H(x, У*) *^к/п при любомх G х, откуда требуемое вытекает немедленно. 28.5. Анализ обширного класса примеров простых игр сводится к исполь- зованию следующей теоремы. Теорема. Пусть для простой игры Г = < х, у, Н > = < х, у, z > в у сущест- вует счетное подмножество, порождающее укладку в х. Тогда иг = 0, и всякая+стратегия игрока 1 является оптимальной. Если, кроме того, в х существует счетное подмножество, порождающее покрытие у, то игрок 2 не имеет оптимальных стратегий (хотя и имеет е-оптималъные стратегии при любом е > 0) . 148
Доказательство. Пусть счетное множество {yi ,у2, • -} порожда- ет укладку в х. Возьмем произвольно YG Yc supp Y = {ylf у2, .. .) . Ясно, что для любого х G х должно быть Н(х, У) = Y(yk), если xGx |ук , 0 в противном случае. Выберем такое к*, что max Y(yk} = Y(yk*), и возьмем хкЕ. х | ук*. к Тогда из (28.5) следует, что для любого х G х Н(х, Y) ^Y(yk^ = H(xkiY), и поэтому sup Н(х, Y)=H(xk, У). При данной укладке мы можем найти смешанную стратегию У, для которой max Y(yk) будет сколь угодно малым положительным числом. Следовательно, по (28.5) должно быть йг = inf sup Н(х, У) = 0. Из неотрицательности значений функции выигрыша игры Г мы получа- ем, что = иг = 0 . Далее, из иг = sup inf Н(Х,у) = 0 % у следует, что inf Н(Х, у) = 0 при любой стратегии Х} которая тем самым оказывается оптимальной. Пусть теперь счетное множество {хь х2, . . .}порождает покрытие у. Возьмем произвольную смешанную стратегию У игрока 2. Очевидно, най- дется такое хп, что У(у|х„) = Я(хп,У)>0. Значит, sup Н(х, У)>0 = иг, т.е. стратегия У не является оптимальной. х Существование же е-оптимальных стратегий у игрока 2 согласно теореме п. 3.1 вытекает из существования у игры Г значения. § 29. ПРИМЕРЫ ПРОСТЫХ ИГР 29.1. Далее мы будем рассматривать простые игры на единичном квадрате или хо- тя бы изображать их в таком виде. Это позволит нам широко пользоваться геометри- ческими представлениями. 29.2. Пусть множество zr таково, что для некоторого х0 ех будет у|х0 = у (рис. 2.11). Тогда уже взятая в единственном числе стратегия х0 порождает покры- тие у, и по теореме п. 28.2 должно быть up 1. Отсюда следует, что up = 1, а страте- гия х0 игрока 1 оказывается его чистой оптимальной стратегией. Игроку 2 при этом ничего не остается делать, как выбирать произвольную стратегию и потерять единицу. Таким образом, произвольная его стратегия является оптимальной. 29.3. Следующий пример как бы двойствен предыдущему. Пусть множество zp та- ково что некоторое бу не принадлежит ни одному у-сечению Zp (рис. 2.12). Это 149
У Рис. 2.11 значит, что никакое подмножество х не порождает покрытия у. Тем самым иг < 0, так что up = 0, и стратегия у0 игрока 2 оказывается его оптимальной стратегией. Игрок 1 бессилен что-либо выиграть, и любая его стратегия оказывается оптимальной. 29.4. Пусть в простой игре Г на единичном квадрате множество zp является по- лосой, расположенной вдоль диагонали квадрата ситуаций, как это изображено на рис. 2.13. Ясно, что здесь множество чистых стратегий хг - 1/5, х2 = 1/2, х3 - 4/5 поро- ждает покрытие у, а множество стратегий у1 = 0, у2 - 1 /2 и у3 = 1 - укладку в х. Поэтому согласно сказанному в п. 28.4 здесь up =1/3, а пара смешанных стратегий X* и Е*, в которых стратегии из троек { .Yj, х2, х3 } и{у1,>?2, у3 } выбираются с вероятностью 1/3 каждая, составляет седловую точку. Очевидно, чистые стратегии, составляющие спектры оптимальных стратегий Х*и Y*, можно в этой игре несколько ’’пошевелить”, не нарушая порождения этими чистыми стратегиями соответствующих покрытий и укладок, и тем самым - оптимальности X* и Y*. Развитию конструкции, лежащей в основе такого ’’шевеления”, будет посвящен следующий параграф. 29.5. Пусть в простой игре Г на единичном квадрате множество zp имеет вид, изображенный на рис. 2.14. Здесь помеченное на рисунке множество из пяти чистых стратегий игрока 1 порождает покрытие множества у кратности 3, а такое же мно- жество чистых стратегий игрока 2 - укладку в множестве х, также кратности 3. Поэтому в данном случае по следствию п. 28.4 должно быть up = 3/5, а одна из си- туаций равновесия получается в результате взятия каждой из перечисленных стратегий игроков с вероятностью 1/5. 29.6. Пусть для простой игры Г множество zr имеет вид, изображенный на рис. 2.15. Очевидно, здесь проекции сплошных вертикальных отрезков составляют покрытие у, а проекции сплошных горизонтальных отрезков - укладку в х. Счет- ное число тех и других дает основание применить теорему п. 28.5, согласно которой здесь up = 0, оптимальной стратегией игрока 1 является любая его стратегия, а е-оп- тимальная стратегия игрока 2 получится, если взять в качестве ее спектра любое доста- 150
точно большое подмножество { у}, у2, _ . . , }приписав каждой стратегии из спектра вероятность, не превосходящую е. 29.7. Рассмотрим, наконец, простую игру Г на единичном квадрате, для которой множество zp имеет вид, изображенный на рис. 2.16. Здесь никакой конечный набор сечений не порождает покрытия у. Значит, у нас нет в этом случае оснований оцени- вать и_р снизу положительным числом. С другой стороны, стратегии уг = с < 1 и уг = 1 игрока 2 порождают укладку в х, так что ир^ 1/2. Так как вместе с тем никакой укладки в х из трех множеств здесь сконструировать нельзя, должно быть и up 1/2. Значит, ир = 1/2. § 30*. ГРАФОАНАЛИТИЧЕСКОЕ РЕШЕНИЕ ОДНОГО КЛАССА ПРОСТЫХ ИГР 30.1. В этом параграфе мы будем рассматривать простые игры Г на еди- ничном квадрате, для которых множество zr имеет вид, вообще говоря, криволинейной полосы (рис. 2.17), ограниченной графиками непрерывных неубывающих функций f и g, удовлетворяющих условиям /(х) = 0 на [0, а] и строго возрастает на [а, 1]; g(x) строго возрастает на [0, Ь] и g(x) = 1 на [b, 1]; /(x)<g(x) на [0, 1]. Таким образом, zr = { (*, Т): Я*) .т Я*) } • 30.2. Ясно, что на сегменте [0, /(1)] существует функция, обратная к /. Из рис. 2.17 видно, что составляющая множество zr полоса имеет ши- рину по вертикали не меньшую, чем некоторое положительное 6верт, и ши- рину по горизонтали не меньшую, чем некоторое положительное 6гор. 30.3. Опишем процесс построения для рассматриваемой игры Г такого конечного множества { X], х2,. . . } С х, которое порождает покрытие у, а также равномощного ему множества { уу , у2,. . . } С у, порождающего укладку в х. Положим индуктивно У1 = о, Xi = а, Ук+i =g(xk), Xk + i = Г'(Ук), к = 1,2.. .. 151
Геометрически этот процесс соответствует построению зигзага, как это изображено на рис. 2.18. Длина каждого вертикального звена зигзага не менее чем 5верт, а каж- дого горизонтального — не менее чем 5гор. Суммарная же длина всех го- ризонтальных (равно как и всех вертикальных) звеньев зигзага не пре- восходит единицы. Поэтому число всех звеньев зигзага должно быть конеч- ным: оно не должно превосходить 2(тах{5верт, 5гор}). Следовательно, через некоторое конечное число шагов зигзаг ’’уткнется” либо в правую сторону квадрата ситуаций на некотором уп >/(1), либо в верхнюю его сторону на некотором хп Ь. Рис. 2.20 Хп 1 В первом из этих случаев (рис. 2.19) мы примем хп - 1 и закончим на этом процесс построения зигзага. Во втором случае (рис. 2.20) положим Уп + 1 = 1 и также закончим процесс. 30.4. Нетрудно видеть, что множество стратегий {Xi,. . . , хп } поро- ждает покрытие у. При i = 1,. . ., п - 2 каждое пересечение у |xz Пу |xz+1 состоит ровно из одной точки, множество же Укп-1 ПУ 1*п = [уп-1, Уп] также обязательно непусто, но может составлять сегмент положительной длины. Множество стратегий {yi>. . . ,у„} укладки в х не порождает: сече- ния х |у! = [лг,_ j, xz] и x|yr-+1 = [xz, xz+1] пересекаются (хотя и по единственной точке). Однако если зигзаг утыкается в правую сторону квадрата, то суммарная длина его вертикальных звеньев без последнего будет меньше единицы, так что некоторое согласованное смещение страте- гий yi,. . . , уп вверх уже будет порождать укладку в х. Если же зигзаг утыкается в верхнюю сторону квадрата, то сумма длин горизонтальных звеньев зигзага (также без последнего) будет меньше единицы, и снова возникает возможность ’’растягивания” элементов покрытия за счет смеще- ния стратегий Xj,...,хл вправо. Применение следствия п. 28.4 дает, что иг = 1/п, а приписывание каж- дой из порождающих покрытие и укладку чистых стратегий вероятности 1/п дает оптимальные стратегии игроков. Разумеется, ими не исчерпывается множество всех оптимальных стратегий, полное описание которого возмож- но, но требует более обстоятельных рассмотрений. 152
§ 31. БОРЬБА ЗА ВСТРЕЧУ СЛУЧАЙНО ПОЯВЛЯЮЩЕГОСЯ ОБЪЕКТА 31.1. Один из источников возникновения разрывов функции выигры- ша антагонистической игры заключается в следующем. Пусть каждый из двух игроков намерен выполнить некоторое действие (произвести выстрел, выбросить на рынок партию товара, внести на совеща- нии предложение и т.д.). При этом обстоятельства часто складываются так, что, во-первых, целесообразно выполнить это действие как можно позже, а, во-вторых, желательно своим действием упредить сходное дей- ствие противника. Такой конфликт в условиях противоположных интере- сов его участников естественно моделировать антагонистической игрой на единичном квадрате, в которой функция выигрыша Н имеет вид К(х, у) при х<у, <р(х) при х-у, (31.1) Цх, у) при х>у, где каждая из функций К и L а) непрерывна по обеим переменным; б) монотонно возрастает по х при любом значении у; в) монотонно убывает по у при любом значении х; г) удовлетворяет условию L(x, х) ^х) К(х, х) (рис. 2.21). Определение. Игра Г с функцией выигрыша Н вида (31.1), удовлетворяющая перечисленным условиям, называется игрой с выбором момента времени, а также игрой типа дуэли. Игры с выбором момента времени имеют достаточно сложную и разра- ботанную теорию. Мы ограничимся рассмотрением лишь одного примера, который будем интерпретировать как борьбу за встречу случайно появляю- щегося объекта. 31.2. Пусть игроки I и II выбирают соответственно числа х и у из сег- мента [0,1 ]. Эти числа будут пониматься как моменты времени прихода игроков в заданный пункт. Пусть t — время появления в этом пункте некоторого объекта, который достается игроку, приходящему пе рв ым после t. Игрок, обладающий объектом, получает выигрыш, равный!, 153
а его противник эту единицу теряет. Если ни один из игроков не получит объекта, то выигрыш каждого из игроков принимается равным нулю. Предполагается, что время появления объекта в пункте встречи яв- ляется случайной величиной, распределенной равномерно на сегмен- те [0, 1 ]. 31.3. Запишем условия данной игры более формально. Рассмотрим ситуацию (х, у), в которой х<у. В этом случае игрок 1 выигрывает единицу, если t<x, (31.2) проигрывает единицу, если х < t < у, (31.3) и не получает ничего, если y<t. (31.4) Вероятности событий (31.2), (31.3) и (31.4) равны соответственно х, у - х и 1 — у. Таким образом, при х < у мы имеем Н(х, у) = 1 х +( -1 )(j - х) = 2х - у. (31.5) Аналогичным образом мы находим, что при х > у Н(х,у} = 1 (х - у) +(- 1) у = х - 2у. (31.6) Наконец, естественно полагать, что при х - у должно быть Н(х, у) = 0. Схематическое описание функции Н(х, у) приведено на рис. 2.22. Тем самым антагонистическая игра Г задана. Она уже фигурировала в примере 3 в п. 6.3. 31.4. Заметим, что игра Г является симметричной. Действительно, рас- смотрим выражение Н (у, х). При х < у второй аргумент принимает боль- шее значение, чем первый, так что значение функции выигрыша следует вычислять по формуле (31.6): #(Л х)=у - 2х = Н(х, у). Аналогично при х > 0, применяя формулу (31.5), мы имеем: Н(у, х) = 2у - х - Н(х. у). Наконец, при х = у Н(у,х) = 0 = -Н (х, у). Отсюда и из сказанного в § 5 следует, что иг = 0. Кроме того, оптималь- ные стратегии игрока 1, как вероятностные распределения, должны совпа- дать с оптимальными стратегиями игрока 2. Поэтому для решения нашей игры достаточно найти оптимальные стратегии игрока 1. 31.5. Существование в этой игре седловых точек в смешанных стратегиях может быть доказано, однако доказательство соответствующей теоремы довольно сложно. Поэтому мы просто предположим, что в игре Г игроки имеют смешанные оптимальные стратегии. Предположим, кроме того, что одна из оптимальных стратегий каждого из игроков является распре- делением, имеющим дифференцируемую плотность f. Эти предположе- 154
ния накладывают на нас обязательство после нахождения интересующих нас стратегий проверить, что они действительно являются оптимальными и обладают предположенными свойствами. Мы далее будем называть искомую стратегию стратегией /. Если игрок 2 употребляет эту страте- гию, то = f Н(х, y)f(y)dy. О Перепишем последний интеграл с учетом формул (31.5) и (31.6): H(xtf) = J (х - 2y)f(y)dy + f (2х - у) f (y)dy. (31.7) О х Те точки, в которых плотность /' положительна, являются по определе- нию точками спектра оптимальной стратегии, определяющей /. Ввиду симметричности игры значения х, для которых f (х) > 0, также должны быть точками спектра некоторой оптимальной стратегии игрока 1. Поэто- му и в силу непрерывности функции Н вне диагонали квадрата ситуаций согласно лемме п. 5.8 для таких значений х должно быть Н(х, f) = иг = 0. Следовательно, Н(х, f), как функция х, остается на всем спектре f посто- янной и равной нулю. Кроме того, ввиду предположенной непрерывности/, каждую точку х, в которой /(х)>0, окружает окрестность точек х с этим же свойством, так что и для всех этих точек будет Н(х 9f) = 0. Так как в этих окрестностях функция Н( • ,/) постоянна, все ее произ- водные по х также должны в них обращаться в нуль. Дифференцируя тождество (31.7) по х, мы имеем ЪН(х,Г) * 1 z ——— = (х - 2х)/(х) + f f(y)dy - (2х - x)f(x) + 2 f f(y)dy = Эх О X = -2xf(x) + ff(y)dy+ff(y)dy = -2xf(x) + 1 + f f(y)dy. (31.8) Ox x Второе дифференцирование дает нам d2H(x,f) ---= —2/(х) - 2xf '(х) -/(х) = 0, Эх2 т.е. Лх) _L /(х) 2 х Интегрируя это дифференциальное уравнение, мы получаем In f (х) = 3 = — — In х + С , откуда /(х) = Сх-3/2. (31.9) Мы видим, что там, где плотность f дифференцируема и положительна, 1 она должна представляться в виде (31.9). Однако интеграл $ x~'3!2dx о расходится (не существует). Следовательно, плотность f не может быть дифференцируемой и положительной на всем сегменте [0,1]. 155
31.6. Выясним, где плотность / может обращаться в нуль. Предположим, что некоторый участок ненулевой плотности кончается в точке , а далее вплоть до точки х2 (х2 > *1) идет участок нулевой плотности. Поскольку Xi является точкой спектра стратегии/, мы, согласно теореме п. 5.8, имеем: = vr H(_x2,f). (31.10) Но, с другой стороны, = f H(xi,y)f(y)dy. О Разбивая этот интеграл на три части — от 0 до х{, от хг до х2 и от х2 до 1 — и учитывая, что между хг и х2 плотность f по предположенному обращает- ся в нуль, получаем H(xltf) = f' H(xt,y)f(y)dy + f H(xi,y)f(y)dy О x2 и аналогично Х1 1 H(x2,f) = f H(x2,y)f\y)dy + f H(x2,y)f(y)dy. 0 x, Поэтому, принимая во внимание выражения для функции Н, имеем х 1 1 H(x2,f)-H(x2,f) = (x2 -*i)J f(y)dy + 2(x2 -xt)f f(y)dy £ 0 x2 1 (X2 -xt)f f(y)dy = x2 -Xj >0, 0 а это противоречит (31.10). Из сказанного следует, что за участком положительной плотности / участок нулевой плотности следовать не может. Это в свою очередь означа- ет, что плотность f может обращаться в нуль лишь между нулем и некото- рым а > 0. Таким образом, мы имеем: /(*) = 0 при х < а, Сх~3!2 при х^а. 31.7. Параметры Спа пока остаются неизвестными. Для их определе- ния воспользуемся содержательными соображениями. Во-первых, f явля- ется плотностью вероятностного распределения. Поэтому должно быть 1 1 ff(x)dx= f f(x)dx = 1. О а (31.11) Во-вторых, как было показано, 1 является точкой спектра некоторой оптимальной стратегии (именно, стратегии с плотностью/) для игрока 2. Следовательно, на основании теоремы п. 5.8 должно быть Я(/ 1) = Уг = 0- (31.12) 156
Равенства (31.11) и (31.12) являются условиями для определения зна- чений а и С. Перепишем их с этой целью в явном виде. Соотношение (31.11) 1 запишется как С f x~3/2dx = 1, т.е. а (31.13) Далее, на основании симметричности игры Я(Л 1) = -Я(1,/) = -С f (1 -2y)y~3'2dy = 0. а Поскольку С Ф 0, эта дает нам / (У 3/2 - 1/2)ф/ = (-2у ^2 —4у1^2)|^ = 0. а Выполняя двойную постановку, получаем 1/V? + 2\J~a —3=0, откуда 2а — 3\/а’ + 1=0. Это квадратное уравнение имеет два корня: 1 и 1/4. Корень а = 1 противоречит равенству (31.13), а подстановка в (31.13) а = 1/4 дает нам С = 1/2. Таким образом, искомая оптимальная стратегия игрока 1 определяет- ся плотностью г 0 —х~3^2 при *2; 1/4. при х< 1/4, (31.14) График функции f изображен на рис. 2.23. 31.8. Дифференцируемость плотности f очевидна. Нам остается про- верить, что найденные стратегии игроков действительно являются опти- мальными. В соответствии с п. 5.5 для этого достаточно убедиться в том, что при любом х Н(х, f ) <t>r = 0. В самом деле, при х 1/4 правая часть формулы (31.7) приобретает вид 1 f(2x-y)y~3'2dy = 1 ((-2)^-1/2 -2//2) =^--У<0, 2 1/4 2 1/4 2 2 поскольку в рассматриваемом случае х < 1/2. 157
Вместе с тем параметры а = 1/4 и С = 1/2 именно так и были найдены, чтобы определяемая посредством (31.14) плотность / удовлетворяла условию (31.12). Формула же (31.8) при l/4Sx^l дает нам ЭЯ(х,/) I 1 J -------= ^2х — х 3/2 + — f у 3^2dy + I Эх 2 2 х 1 х ^2 +х — 1 + 1 = 0. Тем самым оптимальность стратегии с плотностью f установлена. 31.9. Подчеркнем, что в ходе анализа рассматриваемой игры мы вос- пользовались существенным предположением о существовании оптималь- ных стратегий у игроков и о виде некоторой оптимальной стратегии каждо- го из игроков. Именно, мы предположили, что она имеет дифференцируе- мую плотность. Это предположение, в данном случае чисто интуитивное, привело нас к цели. К сожалению, теория игр еще не накопила необходи- мого опыта в решении конкретных задач, чтобы такого рода интуитив- ные соображения возникали достаточно часто.
Глава 3 БЕСКОАЛИЦИОННЫЕ ИГРЫ §1. ПОНЯТИЕ И ОПРЕДЕЛЕНИЕ БЕСКОАЛИЦИОННОЙ ИГРЫ 1.1. Антагонистические игры, которыми мы занимались в двух первых главах книги, описывают конфликты весьма частного вида. Более того, для большинства имеющих место в реальной жизни конфликтов антагонистические игры либо вовсе не могут считаться приемлемыми, адекватными описаниями, либо, в лучшем случае, могут рассматриваться как первые, грубые приближения. Во-первых, антагонистические игры никак не затрагивают своими опи- саниями конфликты с числом сторон, большим чем два. Вместе с тем, такие многосторонние конфликты не только встречаются в действитель- ности, но являются принципиально более сложными, чем конфликты с двумя участниками, и даже, как выяснится дальше, не поддаются сведе- нию к последним. Во-вторых, даже в конфликтах с двумя участниками интересы сторон вовсе не обязаны быть противоположными; во многих конфиликтах такого рода случается так, что одна из ситуаций оказывается предпочти- тельнее другой для обоих участников. В-третьих, даже если любые две ситуации сравниваются игроками по их предпочтительности противоположным образом, различие разностей в оценках этой предпочтительности оставляет место для соглашений, комп- ромиссов и коопераций. Наконец, в-четвертых, содержательная острота конфликта не обяза- тельно соответствует его формальной антагонистичности. Например, при встрече двух боевых единиц воюющих сторон (скажем, танков) обоюдное их стремление уничтожить друг друга не выражает антагонистичности конфликта: в антагонистическом конфликте цели сторон оказываются строго противоположными, и стремлению одной стороны уничтожить другую противоположным будет стремление избе- жать уничтожения. На основании сказанного теория игр не может ограничиться изучени- ем антагонистических игр, а должна иметь своим предметом также игры более общей природы. 1.2. Определение. Бескоалиционной игрой называется система Г = (/, {хД/е/, ez^ > (1-0 в которой I и Xi, i Е I, являются множествами, a — функциями на множестве х = П хг-, принимающими вещественные значения. fez 159
При этом элементы множества I называются игроками, элементы каж- дого из множеств X/ - стратегиями игрока i, элементы декартова произ- ведения х — ситуациями, каждая функция - функцией выигрыша игрока z, а ее значение Hj (х) в ситуации х — выигрышем игрока i в ситуа- ции х. Подмножества множества всех игроков мы будем называть коали- циями. □ Бескоалиционное^ игры (1.1) следует понимать в том смысле, что группам игроков (’’коалициям”) не приписывается ни каких-либо страте- гических возможностей, ни каких-либо интересов, за исключением тех, которые вытекают из стратегических возможностей и интересов отдель- ных игроков. Впрочем, далее будет видно (см. гл. 4), что объединение игроков даже в такие сравнительно примитивные образования может давать ’’кооперативный” эффект. В данном курсе рассматриваются только бескоалиционные игры, т.е. такие игры, в которых целью каждого участника является получение по возможности большего индивидуального выигрыша. Игры, в которых действия игроков направлены на максимизацию выигрышей коллективов (коалиций) без последующего их разделения между игро- ками, называются коалиционными. Теория коалиционных игр весьма сложна и в настоящий курс не входит. Далее мы будем считать множество игроков I конечным, хотя в совре- менной теории игр рассматриваются игры и с бесконечными множествами игроков, представляющие не только теоретический, математический, но и прикладной экономический интерес. Обычно принято различать игроков по их номерам, т.е. считать, что I = {1,2,..., п }. В изложении основных понятий и фактов теории бескоалиционных игр мы будем придерживаться — в той мере, в какой это возможно и целесообразно — параллелизма с изложением теории матричных игр в гл. 1. 1.3. Содержательно процесс игры Г состоит в выборе каждым из иг- роков одной своей стратегии xz Е xz, и, таким образом, в результате каж- дой партии игры складывается система стратегий (хь . .. , хп) = х, т.е. ситуация. Естественно считать, что каждый игрок имеет не менее двух различных стратегий, так как иначе, если он располагает только одной стратегией, его действия оказываются заранее определенными, и он факти- чески в игре участия не принимает. 1.4. Выделим несколько частных классов бескоалиционных игр. Прежде всего заметим, что среди явлений, описываемых посредством бескоалиционных игр, довольно много таких, которые сводятся к рас- пределению между игроками некоторого постоянного количества. В теории игр им соответствуют игры с постоянной суммой. Определение. Бескоалиционная игра Г из (1.1) называется игрой с постоянной суммой, если существует такое постоянное с, что S (х) = zez = с для всех ситуаций х G х. Если для игры Г с постоянной суммой константа с равна нулю, то Г называется игрой с нулевой суммой. □ Нетрудно проверить (ср. также п. 1.5 введения и п. 1.1 гл. 1), что класс антагонистических игр совпадает с классом игр двух лиц с нулевой суммой. 160
1.5. Кроме того, представляют интерес игры с конечными множествами стратегий игроков. Определение. Если в бескоалиционной игре Г из (1.1) множество стратегий xz каждого из игроков i ё I конечно, то игра Г называется конечной. Конечная игра двух лиц называется биматричной ввиду естественной возможности расположения значений функций выигрыша двух игроков в виде пары матриц (ср. п. 1.6 введения, п. 1.2 гл. 1, а также далее п. 12.1). □ § 2. ОСНОВНЫЕ СООТНОШЕНИЯ МЕЖДУ БЕСКОАЛИЦИОННЫМИ ИГРАМИ 2.1. Понятия аффинной эквивалентности, изоморфности и подыгры для произвольных бескоалиционных игр обобщают достаточно непосредствен- ным образом соответствующие понятия, введенные для антагонистических игр в § 1 гл. 1. Естественно, что эти отношения обладают свойствами, анало- гичными свойствам анатагонистических игр, а сами игры - аналогичными свойствами инвариантности в смысле этих отношений. Далее мы будем говорить о тех или иных отношениях между бескоали- ционными играми Г = </, {xz} zez, W/e/ >, (2.1) Г' = <Л {x;)ze/, (//;}ze/>- (2-2) Определение. Игра Г' из (2.2) называется аффинно эквивалентной игре Г из (2.1), если J ё/ (отсюда уже следует, что игры Г и Гг имеют одно и то же множество ситуаций), и H,i(x) = klHi(x)+ah i^I, (2.3) где к, > 0, i&I. Аффинную эквивалентность игр Г'иГ будем обозначать через Г'^ Г. □ Различие между двумя аффинно эквивалентными играми по существу состоит в различии начальных капиталов игроков zzz и в соотношениях еди- ниц измерения выигрышей, определяемых коэффициентами к,. Эти раз- личия и коэффициенты у разных игроков могут быть, вообще говоря, различными. 2.2. Особо отметим частный случай аффинной эквивалентности бескоа- лиционных игр. Определение. Бескоалиционные игры Г и Г'из (2.1) и (2.2) называются однородно аффинно эквивалентными, если соотношение (2.3) выполняется для них с А,- = A, z ё /.□ Очевидно, для антагонистических игр понятия аффинной эквивалентнос- ти и однородной аффинной эквивалентности совпадают. Как и в случае антагонистических игр, устанавливается (ср. теоремы п. 1.3), что отношение аффинной эквивалентности является рефлексив- ным, симметричным и транзитивным и потому действительно эквива- лентным отношением, разбивающим (’’факторизующим”) класс всех бескоалиционных игр с одним и тем же множеством ситуаций на попар- но непересекающиеся подклассы аффинно эквивалентных друг дру- гу игр. То же можно сказать и по поводу однородной аффинной эквива- лентности. 11.Н.Н. Воробьев 161
2.3. Теорема. Всякая бескоалиционная игра с постоянной суммой аффинно эквивалентна (и даже однородно аффинно эквивалентна') неко- торой игре с нулевой суммой. Доказательство. Пусть Г из (2.1) является игрой с постоянной суммой, в каждой ситуации которой сумма выигрышей всех игроков равна с. Возьмем произвольные q,z G/, для которых S Су = с. Полагая /е/ в (2.3) ki = l,zzz = -q, мы приходим к игре с нулевой суммой. □ 2.4. Определение. Игры Г из (2.1) и Г' из (2.2) называются г/зо- морфными, если существует такая система отображений 7Г = <7Г/,{тГ,},</>, (2.4) что : я/: / -*/ 'есть однооднозначное соответствие, при котором игроку i в игре Г ставится в соответствие игрок яTi - яг в игре Г'; тгр. Xj ->x^z есть однооднозначное отображение х на x^z (что вполне естественно: если игроку z ставится в соответствие в игре Г'игрок яг, то стратегиям z должны ставиться в соответствие стратегии игрока яг). При этом для любой ситуации х - (х,, . . . , хп) мы полагаем 7ТХ = (Я, Х}..Я„ Х„). Наконец, Я'я/(ях) = Н, (х) для любой ситуации xG х и любого игрока i G/. Очевидно, в случае, когда игры Г и Г' являются антагонистическими, сформулированное определение совпадает с определением из п. 1.5 гл. 1 изоморфизма антагонистических игр (при отображении я7 игрок 1 в игре Г переводится в игрока 1 в игре Г', а игрок 2 — в игрока 2) или их зер- кального изоморфизма (игрок 1 в игре Г переводится в игрока 2 в игре Г', а игрок 2 — в игрока 1). Если игры Г и Г'совпадают, то изоморфизм игр Г и Г' называется автоморфизмом игры Г. □ Заметим для дальнейшего, что в условиях автоморфизма я игры Г иг- роки г и яг имеют одно и то же число стратегий (или, говоря более общо, множества стратегий одинаковой мощности). 2.5. Теорема. Изоморфность игр обладает свойствами рефлексивнос- ти, симметрии и транзитивности, Для доказательства достаточно повторить сказанное по поводу теоремы п. 1.6 из гл. 1. 2.6. Определение. Бескоалиционная игра Г из (1.2) называется подыгрой бескоалиционной игры Г из (1.1), если xz Cxz для всех z G/, а каждая из функций Яу является сужением соответствующей функции Я у на х' = П Ху Сх. □ ге/ Очевидно, это определение охватывает определение подыгры для анта- гонистических игр. из п. 1.5 гл. 1. 162
§ 3. ОПТИМАЛЬНОСТЬ В БЕСКОАЛИЦИОННЫХ ИГРАХ Как и в случае антагонистических игр (см. п. 2.1 гл. 1), целью теории бескоалиционных игр является выработка принципов оптимальности (ус- ловий, которым должны удовлетворять стратегии или ситуации для того, чтобы считаться разумными, оптимальными, т.е. теми, которые мы уже привыкли считать присущими решениям игр), а также установление соот- ветствий между свойствами игр и свойствалми их решений. Под оптимальностью мы будем понимать различные варианты форма- лизованных описаний содержательных представлений о выгодности, ус- тойчивости и справедливости. Для класса антагонистических игр наиболее естественным принципом оптимальности оказался принцип максимина: он приводит к седловым точкам в игре, которые для каждого игрока яв- ляются приемлемыми, т.е. выгодными и устойчивыми ситуациями. Заметим, что в антагонистических играх, которые являются играми с постоянной (а именно — с нулевой) суммой, даже не может возникать воп- роса об одновременном увеличении выигрышей всех игроков или хотя бы об увеличении их суммарного выигрыша. Напротив, в общих бескоалиционных играх такие возможности могут появляться, и ситуации, приемлемые (т.е. выгодные и потому устойчивые) для каждого из игроков, могут априори оказываться в том или ином смыс- ле невыгодными (и потому неустойчивыми) для групп игроков и тем более для всех игроков сразу. В данной главе мы будем заниматься всем этим кругом вопросов. Особые возможности открываются при последовательном применении принципа максимина не только отдельными игроками, но и любыми их коа- лициями. Исследование этих возможностей составляет предмет коопера- тивной теории бескоалиционных игр, о которой будет идти речь в гл. 4. § 4. ПРИЕМЛЕМЫЕ СИТУАЦИИ И СИТУАЦИИ РАВНОВЕСИЯ 4.1. Как и в антагонистических играх, ситуацию х в игре (1.1) естест- венно считать приемлемой для игрока z, если этот игрок, изменяя в ситуа- ции хсвою стратегию на какую-либо другую, не может увеличить своего выигрыша. Для описания сказанного в более формальном виде введем одно полез- ное обозначение. Пусть х = (Xj,. ,. , xz_ !, хи xz+ j, . . . .xfl) — произвольная ситуация в игре Г, а х\ — некоторая стратегия игрока г. Составим новую ситуацию, которая будет отличаться от ситуации х только тем, что стратегия xz иг- рока z заменяется на его стратегию х\. Получившуюся в результате Такой замены ситуацию (xt,xz_ t ,xj,х/+ t, xn} принято обозначать через xzllxz, а если это не сможет привести к недоразумениям, то через х II xz. Очевидно, в том случае, когда стратегии xz их} совпадают, х II х- -х. Теперь мы можем сформулировать определение приемлемой ситуации следующим образом. Определение. Ситуация х в игре (1.1) называется приемлемой для игрока i, если для любой его стратегии xz ЯДх 11х;-)<ЯДх). (4 1) 11 163
Множество всех ситуаций, приемлемых в игре .Г для игрока i, будем обозначать через / (Г). □ 4.2. От приемлемых ситуаций мы можем, как и в антагонистическом случае перейти к ситуациям равновесия. Определение. Ситуация в игре Г, приемлемая в ней для всех игро- ков, называется ситуацией равновесия (или равновесной ситуацией). Иными словами, ситуация х называется ситуацией равновесия, если для любого игрока i G I и любой его стратегии Е х, выполняется нера- венство (4.1). Множество всех ситуаций равновесия в игре Г будем обозначать через Ж)- □ Очевидно, ^(Г)= п %\.(Г). zez Из определения видно, что в ситуациях равновесия и только в них ни один игрок не заинтересован в отклонении от своей стратегии. В частности, если ситуация равновесия оказывается предметом договора между игрока- ми, то ни один из игроков не будет заинтересован в нарушении своих обя- зательств, Наоборот, если в договоре зафиксирована неравновесная ситуа- ция, то по определению найдется хотя бы один игрок, который будет заинтересован в отклонении от нее и тем самым — в нарушении этого до- говора. Определение. Равновесной стратегией игрока в бескоалиционной игре называется такая его стратегия, которая входит хотя бы в одну из си- туаций равновесия игры. □ В случае антагонистической игры равновесные стратегии игроков совпа- дают с их оптимальными стратегиями. Для неантагонистических игр, напро- тив, понятие оптимальной стратегии игрока нередко вообще не имеет смысла: в таких играх оптимальными оказываются не стратегии отдельных игроков, а их сочетания, (т.е. ситуации) и притом для множества всех игро- ков сразу. Поэтому в общих бескоалиционных играх как оптимальные следует квалифицировать не действия того или иного игрока, а совокупность дейст- вий всех игроков, исход игры, ситуацию в ней. Именно в таком смысле следует понимать оптимальность приемлемых ситуаций в бескоалиционной игре и ситуаций равновесия в ней. Значительная часть теории бескоалиционных игр состоит в исследовании свойств их ситуаций равновесия и равновесных стратегий игроков, а также в разработка способов их нахождения. Процесс нахождения ситуаций равновесия в бескоалиционной игре часто называется решением игры, § 5. ИНВАРИАНТНОСТЬ ПРИЕМЛЕМЫХ И РАВНОВЕСНЫХ СИТУАЦИЙ 5.1. Свойства приемлемости ситуаций, как и в случае антагонистичес- ких игр, оказываются инвариантными относительно аффиных эквивалент- ностей и изоморфизмов. 164
Теорема. Пусть снова Г из (1.1) и Т’из (1.2) — две бескоалиционные игры. Тогда если Г' <*> Г, то «,-(Г')=^ ,(Г), /е/, (Г') = 'Й(Г); если Г '= тт Г’, где тт — изоморфизм из (2.4), то ^тг/(Г,) = 7Г ^,(Г), ZG/, (5.1) ГЙ(Г') = 77 Ъ (Г). (5.2) Доказательство получается незначительной модификацией доказатель- ства теоремы п. 5.3 гл. 1. □ 5.2. Обратим внимание на смысл равенства (5.1). Оно означает, что при изоморфизме л образцы приемлемых для игрока i в игре Г ситуаций долж- ны быть приемлемыми в игре я Г для игрока л/. То же справедливо и для ситуаций равновесия. 5.3. В случае, если Г = Г' вторая часть теоремы п. 5.1 приобретает вид если тт - автоморфизм игры Г, то тг (Г) = $ я/(Г) и я? (Г) = = ^(Г). Содержательно, это утверждение означает, что если игроки входят сим- метрично в условия игры, то они входят симметрично и в совокупность оп- тимальных решений игры. Говоря точнее, в условиях автоморфизма л игры Г положение игрока i в ситуации х, в том или ином смысле оптимальной точ- но такое же, что и положение игрока л/ в ситуации лх, которая оптимальна равно в такой же мере, что и ситуация х. В этом проявляется справедли- вость рассматриваемого принципа оптимальности; в этом же проявляется и ограниченность этой справедливости, ибо допускаются различные положе- ния игроков в одной и той же оптимальной (и тем самым неулучшаемой) ситуации. 5.4. Как и для антагонистических игр, в общем случае бескоалиционных игр имеет место теорема о независимости от посторонних альтернатив. Теорема. Если игра Г' из (1.2) является х-подыгрой игры Г из (1.1), то х'П ^/(ОС^ДГ') для i G I , (5.3) х О^(Г)С Г£(Г'). (5.4) Доказательство проводится по той же схеме, что и для теоремы 5.1 гл. 1. Если х'А$ДГ)=ф, то (5.3) тривиально. Пусть у *Е х П t (Г). Это значит, что Hi(y* \\Xi)^Hi(y*) для любого xzGxz. (5.5) Тем более это верно для любого xz G x'z. Но в этом случае у* II xz GJ, ив (5.5) можно Hi заменить на Нр Hj(y*\\xi) <Н\(у*) для любого xz G GxJ, а это иозначаету * G z (Г). Переход от (5.3) к (5.4) очевиден. □ 165
§ 6. СИТУАЦИИ, ОПТИМАЛЬНЫЕ ПО ПАРЕТО 6.1. Как уже отмечалось, формальное понятие оптимальности призвано отражать различные варианты содержательных представлений об устойчи- вости, выгодности и справедливости. Можно считать, что устойчивость ситуации проявляется в ее равновесности. Другой вариант устойчивости ситуации, в большей степени, чем равно- весность, отражающий черты ее выгодности, состоит в ее оптималь- ности по Парето. Далее нам придется сравнить между собой ситуации по выигрышам, которые получают в них различные игроки. Для этого введем обозначение ЯДх)=(Я1(х),...,Я„(х)), и будем, как обычно, полагать Я7(х) <Я7(у), если (х) < Ht (х) при всех i Е/; если ЯДх^Я^х) при всех i Е / , ноЯ/(х)^Я/Сг); Нj(х) <Hj(y\ если (х) < Ht(х) при всех i Е /. Определение. Ситуация х° в бескоалиционной игре Г- </, {xj iHi}i^I > (6.1) называется оптимальной по Парето, если не существует ситуации хЕх, для которой имеет место векторное неравенство Я^(х°) < (х) . Множество всех ситуаций в игре Г, оптимальных по Парето, обозначается через ((: р (Г) . □ Иными словами, в оптимальной по Парето ситуации игроки не могут совместными усилиями увеличить выигрыш кого-либо из них, не уменьшив при этом выигрыш кого-либо другого. Подчеркнем формальное различие ситуации равновесия |от ситуации, оптимальной по Парето: в первой ни один игрок, действуя в оди- ночку, не может увеличить своего собственного выигрыша; во второй — все игроки, действуя совместно, не могут (даже нестрого) увеличить выигрыш каждого. 6.2. Вопросы об оптимальных по Парето ситуациях решаются в принципе вопросы о ситуациях равновесия. Это объясняет- ся тем, что оптимальность по Парето ситуации х определяется лишь положением векторного зна- чения Я7(х) в множестве всех допустимых век- торов выигрышей 53(Г)= {Нг(х): хЕх}, а для выяснения вопроса о равновесности ситуа- ции требуется учитывать еще и зависимость каж- дой из компонент Н^х) этого вектора от соот- ветствующей переменной X/. Практически любое достаточно обозримое опи- сание множества векторов выигрышей 5? при- проще, чем аналогичные Рис. 3,1 166
водит к описанию векторов выигрышей в оптимальных по Парето си- туациях. Так, в изображенном на рис. 3.1 примере оптимальным по Парето ситуа- циям будут соответствовать все точки S3 (Г) , принадлежащие выделен- ными жирными линиями участкам ’’северо-восточной” границы S3 (Г) . В частности, для существования в игре» Г оптимальной по Парето ситуа- ции достаточно компактности множества 53 (Г). Для этого же, в свою очередь, достаточно, чтобы множество всех ситуаций х было компактным в некоторой топологии, а все функции выигрыша в этой топологии бы- ли непрерывными. Разумеется, фактическое нахождение оптимальных по Йарето ситуаций может представлять существенные технические и в том числе вычислитель- ные трудности, но мы здесь не будем останавливаться на этих вопросах. 6.3. Нетрудно проверить, что оптимальность по Парето обладает опи- санными в пп. 3.3 и 3.4 свойствами инвариантности, которые присущи и равновесию. Теорема. Аффинно эквивалентные игры имеют одни и те же опти- мальные по Парето ситуации. Теорема. Если it - изоморфизм игры Г на игру Г', то ^р(Г') = л ^Р(Г). Теорема. Для оптимальности по Парето справедливо свойство неза- висимости от посторонних альтернатив’, если Г* есть х-подыгра игры Г, то к П £ Р(Г)С Доказательство этих утверждений мы предоставляем читателю. □ 6.4. Докажем в заключение, что совокупность всех ситуаций, оптималь- ных по Парето, обладает естественными свойствами внутренней и внеш- ней устойчивости. Теорема. Каковы бы ни были оптимальные по Парето ситуации х и у, не может быть НДх) ^Нт(у) (внутренняя устойчивость). Если множество S3 (Г) компактно, а функции выигрыша Hj непрерыв- ны, то какова бы ни была ситуация хф 2? Р(Г), найдется ситуация ]’Е G р (Г), для которой Ht(x) <Hj(y) (внешняя устойчивость). Доказательство. Свойство внутренней устойчивости вытекает непосредственно из определения оптимальности по Парето. Для доказательства внешней устойчивости зафиксируем в игре Г ситуа- цию х и рассмотрим множество ВХ(Г) = Ш*) + К'+ )П 23 (Г) (на рис. 3.1 заштриховано). Вместе с S3 (Г) это множество должно быть компактом. Поэтому среди его точек найдутся такие, для которых сумма X Н,(х) (6.2) 7Е/ принимает свое максимальное значение на S3 Л(Г). Каждая такая точка соответствует оптимальной по Парето ситуации в игре Г. Заметим, что в ходе доказательства этой теоремы вместо суммы (6.2) можно было бы взять любую линейную форму выигрышей Н{ (х) с положи- тельными коэффициентами.
§ 7. СМЕШАННЫЕ РАСШИРЕНИЯ БЕСКОАЛИЦИОННЫХ ИГР 7.1 Начиная с этого места мы будем рассматривать только конечные бескоалиционные игры, т.е. игры, в которых каждый игрок имеет конеч- ное множество стратегий. Переход от теории конечных бескоалиционных игр к теории бесконечных бескоалиционных игр напоминает переход от теории матричных игр (гл. 1) к теории бесконечных антагонистических игр (гл. 2), но является более громоздким. На этом пути довольно естест- венно получаются доказательства теорем существования ситуаций равнове- сия для бесконечных бескоалиционных игр, но нахождение ситуаций равно- весия в таких играх удается ввиду технических трудностей лишь в отдель- ных, узких и пока еще немного численных случаях. 7.2. Уже рассмотрение антагонистических игр показывает, что большое число таких игр, и в том числе конечных, матричных игр имеет ситуации равновесия не в исходных, чистых стратегиях, а лишь в обобщенных, смешанных стратегиях. Поэтому и для общих, неантагонистических бес- коалиционных игр естественно искать ситуации равновесия именно в смешанных стратегиях. Введем с этой целью понятие смешанного расширения бес- коалиционной игры. Пусть Г= (/, {#,} ,е/ > (7.1) - произвольная конечная бескоалиционная игра. Для определенности примем, что игрок i в игре из (7.1) имеет гщ стратегий. Набор чисел 0^1,, тп) иногда называется размерами или форматом игры. Пусть — произвольная смешанная стратегия игрока z, т.е. некоторое вероятностное распределение на множестве чистых стратегий xf. Вероят- ность, которую распределение приписывает конкретной чистой страте- гии Xj, будем обозначать через X; (xz). Множество чистых стратегий игрока z, для которых Xi (х^ > 0, называется спектром смешанной стратегии Xt (ср. п. 8.5 гл. 1) и обозначается через supp Xt. Множество всех смешанных стратегий игрока i Е/ будем обозначать через X/. Как и в случае антагонистической игры, смешанные стратегии игрока z можно понимать как задаваемые своими барицентрическими координа- тами точки (пц — 1)-мерного симплекса. Заметим, что этот симплекс является компактом. 7.3. Пусть каждый из игроков i Е/ применяет свою, смешанную страте- гию Хь т.е. выбирает свои чистые стратегии х7- с вероятностями Xz (xf). Пусть, кроме того, смешанные стратегии всех игроков 1,. . ., п как вероят- ностные распределения независимы в совокупности, т.е. веро- ятность появления каждой из; ситуаций х = (д^ , . . . , xfl) есть произведение вероятностей выборов составляющих ее стратегий Х} (Xj),..., Хп(хп). Таким образом, мы приходим к вероятностному распределению X на множестве всех ситуаций х, задаваемому соотношениями X (х ) = X (х t, . . . , х f t) = X i (x!) X . . . X „ Xn (x „ ) для всех ситуаций в игре Г. Такого рода вероятностные распределения X 168
называются ситуациями игры Г в смешанных стратегиях. Множество всех ситуаций Г в смешанных стратегиях обозначается через X. 7.4. Ситуация игры Г в смешанных стратегиях реализует различные ситуации с некоторыми вероятностями. Поэтому значение функции выиг- рыша каждого из игроков оказывается случайной величиной. В качестве значения функции выигрыша на ситуации в смешанных стратегиях в тео- рии игр принимается математическое ожидание этой случайной величины: xGX = S ... S Hi(x1,...,xn)Xi(xl)X ... XX„(x). (7.2) Ex, X nE:Xn Заметим попутно, что W4 ) = = S ... S S ... S Я,(хИх?) П Xk(xk). Xj^x, xj^iSXj_i Xj+lexl+l x„Gx„ k*j (7.3) Пусть X? — произвольная смешанная стратегия игрока j в игре Г. Умно- жив неравенство (7.3) на Х°(х°') и просуммировав по всем х° Gx°, мы получаем ввиду (7.2) S НЛХ IIх?)Х9(х.) = Ht(X IIX?). (7.4) х;еХ/ 7.5. Определение. Игра Г = <Z, {X,} Zez> {^Izez >, (7.5) в которой множество игроков есть /, множество стратегий каждого игро- ка i есть X/, а функция выигрыша определяется равенством (7.2), назы- вается смешанным расширением игры Г из (7.4). □ 7.6. В бескоалиционных играх возможен такой же переход к смешанным стратегиям, как и отмеченный в п. 9.3 гл. 1 и в п. 4.5 гл. 2 для антагонисти- ческих игр. Именно, если для любой чистой стратегии xf игрока i имеет место Hj (Xi II х^ <д9 то и для любой его смешанной стратегии Х\ выпол- няется Hj (Xi II X'i) <лт Особенно ясно это видно, если обратить внимание на формулу (7.4). Справедливость этого вытекает из равенств (7.2) и (7.3) с помощью стандартного перехода к смешанным стратегиям. 7.7. Далее нам понадобится следующее утверждение. Лемма. Какова бы ни была ситуация в смешанных стратегиях X = = (Ха ,. .., Хл), любой игрок i имеет такую чистую стратегию X/, что одно- временно выполняются два неравенства: У,(х?)>0, Я,(Х11х?)<Я,-(Х). (7.6) Доказательство. Предположим, что для всех чистых стратегий х{ игрока z, для которых выполняется (7.6), имеет место неравенство Hi (XII х^ > (X). Тогда для всех таких стратегий Hi(X II хдХ^) > Hi(X)Xi(Xi). (7.7) 169
Полученное неравенство имеет место для всех тех xz, для которых Xz (xz) > > 0. Для всех остальных xi9 очевидно, будет Ht(X IIxz)Xz(xz) = Hi(X)Xi(xi) = 0. (7.8) Складывая все неравенства (7.7) и все неравенства (7.8), мы осуществим суммирование по всем чистым стратегиям xz игрока i и получим 2 /7,(Х11хг.)Х,(хг)> 2 Я;(Х)Х,(х,), x,Exz xfGxz или, используя (7.2) и (7.3), Ht (X) > Яг- (X), чего не может быть. Полученное противоречие указывает на существование нужной нам чистой стратегии игрока i. □ 7.8. На смешанные расширения распространяются отношения аффинной эквивалентности и изоморфности бескоалиционных игр. Теорема. Если бескоалиционалъные игры аффинно эквивалентны, то их смешанные расширения также аффинно эквивалентны. Распространение на случай бескоалиционных игр доказательства теоремы п. 9.7 гл. 1 предоставляется читателю. □ 7.9. Продолжение изоморфизма Г^яГна смешанное расширение Г игры Г состоит в следующем. Пусть i — игрок в игре Г, a Xz — его смешанная ^стратегия. Тогда я-обра- зом Xi будем считать смешанную стратегию ттХ^ игрока я/, для которой (яХг)(яхг) = Xi(Xi) для любой стратегии xz G xz. (7.9) Справедлива следующая теорема. Теорема. Если я - изоморфизм игр Г и Г', то его продолжение на смешанное расширение Г игры Г является изоморфизмом игры Г на смешанное расширение игры Г'. Доказательство очевидно. □ § 8. СИТУАЦИИ РАВНОВЕСИЯ В СМЕШАННЫХ СТРАТЕГИЯХ 8.1. Примем следующее терминологическое соглашение. Определение. Приемлемые ситуации и ситуации равновесия в смешанном расширении Г из (7.4) бескоалиционной игры Г из (7.1) называются приемлемыми ситуациями и соответственно ситуациями равно- весия исходной игры Г в смешанных стратегиях. □ Таким образом, ситуация I* является ситуацией равновесия в смешан- ных стратегиях в игре Г, если для любого игрока z и любой его смешанной стратегии Х^ имеет место неравенство ЯДУ* ИУ£)<ЯДУ*). (8.1) Как и в случае антагонистических игр, вместо смешанных стратегий игроков часто говорят просто об их стратегиях, оговаривая, напротив, чистоту появляющихся стратегий во всех тех случаях, когда это необходи- мо. Это соглашение распространяется также на ситуации в смешанных стратегиях и, в частности, на ситуации равновесия в смешанных стратегиях. 8.2. Весьма полезной является следующая теорема. Теорема. Для того чтобы ситуация X* в игре Г была ситуацией равновесия этой игры (в смешанных стратегиях), необходимо и достаточно, 170
чтобы для любого игрока i и любой его чистой стратегии xi выполнялось неравенство Н.(Х* llxz)^7/z(y*). (8.2) Доказательство. Необходимость очевидна, так как чистая страте- гия является частным случаем смешанной и, таким образом, каждое из неравенств (8.2) есть частный случай соответствующего неравенства (8.1). Для доказательства достаточности следует воспользоваться переходом к смешанным стратегиям, как это было описано в и. 7.6. □ 8.3. Ввиду того, что бескоалиционная игра является подыгрой своего смешанного расширения, к этой паре игр применима теорема о независи- мости от посторонних альтернатив. • Теорема. Если г =<л{х,}/е/,(я(}/е/> - смешанное расширение бескоалиционный игры ТО ^(Г)=хП^ДГ), (8.3) <£(Г) = хАЙ(Г), (8.4) Доказательство аналогично доказательству теоремы п. 9.6 гл. 1 и выте- кает непосредственно из теоремы п. 5.4 о независимости от посторонних альтернатив. □ § 9. ТЕОРЕМА НЭША 9.1. Дж. Нэшем было доказано существование ситуации равновесия в смешанных стратегиях для любой конечной бескоалиционной игры. Теорема. В каждой бескоалиционной игре существует хотя бы одна ситуация равновесия (в смешанных стратегиях}. Доказательство. Если игрок i имеет в игре Г гщ чистых страте- гий, то множество Xz- всех его смешанных стратегий, как уже неоднократно отмечалось, можно представлять как (mz — 1)-мерный симплекс. Поэтому всякую ситуацию Х = (ХЬ...,Х„) (9.1) в смешанных стратегиях можно рассматривать как точку в декартовом произведении X = Хх X . . . X Хи симплексов смешанных стратегий. Это декартово произведение, очевидно, является выпуклым и компактным подмножеством евклидова пространства размерности + ...+ тп - п. Положим теперь для произвольной ситуации X и любой чистой стратегии х^ Е х, игрока i = ф'(Х) = max {О, Я,(Х || х,0)) - Я,(Х)} . (9.2) Очевидно, все вводимые таким образом функции принимают только неотрицательные значения. 171
Функция <pJ. показывает увеличение выигрыша игрока i в ситуации X, происходящее за счет замены его стратегии , входящей в эту ситуацию, некоторой чистой стратегией \ Уменьшения же выигрыша функция не показывает, ибо в этом случае ее значение будет равно нулю. Составим теперь для всевозможных i = 1, ..., п и j = 1, . .., mj числа вида . (9.3) Все эти дроби, очевидно, неотрицательны, а каждая сумма вида А ----------------- 1 + 2 7 = 1 равна единице. Следовательно, при фиксированных X и i дроби (9.3) можно понимать как вероятности соответствующих чистых стратегий хУ > игрока i. Тем самым каждый набор таких дробей для всех чистых стратегий х^ Е хг- можно понимать как смешанную стратегию игрока i. Так как дроби (9.3) составляются для каждого игрока i ЕI, их совокуп- ность определяет систему смешанных стратегий всех игроков, т.е. некото- рую ситуацию в игре Г. Эта ситуация зависит от исходной ситуации X, являясь ее функцией. Будем обозначать ее поэтому через ф(Х). Очевидно, что функция ф осуществляет преобразование замкнутого выпуклого и ограниченного множества всех ситуаций X в себя. Кроме того, эта функция является непрерывной функцией ситуации. Действительно, каждая компонента ситуации, являющейся значением функ- ции i//, есть дробь вида (9.3). В числителе этой дроби первое слагаемое есть сама компонента ис- ходной ситуации и поэтому зависит от нее непре- рывно. Второе слагаемое, как видно из (9.2), есть комбинация из линейных функций Hj (X) и Hi(X II х/^), постоянной 0 и операции взя- тия максимума (то, что функция шах { 0, х } является непрерывной, легко усмотреть из ее графика на рис. 3.2; ср. также лемму п. 10.5 (X) также является непрерывной функцией X. гл. 1). Следовательно, Значит, числитель дроби (9.3) есть непрерывная функция X. Наконец, знаменатель этой дроби непрерывен и притом не может приближаться к нулю (его значения не меньше единицы). Таким образом, функция ф является непрерывной. На основании сказанного мы находимся в условиях известной теоремы Брауэра о неподвижной точке*), согласно которой непрерывное преобра- зование ф выпуклого компактного подмножества конечномерного прост- 172
ранства в себя должно иметь хотя бы одну неподвижную точку, т.е. такую точку Х°, для которой i//(AT°) = • Пусть XQ — одна из таких неподвиж- ных точек. Это значит, что для всех i и / (9-4) mi 1 + S V’/^0) Вспомним теперь, что на основании леммы п. 7.7 для любого игрока /должна найтись такая его чистая стратегия х?, что Х?(х°) > О и $Q.(X®) = 0. Для этой стратегии равенство (9.4) записывается как %о(уо) = Л^)) + ^(Х0) , mi 1 + Д ^/(У°) откуда пЧ Х?(х°) + Х?(х°) Д ^(У0) = Х?(х^) + ^°(%0). Отбрасывая равные слагаемые справа и слева и вспоминая, что второе сла- гаемое справа по самому выбору стратегии х(- обращается в нуль, получаем У°(х°) X ^7(Х°) = 0. 1 i = 1 1 Но первый сомножитель слева, опять-таки по выбору стратегии х(-, от- личен от нуля. Следовательно, X <pi(XQ) = 0. А так как все числа / = 1 1 ^(Х°) неотрицательны, каждое из них должно обращаться в нуль: (Х°) = 0. Следовательно, в нашем случае в равенстве (9.2) под знаком максимума положительных чисел нет, г.е. Hi(X° \\xl)^Hi(X^. Так как это неравенство справедливо для любого игрока i и любой его чистой стратегии х^*, теорема 8.2 дает нам, что ситуация Х° является ситуацией равновесия. □ Другое доказательство теоремы Нэша см. в приложении 2. 9.2. Заметим, что принципиальная важность теоремы Нэша ограничи- вается вопросом существования диуации равновесия. Непосредственно применять ее для нахождения к.кнх ситуаций не удается, так как сама *> См., например. Люстерник Л.А., (оболов В.И. ’’Элементы функционального жализа”, М., Наука, 1965, с. 502 — 507. ’73
по себе она не является конструктивной: теорема Брауэра не содержит никаких указаний на способ фактического нахождения неподвижной точ- ки; гем самым и теорема Нэша, которая опирается на теорему Брауэра самым существенным образом, не дает путей к нахождению ситуаций рав- новесия. Вместе с гем, все методы приближенного нахождения непод- вижных точек в непрерывных отображениях компактов (особенно выпук- лых) в себя могут быть использованы для приближенного решения ко- нечных бескоалиционных игр. < 10. ДОПОЛНЯЮЩАЯ НЕЖЕСТКОСТЬ ЮЛ. Ряд свойств приемлемых ситуаций и седловых точек в антагонисти- ческих играх переносится на приемлемые ситуации и на ситуации равнове- сия в произвольных бескоалиционных играх. К их числу относится следую- щий аналог теоремы о ’'дополняющей нежесткости” (см. пп. 17.2,17.3 гл. 1). Теорема. Если смешанная стратегия Xj игрока i входит в прием- лемую для него ситуацию X и для некоторой его чистой стратегии х® имеет место строгое неравенство Н;{Х || х? ) < Я/(Х), то X,- (х® ) = 0. Доказательство этой теоремы по существу не отличается о г доказательст- ва аналогичной теоремы п. 17.2 гл. 1. Именно, предположим, что Х,(х® ) > 0. Тогда //,(.¥ || х° )Х(х° )<Н(Х >Х(х°). (10.1) Вместе с тем для всех чистых стратегий игрока /, отличных от х®, должно быть по определению ситуации равновесия Hj(X || xj ^НрХ) и тем самым Я, (А || х, )X(xt) <. Е,{ X Ц¥(х, ). (10.2) Суммируя по всем хг- G Ал,- и прибавляя ( 10.1), мы, как и при рассужде- ниях, встретившихся нам в ходе доказательства леммы п. 7.7, получаем Н t (X) < Н j (X), чего не может быть. □ 10.2 . Доказанную теорему можно сформулировать и в несколько изме- ненной (’’контрапозитарной”) форме: если равновесная стратегия Xt игрока i входит в ситуацию равновесия X и чистая стратегия х° принадле- жит спектру смешанной стратегии Л,- , то Н,(X II л-°)=//,-( ¥). (10.3) § 11. СИММЕТРИЧНЫЕ СИТУАЦИИ РАВНОВЕСИЯ 11.1. В теореме п. 5.2. была зафиксирована инвариантность множеств приемлемых ситуаций, а также множеств ситуаций равновесия при автомор- физмах игры. Оказывается, что при переходе к смешанным стратегиям это утвержде- ние можно существенно усилить. Оп ределение. Ситуация X в смешанных стратегиях в бескоали- ционной игре Г называется симметричной, если для любого автоморфиз- ма я игры Г имеет место пХ = X. □ Содержательно симметричные ситуации равновесия являются оптималь- ными не только в смысле общей для всех ситуаций равновесия устойчиво- сти, но и в смысле справедливости; в таких ситуациях игроки, равноправно 174
входящие в игру согласно ее условиям, фактически оказываются в одина- ковом положении (и, в частности, при одинаковых выигрышах). Сейчас мы докажем существование симметричных ситуаций равновесия в конечных бескоалиционных играх. 11.2. Л е м м а. Множество всех симметричных ситуаций (в смешанных стратегиях) в конечной бескоалиционной игре Г из (1.1) является непустым, выпуклым и замкнутым. Доказательство. Непустота множества всех симметричных ситуа- ций в игре Г 'следует из того, что ему принадлежит ситуация X = = (Xi, ..., Хп), для которой Xj(Xi) = l/m, при z’G7 и .X/Gxf. Действительно, в этом случае при любом автоморфизме л яХДях^) = = \lm^t, а, как было замечено в конце п. 2.4, = mh Далее, при симметричных ситуациях X9,. Хп й X G [0, 1] мы имеем я(ХХ/+(1 -Х)Х")(ях,) = = Х(лХ'(юс,)) + (1 - X)(лХ,")(пх,) = = XX'i(Xi) + (1 - Х)Х"(х,) = (ХХ/+ (1 - Х)%" )(х;), т.е. множество всех симметричных ситуаций оказывается выпуклым. Замкнутость этого множества устанавливается аналогично, так как авто- морфизм, очевидно (или, если угодно, в силу формулы (7.9)), является непрерывным отображением множества ситуаций на себя. .□ 11.3. Т е о р е м а. Конечная бескоалиционная игра имеет симметричные ситуации равновесия. Доказательство. Возьмем отображение ф из доказательства тео- ремы Нэша (см. п. 9.1) и покажем, что оно преобразует множество всех симметричных ситуаций в себя. Пусть X — симметричная ситуация, а я — произвольный автоморфизм игры. Из (9.2) следует, что ^”'р'(л%) = тах{О.Ял,(яАг|| тгх‘) -Н^-пХ)} = 7Г i = тах{0,Я,(* II х/) -Я,-(Х)} = </''(%) i Поэтому мш)(4)= = Хл,.(я^)+^ЧяХ)(1 + S = 7ГХ f Е. X I 7Т1 = Хг.(4) + ^’(%)(!+ S ^'(Х))-1 -(фХ,)(х’), 175
т.е. если ситуация X симметричная, то такой же оказывается и ситуа- ция ^Х. Таким образом, мы имеем дело с непрерывным отображением компакта симметричных ситуаций в себя. По теореме Брауэра это отображение имеет неподвижную точку, которая, как это было выяснено в ходе теоремы Нэша, является ситуацией равновесия. □ Заметим, кстати, что эта теорема также была доказана Дж. Нэшем. § 12. БИМАТРИЧНЫЕ ИГРЫ 12.1. Задача нахождения ситуаций равновесия бескоалиционной игры Г формата (т1? ... ,тл) фактически состоит в решении системы тх + . . . ... + тп неравенств вида (8.2) с . .. тп ограничениями неотрицатель- ности и и ограничениями нормирования. Математически это сложно и громоздко. Лишь для отдельных сравнительно простых классов беско- алиционных игр ход решения этой задачи поддается элементарному описанию. Одним из таких классов являются конечные бескоалиционные игры двух лиц. Пусть в такой игре игрок 1 имеет т чистых стратегий, а игрок 2 — п стратегий, и в каждой ситуации (z,/) игрок 1 получает выиг- рыш ау , а игрок 2 — выигрыш by . Тогда значения обеих функций выиг- рыша игроков естественно расположить в виде пары матриц Поэтому такие игры называются биматричными. Биматричная игра с матри- цами выигрышей А и В обозначается через Г (Я, Я) или через Гл в. 12.2. Смешанные стратегии в биматричных играх, как и в матричных иг- рах, естественно понимать как векторы, составляющие фундаментальный симплекс. Если X и Y — соответственно векторы, описывающие смешанные стратегии игроков 1 и 2, то, как легко видеть, Hi(X, Y)=XAYT. H2(X,Y) = XBYT. Определение ситуации равновесия для случая биматричной игры приоб- ретает следующую формулировку. Ситуация (X, Y) в биматричной игре с матрицами выигрышей А и В является равновесной, если А(. YT g XAYT, те, (12.1) XB.f XBYT, (12.2) Очевидно, при В = — А биматричная игра превращается в матричную, а соотношения (12.1) и (12.2) — соответственно в At. Y1 <. XAY7. / 7 (12.3) -XA.j £ XAY , Последнее неравенство равносильно А\4У7^ XA.j , что вместе с (12.3) дает нам известное определение седловой точки в матричной игре. 176
§ 13. РЕШЕНИЕ БИМАТРИЧНЫХ ИГР 13.1. Анализ 2 X 2-матричных игр в §17 гл. 1 проводился путем составления точного описания множеств ситуаций, приемлемых для каждо- го из игроков (это описание проводилось на геометрическом языке, но, очевидно, могло бы быть представлено и в чисто алгебраическом виде), и нахождения пересечения этих двух множеств. В принципе этот способ описа- ния ситуаций равновесия мог бы быть применен и к матрич- ным играм произвольного формата. Однако он пока еще не нашел достаточ- но наглядных средств выражения, которые сделали бы его конкурентоспо- собным среди других методов анализа матричных игр. Вместе с тем, как мы сейчас увидим, применение описанного способа к анализу биматричных игр и даже к нахождению их решений, правда, весьма неэффективному, представляется вполне целесообразным. 13.2. Пусть Г - Г (Л, В ) — тХ и-биматричная игра с матрицами выигры- шей игроков состоит из всех ситуаций (X, Y), для которых выполняется система неравенств AhYT<XAYT, (13.2) Взяв в качестве образчика рассуждения из § 17 гл. 1, будем рассматри- вать случаи, соответствующие тому или иному спектру стратегии X. 13.3. Пусть supp X — sx С х. Тогда в (13.2) для i G по свойству до- полняющей нежесткости (см. п. 10.1) должно выполняться точное равен- ство. Отсюда следует, что для любых двух смешанных стратегий ХТ и Хп, обладающих одним и тем же спектром и дающих в паре с одной и той же стратегией Y приемлемые ситуации (X1, У) и (X”, У), должно быть X'AYT = X"AYr. Таким образом, на множестве X(sx) всех стратегий игрока 1 со спект- ром sx величина ХА YT не зависит от X, Этот факт является для дальнейшего решающим. Во-первых, из него следует, что вместе с любой приемлемой для игрока 1 ситуацией (X, Y) таковой же является любая ситуация (Х\ Y), где sxr s¥’ те- ситуаций входят (или не входят) в i (Г) целыми ’’блока- ми” вида (X(s), У). Во-вторых, отсюда же следует, что на X(s^) выражение ХА Y Т представ- ляет собой единую линейную форму от У, и на X(sA) система (13.2) ока- зывается системой именно линейных (а не билинейных!) неравенств, и множество ее решений составляет выпуклый многогранник, который зави- сит опять-таки не от конкретной стратегии X, и лишь от ее спектра sY = s. Обозначим этот многогранник через (s). 12.Н.Н. Воробьев 177
Попутно обратим внимание на то, что каждый из таких многогранников (s) зависит только от матрицы А (и не зависит от матрицы В). Значит, ситуации входят (или не входят) в ^1(Г) целыми произведе- ниями X(s) X (s). Иными словами, W) = и X(s)X^t(s). S С X Очевидно, число произведении в этом объединении не может превосходить 2т — 1 (s может быть любым непустым подмножеством х), а множество i ( Г ) зависит только от матрицы А. В силу тех же причин W) = и Y(t)X^2(t), t С у где Y(t) — множество стратегий игрока 2, имеющих данный спектр t, а (О — множество решений X системы неравенств XB.j^XBYT, (13.3) где supp Y = t (как и выше, решение зависит здесь не от самой стратегии у, а лишь от ее спектра). Здесь в объединение входит не более 2п — 1 произве- дений. Множество ^2 (Г) определяется только матрицей В. Окончательно мы получаем ^(Г) = ^(Г)П^2(Г) = = и X(s)X.^i(s)n и f<f2(t)X Y(t) = S С X t С у = и (X(s)X ^(s))n^2(t))X(Y(t) = S С X tcy = и (X(s)n^1(t))X(Y(t)O®1(s)). (13.4) S с X t с у 13.4. При любом s С х нахождение многогранника ^i(s) состоит в решении системы линейных неравенств, т.е. в выполнении конечного числа рациональных (арифметических) операций над элементами матрицы А. Точно так же выполнением конечного числа рациональных операций над элементами матрицы В может быть найдено множество $2>(t ) при любом t Су. Следовательно, таким же конечно-рациональным путем находится каж- дое из пересечений X(s) rV(f2 (t) и Y(t) О ®i(s), и потому, в силу отмечен- ной конечности множества вариантов для спектров s и t и согласно форму- ле (13.4), - и все множество й’(Г). 13.5. Хотя при сколько-нибудь больших значениях чисел т и п описанная процедура нахождения приемлемых (а по ним — и равновесных) ситуаций в биматричной игре является весьма громоздкой, при т = п = 2 для спектров стратегий каждого игрока оказывается не более трех вариантов, и приве- денйый способ представляется реально выполнимым геометрически. Мы займемся им в следующем параграфе. 178
§ 14. 2 X 2-БИМАТРИЧНЫЕ ИГРЫ 14.1. Описываемая далее схема анализа 2 X 2-биматричных игр формаль- но является частным случаем рассуждений предыдущего параграфа, и множество всех ситуаций равновесия в такой игре можно описать на осно- вании формулы (12.4). Однако, как это нередко бывает, в частном случае 2 X 2-биматричных игр представляется целесообразным не пользоваться окончательной формулой,- выведенной для общего случая, а проводить каждый раз все приведшие к ней рассуждения применительно к конкретной рассматриваемой игре. Фактически анализ 2 X 2-биматричных игр будет проводиться по той же схеме, что и описанный в § 17 гл. 1 анализ 2 X 2-матричных игр. Как мы увидим, несмотря на существенно большее разнообразие вариантов (вместо четырех параметров в матричном случае здесь их оказывается восемь!), анализ не станет от этого практически ни более сложным, ни даже более громоздким. 14.2. Мы будем рассматривать 2 X 2-биматричную игру с матрицами выигрышей flu А = #2 1 «12 ’ #2 2 J (14.1) соответственно игроков 1 и 2. Как и в случае 2 X 2-матричных игр, смешан- ные стратегии X и Y игроков полностью описываются вероятностями ? и р выбора ими своих первых чистых стратегий (вторые чистые стратегии выбираются, очевидно, с вероятностями 1 — £ и 1 — т?). Поэтому ввиду О £, 1 каждая ситуация в смешанных стратегиях в 2Х 2-биматричной игре геометрически представляется как точка на единичном квадрате (ситуации в чистых стратегиях суть вершины этого квадрата) . Как и в случае матричных игр, мы опишем порознь множества приемле- мых ситуаций для каждого из игроков, изобразим эти множества геометри- чески на единичном квадрате ситуаций, а затем найдем их пересечение. 14.3. Начнем с описания ситуаций, приемлемых в игре Г (А, В) для игрока 1. Приемлемость ситуации (X Y) для игрока 1 в игре Г (Л. В) означает, что - A, ,Yr^XAYr, (14.2) A2.YT^XAYT. (14.3) Подчеркнем, что эти условия приемлемости никак не связаны с матрицей В выигрышей игрока 2. Поэтому они будут одинаковыми для всех би матрич- ных игр с одной и той же матрицей выигрышей игрока 1; в частности, они совпадают с аналогичными условиями для случая матричной игры Гл. Поэтому и множество ситуаций, приемлемых для игрока 1 в игре Г (А, В), будет совпадать с множеством приемлемых для него ситуаций в игре ГА. Как было установлено в пп. 18.3 — 18.5 гл. 1, множество ^1(Г) всех приемлемых для игрока 1 ситуаций в игре ГА (а тем самым и в игре Г (Л, В)) есть либо трехзвенный (возможно, вырожденный) зигзаг, либо же квадрат всех ситуаций. 12 179
Именно, полагая, как и при анализе матричных игр, С~а1Х - ах 2 ^21 + + я22, а = #2 2 - #21, мы получим, что при С Ф 0 множество (Г) всех приемлемых для игрока 1 ситуаций состоит из точек трех типов: (1,т?), где т?С2^а, (0,77), где т?С^ а, (5, П), где т?С= а и 5 <= [0, 1J. При С = 0 и а О это множество будет иметь вид (1,т?), если а22 >fli2, (0,77), если а22 <аХ2. Наконец, при С = 0 и а = 0 будет ^т(Г) = XX Y, т.е. приемлемыми для игрока 1 будут все ситуации. 14.4. Перейдем к описанию множества ^(Л, В) всех ситуаций, приемле- мых в биматричной игре Г (Л, В) для игрока 2. Во-первых, это можно *сделать, продолжив проведенную в предыдущем пункте аналогию с матричными играми (см. п. 18.6 гл. 1), причем в нера- венствах (18.14) вместо матрицы Л следует рассматривать матрицу —В. Во-вторых, это можно сделать, перейдя в рамках игры Г (Л, В) от игро- ка 1 к игроку 2 и заменив в связи с этим матрицу Л в рассуждениях п. 14.3 и соответственно в неравенствах (14.2) и (14.3) на матрицу Вт. В обоих случаях мы получаем систему неравенств ХВ.! < XBYT, XB_2^XBYr. (14.4) (14.5) В результате оказывается, что (А, В) = (- В) является, подобно (А, В) = (Л) , трехзвенным (возможно, вырожденным) зигзагом или же множеством всех вообще ситуаций. Именно, положим D = 1 - bl2 - b2 1 + b22, j3 = b22 b2i-Тогда при D Ф 0 множество 2(Г) будет состоять из точек трех типов: (5,1), где 5#^ (5,0), где где 5^ = /3 и т? G [0, 1]. При D = 0 и /3^=0 это множество будет иметь вид (5, 1), если b22 >Z?21, (5,0), если b22<b2l, а при D- 0 и (3 = 0 — совпадать с множеством всех ситуаций X X Y. 14.5. Естественно, что в случае биматричной игры Г для взаимного расположения множеств ^1(Г) и $2(Г) может представиться существен- но больше комбинаций, чем в случае матричной игры. В частности, в отличие от случая матричной игры, зигзаги <^1(Г) и ^2(Г) могут быть не только одинаковой (ср. конец п. 18.6), но и проти- воположной ориентации (рис. 3.3, а и б) . В первом случае ^(Г) = (Г) А А г^2(Г) состоит из единственной точки, а во втором — из трех точек. 180
Ордината i?* горизонтального звена зигзага в ^(Г), как и случае матричной игры Гл (см. п. 18.5 из гл. 1) , описывается формулой #22—012 П = ------------------- . 011 “ 01 2 — 02 1 + 02 2 Выражение же для абсциссы вертикального звена зигзага в ^2 (Л В) получается из формулы (18.12) гл. 1 путем замены в ней каждого Рис. 3.3 на соответствующее —Ьд (фактически знаки в дроби останутся без измене- ний) . Таким образом, Ь22 — Ъ2 1 Г =---------------------- . ^11 — ^12 — Ъ2 \ + Ъ22 Сравнение этих выражений с формулами (18.12) и (18.18) из гл. 1 показывает, что в рассматриваемой биматричной игре в условиях ситуации равновесия во вполне смешанных стратегиях поведение игрока 2 совпадает с поведением игрока 2 в матричной игре с матрицей выигрышей А, а пове- дение игрока 1 — с поведением игрока 2 в матричной игре с матрицей выигрышей В. Таким образом, описанное равновесное поведение игроков оказывается ориентированным не столько на максимизацию собственного выигрыша, сколько на минимизацию выигрыша противника. Так ’’антагонизм поведе- ния” может возникать и при отсутствии’’антагонизма интересов”. 14.6. Обратим, наконец, внимание на следующее примечательное обстоя- тельство . Пусть зигзаги приемлемых ситуаций для 2 X 2-биматричной игры Г (А, В) имеют вид, представленный на рис. 3.3 а или б (или же зеркальный по отношению к одной из этих картинок). Если теперь ’’слегка” изменить матрицы А и В, то и зигзаги ’’пошевелятся чуть-чуть”, не изменив ни своей общей формы, ни взаимного расположения. В частности, их пересечение будет по-прежнему состоять из одной точки или из трех. В этом месте мы встречаемся с весьма общей и глубокой теоретико-игро- вой закономерностью: если конечная бескоалиционная игра Г носит ’’общий” характер, т.е. форма и расположение множеств приемлемых ситуа- ций (Г) для каждого из игроков не изменяется при достаточно малом изменении значений функций выигрыша игроков, то множество ^(Г) ситуаций равновесия в этой игре (являющееся пересечением множеств $/(Г) ) конечно и насчитывает нечетное число точек. 181
§ 15. ПОЧТИ АНТАГОНИСТИЧЕСКИЕ ИГРЫ 15.1. Отдельные классы биматричных игр (и в том числе 2 X 2-игр) поддаются более простому и содержательному анализу, чем те общие рас- смотрения, которые были изложены в предыдущем параграфе. Одним из таких классов являются антагонистические игры, рассмотрен- ные в гл. 1. Более общий класс составляют почти антагонистические игры. Определение. Будем называть почти антагонистической игрой биматричную игру с матрицами выигрыша Л и В, идя которых из а^ < akt или а^ = akl следует соответственно bIf- > bki или by -bkh □ В почти антагонистическую игру превращается всякая матричная игра, если в ней начать оценивать выигрыш игроков по различным (но монотон- ным!) шкалам полезности. В положении игрока 1 в почти антагонистичес- кой игре оказывается, например, сторона, стремящаяся нанести ущерб противнику и правильно сравнивающая его ущерб в различных ситуациях, но дающая размеру этого ущерба, вообще говоря, неверную количествен- ную оценку. 15.2* .Проведем анализ почти антагонистической 2 X 2-игры. Не нарушая общности (т.е. переходя, если нужно, к аффинно эквива- лентным играм и отвлекаясь от некоторых случаев вырождения), мы можем считать, что матрицы выигрышей в рассматриваемой игре суть 1 ^2 1 #22 о 1 А = О ' &2 2. Если я2 2 < #21, то по условию почти антагонистичности должно быть Ь22 > Ь21, и вторая чистая стратегия игрока 2 доминирует его первую чис- тую стратегию. Значит, все приемлемые для него ситуации имеют вид (£, 0). Отсюда следует, что ситуациями равновесия в игре будут либо (1, 0) ,либо (0, 0), либо все ситуации вида (£, 0), смотря по тому, будет ли а22 > 0, я2 2 < 0 или, наконец, а2 2 =0. Пусть теперь а22 ^а219 так что по почти антагонистичности b22 ^Ь21, Тогда для характеристик игры £ * и т? * мы имеем Ъ22 - Ь21 — 1 — Ь2 1 + Ь2 2 а2 2 1 ~ 02 1 + 02 2 15.3. В качестве примера почти антагонистической игры приведем следую- щий вариант борьбы за рынки. Небольшая фирма (игрок 1) намерена сбыть крупную партию товара на одном из рынков, контролируемых другой, более крупной фирмой (игрок 2). Для этого она может предпринять на одном из рынков соответ- ствующие действия (например, развернуть рекламную кампанию) . Господ- ствующий на рынках игрок 2 может по питься воспрепятствовать этому, приняв на одном из рынков предупредительные меры. Игрок 1, не встре- тивший на рынке препятствий, захватывает его; встретившись же с сопро- тивлением — терпит поражение. Выборы фирмами рынков являются их стратегиями. Предположим, что проникновение игрока 1 на первый рынок более выгодно для него, чем проникновение на второй, но борьба за первый 182
рынок требует больших средств. Например, победа игрока 1 на первом рынке принесет ему вдвое больший выигрыш, чем на втором, но зато пора- жение на первом рынке полностью его разоряет (проигрыш равен 10), а игрока 2 избавляет от конкурента (выигрыш равен 5) . Описанная биматричная игра может быть задана матрицами выигрышей 5-2' -1 1 . -10 2 1 -1 А = , в = Для этой игры, как легко видеть, С = — 14, а----3, т?* - 3/14. Значит, ситуациями, приемлемыми для игрока 1, будут все ситуации вида (0, т?), где 3/14^73^1, (£,3/14), где 0<£^1, (1,7?), где 0 ^.т? g 3/14. Множество всех приемлемых для игрока 1 ситуаций изображено на рис. 3.4. Далее мы имеем: D = 9, 0 = 2, %* = 2/9, так что приемлемыми для игрока 2 будут все ситуации вида где 0<£<2/9, где 2/9^£<И. «,0), (2/9,7?), где г? произвольно, в, 1), Их множество изображено на рис. 3.4 пунктиром. Зигзаги приемлемых ситуаций пересекаются в единственной точке (2/9, 3/14), которая и оказывается единственной ситуацией равновесия. § 16. ’’СЕМЕЙНЫЙ СПОР” 16.1. В п. 2.6 введения рассматривалась игра под названием’’семейный спор”. В этой 2 X 2-биматричной игре матрицами выигрышей игроков явля- ются О 1 А = 2 В = L0 Решение данной биматричной игры в соответствии со сказанным в § 13 дает нам С = 3, а = 2, rj* = 2/3. Поэтому ситуации, приемлемые для игрока 1, сос- 183
тавляют зигзаг, охватывающий следующие точки: (О,??), где 0<?7<2/3, (§,2/3), где £ произвольно, (1,??), где 2/3^??^ 1. Аналогично, Z) = 3, /3 = 1, £ * = 1/3. Поэтому приемлемыми для игрока 2 будут ситуации (5,0), где 0<?^1/3, (1/3,7?), где ?7 произвольно, Й,1), где 1/3^?^ 1. Как видно из рис. 3.5,данная игра имееттри ситуации равновесия: (0,0), (1,1), (1/3, 2/3). У 1 Рис. 3.5 16.2. Здесь ситуации (0,0) и (1,1) соответствуют одновременному выбору игроками своих вторых или, соответственно, первых чистых страте- гий, т.е. договоренности о достоверных совместных действиях. Обычно так и понимаются всякого рода договоры. Однако в нашем случае имеется еще третья ситуация равновесия, состоя- щая в выборе игроками некоторых вполне определенных смешанных стра- тегий. Формально ее можно считать основой возможного договора в не меньшей степени, чем первые две. Она даже ’’более справедлива”, чем они, поскольку в ней оба игрока получают одинаковые выигрыши: (1/3,2/3) А (2/3,1/3)т = (1/3-, 2/3) В (-2/3, 1/3)г = 2/3. Вместе с тем выигрыши каждого из игроков в этой ситуации равновесия меньше, чем в двух других ситуациях равновесия, где они соответственно равны 1 и 2 в первой ситуации и 2 и 1 — во второй. Так сочетание устойчивости со справедливостью вступает в противоре- чие с сочетанием устойчивости и выгодности. Ясно, что если игроки договорились бы играть оба, скажем, первую чистую стратегию, причем игрок 2 за получение большего выигрыша, чем игрок 1, заплатил бы ему 1/2, то выигрыш каждым полутора единиц можно было бы считать и выгодным, и справедливым. Однако в рамках теории бескоалиционных игр такого рода дележи не рассматриваются. Они изуча- ются в кооперативной теории игр, о которой будет говориться в гл. 4 184
16.3. Очевидно, проведенный анализ биматричной игры ’’семейный спор” с матрицами выигрыша А и В из (16.1) приложим и к более общим бимат- ричным играм, и в том числе к играм Г (Л, В) с матрицами выигрышей При этом,очевидно, в каждой такой игре будут три ситуации равновесия: две в чистых стратегиях, соответственно с выигрышами игроков а и с или Ъ и d, и одна - в смешанных (£ *,??*), где £ * = d/(c + d), 17* = b/(a + b). 16.4. Отметим, однако, специально тот частный случай, когда А = В, т.е. с = с и b = d. Тогда в игре Г(Л, В) интересы игроков полностью совпада- ют. Тем не менее теоретико-игровая природа этого явления сохраняется; в такой игре по-прежнему имеются три ситуации равновесия: две в чистых стратегиях и одна — в смешанных. Ясно, что при а > Ь оптимальная по Парето ситуация равновесия будет состоять из первых чистых стратегий игроков, а при а < b — из их вторых чистых стратегий. Тем самым для игр такого рода представля- ется естественным выбор игроками стратегий, уверенно дающих им наи- большие выигрыши. Соответствующую ситуацию равновесия здесь можно уже рассматривать не только как устойчивый вариант договора между игроками, но даже как результат их независимых самостоятельных действий. Менее тривиальным оказывается положение дел, когда а = Ь. В этом случае игрок 1 при выборе им своей первой чистой стратегии не может быть уверен в выборе игроком 2 также первой чистой стратегии: тот может с такими же основаниями выбрать и вторую стратегию. Таким образом, здесь из всех мотивов действия остается лишь упоминавшийся в п. 14.5 ’’антагонизм поведения”, и разумным для игрока 1 оказывается выбор им смешанной стратегии (для которой здесь £ = 1/2). § 17. ’’ДВА БАНДИТА” 17.1. В п. 2.5 введения была описана игра ’’два бандита”, — 2 X 2-бимат- ричная игра с матрицами выигрышей игроков Г -8 0] Г —8 —101 А = , В- L -10 -1 0 -1 J В этой игре С=1,а = —1,17* = —1; поэтому ситуациями, приемлемыми для игрока 1, будут ситуации вида (1,7?) при произвольном 17 G [0,1]. Аналогично мы получаем, что £* = — 1, так что для игрока 2 приемлемы- ми ситуациями будут ситуации вида (£, 1) при произвольном £. Для наглядности на рис. 3.6 изображены зигзаги, описывающие решения неравенств (14.2) — (14.5) и за пределами сегментов [0,1] - изменения вероятностей £ и ??. Единственной ситуацией равновесия в рассматриваемой игре оказывает- ся поэтому ситуация (1, 1), в которой каждый из игроков должен сознать- ся. В этой ситуации каждый из участников игры теряет 8. 185
Вместе с тем очевидно, что в ситуации (0, 0) каждый игрок теряет лишь по единице. Однако ясно, что ситуация (0, 0) ,в которой каждый выбирает свою вторую чистую стратегию и потери обоих игроков минимальны, явля- ется весьма неустойчивой: каждый игрок, изменяя в ней произвольным образом свою стратегию, увеличивает свой выигрыш. 17.2. Множество 5В (Г) всех реализуемых векторов выигрышей для рассматриваемой игры имеет вид, изображенный на рис. 3.7. Очевидно, здесь ситуации с выигрышами (- 1, — 1), (- 10,0) и (0, - 10) являются оптимальными по Парето. При этом первая из них, в которой получаются 7 Рис. 3.6 наибольшие выигрыши (— 1, — 1), для каждого из игроков лучше, чем равновесная. Противоречие между осуществимостью ситуации, выражаемой в виде равновесности и ее выгодностью, которой соответствуют оптимальность по Парето, имеет по существу ту же природу, что и противоречие между максиминным и минимаксным выигрышами. Поэтому оно должно разре- шаться при помощи аналогичных приемов, состоящих в расширении мно- жеств уже имеющихся стратегий. Следующие два параграфа мы посвятим этому вопросу. § 18. МЕТАСТРАТЕГИИ И МЕТАРАСШИРЕНИЯ 18.1. Смешанные стратегии определяются как случайные величины (см. § 7 гл. 1 и § 4 гл. 2), реализующиеся в виде чистых стратегий. Если говорить более аккуратно (т.е. именно так, как это принято в современной теории вероятностей), смешанная стратегия X игрока, имеющего множест- во чистых стратегий х,понимаемая как случайная величина, есть функция X. £2 -> х. Здесь £2 есть множество ’’элементарных событий”, под которым, как правило, понимают сегмент [0, 1] с обычной мерой Лебега на нем. При этом предполагается, что функция^ обладает в достаточной степени свойст- вом измеримости: для большинства всех практически важных подмножеств (не будем уточнять, для каких именно) х' множества х их Jf-прообразы, т.е. подмножества £2, состоящие из всех техсс, для которых Х(со) Е х', измеримы (по Лебегу). Между прочим, именно такое понятие смешанной стратегии является достаточно корректным и имеет широкое (хотя, разу- меется^ не безграничное) применение. 186
В этом описании наше внимание сейчас привлекает единственный пункт: функциональная природа смешанной стратегии. Чистыми страте- гиями оказываются при этом те смешанные стратегии, которые, понимае- мые как функции, являются постоянными. 18.2. Идея ’’функциональности” расширения понятия стратегии, при котором новые, обобщенные стратегии рассматриваются как функции, а исходные стратегии принимаются константами, оказывается весьма плодотворной в теории игр и не ограничивается введением смешанных (в вероятностном смысле) стратегий. В качестве аргументов,от которых целесообразно рассматривать функ- ции-стратегии, можно, как оказывается, брать стратегии других игроков. Далее мы ограничимся случаем, когда каждый раз рассматриваются функ- ции от стратегии только одного игрока. 18.3. Определение. В бескоалиционной игре Г- </, {х,},,. /,{Я,},е/> (18.D всякая функция вида.Fkj-: хк * х, называется метастратегией игрока i (в ответ на стратегию игрока к) . □ Содержательно всякую метастратегию Fk>i можно понимать как способ выбора игроком i некоторой своей стратегии в зависимости от получае- мой им информации о стратегии, выбираемой игроком к. Если рассмат- ривать ситуацию в бескоалиционной игре как некоторое соглашение, неко- торый договор между игроками, а обычную стратегию — как принимаемое на себя в этом договоре обязательство, то метастратегию можно понимать как своего рода условное обязательство: ”в случае, если игрок к поступит так-то, я, игрок i , выбираю такую-то свою стратегию, а если этак-то, то такую-то”. Очевидно, множество всех метастратегий z в ответ на стратегию к можно изобразить в виде степени множеств х*к . 18.4. Определение. Бескоалиционная игра с тем же множеством игроков I , что и игра Г из (17.1) , называется метаиг- рой над игрой Г, или метарасишрением игры Г, если при некоторых /, к G I г xz для i~F j, уЯ I х*Л для i= f, и для любой метастратегии У/G yz и любого игрока z’G/ Gi(x Wy^H^x НуДх/Д) (здесь, как обычно, хк есть стратегия игрока /г, входящая в ситуацию х). □ 18.5. Очевидно, процесс образования метаигр (метарасширений игр) поддается неограниченному итерированию: от метаигры можно переходить к ее метаигре (называемой второй метаигрой), от нее к следующей (к третьей метаигре) и г.д. В этом отношении мет а расши рения игр отлича- ются большим разнообразием, чем смешанные расширения, которые, оче- видно, исчерпываются своим первым шагом. 187
В метаиграх могут реализоваться более сильные принципы оптимальнос- ти, чем в исходных бескоалиционных играх, и, как оказывается, даже более сильные, чем в смешанных расширениях. § 19. РЕАЛИЗАЦИЯ ПРИНЦИПОВ ОПТИМАЛЬНОСТИ В МЕТАСТРАТЕГИЯХ 19.1. В качестве первого примера применения метастратегий рассмотрим существование ситуаций равновесия в конечных бескоалиционных играх. Для простоты формулировок и доказательств мы ограничимся случаем ко- нечных игр двух лиц. Мы не будем называть сейчас эти игры биматричными, потому что матричная форма записи значений функций выигрыша в этих вопросах не играет роли. 19.2. Т е о р е м а. Каждая конечная бескоалиционная игра двух лиц имеет в своем (первом) метастратегическом расширении ситуации равно- весия. Доказательство. Рассмотрим игру двух лиц Г = < х, у,Яь Я2 > и построим ее метарасширение А = < х, ух, Gi, G2 >, где при любом / G ух (f в этом случае есть функция из х в у) Gz(x,/) = Hz(x,/(x)), z=l,2. (19.1) Поставим каждому х G х в соответствие такую стратегию ух, что Н2(х, ух) = max Н2(х, у). у Соответствие х у х есть, очевидно, одна из функций f * G у х. Таким обра- зом, при любых х G х и у G у должно быть H2(x,f*(x))>H2(x,y). (19.2) Найдем, далее,такое х* G х, что 6\(х*,/*) =7/1(х*,/*(х*)) = max H^J^x)), (19.3) и покажем, что (х*, f*) есть ситуация равновесия в игре А. Действительно, на основании (19.3) прилюбом xG х должно быть = (19.4) Кроме того, из (19.2) следует, что G2(x\f)=H2(x\f(x*))^ ^H2(x\f*(x*)) = G2(x*J*). Вместе с (19.4) это и означает равновесность ситуации (х* ,/*). □ Разумеется, доказанная теорема не противоречит той возможности, что ситуацией равновесия может обладать уже сама исходная игра Г. 19.3* . Более принципиальной оказывается возможность осуществить в метарасширении игры ситуацию, которая была бы одновременно как равно- весной, так и оптимальной по Парето. Теорема. Каждая конечная бескоалиционная игра двух лиц имеет в своем третьем метарасширении ситуацию, которая является одновремен- но ситуацией равновесия и оптимальной по Парето. 188
Доказательство. Из предыдущего следует, что любая конечная бескоалиционная игра двух лиц имеет ситуации равновесия хотя бы в своем первом метарасширении. Поэтому мы начнем с рассмотрения игры, имею- щей ситуацию равновесия, и найдем нужную нам ситуацию в ее втором метарасширении. Рассмотрим игру Г = ( х, у,//) ,Я2 ), у кото рой есть ситуация равнове- сия (х*, у*) , и два ее последовательные метарасширения: Д = < х, ух, 6’1, G2 > , где при хЕх и /Еух выполняется (16.1),и Е = <х(уХ),ух, Ft,F2 \ где при g&х<у 1 и /Сух положено F,(g, f) = Gi(g, f),f) = f(M i = 1,2. (Разумеется, то обстоятельство, что здесь первую метастратегию выбирает игрок 2, а вторую метастратегию — игрок 1, является совершенно несущест- венным; можно было бы здесь рассмотреть конструкцию, в которой пер- вую метастратегию выбирает игрок 1, а вторую — игрок 2; все дальнейшие рассуждения отличались бы при этом лишь незначительными деталями). Найдем в соответствии с теоремой п. 6.4 оптимальную по Парето ситуа- цию (х°, у °) в игре Г, для которой H^x^y^^H^.y0), (19.5) H2(x*,y*)^H2(xo,yo), (19.6) и покажем, что искомой ситуацией в Е, одновременно равновесной и опти- мальной по Парето, является ситуация (g°,/°) , для которой ( у°,еслих = х°, /°(А')= * ( у , если х Ф х , (19.7) х°, если/ = /°, х*, если/т^ /°. Действительно, Fi{g° f Gi(gQ^f°},f°^-G^x0 H-XxQ ,f°(xQy)-Н^х^ ,yQ} для i = 1,2. (19.9) Это значит, что выигрыши игроков в ’’метаситуации” (g°,/°) те же, что и в ситуации (х°,у°). Поэтому одновременное увеличение выигрышей игро- ков (в смысле знака <) в метаситуации (g°,/°) невозможно, и эта мета- ситуация оказывается оптимальной по Парето в Е. Докажем равновесность ситуации (g°,/°) в Е. При произвольном / ¥= / ° мы имеем F, (g\f) = G2 (g°(f), f)-G2(x*,f)=H2 (x *, /(x*)). (19.10) Но ввиду равновесности ситуации (х*,у *) в Г и по (19.6) и (19.9) ^(x\/(x*))^//2(x*,y*)^H2(xo,/) = F2feo,/°). (19-8) 189
Вместе с (19.10) это дает нам F2(g\f)^F2(g°J°\ (19.11) Возьмем теперьg Фg°. Здесь мы будем различать два случая: a) g(f°) ~х'- В этом случае = (х°, f = /7, (х°, у°) = F} (19.12) б) g(f°) F х°. В этом случае ^fe,/o)-6\(g(/o),ro) = = /Л^(Г0хГ0^(Г0)))--^(^(^0)^*)- (19ЛЗ) Но опять-таки ввиду равновесности ситуации (х*,у*) в Г и по (19.5) и (19.9) должно быть ^Hx(x\y^^Hx(x\yG )= Fv{go Вместе с (19.13) это дает нам при g(f°) Фхс F^f^F^J0) (19.14) Соотношение (19.12) позволяет снять условие °) Неравенство (19.14) оказывается теперь справедливым для любых g (npng=go оно превращается в точное равенство). В итоге неравенства (19.11) и (19.14) дают нам требуемую равновес- ность. □ 19.4*. Применим доказанную теорему к игре ’’два бандита” (см. § 17). В этой игре уже имеется ситуация равновесия (х* у*), состоящая в выбо- ре каждым из игроков своей первой стратегии. Оптимальная по Парето ситуация (х°,у°) удовлетворяющая по отношению к ситуации равновесия (х*,у*) условиям (19.5) и (19.6), состоит в выборе каждым из игроков своей второй стратегии. Первая метастратегия игрока 2, определяемая согласно (19.7), состоит в^выборе им своей второй стратегии в ответ на вторую стратегию игрока 1 и первой стратегии в ответ на первую. ' Вторая метастратегия игрока 1, определяемая соотношениями (19.8), состоит в выборе им второй своей стратегии, если игрок 2 выберет ту же стратегию, что и 1, и в выборе им своей первой стратегии во всех осталь- ных случаях. z Содержательно это можно представить себе так, что игрок 2 исходит из тезиса ”око за око”, а игрок 1 — из более изощренных соображений, кото- рые можно расценить как эгоцентризм (” поддерживаю тех, кто действует так же, как я”) и ксенофобию (’’выступаю против всех тех, кто действует иначе, чем я”). 190
§ 20. ДИАДИЧЕСКИЕ ИГРЫ 20.1. Упрощением, получающимся в случае, когда каждый игрок имеет лишь две чистые стратегии, можно воспользоваться не только в случае биматричных игр, но и при рассмотрении игр с любым конечным числом иг- роков . Определение. Бескоалиционная игра Г = </, { xz} ze/, (20.1) называется диадической, если каждый игрок в ней имеет две чистых страте- гии: xz = {lz,0z} для? Е/. □ Далее в тех случаях, когда это не сможет привести к недоразумениям, мы будем стратегии lz и 0z игрока i обозначать просто через 1 и 0. В диадической игре каждая смешанная стратегия игрока i полностью описывается вероятностью £z выбора им своей первой чистой стратегии. Таким образом, множество всех смешанных стратегий игрока можно представить как сегмент [0, 1], а множество всех ситуаций в смешанных стратегиях — как единичный и-мерный куб. Ситуации в чистых стратегиях будут, очевидно, соответствовать вершинам куба. 20.2. Всякая вершина куба ситуаций в диадической игре может быть задана как и-членная последовательность единиц и нулей. Очевидно, для того, чтобы ее идентифицировать среди всех вершин, достаточно указать мно- жество всех игроков, выбирающих в этой ситуации свою первую стратегию. Пусть X — произвольная ситуация в смешанных стратегиях в диадичес- кой игре Г из (20.1), а х — ситуация в чистых стратегиях в ней, причем множество игроков, выбирающих в х свою первую чистую стратегию, есть К (х) . Тогда, очевидно, = П & П (1-^). (20.2) /gk(a-) j^K(x) 20.3. Опишем множество (Г) всех ситуаций, приемлемых в игре Г для данного игрока /. Возьмем для этого произвольно KlCI\in будем под (£hKl) пони- мать ситуацию, в которой игрок i выбирает такую смешанную стратегию Xh что Xi (1) = £i, игроки из К1 — свои первые чистые стратегии (£;- = - 1), а остальные игроки -вторые чистые стратегии (£;- = 0). Положим X(^z)-.¥(l./Cz) + X(0, П. L П.(1-еД j(EKl /$к1 Тогда, учитывая (20.2). мы получаем Hi(X^ii Z.Hi(\,Ki)X(Ki) + (l SHz(0,/Cz)X(Az). (20.3) к Условия приемлемости ситуации X для игрока / состоят в выполнении неравенств Я,-(.¥Н ) <Hi(X) для = 0и^- = 1, или, учитывая (20.3), S Hz(£°, A z) %(A?Z)< к1 <. ^i S Hz(l , A'Z)X(A'Z) + (1 - £•) 2 Hi(0, К ')Х(Г ). (20.4) к1 к1 191
При = 1 это неравенство переписывается как к1 #z(l, К*) + Х(К^ + (1 - £z) S Я,(0,К1}Х(К\ (20.5) к1 к1 или, после очевидных упрощений, — как (1 - X Х(К^ к1 < (1 - £) X //z(0. К*)Х(К{). (20.6) к1 Аналогично, полагая в (20.4) - 0, мы получим £ZX Н^0,К1)Х(К^&£ Н^1.КЬ)Х(К1). (20.7) к1 к1 При - 1 неравенство (20.6) выполняется автоматически, а (20.7) записывается как X Н^К1)Х(К1)^ X Н^^К^Х^У (20.8) К* к1 При ~ 0 наблюдается симметричная картина: X. Я,-(1, KZ)X(KZ)S X #z(0. К*)Х(К*). (20.9) к1 к1 20.4. Обозначим через Х{ множество таких комбинаций стратегий игро- ков из/V, что для ситуаций вида (1,Хг),гдеХ* G X}, неравенство (20.8) выполняется со знаком строгого неравенства, через X — множество таких комбинаций, что для соответствующих ситуаций (20.8) выполняется со зна- ком равенства, и через Хо - все остальные комбинации стратегий (для соответствующих ситуаций неравенство (20.8) будет неверным). Из сказанного выше следует, что приемлемыми для игрока i в игре Г будут все ситуации вида (0,%z), где Х{ЕХ^, (20.10) (1,XZ), где A^'exj, (20.11) (£Z,X'), прилюбых X1 GXL и &fE [0, 1]. (20.12) Множества ситуаций вида (20.10) и (20.11) представляют собой (не обязательно связные) куски (и—1)-мерных гиперплоскостей, а мно- жество вида (20.12) — декартово произведение их общей (как правило, (п — 2)-мерной) границы на сегмент [0, 1], т.е. кусок некоторого (п — 1)- мерного цилиндра. 20.5. Для множества ситуаций равновесия (Г) в игре Г из (20.1) мы имеем: 'с (Г)- П r£z(T). (20.13) Точки этого пересечения в принципе можно последовательно перечис- лить, рассматривая каждое из Зп пересечений множеств вида (20.10) - 192
(20.12), взятых по одному для каждого i = 1,. . . , п. Разумеется, значитель- ное число этих перечислений окажется пустыми. В случае ’’общего вида” цилиндров, на которых расположены части (20.12) множеств й)(Г), и их ’’общего расположения” относительно ги- перплоскостей = 0 и = 1 число точек перечисления (20.13), очевидно, будет конечным. § 21. ДИАДИЧЕСКИЕ ИГРЫ ТРЕХ ЛИЦ 21.1. Каждая из диадических игр трех лиц описывается 3 • 23 = 24 па- раметрами. Как легко подсчитать, переход к классам аффинной экви- валентности уменьшит число параметров лишь на 6, так что полная клас- сификация таких игр, подобная той, которая была выполнена для 2X2- биматричных игр, практически неосуществима. Однако исчерпывающий алгоритм решения любой такой игры может быть составлен. 21.2. Опишем множества ^/(Г) для диадической игры трех лиц. Для определенности мы рассмотрим случай i = 3, обозначив для краткости зна- чения функции выигрыша Ht (jq , х2, х3) этого игрока через HXi .Не- равенство (20.10), характеризующее в этом случае множество X*, запишет- ся так: Яооо (1 - Ь )(1 - Ь) + Яо!о (1 ~ Ь)Ь + Я,ооЬО- Ь) +^i 1 оЬ £Яоо1(1 - <1)0 -Ь)+ЯО11(1-ЬЖ +Я101£1(1-Ь) + + #1 1 1 £1 ?2 • После естественных преобразований, без труда выполняемых в каждом конкретном случае, это неравенство приводится к виду + В^ + Q2 + Z>^0. (21.1) Граница описываемого этим неравенством множества в случае А Ф 0 есть гипербола (быть может, вырождающаяся в пару пересекающихся прямых). Построение этой гиперболы на единичном кв а драте плоскости (Ь,?2) при- водит к описанию множества Г^3(Г) согласно (20.8) —(20.10) и к его геометрическому изображению. Аналогично строится каждое из множеств i (Г) и (Х2 (Г). Нахождение пересечения ^1(Г) П 2 (Г) Г) с£3 (Г) осуществляется вполне элементарными геометрическими (точнее говоря, — графоаналити- ческими) рассуждениями, но требует большой тщательности и осмотритель- ности ввиду разнообразия могущих встретиться случаев. § 22. ОХРАНА ОКРУЖАЮЩЕЙ СРЕДЫ 22.1. Каждое из трех предприятий (игроки 1, 2 и 3) , пользующихся для технических целей водой из некоторого природного водоема, располагает двумя чистыми стратегиями: использовать очистные сооружения для отрабо- танной воды (стратегия 0) или же сбрасывать ее в водоем без очистки (стра- тегия 1). Предполагается, что особенности водоема и технологических про- цессов на предприятиях таковы,что если неочищенную воду сбрасывает не более одного предприятия, вода в водоеме остается пригодной для использо- 13.Н.Н. Воробьев 193
Соотношение (20.4) для игрока вания, и предприятия убытка не несут. Если же неочищенную воду сбрасыва- ют не менее двух предприятий, то каж- дый пользователь воды несет убытки в размере трех единиц. Стоимость ис- пользования очистных сооружений об- ходится каждому предприятию в одну единицу. 22.2. Изобразим куб ситуаций для описанной игры и укажем при его вер- шинах значения выигрышей игроков (рис. 3.8). i = 3 принимает в данном случае вид - Sib - ьа - е2)- а - еоь - 4(1 - еоа - - зьа - е2)- за - еоь - за - ь)а- е2), или, после очевидных упрощений, (1 -З^Н-З^З^. (22.1) (22.2) Множества X о, Xf иХ~ изображены на рис. 3.9 (здесь множество Х = состоит из двух дуг, принадлежащих двум ветвям гиперболы). 22.3. В соответствии с (20.5) множество Й’з(Г) приемлемых для иг- рока 3 ситуаций имеет вид, изображенный на рис. 3.10. Оно состоит из кри- волинейного шестиугольника, лежащего в плоскости £ 3 = 0 (мы обозначим его через Ш3), двух секторов в плоскости £3 = 1 (тот из них, который ближе к вершине куба (1,1,1), будет обозначен через С3, а другой - через С з) и двух кусков гиперболического цилиндра с образующими, направленными вдоль оси £3 (тот кусок цилиндра, который ближе к оси £ з, обозначим через Ц3, а другой кусок — через Ц'3 ). Множества i (Г) и (С 2 (Г) имеют в соответствии с очевидными авто- морфизмами игры Г такой же вид, отличаясь ориентацией образующих цилиндров соответственно вдоль осей и £2 • Части этих множеств мы бу- дем обозначать соответственно через Uli, Ci, С i, Щ, Ц i, и Ш2, С2, С2, ц2,ц2. 194
22.4. Опишем множество (Г) = (Г)А (£2 (Г) И Г6’3(Г). Снача- ла рассмотрим те точки множества />(Г), которые являются вершинами куба ситуаций. Одной из них будет точка (1, 1, 1), т.е. пересечение секторов Ci АС2 А АС3. Эта ситуация равновесия, в которой каждый из участников несет по- тери в 3 единицы, описывает своего рода ’’равновесие безнадежности”, когда переход любого предприятия на чистую технологию не спасает обще- го положения и лишь ухудшает его собственные экономические показатели. Дальнейшие три ситуации равновесия получаются как пересечение UIj О АШ2 АС3 (вершина (0, 0, 1)) и симметричные ему пересечения Ш] А А с2 п Ш з (вершина (0, 1,0)) и С i А Ш2 АШ3 (вершина (1, 0, 0)). Каж- дая из этих ситуаций характерна наличием ’’нахала”, единолично исчерпы- вающего все ’’ресурсы загрязнения” и вынуждающего своих партнеров по природопользованию придерживаться чистой технологии под страхом их собственных потерь. В этих ситуациях равновесия ’’нахал” не несет потерь вовсе, а потери остальных (называть их ’’совестливыми” здесь не вполне уместно, так как выбор каждым из них чистой технологии оказы- вается все-таки вынужденным) равны единице. Проверка остальных вершин куба ситуаций показывает, что больше ситуаций равновесия среди них нет. В частности, не является равновесной приро до охраняющая ситуация, в которой каждый из участников игры применяет свою чистую технологию: каждому из игроков выгодно от нее отклониться. 225. Рассмотрение ребер куба ситуаций показывает, что среди внутрен- них точек этих ребер нет ситуаций равновесия. Обратимся к внутренним точкам граней. Здесь возможны три ситуации равновесия: определяемая пересечением Щ АЦ2 АШ3 (точка куба с ко- ординатами (1/3, 0, 1/3)) и симметричные ей Щ А Ш2 ПЦ3 (имеющая координаты (1/3,0, 1/3)) и ПП А Ц2 ПЦ3 с координатами (0, 1/3, 1/3)). Эти ситуации в отличие от трех предыдущих характерны наличием ’’созна- тельного” природопользователя, применяющего чистую технологию. Такое его поведение дает возможность остальным допускать умеренное загряз- нение среды. Впрочем, после того, как эти два игрока такие свои стратегии выбрали, ’’сознательность” первого превращается из добродетели в не- обходимость: отклонение от ситуации равновесия невыгодно ни для кого! Потери игроков в первой из таких ситуаций равновесия равны соответ- ственно 13/9, 13/9 и 21/9, а в остальных двух получаются из указанных циклической перестановкой. Отсюда видно, что в этих условиях созна- тельность требует известных затрат. 22.6. Ситуации равновесия, лежащие внутри куба ситуаций, могут быть получены лишь как пересечения Щ А Ц2 А Ц3 или Ц \ А Ц 2 А Ц '3. Так как, в частности, каждая из этих ситуаций лежит на цилинде Ц3 U иЦ3, для них соотношение (22.1) должно выполняться со знаком ра- венства: (1-3^1)(1-ЗЬ) = Зе1Ь. (22.3) Ввиду того, что эти ситуации лежат и на двух других цилиндрах, мы можем для их компонент написать два аналогичных равенства и решать получив- 13 195
шуюся систему, которая, в силу симмет- ричности рассматриваемой игры, будет симметричной относительно неизвестных £1, £2 и £3. Впрочем, симметричностью игры можно воспользоваться и более непосредственно. Ввиду одинакового расположения пересе- кающихся цилиндров относительно соот- ветствующих осей координат, ситуации равновесия, являющиеся точками пересе- чения этих цилиндров, должны сами быть симметричными: для них должно быть ' (22.4) Существование таких симметричных ситуаций равновесия можно было бы предсказать на основании теоремы п. 11.3. На этих ситуациях осущест- вляется не только устойчивость, но и справедливость. Из (22.3) и (22.4) мы получаем (1 -3£)2 = 3£2,откуда 1-3£=±£\Л? и окончательно — (22.5) т.е. - 0,211 и £2 ~ 0,789. Иными словами, внутри куба ситуаций оказы- ваются две ситуации равновесия: (0,211,0,211,0,211) и (0,789,0,789,0,789). (22.6) Для подсчета выигрышей игроков в этих ситуациях подставим в одну из частей соотношения (22.1) h = Ь = £ и возьмем $ из (22.5). После простых вычислений мы получим о у/? //z(f,g,0) = 3?2 -3=-2+ —, 2 т.е. числа —1,134 и —2,866. Обе ситуации (22.6) являются устойчивыми (равновесными) и сим- метричными (справедливыми). При этом первая из них еще и достаточно выгодная, а вторая — нет: как по поведению игроков в ней, так и по своим последствиям (выигрышам игроков) она близка к ’’равновесию безнадеж- ности” (1,1,1). Таким образом, окончательно оказывается, что рассматриваемая игра имеет 9 ситуаций равновесия. Все они изображены на рис. 3.11. Как обычно, устойчивость вступает здесь в противоречие с выгодностью и справедливостью. В порядке преодоления этого противоречия игроки могут выбрать ситуацию равновесия с ’’нахалом”, обязав ’’нахала” вы- плачивать каждому из остальных игроков компенсацию в размере 1/3 (ср. п. 16.2). 22.7. Поучительно заметить, что даже среди справедливых (симметричных) ситуа- ций в данной игре, т.е. таких ситуаций, для которых соблюдается (22.4), равновесные ситуациии не совпадают с выгодными. Это напоминает известные из области механики факты, когда симметричное состояние, стабильное по отношению к симметричным формам потери устойчивости, утрачивает свою стабильность по отношению к несиммет- ричным формам потери устойчивости, 196
Действительно, справедливые ситуации суть тройки вида (£,£,£). Для вычисле- ния наиболее выгодной ситуации из числа справедливых заметим, что выигрыш каж- дого игрока в такой ситуации равен, как нетрудно подсчитать, б£3 - 12 £ 2 + £ - 1. Производной этой функции будет 18 £2 - 24£ + 1. (22.7) При £ = 0 значение производной оказывается положительным, так что ситуация (О, О, 0) не является такой уж выгодной даже в классе всех симметричных (справедливых) ситуаций в смешанных стратегиях. Небольшое увеличиение £ от нуля (т.е. ’’легкое нарушение экологической дисциплины”) будет в условиях данной игры приводить к некоторому росту выигрышей каждого из игроков (а говоря точнее, к уменьшению их потерь). Очевидно, корнями производной (22.7) будут _ 4 ± хЛ4* 18 6 из которых теоретико-игровой смысл имеет только тот, который соответствует знаку минус: £ = 0,043. Соответствующие этому значению £ потери игроков составляют 0,96, что меньше, чем оказывающиеся в равновесной симметричной ситуации 1,134. Таким образом, плата за равновесность в условиях справедливости для данной за- дачи составляет 0,17 единиц. 22.8* . Обратим, наконец, внимание на то, что вероятности в (22.5) яв- ляются иррациональными числами. Как было отмечено в п. 13.4, описание множества ситуаций равновесия биматричной игры (т.е. конечной игры двух лиц) есть рациональная опера- ция. Иррациональность же числа £ в (22.4) означает, что решение данной игры трех лиц принципиально несводимо к решению какого-либо конечного числа игр двух лиц. Конфликты с тремя участниками оказываются, таким образом, принципиально более сложными, чем конфликты с двумя участ- никами. Между прочим, с точки зрения нахождения ситуаций равновесия даль- нейшее увеличение числа игроков в игре к дальнейшим сложностям реше- ния этих игр не приводит. Именно, какова бы ни была конечная игра п лиц, существует конечная же игра трех лиц, из ситуаций равновесия кото- рой ситуации равновесия исходной игры получаются рациональным (и при- том достаточно простым) образом. § 23. ’’ДЕЗОРИЕНТИРУЮЩАЯ РЕКЛАМА” 23.1. Рассмотрим следующую игру, которую можно интерпретировать как конфликт в области рекламы. Для некоторой категории покупателей, желающих приобрести к пред- стоящему празднику непременно ’’лучший подарок” и черпающих свою информацию о товарах из передач по телевидению, три фирмы (игроки 1, 2 и 3) выпустили три вида подарков, и каждая из них рекламирует свое изделие как лучшее. Каждая фирма имеет две стратегии осуществления рекламы: 1) в вечерней телевизионной передаче; 2) в дневной телепереда- че. Если одновременно свой товар как лучший будет рекламировать бо- лее чем одна фирма, то каждый покупатель из рассматриваемой нами категории усмотрит в этом противоречие и вовсе откажется от покупки. Фирма, выступающая одна с рекламным объявлением днем, завербует столько покупателей, что реализует свой товар с получением 1 единицы 197
полезности. Если она выступит также одна, но вечером, то завербует вдвое больше покупателей и получит 2 единицы полезности. В качестве другой интерпретации этого же конфликта можно привести игру ’’морра трех лиц”, в которой каждый из трех игроков показывает (’’выбрасывает”) один или два пальца. Его выигрыш равен числу показан- ных им пальцев, если каждый из его партнеров по игре показывает другое число пальцев, и равен нулю в остальных случаях. 23.2. Куб ситуаций для этой игры с приписанными его вершинам выиг- рышами игроков, определенными в соответствии с указанными правилами игры, изображен на рис. 3.12. Неравенство (20.4) приобретает для игрока 1 в случае этой игры вид £2Ь^2(1 -М(1 ~Ь). (23.1) Соответствующие области X о. X ’ и X } изображены на рис. 3.13. Очевидно, множество Х=’ является дугой гиперболы. Таким образом, множество *ё’1 (Г) всех ситуаций, приемлемых в нашей игре для игрока 1, состоит из всех ситуаций вида (о,^2Лэ),где (ь, b)exj, (е1,ЬЛз),гдеа2,Ь)еХ1, а произвольно из [0,1 ], (1,Ь,Ь), где h)GXj . Расположение множества всех приемлемых для игрока 1 ситуаций в кубе всех ситуаций изображено на рис. 3.14. Заметим, что это множество симметрично относительно £2 и £3. 23.3. Множества ^2(Г) и (6з(Г) всех ситуаций, приемлемых соот- ветственно для игроков 2 и 3, получаются из ^ДГ) перестановкой ко- ординат, а множество всех ситуаций равновесия в рассматриваемой игре является по определению пересечением (6\ (Г) П (Г) (Г). Опишем это пересечение. Заметим прежде всего, что в каждое из множеств приемлемых ситуаций ^1(Г), #2, (Г) и ^з(Г) входят одни и те же шесть ребер куба (вмес- те с лежащими на них вершинами). Поэтому эти ребра должны входить и в множество ^(Г) ситуаций равновесия игры. Отметим среди них особо ситуации (1, 0, 0), (0, 1, 0) и (0, 0, 1). В каждой из них выигрыш одного 198
из игроков равен двум, а выигрыш каждого из остальных — нулю. Эти си- туации равновесны и выгодны, но несправедливы. Далее, точки *й>1 (Г), $2(Г)-И (Г) лежащие внутри граней куба, на- ходятся соответственно на различных парах противоположных его гра- ней, но внутренности различных граней куба попарно не пересекаются. Поэтому в рассматриваемой игре ситуаций равновесия, соответствующих внутренним точкам граней куба, нет. Найдем, наконец, внутренние точки куба, принадлежащие ^(Г). Оче- видно, они являются и внутренними точками куба, принадлежащими каж- дому из множеств (Г), ^2 (Г) и з (Г), т.е. каждой из цилиндри- ческих поверхностей. Эти поверхности пересекаются в единственной точке, все координаты которой равны друг другу. Поэтому и из (23.1) следует, что каждая координата £ такой ситуации равновесия должна удовлетворять уравнению £2 = 2(1 — £)2, откуда £ = х/2(1 — £) (стоящие в частях этого равенства числа неотрицательны, поэтому мы ограничиваемся арифметичес- ким значением корня), так что £ = 2 — 0,586. Выигрыш каждого из игроков в этой ситуации равновесия в соответствии с (23.1) равен 0,242. Окончательный вид множества (Г) изображен на рис. 3.15. 23.4. Ситуация равновесия игры, лежащая внутри куба ситуаций, соответствует некоторому устойчивому и притом справедливому со- глашению между участниками игры. Однако, давая всем трем игро- кам суммарный выигрыш 0,726, она представляется уж очень невы- годной. В ситуациях же равновесия, расположенных на ребрах куба ситуаций, наблюдается примечательное явление: игрок, координата которого изме- няется вдоль соответствующего ребра, на ситуациях этого ребра не получает ничего; зато именно он определяет величину выигрыша каждого из осталь- ных игроков. Поэтому представляется разумным дать одному из игроков (скажем, первому) возможность выступить в одиночку вечером (ситуация (1, 0, 0)) и получить выигрыш в две единицы, обязав его за это поделиться своим выигрышем. Такого рода кооперативные соглашения будут рассматри- ваться в следующей главе. 199
§ 24. ПОЛИАНТАГОНИСТИЧЕСКИЕ ИГРЫ 24.1. Как отмечалось в п. 16.4, даже явление, в котором участвуют лица с полностью совпадающими интересами, может описываться нетривиальной теоретико-игровой конструкцией. Тем более естественно предполагать, что можно найти явления с диа- метрально противоположными интересами участников, которые описыва- лись бы неантагонистическими играми, и даже решение их не сводилось бы к решению антагонистических игр. 24.2. Определение. Бескоалиционная игра Г= <A{xfhej, {H^i) называется полиантагонистической, если имеется такое разбиение / = = К U L (К П L = ф) , что для любой ситуации х Нк (х) = —Я/ (х) для всех кЕК и I G L. 24.3. Полиантагонистические игры составляют существенно более широ- кий класс игр, чем антагонистические. В этом нас убеждает следующий пример. Пусть в диадической игре трех лиц Г значения выигрышей игроков в двух ситуациях указаны на рис. 3.16, а их выигрыши во всех остальных си- туациях в чистых стратегиях равны нулю. Полиантагонистичность этой игры очевидна. На поверхности куба ситуаций этой игры, как нетрудно убедиться, имеются две ситуации равновесия и притом в чистых стратегиях: £ i = 5 2 = О, ь = 1 и Ь =ь = 1, Ь=о. Будем искать вполне смешанные ситуации равновесия. В силу дополняющей нежесткости для таких ситуаций X должно бытьЯДХН 0) = = Я/(х||1). Полагая, как обычно, X/(l) = (/=1,2,3), мы при i i = 3 получаем при i = 2 — (1 -b) = 2tib, 200
а при i= 1 — (1 -b)(l -Ь) = 2Ыз- Изменение знака частей первого из этих равенств превращает эту систе- му равенств в условие равновесности вполне смешанной ситуации в игре из предыдущего параграфа. Поэтому в единственной вполне смешанной ситуации равновесия каждый из игроков выбирает свою первую чистую стратегию с вероятностью £ = 2 — \/2^ являющейся иррациональным числом. 24.4. Как было показано в п. 13.4, в любых биматричных играх (и в том числе — конечных антагонистических играх) с рациональными значениями функций выигрыша ситуации равновесия описываются рациональным образом. Поэтому приведенный пример показывает, что конечные полиан- тагонистически е игры могут не поддаваться сведению к последователь- ному решению конечного числа конечных антагонистических (и даже биматричных) игр.
Глава 4 КЛАССИЧЕСКИЕ КООПЕРАТИВНЫЕ ИГРЫ § 1. ХАРАКТЕРИСТИЧЕСКИЕ ФУНКЦИИ БЕСКОАЛИЦИОННЫХ ИГР 1.1. Пусть нам дана бескоалиционная игра Г = </,{х,}.еГ (1.1) Предположим, что игроки, составляющие некоторую коалицию К С /, объединяются в условиях этой игры для борьбы в общих для них интере- сах. Поставим вопрос о том наибольшем выигрыше, который игроки из К могут с уверенностью совместно получить. 1.2. Проанализируем поставленный вопрос с теоретико-игровой точки зрения. Объединение игроков из К означает превращение их в единого иг- рока. Назовем его игроком 1. То/что игроки из К начинают действовать совместно, означает, что стратегиями этого объединенного игрока 1 яв- ляются всевозможные комбинации стратегий составляющих его игроков из К, т.е. элементы декартова произведения хк = хг-. Общность Инте- ле к ресов игроков из К означает, что выигрыш объединенного игрока 1 есть сумма выигрышей составляющих его игроков из К: Нк(х)= X Н^х). (1.2) i^K 4 Нас интересует тот наибольший выигрыш, который игроки из К могут уверенно получить. Но что вообще может помешать им получать достаточ- но большие выигрыши, допускаемые значениями функций ? Очевидно, деятельность игроков, не вошедших в К, т.е. игроков из 1 \ К. В худшем для игрока 1 случае игроки из 1\К могут также объединиться в некоторого коллективного игрока 2 с множеством стратегий Х/\К= п X,- i<El\K и с интересами, диаметрально противоположными интересам игрока 1. Таким образом, мы по бескоалиционной игре Г из (1.1) и коалиции К в ней конструируем антагонистическую игру х1Хк,Нк). (1.3) Обратим внимание на то, что множество ситуаций хк X х^к в этой беско- алиционной игре формально совпадает с множеством ситуаций х = х7 в ис- ходной бескоалиционной игре (1.1). Заметим также, что антагонистическая игра (1.3) представляет собой картину, рассматриваемую с точки зрения коалиции К. В частности, здесь никак не отражается фактическая (собственная) точка зрения коалиции 202
1\К п входящих в ее состав игроков. Коалиция К отвлекается от мыслей о том, каковы у коалиции 1\К интересы (функции выигрыша Hj игроков j G 1\К даже не участвуют в описании антагонистической игры (1.3)!) и как она их может осуществлять. Коалиция К в рамках игры (1.3) заботит- ся единственно о том, в какой мере коалиция 1\К сможет ей навредить, если того пожелает. 1.3. В результате проведенных рассуждений вопрос о наибольшем гаран- тированном выигрыше коалиции К в игре Г из (1.1) превратился в вопрос о наибольшем гарантированном выигрыше игрока 1 в антагонистической игре Г к из (1.3). Но этот выигрыш есть, в соответствии с принятым прин- ципом максимина, значение игры Г# (разумеется, в предположении, что игра (1.3) имеет значение). Очевидно, значение игры зависит в конеч- ном счете только от коалиции К (и еще, разумеется, от самой исходной бескоалиционной игры Г, которая, однако, в наших рассуждениях остается одной и той же), являясь ее функцией. Эта функция называется характеристической функцией бескоалиционной игры Г. Мы будем ее обо- значать через иг. Подчеркнем, что характеристическая функция всякой бескоалиционной игры задана на семействе всех подмножеств множества игроков и принимает вещественные значения: : 21 R. 1.4. В сущности, переход от бескоалиционной игры Г из (1.1) к ее ха- рактеристической функции иг можно рассматривать как итог последова- тельно проводимого принципа максимина. Тем самым характеристическую функцию иг можно считать как бы решением игры Г. Замена игры Г ее характеристической функцией означает существен- ную редукцию оптимизационного анализа игры Г. Имеются весьма сильно отличающиеся друг от друга бескоалиционные игры с одной и той же ха- рактеристической функцией. Например, функция v, для которой с(ф) =0, и(1) =v0, и (2) =— и (1,2) = 0, является характеристической функцией любой антагонистической игры, имеющей значением число и0 • В результате замена игры Г ее характеристической функцией vr, снимая вопрос о нормативном поведении игроков, не приписывает им, однако, каких-либо обоснованных индивидуальных выигрышей. Последнее может быть достигнуто лишь введением дополнительных оптимизационных сооб- ражений. В связи с этим изучение характеристических функций бескоали- ционных игр составляет целую теорию, которая называется кооперативной теорией бескоалиционных игр. 1.5. Установим два свойства, которыми обладает характеристическая функция любой бескоалиционной игры. Персональност ь. Для каждой бескоалиционной игры Г иг (Ф) = 0. Действительно, по определению (см. п. 1.2) Яф(х)=2 Н<(х), а последняя сумма не содержит слагаемых и поэтому равна тождественно нулю на множестве всех ситуаций. Таким образом, в игре Гф функция вы- игрыша игрока 1 тождественно равна нулю, а потому и значение в этой игре должно быть равно нулю. Содержательно персональность характеристической функции бескоали- ционной игры означает, что выигрыши в ней приписываются только тем или иным игрокам (’’лицам”). 203
1.6. Супераддитивность. Для каждой бескоалиционной игры ur(AU£)^ur(A) + ur(Z), если K,LCI и КПЬ=ф. (1.4) Для доказательства этого утверждения заметим, что vr(KUL)- sup inf S Ht(XKVL, У/\(^и£)), XKUL yI\(KUL) l^KUL где через XKUL обозначаются смешанные стратегии коалиции К U L, т.е. произвольные вероятностные меры на x^UL, а через Yj\^kul) — вероят- ностные меры на Yi\(kul) • Если ограничиться только такими вероятност- ными мерами на XKUL, которые являются произведениями независимых распределений Хк и XL на декартовом произведении хк X xL, то область изменения переменной, по которой производится максимизация, сузится, и написанный супремум может разве лишь уменьшиться. Таким образом, мы имеем ur(KUZ)^supSup 2 ^.(Xx,X£,ymuL)). ЛК XL YI\(KUL) iEKUL X В написанном неравенстве левая часть не меньше, чем наибольшее значение стоящей справа под знаком максимумов функции. Следователь- но, и каждое значение этой функции не превосходит левой части не- равенства: ur(AUf)^ inf S Н((ХК, Xl, > Yl\(KUL) iEKUL или ur(AUZ)> inf ( S H{(XK, XL, 1j\(acUl)) + yZ\(/CUL) ZG/C + £ НДХК, XL, X/\(j<U£))). iGL Заменим теперь стоящий справа инфимум суммы на сумму инфимумов (при этом, очевидно, правая часть может только уменьшиться, так что не- равенство не нарушится) : vr(KUL)2> inf S Н,(Хк.ХЬг УЛ(^и£)) + yZ\(XU£) zGX + inf S Hi(XK, XL, Yj\^KUL)). yi\(kul) ZG£ Минимизация первого слагаемого справа по XL, а второго — по Хк (для единообразия мы переименуем их соответственно в YL uYK) может при- вести лишь к дальнейшему уменьшению правой части ur(AUZ)>inf inf S Н^ХК, Yl, УЛ^и£)) + YL Yl\(KUL) l(EK + inf inf YK, У/\(к:и £))• YK YI\(KUL) В первом слагаемом справа минимизация осуществляется по паре не- зависимых мер на произведении xL X хд (К и£) = х^\к. Переход к минимизации по произвольной мере на произведении хт\к расширяет область минимизации и тем самым может лишь уменьшить ин- 204
фимум.По тем же причинам переход во втором слагаемом к минимизации по произвольной мере на произведении Х/\к может также лишь уменьшить его. В итоге мы имеем vr(KUL)^ inf S Hi(XK,YI\K) + inf S Ht(XL, Yr\L). yi\k ieK yi\l i&L Написанное неравенство справедливо при любых значениях мер Хк в первом слагаемом и XL во втором. Следовательно, мы можем по этим ме- рам перейти к супремумам: иг (К U L) sup inf S Hi(XK, Y. \к ) + хк yi\k ™ ' + sup inf S Hi(XL, Yj\l ), XL yi\l ieL откуда, по определению характеристической функции, иг {К U L) > иг (/С) + иг(£), (1.5) и требуемое доказано. □ Содержательно свойство супераддитивности характеристической функ- ции может быть интерпретировано следующим образом. Пусть К, L С/ и К C\L =ф. Число (Л7) есть гарантированный выигрыш коалиции К в игре Г в условиях противодействия ей всех игроков из 1\К (которые в нашей интерпретации являются непримиримыми врагами иг- роков из К), и в том числе — всех игроков из L. Значит, если игроки из L из врагов К превратятся в союзников, то игроки из К получат, во вся- ком случае, не меньше чем иг (Ю • По тем же причинам игроки из £, если игроки из К превратятся из их врагов в союзников, получат не менее чем иг (£). Следовательно, если игроки из К объединятся с игроками из £ в одну коалицию К U L, то игроки из К получат не менее чем v^(K), а игроки из £ - не менее чем иг(£). Но по определению они вместе теперь получат уверенно up (К U £), что и означает (1.5). 1.7. Следующее свойство присуще характеристическим функциям не всех бескоалиционных игр, а лишь игр с постоянной суммой ( см. п. 1.4 гл. 2). Дополнительность. Для любой бескоалиционной игры Г с по- стоянной суммой vr(K)^vr(I\fC) = vr(I). (1.6) Заметим, прежде всего, что для бескоалиционной игры с постоянной суммой иг(/)= Z Hi(x) = c. i^i Напишем теперь ur(/f)=sup inf S Hi(XK, Yr\K) = xk'yi\k = sup inf (c - S Ht(XK, YT\Ky) = XK YI\K IGI\K = c —inf sup S Hi(XK, Yj\K) = c - vr(I\K), xk yi\k \x откуда и следует требуемое. □ 205
Содержательно дополнительность характеристической функции являет- ся весьма ослабленной формой постоянства, суммы соответствующей бескоалиционной игры. Разумеется, постоянство суммы бескоалиционной игры не является необходимым условием дополнительности ее характе- ристической функции. Читатель без труда может подобрать соответствую- щие примеры. 1.8. Обратим внимание на то, что нахождение характеристической функ- ции бескоалиционной игры сводится к нахождению значений некоторого числа антагонистических игр, и потому по существу относится к теории антагонистических игр. Например, для биматричной игры Г = Г (Я, В) будет иг(ф) = О, УГ(1) = УЛ, vr(2) = vBr, vr (1,2)= max (а^ + by). Л/ 1.9. Свойства однородной аффинной эквивалентности, изоморфности и автоморфизмов бескоалиционных игр сохраняются при переходе к их характеристическим функциям в смысле, описываемом следующими тео- ремами. Теорема. Если бескоалиционные игры Г = <Л{хДег и Г’ = <1, (1.7) однородно аффинно эквивалентны, причем для всех х G х Я/(х) = Щ(х) + ^, (1.8) то для любой коалиции К СI vr\K) = kvY(K) + S (ц. (1.9) iEK Доказательство. Из (1.8) следует, что для любой коалиции KCI S Н-(х) = к Ъ Hi (х) + S ah i<=K i^K i^K так что аффинно эквивалентными оказываются и антагонистические игры Г (Л ) и Г(/С'). Но тогда по теореме п. 5.3 гл. 1 Vr'(K)~kvr(K)^ igk а это и означает (1.9). О 1.10. Теорема. Если я - изоморфизм игры Г на игру Г ' из (1.7), то иг<7гЮ = ^г(Л:). (1.10) Доказательство подобно предыдущему. Изоморфность Г и Г ’ означает, что при любой коалиции К CI и ситуации (хк’У1\к) имеет место ра- венство ^7г? (пхк ’ пУт \к) = Н&хк ’Ут\к)- Суммируя по i&K (или, что то же самое, по тп Е тсК), получаем J 'ЕУтХк ) = . Щ(хк> У/\к)> 7ПЕ:ПК lEK 206
т.е. антагонистические игры Г(Х) и Г'(Л) оказываются изоморфными, так что по теореме п. 5.3 гл. 1 они имеют одно и то же значение. Послед- нее и означает (1.10). □ 1.11. Следствие. Если тг есть автоморфизм игры Г, то vr(jrK) = vr(K) (АС/). (1.11) Это получается, если в (1.10) положить Г' = Г. □ § 2. АБСТРАКТНЫЕ ХАРАКТЕРИСТИЧЕСКИЕ ФУНКЦИИ 2.1. Говоря абстрактно, характеристическая функция бескоалиционной игры состоит в постановке в соответствие каждому подмножеству некоторо- го множества (игроков) вещественного числа. Поэтому о ней можно го- ворить и вне какой-либо связи с бескоалиционными играми. На этом пути возникает весьма плодотворное понятие кооперативной игры, о которой речь будет идти ниже. Определение. Характеристической функцией над множеством I на- зывается отображение v: 2Z->R. (2.1) Далее мы будем множество I предполагать конечным, а его элементы на- зывать игроками. Если не оговорено противное, мы будем полагать 1= {1, ... , п}. Как обычно, любое подмножество множества всех игроков I называет- ся коалицией. □ Содержательно характеристическая функция (2.1) описывает следующее положение дел. Пусть игроки из I находятся в таких условиях,.что, вступая, если нужно, в отношения производства и обмена, они могут получать те или иные сравнимые между собой выигрыши (полезности). Характеристи- ческая функция v ставит при этом в соответствие каждой коалиции К С/ наибольший уверенно получаемый ею выигрыш v(K). Теория кооперативных игр, элементы которой нам предстоит изложить в данной главе, заключается в том, чтобы для процесса, приводящего к данной характеристической функции, указывать в том или ином смысле оптимальные распределения получаемой полезности между игроками. 2.2. Характеристические функции могут иметь самое разнообразное со- держательное происхождение. Приведем несколько примеров. Пример 1. Пусть группа / неквалифицированных работников выпол- няет однородную работу, причем каждый из работников i может выпол- нить некоторый объем работы и заработать (в соответствующем масштабе цен) сумму at. В этом случае суммарный заработок коалиции К С/, очевидно, будет равен S ai9 что и является значением v(K). i£K П р и м е р 2. Пусть в условиях предыдущего примера каждый из работ- ников i Е I имеет некоторый индивидуальный навык, которым владеет только он один из всего множества / и который позволяет увеличивать на некоторую сумму bi} заработок каждого работника /, который с ним работает в одном коллективе (коалиции). 207
Здесь заработок каждого участника коалиции К будет равен at + 2 bjj i^K\i (каждый член К пользуется навыками всех остальных членов К ), и в соот- ветствии с этим заработок всей коалиции К будет равен 2 (ai + S )- 2 at + Z bif-. i^K j(=K\i iEK i,jEK i Последнюю сумму мы будем обозначать через В (К). Пример 3. Пусть мы имеем дело с рынком, на котором имеются продавец (Пр) некоторой штуки неделимого товара, оцениваемого им в а, и два покупателя (Щ и П2), ценящих этот товар соответственно в b и с. Очевидно, если а > Ь, то продавец не имеет материальных стимулов всту- пать в сделку с покупателем а если а > с, то с П2. Поэтому мы будем предполагать, что а < b < с. В начальные момент распределения полезностей среди участников рынка таково: а, 0, 0. После акта обмена продавца с П1 по цене х распределение будет таким: х, b - х, 0, а после обмена с П2 по цене х - х, 0, с - х. Поэтому в результате обмена продавца с первым покупателем суммар- ная полезность возрастет на b - а, а в результате его обмена со вторым — на с - а. Таким образом, легко убедиться в том, что здесь и(ф) =0, ^(П1)гу(П2) = и(ПьП2) = 0, и(Пр) =0, и(Пр,П1)=/?-а, и(Пр,П2) = и(Пр, Щ , П2 ) = с — а. 2.3. Хотя, говоря формально, характеристическая функция из (2.1) может быть вполне произвольной, но по многим соображениям естествен- но ограничиться рассмотрением характеристических функций, обладающих некоторыми свойствами, о которых мы уже говорили в § 1 при рассмотре- нии характеристических функций бескоалиционных игр. Персональность: и(ф) = О. (2.2) Это свойство характеристической функции отражает то обстоятельство, что в теории игр выигрыши (или проигрыши) приписываются лишь игро-' кам и их объединениям. Супераддитивность: для любых X, L С/, для которых имеет место К С^Ь~ф, v(K) + v(L) < v(K U Z). (2.3) Это свойство отражает ’’кооперативный эффект” социально-экономи- ческих явлений, состоящий в том, что при объединении усилий двух групп участников явления итоговый результат оказывается не меньшим (а, как правило, и большим), чем алгебраическая сумма результатов от деятель- ности каждой из групп. 208
Далее мы будем ограничиваться, не оговаривая этого каждый раз особо, рассмотрением лишь характеристических функций, обладающих свойства- ми персональности и супераддитивности. Отметим еще одно свойство характеристической функции. До полнительность: для любой коалиции К GI имеет место v(K) + v(I\K) = v(I). (2.4) Свойство дополнительности проявляется в тех случаях, когда соответ- ствующий характеристической функции v социально-экономический про- цесс связан не с производством и потреблением каких-либо полезностей, а лишь с их перераспределением (каковыми являются, например, процес- сы обмена). В отличие от свойств персональности и супераддитивности свойство до- полнительности характеристической функции не будет предполагаться ав- томатически выполненным, а в тех случаях, когда оно имеет место, будет каждый раз специально оговариваться. 2.4. Из свойства супераддитивности (2.3) тривиальной индукцией по- лучается ее распространение на объединение любого числа коалиций: для любых попарно непересекающихся коалиций , Кк к к S v(Kt)<v(U Ki). (2.5) Z = 1 Z = 1 В частности, если каждая коалиция состоит из единственного игрока, то формула (2.6) может быть записана в виде Z v(i)^v(K). (2.6) i^K § 3. РЕАЛИЗАЦИЯ ХАРАКТЕРИСТИЧЕСКИХ ФУНКЦИЙ 3.1. Конструкция характеристической функции бескоалиционной игры является для общей теории характеристических функций в некотором смысле универсальной. Теорема. Какова бы ни была функция v: 2Z->R (3.1) с конечным множеством игроков /, обладающая свойствами персоналъ- ности и супераддитивности, существует конечная бескоалиционная игра r = </,{xz}.e/, (3.2) с тем же множеством игроков I, характеристическая функция иг которой совпадает с v. До казательство. Будем по характеристической функции v из (3.1) строить бескоалиционную игру Г из (3.2) следующим образом. Преж- де всего, положим Xi = 2^. (3.3) Таким образом, стратегию х, игрока i можно понимать как предложение, адресуемое игроком i некоторой группе игроков, составить вместе с ним коалицию. 14.Н.Н. Воробьев 209
Пусть в результате выбора игроками i Е I их стратегий сложилась ситуация х = (хь . . ., хп). Коалицию К будем называть замкнутой в си- туации х, если для любого игрока i Е К будет i Uxz- = К (т.е. если каждый игрок из К обращается о вступлении в коалицию ко всем осталь- ным игрокам из К и только к ним; заметим, что стратегии-предложения иг- роков, не принадлежащих К, при этом не принимаются во внимание, даже если они хотят объединиться с коалицией К). Очевидно, любые две замкнутые коалиции в одной и той же ситуации либо не пересекаются, либо совпадают. Игроков, которые в эти замкнутые коалиции не входят, будем называть изолированными в х. Обозначим через /Q(x) замкнутую в х коалицию, содержащую игрока z, или же самого игрока z, если он является в х изолированным, и положим (х) = 1ВД1 (3-4) Соотношения (3.3) и (3.4) определяют некоторую бескоалиционную иг- ру Г вида (3.2). Покажем, что эта игра является искомой. Обозначив через иг ее характеристическую функцию, возьмем произвольную коалицию К СI и покажем, что vr (К) = v(K). Если К = ф, то, очевидно, vr (К) = 0 = v(K). Предположим поэтому, что К ¥= ф. Пусть каждый игрок i Е К выбирает свою стратегию xf = К \i. Составим из индивидуальных стратегий х * (z Е К) коалиционную стратегию коалиции К, которую обозначим через х%. Возь- мем также произвольную стратегию Xj\K коалиции 1\К. В ситуаций (х£, Xj\K) коалиция К, очевидно, является замкнутой. Общий ее выиг- рыш согласно (3.4) будет равен * Z Hi(xK,Xj\K) - 2 и(Ю- (3.5) i^K i€:K | К | С другой стороны, стоящая здесь слева сумма является выигрышем иг- рока 1 в ситуации (х^,ху\к) в антагонистической игре Г^, т.е. Нк(хк> х1\к)‘ Кр°ме того, этот выигрыш не зависит от стратегии Х/\к. Значит, v(K)=Hk(x*k,x*i\k) = min Нк(х*к,х^к)^ XJ\K < max min HK (x*K , xt\K ) = uv(JO). (3.6) XK XI\K Обратимся теперь к дополнительной коалиции 1\К. Рассмотрим, как и выше, коалиционную стратегию хДк, состоящую из индивидуальных стра- тегий х* = (I\K)\i для каждого игрока z Е 1\К, и произвольную коалици- онную стратегию хк коалиции К. Пусть Кр(х), р = 1, ...,г, — все замкну- тые коалиции (за исключением 1\К) и все изолированные игроки в си- туации х. Тогда, как и при выводе формулы (3.5), мы имеем X Hf(xKtx^K)= X и(Кр(х))^и(К). i е к р = 1 210
Вместе с тем. как и при выводе формулы (3.6), мы получаем v(K)=HK(xK,x*XK) = max Нк (хк, х*\к ) 1 хк > min max HK(xK,Xj\K) = fr(K). (3.7) ~ XI\K XK Неравенства (3.6) и (3.7) дают нам v(K) = vr(K). □ 3.2. Доказанная теорема имеет принципиальное значение. Во-первых, из нее следует, что теорию абстрактных характеристических функций можно интерпретировать как теорию характеристических функ- ций бескоалиционных игр. Во-вторых, эта теорема вместе с утверждениями п. 1.5 и 1.6 означает своего рода ’’структурную замкнутость” системы из двух свойств харак- теристической функции — персональное™ и супераддитивности. Определяе- мая этими двумя свойствами теория реализуется единственным образом как результат систематического использования принципа максимина в бескоалиционных играх. 3.3. В одном важном частном случае теорему п. 3.1 о реализуемости можно уточнить. Теорема. Если характеристическая функция v вида (3.1) обладает помимо свойств персональности и супераддитивности еще и свойством дополнительности, то существует бескоалиционная игра Г вида (3.3) с постоянной суммой, для которой иг = v. Доказательство этого утверждения является модификацией доказа- тельства теоремы п. 3.1. Как и раньше, множества стратегий игроков х, определяются соотношением (3.3). Это дает нам основание ввести для каждой ситуации конструируемой игры Г понятия замкнутой в этой ситуа- ции коалиции и изолированного игрока. Если Kj(x) — замкнутая в х коали- ция, содержащая игрока i (или сам этот игрок, если он является изолиро- ванным) , то положим для любого i ЕI V(KZ(x)) 1 7 п v(Kj(x)) Ч НАх) = ---------+ — / г(/) - 2 ---------- . \ \К;(х)\ п\У j = i \Kj(x)\ / Здесь, как видно из непосредственного подсчета, Z Hj(x) - v(I), так что ZG I построенная бескоалиционная игра Г является игрой с постоянной суммой. Ясно также, что 2 Я£(х) = иг(/). Из последних двух равенств следует, что vr(7) = v(7). (3.8) Для доказательства того, что иг = и, поступим так же, как и в дока- зательстве теоремы п. 3.1. Взяв коалицию К С1, положив х* =K\i для лю- бого i Е К и приняв xt для i Е 1\К произвольным, мы получаем аналоги равенств (3.5) и (3.6), из чего следует, что и(/С)^г(Ю. (3.9) Применяя те же рассуждения к коалиции 1\К, мы получаем u(ZVOiur(/\ZO. (3.10) 14 211
Сложение неравенств (3.9) и (3.10) дает нам и (К) + v (I \К) иг (К) + v г (/ \А ). (3.11) Но слева здесь стоит по условию дополнительности и(/), а справа — в силу постоянства суммы игры Г — число 1>гС0- Поэтому и ввиду (3.8) в соотношении (3.11) имеет место точное равенство. Но тогда (3.9) и (3.10) также должны быть равенствами, и v(K) = vv(K). □ § 4. ЛИНЕЙНАЯ СТРУКТУРА МНОЖЕСТВА ВСЕХ ХАРАКТЕРИСТИЧЕСКИХ ФУНКЦИЙ 4.1. В линейном пространстве всех вещественных функций на множест- ве 21 множество1^/) всех характеристических функций над / (т.е. функ- ций, обладающих свойствами супераддитивности и персональности) имеет определенное строение. Теорема. В пространстве всех вещественных функций на I (где | / | - п) множество 2^(1) является выпуклым конусом, размерность ко- торого не превосходит 2п — 1. Доказательство того, что 2^(7) является выпуклым конусом, следует из того, что умножение супераддитивной функции на положительное ве- щественное число и сложение двух таких функций не выводит за пределы класса супераддитивных функций. Замкнутость же класса всех персональ- ных функций относительно этих двух операций тривиальна. Для оценки размерности ^(/) достаточно заметить, что все вообще ве- щественные функции над / образуют линейное пространство размернос- ти 2п. При этом все характеристические функции удовлетворяют условию персональности и(ф) = 0, которое является нетривиальным линейным со- отношением. □ Из теоремы п. 4.3 будет следовать, что размерность множества V(I) равна 2п — 1. 4.2. Для указания базиса в множестве ^(/) введем следующие понятия, которые представляют и самостоятельный теоретике-игровой интерес. Определение. Характеристическая функция v называется простой, если она принимает лишь два значения: 0 и 1. Если характеристическая функция v простая, то коалиции К, для которых v(K) = 1, называются выигрывающими, а коалиции К, для которых v(K) = 0, — проигрывающими. Если в простой характеристической функции и выигрывающими явля- ются те и только те коалиции, которые содержат фиксированную непустую коалицию R, то характеристическая функция v, обозначаемая в этом случае через vR , называется простейшей. □ Содержательно простые характеристические функции возникают, напри- мер, в условиях голосования, когда коалиция является выигрывающей, если она собирает более половины голосов (простое большинство) или не менее двух третей голосов (квалифицированное большинство). Более сложным является пример оценки результатов голосования в Со- вете безопасности ООН, где выигрывающими коалициями являются все коа- лиции, состоящие из всех пяти постоянных членов Совета плюс еще хотя бы один непостоянный член, и только они. 212
Простейшая характеристическая функция появляется, когда в голосую- щем коллективе имеется некоторое ’’ядро”, голосующее с соблюдением правила ’’вето”, а голоса остальных участников оказываются несуществен- ными. Очевидно, определение простейшей характеристической функции vR можно записать в виде vR(K) = 1, О, если Кд R, в противном случае. (4.1) 4.3. Число различных простейших характеристических функций над / равно числу непустых подмножеств в/, т.е. 2" — 1. Теорема. Все 2п — 1 простейших характеристических функций над I линейно независимы в совокупности. Доказательство. Выясним, какими могут быть коэффициенты в тождестве X \RvR(K} = ® при любом К С/. (4.2) R С 1 R Ф ф Будем проводить следующее индуктивное рассуждение. Возьмем неко- торую непустую коалицию К С/ и предположим, что для любой коалиции L СК, отличной от К, должно быть \L =0. Согласно (4.1) в равенстве (4.2) можно оставить лишь те слагаемые, для которых R СК. При этом для Л ФК по предположенному должно быть \R - 0. Но тогда (4.2) превратится в равенство \кск(К) = 0. Поэтому из 1^(ЛЭ=1 следует =0, и индуктивный переход обоснован. Таким образом, в тождестве (4.2) все коэффициенты должны обра- щаться в нуль. □ 4.4. Из установленной в предыдущем пункте линейной независимости всех простейших характеристических функций в линейном пространстве, натянутом на множество 2^(7), и из совпадения их числа с размерностью этого пространства (см. п. 2.1) следует, во-первых, что размерность конуса ^(/) всех характеристических функций над / равна 2п — 1, а, во-вторых, что каждую характеристическую функцию над I можно представить, и при- том единственным образом, в виде линейной комбинации простейших ха- рактеристических функций над Z. 4.5* . Теор е м а. Имеет место представление v = S XR(v)uR, (4.3) R С I где XR(v) = X (_ 1)^1- |Klu(/Q. (4.4) К CR Доказательство. Подставим в (4.3) вместо XR (у) правую часть равенства (4.4). Для любого ТС 1 мы получим и(П= 2 ( X (-1)|й|-|К|и(^))ид(П. R CI KCR Очевидно, здесь отличны от нуля только те слагаемые, для которых А СТ; 213
но для этих слагаемых vR (Т) - 1. Поэтому v(T)= z s (-1)|Л |_|KIv(a:), R С Т К С R или, изменяя порядок суммирования, и(Г)= S ( S (- 1)1* 1 - I* 1 )V(K) KCR KCRCT X X (крестиками помечены переменные множества, по которым производится суммирование). Объединяя во внутренней сумме все слагаемые с одинако- вым числом игроков в коалиции R, мы получаем |Г| v(T) = S ( S 2 (- 1)г-1) v(K), KCR r = \K\ \R\=r KCRCT а так как r-элементное множество R, содержащее данное | К |-элемент- ное множество К, можно из данного I Т |-элементного множества Т выбрать ровно С ljrl способами, | 7 | — I A I V(D= 2 ( Т (-1Г- IS,C(7'f' .)v(K). КСТ r= \К \ U I IX | Выделяя слагаемое, соответствующее К = Т, мы, пользуясь формулой би- нома, получаем и(Г) = и(Г)+ X (1 КС т КФТ и справедливость представления (4.3) доказана. □ 4.6. В характеристической функции с п игроками наложение условий дополнительности равносильно наложению 2Л-1 — 1 линейно независимых условий вида (1.5). Переход от характеристических функций к их выпук- лым комбинациям, а также их уможение на положительные числа этих ус- ловий не нарушают. Поэтому множество характеристических функций с п игроками, удовлетворяющих условию дополнительности, является 2п ~1 -мерным выпуклым конусом. § 5. ОСНОВНЫЕ СООТНОШЕНИЯ МЕЖДУ ХАРАКТЕРИСТИЧЕСКИМИ ФУНКЦИЯМИ 5.1. Между характеристическими функциями, каки между другими тео- ретико-игровыми объектами, имеют место естественные соотношения аф- финной эквивалентности и изоморфности. Определение. Две характеристические функции v и vl (5.1) над одним и тем же множеством игроков I называются (однородно) аф- финно эквивалентными, если существует такое к > 0 и такие вещественные at (i El), что для любой коалиции К С / v'(K)=kv(K) + S at. (5.2) iCK 214
Переход от одной характеристической функции к другой, аффинно эк- вивалентной ей, иногда называется ее аффинным преобразованием*), Содержательно различие между двумя аффинно эквивалентными харак- теристическими функциями состоит в различии между начальными капи- талами каждого из игроков при их вступлении в ту или иную игру, а также в различии между теми единицами, в которых измеряются выигрыши коа- лиций (получаемые ими полезности) в условиях этих характеристических функций. Аффинная эквивалентность характеристических функций и и и' далее нами будет обозначаться как v Теорема п. 1.9 по существу утверждает, что аффинно эквивалентные бес- коалиционные игры ймеют аффинно эквивалентные характеристические функции. 5.2. Нетрудно убедиться в справедливости следующих трех свойств аф- финной эквивалентности характеристических функций. 1. Рефлексивность. Каждая характеристическая функция аф- финно эквивалентна самой себе : v '^v. Действительно, достаточно в (5.2) положить k = 1, а все щ — равны- ми нулю. 2. Симметрия. Если v v, то v’ ™ v. В самом деле, пусть имеет место (5.2). Решив это уравнение относитель- но v '(К), мы получим 1 а; v(K)= — v(K) + S — , к кек к и остается заметить, что 1/& > 0. 3. Транзитивность! Если v ™ v и v" то v" s>V. Для доказательства запишем вместе с условием аффинной эквивалент- ности i/и и условия аффинной эквивалентности v" и и': u"(K) = k'v'(K) + S а}. iEK Подставляя сюда выражение для v’ из (5.2), получаем v”(K) = kk’v(K) + S (a'i + kai), iEK где, очевидно, кк'> 0. Мы видим, что аффинная эквивалентность как отношение между харак- теристическими функциями обладает свойствами рефлексивности, сим- метрии и транзитивности. Отсюда, как известно, следует, что множество всех характеристических функций единственным образом распадается *) Иногда аффинная эквивалентность характеристических функций называется их стратегической эквивалентностью. Последний термин представ- ляется неудачным, так как уже сам переход к характеристическим функциям сопро- вождается полным исключением из рассмотрения стратегического аспекта. 215
на попарно непересекающиеся классы, которые мы далее будем называть классами аффинной эквивалентности. 5.3. Непосредственно из соотношения (5.2) следует, что характеристи- ческая функция, аффинно эквивалентная характеристической функции, обладающей условием дополнительности, сама обладает этим свойством. 5.4. Далее нами будут рассматриваться только такие принципы опти- мальности в кооперативных играх, которые ковариантны относительно преобразований аффинной эквивалентности, в том смысле, что реализуе- мость принципов оптимальности не изменяется в результате этих пре- образований характеристических функций, а сами их реализации подвер- гаются аналогичным аффинным преобразованиям. 5.5. Поучительным является пример аффинного преобразования харак- теристической функции при котором А: = 1, а а^— v(i). В этом случае для любого К С 1 будет v'(K) = v(K) + S a^v(K) S v (0^0, z GE К i E К т.е. функция и (К) оказывается неотрицательной. Таким образом, всякая характеристическая функция аффинно экви- валентна неотрицательной. Из неравенства (4.3) непосредственно следует, что всякая суперадди- тивная неотрицательная функция является монотонной. 5.6. Определение. Характеристическая функция v над множеством игроков I называется изоморфной характеристической функции v над Г, если существует такое однооднозначное отображение я: 1-+Г, что при любой коалиции К С I v ) = v(K). □ (5.3) Теорема п. 1.10 означает, что изоморфные бескоалиционные игры имеют изоморфные характеристические функции. Непосредственно проверяется, что отношение изоморфизма характерис- тических функций является рефлексивным, симметричным и транзи- тивным. 5.7. Определение. Изоморфизм характеристической функции на себя называется ее автоморфизмом. □ Если я есть автоморфизм характеристической функции и, то (5.3) переписывается как и(яЛГ) ~ v(К). Утверждение п. 1.11 означает, что автоморфизм бескоалиционной игры порождает автоморфизм ее характеристической функции. Очевидно, тождественная (’’единичная”) перестановка я0 элементов множества I является автоморфизхмом любой характеристической функ- ции v над /; если перестановка я есть автоморфизм v над I, то обратная ей перестановка я"1 также является автоморфизмом и; наконец, если я' и я" — два автоморфзима п, то их произведение я'я" (’’композиция”) также является автоморфизмом v. Сказанное означает, что множество всех автоморфизмов характеристической функции составляет группу. 216
§ 6. АДДИТИВНОСТЬ В ХАРАКТЕРИСТИЧЕСКИХ ФУНКЦИЯХ 6.1. Крайним (’’вырожденным”) случаем супераддитивности характерис- тической функции является ее аддитивность. Определение. Характеристическая функция v называется аддитив- ной, если для любых К, L С 1сК СУ L = ф имеет место v(K) + v(L) = v(KUL). (6.1) Характеристическая функция, не являющаяся аддитивной, называется строго супераддитивной. □ Тривиальной индукцией по числу объединяемых коалиций устанавли- вается, что для аддитивной характеристической функции v при любых попарно пересекающихся коалициях К19 . . . ,Кк будет S v(K,) = v( U A'z); (6.2) 1 = 1 1 = 1 в частности, если каждая из этих коалиций состоит из единственного игро- ка, то S v(z) = v (К). (6.3) i ел В качестве аддитивной можно упомянуть характеристическую функцию из примера 2 п. 2.2. 6.2. Удобный признак аддитивности (супераддитивной) характеристи- ческой функции и дается следующей теоремой. Теорема. Для того чтобы характеристическая функция v была адди- тивной, необходимо и достаточно выполнение равенства S iz(z) = v(Z). (6.4) /е/ Доказательство. Необходимость написанного равенства из аддитивности функции вытекает автоматически. Для доказательства достаточности возьмем произвольные не пересекающиеся коалиции К и L и напишем систему неравенств, вытекаю- щих из супераддитивности функции v (они являются частными случаями формул (1.4) и (1.7)) : и(^) + и(£) и(^О£), S u(z) S и (Г), S v(i) v(L), i^L S u(z)<u(Z\(XU £)), iеЛ(к и L) u(KU£) + u(/\(AzU£))g v(I), S v(i) i<BI (в действительности, на основании условия теоремы в последнем соотноше- нии имеет место знак точного равенства, но нас это в данный момент 217
не интересует). Обратим внимание на то, что в совокупности этих не- равенств слева и справа стоят одни и те же величины. Поэтому, сложив все эти неравенства почленно, мы получим тождественное равенство. Сле- довательно, и каждое из складываемых соотношений является равенством, ив частности, первое из них: v(K) + v(L) = v(K U£) . □ 6.3. Даже строго супераддитивная характеристическая функция может об- ладать некоторыми чертами аддитивности: для некоторых конкретных ко- алиций К и L может выполняться равенство (6.1). В связи с этим для нас будут представлять интерес понятия, вводимые следующим определением. Определение. Игрок i в характеристической функции v над/ называется существенным, если существует такая коалиция К, что u(/O + u(f)<u(XUz). (6.5) В противном случае, т.е. если для любой коалиции К СI будет v(K} + u(z) = v(K U z) , (6.6) игрок / называется несущественным, или”боле ано л/”*) . Коалиция в условиях характеристической функции, содержащая всех существенных в ней игроков, называется носителем в этой характеристи- ческой функции. Если все игроки в характеристической функции являются несуществен- ными, то и характеристическая функция в целом также называется несу- щественной. В противном случае, т.е. если в ней имеется хотя бы один существенный игрок, она называется существенной. □ Заметим, что простая характеристическая функция является несущест- венной тогда и только тогда, когда она нулевая, или же хотя бы один игрок z является выигрывающим, т.е. для него u(z) - 1. Если L — некоторое множество несущественных игроков, содержащееся в коалиции К, то итерирование равенства (6.6) дает нам v(K) = v(K\L) + S u(z’) (6.7) i G L В частности, если коалиция К состоит только из несущественных игроков, то v(K)= 2 u(z). (6.8) i G к 6.4. Применим к существенной игре рассуждения п. 5.5. Определение. Характеристическая функция, тождественно равная нулю, называется нулевой. □ Теорема. Для того чтобы характеристическая функция была аффин- но эквивалентна нулевой, необходимо и достаточно, чтобы она была несу- щественной. Доказательство. Необходимость. Пусть характеристичес- кая функция v аффинно эквивалентна нулевой. Это значит, что найдутся такие к > 0 и a^iG/), что для любого KCI будет kv(K} + Z at = 0. (6.9) i Е К Термин ’’болван” происходит от английского слова dummy (что означает фик- тивного игрока в карты, открытыми картами которого могут распоряжаться реальные играющие; немецкий термин Strohmann имеет тот же смысл). 218
В частности, для любого игрока i G1 должно быть v(z) = - а,/К. Но тогда согласно (6.9) должно быть v(K) = X v(i), т.е. характеристическая i G К функция v — несущественная. Достаточность. Если характеристическая функция v — несущест- венная, то достаточно подвергнуть ее преобразованию аффинной эквива- лентности, положив к = 1 и i>(z) = — а,. □ Таким образом, несущественная характеристическая функция ли- шена какого-либо кооперативного содержания. Это не мешает ей иметь стратегическое содержание. Например, именно такой является характерис- тическая функция антагонистической игры. Кроме того, из доказанной теоремы следует, что все несущественные характеристические функции с одним и тем же множеством игроков аф- финно эквивалентны друг другу. 6.5. Свойство аддитивности для отдельных коалиций К и L остается инвариантным при аффинно эквивалентных преобразованиях. Т е о р е м а. Если v' и, то равенство (6.1) равносильно равенству v\K}^v\L) = v\K^L}. (6.9) Доказательство. Найдем А:>1 и вещественные Д/, указанные в определении аффинной эквивалентности. Тогда v’(K) = kv(K) + Z аь i е к v'(L) = kv(L)+ S аь i G L v '(К U £) = kv(K U L) = S ah ПЕК и L и равносильность равенств (6.1) и (6.9) оказывается очевидной. 6.6. Формальная характеризация носителя игры дается следующей тео- ремой. Теорема. Для того чтобы коалиция N СI была носителем в характе- ристический функции v над I, необходимо и достаточно, чтобы для любой коалиции КС I было и(А?) = и(Л? O7V) + X u(z). (6.10) i G К \ N Доказательство. В силу п. 5 5 доказательство достаточно провес- ти лишь для случая неотрицательной характеристической функции. Нео бходимость. Пусть N — носитель в v . Тогда разность K\N состоит только из несущественных игроков, и согласно формулам (6.7) и (6.8) мы имеем (6J0). Достаточность. Пусть коалиция N такова, что равенство (6.10) выполняется для любой коалиции К, a i — существенный игрок в v . Возь- мем ту коалицию K^i, для которой выполняется неравенство (6.5). Применение к коалиции К Vi равенства (6.10) дает нам и(^и/) = К(^иОп^)+ К/)- (6.Н) j е (к и z)\tv 219
Вычитая почленно (6.10) из (6.11) , мы получаем v(K U z) - V(K) = v((K U z) П TV) - v(K П TV) + + 2 у(/)~ 2 y(/). /e(xuz)w /ет (6.12) Если теперь i ^N, то (К U z) \Ni=K\N, и (6.12) переписывается как v(KUi)-u(K) = v(i), что неверно ввиду (6.5). Следовательно, iGN. □ 6.7. Определенная в п. 6.3 несущественность игрока носит как бы универсальный характер: она проявляется во всех его взаимодействиях со всеми коалициями. Вместе с тем представляет интерес и некоторая локальная несущественность игроков. Определение. Коалиция К в характеристической функции называется линей- ной, если сужение и на 2 является аддитивной функцией (т.е. несущественной характеристической функцией над К). Содержательно линейную коалицию можно представлять себе в виде группы участ- ников экономического процесса, располагающих однотипными и одинаково ском- плектованными ресурсами. Ясно, что для таких участников нет смысла вступать в отношения обмена, а их объединение для совместного производства (в условиях линейной производственной функции) не приведет к повышению эффективности этого производства. Ясно, что присоединение к линейной коалиции любого множества несущественных игроков линейности коалиции не изменит. § 7. 0 - 1-РЕДУЦИРОВАННАЯ ФОРМА 7.1. По многим соображениям, и в том числе для возможностей сравне- ния значений различных характеристических функций на одной и той же коалиции, представляется удобным произвести своего рода нормировку характеристических функций. Определение. Характеристическая функция v над I называется 0 — \-редуцированной (имеет 0 — 1-редуцированную форму) , если l»(z) = 0 для любого iCl, (7.1) и(/)=1. (7.2) Из определения следует, что всякая 0—1-редуцированная характеристи- ческая функция является неотрицательной и потому неубывающей: из КС L следует v(K)^ v(K) + v(L\K) < v(L) . 7.2. T e о p e м а. Всякая существенная характеристическая функция аффинно эквивалентна некоторой 0 — ^-редуцированной характеристичес- кой функции, и притом ровно одной. Доказательство. Пусть v — существенная характеристическая функция. Будем строить нужное преобразование аффинной эквивалент- ности, находя соответствующие к и at из п. 5.1. 220
Напишем для этого систему из п + 1 уравнений с п + 1 неизвестными: u'(z') = kv(j) +az = 0 для iGI, (7.3) v'(I) = kv(J)+ 2 а^О. (7.4) i е I Матрица этой системы 1 0 ... О i>(l) О 1 ... О д(2) О О ... 1 «(и) _ 1 1 ... 1 и(1) (7-5) имеет определитель, равный п v(I)- S v(J), i = 1 который в силу существенности характеристической функции является положительным. Тем самым доказываемая теорема становится элементар- ным алгебраическим фактом. □ 7.3. Фактическое решение системы (7.3) — (7.4) не составляет труда. Вычитание всех уравнений (7.3) из (7.4) дает нам k(v(I) — L u(z))= 1, « е 7 откуда немедленно находится как искомое к > 0, так и все а, = u(z) (и(/) - S и(/))-1. i (= I 7.4. Например, в случае игры из примера 2 п. 2.2 0 -1-редуцированной формой будет характеристическая функция v, для которой и (К) = = в(кмв(1). 7.5. Заметим попутно, что множество всех 0 — 1-редуцированных харак- теристических функций над данным множеством игроков является вы- пуклым. 7.6. В соответствии со сказанным в п. 3.4 мы можем вместо отдельной характеристической функции рассматривать целый класс аффинно эквива- лентных функций. Вместо же такого класса мы можем в свою очередь рассматривать одного из представителей этого класса. В качестве представителя класса несущественных характеристических функций с данным множеством игроков мы будем рассматривать нулевую характеристическую функцию над этим множеством, а в качестве представи- теля каждого из классов существенных характеристических функций - соответствующую 0 — 1-редуцированную характеристическую функцию. 7.7. Подобно 0 — 1-редуцированным формам характеристических функ- ций можно рассматривать при произвольных а и b (па Ф Ь) также и ”а — b -редуцированные” их формы, понимая подними такие характерис- тические функции v \ ддя которых v '(z) - a, z G Z, '(/) “ b. Нетрудно показать, что всякая существенная характеристическая функ- ция имеет ровно одну а - ^-редуцированную форму, каковы бы ни были а и Ъ (если па Ф Ь) . 221
Кроме уже упомянутых 0 — 1-редуцированных форм, в теории игр чаете * рассматриваются еще и - 1-0- редуцированные формы. § 8. ПЕРЕЧИСЛЕНИЕ ХАРАКТЕРИСТИЧЕСКИХ ФУНКЦИЙ С МАЛЫМ ЧИСЛОМ ИГРОКОВ 8.1. В соответствии со сказанным в п. 7.4 мы будем для любого числам игроков фиксировать наличие нулевой характеристической функции как представителя класса несущественных характеристических функций, а также перечислять все 0 - 1-редуцированные характеристические функции как представителей классов существенных характеристических функций. Из сказанного в п. 4.1 следует, что каждая характеристическая функция с числом игроков п описывается 2Л — 1 параметрами. При 0 — 1-редукции на характеристическую функцию накладывается п + 1 линейно независимых связей, так что каждая 0 — 1-редуцированная характеристическая функция описьюается 2Л - п — 2 параметрами. Из сказанного в п. 4.5 следует, что каждая характеристическая функция над п игроками, обладающая свойством дополнительности, описывается 2Л “ 1 параметрами. Следовательно, каждая 0 — 1-редуцированная характе- ристическая функция над п игроками описывается 2Л’-1 - п — 1 парамет- рами. 8.2. При п = 2 число параметров 2Л - п - 2 равно нулю. Выпуклое же (см. п. 5.4) нульмерное множество должно состоять из единственной точки. Значит, имеется единственная 0 — 1-редуцированная характеристическая функция над двумя игроками. Именно, для I = {1, 2) должно быть и(ф) = = и(1) = и(2) = 0. v(I)= 1 (что, впрочем, непосредственно вытекает из определения 0 — 1-редуцированной характеристической функции). Подсчет числа параметров 2п~1 - п — 1, определяющих 0 — 1-редуци- рованные характеристические функции с условиями дополнительности, имеет смысл лишь в случаев > 2, а 0 — 1-редуцированных характеристичес- ких функций двух лиц с условием дополнительности просто нет. 8.3. При п = 3 каждая 0 - 1-редуцированная характеристическая функ- ция определяется 23 —3 — 2=3 параметрами. Очевидно, в качестве таких 222
параметров естественно взять и(1,2) = с3, и(1,3) = с2, u(2,3) = Ci. (8.1) Заметим, что к такому выводу приводит и непосредственное выписывание условий персональности и 0 — 1-редуцированности. В силу сказанного в конце п. 5.5, О = и(1) < и(1,2) = с3 и(1,2, 3) = 1, т.е. О <с3 < 1. Аналогично мы получаем, что 0 < < 1 и 0 < с2 — 1. Таким образом, каждая 0 — 1-характеристическая функция трех лиц описывается тройкой чисел (ci ,с2,с3) ,где [0, l],z = 1, 2, 3, которую можно интерпретировать как точку трехмерного единичного куба (рис. 4.1). Описание множества всех 0 — 1-редуцированных характеристических функций трех лиц в виде куба не имеет какого-либо принципиального значения, но наглядно и удобно. Согласно п. 8.1 семейство всех 0 — 1-редуцированных характеристичес- ких функций трех лиц с условием дополнительности имеет размерность 22 — 3 — 1 =0, т.е. состоит из единственной характеристической функции. Для нее должно быть с} = с2 = с3 = 1 (см. жирную точку на рис. 4.1) *). Для 0 — 1-редуцированной формы игры из примера 3 п. 2.2 мы,очевидно, имеем: Ь - а с3 =н(П15 П2) =0, с2 =и(ПьПр) =----------, с - а Ci =и(П2,Пр) = 1, и ей примерно соответствует точка, помеченная на рис. 4.1 крестиком (мы считаем продавца игроком 3) . 8.4. Характеристическая функция v трех лиц, описываемая соотноше- ниями (8.1) , имеет нетривиальный автоморфизм 1 2 3 2 1 3 В такие характеристические функции игроки 1 и 2 входят равноправно, если Ci = с2. Соответствующие точки куба составляют диагональную плос- кость (рис. 4.2). Аналогично описывается характеристическая функция с автоморфизмом /1 2 3 \1 3 2 /12 3 или \ 3 2 1 Им соответствуют точки, лежащие на других диагональных плоскостях. Наконец, симметричные характеристические функции, для которых ci =с2 = с3, имеют автоморфизмами все шесть перестановок игроков. Им соответствуют точки, лежащие на диагонали куба (рис. 4.3) . *) Заметим, что точка куба на рис. 4.1, лежащая в начале координат, не соот- ветствует классу несущественных игр, которым вообще нет места в этом пред- ставлении. 223
Рис. 4.3 8.5. Переходим к случаю п = 4. Размер- ность пространства всех 0 — 1-редуциро- ванных характеристических функций ра- вна 24 —4 — 2=10, и это пространство ед- ва ли поддается наглядной геометрической интерпретации. Размерность пространства всех 0 — 1-ре- дуцированных характеристических функ- ций с условием дополнительности равна 23 —4—1=3. Для таких характеристичес- ких функций мы автоматически имеем »(Ф) = и(1) = 17(2) = 17(3) = 0, 17(/) = 17(2, 3,4) = 17(1,3,4) = = 17(1,2,41 = 17(1.2,3)= 1, и, кроме того, можно в соответствии с условием дополнительности поло- жить и(1,4) =Ci, и(2,4) = с2, и(3,4) = с3, 17(2,3)= 1 - С*!, 17(1,3) = 1 - с2, 17(1,2) = 1 -с3. Значит, каждую из таких характеристических функций можно изобразить точкой того же куба на рис. 4.1. 8.6. Разнообразие классов аффинной эквивалентности (или, что то же самое, 0 — 1-редуцированных характеристических функций) растет с увели- чением числа игроков весьма быстро. Например, размерность множества классов игр пяти лиц равна 25 (в случае условия дополнительности эта размерность равна 10). Для шести игроков соответствующие числа равны 56 и 25 и т.д. Ясно, что при п > 4 приходится ограничиваться рассмотрением отдель- ных классов таких игр, а для построения их полной систематической теории необходимо привлечение какие-либо новых комбинаторных идей. § 9. ДЕЛЕЖИ И КЛАССИЧЕСКИЕ КООПЕРАТИВНЫЕ ИГРЫ 9.1. Как уже отмечалось, характеристическая функция бескоалиционной игры является весьма неполной реализацией принципа оптимальности максиминного типа, как таковая нуждается в уточнении и действительно может быть уточнена. Это уточнение мы будем осуществлять в виде расчле- ненного на этапы нормативного (оптимизационного) описания распределе- ний полезностей между игроками в условиях каждой конкретной характе- ристической функции. 9.2. Предположим, что при 'распределении полезности, имеющейся в распоряжении множества игроков Z, каждый игрок i получит сумму . В результате распределение полезностей может быть описано вектором выигрышей х = (%i, .. . , хп) . Очевидно, каждый раз в конкретных условиях распределения полезнос- ти возможно осуществление не произвольного вектора выигрышей, а лишь такого, который удовлетворяет некоторым ограничениям, вытекающим из условий распределения полезности. 224
Определение. Вектор х: I-+R (т.е. вектор, компоненты ко- торого соответствуют игрокам данной характеристической функции v над I ) называется дележом в условиях v , если он удовлетворяет некото- рым условиям, выраженным через значения v и соответствующим содержа- тельно возможностям реализации х. □ В условиях дележа х каждая коалицияKCI получает сумму S & xh Мы будем часто обозначать эту сумму через х(Л'). Такое обозначение как бы напоминает о том, что дележ с неотрицательными компонентами можно понимать как меру. Ясно, что условия реализуемости, накладываемые априори на вектор х из сформулированного определения, могут быть весьма разнообразными. Множество всех допустимых в условиях характеристической функции v дележей будем обозначать через <AV . Определение. Тройка Г = <7, и, Ли>, (9.1) состоящая из множества игроков I, характеристической функции v над I и множества дележей ^VCRZ, называется классической кооперативной игрой. □ В данной книге мы ограничимся только одним из вариантов таких условий, которым должны удовлетворять дележи, составляющие множест- во 9.3. Рассмотрим некоторую характеристическую функцию v над мно- жеством игроков I . Сформулируем условия, при которых вектор выигрышей х может считаться допустимым в бескоалиционной игре с данной характеристичес- кой функцией v (равно как и в любых иных конфликтных отношениях с этой характеристической функцией) и может с реальными основаниями рассматриваться как разумный договор между участниками игры в усло- виях ' неограниченного последующего распределения между игроками, получаемых коалициями выигрышей. Реальность этих оснований мы будем далее понимать как их необходимость, как своего рода частичную систему аксиом, определяющих оптимальность дележа. Во-первых, естественно потребовать, чтобы дня каждого i ЕI было xz^u(f). Действительно, в противном случае игроку i при распределении благ х будет предложено меньше, чем он может получить форсированно, действуя совершенно самостоятельно и не заботясь о согласии каких-либо других игроков. Если же игроку i будет в распределении х предложена доля, меньшая чем v(i), то он откажется участвовать в таком распределении, и это распределение тем самым не будет реализовано. Во-вторых, необходимо, чтобы было х(7) = v(I). (9.3) В самом деле, в случае х(7) <и(7) вся совокупность игроков 7 получает меньше, чем она могла бы получить в условиях характеристической функ- ции , v . Вместо этого I может добиться получения и(7) и распределить это 15.Н.Н. Воробьев 225
количество так, чтобы каждый игрок zE/получил больше, чем его доля Xj. Следовательно, такое распределение х можно считать невыгодным и потому недопустимым. С другой стороны, если бы было x(I) > v(I) , то это означало бы, что игроки из I делят между собой сумму, превосходящую ту, которая нахо- дится в их распоряжении. Значит, в этом случае вектор выигрышей х просто неосуществим. Условие (9.2) называется условием индивидуальной рациональности вектора х, а условие (9.3) — условием его коллективной рациональности (или групповой рациональности). Далее мы под дележом в условиях характеристической функции v над I будем понимать вектор х: I удовлетворяющий условиям индивидуаль- ной рациональности (9.2) и коллективной рациональности (9.3). 9.4. Опишем в явном виде множество всех дележей в классической кооперативной игре. Теорема. Для того чтобы вектор х = (*i ,... ,х„) был дележом в классической кооперативной игре </, и, >, необходимо и достаточно, чтбы было Xi = v(i) + az, i G 7, причем S ai = v(I)— S v(i). (9.4) i e i i(= i Доказательство. Достаточность устанавливается простой провер- кой условий индивидуальной и коллективной рациональности вектора х. Для доказательства необходимости положим Xj - v(i) = а(. (9.5) Из (9.2) следует, что а > 0. Суммируя почленно все равенства вида (9.5) и учитывая (9.3), мы получаем (9.4) . □ 9.5. В частности, если в кооперативной игре Г = </, и, > характеристи- ческая функция v является несущественной, то правая часть неравенства в (9.4) должна обращаться в нуль, откуда следует, что должно быть = О при всех i G I. Это значит, что в несущественной кооперативной игре имеет- ся лишь один дележ: (и(1), ... ,и(п)). С другой стороны, если в кооперативной игре Г характеристичес- кая функция v имеет 0 — 1-редуцированную форму, то множество всех дележей оказывается симплексом = {(*!> • • • ,хпУ- Xi^O, iel; х(/)=1), а компоненты каждого дележа (т.е. доля каждого игрока в нем) естествен- но понимать как его барицентрические координаты в >AV . Мы видим, что смешанные стратегии в бескоалиционных играх и дележи в кооперативных играх описываются одними и теми же математическими образами: точками (векторами) в симплексе, задаваемыми своими бари- центрическими координатами. Это приводит и к одинаковым геометричес- ким изображениям тех и других. Однако, видя такое наглядное сходство и проводя формальные аналогии, не следует забывать о глубоком содержа- тельном различии между ними: компонентами смешанной стратегии игрока являются вероятности тех или иных его действий (чистых стратегий), а компонентами дележа — доли полезности различных игроков. При этом 226
то, что доли полезности также могут выступать в физическом облике вероятностей, очевидно, дела не меняет. 9.6. Между дележами в аффинно эквивалентных характеристических функциях имеется естественное соответствие. Определение. Пусть v'(/Q = Jb(tf) + Z аг (9.6) и х G Л v. Дележом х ГЕ Л и', соответствующим дележу х в условиях описы- ваемой в (9.6) аффинной эквивалентности, называется дележ х', для i -й компоненты которого будет х- =kxi + щ. □ (9.7) 9.7. Если х = (лгх,.. ., хп) Е Л v и тт — автоморфизм v , то положим ях = (хЯ1,... 9.8. В настоящее время в теории игр рассматриваются также кооператив- ные игры более общего типа, чем определенные только классические коопе- ративные игры. Мы, однако, в дальнейшем ограничимся рассмотрением лишь классических кооперативных игр, которые будем называть просто кооперативными играми. Поскольку основной и определяющей составной частью кооперативной игры является характеристическая функция, коопе- ративные игры нередко называют также играми в форме характеристичес- кой функции. 9.9. По подходу к изучаемым явлениям и по их математической трактов- ке теория кооперативных игр близка к рассматривавшейся в предыдущих главах теории бескоалиционных игр. Подобно ситуации в общей теории бескоалиционных игр (ср. гл.З. п.4.2), дележ в теории кооперативных игр можно содержательно понимать как договор между игроками о распределении получаемой ими всеми суммы »(/). Однако следует иметь в виду важные черты различия между этими двумя теориями. Прежде всего бескоалиционные игры являются стратегическими в том смысле, что в них исход (ситуация) формируется в результате, дейст- вия тех самых игроков, которые в этой ситуации получат те или иные выигрыши. Напротив, исходом кооперативной игры является дележ, который возникает не как следствие тех или иных действий игроков, а как результат их соглашений. В соответствии с этим в кооперативных играх сравниваются по предпочти- тельности не ситуации, как это имеет место в бескоалиционных играх, а дележи, и сравнение это не ограничивается рассмотрением индивидуаль- ных выигрышей, а носит более сложный характер. Различие в характере предпочтений обусловливает и различия в представ- лениях об оптимальном для этих классов игр. Принципы оптимальности в кооперативных играх оказываются весьма разнообразными и часто довольно сложными. Рассмотрению некоторых из них посвящена вся оставшаяся часть этой главы. Определение. Кооперативные игры Г = </, v' <AV > и Г' = </, иЛ v>) с одними тем же множеством игроков называются аффинно эквивалентны- 15 227
ми, если аффинно эквивалентны характеристические функции и и v', а каждому дележу х Е ,А v поставлен соответствие определяемый в (9.7) соответствующий ему дележ xEjv'. □ Поскольку в принятых нами соглашениях характеристическая функ- ция v однозначно определяет множество дележей <А„, она однозначно опре- деляет и всю кооперативную игру < I, v, *AV), На этом основании мы можем понятия характеристической функции и кооперативной игры отождеств- лять, пользуясь терминами ’’характеристическая функция” и ’’кооператив- ная игра” как синонимичными. В частности, мы будем на кооперативные игры переносить формулиров- ки всех свойств характеристических функций, и в том числе такие, как дополнительность, существенность или несущественность (аддитивность), О — 1-редуцированность и т.д. § 10. ДЕЛЕЖИ И ХАРАКТЕРИСТИЧЕСКИЕ ФУНКЦИИ 10.1. Присоединение к заданию характеристической функции множества допустимых дележей, т.е. ее превращение в кооперативную игру, можно рассматривать как своего рода оптимальное решение задачи, которая описывается характеристической функцией. Это значит, что характеристи- ческая функция бескоалиционной игры находит в соответствующей ей кооперативной игре некоторое свое оптимизационное уточнение. Однако множество всех дележей, очевидно, оказывается при этом все еще недоста- точно точным решением, и возникает естественная задача указать в качестве такого оптимального решения некоторое меньшее множество дележей, а в идеале — единственный дележ. Один путь построения таких оптимальных решений состоит во введении на множестве всех дележей некоторого достаточно естественного отноше- ния предпочтения и в объявлении ’’решением” того дележа или того мно- жества дележей, которые удовлетворяют в смысле этого отношения тем или иным условиям максимальности. На этом пути мы получим оптималь- ные решения, которые называются с-я дро м (см. § 13) и решением по Нейману - Моргенштерну (см. § 16). Другой путь основан на введении формальных описаний тех требований, которые естественно предъявлять к оптимальным дележам, придании этим требованиям смысла аксиом и нахождении описания оптимальных решений дедуктивным путем. На этом пути мы в § 20 придем к понятию ’’справедли- вого дележа” (который называется вектором Шепли). Заметим, что получае- мые на таком аксиоматическом пути оптимальные решения можно также получить и как оптимальное решение некоторой оптимизационной задачи над множеством дележей, понимаемым как подмножество (симплексов) в евклидовом пространстве. 10.2. Хотя понятие дележа логически и связано с понятием характеристи- ческой функции, но в принципе является внешним по отношению к нему. Поэтому уточнение формальной связи между этими понятиями оказывает- ся достаточно плодотворным. Основой этой связи может служить соотно- шение между выигрышами (полезностями), получаемыми коалицией на основании характеристической функции, с одной стороны, и на основании того или иного конкретного дележа - с другой. Некоторые из таких соот- 228
ношений были рассмотрены в п. 9.3 как условия индивидуальной и кол- лективной рациональности. Они касались значений характеристической функции для отдельных игроков и для ’’большой” коалиции. Включим в рассмотрение свойства ’’рациональности” дележей для другий коалиций. Определение. Эксцессом дележа х для коалиции К в условиях характеристической функции v называется разность ev(x, K)=v(K) — — х(К). □ Содержательно эксцесс есть разность между тем количеством v(K), на которое коалиция К может уверенно рассчитывать в условиях харак- теристической функции v, и тем количеством, которое на основе дележа х получат в сумме все участвующие в ней игроки. Таким образом, положи- тельный эксцесс можно понимать, с одной стороны, как ’’запас” в реализуе- мости компонент дележа для игроков из А? в условиях х, а с другой — как степень неудовлетворенности коалиции К дележом х в условиях v. Ясно, что в результате автоморфизма тг характеристической функции эксцесс дележа не изменяется: env (ттх, ттК) = ev (х, К). 10.3. Дележи с неотрицательными эксцессами можно считать осущест- вимыми. Определение. Дележ х называется эффективным для коалиции К в условиях характеристической функции v, если ev(x, К) =v(K) — -х(К)^0. □ Наглядно можно интерпретировать и неэффективность дележа х для К в условиях v. Она состоит в вынужденной приемлемости х для К, т.е. в том, что коалиция К, оказавшись в условиях неэффективного для нее дележа, не будет иметь возможностей изменить его для себя в лучшую сторону и не будет тем самым стремиться к его изменению. Следовательно, если дележ не яйляется эффективным ни для какой коалиции, то он оказывается весьма устойчивым и может в этом своем качестве квалифицироваться как оптимальный. Определение. Дележ называется абсолютно неэффективным в условиях характеристической функции v, если он не эффективен ни для какой коалиции в условиях v. □ Множеством всех абсолютно неэффективных дележей мы займемся в § 13 и следующих за ним. § 11. ДОМИНИРОВАНИЕ ДЕЛЕЖЕЙ 11.1. На множестве дележей в любой кооперативной игре можно указать некоторое достаточно естественное отношение предпочтения. Пусть х = (%1,.. ., хп) и у = (у 1,..., уп) — два дележа в кооперативной игре v, а К С / —некоторая коалиция. Определение. Говорят, что дележ х доминирует дележ у по коа- лиции К, если выполняются следующие два условия: 1) эффективность доминирующего дележа: х(Л (ПЛ) 2) предпочтительность: X/ >у/ для всех / G К. (И.2) 229
Доминирование дележа у дележом х по коалиции К обозначается через х > у (или иногда через xRKy), а множество всех дележей, доминируемых к дележом х по коалиции К, — через domк х. □ Из соотношения (11.2) следует, что множество dom^x есть открытое выпуклое подмножество множества всех дележей. Ясно также, что из х> у следует, что х> Хх + (1 — X) у при любом XG [О, 1]. к к 11.2. Соотношение доминирования по коалиции К, т.е. х> у, выражает к некоторое предпочтение, отдаваемое коалицией К дележу х по сравнению с дележом у. Оно призвано отражать то обстоятельство, что при выборе из двух дележей х и у коалиция К выберет х. Это можно понимать и так, что при предъявлении коалиции К дележа у как договора, коалиция К имеет основания выступать против у, предлагая в качестве альтернативы дележ х. Фигурирующее в определении доминирования условие эффективности уже комментировалось нами в п. 10.2. Оно означает, что сравниваемый коалицией дележ х должен быть, прежде всего, реализуемым этой коали- цией: сумма выигрышей каждого из членов коалиции не должна превос- ходить уверенно получаемое ею количество. В противном случае коалиция, встретившись с дележом, дающим ей столько, сколько она самостоятельно не в состоянии добиться, должна согласиться на него и не заниматься его сравнением с какими-либо другими дележами. Условие предпочтительности отражает необходимость ’’единодушия” в предпочтении со стороны коалиции: если хотя бы одно из неравенств (11.2) будет нарушено, т.е. если хотя бы для одного из членов коалиции К выигрыш в условиях дележа у будет не меньшим, чем в условиях деле- жа х, то можно будет говорить о предпочтений дележа х дележу у не всей коалицией К, а лишь теми ее членами, для которых соответствующее неравенство (11.2) соблюдается. 11.3. Определение. Говорят, что дележ х доминирует дележ у, если существует такая коалиция К, по которой дележ х доминирует дележу (т.е. имеет место х > у). к Доминирование дележа у дележом х обозначается через х > у (или иногда как xRy), а множество всех дележей, доминируемых дележом х, через dom х. □ Очевидно, domx = U domxx. Поэтому множество domx также к ст является открытым. Из х > у следует, что х > Хх + (1 - X) у при любом X G [0, 1). Доминирование дележом х дележа у означает, что в ’’обществе” (т.е. в множестве всех участвующих в игре игроков /) найдутся такие ’’силы” (т.е. такая коалиция К}, которые б>дут выступать в пользу дележа х при его сравнении с дележом у. Отношение доминирования, вообще говоря, не обладает теми свойст- вами отношений, которые обычно упрощают их анализ. Так, ввиду стро- гости неравенств (11.2) отношение доминирования не может быть рефлек- сивным. Симметричность его возможна (гак как дележ х может домини- 230
ровать дележ у по одной коалиции, в то время как дележ у доминирует дележ х по другой), но не обязательна. То же можно сказать и о транзи- тивности доминирования. Из того, что х доминирует у (т.е. имеется коа- лиция, предпочитающая х по сравнению с у), а у доминирует z (т.е. имеется коалиция, предпочитающая у по сравнению с z), еще никак не следует доминирования дележа z дележом х (т.е. существования коалиции, кото- рая предпочитала бы х по сравнению с z). 11.4. Доминирование возможно не по всякой коалиции. Так, ни в какой кооперативной игре невозможно доминирование по коалиции, состоящей из единственного игрока, а также по множеству всех игроков /. Действительно, из х> у следовало бы yt< xf< u(z), а это противо- речит индивидуальной рациональности дележа у. Из х> у следовало бы х- >у- для всех /6/, и потому х(Г) >у(1) = 2 = и(/), что противоречит коллективной рациональности дележа х. 11.5. Нетрудно показать, что для одновременного выполнения доминирований х> у и у > х в кооперативной игре необходимо, чтобы число игроков п в ней было не меньше пяти. В самом деле, пусть л =4, х >у иу > х. В силу строгости неравенств (11.2) долж- К L но быть К n L =ф. Поэтому каждая из коалиций К и L должна состоять ровно из двух игроков. Не нарушая общности, можно считать, что К = {1, 2} и L = {3, 4}. Мы имеем в силу х >у хх + х2 и(1, 2), а в силу у >х - х3+х4 < у3 + у4 < и(3, 4). К L Сложение этих неравенств дает нам xi + х2 + хз + х4 < и(1, 2) + и(3, 4) < v (I), что противоречит коллективной рациональности дележа х. 11.6. Отношения доминирования по какой-либо коалиции (а тем самым и отношение доминирования) инвариантны относительно аффинной эк- вивалентности. Теорема. Если v и v — две аффинно эквивалентные характеристичес- кие функции, причем дележам х и у соответствуют дележи х и у, то из х > у следует х > у . к к Доказательство. Пусть v,(K) = kv(K) + S at i£K Доминирование x > у означает х(АЭ^и(АЭ, К Xi>yi Но тогда х'(К) = S (кх-+а.) = iEK = к 2 х- + S я.< kv(K}+ S a. = i/(A3, iEK i(=K i<=K y'i ~ kyt + at < kxt + at = x/, т.е. x > y’. □ к 231
11.7. № сказанного следует, что все явления, описываемые в терминах доминирования дележей, относятся не к самим кооперативным играм, а к их классам аффинной эквивалентности. Следовательно, эти явления достаточно изучать для несущественных игр по нулевым играм, а для существенных игр — по их 0 — 1-редуцированным формам. 11.8. Отношение доминирования сохраняется и при автоморфизмах характеристической функции. Теорема. Если тт — автоморфизм характеристической функции v, а К — коалиция, то из х >у следует ттх > тту. К 7Т к Доказательство очевидно. □ Отсюда немедленно получается: из х> у следует ттх> тту. 11.9. Доминирование в условиях простой (и в том числе — простейшей) характеристической функции возможно лишь по выигрывающим коали- циям (отличным от множества / всех игроков). Действительно, если v(K) = 0, то из х > у следовало бы к у(К)< х(К)^и(К) =0, чего не может быть ввиду неотрицательности компонент дележей. С другой стороны, если характеристическая функция v — простейшая: v = vR, а К Э R, то для х >у необходимо, чтобы было ЯЛ< *(Л 1. (11.3) § 12. ПРИМЕРЫ ДОМИНИРОВАНИЯ ДЕЛЕЖЕЙ 12.1. В любой несущественной игре согласно п. 9.5 имеется только один дележ, и потому никаких доминирований в ней нет. 12.2. В играх двух лиц всякая коалиция либо состоит из единственного игрока, либо совпадает с множеством всех игроков. Поэтому согласно п. 11.4 в играх двух лиц доминирование дележей невозможно. 12.3. Опишем доминирование дележей в существенной игре трех лиц (мы можем считать, что она имеет 0 — 1-редуцированную форму). Начнем с того случая, когда рассматриваемая кооперативная игра обла- дает свойством дополнительности: Сх ~с2 = с3 = 1 (см. п. 8.3). Пусть х = (%1, х2, х3) и у = (У1, у2, J3) — два дележа. Как указывалось в п. 11.4, доминирование невозможно ни по одной из одноэлементных коалиций 1, 2 или 3, ни по трехэлементной коалиции {1, 2, 3}. Следова- тельно, доминирование возможно лишь по одной из двухэлементных коалиций {1,2}, {1,3} или {2,3}. Будем представлять дележи в рассматриваемой кооперативной игре как тройки барицентричных координат точек в треугольнике 123. Доминирование х > у означает, во-первых, что Xi +х2 < и(1, 2) = 1 и, 1,2 во-вторых, что yi < Xi, у2 < х2. Первое из этих условий выполняется автоматически: хг +х2 = 1 — х3 1, и поэтому мы на нем останавливаться не будем. Во втором же условии >4 < xt означает, что прямая, параллель- ная стороне треугольника 23 (рис. 4.4) и проведенная через точку х, лежит 232
ближе к вершине 1 треугольника, чем параллельная ей прямая, проведенная через точку у. Точно так же у2 < Ti означает, что точка х лежит к верши- не 2 ближе (в том же самом смысле), чем точка у. Таким образом, множество всех дележей, доминируемых данным деле- жом х по коалиции {1,2}, составляет в треугольнике всех дележей откры- тый параллелограмм. Он открыт в треугольнике, но не по всей плоскости, в том смысле, что его стороны, лежащие на сторонах треугольника деле- жей, принадлежат ему, а стороны, лежащие внутри этого треугольника, - нет, ибо неравенства (11.2) — нестрогие (рис. 4.5) Рис. 4.4 Рис. 4.5 Рис. 4.6 Аналогично (в сущности, это вытекает из симметричности рассматривае- мой игры (см. п. 8.4) и сохранения доминирования при автоморфизмах (см. п. 11.8)) множество дележей, доминируемых дележом х по коали- циям {1,3}и{2,3}, образует два дальнейших открытых параллелограмма, направленных в сторону вершин 2 и 1. Таким образом, множество всех дележей, доминируемых дележом х, описывается на рис. 4.6 заштрихован- ной областью. 12.4. Непосредственно из описания множества всех дележей, доминируе- мых данным дележом, видно, что для того, чтобы из двух данных дележей ни один не доминировал другого, необходимо и достаточно, чтобы прямая, проведенная через соответствующие им точки, была параллельна одной из сторон треугольника дележей. 12.5. Рассмотрим теперь доминирование дележей в общей игре трех лиц. Напишем снова условия доминирования дележом х= (хь х2, х3) дележа^ = (j^i,у2,у3) по коалиции {1,2}: X] + х2 и(1, 2) =с3, У1< *1, У2< х2. Так как теперь, вообще говоря, может быть с3< 1, первое из этих условий может оказаться существенным, и его нельзя отбросить, как это мы сделали в случае игр со свойством дополнительности. Это условие означает, что соответствующая дележу х точка должна быть расположена не ниже прямой с уравнением + £2 = ^з> или, что то же самое (напом- ним, что мы имеем дело с барицентрическими координатами, в которых равенство £1+£2+£з = 1 выполняется тождественно!), с уравнением ?з = 1-Сэ (рис. 4.7). Таким образом, если дележ х таков, что Xi^l-Ci, х2>1-с2, х3^1-с3, (12.1) 233
Рис. 4.7 Рис. 4.8 Рис. 4.9 то имеются три параллелограмма доминируемых им дележей (рис. 4.8); если одно из неравенств в (12.1) не имеет места (пусть это будет для определенности третье неравенство), то имеются два параллелограмма (рис. 4.9); наконец, если не имеют места два неравенства из (12.1) (ска- жем, последние два), то — лишь один параллелограмм (рис. 4.10). Возможностей для не доминирования одним дележом другого здесь больше, чем в случае игры со свойством дополнительности. Эти возмож- ности можно усмотреть и перечислить, анализируя рис. 4.8—4.10 и аналогич- ные им. Разнообразие возникающих здесь случаев достаточно наглядно демонстрирует комбинаторные трудности, которые возникают при изу- чении вопросов, связанных с доминированием дележей в кооперативных играх, и которые возрастают при увеличении числа игроков. 12.6*. Комбинаторное разнообразие вариантов доминирования дележей в игре возрастает с увеличением числа игроков весьма быстро. Ограни- чимся кратким описанием положения дел в случае игр четырех лиц. Пусть v — характеристическая функция над /= {1, 2, 3, 4}. Согласно сказанному в п. 11.4, доминирование возможно здесь лишь по двухэлемент- ным и трехэлементным коалициям, т.е. всего здесь может быть до Сд + = = 10 типов доминирования. 234
Будем считать, что v задана в 0 — 1-редуцированной форме, и для любых попарно различных i, j, к, I из I v(ij\k) = cl9 (12.2) = (12.3) Заметим попутно, что согласно монотонности характеристической функции v (см., например, п. 7.1) здесь должно быть dkl <ск и dkJ ^Cj (всего наберется, очевидно, 12 таких неравенств). 12.7 *. Возможность х > у наступает тогда, когда дележ х для коалиции 123 {1, 2, 3 } эффективен, т.е. когда хг + х2 + х3 <. с4. Геометрически это озна- чает, что в симплексе дележей соответствующая дележу х точка должна находиться в тетраэдре, отсекаемом от всего симплекса плоскостью + + £2 + £3 = ci, где & — барицентрические координаты в этом симплексе. В этом случае х > у будет иметь место, если х} >У1, х2 >у2 и х3 >у3, 123 т.е. если дележ у находится в параллелепипеде с вершинами хи 4, изобра- женном на рис. 4.11. Подобно параллелограмму с рис. 4.5 этот параллеле- пипед открыт в симплексе всех дележей: он содержит только те свои грани, которые лежат на гранях симплекса. Аналогично описываются возможности доминирования по остальным трехэлементным коалициям. 12.8 *. Доминирование по двухэлементным коалициям опишем на приме- ре коалиции {1, 2}. В этом случае доминирование х> у предполагает 12 эффективность дележа х для {1, 2}, т.е. неравенство Xj +x2=g d^. Геомет- рически это означает, что соответствующая дележу х точка лежит по ту Рис. 4.11 Рис. 4.12 же сторону от плоскости + £2 = d34, что и ребро 34. Доминирование х > у будет при этом иметь место, если хг >у^ и х2 >у2, т.е. если дележу 12 лежит внутри двугранного угла, изображенного на рис. 4.12. 12.9 *. Из сказанного видно, что априорное перечисление всех возможных вариантов доминирования представляется уже в случае игр четырех лиц достаточно затруднительным. Вместе с тем выяснение каждого конкрет- ного вопроса о возможном доминировании каких-либо двух заданных дележей не составляет труда. 235
§ 13. с-ЯДРО 13.1. Как указывалось, доминирование дележом х дележа у можно понимать как предпочтение дележа х дележу у со стороны одной из коа- лиций. Это можно понимать так, что всякая попытка предложить ’’общест- ву” дележ у может встретить со стороны этой коалиции контрпредложение дележа х. Значит, дележ, который не доминируется никаким другим де- лежом, можно считать в известном смысле ’’вполне устойчивым”. Определение. Множество дележей в кооперативной игре Г (харак- теристической функции v), каждый из которых не доминируется какими- либо другими дележами, называется с-ядром этой игры и обозначается через С (у) или С(Г). □ 13.2. Удобная характеризация принадлежащих с-ядру дележей дается следующей теоремой. Теорема. Для того чтобы дележ х принадлежал с-ядру кооператив- ной игры с характеристической функцией и, необходимо и достаточно, чтобы он был абсолютно неэффективным, т.е. чтобы для любой коалиции К выполнялось неравенство v(K)^x(K). (13.1) Необходимость. Пусть для дележа х при некоторой коалиции К v(K) > х(К) . Заметим, что коалиция К должна здесть состоять более чем из одного игрока, иначе это неравенство противоречило бы свойству индивидуальной рациональности дележа х. Равным образом, коалиция К должна быть отлична и от I. Мы имеем х(1\ К) = и(/) — х(К) — х(К) >0. Возьмем теперь е, для которого о< e<-J- (v(K) -Х(Л), IА I и составим вектор у = (j^ i,.. . ,уп), положив + е, если i е -------- (х(К) — | К | е), если i К. Непосредственная проверка показывает, что вектор у есть дележ, причем у > х. Поэтому х не принадлежит с-ядру v. к Достаточность. Предположив, что дележх доминируется деле- жом у, мы получаем для некоторой коалиции К х(К} < у (К) < v(K), что противоречит (13.1). □ 13.3. Из условий предыдущей теоремы следует, что для принадлежности дележа с-ядру данной кооперативной игры необходимо и достаточно, чтобы его компоненты удовлетворяли некоторой конечной системе ли- нейных неравенств. Это значит, что с-ядро в любой кооперативной игре является выпуклым многогранником. 236
Характеристическая функция задает свое с-ядро в виде выпуклого многогранника, определяемого как пересечение полупространств, т.е. ”не вполне явным образом” (ср. замечание из п. 11.3 гл. 1 по поводу аналогичного задания множества оптимальных стратегий игроков в матрич- ной игре). Поэтому вся теория с-ядра в кооперативных играх сводится в принципе к тому, чтобы переходить от такого задания этого много- гранника к более явному его заданию путем указания его вершин (считаясь, разумеется, с тем, что этот многогранник может оказаться пустым). 13.4. с-ядро является симметричным множеством дележей в следующем смысле. Теорема. Если я — изоморфизм v и х€С(р),то ттхЕС(яи). Если С (и) Фф, то существует такой дележ x*GC(u), что itx* = х* для любого автоморфизма я характеристической функции и. Доказательство. Первая часть теоремы вытекает непосредственно из того, что неравенство (13.1) сохраняется при изоморфизмах игр (см. п. 5.6). Для доказательства второй части возьмем произвольный дележхЕ С (у), перечислим все автоморфизмы v: 7Ti,..., irt и составим дележ 1 t х*= — S тгкх. (13.2) t к = 1 Для этого дележа и любого автоморфизма Я/ должно быть 1 | Я/Х* = — S я/я^х. (13.3) t к = 1 Но ввиду того, что автоморфизмы составляют группу (см. п. 5.7), Я/Я1,... . .. , Я/Яг есть снова перечисление всех автоморфизмов щ так что правые части (13.2) и (13.3) совпадают, откуда и следует требуемое. □ 13.5. Очевидно, чем больше возможностей не доминирования в игре одних дележей другими, тем выше шансы на наличие у такой игры непус- того с-ядра и тем большим может быть само это с-ядро. ’’Наиболее благо- приятным” в этом отношении представляется случай несущественной игры, в которой с-ядро существует и состоит из единственного дележа этой игры, а также случай игры двух лиц, в которой какое-либо доминирование от- сутствует, и с-ядро состоит из множества всех вообще дележей. 13.6. Другим крайним случаем по количеству доминирований являются существенные игры с постоянной суммой. Теорема. Во всякой существенной игре со свойством дополнитель- ности с-ядро пусто. Доказательство. Предположим, что дележ х принадлежит с-яд- ру v. По теореме из п. 13.2 для любого игрока i должно быть v(i) xt, v(I\ i) <^х(1\ Г). (13.4) Складывая эти неравенства почленно, мы на основании свойства дополни- тельности и коллективной рациональности дележей получаем и(/)=х(/). (13.5) Значит, и в соотношениях (13.4) должно быть точное равенство: v(0 =Х{, (13.6) 237
и это справедливо для любого игрока. Из (13.5) и (13.6) следует аддитив- ность характеристической функции и тем самым несущественность игры. 13.7. Следствие. Для простейшей характеристической функции vR с-ядро C(vR) состоит из всех дележей х, для которых x(R) = 1. Действительно, это условие вытекает из неравенства (13.1) и из коллек- тивной рациональности дележей и потому необходимо. С другой стороны, из него и из индивидуальной рациональности следует х(К) О при К ф R, х(К) > 1 при К D R, и потому оно достаточно ввиду п. 13.2. □ § 14. с-ЯДРО В ОБЩИХ ИГРАХ ТРЕХ ЛИЦ 14.1. Рассмотрим общую игру трех лиц в 0 — 1-редуцированной форме. Для ее характеристической функции мы имеем (см. п. 8.3) и(0) = и(1) = и(2) = и(3) = О, и(1,2,3) = 1, и(1,2) = с3, и(1,3)=с2, и(2,3)=с1, где, конечно, 0<с.^1, i= 1,2,3. (14.1) На основании теоремы п. 13.2 для того, чтобы дележ х принадлежал С(у), необходимо и достаточно выполнение следующих соотношений: *1+*2^С3, Х1+Х3^С2, или, что то же самое, х3<1-с3, х2^.1-с2, Xi^l-Ci, (14.2) Это значит, что точка х должна лежать к z-й вершине основного треуголь- ника ближе, чем прямая ?г-=1-с£. (14.3) Почленное сложение всех неравенств (14.2) дает нам + х2 + х3 < 3 - (Ci + с2 + с3), или, поскольку сумма всех барицентричных координат тождественно равна единице, С1+с2+сз=^2. (14.4) Написанное неравенство является, таким образом, необходимым услови- ем существования в рассматриваемой игре непустого с-ядра. Например, если c*i = с2 = с3 = 1, т.е. если игра обладает свойством допол- нительности, то неравенство (14.4) не выполняется. Это соответствует утверждению теоремы 13.4. С другой стороны, если (14.4) выполняется, то можно взять такие неот- рицательные ei, е2, е3, чтобы было з S(cz + e.)=2, er.^l-q, z = l,2,3, i = i 238
и положить х. = 1 — cf — ez, i = 1, 2, 3. Такие числа х удовлетворяют нера- венствам (14.2), так что дележ х = (х19 х2, х3) будет принадлежатьс-ядру игры. Неравенство (14.4) дает возможность наглядно представить себе вид множества всех игр трех лиц в непустым с-ядром как подмножество куба всех игр трех лиц на рис. 4.1. 14.2. Геометрически непустое с-ядро кооперативной игры трех лиц является тре- угольником, ограниченным прямыми (14.3), если, конечно, все точки пересечения этих прямых лежат в пределах основного симплекса дележей (рис. 4.13). Последнее будет иметь место, если решение любой пары уравнений (14.3) вместе с уравнением Si + h +£з =1 (14.5) состоит из неотрицательных чисел. Рассмотрим, например, систему, состоящую из уравнений =1 - clf £2 = 1 - с2 и уравнения (14.5). Неотрицательность и £2 обеспечивается (14.1). Из этой системы получаем £3 = 1 — q — с2, и неотрицательность £3 равносильна соблюдению нера- венства с1+с2^1. (14.6) Если это условие не выполняется, то нижняя вершина заштрихованного треуголь- ника выходит за пределы симплекса дележей (рис. 4.14) и с-ядро приобретает вид четырехугольника. Сходную роль играет выполнение или невыполнение неравенств Рис. 4.15 239
В зависимости от различных случаев (а всего их может быть восемь) с-ядро будет приобретать тот или иной вид. Например, если не выполняется ни одно из трех нера- венств (14.6) и (14.7), то с-ядро оказывается шестиугольником (рис. 4.15). 14.3. Для 0 - 1-редуцированной формы игры из примера 3 п. 2.2 уравнения (14.3) приобретают вид так что С (и) есть сегмент, изображенный на рис. 4.16. § 15*. с-ЯДРО В ИГРАХ ЧЕТЫРЕХ ЛИЦ 15.1 . Ввиду разнообразия возможностей доминирования дележей в играх четырех лиц (см. пп. 12.5—12.7) перечисление всех вариантов формы расположения оядра представляется для таких игр достаточно громоздким. Однако наглядное геометрическое представление о с-ядре, построение его для каждой конкретной игры и, тем более, суждение о принадлежности оядру того или иного дележа выглядят достаточно просто. Как обычно, мы далее будем считать, что v есть игра в 0 — 1-редуцированной форме. 15.2 . Согласно теореме п. 13.2 принадлежность дележах с-ядру игры с характеристической функцией v состоит в выполнении системы нера- венств (13.1). В обозначениях (12.2) и (12.3) для игр четырех лиц эта система может быть записана в виде следующих десяти неравенств: xt + Xj +хк ^с19 (15.1) Xi + Xj ^dkl (15.2) при любых различных f, /, к и I из числа 1,2, 3 и 4. К этим неравенствам следует присоединить еще четыре неравенства индивидуальной рациональ- ности xz^0, а также помнить о равенстве коллективной рациональности xf + xy +хк + х, = 1. (15.3) (15.4) 15.3 . Неравенства (15.3) вместе с равенством (15.4) определяют симп- лекс всех дележей. Каждое из четырех неравенств (15.1) определяет в симплексе всех дележей, как описывалось в п. 12.7-, усеченную пирамиду, а вся система (15.1) — пересечение четырех таких усеченных пирамид. Это пересечение, если оно непусто, является тетраэдром, грани которого Рис. 4.17 240
параллельны граням основного симплекса дележей и который расположен по отношению к симплексу дележей ’’антиподобно” (см. рис. 4.17). 15.4 . Неравенства (15.2) можно сгруппировать попарно: х{+х^ак1, xk+xl>dij. Ввиду (15.4) мы можем второе из этих неравенства заменить на xz+xy < 1 -dif, (15.5) так что пересечение полупространств, описываемых (15.2) и (15.5), если непусто (т.е. если dy + dki^ 1), то составляет некоторый плоский слой. Если все эти три слоя непусты, то их пересечение образует параллелепипед (см. рис. 4.18). 15.5 . Таким образом, с-ядро игры с характеристической функцией и есть пересечение трех тел: тетраэдра всех дележей, тетраэдра, определяемого пересечением полупространств (15.1), и параллелепипеда, определяемого пересечением полупространств (15.2). Для любой игры четырех лиц можно естественным графоаналитическим методом определить, является ли ее с-ядро пустым, и если оно непусто, то описать его путем задания всех его вершин. § 16. РЕШЕНИЯ ПО НЕЙМАНУ - МОРГЕНШТЕРНУ 16.1. Рассмотренное в предыдущих параграфах с-ядро состоит из деле- жей, каждый из которых устойчив, но в несколько негативном, пассивном смысле: обстоятельства дела не дают коалициям оснований отклоняться от дележа, входящего в ядро. Однако свойства этих дележей сами по себе еще не дают никаких оснований предлагать эти дележи или противопоставлять их другим, уже предложенным. Более того, если некоторый дележ принадлежит внутренности ядра, то он не может даже быть предпочтительнее какого-либо другого дележа, не может доминировать его. В самом деле, пусть х принадлежит внутренности С(и) и х >у. Тогда по сказанному в п. 11.3 будет х > Хх + (1 — Ху) и при любых сколь угодно близких к единице значениях X. Но такие дележи должны принадлежать C(v) и потому доминироваться не могут. Разумеется, идеальным было бы указание такого дележа, который не только не доминировался бы какими-либо другими дележами, но сам доми- нировал бы любой другой дележ. К сожалению, ни в одной существенной кооперативной игре такого дележа не может быть. Не удается найти и дележей, обладающих в разумной степени ослабленными свойствами такого рода. Поэтому решение данной проблемы следует искать на пути рас- ширения класса тех объектов, которые подлежат сравнению в коопера- тивных играх — на пути некоторого расширения класса дележей. Этот путь, как мы видели, уже оправдал себя в бескоалиционных играх: введение смешанных стратегий позволило решить проблему существования ситуаций равновесия для произвольных конечных (а в действительности также и для многих бесконечных!) бескоалиционных игр. В кооперативном случае мы будем искать решения не в виде единственных дележей, а в виде множеств дележей. Дж. фон Нейман и О. Моргенштерн предложили потребовать от множест- ва дележей, которое принимается в качестве решения кооперативной игры, 16.Н.Н. Воробьев 241
следующие два свойства: внутреннюю устойчивость, состоящую в том, чтобы дележи из решения нельзя было противопоставлять друг другу, и внешнюю устойчивость, состоящую в возможности каждому отклонению от решения противопоставлять некоторый дележ, принадлежащий решению. Формализация этих двух требований приводит к следующему определению. 16.2. Определ ение. Решением по Нейману — Моргенштерну {коро- че, Н-М-решением} кооперативной игры называется множество & дележей в ней, обладающее следующими свойствами: 1) внутренняя устойчивость: никакие два дележа из & не доминируют друг друга; 2) внешняя устойчивость: каков бы ни был дележ s, не при- надлежащий (R, найдется дележ г, принадлежащий (R, который доминирует $. Содержательно представление о Н—М-решении кооперативной игры можно интерпретировать как представление о такой системе норм пове- дения, что последствия двух допустимых этими нормами поведений не могут быть противопоставлены какой-либо общественной силой (коали- цией) друг другу, а каково бы ни было отклонение от допустимых пове- дений, в обществе (т.е. в множестве всех игроков Z) найдутся такие силы (т.е. некоторая коалиция), которые будут стремиться к восстановлению нормы. 16.3. Между с-ядром кооперативной игры и ее Н—М-решением имеется простая связь, выражаемая следующей теоремой. Теорема. Если в кооперативной игре v существуют с-ядро и Н-М- решение 6{,то C(v) С Доказательство. Если дележ х принадлежит С (v), то он не может доминироваться каким-либо другим дележом. Если же он не принадлежит решению, то он должен доминироваться некоторым дележом из решения. Следовательно, принадлежащий с-ядру дележ х должен принадлежать и каждому Н—М-решению. □ 16.4. Н—М-решение существенной кооперативной игры не может со- стоять только из одного дележа. Теорема. Если некоторое Н~М-решение кооперативной игры v сос- тоит из единственного дележа х, то характеристическая функция v являет- ся несущественной. Доказательство. Предположим, что характеристическая функ- ция v существенная. Согласно пп. 7.2 и 11.7 мы можем предполагать, что она имеет 0—1-редуцированную форму. Пусть xt — некоторая положитель- ная компонента дележа х. Для существенной характеристической функции |/| = п > 1, и мы можем составить дележу = {у19...,уп), положив если если / 7 = 1. По определению доминирования дележ х не может доминировать у; сле- довательно, у, отличаясь от х, должен входить вместе с х в любое Н—М- решение игры. □ 242
16.5. Аналог теоремы п. 13.4 для Н—М-решений неверен: для Н—М-ре- шения (R игры v и ее автоморфизма л не обязательно должно быть я 6? = 6?, и в (И может не найтись такого дележа х*, что лх* = х* при любом автомор- физме л. Соответствующие примеры непосредственно усматриваются из анализа игр трех лиц в § 17. Понятие Н—М-решения обладает свойством симметрии в весьма ослаб- ленном смысле. Теорема. Если (R есть Н-М-решение v, а тг — изоморфизм и, то л(й также есть Н-М-решение тти. Доказательство следует из того, что соотношение доминирования сохра- няется при изоморфизмах. □ 16.6. Понятие Н—М-решения при всей его естественности обладает также некоторыми недостатками. Отметим следующие из них. Во-первых, известны примеры кооперативных игр, которые не имеют Н—М-решений. Более того, в настоящее время не известно каких-либо критериев, позволяющих судить о наличии у кооперативных игр Н—М- решений. Тем самым заложенный в Н—М-решении принцип оптимальности не является универсально реализуемым, и область его реализуемости пока остается неопределенной. Во-вторых, кооперативные игры, если имеют Н—М-решения, то, как правило более одного. Поэтому принцип оптимальности, приводящий к Н—М-решению, не является полным: он, вообще говоря, не в состоянии указать игрокам единственной системы норм распределения выигрыша. В-третьих, как мы видели, решения существенных кооперативных игр состоят более чем из одного дележа. Таким образом, даже выбор какого-либо конкретного Н—М-решения еще не определяет выигрыша каждого из игроков. Наконец, в-четвертых, понятие Н—М-решения отражает, как это видно из п. 16.5, лишь в весьма малой мере черты справедливости. Перечисленные недостатки следует понимать не как пороки, которые следовало бы исправлять, а именно как недостатки, которые хотелось бы восполнить. К сожалению, такое восполнение рассматриваемого принци- па оптимальности едва ли возможно, разве лишь за счет резкого сокраще- ния области его реализуемости. Впрочем, это отражает положение дел в действительности: большинство экономических и социальных проблем допускает множественные решения, и эти решения не всегда поддаются непосредственному сравнению по их предпочтительности. § 17. Н—М-РЕШЕНИЯ В ИГРАХ ТРЕХ ЛИЦ С ПОСТОЯННОЙ СУММОЙ 17.1. Вопрос об Н—М-решениях в несущественных играх, а также в произвольных играх двух лиц решается точно так же, как и вопрос о с-ядре в этих играх (см. п. 13.4). Именно, поскольку среди дележей в играх двух лиц никаких доминирований быть не может (см. п. 11.4), а в каждой из несущественных игр вообще имеется всего лишь один дележ (см. п. 9.5), Н—М-решениями в таких играх оказываются множества всех дележей. В соответствии с этим анализ Н—М-решений кооперативных игр следует начинать с рассмотрения существенных игр трех лиц. На основании 16 243
сказанного в п. 11.7 мы можем ограничиться играми в 0—1-редуцированной форме. 17.2. Множеством всех дележей в существенной игре трех лиц в 0—1-реду- цированной форме является треугольник. Внутренняя устойчивость Н-М- решения означает, что никакие принадлежащие ему два дележа не домини- руют друг друга. Поэтому любые два дележа, принадлежащие одному ре- шению, должны лежать на прямой, параллельной одной из сторон треуголь- ника всех дележей (см. п. 12.4). Следовательно, все отрезки, соединяющие попарно дележи из ТН—М-решения, должны быть параллельны трем направ- лениям (сторонам треугольника дележей). Рассмотрим отдельно два случая: 1) все принадлежащие Н—М-решению дележи лежат на одной прямой; 2) не все дележи Н—М-решения лежат на одной прямой. 17.3. Пусть Н—М-решение & целиком лежит на одной прямой. Пусть для определенности эта прямая АВ параллельна стороне 12 треугольника всех дележей (рис. 4.19). Никакие два дележа из (Я не доминируют друг друга, так что внутренняя устойчивость (R выполняется автоматически. Займем- ся внешней устойчивостью этого множества. Ни один дележ отрезка АВ не доминируется каким-либо из остальных дележей этого отрезка. Поэтому внешняя устойчивость (R требует, чтобы в (R входил весь отрезок АВ. Далее, дележ х (см. рис. 4.19) доминирует по коалиции {1,2} дележи, составляющие параллелограмм xFЗЕ, а совокупность всех дележей отрез- ка — объединение всех таких параллелограммов, т.е. треугольник А ВЗ (разумеется, без его стороны АВ). Обратимся теперь к доминированию дележей, расположенных ниже отрезка АВ. Дележ х доминирует по коа- лиции {1,3} параллелограмм xDZB, а все дележи АВ — объединение таких параллелограммов, т.е. параллелограмм В А 1Н. Аналогично по коалиции { 2, 3 } дележи АВ доминируют параллелограмм XG2B. Очевидно, чтобы дележи АВ доминировали все дележи из трапеции А1 2 В, необходимо, чтобы точка пересечения прямых AG и ВН находилась строго ниже основа- ния треугольника дележей 12. Выберем это последнее условие алгебраически. 244
Уравнением прямой АВ будет £3 = х3. Следовательно, точки А и В имеют соответственно барицентрические координаты (1 -х3,0,х3) и (О, 1 — х3,х3). Поэтому уравнения прямых AGuBH будут ^1 = 1—лг3и?2 = = 1 — х3. Условие, чтобы точка пересечения этих прямых лежала вне тре- угольника 12 3, состоит в том, что £i + £2 > 1, т.е. х3 < 1/2. Это значит, что для того, чтобы множество & было внешне устойчивым и, тем самым, Н—М-решением, необходимо и достаточно, чтобы этот отрезок лежал ниже средней линии треугольника. Каждый такой отрезок представляет собой Н—М-решение рассматриваемой игры. 17.4. Содержательно описанные Н—М-решения состоят в представлении игроку 3 некоторой доли айв последующем произвольном распределе- нии оставшейся части 1 — а между игроками 1 и 2. Мы видим, что во всех дележах этого решения сумма, получаемая игроком 3, одна и та же. Такие решения в теории кооперативных игр принято называть дискриминирую- щими, а игроков, получающих во всех дележах решения один и тот же выигрыш, — дискриминированными, 17.5. Совершенно так же можно построить серии Н—М-решений игры, в которых дискриминированными будут соответственно игроки 1 или 2. Ясно, что при автоморфизме я Н—М-решение (R, дискриминирующее игрока г, переводится в Н—М-решение я(Я, дискриминирующее игро- ка т. 17.6. Рассмотрим теперь случай, когда не все дележи Н—М-решения лежат на одной прямой. Пусть х,у и z — три таких дележа. Посмотрим, к чему приведет попытка ’’пристроить” к имеющимся трем дележам четвертый дележ и, не домини- руемый ни одним из этих трех и не доминирующий ни одного из них. Соединим и сх. Отрезок их должен быть параллельным одной из сторон ху9 yz или xz треугольника xyz (или совпадать с ней). Если хи совпадает по направлению с ху (рис. 4.20), то дележ и находится на прямой ху, отли- чаясь как от х, так и от у. В этом случае отрезок zu не будет параллелен ни zx, ни zy, а этого не может быть. Аналогично отвергается случай, когда отрезок хи идет вдоль стороны xz, Пусть теперь отрезок хи параллелен yz (рис. 4.21). В этом случае пря- мая, соединяющая z с и, вынуждена быть параллельной ху, так что четырех- угольник xyz и оказывается параллелограммом. Его диагональ, соединяю- щая у с и, не параллельна ни одной из его сторон, а также другой его диаго- нали, давая нам тем самым недопустимое четвертое направление. Таким образом, если не все дележи Н—М-решения лежат на одной пря- мой, то это решение должно состоять ровно из трех дележей, являющихся вершинами некоторого треугольника. Его стороны должны быть парал- лельными сторонам треугольника всех дележей. Значит, малый треуголь- ник должен быть либо подобно расположен в большом (рис. 4.22), либо ’’антиподобно” (рис. 4.23). 17.7. Рассмотрим сначала случай ’’подобного” расположения. Нетрудно проверить, что здесь ни одна из точек внутреннего треугольника не доми- нируется какой-либо из его вершин. Поэтому тройка вершин этого тре- угольника не может составлять Н—М-решения. В случае ’’антиподобного” расположения, как легко убедиться, недоми- нируемыми оказываются дележи, расположенные в замкнутых треугольни- 245
ках, заштрихованных на рис. 4.23. Следовательно, чтобы множество деле- жей{Д,В, С} составляло Н-М-решение, необходимо, чтобы от этих заштри- хованных треугольников остались только их вершины, т.е. чтобы точки Л,В и С оказались на соответствующих сторонах треугольника всех деле- жей. Но это возможно, лишь если точки А, В и С находятся в серединах соответствующих сторон основного треугольника. До сих пор рассуждения этого пункта носили необходимый характер: мы установили, что если существует Н-М-решение в существенной игре трех лиц, дележи которого не лежат на одной прямой, то оно может сос- тоять лишь из трех точек, именно, из трех середин сторон (рис. 4.24). Нам остается проверить, что множество{А, В, С}, которое по доказанному только и может быть Н—М-решением, действительно оказывается таковым. Внутренняя устойчивость этого множества все время была одним из ус- ловий его построения. Проверим его внешнюю устойчивость. Дележ А до- минирует дележи из параллелограмма 1САВ>, за исключением внутренних точек отрезков В А и АС. Подчеркнем, что, в частности, он доминирует все внутренние точки отрезка ВС. Далее, дележ В доминирует паралле- лограмм 2АВС (кроме внутренних точек отрезков ВС и В А), а дележ С — параллелограмм С А ЗВ (кроме внутренних точек ВС и А С). Но внут- ренние точки ВС до минируются дележом Л, внутренние точки А С — деле- жом В, а внутренние точки В А — дележом С. Таким образом, все дележи, за исключением самих дележей А, В и С, до минируются этими тремя деле- жами. Тем самым множество{А, В, С}, оказывается внешне устойчивым и поэтому — Н—М-решением. Найденное решение состоит из дележей А = {0, 1/2, 1/2}, В ={1/2, 0, 1/2} , С= {1/2, 1/2,0}. Оно называется симметричным. 17.8. Нетрудно убедиться в том, что симметричное решение переводится само в себя любым автоморфизмом игры оправдывая этим свое название. § 18. Н—М-РЕШЕНИЯ В ОБЩИХ ИГРАХ ТРЕХ ЛИЦ 18.1. Рассмотрим сначала случай, когда с-ядро игры пусто. Геометричес- ки это означает, что точки попарных пересечений прямых = 1 — ci, = = 1— Г2,?з = 1— Гз составляют треугольник,расположенный как показано на рис. 4.25. 18.2. Из сказанного в п. 12.5 ясно, что дележи, лежащие внутри треуголь- ника АВС, не могут доминироваться какими-либо дележами, лежащими 246
вне его. Следовательно, всякое подмно- жество треугольника АВС, внутренне и внешне устойчивое по отношению к до- минированиям в пределах этого малого треугольника (будем для удобства назы- вать его ”Н—М-решением в малом”), явля- ется^ таковым по отношению к доминиро- ваниям в пределах большого треугольни- ка, и наоборот. Таким образом, если в рассматриваемой нами игре имеется неко- торое Н—М-решение, то его пересечение с треугольником АВС должно быть Н—М-ре- шением в малом. Но эти последние бы- ли описаны нами в предыдущем пара- графе. Для того чтобы из Н-М-решения в малом получить Н—М-решение всей игры, необходимо добавить некоторые дележи, расположенные вне тре- угольника АВС. Рассмотрим отдельно случаи, когда решение в малом яв- ляется дискриминирующим или симметричным. 18.3. Пусть Н—М-решение в малом — дискриминирующее (рис. 4.26). Множество всех недоминируемых множеств АВ дележей на рисунке зашт- риховано. Ограничимся рассмотрением необходимой добавки к АВ для того, чтобы доминировались все дележи из треугольника KLM. Добавки для остальных треугольников описываются аналогичным образом. Ясно, что эта добавка должна сама находиться в треугольнике KLM. Уравнения наклонных сторон этого треугольника имеют вид £i=a и £2 =0. Возьмем в треугольнике KLM некоторую точку х с данными координатами и (рис. 4.27). Доминируемые ею дележи из этого треугольника составляют два параллелограмма (очерчены пунктиром). Следовательно, если два дележа принадлежат одной добавке до Н—М-решения, то соединяющий их отрезок должен составлять с вертикалью угол не более чем в 30°. В част- ности, каждая горизонталь может пересекать эту добавку не более чем в одной точке. Значит, вся эта добавка должна лежать на криволинейном отрезке, соединяющем точку L с основанием треугольника дележей и не отклоняющемся от вертикали более чем на 30°. Предположим, что одна из точек криволинейного отрезка не принадлежит добавке. По своему положению она не может доминироваться другими дележами добавки. Никакими дележами вне добавки она, очевидно, также домини- роваться не может. Поэтому при сделанном предположении добавка ока- зывается недостаточной для получения Н—М-решения. Следовательно, каж- дая точка криволинейного отрезка должна на этой добавке принадлежать. Аналогичные криволинейные отрезки составляют добавки до Н—М-ре- шения в остальных двух треугольниках, и все Н—М-решение приобретает вид, изображенный на рис. 4.28. Ясно, что добавляемые к Н—М-решению в малом криволинейные отрезки должны выходить из соответствующих точек, не отклоняться по своему направлению от перпендикуляра к со- ответствующей стороне треугольника дележей более чем на 30° и доходить до самой этой стороны. В остальном они могут быть совершенно произ- вольными. 247
18.4. Пусть теперь Н—М-решение в малом симметрично. В этом, как ив предыдущем случае, мы можем дополнить его криволинейными отрезками, как это показано на рис. 4.29. Эти криволинейные отрезки должны удов- летворять тем же условиям, что и указанные в предыдущем пункте, а в остальном могут быть произвольными. Между прочим, из сравнения дискриминирующего и симметричного ре- шений в случае общих игр трех лиц становится вполне ясным, что второе можно рассматривать как предельное положение первого. 18.5. Обратимся, наконец, к случаю, когда игра имеет непустое с-ядро. Совокупность дележей, составляющих ядро, доминирует все дележи, за исключением множества, заштрихованного на рис. 4.30. Для того чтобы дополнить с-ядро до Н—М-решения, к нему необходимо, как и выше, до- бавить в каждом из треугольников недоминируемых дележей по соответ- ствующему криволинейному отрезку (рис. 4.31) . Ясно, что если с-ядро становится четырех-, пяти- или шестиугольником, то вместе с исчезновением недоминируемых треугольников отпадает и на- добность в соответствующих криволинейных отрезках (рис. 4.32). В част- ности, если с-ядро доходит до каждой из сторон треугольника дележей 3 Рис. 4.31 Рис. 4.33 248
(случай, изображенный на рис. 4.15), то оно просто совпадает с Н—М-ре- шением. 18.6. Для игры рынка с продавцом и двумя покупателями из п. 2.2 с-ядро было описано в п. 14.3 (см. рис. 4.16). В соответствии с этим Н—М- решения для этой игры будут иметь вид, изображенный на рис. 4.33. § 19*. Н—М-РЕШЕНИЯ В ИГРАХ С ЧИСЛОМ ИГРОКОВ, БОЛЬШИМ ТРЕХ 19.1. В случае, когда число игроков в игре становится большим трех, разнообразие вариантов формировавния Н—М-решений начинает весьма быстро возрастать. Наглядный пример дает анализ Н—М-игр четырех лиц с непустым с-яд- ром. Это с-ядро, как было выяснено в § 15, является пересечением четыр- надцати. замкнутых полупространств (которое удобно представлять себе как пересечение трех выпуклых многогранников). В случае, когда с-ядро непусто, всякое Н-М-решение должно содержать, кроме дележей изс-ядра, еще и дальнейшие дележи, принадлежащие тетраэдрам и клиновидным мно- гогранникам, играющим в этом случае ту же роль, что и недоминируемые с-ядром треугольники в игре трех лиц, показанные на рис. 4.30. Оказывает- ся, что таким путем удается построить Н—М-решения для любой игры че- тырех лиц с непустым с-ядром. 19.2. Если в игре четырех лиц с-ядро пусто, то построение ее Н—М-реше- ний оказывается более сложным. Выражаясь несколько вольно, это услож- нение проистекает здесь из-за того, что если пересечение трех многогран- ников может быть непустым как бы единственным способом, то пустота этого пересечения может иметь различные причины (за счет пустоты пере- сечения уже какой-либо пары из этих многогранников или даже возмож- ного исчезновения одного из них). Тем не менее существование Н—М-ре- шения конструктивно устанавливается и во всех этих случаях. Следует подчеркнуть, что форма Н—М-решений некоторых игр четырех лиц может быть достаточно экзотической. Именно, любое замкнутое под- множество не слишком длинного отрезка может быть погружено в симп- лекс дележей так, что будет замкнутой компонентной одного из Н—М-ре- шений некоторой игры четырех лиц. 19.3. О существовании Н—М-решений в кооперативных играх пяти лиц никакого универсального суждения высказать нельзя: ввиду комбинатор- ного разнообразия таких игр нахождения Н—М-решений в каждой игре не представляется пока возможным, а примера игры пяти лиц, не имеющей Н—М-решений, также пока не найдено. Такой пример игры без Н—М-ре- шений обнаружен лишь среди игр с большим числом игроков. В наиболее простом из них имеется 10 игроков. Он носит достаточно искусственный характер и имеет скорее принципиальное, чем практическое значение. 19.4. Ввиду того, что не все кооперативные игры имеют Н—М-решения, представляет интерес исследовать существование Н—М-решений для от- дельных частных классов игр. Тривиальной оказывается теория Н—М-решений для простейших игр. Она исчерпывается следующим утверждением. 249
Теорема. Простейшая игра vR имеет единственное Н—М-решение, совпадающее с ее с-ядром. Доказательство. Внутренняя устойчивость с-ядра соблюдается автоматически. Покажем, что в условиях простейшей игры vR множество C(yR) оказываетя и внешне устойчивым. Возьмем для этого дележу C(vR). Согласно п. 13.7 для этого дележа должно быть у (R ) < 1. Положим 1 -у(Я) уi + ------ для i G R, Г = |Л| Л/ . О для i Е R. Очевидно,х= ,. .. ,х„) Е C(vR) их>у. □ в. § 20. ВЕКТОР ШЕПЛИ. АКСИОМАТИКА 20.1. Теория игр рассматривает весьма разнообразные принципы опти- мальности. Некоторые из них отражают интуитивные представления об оптимальности непосредственно. Таковы, например, принцип приемлемых ситуаций (принцип осуществимости цели) в бескоалиционных играх (см. § 2 гл. 1) с его важнейшим частным случаем — принципом максимина, а также рассмотренные в предыдущих параграфах принципы оптимальности, приводящие к с-ядру и Н—М-решению. Однако, кроме этих принципов оптимальности, которые можно назвать естественными, теория игр сама конструирует принципы оптимальности, задавая их теми свойствами, ко- торыми они должны обладать. Такой подход к вопросу по существу являет- ся аксиоматическим. В данном параграфе мы рассмотрим такое аксиоматическое задание од- ного из принципов оптимальности, которое является весьма интересным как с теоретической, так и с практической точки зрения. Если характери- зовать отдельные принципы оптимальности при помощи неформальных, интуитивных определений, то конструируемый нами сейчас принцип можно было бы с некоторым основанием назвать принципом справедливого де- лежа. Нашей целью будет указание способа, который ставит в соответствие каждой кооперативной игре (т.е. каждой характеристической функции) v над множеством игроков / = {!,...,«} некоторый вектор Ф(и) = = (0i (и),..., Фл(и)), компоненты которого описывают справедливые в нектором смысле выигрыши каждого из игроков в этой игре. При этом естественно желать, чтобы этот вектор Ф(и) оказался дележом в условиях v. 20.2. Приступим к формулировке тех требований, которые естественно предъявлять к справедливому дележу. Прежде всего ’’справедливость тре- бует” при разделении общего выигрыша носителя игры ничего не выделять на долю посторонних, не принадлежащих этому носителю болванов (см. п. 6.3), равно как и ничего не взимать с них. Формально это можно выра- зить в виде следующей аксиомы. Аксиома эффективности. Если N — носитель v, то S <J>,(v) = i>(7V). (20.1) few 250
20.3. Т е о р е м а. Если j - болван в v, то Ф/(и) = и(/). (20.2) Доказательство. Возьмем носителя N игры, v, не содержащего болвана /. Ясно, что множество 7VU / также является носителем v. Поэтому в нашем случае справедливо равенство (20.1), а также равенство S Ф/(и)-ц(^и/). (20.3) U j Почленное вычитание (20.1) из (20.3) дает нам (20.2). □ 20.4. Из этой теоремы следует, что в несущественной игре, в которой все игроки — болваны, формула (20.2) справедлива для каждого игрока. 205. Важной чертой справедливости является симметрия: игроки, одина- ково входящие в правила игры, должны ”по справедливости” получать одинаковые выигрыши. Аксиома симметрии. Для любого автоморфизма я игры V Ф, (и) =Ф7Г, (и). 20.6. Наконец, естественно потребовать, чтобы операция перехода к справедливому дележу обладала некоторыми чертами аддитивности. Пусть имеются две игры v и и " с одним и тем же множеством игроков /. Сумма v' и v" , т.е. заданная на подмножествах Л функция v'+v" , для которой (и +и")(/С) = и(^) + у"(^), как следует, например, из п. 4.1, также является характеристической функ- цией. Сложение характеристиеских функций можно понимать как одновремен- ное участие каждого из игроков из I в двух играх. ’’Справедливо считать”, что при участии игроков в двух играх их выиг- рыши в отдельных играх должны складываться. Аксиома агрегации. Если v' и v” — две игры с множеством иг- роков /, то Ф(и +и") = Ф(и) + Ф(и"). Тривиальной индукцией эта аксиома распространяется на произвольное конечное число слагаемых. 20.7. Оказывается, что система, состоящая из трех приведенных аксиом, является непротиворечивой и полной в том смысле, что для всякой харак- теристической функции v а) существует, и притом б) единственный, вектор Ф(и), удовлетворяющий этим трем аксиомам. Этот вектор называется вектором Шепли, В связи с вектором Шепли перед нами встают следующие задачи. Прежде всего нам нужно указать формулы, выражающие компоненты вектора Шепли в явном виде и позволяющие, по крайней мере в принципе, вычислять их для каждой игры. При этом, разумеется, необходимо дока- зать, что получаемый по этим формулам вектор действительно является вектором Шепли, т.е. удовлетворяет определяющим вектор Шепли аксиомам (непротиворечивость аксиоматики) и является среди таких векторов единственным (полнота аксиоматики). Это мы сделаем в § 21. 251
Желательно, далее, чтобы способ получения этих формул был достаточно естественным. Идеалом в этом смысле представляется дедуктивный вывод их из перечисленных аксиом. Такой вывод будет проведен в § 23. При всей своей естественности он оказывается довольно сложным. Вместе с тем те же формулы можно получить и из других, внеаксиомати- ческих, как бы эвристических соображений. Это будет сделано в § 22. Такой вывод представляется несравненно более простым и наглядным, чем опирающийся на аксиомы. Однако положенные в его основу посылки могут показаться искусственными и неубедительными. Впрочем, такое основанное на эвристических отображениях описание вектора Шепли может в свою очередь также пониматься как некоторое его аксиоматическое за- дание, пожалуй, только посредством менее убедительных аксиом. Тот факт, что на обоих путях получаются для вектора Шепли одинаковые выражения, свидетельствует об эквивалентности полагаемых в их основы явных или неявных аксиоматик. § 21. СУЩЕСТВОВАНИЕ И ЕДИНСТВЕННОСТЬ ВЕКТОРА ШЕПЛИ 21.1. Найдем сначала вектор Шепли для характеристической функции вида cvR, где vR — простейшая характеристическая функция (см. п. 4.2), ас > 0. Теорема. Для вектора Шепли ^(cvR) характеристической функции cvR (где с > 0) должно быть ’ " , если iER, \R I 0, (21.1) если iG/?*) Доказательство. Множество R является для cvR носителем. Поэтому по аксиоме эффективности S Ф/(си) -cvr(R)-c. i<ER (21.2) Далее, перестановка (транспозиция) любых двух игроков из А является автоморфизмом cvR. Поэтому по аксиоме симметрии слева в (21.3) все слагаемые равны друг другу, и мы получаем верхнюю строку (21.1). На- конец, все игроки, не входящие в R, являются в cvR болванами, и приме- нение в этом случае формулы (20.3) дает нам нижнюю строку (21.1). □ 21.2. Следствие. Для простейшей характеристической функции vR uc>0 <b(cvR) =сФ(и/?). Доказательство. Следует непосредственно из (21.1). □ 21.3. Из аксиомы агрегации и последнего следствия вытекает, что при любых cR > 0 должно быть Ф(2 cRvR)=^ Ф(скик)=2; слФ(ид). R R R (213) ♦) Подчеркнем, что согласно аксиоме агрегации мы можем определять вектор Шеп- ли для тех или иных характеристических функций лишь вместе с векторами Шепли для их сумм. Поэтому формулировка данной теоремы носит условный (а говоря фор- мально , чисто необходимый) характер: она указывается лишь на то, каким должен быть вектор Шепли простейшей характеристической функции, если она тако- вым обладает. 252
Распространим эту формулу на случай коэффициентов cR с произволь- ными знаками. Лемма. Если v ’ и v" - характеристические функции, а их разность с -v ” также является характеристической функцией, то Ф(и - и") = Ф(и ) - Ф(и"). (21.4) Доказательство. По условию мы имеем тождественно v = v” + + (у ' — и "). Справа здесь стоит сумма двух характеристических функций, и по аксиоме агрегации мы имеем Ф(ц) = Ф(и") + Ф(и - и”), откуда и следует (21.4). □ 21.4. С л е д с т в и е. Формула (21.3) остается справедливой, если знаки коэффициентов cR произвольные, а сумма S cR vR является характеристи- ческой функцией, R Доказательство. Имеем cRvR = S cRvR — S (~cR)vR. R R R CR — ° CR < ° Здесь во второй сумме все числа — cR являются положительными, так что вычитаемая сумма оказывается характеристической функцией. Поэтому по лемме п. 21.2 Ф(и) = Ф( S R CR^O crvr)— Ф( (-Ог)ия)- R CR<0 Cr&(VR)- s R cr<0 S R (~Cr )Ф(Уг) = S cR Ф(и). □ R 215. Теорема. Каждая характеристическая функция имеет не более одного вектора Шепли. Доказательство. То, что каждая простейшая характеристическая функция имеет не более одного вектора Шепли, следует из теоремы п. 21.1. Но, как было показано в п. 4.4, произвольная характеристическая функция представима в виде линейной комбинации простейших единствен- ным способом. Поэтому и на основании сказанного в пп. 21.3, 21.4 каждая характеристическая функция имеет не более одного вектора Шепли. □ 21.6. Нам остается доказать существование вектора Шепли для любой характеристической функции. В соответствии со сказанным в п. 20.7 мы опишем сначала вектор Шепли ’’немотивированным” образом. Теорема. Для любой характеристической функции и над !={!,... ... ,п}компоненты вектораШепли определяются по формуле (п- | АГ|)!(Ш- 1)! Ф/Ф) = S -------------~ (21.5) ZGKCZ и!.. Доказательство. Проверим сначала, что вектор Ф(и) с компо- нентами из (21.5) является дележом. 253
Сначала установим индивидуальную рациональность Ф(и). Ввиду супер- аддитивности характеристической функции мы имеем v(K)-v(K\i) > v(z), так что Ф/(и)^ Z (п - | /С|)! ( । /С| - 1)!и(/) = iGKGI п\ 1 = У(О Е — (и - | |)! (| Х| — 1)! iEKCI П\ Объединение слагаемых, соответствующих коалициям К с одинаковым числом игроков, дает нам и 1 Z Z — (п-к)\(к- 1)!, /С = 1 |KI=fc п\ а так как внутренняя сумма состоит из одинаковых слагаемых, — Ф/(и)^(0 S (к-1)! {к — \)\(п-к)\ ± („_£)!(£_ 1)! = п\ = v(i) S — = v(i). к=] П (21.6) Для доказательства коллективной рациональности Ф(и) напишем (п-\К\ )!( |£|-1)! Z Ф,(у) = S Е -------------—--------- (v(K)-v(K\[)). (21.7) iGI iGI iGKCI n\ Во всей двойной сумме выражение v (К) встретится в роли уменьшаемого | К | раз (по числу входящих в К элементов) и тем самым приобре- тает коэффициент (п — \ К\)1 (\ К \ — 1)! (п-\К\)\К\1 который при | К | = п, т.е. при К = 1, очевидно, равен единице. В роли же вычитаемого оно встретится п — | /С | раз (по числу не входящих в К элементов) и тем самым приобретает коэффициент (п - 1/C I- 1)! Ш ! п! -(п-\К\) (п - \К I)! I1C I ! -------------------, если п Ф IК | , п! и коэффициент, 0, если п = | К | . Таким образом, правая часть (21.7) равна v (/) : S Ф,(и) = и(7), i<El (21.8) и вектор Ф(и) оказывается коллективно рациональным. Следовательно, вектор, описываемый (21.5), действительно является дележом. Обратимся к проверке дня него аксиом вектора Шепли. 254
Аксиома эффективности. Пусть в условиях v игрок i являет- ся болваном. Тогда при любой коалиции К С/ v(K)-v(K\i) = v(i)> (21.9) и точно так же, как от неравенства (21.5) мы переходили к неравенству (21.6), мы можем от равенства (21.9) перейти к равенству ФДи) = и(/). (21.10) Возьмем теперь произвольного носителя N игры v. Так как все игроки вне N — болваны, мы можем просуммировать равенство (21.10) по i е е /\7У: s ф/(и)= 2 у(0- i е I\N i е l\N Почленное вычисление этого равенства из (21.8) приводит к S Ф/(и) = и(7)- Z u(z), i^N i^l\N и ссылка на формулу (6.10) дает нам требуемое. Аксиома симметрии. Пусть я — автоморфизм v. Тогда вместе с К коалиция ттК пробегает все подмножества /, и мы можем (21.5) пере- писать как (п — 17Г/С |) I ! (17Г/С1 — 1)! Фя/(и)= S ------------------------------ (и(яА)-и(я(£\/))). я/ е тгк с I п! С другой стороны, из автоморфности я следует, что v (у К) - v (К), и | тгК | = |/С |, а я/ и тгК под знаком суммирования можно обратно пере- именовать соответственно в i и К. Окончательно мы имеем (и-|К|)!(1АЧ-1)! Фя/Ф) = Z ----------------------- (у(К) - v(K\iJ) = ФДи). KCI п\ Аксиома агрегации соблюдается в силу того, что компоненты вектора Ф(и) зависят от значений характеристической функции и линейно. Таким образом, вектор Ф(и) действительно является для характеристи- ческой функции v вектором Шепли, существование которого тем самым доказано. □ 21.7. Вектор Шепли как дележ обладает естественным свойством инва- риантности. Теорема. Если я - изоморфизм характеристической функции v на характеристическую функцию v', то Фя/- (у ) = Ф,- (у). Доказательство отличается лишь несущественными деталями от про- верки аксиомы симметрии в доказательстве теоремы предыдущего пунк- та. □ 21В. Теорема. Если имеется преобразование аффинной эквивалент- ности характеристической функции v в и , то вектор Шепли Ф(иг) будет как дележ соответствовать вектору Шепли Ф(и). Доказательство вытекает непосредственно из линейности выражения компонент вектора Шепли через значения характеристической функции. □ 255
§ 22. ЭВРИСТИЧЕСКИЕ ВЫВОДЫ ФОРМУЛЫ ДЛЯ ВЕКТОРА ШЕПЛИ 22.1. ’’Справедливо считать”, что каждый игрок 7G/, создавая вместе с какими-либо другими игроками некоторую коалицию KCI, должен получить тот прирост уверенного выигрыша, т.е. значения характеристи- ческой функции v(K)-v(K\i), (22.1) который он вносит в коалицию К. Так, как, однако, при этом может быть сформирована любая содер- жащая игрока i коалиция К, справедливой долей игрока i следует считать не значение разности (22.1) для какой-либо конкретной коалиции К, а некоторое усреднение значений этой разности по всем коалициям, содер- жащим игрока i. В случае вектора Шепли разность (22.1) входит в его z-ю компоненту с коэффициентом (’’весом”, ’’вероятностью”) .(и-1*1)! (|*| —1)! п\ (22.2) и уместен вопрос о непосредственном обосновании этих коэффициентов как вероятностей появления коалиции *, при условии, что в нее заведомо войдет игрок z. 22.2. Наиболее простым будет представление числа (22.2) в виде 1 ( \к 1-1 V* 1 — (Сп _ j J . При таком представлении его можно понимать как вероят- ность совмещения двух независимых событий: равновероятного назначе- ния размеров I К I коалиции К, т.е. равновероятного выбора одного из чисел 1, 2, . . . , п с последующим равновероятным выбором из п — 1 воз- можных партнеров, состоящего из I К | — 1 игроков набора, составляющего вместе с i коалицию | К |. 22.3. Несколько ’’игрушечный”, хотя и достаточно наглядный вид имеют следующие рассуждения. Предположим, что игроки в случайном порядке по очереди приходят в некоторое место, причем каждый пришедший получает ту сумму, на кото- рую он увеличивает своим приходом значение характеристической функции для уже собравшейся коалиции. Покажем, что математическое ожидание этой суммы и есть компонента вектора Шепли игрока. Рассмотрим для этого произвольную перестановку л множества игро- ков. Обозначим через */(л) множество игроков, предшествующих данному игроку i в перестановке л. Разность v(Ki(7r) U z) - = Д(ц г, л) (22.3) есть тот прирост значения характеристической функции и, который игрок i осуществляет в перестановке л. Теорема. Если все перестановки л равновероятны, то 1 МД (и, z, л) = — 2 Д (и, г, л) = Ф,(у). (22.4) 7Т П\ 7Г 256
Доказательство. Число перестановок, в которых игроку i пред- шествуют игроки из АГ и только они, очевидно, равно |Х|! (п— 1—|Х|)!, а вероятность появления такой перестановки равна |Х'|! (и-1-IXI)!. п\ Следовательно, по (22.3) 1 М Д(ц z, тт) = S — |Х|! (и—1—|Х|)! (р(К U z) - и(Х)), 7Г KCl\i п\ или, переобозначая под знаком суммы KUi через X, 1 М Д(и, z, тг) = S ----(|XJ—1)! (п - |7С|)! (и(Х) - u(X\z)) = Ф,(ь>), я НЕК CI п\ а это и требовалось. □ 22.4. В сущности, приведенные в п.п. 22.2 и 22.3 выводы формул для компонент вектора Шепли можно считать ’’как бы аксиоматическими”. Только применяемые при этом аксиомы (равновероятность числа партне- ров в коалиции с данным игроком в равновероятность самих коалиций с заданным числом партнеров в первом случае или равновероятность все- возможных перестановок игроков во втором) представляются несколько нарочитыми и потому малоубедительными. § 23 *. ВЫВОД ФОРМУЛЫ ДЛЯ ВЕКТОРА ШЕПЛИ ИЗ АКСИОМ 23.1. Выведем формулу (21.4) для компонент вектора Шепли непосред- ственно из положенных в его основу аксиом эффективности, симметрии агрегации. Говоря точнее, мы воспользуемся формулой (21.1) для ком- понент вектора Шепли простейшей характеристической функции и явным представлением (4.3) —(4.4) произвольной характеристической функции через простейшие и преобразуем полученное выражение к виду (21.5). 23.2. Согласно пп. 21.3, 21.4 из v = 2 \rVr, следует R с I Ф/(и) - S ^Ф^). RCI Подставим в правую часть этой формулы вместо коэффициента XR его выражение из формулы (4.4), а вместо Ф/(ря) — его выражение из формулы (21.2). Мы получим Ф;(П) = Z iER KCR |Х| = z( S (-1)|Л|~|К| К \KUiCR |Х|/ Нам остается преобразовать стоящее справа выражение. 17.Н.Н. Воробьев 257
Находящаяся здесь в скобках сумма зависит от коалиции К и от игрока i. Обозначим ее поэтому через . Очевидно, если i G К. то 7f(K\i)= Б ±(-i)l*l-IKVl = RD(K\i)Ui |А| RCI = S ^-(-l)i7?|-|KI+1 =-л(К). RDK |Я| RCI (заметим что здесь К = К U i). Объединим теперь каждую коалицию К С /, содержащую игрока z, в пару с коалицией K\i. Мы получим = S (7iW^(/0 + 7z(^\0^(^\0= S 7/W(u(X)-u(^\z)). К CI iCKCI K^i Далее, для всех таких К 7,<К) = Б 1 RDK |А| RCI п 1 = Б — Б (-1)''“|к|. г=|К| Г \R\=r KCRCI Последняя сумма, очевидно, стостоит из CrnJ*,( одинаковых слагаемых. Следовательно, 7,(/э = £ r=|K| г и 1Л1 Но I -Cir'c'-' - х ' = r=t Г n~f о 1 п = f S Cr-^xl-ldx = о r~f 1 = f (1 — x)n~txt~1 dx. о Последний интеграл известен в математике под именем эйлерова интег- рала первого рода, или бэта-функции и обозначается через В(t, п) .Известно, Для полноты изложения выведем эту формулу. Заметим с этой целью, что 1 1 В(1, п) = f (1 - х)п 1 dx=---(1 - х)п ’ = -1-. (23.2) О ’ " Далее возьмем интеграл В(/, п) по частям, для чего положим (1 = и, xf—1ctc = = dv. Очевидно, здесь du = (n-f)(l-x)"-f-1, и=|х'. 258
Значит, при t > О 1 и n-t 1 2 3 B(f, n) = f (1 -X)" txt~1dx= (1 -x)"”f lxf +--------- f (1 -x)n~t~lx,dx = t |o t 0 0 = B(f + 1,«), откуда t B(t + 1,и) =----В(Г, ri). n-t Применяя эту формулу к (23.2) , мы последовательно получаем ва> „) =1 _L _2_. . . _LL= п п-\ п-2 п-t+l п\ С учетом (23.1) окончательно оказывается = -^-(и-|/П)!(|/П-1)!> Ф,(в) = S — (п - |А1)! (|/С| - 1)! (v(K) - v(K\iJ). (23.3) K3i п\ § 24. ВЕКТОР ШЕПЛИ ДЛЯ ИГР ТРЕХ ЛИЦ 24.1. В отдельных случаях формула (21.4) для компонент вектора Шеп- ли допускает более ’’замкнутое” их описание. Помимо простейших игр (см. п. 21.1), это удается сделать, например, для игр трех лиц. Ввиду сказанного в п. 20.4 мы можем ограничиться существенными иг- рами, а ввиду сказанного в п. 21.8 — играми в 0—1-редуцированной форме. 24.2. Теорема. Если v - характеристическая функция трех лиц в Q-Л-редуцированной форме с v(i, j) = сk, то Ф,(0 = у(2-2с,+С/+С*). (24.1) Доказательство. Воспользуемся теоремой п. 22.3. С этой целью выпишем все перестановки игроков в игре трех лиц и подсчитаем разность Д(и, z, я) при i = 1 для каждой из них: п Д 12 3 0 13 2 0 2 13 с3 2 3 1 1-С. 3 12 с2 3 2 1 1 - С. 17 259
Каждую из этих разностей следует умножить на вероятность 1/6 соответст- вующей перестановки и полученные произведения сложить. В итоге мы получим Ф1(0 = 4"(2~2с1 +с2 +с3), о а надлежащее переименование игроков дает формулу (24.1). □ 24.3. Например, для игры рынка с одним продавцом и двумя покупа- телями (пример 3 из п. 2.2) в 0—1-редуцированной форме (см. п. 8.3) фп, О') = 1 Ь-а 6 с-а ’ , , ч _ 1 1 Фп/и) 2 3 Ь-а —а' , Л - 1 4. 1 Ъ'а фпР(и) - -2 + ? Мы видим, что монопольное положение продавца делает для него ’’справедливым” получение более чем половины от общего прироста полез- ности. Кроме того, как нетрудно подсчитать, из Ъ с следует Фщ vO =фп2(р)- Это значит, что справедливо, чтобы доля фактически вступающего в сделку, более конкурентоспособного покупателя была бы больше, чем у его конкурента. 24.4. Игры, в которых вектор Шепли принадлежит с-ядру, представляют естественный содержательный интерес: именно в таких играх существует дележ, который является одновременно справедливым и устойчивым (его выгодность вытекает из свойства коллективной рациональности, которым обладают все дележи). Можно сформулировать условия того, чтобы для характеристической функции v было Ф(и) Е C(v). Для игр трех лиц этот вопрос решается доста- точно просто. Теорема. Для того чтобы в игре трех лиц с характеристической функцией v(i, f) = ck вектор Шепли Ф(и) принадлежал с-ядру C(v), необхо- димо и достаточно соблюдение неравенств fci + cj + ck < 4 для любых i, j, k (24.2) Доказательство. Согласно теореме п. 13.2 условиями принадлеж- ности с-ядру дележа х в игре трех лиц v будут неравенства + ck. Для случая х = Ф(и) это переписывается как Ф/(с) + и формула л (24.1) дает нам g- (4 Ci — Cj + 2с^) S^c^, откуда немедленно следует (24.2). □ Наглядное изображение множества всех игр трех лиц, в которых вектор Шепли принадлежит с-ядру, получается, если на рис. 4.1 построить пересече- ние куба всех игр с тремя полупространствами (24.2). 260
§ 25. ПРИМЕРЫ ВЫЧИСЛЕНИЯ ВЕКТОРА ШЕПЛИ 25.1 Игра с главным игроком. В игре участвуют п игроков, один из которых называется главным. Коалиция К выигрывает 1, если она либо содержит главного игрока и хотя бы одного кроме него, либо же всех и—1 ’’неглавных”. Если главный игрок имеет номер п, то характе- ристическая функция этой игры записывается в следующем виде: и(К) = 1, 1, О если К D {i, п}, i^n, если К D { 1,.. ., п-1}, в остальных случаях. Очевидно, во всякой перестановке главный игрок увеличивает выигрыш коалиции на единицу, если только он оказывается в ней не первым или не стоит! на и-М!месте. Вероятность этого события равна (и-2)/и. В противном случае он не увеличивает выигрыша коалиции. Следовательно, в нашем случае Фгл(и) = (и-2)/и. Данная игра имеет 0—1-редуцированную форму. п- 1 Поэтому S ФДр) = 1 — Фгл(и) = 2/и. Но ясно, что все неглавные игроки равноправны. Поэтому по симметрии Ф/(и) = 2/и(и-1), и—1. Мы видим, что ’’монопольное” положение главного игрока обеспечивает ему в (п-1)(и-2)/2 раз больший выигрыш, чем ’’рядовым” участникам игры. Это обстоятельство подчеркивает вторичный, относительный, эконо- мически обусловленный характер ’’справедливости”. 25.2. ’’Помещик и батрак и”. Предположим, что имеются п—1 батраков (игроки 1,..., л—1) и помещик (игрок п) и что помещик, на- няв к батраков, получит от урожая доход f(k), а батраки в любом числе сами по себе дохода получить не могут. Это положение дел описывается следующей характеристической функцией: у(Ю = I *^1 “ 1если п G К> ' * | 0 в противном случае. Нетрудно видеть, что в случайной равновероятно распределенной пере- становке помещик с вероятностью 1/п окажется на любом к-м месте и уве- личит тем самым значение характеристической функции на/(А-1). Поэтому 1 Ф„(и) = ~ S f(k). . (25.1) п Jt=i На основании условий эффективности и симметрии всех батраков мы имеем 1 / 1 "-1 \ Ф/(0 =----s /да) г = 1........................«-!• И-1\ п к=1 / 261
Геометрически сумму в (25.1) можно представить себе как площадь, ограниченную графиком функции f (см. рис. 4.34 и 4.35). В условиях слабо механизированного сельского хозяйства график функции f будет напоминать кривую, изображенную на рис. 4.34. По мере роста уровня механизации этот график начинает напоминать кривую на рис. 4.35. Это означает увеличение доли помещика в доходах, что соответствует представ- лениям о росте нормы эксплуатации с ростом органического состава капи- тала. 25.3. Однопродуктовый сбалансированный рынок. Рассмотрим рынок, в котором участвует множество продавцов Р, причем каждый продавец к^Р располагает количеством хк некоторого товара, и множество покупателей Q, причем покупатель l^Q предъявляет спрос на этот товар в объеме у/. Сбалансированность рынка выражается в равенст- ве суммарного предложения суммарному спросу: Z хк = Z уг Очевид- к^Р VEQ но, каждую из этих сумм можно, не нарушая общности, приравнять единице. Такой рынок можно описать кооперативной игрой с множеством игро- ков I=PUQ (как обычно, мы полагаем |/|=и) и характеристической функцией u(A3 = min< хк, Z уЛ. (25.2) (к(ЕРОК l(=QOK J Персональное™ и супераддитивность функции и проверяются непосред- ственно. Свойством дополнительности она, очевидно, не обладает, так как, например, v(P) = v(Q) = 0, a v(P U Q) = и(Г) > 0. Значением этой характеристической функции является, очевидно, объем сделок, которые могут быть заключены между членами-продавцами и чле- нами-покупателями коалиции К. Найдем вектор'Шепли для этой кооперативной игры. Рассмотрим произвольную перестановку игроков я и поставим ей в соот- ветствие ’’противоположную” перестановку я*, т.е. такую перестановку, в которой переставляемые игроки расположены в обратном порядке. Возьмем теперь произвольного продавца к и обозначим через Кп(ку мно- жество всех участников рынка, предшествующих ему в перестановке я. Обозначим разность Z Уг - хк’ l^K^kynQ k'fEKnikyaP через d(k, я). Из определения характеристической функции (25.2) мы имеем viK^kyuky-v^K^k)) = 0, если d(k, я)<0, d(k, я), если 0^d(k, я)^^, хк, если xk<±d(k, я). Как легко убедиться, d(k, я) + d(k, тг*У = хк. Поэтому vCK^ky U ку- v(K7T(kyy + v(K^(ку U кУ - v{K^(kyy = хк. Значит, если мы объединим в сумме (22.4) в данном случае слагаемые в пары, сочетая каждую перестановку с противоположной ей, то всего мы получим п!/2 пар, и сумма слагаемых в каждой паре будет равна хк. Сле- 262
довательно, для каждого продавца к€.Р 1 п\ 1 = — — хк = — хк, и аналогично для любого покупателя l€.Q = у У г Таким образом, для сбалансированного однопродуктового рынка доля каждого участника рынка в распределении прироста полезности от совер- шаемого обмена зависит только от его капитала (взятого в денежной или натуральной форме) и не зависит от распределения капиталов между от- дельными участниками рынка. Это значит, что цена на сбалансированном однопродуктовом рынке формируется вне рынка, т.е. в сфере производст- ва, что и соответствует трудовой теории стоимости и закону стоимости.
Приложение 1 О СМЫСЛЕ ВЫРАЖЕНИЯ ’’ПОЛНАЯ ОПРЕДЕЛЕННОСТЬ ИГРЫ” Согласно теореме п. 6.1 из равенства (13.10), справедливого для любой матрицы А , следует, во-первых, что смешанное расширение любой матрич- ной игры имеет значение, т.е. является вполне определенной игрой, а, во-вторых, что игроки в этом смешанном расширении имеют оптимальные стратегии. Как отмечалось в п. 4.5, значение смешанного расширения игры есть с одной стороны уверенный ожидаемый выигрыш игрока 1 за одну партию такой игры, а с другой — справедливая плата за участие в ней. Здесь можно было бы воспроизвести рассуждения из п. 6.7 с тем отли- чием', что теперь вместо достоверного получения тех или иных конкретных сумм речь будет идти об ожидаемых выигрышах. Поэтому полная опре- деленность смешанного расширения матричной игры должно пониматься в том смысле, что в условиях применения игроками оптимальных сме- шанных стратегий однозначно устанавливается математическое ожидание выигрыша игрока 1, которое и будет равно значению игры. Разумеется, если оптимальные стратегии игроков являются строго смешанными (т.е. не являются чистыми), то фактические (случайные) значения выигрышей игроков в отдельных партиях игры могут оказаться различными. Приложение 2 ДРУГОЕ ДОКАЗАТЕЛЬСТВО ТЕОРЕМЫ НЭША Существенно проще с технической точки зрения оказывается доказатель- ство теоремы Нэша, если вместо сравнительно элементарной теоремы о неподвижной точке Брауэра воспользоваться более тонкой теоремой Каку- тани. Теорема Какутани. Пусть X — непустое компактное подмножест- во а отображение Ф ставит в соответствие каждому элементу X Е X некоторое непустое замкнутое выпуклое подмножество 0(ЛЭ СХ, причем выполняется условие полунепрерывности сверху: если последовательность Xi, ..., Xt, ... точек из X сходится к предельной точке XOi а последователь- ность У1} ..., Yti ..., где Yt Е $(Xt) — к точке Уо, то Уо G $(Х0). Тогда 264
отображение ф имеет неподвижную точку в том смысле, что найдется точка X*, для которой X* € i//(X*)*). Терема Нэша доказывается на основании теоремы Какутани сле- дующим образом. Возьмем в игре Г = < /, { х/ } у € I, Wi} fez > произвольную ситуа- цию в смешанных стратегиях X = (Хг, Хп) и рассмотрим для каждого i е I множество (Х^) всех тех смешанных стратегий X*. игрока/, для которых НКХ\\ХП^^(Х И*/) (9.5) при любом X/ £ X/. Как легко проверить, множество Ф* (Ху) является замкнутым и выпук- лым подмножеством X/. Следовательно, декартово произведение П ^(Х/) i<EI является замкнутым и выпуклым подмножеством в пространстве всех ситуаций в смешанных стратегиях. Обозначим его через ^(Х). Соответ- ствие X i//(X) является полунепрерывным сверху, ввиду того, что в обеих частях (9.5) стоят непрерывные функции от X, так что при переходе к пре- делу неравенство сохраняется. Таким образом, по теореме Какутани найдется такая ситуация в смешан- ных стратегиях X*, что X* Е i//(X*). Для этой ситуации X* неравенство (9.5) переписывается как Яу(Х*) > Щ(Х* ИХ-), X-GXy, т.е. X* является ситуацией равновесия игры Г в смешанных стратегиях. □ *) Доказательство теоремы Какутани см., например, в кн. Л.В. Канторович, Г.П. Акилов, Функциональный анализ, М.: Наука, 1984, с. 637. 265
СПИСОК РЕКОМЕНДУЕМОЙ ЛИТЕРАТУРЫ А. УЧЕБНИКИ 1. Бургер (Burger Е.) Einfuhrung in die Theorie der Spiele. - Berlin: W. de Gruyter, 1959, S. 169 (Англ, nep.: Introduction to the theory of games. Englewood Cliffs: Prentice-Hall, 1963,202 р.) 2. Воробьев H.H. Теория игр. Лекции для экономистов-кибернетиков. — Л.: Изд-во ЛГУ 1974. — 160 с. (Англ.пер.: Game Theory. Lectures for economists and system scientists. - New York: Springer, 1977. - 178 p.) 3. Давыдов Э.Г. Методы и модели теории антагонистических игр. - М.: Изд. МГУ, 1978. - 208 с. 4. Джонс (Jones A.J.) Game theory: mathematical models of conflict. Mathematic and its applications. Chichester: E. Horwood, 1980-309 p. 5. Дрешер (Dresher M.) Games of strategy, Theory and applications. - N.Y.: Prentice- Hall, Englewood Cliffs, 1961. - 186 p. (Рус. пер.: Стратегические игры. Теория и приложения. - М.: Советское радио, 1964. - 352 с.) 6. Дюбин ГН., Суздаль В.Г. Введение в прикладную теорию игр. - М.: Наука, 1981.- 336 с. 7. Крушевский А.В. Теория игр. — Киев:. Вища школа, 1977. — 215 с. 8. Мак-Кинси (MacKinsey J.C.C.) Introduction to the theory of games, N.Y.: McGraw- Hill, 1952. - 371 p. (Рус. пер.: Введение в теорию игр. М.: Физматгиз, 1960. — 420 с. Исплер.: Introduction a la teoria matematica de los juegos. Madrid; Aguilar, 1967. - 377 p.) 9. Мантейфель, Штумпе (Manteuffel К., Stumpe D.) Spieltheorie. - Leipzig: Teubner, 1977.- 60 S. 10. Оуэн (Owen G.) Game theory. - Philadelphia e.a.: Saunders, 1968. — 228 p. (Pyc. пер.: Теория игр. - M.: 1971. - 230 с.) И. Оуэн (Owen G.) Game theory. Second Edition. Acad. Press, 1982. - 344 p. 12. Cen, Форго (Szep E., Forgo F.) Bevezetes a jatekelmelet be. — Budapest: Kozagzd. kiadd, 1974.- 313 1. 13. Cen, Форго (Szep E., Forgo F.) Einfuhrung in die Spieltheorie, Budapest, Akademiai Kiado, 1983. - 292 S. 14. Судзуки (Suzuki Mizuo) Theory of games. — Tokyo: Kieso Shobo, 1959, — 242 p. 15. Суздаль В.Г. Теория игр для флота. - М.: Воениздат, 1976. - 318 с. Б. МОНОГРАФИИ 16. Ауман, Шепли (Aumann R.J., Shapley L.S.)Values of nonatomic games. - Princeton univ. press, 1974. - 333 p. (Рус. пер.: Значения для неатомических игр. - М.: Мир, 1977. - 357 с.) 17. Базар, Олдсер (Basar Т., Oldser G.J.) Dynamic noncooperative game theory. — London a.o.: Academic Press, 1982. — 430 pp. 18. Берж (Berge C.) Theorie generale des jeux a n personnes. — Paris: Gauthier-Villars, 1957. - 114 pp. (Рус. пер. ; Общая теория игр нескольких лиц. - М.: Физматгиз, 1961.-с. 126.) 19. Воробьев Н.Н. Основы теории игр. Бескоалиционные игры. — М.: Наука, 1984. - 495 с. 2Ъ.Данскин (Danskin J.M.) The theory of max-min. - Berlin: Springer, 1967. - 126 S. (Рус. пер.: Теория максимина. - M.: Советское радио, 1970. - 200 с.) 266
21. Карлин (Karlin S.) Mathematical methods and theory in games, programming and economics.- London-Paris: Pergamon press 1959. (Рус. пер. Математические мето- ды в теории игр, программировании и экономике. - М.: Мир, 1964. - 838 с.) 22. Моргенштерн (Morgenstern О.) Spieltheorie und Wirtschaftswissenschaft. - Miinchen- Wien: R. Oldenbourg, 1966. - 200 S. 23. Фон Нейман, Моргенштерн (von Neumann J., Morgenstern O.) Theory of games and economic behavior. 3rd ed. -Princeton: Princeton univ. press, 1953. - 641 p. (Нем. nep.: Spieltheorie und wirtschaftliches Verhalten. - Wurzburg: Physica-Verlag, 1961. - 668S.;Pyc. пер.: Теория игр и экономическое поведение. - М.: Наука, 1970. - 707 с.) 24. Обэн (Aubin J.P.) Mathematical methods of game and economic theory. — Amsterdam: North-Holland Publ. Co., 1979. - 619 p. (2 изд., испр., 1982.-616 p.) 25. Партхасаратхи,Рагхаван (Parthasarathy T., Raghavan T.E.S.) Some topics in two- person games. - N.Y.: Amer. Elsevier, 1971. - 259 p. - (Рус. пер.: Некоторые вопро- сы теории игр двух лиц. -М.: Мир, 1974. - 295 с.). 26. Розенмюллер (Rosenmuller J.) Kooperative Spiele und Markte. — Berlin: Springer, 1971 (Leet. Motes Oper. Res. Math. Syst. V. 53) - 152 S.(Рус.пер.:Кооперативные игры и рынки. - М.: Мир, 1976. - 159 с.) 27. Розенмюллер (Rosenmuller J.) The theory of games and markets. - Amsterdam: North- Holland, Publ., Co., 1981. - 554 p. 28. Фридман (Friedman J.W.) Oligopoly and theory of games. - Amsterdam ел.: North Holland, 1977 (Advanced textbooks in economics, vol. 8). - 311 p. 29. Ховард (Howard N.) Paradoxes of rationality: theory of metagames and political beha- vior. - Cambridge Mass.: MIT Press, 1977. - 248 p. 30. Фон Штакельберг (von Stackelberg H.) Marktform und Gleichgewicht. - Wien: Sprin- ger, 1934. (Англ, nep.: The theory of the market economy. - Oxford: Oxford Univ. Press, 1952.) В. НАУЧНО-ПОПУЛЯРНАЯ ЛИТЕРАТУРА 31. Вентцель E.C., Элементы теории игр. - М.: Наука, 1961. - 67 с. 32. Воробьев Н.Н., Математическая теория игр. — Л.: Знание, 1963. - 72 с. 33. Воробьев Н.Н., Теория игр. - М.: Знание, 1976. - 64 с. 34. Дэвис (Davis М.А.), Game theory. A nontechnical introduction. - N.Y.: Basic books, 1970. - 224 p. - (Нем. nep.: Spieltheorie fur Nichtmathematiker. - Miinchen-Wien: Oldenbourg, 1972. - 216 S.; Франц, nep.: La theorie de jeux. - Paris: Colin, 1973. - 271 p.) 35. Рапопорт (Rapoport A.) Two-person game theory. The essential ideas. - Ann Arbor: The Univ, of Michigan Press, 1966. - 229 p. 36. Рапопорт (Rapoport A.) Amerson game theory. Concepts and applications. - Ann Arbor: The Univ, of Michigan Press, 1970. - 331 p. 37. Фогельзанг (Vogelsang R.) Die mathematische Theorie der Spiele.-Bonn: Ferd. Diim- mlers Verl. 1963, 254 s. Г. ОБЗОРЫ И СПРАВОЧНИКИ 38. Теория игр. Аннотированный указатель публикаций по 1968 г. — Л.: Наука, 1976, - 224 с. 39. Теория игр. Аннотированный указатель публикаций отечественной и зарубежной литературы за 1969 - 1974 гг. - Л.: Наука, 1980. - 298 с. 40. Воробьев Н.Н. Развитие теории игр. - В рус. пер. кн.: [23], с 631-702. (Немлер.: Entwicklung der Spieltheorie, Berlin, Verlag der Wissenschaften, 1975,143 S.) Воробьев Н.Н. Современное состояние теории игр. - Успехи мат. наук, 1970, с. 25, №2, с. 81-140. 42. Воробьев Н.Н. Бескоалиционные игры. - В кн.: Проблемы кибернетики, вып. 33, М., 1978, с. 69-90. 43. Лукас (Lukas W.F.) Some recent development in jV-person game theory. - SIAM Rev. 1971, vol. 13,N’4,p. 491-523. 267
44. Льюс и Райфа (Luce R.D., Raiffa Н.) Games and decisions. Introduction and critical survey. - N.Y.: J. Wiley, 1957. - 509p. (Рус. пер.: Игры и решения. Введение и кри- тический обзор. - М.: ИЛ, 1961. — 642 с.) 45. Соболев А.И. Кооперативные игры. - Проблемы кибернетики, 1982 вып. 8, с. 45-54. , 46. Томпсон, Томпсон (Thompson D.M., and Thompson G^L.) A bibliography of game theory. - Contributions to the theory of games, v. 4. Ann. of Math. Studies, - Princeton Univ. Press, 1959, p. 407-453. 47. Шубик (Shubik M.) Game theory in the Social sciences. Concepts and solutions. Cambrid- ge, Mass.a.o.: The MIT Press, 1982. — 514 p. 43. Яновская Е.Б. Бесконечные антагонистические игры. - В кн.: Теория вероятнос- тей. Математическая статистика. Математическая кибернетика. Т. 10, М., 1972, с. 75-106. 49. Яновская Е.Б. Антагонистические игры. - В кн.: Проблемы кибернетики, вып. 34. М.: Наука, 1978, с. 221-246.
ОГЛАВЛЕНИЕ Предисловие.............................................................. 3 Основные о бозначения.................................................... 5 Введение § 1. Бескоалиционные игры...................................... § 2. Примеры бескоалиционных игр............................... § 3. Оптимальность............................................. § 4. Равновесие................................................ § 5. Кооперативная теория...................................... § 6* Постановка прикладных задач теории игр................... § 1. * Проблематика теории игр ................................ Глава 1. Матричные игры § 1. Антагонистические игры.................................... § 2. Оптимальность в антагонистических играх................... § 3. Некоторые свойства экстремумов............................ § 4. Ситуации равновесия (седловые точки)...................... § 5. Инвариантность седловых точек............................. § 6. Седловые точки и минимаксы................................ § 7. Матричные игры............................................ § 8. Смешанные стратегии....................................... § 9. Смешанное расширение матричной игры....................... § 10. Существование минимаксов в смешанных стратегиях........... §11. Выпуклые множества........................................ §12. Лемма о двух альтернативах................................ § 13. Теорема о минимаксах...................................... § 14. Задача решения матричных игр.............................. § 15. Свойства значения игры и оптимальных стратегий игроков . §16. Множества оптимальных стратегий игроков в матричных играх . § 17. Спектры стратегий и дополняющая нежесткость............... § 18. 2 X 2-игры................................................ § 19. Графоаналитический метод решения 2 X и-игр................ § 20. Графоаналитический метод решения тп X 2-игр............... §21. Графоаналитический метод решения 3 X 3-игр................ § 22. Доминирование стратегий................................... § 23. Строгое доминирование стратегий........................... § 24. Вполне смешанные стратегии................................ §25. Матричные игры и линейное программирование................ § 26. Симметрия в играх......................................... 7 10 12 15 18 19 21 23 26 30 32 35 38 42 43 45 49 51 52 54 55 56 59 59 63 68 71 72 76 78 79 83 87 Глава 2. Бесконечные антагонистические игры § 1. Бесконечные антагонистические игры................................. 92 § 2. Ситуации е-равновесия, е-седловые точки и е-оптимальные стратегии. 93 § 3. е-оптамальные стратегии и минимаксы................................ 94 § 4. Смешанные стратегии................................................ 96 269
§ 5. Свойства значения игры и оптимальных стратегий игроков...... 101 § 6. Естественная метрика на множествах стратегий................ 104 § 7. Вполне ограниченные игры.................................... 107 § 8. Основная теорема о вполне ограниченных играх................. ПО § 9? Компактные игры............................................. 111 § 10. Оптимальные стратегии игроков в компактных играх............ 115 §11. Внешняя топология. Непрерывные компактные игры.............. 116 § 12. Выпуклые функции одного переменного......................... 117 §13. Выпуклые игры на единичном квадрате. Чистые оптимальные страте- гии игрока 2............................................... 121 § 14. Выпуклые игры на единичном квадрате. Оптимальные стратегии игрока 1................................................... 123 § 15. Строго выпуклые игры..................................... 125 §16. Общая схема решения выпуклых игр на единичном квадрате. При- меры......................................................... . 125 §17. Борьба за рынки.............................................. 127 §18. Распределение производственных мощностей в условиях частичной неопределенности.................................................. 130 §19. Игра на единичном квадрате с выпуклой неограниченной функцией выигрыша.......................................................... 133 § 20-* Выпуклая разрывная функция выигрыша.......................... 134 §21.* Выпуклые функции нескольких переменных........................ 135 § 22? Выпуклые игры с векторными стратегиями. Чистые оптимальные стратегии игрока 2.................................................. 136 §23* Выпуклые игры с векторными стратегиями. Оптимальные стратегии игрока!........................................................ 137 §24? Оптимальное распределение ограниченных ресурсов в условиях не- определенности ................................................ 140 § 25.* Примеры распределения охраниченных ресурсов в условиях неопре- деленности ......................................................... 144 §26 . Игры с разрывными функциями выигрыша......................... 145 §27 . Простые игры................................................ 146 §28 . Оценки значений простой игры................................. 147 § 29. Примеры простых игр.......................................... 149 § 30? Графоаналитическое решение одного класса простых игр......... 151 § 31. Борьба за встречу случайно появляющегося объекта............. 153 Глава 3. Бескоалиционные игры § 1. Понятие и определение бескоалиционной игры................. § 2. Основные соотношения между бескоалиционными играми......... § 3. Оптимальность в бескоалиционных играх...................... § 4. Приемлемые ситуации и ситуации равновесия.................. § 5. Инвариантность приемлемых и равновесных ситуаций........... § 6. Ситуации, оптимальные по Парето............................ § 7. Смешанные расширения бескоалиционных игр................... § 8. Ситуации равновесия в смешанных стратегиях................. § 9. Теорема Нэша............................................... §10. Дополняющая нежесткость.................................... §11. Симметричные ситуации равновесия........................... §12. Би матричные игры.......................................... §13. Решение би матричных игр................................... § 14. 2 X 2-биматричные игры..................................... § 15. Почти антагонистические игры............................... §16. ’’Семейный спор”........................................... §17. ’’Два бандита”......:...................................... §18. Метастратегии и метарасширения . .......................... § 19. Реализация принципов оптимальности в метастратегиях........ § 20. Диадические игры........................................... §21. Диадические игры трех лиц.................................. 159 161 163 163 164 166 168 170 171 174 174 176 177 179 182 183 185 186 188 191 193 270
§ 22. Охрана окружающей среды.................................... § 23. ’’Дезориентирующая реклама”................................ § 24. Полиантагонистические игры................................. Глава 4 Классические кооперативные игры § 1. Характеристические функции бескоалиционных игр............. § 2. Абстрактные характеристические функции..................... § 3. Реализация характеристических функций...................... § 4. Линейная структура множества всех характеристических функций § 5. Основные соотношения между характеристическими функциями . . . § 6. Аддитивность в характеристических функциях................... § 7. О - 1-редуцированная форма................................. § 8. Перечисление характеристических функций с малым числом игроков § 9. Дележи и классические кооперативные игры..................... § 10. Дележи и характеристические функции........................ § 11. Доминирование дележей...................................... § 12. Примеры доминирования дележей.......................... . . § 13. с-ядро..................................................... § 14. с-ядро в общих играх трех лиц.............................. § 15- * с-ядро в играх четырех лиц............................... § 16. Решения по Нейману — Моргенштерну.......................... § 17. Н — М-решения в играх трех лиц с постоянной суммой......... § 18. Н -М-решения в общих играх трех лиц........................ § 19. * Н —М-решения в играх с числом игроков, большим трех...... § 20. Вектор Шепли. Аксиоматика.................................. § 21. Существование и единственность вектора Шепли............... § 22. .Эвристические выводы формулы для вектора Шепли............ § 23. * Вывод формулы для вектора Шепли из аксиом . <............ § 24. Вектор Шепли для игр трех лиц.............................. § 25. Примеры вычисления вектора Шепли........................... Приложение 1.0 смысле выражения полная определенность игры”. . . . Приложение 2. Другое доказательство теоремы Нэша..................... 193 197 200 202 207 209 212 214 217 220 222 224 228 229 232 236 238 240 241 243 246 249 250 252 256 257 259 261 264 264 Список рекомендуемой литературы................................... 266
НИКОЛАЙ НИКОЛАЕВИЧ ВОРОБЬЕВ ТЕОРИЯ ИГР ДЛЯ ЭКОНОМИСТОВ-КИБЕРНЕТИКОВ Редактор А.Д. Вайнштейн Художественный редактор Т.Н. Кольченко Технические редакторы С.В. Геворкян, О.Б. Черняк Корректоры Т.В. Обод, Е.А. Янышева Набор осуществлен в издательстве на наборно-печатающих автоматах ИБ № 12425 Сдано в набор 03.07.85. Подписано к печати 22.10.85 Т-20176. Формат 60 X 90 1/16. Бумага офсетная № 1 Гарнитура Пресс-Роман. Печать офсетная. Усл.печл. 17,00 Усл. кр.-отт. 17,00. Уч-изд.л. 18,86. Тираж 10000 экз. (1001 — 10000 экз., II завод) Тип. зак. 117. Цена 1 р. 50 к. Ордена Трудового Красного Знамени издательство ’’Наука Главная редакция физико-математической литературы 117071 Москва. В-71, Ленинский проспект, 15 Ордена Трудового Красного Знамени 1-я типография издательства ’’Наука” 199034 Ленинград, В-34, 9-линия, 12