Текст
                    HERVE MOULIN
THEORIE DES JEUX POUR
L'ECONOMIE ET LA POLITIQUE
HERMANN COLLECTION
PARIS METHODES
1981


9.МУЛЕН ТЕОРИЯ ИГР С ПРИМЕРАМИ ИЗ МАТЕМАТИЧЕСКОЙ ЭКОНОМИКИ Перевод с французского О. Р. МЕНЬШИКОВОЙ и И. С. МЕНЬШИКОВА под редакцией Н. С. КУКУШКИНА МОСКВА «МИРа 1985
ББК 65 М 90 УДК 519.83 + 519.86 Мулен Э. М90 Теория игр с примерами из математической экономики: Пер. с франц.—М.: Мир, 1985.—200 с, ил. Книга французского математика, отражающая взаимосвязь между мате- математической экономикой и теорией игр;,в последние годы, на стыке этих двух наук получены интересные результаты. Изложение отличается методическими достоинствами-автор дает возможность читателю самостоятельно разобраться в тщательно подобранных упражнениях. Для ^студентов и аспирантов, изучающих математическую экономику в теорию игр, а также для специалистов, работающих в этих областях „ 1702070000 - 125 ' „. , ББК 65 М 041 @1)-85 34-854' ' 33 Редакция литературы по математическим наукам © 1981, Hermann © Перевод на русский язык, «Мир», 1983
ПРЕДИСЛОВИЕ РЕДАКТОРА ПЕРЕВОДА Выход в свет сорок лет назад монографии Дж. фон Ней- Неймана и О. Моргенштерна возбудил немало надежд на развитие теории игр в универсальную математическую теорию поведения в условиях конфликта интересов. Несмотря на последовавшие достижения (а, может быть, и благодаря им), этим надеждам не суждено было сбыться. Сегодня мало кто рассчитывает по- получить от теории игр предсказание поведения участников какого- либо реального конфликта или конкретные рекомендации для принятия решения. Однако, отказавшись от излишних претен- претензий, теория игр только прочнее заняла свое законное место в арсенале исследователей социально-экономических явлений. Без отчетливого понимания таких концепций, как оптималь- оптимальность по Парето, равновесие по Нэшу, С-ядро, иерархическое решение, сегодня просто невозможно браться за математическое исследование ситуаций с несколькими участниками. Предлагаемая вниманию советского читателя книга вышла на французском языке в 1981 г. и неанглийском языке в 1982г. В предисловии к английскому изданию этой книги Э. Мулен так характеризует значение теории игр для социально-эконо- социально-экономических наук: «По нашему мнению, теория игр представляет собой набор инструментов для построения моделей в экономи- экономической и политической теориях. Единственным, но вполне до- достаточным оправданием существования теории игр служит ее растущее применение в этих дисциплинах. Она является поис- поистине неиссякаемым источником гибких концепций, каждая из которых проливает свет на определенные стороны социальных взаимоотношений... . В частности, мы предпочитаем рассмат- рассматривать каждое из десятка излагаемых здесь понятий устойчи- устойчивости как отдельный «идеальный тип» (термин М. Вебера), иллюстрирующий какую-то определенную стратегическую и (или) информационную особенность совместного действия». В соответствии с таким пониманием автор не стремится из- излагать теорию игр как раздел «чистой» математики, связи ко-
6 Предисловие редактора перевода торого с какой-либо реальностью давно утрачены. Перед чита- читателем развертывается панорама различных подходов к опреде- определению рациональных коллективных действий, каждый со своим содержательным обоснованием, со своими логическими следст- следствиями. В некоторой степени эта книга может быть уподоблена известней монографии Льюса и Райфы «Игры и решения», кардинально отличаясь от нее манерой изложения: Э. Мулен экономно пользуется прямой авторской речью, предпочитая, чтобы теоремы и особенно примеры говорили сами за себя. Это позволило при значительно меньшем объеме книги охватить не меньший объем материала. Специалисты по математической экономике (в самом широ- широком смысле слова), ощущающие недостаточность своего теорети- теоретико-игрового багажа, найдут эту книгу весьма удобной. Основ- Основные понятия и идеи изложены компактно и ясно, многочислен- многочисленные примеры иллюстрируют возможности теоретико-игрового подхода в анализе социально-экономических явлений. Пожалуй, и многие специалисты, скептически оценивающие возможности теоретико-игрового подхода к интересующим их проблемам, изменят свое мнение после знакомства с этой книгой. Особый интерес представляет книга Э. Мулена для препо- преподающих теорию игр. И отбор, и расположение материала за- заметно отличаются от привычных (достаточно сказать, что гл.1 не называется «матричные игры»); достигнутая при этом высо- высокая степень логической стройности впечатляет. Несомненно, появление русского перевода этой книги окажет значительное влияние на программы курсов по теории игр, читаемых ныне во многих вузах страны. Рекомендуя книгу Э. Мулена самому широкому кругу чи- читателей, следует все же подчеркнуть, что ее никак нельзя назвать популярной. Это серьезная математическая книга; для полного ее понимания от читателя требуются и самостоятель- самостоятельные усилия и известная математическая культура, хотя ника- никаких предварительных знаний, выходящих за рамки программ младших курсов экономико-математических специальностей (не говоря уж о математических), не предполагается. Впрочем, и читатель, совершенно не готовый или не склонный разбирать- разбираться в абстрактных построениях, сможет ее прочесть, если при каких-либо затруднениях будет обращаться к примерам. В лю- любом случае полученные удовольствие и польза оправдают за- затраченные усилия. В процесе перевода на английский язык для издательства New York University Press Э. Мулен внес в свою книгу ряд существенных изменений. С любезного разрешения автора и при его содействии эти изменения в значительной степени учте- учтены при подготовке настоящего издания. В частности, исполь-
Предисловие редактора перевода зовано предисловие к английскому изданию и опущена послед- последняя глава французского издания, посвященная «-ядру и век- вектору Шепли, что позволило достичь большей цельности изложе- изложения, сосредоточенного теперь исключительно на стратегических концепциях. Н. С. Кукушкин
ПРЕДИСЛОВИЕ Теория игр принадлежит к числу важнейших математиче- математических инструментов современных социально-экономических наук. Автор данной книги ставил перед собой две основные цели. 1) Предложить неспециалистам замкнутое изложение основ- основных понятий теории стратегических игр. Определения и резуль- результаты с математической точки зрения являются совершенно строгими. Вместе с тем обсуждению и сравнению различных понятий равновесия уделено большее место, чем развитию ме- методов их вычисления. Технические детали в большинстве слу- случаев опускаются. Чтобы стимулировать читателей, предлагается более 75 упражнений и задач, некоторые из них достаточно трудны. 2) Обосновать полезность теоретико-игровых концепций для теоретического анализа социально-экономических ситуаций. Для этой цели были тщательно отобраны 39 ярких примеров. В основном они почерпнуты из микроэкономических проблем: приведены примеры, относящиеся к теории несовершенной конку- конкуренции, теории общественных благ, рассмотрены модели голосо- голосования, методы дележа и т. д. Во многих задачах читателю пред- предлагается развить интерпретацию игровой модели. Для этого было бы полезно некоторое знакомство с логикой экономиче- экономических рассуждений. Некоторые важные разделы современных теоретико-игровых исследований в данной книге не рассмотрены. Наибольший пробел — исследование игр с неполной информацией, поскольку, по моему мнению, результатам в этой области недостает завер- завершенности и простоты, необходимой для учебника. Опущено также изложение аксиоматического подхода к решению игр в форме характеристической функции, поскольку я отнес бы их скорее к нестратегическому анализу общественного выбора (см. введение). Исходным материалом для этой книги послужили лекции кур- курса теории игр, прочитанного в Национальном институте статиста-
Предисловие ки и экономического управления. Я особенно благодарен Полю Шамсору, который был инициатором этого курса. Я глубоко признателен Центру математической теории при- принятия решений Парижского университета, где я начинал изу- изучать теорию игр под руководством Жана-Пьера Обена и Ивара Экланда, а также лаборатории эконометрики Политехнической Школы, поддержка которой обеспечила выход этой монографии в свет, благодаря Вильме де Суза, Мартине Видони и Мари- Элен Понруа, очень хорошо напечатавших рукопись. Я также благодарен Эндрю Шоттеру, убедившему меня подготовить английский вариант книги, и Институту математи- математических исследований в социальных науках в Стэнфорде, госте- гостеприимство которого позволило мне завершить работу. Эрве My лен
ВВЕДЕНИЕ Игра — это идеализированная математическая модель коллек- коллективного поведения: несколько индивидуумов (участников, игро- игроков) влияют на ситуацию (исход игры), причем их интересы (их выигрыши при различных возможных ситуациях) различны. Антагонизм интересов рождает конфликт, в то время как совпа- совпадение интересов сводит игру к чистой координации, для осущест- осуществления которой единственным разумным поведением является кооперация. В большинстве игр, возникающих из анализа со- социально-экономических ситуаций, интересы не являются ни стро- строго антагонистическими, ни точно совпадающими. Продавец и по- покупатель согласны, что в их общих интересах договориться о "продаже, конечно, при условии, что сделка выгодна обоим. Однако они энергично торгуются при выборе конкретной цены в пределах, определяющихся условиями взаимной выгодности сделки. Подобно этому рядовые избиратели, как правило, сог- согласны отвести кандидатов,, представляющих крайние точки зре- зрения. Однако при избрании одного из двух кандидатов, предла- предлагающих различные компромиссные решения, возникает ожесто- ожесточенная борьба. Немного поразмыслив, читатель, наверное, со- согласится с тем, что большинство напоминающих игры ситуаций общественной жизни порождают как конфликтное, так и коопе- кооперативное поведение. По нашему мнению, теория игр является полезным логическим аппаратом для анализа мотивов поведе- поведения участников в подобных ситуациях. Она располагает целым арсеналом формализованных сценариев поведения, начиная с не- некооперативного поведения (гл. I) и до кооперативных соглаше- соглашений с использованием взаимных угроз (гл. VI), Для каждой игры в нормальной форме использование различных кооператив- кооперативных и иекооперативиых концепций равновесия, как правило, приводит к различным исходам. Их сравнение является основ- основным принципом теоретико-игрового анализа и, по-видимому, источником строгих и вместе с тем содержательных рассужде- рассуждений о побудительных мотивах поведения, вытекающих только из структуры игры в нормальной форме.
Введение 11 Во многих социальных науках имеется большое количество моделей, при анализе которых требуется изучать способы выбо- выбора стратегий. Приложения теории игр преимущественно разви- развиваются в связи с исследованием экономики. Это соответствует установкам основоположников теории игр фон Неймана и Мор- генштериа. Однако прочная репутация теоретико-игрового подхо- подхода утвердилась только после теоремы Дебре — Скарфа, позво- позволяющей рассматривать конкурентное равновесие как результат кооперативных действий. С тех пор целые разделы экономичес- экономической теории (такие, как теория несовершенной конкуренции или теория экономического стимулирования) развиваются в тес- тесном контакте с теорией игр (см. обзор Шоттера и Шведиауэра |1980]). Начиная с книги Фаркуарсона [1969], анализ процедур го- голосования, направленный на изучение стратегических возмож- возможностей, позволил переосмыслить некоторые традиционные на- Йравления политической теории. Хотя используемые при этом ЗЙГровые модели по-прежнему вызывают споры, достаточно ясно, *Jto потенциальные возможности теоретико-игрового подхода зна- значительны. Отсылаем читателя к обзорной работе Брамса [1975] и к последним работам по стратегической реализуемости (Мулен [1981]). Теоретико-игровой способ мышления является сейчас доста- достаточно общим в социологии (см. Крозье [1977]). Ясно, что поиск равновесных концепций, являющихся идеализацией целого ёиектра некооперативных и кооперативных схем поведения, тесно связан с основами социологии. В частности, наша точка Зрения на кооперацию как на необязательные соглашения (часть II), безусловно, восходит к идеям Руссо об эволюции от «естест- «естественной свободы» к «гражданской свободе» (см. Руссо [1755]). Тем не менее в современных социологических исследованиях формальные теоретико-игровые модели весьма редки и с мате- математической точки зрения элементарны. И все-таки влияние теории игр кажется нам уже необратимым, по крайней мере на этапе обучения. Обзор содержания книги В части I изучается некооперативное поведение изолирован- изолированных игроков. Само задание игры в нормальной форме предпо- предполагает, что все переменные модели распределены между игро- игроками, которые распоряжаются их выбором по собственному желанию (таким образом, все переменные модели становятся определенными после того, как каждый игрок зафиксирует свою стратегию). Вначале мы предполагаем, что обмен инфор- информацией между игроками невозможен. При этом выдвигается
12 Введение несколько логически обоснованных способов выбора игроком стратегии, которой он «должен» придерживаться. К таким по- понятиям следует отнести доминирующие и осторожные стратегии, когда мы предполагаем, что игрок не знает предпочтений ос- остальных игроков (гл. 1), а также сложное поведение, когда мы считаем, что все предпочтения игроков известны каждому участнику игры (гл. II). Эти стратегии могут быть рассчитаны каждым игроком независимо от поведения других игроков. Указанные понятия являются статическими. К сожалению, сколь бы привлекательны ни были эти понятия, их математические, свойства являются плохими (в частности, равновесие в домини- доминирующих стратегиях и сложное равновесие, как правило, не существуют). Поэтому мы переходим к рассмотрению концеп- концепций некооперативного равновесия «второго уровня», а именно, равновесия по Нэшу, которое требует некоторых контактов между игроками хотя бы на уровне совместного наблюдения за происходящим (гл. III). Предлагается несколько сценариев поведения, обосновывающих определение равновесия по Нэшу; все они требуют перехода к динамике (хотя бы из двух перио- периодов). В отличие от понятий «первого уровня», исходы игры, равновесные по Нэшу, обладают хорошими математическими свойствами. Если игроки используют независимые рандомизи- рандомизированные стратегии, то существование таких исходов можно гарантировать в весьма широких предположениях (гл. IV). Основная причина перехода от понятий ч. I к понятиям ч. II (кооперативное поведение игроков) состоит в том, что индивидуальная свобода выбора стратегий наносит ущерб обще- общественным интересам. Некооперативное равновесие (является ли оно следствием изолированного поведения, как в гл. I и II, или удовлетворяет условиям стабильности по Нэшу, как в гл. III и IV) может не быть оптимумом Парето. Свободный выбор игроком своей стратегии противоречит требованию эффективнос- эффективности коллективного выбора в том (и только том) случае, когда для каждого оптимального по Парето исхода найдется выгод- выгодное с точки зрения какого-либо игрока отклонение. В этом случае оптимальные по Парето исходы игры нельзя считать правдоподобными. Дилемма заключенного (пример 1 гл. I) яв- является хорошо известным примером такого противоречия. Это простейший пример противоречия между стабильностью и эф- эффективностью, которое мы считаем главным побудительным мо- мотивом к кооперации. К сожалению, сами механизмы коопера- кооперации являются не столь наглядными. Для того чтобы получить исходы, лучшие по Парето,, чем некооперативное равновесие, мы предполагаем, что игроки за- заключают необязательные соглашения. Это такие сценарии пове- поведения, которые не лишают игроков их неотъемлемого права.
Введение 13 придерживаться любой стратегии, находящейся в их распоря- распоряжении. Эти соглашения автоматически выполняются благодаря свойству стабильности, которое аналогично свойству, введенно- введенному Нэшом: «Меня никто не принуждает следовать нашему со- соглашению, но до тех пор, пока вы, все остальные, ему верны, у меня нет причин его нарушать». На самом деле, понятие равновесия по Нэшу — это исторически первый существенный пример кооперативного соглашения такого типа. Концепции гл. V последовательно развивают различные стороны определения Нэша. «Мы сотрудничаем, потому что мы хотим этого, однако добровольная кооперация приводит к обязанностям для нас неожиданным» (Дюркгейм [1893]). Необязательные соглашения полностью признают право свободного выбора игроком своих стратегий. Однако реализуемость таких соглашений требует определенных ограничений на обмен информацией между игро- игроками. Одна из возможностей—запретить по достижении'согла- достижении'соглашения дальнейшие переговоры с тем, чтобы участники не могли больше угрожать друг другу. Этот путь приводит к понятиям стабильности гл. V. Другая возможность состоит в том, чтобы любые отклонения от договоренности (в выборе стратегии) ста- Йовились известными всем и потому можно было бы своевремен- своевременно привести в исполнение взаимные угрозы. Это приводит к кооперативной точке зрения на предостережения, которым по- посвящена гл. VI. Мы не касаемся обязательных соглашений, поскольку тут Возникает целый круг вопросов, не связанных с выбором стра- стратегий, а скорее относящихся к теории общественного выбора. Под обязательным соглашением мы понимаем договоренность игроков о некотором исходе игры, причем выполнение этой договоренности обеспечивается некоторым контролирующим ор- органом. После подписания такого соглашения игроки фактичес- фактически лишаются контроля над своими стратегиями. Следователь- Следовательно, вопросы стабильности соглашений отпадают, поскольку никакие нарушения договоренности ни отдельным игроком, ни коалицией игроков больше не возможны. Таким образом, все сложные проблемы кооперации снимаются после того, как соглашение подписано, зато все они возникают до подписания. Другими словами, поскольку теперь нет смысла сравнивать соглашения с точки зрения их стабильности, приходится гово- говорить об их большей или меньшей «справедливости». Таким образом, подход к кооперации из описательного (какие согла- соглашения являются стабильными при той или иной информацион- информационной структуре?) превращается в нормативный (какие соглаше- соглашения считать справедливыми при заданных соотношениях сил отдельных игроков и коалиций?). При этом главная аксиома состоит в том, что справедливость — это первичный побудитель-
14 Введение ный мотив к кооперации, или, другими словами, несправедли- несправедливость является решающей причиной разрушения кооперации. Если хотя бы одному положению суждено остаться неизмен- неизменным в будущем в теории стратегических игр, то это, по-види- по-видимому, будет утверждение о том, что данной игре адекватно несколько, не слишком много, равновесных концепций, в за- зависимости от условий обмена информацией и кооперации. И зна- значит, игра в нормальной форме, наша основная математическая модель, действительно является богатым источником стратеги- стратегических сценариев, проясняющих логические связи таких пер- первичных понятий, как кооперативное и эгоистическое поведение, взаимные стратегические ожидания, тактическая неопределен- неопределенность и ограничение информированности при кооперации, об- обмен угрозами и обещаниями. Критика предложенных концеп- концепций должна основываться на их приемлемости в приведенных примерах. Изучение равновесных концепций приводит к ряду теорем существования, а также к некоторым контрпримерам. Однако пустоту, скажем, а-ядра некоторой конкретной игры в нор- нормальной форме не следует интерпретировать как логическое обоснование невозможности кооперации с помощью угроз в этой игре. Скорее это означает, что сценарий предостережений, который лежит в основе определения а-ядра, не описывает полностью коалиционное поведение, и нужны другие, более сложные схемы (как правило, это двухшаговые концепции, см. гл. VI, разд. 2). Скромность создателя математических моделей требует избегать апокалиптических интерпретаций. ЛИТЕРАТУРА Брамс (Brams S.) [1975] Game theory and politics. London, Glencoe Free Press Collier Macmil- lan Pub. Дюркгейм (Durkheim E.) [1893] De la division du travail social. Paris, Крозье, Фридберг (Crozier M., Friedberg F.) [1977] L'acteur et le systeme. Paris, ed. Seuil. Мулен (Moulin H.) [1981] The strategy of social choice. Laboratoire d'Econometrie de l'Ecole Polytechnique, n° A229, Paris A983, in advanced textbooks in Econo- Economics, North-Holland, Amsterdam). Руссо (Rousseau J. J.) [1755] Discours sur l'origine des inegalites. Фаркуарсон (Farquharson R.) [1969] Theory of voting. New Haven Yale University Press. Шотгер, Шведиауэр (Schotter A., Schwodiauer G.) [1980] Economics and game theory: a survey. Journal of Economic Littera- lure 18,2.
ЧАСТЬ I Некооперативное поведение игроков Основной моделью для анализа некооперативного поведения является игра в нормальной форме. Определение. Пусть N—фиксированное конечное сообщество, скажем множество игроков (участников), для обозначения кото- которых используется индекс i. Игрой в нормальной форме называется совокупность, содер- содержащая для каждого игрока i(*N — множество стратегий Xit элементы которого обозначаются л:,-, — функцию выигрыша (функцию полезности) uh являющуюся Отображением из XN = X Х- в IR1'. Элемент л: = (х-)t- e л/ из мно- жества Хд, называется исходом игры. Игрок i выбирает любую стратегию xt g Х{. После того как каждый игрок выбрал свою стратегию, определяются исход х И выигрыш t'-ro игрока и; (х). Отметим, что в описанной выше модели нет ни случайных ходов, ни игрока, который бы моде- моделировал неопределенность, свойственную природе. L) В книге без пояснений используются общепринятые обозначения! Э частности, |R — мно^естро вещественных чисел.— Прим. перев.
ГЛАВА I НЕКООПЕРАТИВНОЕ ПОВЕДЕНИЕ ИЗОЛИРОВАННЫХ ИГРОКОВ Рассмотрим игру в нормальной форме (Х{, и{; i?N) и пред- предположим, что игроки в этой игре действуют изолированно, т. е. каждый игрок выбирает свою стратегию независимо, не обра- обращая внимания на то, какие стратегии выбирают другие участ- участники. Игроки не обмениваются информацией. На выборы игроков не оказывает влияния прошлое (предыстория партии игры или начальная позиция). Напротив, все стратегии априори считаются эквивалентными, и их различие должно устанавли- устанавливаться, исходя из внутренних принципов оптимальности. На протяжении гл. I будем считать, что каждому игроку известна его собственная функция выигрыша; функций выигрыша остальных игроков он может не знать. В этих предположениях исследуем по очереди два не противоречащих друг другу сце- сценария поведения изолированных игроков: сначала исключение доминируемых стратегий, а потом осторожное (максиминное) поведение. 1. ДОМИНИРУЮЩИЕ И НЕДОМИНИРУЕМЫЕ СТРАТЕГИИ Определение 1. Стратегия х{ игрока / в игре в нормальной форме (Х{, ut; i € N) доминирует стратегию yt, если Vx, € X, ut{yh xt)^ut(x{, xt), Эх, € X, ut{yh xt)<ut(Xi, xt), где Xt= X X, и {xt, xi)€.XN. Обозначим через ®,(иг) множество всех недоминируемых стратегий t-ro игрока: у, ? 2>{ (и{) фф % х{ € Х{\ х{ доминирует у{. Стратегия t'-ro игрока х{ доминирует стратегию у{, если независимо от поведения «остального мира» /V\{t} стратегия yt для него не дает большего выигрыша, чем х(, а для некоторого
Гл. I. Некооперативное поведение игроков 17 допустимого стратегического выбора игроков Л^\{/} ему выгод- выгоднее выбрать х{, чем у{. Отсюда следует, что игроку i имеет смысл выбирать стратегию только из множества й), (ы;). Заметим, что t-му игроку для вычисления @){ (и{) достаточно знать множества стратегий Xj своих партнеров; знание их функций выигрыша не требуется. Определение 2. Стратегия xt игрока i в игре в нормальной форме (X/, и{\ i?N) называется доминирующей стратегией1), если v<//€*/ Vxt?Xt: и,-(у,; xt)^ut(xt, xt). Обозначим через Df(«(-) множество всех доминирующих стра- стратегий i-ro игрока. Исход x = (x;)ieN назовем равновесием в доминирующих стратегиях, если xt является доминирующей стратегией 1-го игрока при всех i. Недоминируемые стратегии существуют при достаточно сла- слабых топологических предположениях, поэтому постулат о том, что при некооперативном поведении игрок исключает домини- доминируемые стратегии, не приводит к логическому противоречию. Лемма 1. Предположим, что для любого i^N множество Х{ компактно, а функция и{ непрерывна. Тогда множество 3>t (ut) недоминируемых стратегий i-го игрока не пусто. Доказательство. Для любого / выберем вероятностное рас- распределение Цу на Xj таким образом, чтобы каждое непустое открытое подмножество Xj имело положительную меру2). Зафик- Зафиксируем i и рассмотрим функцию г|>,-, определенную на Xt: где jjfi = ® fi/ (тензорное) произведение ц,, / Ф i. Поскольку функция Uj непрерывна, то непрерывна и функ- функция я|з/( а следовательно, можно выбрать стратегию **, макси- максимизирующую функцию tyj на множестве Xt. Покажем, что стра- стратегия а;^ недоминируема. В самом деле, если существует стра- стратегия X;, доминирующая а;*, то в силу непрерывности функ- функции щ найдется открытое подмножество Ot множества Xt, *) В отечественной литературе используется также термин «абсолютно оптимальная стратегия»,— Прим. перев. 2) Для существования такой меры достаточно, чтобы в Xj существо- радо счетное всюду плотное подмножество.— Прим. перев.
18 4:1. Некооперативное поведение игроков такое, что Vx, ? Oi u; (xt, xt) < ut (xit xt). В силу выбора fiy, \ф1, получаем \ui{xf,x)d\i {xt)< \u{{xh xt)d\it(xt). 0, O, Поскольку неравенство и,- (л;*, xl) ^ ut {xh xt) справедливо на всем множестве Хи то имеем1) \ и; (xft xt) d Hi (xt) < J и,- (xlt xi) d\it (xt). Складывая два неравенства, приходим к противоречию: Ь (xt) < fy (Xi)- Ш В противоположность полученному выше результату доми- доминирующие стратегии могут не существовать даже в топологи- топологически тривиальных (конечных) играх. В самом деле, доминирующая стратегия х{ должна одновре- одновременно быть решением задач максимизации max ut(xh xs) х при всех значениях параметра Стратегии xt и у( i-ro игрока будем считать эквивалент- эквивалентными, если они не различимы с его точки зрения: Vxt?X, и,-(х,; xt) = ui{yl, xt). Лемма 2. Предположим, что в игре в нормальной форме (Xj, ut; j € N) множество недоминируемых стратегий i-го игрока непусто: @)((и;)Ф 0. Тогда эквивалентны следующие три утверждения:2) (i) Существует доминирующая стратегия i-го игрока! Dt(u,)*0. (ii) Все стратегии в множестве й>, (и,) эквивалентны. (in) D,(ul) = S)i(ui). Доказательство леммы 2 оставляется читателю в качестве (элементарного) упражнения. 1) Здесь и далее Ас—дополнение к множеству Л.— Прим. перев. г) Для того чтобы утверждения (i) (iii) следовали из (ii), достаточна потребовать компактность множеств Xj и непрерывность функций Uj, j?N. Без этого предположения лемма, вообще говоря, не верна.— Прим. перев.
Гл. I. Некооперативное поведение игроков 19 В лемме 2 говорится о том, что если у игрока есть хотя бы одна доминирующая стратегия, то все доминирующие стра- стратегии эквивалентны и совпадают с его недоминируемыми стра- стратегиями. В этом случае будем считать, что при некооператив- некооперативном поведении игрок использует одну из них. С другой сто- стороны, если у 1-го игрока нет доминирующей стратегии (наиболее частный случай), то его недоминируемые стратегии не эквива- эквивалентны, поэтому его некооперативное поведение не может быть определено однозначно. Требуются дополнительные предположе- предположения об информации, которой располагают игроки (в частности, о функциях выигрыша), чтобы сделать дальнейшие заключения; см. разд, 2 ниже и гл. II. Равновесие в доминирующих стратегиях постулируется рацио- рациональным некооперативным поведением изолированных игроков. В приведенных ниже примерах 2 и 3 показано, что равно- равновесие в доминирующих стратегиях может быть доминируемым по Парето (см. определение 3), что делает это понятие уязви- уязвимым при кооперативном поведении игроков. Пример 1. Дилемма заключенного (Льюс и Райфа [1957]) Каждый из двух игроков располагает двумя стратегиями А и Р, где А обозначает агрессивность, а Р—миролюбие. Пред- Предположим, что «мир» (оба игрока миролюбивы) лучше для обоих игроков, чем «война» (оба игрока агрессивны), но односторон- односторонняя агрессия (один игрок агрессивный, а другой миролюбивый) выгоднее агрессору. Типичная структура выигрышей имеет сле- следующий вид: Игрок 1 - 2 2 3 0 0 3 1 1 Игрок 2 Стратегиями первого игрока являются строки платежной мат- матрицы, а стратегиями второго игрока — столбцы. Результаты игры указаны в матрице 2x2, причем «северо-западное» число обо- обозначает выигрыш первого игрока, а «юго-восточное»—выигрыш второго игрока, например ^(А^ Р2) = 3. Для обоих игроков стратегия А доминирует стратегию Р. Таким образом, единственное равновесие в доминирующих стра- стратегиях имеет вид (Лх, Л2), т. е. постулируется, что результатом некооперативного поведения является война. В то же время исход (Pj, P2) (мир) дает большой выигрыш сразу для обоих игроков. Таким образом, некооперативное эгоистическое рацио-
20 4.1. Некооперативное поведение игроков нальное поведение вступает в противоречие с коллективными интересами. Коллективные интересы диктуют выбор мирных стратегий. В то же время, если игроки не обмениваются инфор- информацией (так что, например, не могут возникнуть взаимные угрозы типа: «Я буду миролюбив, до тех пор пока ты будешь миролюбив»; подробнее об этом см. в гл. VI), война является наиболее вероятным исходом: изолированность стратегических выборов может нанести определенный ущерб общественным интересам. Определение 3. Исход х (Е XN в игре в нормальной форме (X/, «,-; i?N) доминирует по Парето исход y?XN, если \ 3i€# «/foX «,(*)¦ Исход х назовем оптимальным по Парето (или оптимумом Парето), если он не доминируем по Парето. В следующем примере равновесие в доминирующих страте- стратегиях также доминируемо по Парето. Пример 2. Аукцион неделимого товара Товар должен быть куплен одним из п участников. Его ценность для 1-го участника измеряется величиной ah причем предполагается, что с ростом i величины а,- не возрастают, т. е. Будем рассматривать два типа аукционов. На аукционе первого типа каждый участник независимо предлагает цену. Пусть, например, i-й участник выбрал цену х-г Победителем считается тот, кто предложил наиболее высокую цену. Эта цена выплачивается продавцу товара. Обозначим через г началь- начальную цену, назначаемую продавцом, т. е. ценность товара для продавца, и предположим, что г^ап. Складывается следующая игра п лиц: Х,= ... =Х„ = [г, +оо), для всякого х?Х{1 . п) положим w(x) = {i/x(= sup x,\. 1 < / < п ' Тогда ai(x) = ai—xl, если i= inf /, / € w <X) U[ (x) = 0 в противном случае. Заметим, что при одинаковых ценах предпочтение отдается тому игроку, для которого ценность товара больше. Покажем, что а,-, т. е. искренняя стратегия 1-го игрока, доминирует всякую стра- стратегию хь для которой выполнено а,- < xt. В самом деле, Щ(Х(> ^)<° = "; (Я/. хд Для любого xt. Значит, ©,- (ы;) = [Г) а;].
Гл. I. Некооперативное поведение игроков 21 Тем не менее у i-ro игрока нет доминирующей стратегии, если только г<а,. Для исключения доминируемых стратегий нужно знать только свою собственную функцию выигрыша. Если первому игроку известна ценность товара для остальных игроков, то он может исключить стратегии (а2, ах]. Мы разовьем эти соображения в гл. II (см., в частности, упр. 3). В данной главе сосредото- сосредоточим внимание на изолированном поведении, требующем знания только собственной функции выигрыша. В аукционе второго типа (аукцион Викри) победителем счи- считается также участник, предложивший наибольшую цену, однако он должен уплатить вторую по величине цену. Возникает сле- следующая игра п лиц: Х1=...=Хп = [г, +оо). Для всех л;?Х{1> ..,„} обозначим *_,-= sup х,. 1</<л ' Тогда uj(x) = ai—х_(, если i= inf /, / € ш (X) «,(*) = О в противном случае. Утверждается, что искренняя стратегия а{ является доми- доминирующей стратегией i-го игрока. В самом деле, фиксируем исход х € XN и выделим два случая. Случай 1. Игрок i выигрывает на аукционе при исходе (в/, х,). Отсюда следует *;_,•<;а,-. Заметим, что ul(x) = ai—x_h если 1-й игрок выигрывает аукцион также и при исходе х, и щ (л;)=0 в противном случае. Следовательно, "/(*/, АГ/Ха,—х_, = и/(а,, xt). Случай 2. Игрок i не выигрывает аукциона при исходе (a,., xt). Тогда а;^х_1, а значение функции «,•(*,•, xt) есть либо (а,-—x_i), либо 0, поэтому ut(x,, а;,)<0 = и, (а,., xt). Легко можно убедиться в том, что нет другой доминирующей стратегии i-го игрока, значит, D,- (и-) — {а,}, и равновесие в доми- доминирующих стратегиях приводит к победе на аукционе первого игрока, который выплачивает цену а2. Этот исход доминируется по Парето исходом (г, ..., г). Если каждый игрок назначит начальную цену аукциона, то игрок 1 получит товар, заплатив всего лишь г. Конечно, игроки {2, ..., п\ не станут помогать игроку 1, если он не перераспределит часть своего сверхдохода at-^-r
22 Ч. I. Некооперативное поведение игроков между ними. Такое поведение было бы кооперативным, здесь оно не рассматривается. О нем см. в гл. VI разд. 5. Пример 3. «.Услуга за услугу» Если у одного участника есть несколько доминирующих стратегий, то они для него эквивалентны (см. лемму 2), но возможно не эквивалентны для остальных. Рассмотрим следую- следующую игру двух лиц, в которой стратегии каждого участника влияют только на выигрыш другого, но не на свой собственный: Благожела- jтельность ;к игроку 2 Игрок 1 Неблагоже- Неблагожелательность 1 1 1 0 0 1 0 0 Благожела- Неблаго- тельность желательность к игроку 1 Игрок 2 Любой исход является равновесием в доминирующих стра- стратегиях, но только один из них оптимален по Парето. Задача 1. Две олигополистические игры (Кейз [1979]) 1) Игра с назначением цен в дуополии. Два дуополиста предлагают на рынок взаимозаменяемую продукцию. Если они установили цены pi и р2, то соответст- соответствующий спрос на их продукцию будет равен: di=i—} единиц товара, произведенного игроком 1, dt~(—j* единиц товара, произведенного игроком 2. Предположим, что затраты на выпуск единицы продукции у обоих производителей не зависят от масштабов производства. Тогда приходим к следующей игре в нормальной форме: ui(Pb Pt) = (Pt—ci)di, где С; — постоянная величина, с,>0, а,> 1, /=1, 2. Вычислите равновесие в доминирующих стратегиях для этой игры и проанализируйте выбранную форму функций спроса. 2) Олигополия с назначением выпусков. Предположим, что цена на некоторый товар с насыщаемым спросом (например, минеральную воду) убывает по экспоненте c-e~s, где S—совокупное предложение.
Гл. /. Некооперативное поведение игроков 23 Пусть количества минеральной воды, предлагаемой на рынке п производителями, измеряются величинами xv ...,хп, тогда в предположении нулевых затрат получаем следующую игру; (Ответьте на те же вопросы, что и в 1.) Задача 2. Топологические свойства множеств 3)г и D( Пусть для всех i ? N множество Xt компактно, а функция и,- непрерывна на XN. 1) Докажите, что для любого игрока i единственная недо- недоминируемая стратегия существует тогда и только тогда, когда у него имеется единственная доминирующая стратегия. 2) Покажите на примере, что множества S>t (и,-) недомини- недоминируемых стратегий и множество исходов, оптимальных по Парето, не обязательно замкнуты. Что можно сказать о множествах D,- («,•) доминирующих стратегий? Задача 3. Стратегически обоснованное правило голосования с упорядочением (Myлен [1980]I) Пусть (А, «$) есть (линейно) упорядоченное множество из р кандидатов, среди которых сообщество N — {1, 2, ..., п) должно выбрать одного. Для любого нечетного К обозначим через тк следующее отображение из Ак в А: mK{ait для всех (af, ..., ак) € Ак. Таким образом, тк(аи ...,ak) является медианой (средним элементом) множества \аи ...,ak\ в соответствии с заданным порядком на А. Определим семейство правил голосования на А. Пусть мно- множество стратегий i-го игрока (множество предложений) есть просто X,- = А, а правило голосования имеет вид я {хи ...,*„) = m2n_j (xl xn,at а„_1), где (Xf, ...,хп) изменяется на X{i nJ, а a(, ...,an_j — фик- фиксированные элементы множества А. В частности, полагая af= ... =an_l= inia, получаем, что n(xv ...,xn)= inf xt. Или, например, пустьaj=.. .=ay=inf a, aa/+j=...=an_j=supa. aeA aeA x) Правило голосования называют стратегически обоснованным, если в соответствующей этому правилу игре существует равновесие в доминирую- доминирующих стратегиях при всех предпочтениях участников из некоторого заданного класса.— Прим. перев
24 Ч. 1. Некооперативное поведение игроков Тогда nf+i(xb ...,*„) есть кандидат ранга / + 1, если только хи ...,хп расположены в порядке убывания относительно за- заданного порядка на А. Если для каждого участника i опреде- определить полезности ut на А, то правило голосования порождает следующую игру п лиц1): g = (Xj, .... Х„; и^я, ..., и„оп). 1) Пусть х{ и yt два соседних элемента А относительно заданного на этом множестве порядка. Докажите следующие предложения: {и,-(л;,) > «,-(#,•} =>{х{ доминирует yt для игрока i\, {U{ (Xj) = ut (yt)\ => {а;,- и y-t эквивалентны для игрока i]. Выведите отсюда, что S)t {u{) состоит только из локальных максимумов uh т. е. xt € 3>t (и,) =>.[V^ € А \и{ (х;) < и, (у,)\ => => 32, € iXt, у,) {«j B,) < И,- (Xt)\\ 2) Докажите, что если функция выигрыша щ игрока i уни- унимодальна на (А, ^), т. е. на (¦*—, а] щ не убывает, За, на [а, Р] ы; постоянна, на [Р, —»¦) и, не возрастает, то у игрока ( есть доминирующая стратегия. Каково множество Dt{ut) в данном случае? Докажите, что равновесие в доминирующих стратегиях в игре g оптимально по Парето. 3) Для произвольных функций выигрыша и{ на А докажите, что множество недоминируемых стратегий в играх g, получен- полученных на основе правил голосования nit ...,лп_г, имеет сле- следующий вид; для я„ ...,яп_,- S)i (щ) = LM (и() = {х{ € А \ xt локальный мак- максимум щ), для щ\ &>i(ui) = {xi€LM(ui)\Vyl€LM(ui) [y,<x,] или [ui(yt)<ut(xt)]\. Задача 4. Механизм финансирования общественных благ по Кларку—Гроувзу (Грин, Лафон [1979]) 1) Функция выигрыша каждого игрока в игре g является суперпози- суперпозицией отображения я, формализующего правило голосоваиия и функции цр- лрзности, заданной на множестве кандидатов А.— Прим. перев.
Гл. I. Некооперативное поведение игроков U5 Пусть А — множество из р исходов (представляющих раз- различные общественные проекты, кандидатов и т. п.), среди ко- которых сообщество N должно выбрать один. В противополож- противоположность предыдущей задаче предположим, что допустимы побоч- побочные платежи (денежный обмен) и что участники имеют квази- квазилинейные полезности. Так, если м,- — действительная функция на А, представляющая полезность для 1-го участника, то сово- совокупная полезность определяется как и,(а) + ^, где а?А является принятым решением, а число t{ (положительное) — побочный платеж участнику i. В механизме Кларка — Гроувза каждый участник объявляет свою функцию полезности. Поскольку информация о функции м,- имеется только у i-ro участника, он может выбрать любой вектор Xi?R.A и утверждать, что это и есть его функция по- полезности. Следовательно, X,- = RA есть множество стратегий 1-го игрока. После того, как каждый игрок i объявляетxh скла- складывается исход x$XN. Решение а* = а*(л;)(ЕЛ выбирается из условия 2 *, (а*) = sup/2*, 0I. (О Побочный платеж игроку i есть tt (x): tl(x)= 2 Xj(a*)-sup! 2 ieN\{t] ЫА \(бЛ/\ Следовательно, если (ut)i6 n—совокупность истинных функ- функций полезности, то получается следующая игра в нормальной форме: g = (Xh щ, i?N), где и, (*) = и, (а* (*)) + */(*)• Отметим, что отображение л:—> а* (а;) любое, удовлетворяющее A). 1) Заметьте, что число tt(x) неположительно, и дайте ин- интерпретацию случаям /,-(*) = 0 и ti(x)<0. 2) Докажите, что искренняя стратегия xt = u{ является единственной (с точностью до аддитивной константы) домини- доминирующей стратегией игрока L 3) Докажите, что равновесие в доминирующих стратегиях и = (u{)ie л- оптимально по Парето тогда и только тогда, когда t{ (a* («))== 0 для всех i. Дайте интерпретацию этому результату.
26 Ч. I. Некооперативное поведение игроков 2. ОСТОРОЖНЫЕ И ОПТИМАЛЬНЫЕ СТРАТЕГИИ Если у t-ro игрока не имеется информации о функциях выигрыша остальных игроков, то он не может исключать из рассмотрения какие-либо допустимые стратегии из X/ (мы пред- предполагаем, что множества стратегий всех игроков известны всем). Один из способов исключения стратегий на множестве Х{ состоит в удалении доминируемых стратегий. Другой путь соответствует пессимистическому предположению (исключающему риск), что случится худшее. Определение 4. В игре в нормальной форме (Х{, ut\ i € N) Xj является осторожной стратегией t-ro игрока, если выполнено inf ut{xh xt)— sup inf «,(#,-, x) = a{. Обозначим через Pi(u{) множество осторожных стратегий t-ro игрока. Осторожное поведение реализуемо и совместимо с правилом исключения доминируемых стратегий. Лемма 3. Предположим, что Xt—компакты, а и{ непре- непрерывны для всех i ?N. Тогда множество Р{ {и{) осторожных стратегий i-го игрока не пусто, компактно и пересекается с множеством eDt (u{) недоминируемых стратегий: Доказательство. Фиксируем i?N. Поскольку функция и{ непрерывна, то функция Э (yt)= inf u{(yh x,) полунепрерывна сверху*) на X,- и, следовательно, множество ее точек макси- максимума есть непустое компактное множество Р{(и{). Рассмотрим далее игру Я == (У„ м;; у g N), где У; = Ху для / Ф i и У, = Р{(и{). По лемме 1 игрок t имеет по крайней мере одну недомини- недоминируемую стратегию х{ в игре Н. Предположим, что xt домини- руется стратегией у{ в исходной игре (Х;, ut; i € N), т. е. [V*, € X и, (х„ xt) ^ и, (у„ х,)] => [Э (*,) < в (у{)]. Отсюда Q(yt)= sup Э(г,-) и yt € Р{ (ut), что противоречит пред- г,<ЕХ; !) Функция / (*) называется полунепрерывной сверху, если для любого к множество {х | / (х) ^ к) замкнуто. Полунепрерывность сверху функции в (щ) следует из непрерывности функции и/ (дг) в силу равенства Для случая метрического пространства Ал функция 9 ((/,•) является непре- непрерывной.— Прим перев.
Гл. I. Некооперативное поведение игроков 27 положению о недоминируемости xt в игре Н. Значит, xt при- принадлежит Pt («,) П 3>i (и,-)- В Нц>ке в задаче 5 мы предполагаем другой вариант опреде- определения 4, который автоматически выделяет подмножество из множества Р{ (и,) n @>t (ut). Используя осторожную стратегию, игрок i гарантирует себе выигрыш а,-. Назовем а,- гарантированным выигрышем. Если набор (а,)Fл/ гарантированных выигрышей является оптималь- оптимальным пс) Парето, тогда мы считаем, что осторожные стратегии также могут быть названы оптимальными. Определение 5. Скажем, что игра в нормальной форме не- несущественна, если нет исхода y&XN, для которого Vt g N sup inf «,¦ (a;,-, Xt) = a,- < «,- (y) ^X *X Название «несущественные» для данного класса игр на ин- интуитивном уровне можно пояснить следующим примером. Имеется единица однородного товара, которая должна быть поделена среди членов сообщества N. Предположим, что игрок i за счет хорошей игры может гарантировать, что его окончательная доля будет не меньше а{ независимо от поведения остальных игроков. Допустим, что 2 а,-=1- Тогда («,-),•<= л/ есть дележ 16 N товара, который должен быть результатом «оптимального» по- поведения игроков1).. В нашем более общем случае функции вы- выигрыша игроков не являются сравнимыми, а потому их нельзя складывать. Тем не менее, в несущественной игре осторожные стратегии оптимальны в следующем смысле. 1) Приведем пример несущественной игры. Предположим, что игроки {1 л} используют следующую процедуру дележа. Игра проводится в п этапов. На первом этапе игрок 1 объявляет, что он претендует на неко- некоторую долю л:х<1. Игрок 2 можете этим согласиться, а может объявить, что он претендует на некоторую долю х2 < xv Далее игрок 3 может либо принята предложение игрока 2, либо сделать собственную заявку дг8 < xt и т. д. На первом этапе игрок i, чья заявка дг,- < *,-_i будет принята игроками (+1, .••, п, получит долю товара дг,- и выйдет из игры. Для остальных игроков повторяется описанная процедура. На этапе я—1 остается два игрока. На последнем этапе п остается один игрок, который и забирает остаток товара. На этом игра кончается. Нетрудно убедиться в том, что гарантированный выигрыш любого игрока равен 1/я, а потому игра несущественна и ее исходом является справедливый дележ. Эту игру удобно представлять как игру в разверну- развернутой форме. См. гл. II.— Прим. перев.
28 Ч. 1. Некооперативное поведение игроков Теорема I. Предположим, что (Xh ut\ i^N)—несуществен- i^N)—несущественная игра. Пусть x-t—осторожная стратегия игрока i для всех i?.N, и пусть х—соответствующий исход. Тогда 1) ui(x) — ai^.ui(xi, yt) для всех igAf и yt?Xt, 2) х—оптимальный по Парето исход, 3) для любой коалиции ScN и любого набора стратегий ys € %s одновременное выполнение следующих двух условий не- невозможно: 3i € S ut (x) < и; (ys, xSc). Доказательство. Поскольку xt—осторожная стратегия t-го игрока, то имеем <х,= inf щ{х,, yt)^u{(x). ytex. Данное неравенство выполнено для всех i, а поскольку наша игра несущественна, то а,- = ut (x) для всех i и утверж- утверждение 1 теоремы доказано. Утверждение 2 следует из 3 при S = N. Для доказательства 3 выберем S и ys 6 Xs, такие, что Vt g S а, < щ (ys, xSc). B) Применяя утверждение 1 к / ? Sc, получаем Объединяя две системы неравенств, получаем и{ (ys, xsc) — a{ для всех i, поскольку игра несущественна. Следовательно, строгое неравенство в B) невозможно. Щ Согласно утверждению 1, если игрок i использует оптималь- оптимальную (т. е. осторожную) стратегию и ожидает, что остальные игроки сделают то же самое, то он получит выигрыш, равный гарантированному а,-. Если некоторые игроки \, \Ф1 откажутся от использования оптимальных стратегий, то это может быть только выгодно игроку i. Свойство 3 означает, что никакой отдельный игрок и никакая коалиция игроков не имеют при- причин для одностороннего отхода от осторожных стратегий (мы неявно предполагаем, что побочные платежи внутри коалиции невозможны, т. е. полезности не трансферабельны). В терминах определения 1 гл. V набор осторожных стратегий является сильным равновесием. Для того чтобы дать интерпретацию определению 5, рас- рассмотрим также игру (Х;, ы(; i g N), которая не является несу- несущественной, и заметим, что никакой набор стратегий х не мо- может быть назван оптимальным.
Гл. I. Некооперативное поведение игроков 29 В самом деле, два очевидных требования оптимальности суть at ^ щ (х) для всех i и оптимальность по Парето исхода к. По определению 5 эти условия вместе приводят к тому, что для некоторого i 6 N получается sup inf «,• (уi, yt) = at < иг (х). Иначе гоЕоря, игрок i не может себе гарантировать выиг- выигрыш и,- (х) и может подвергнуться угрозам со стороны допол- дополнительной коалиции #\{i}. Основные примеры несущественных игр следует искать, ко- конечно, среди игр двух лиц с нулевой суммой. Но об этом в следующем разделе. Упражнение 1. Предположим, что g— игра двух лиц, в которой равновесие в доминирующих стратегиях оптимально по Парето. Обязательно ли игра g несущественна? Задача 5. Лексикографически осторожные стратегии (Му- лен [1981]). Для каждого элемента z = (zlt ..., zr) из IR7 результат пере- переупорядочения его координат по возрастанию обозначим через г*: г* = (&. •••• Ут)&{У1, .... iM = {*i *т\, Введем далее лексикографический порядок в R7": W < *, yt = гь У и < *.¦ Пусть (Xh «,•; i?N) — игра в нормальной форме, причем множества X,- конечны. Будем говорить, что стратегия х( иг- игрока i является лексикографически осторожной, если она мак- максимизирует на множестве X,- по отношению к лексикографиче- лексикографическому порядку в Rx? следующее отображение: х{ =» (и,- (X;, х,) | xi ? Хг)*. Обозначим через LP (и() множество лексикографически ос- осторожных стратегий г-го игрока. 1) Дайте интерпретацию введенного определения. 2) Докажите включение LP,(«,-) s Р{ («,) п ®,- (и,). 3) Докажите, что понятие лексикографически осторожной стратегии обобщает понятие доминирующей стратегии в сле- следующем смысле: {Pi («,¦) Ф 0} => [LP( (н,) = D,- (и,.) = S>i (и,)}.
30 Ч. 1. Некооперативное поведение игроков 3. ИГРЫ ДВУХ ЛИЦ С НУЛЕВОЙ СУММОЙ Игры двух лиц с нулевой суммой имеют вид (Х1( Х2; щ, —Щ), т. е. игроки являются чистыми антагонистами. Обозначим такую игру через G = (Хи Х2, их), понимая под их (положительный или отрицательный) платеж, который игрок 1 максимизирует, а игрок 2 минимизирует Тогда осторожные стратегии могут быть заданы так: х1 €Л (и,)«* inf Ui(xit yt)= sup inf ul(y1, y2), *. € Pt i—Ui) & sup «, (yu хг) = inf sup m, (yu y2). Числа sup inf«, и inf sup ы, являются соответственно макси- Ui Уг Уг У\ мальным гарантированным выигрышем игрока 1 и минималь- минимальным гарантированным проигрышем игрока 2. Они связаны не- неравенством sup inf «!<: inf sup щ. C) ft fti Уг ft Для доказательства C) фиксируем произвольные xt^Xit *г€^2 и заметим, что «Pi (*i) = inf "i (*i. Л) < «i (*i. *i) < SUP «t (г/t, a;2) = ф2 (xt). Уг Vi Отсюда следует sup cpi (yt) < inf cp2 (y,). ft V> Если выполнено равенство sup inf щ = nf sup ы{ = a, ft V. Ws ft то будем называть число а ценой игры G1). Если в C) стро- строгое неравенство, то будем говорить, что игра не имеет цены. Теорема 2. Пусть G = (X(, X2, и^ — игра двух лиц с нуле- нулевой суммой. Если игра имеет цену, то она несущественна. Обратно, предположим, что Xv X2 — компакты, а м, непрерывна, тогда если G несущественна, то она имеет цену. 1) Наряду с этим термином в отечественной литературе широко исполь- используется также термин «значение игры».— Прим. перев.
Гл. I. Некооперативное поведение игроков 31 Доказательство. Предположим, что G имеет цену, и пусть исход (xt, л;2) €Х,х Х2, таков, что sup inf ut < Uf (xit xt), sup inf — «,<-«! (л^, хг) фф Mj (xu хг) < inf sup щ. v ' </* </i Уг Ч\ Поскольку (З) обращается в равенство, то эти два нера' венства на самом деле тоже равенства, и первое утверждение доказано. Предположим теперь, что C) — строгое неравенство. В силу сделанных топологических предположений и леммы 3 мы можем выбрать пару (хи xt)?P1(u1)xPi(ut). Эта пара удовлетворяет системе D), в которой хотя бы одно из неравенств строгое, и поэтому игра G не может быть несущественной. Щ Для несущественных игр с нулевой суммой пара оптималь- оптимальных стратегий является седловой парой. Определение 6. Седловая пара в игре двух лиц с нулевой суммой (Хи Х2, щ) есть такая пара (хи хг)^Х1хХ2, что V (Уи Уг) € Хг X Хг «! (уи Xt) < Mj (Хи Хг) < Mi (Хи у2). Обозначим через S множество (возможно пустое) седловых пар. Теорема 3. Пусть G = (XU X2, uj — игра двух лиц с нуле- нулевой суммой. Если G имеет цену, то исход является парой оптимальных стратегий тогда и только тогда, когда он яв- является седловой парой: S — Pl (щ) х Р2 (и2)- Если G не имеет цены, то в этой игре нет также и седловой пары. Доказательство. Предположим сначала, что игра имеет цену и, следовательно, несущественна. По свойству 3 теоремы 1 получаем включение Pl(u1)xP2(u^)^S. Обратно, выберем седловую пару. Из определения 6 получим inf sup ut < sup ux (ylt xt) < u, (*!, xt) < inf щ (хи уг) < sup inf ut. Ш У1 Ух Уг Vi Уг В силу C) эти четыре неравенства огфащаются в равен- равенство, а значит, xt — осторожная стратегия игрока i (i = 1, 2). Щ Теоремы 2 и 3 показывают, что ключевой характеристикой для игр с нулевой суммой является существование или отсут- отсутствие цены игры. Если игра обладает ценой, то оптимальные стратегии существуют и определяются эквивалентно двумя спо- способами: изолированно (как осторожные стратегии) и одновре- одновременно обоими игроками (как седловые пары).
Ч. I. Некооперативное поведение игроков Пример 4 Пусть у обоих игроков имеется по 3 стратегии. Функция щ из X1xXi в R задана 3x3 матрицей, в которой строки соот- соответствуют элементам множества Хи а столбцы — элементам мно- множества Х2. Рассмотрим следующую функцию выигрыша. -2 -1 -3 5 0 2 -3 -1 -2 + + У игрока 1 одна оптимальная стратегия (+), а у игрока 2 их две. Цена игры равна —1. С другой стороны, игры без цены обычно порождают не- несходящуюся последовательность стратегических ожиданий. В самом деле, пусть (Хи Х2, щ) — игра с нулевой суммой, причем sup inf щ = а < Ь = inf sup их. X, Х2 Х2 X, Скажем, что игрок 1 выигрывает, поднимая финальный пла- платеж выше Ь, а игрок 2 — удерживая финальный платеж ниже а. Допустим, что игрок 1 собирается использовать стратегию х\. Предвидя этот выбор и используя наилучший ответ (страте- (стратегию х\), игрок 2 выигрывает:- «1 (*?, xl) = inf щ (х\, у2) < а. 4-1 Ожидая, что второй игрок выберет х\, и используя наилуч- наилучший ответ (стратегию л;}), игрок 1 выигрывает: Ь < sup «i (уи xl) = щ (х\, xl). И так далее... Для последовательности (хи xi)^N> B которой л;^ —наилучший ответ второго игрока на х{~\ а ^ — наилучший ответ игрока 1 на х[, получаем Следовательно, ни одна из двух последовательностей (х{I?ц и (x{)t<=N не сходится^) (в предположении непрерывности щ и компактности Х\ и Xt). 1) Сходимость последовательностей наилучших ответов подробно иссле- исследована в разд. 3 гл. III.— Прим. перев.
Гл. 1. Некооперативное поведение игроков 33 пример 5 Предположим, что игрок 1 собирается применить свою един- единственную осторожную стратегию xt. Поскольку игроки прини- принимаю^ решения изолированно, то игрок 1, считая, что против- противник Также планирует выбор единственной осторожной страте- стратегии yit может отказаться от осторожной стратегии и приме- применить наилучший ответ хг против стратегии ух и т. д. Проиллюстрируем сказанное на следующем примере, в кото- котором у каждого игрока имеется по одной оптимальной стратегии. 0 2 3 1 В заключение приведем пример игр с нулевой суммой без цены и с ценой, а также несколько упражнений и задач. Пример 6. «Раз — два — три» Каждый игрок выбирает одну из трех стратегий «раз», «два» или «три». Выигрыш первого игрока положителен, если он правильно угадал выбор второго игрока, и нуль в противном случае. Выигрыши задаются 3x3 матрицей: Игрок 1 Раз Два Три 1 0 0 0 2 0 0 0 3 v Раз Два Три Игрок 2 Гарантированный выигрыш игрока 1 равен 0, и любая его стратегия является осторожной, так как гарантирует только 0. Гарантированный проигрыш игрока 2 равен 1, и у него единственная осторожная стратегия, а именно «раз» (поскольку «два» и «три» могут дать проигрыш величины 2 или 3). В гл. IV мы будем использовать смешанные (рандомизиро- ва*ные) стратегии для расширения рассмотренной выше игры до такой игры, которая имеет цену. 2 к* тез
34 Ч, 1. НекооЛеративнйе поведение игрокМ ^^. Пример 7. Дуэль1) Каждый из двух игроков может произвести один выстрел. Игроки сходятся с постоянной скоростью. В момент t = О иг- игроки достаточно далеко друг от друга, а в момент t=\ схо- сходятся вплотную. Задана действительная функция а, на отрезке [О, 1], измеряющая меткость игрока i, i=\, 2. Значение а,(/) есть вероятность того, что игрок i поразит игрока /, если будет стрелять в момент t. Предположим, что а{ не убывает, непре- непрерывна и удовлетворяет краевым условиям а,@) = 0 и 0,A)= 1. Выигрыш (игрока 1) равен -И. если первый игрок пора- поражает второго до того, как сам будет поражен; —1 в симмет- симметричном случае и 0, если ни один не поражен, либо оба пора- поражены одновременно. Множества стратегий суть Xf = X2 = [0, 1]. Стратегия xt игрока i означает» «Я буду стрелять в момент t = xit если противник не вы- выстрелит раньше. Если же он выстрелит, но промахнется, то я для надежности буду стрелять в момент t= 1». Следовательно, нормальная форма игры имеет вид (Xlt X2, «j), где и1(х1,х2)=- если хх<х„ если х, =Xj, E) 1 — 2а2 (х2), если х2 < хи Например, пусть х1 = хг. Тогда выигрышу +1 соответствует вероятность ax(A;j)(l — аг (а;1)), т.е. игрок 1 попал, а его про- противник промахнулся. Выигрышу —1 соответствует вероятность аг(хг)A— aj(*i))- Вычислим осторожные стратегии игрока 1. В силу E) легко проверить, что для любого лгх € [О, 1] «Pi (*i) = inf "i (*i. *•) = inf {2 «, (*i) - 1, 1 - 2a2 (xj}. Пусть / есть отрезок, принадлежащий [О, 1] (возможно, и точка), определяемый из условия / = {*.€ [О, 1] | 2а, (Xl) - 1 = 1 - 2с, (х,)}. Функция фх возрастает до /, постоянна на / и убывает после /. Поэтому [ = Р1(и1) является множеством осторожных стратегий игрока 1. Гарантированный выигрыш игрока 1 a1 = supinfw1 есть общее значение функций 2ах—1 и 1— 2а2 X, Ж, s) Этот вид поединка иногда называют шумной дуэлью, чтобы отли- отличить от бесшумной дуэлн, когда игрок не слышит выстрела противника (см. упр. 3).— Прим. перев.
Гл. I. Некооперативное поведение игроков 35 на /. Аналогично можно показать, что 1 — Р2(иг) и гаранти- гарантированный проигрыш второго игрока равен щ. Следовательно, а1 есть цена игры, а / — множество оптимальных стратегий для обоих игроков. Каждый стреляет оптимально, когда Упражнение 2 Обобщите теоремы 2 и 3 для класса квазиантагонистических игр1) двух лиц (Хь Х3, «j, и2), которые определяются сле- следующим образом: любой исход игры оптимален по Парето, т. е. Ух, у € X, х Х2: [и, (х) < щ (у)] ФФ [и, (у) Упражнение 3. Бесшумная дуэль В этом варианте приведенной выше игры выстрел игрока не слышен для его противника и тот узнает о нем, лишь если он его поражает. 1) Докажите, что соответствующая функция выигрыша имеет вид (Х1 = Хг = [0, 1]): !)—а2 (хг) + аг (х^-а^ (xt), если xt < л:2, )—а2(д;8), если x1 = xtt 2) Предположим, что функция ах—a2-\-at-a2 монотонно возрастает по t, a at—a3—ai-a2 монотонно убывает. Сосчитайте гарантированные выигрыши обоих игроков и докажите, что они не совпадают. Более точно, если v—цена шумной дуэли (пример 7), то докажите, что sup inf щ < v < inf sup ut. xt х„ x2 Xi Упражнение 4 Пусть (Xj, X2, и,) — симметричная игра двух лиц с нулевой суммой, т. е. Xi = X2; щ{хь х,)= — щ(х%, xj для всех xit xt. Докажите, что ее цена (если таковая имеется) равна нулю, а множества оптимальных стратегий совпадают. Задача 6 (Myлен [1976]) Для любых действительных чисел а, Ь, с, d следующая игра двух лиц с нулевой суммой, в которой у каждого игрока четыре стратегии, имеет цену. Матрица выигрышей для игрока, *) В отечественной литературе принят термин: игры с противополож- противоположными интересами.— Прим. перев.
36 Ч. I. Некооперативное поведение игроков выбирающего строки, имеет вид а с а с Ь d d а d а fft+c-f 4 b С a-\-b-\-c-\-d 4 -d Более того, цена val (G) игры G удовлетворяет неравенствам sup{inf(a, b), inf (e, d)} < val (G)< inf {sup (а, в), sup (b, d)}. Дайте интерпретацию. Задача 7 (Шепли) Пусть G = (X,, Х2, щ) — конечная игра двух лиц о нулевой суммой. Предположим, что для каждого двухэлементного под- подмножества У, множества X,, i=\, 2, игра (Yt, Y2, ut) имеет цену. Докажите, что в этом случае игра G также имеет цену. Задача 8 Пусть (Xj, X2, «() — игра двух лиц с нулевой суммой. Обо- Обозначим через #{ = Х* (соответственно /?2 = Xf') множество стратегий—ответов первого игрока (соответственно второго игрока). Докажите следующие равенства: sup inf ut(xu ха)= inf sup щ(х{, X X SRx inf sup щ (xit x2 x,e x, sup inf ut (rt '16 R, хге x, , x2). Каковы оптимальные стратегии в игре (Rit X2, щ), где Щ (ги х2) = щ (г, (хг), xt)f 2) Предположим, что Хь Х3—выпуклые компакты. Обозначим через RcicRi (соответственно Rc2czR2) множество непрерывных функций из Х2 в X, (соответственно из X, в Х2). Докажите следующие неравенства: sup inf щ ^ sup inf щ (rt (xt), xj ^ inf supui(xit r% r,e Rc. x< inf sup щ (используйте теорему Брауэра: непрерывное отображение вы- выпуклого компакта в себя имеет по крайней мере одну непод- неподвижную точку).
Гл. I. Некооперативъное поведение игроков 37 3) Приведите пример, в котором Х1 = Х2 = [0, 1], щ непре- непрерывна и тем не менее sup inf ut — sup inf ut << inf sup ut = inf sup щ. ЛИТЕ1РАТУРА Грин, Лафон (Green J., Laffont J. J.) f 1979] Incentives in public decision making. Studies in public economics, vol. 1, Amsterdam, North-Hollland Publishing Co. [1979] Economics and the competitive process. New York, University Press. Льюс, Райфа (Luce R. D., Raiffa H|.) Г19571 Games and decisions, New York,, J. Wiley. [Имеется перевод: Льюс Р. Д., Райфа X. Игры и решения.—. М.: ИЛ, 1961.] Мулен (Moulin H.) . [1976] Prolongement des jeux a deux joueurs de somme nulle. Paris, Bulle- Bulletin de la Societe Mathematiqme de France, Suppl. Memoire 45. [1980] On strategy-proofness and siingle peakedness. Public Choice, 35, [19811 Prudence versus sophistication in voting strategies. Journal oi Econo- Economic Theory, 24, 3, 398-412.
ГЛАВА II СЛОЖНОЕ ПОВЕДЕНИЕ Осторожное поведение игроков основано на предположении об их «полной изолированности», согласно которому каждый игрок ориентируется только на свою собственную функцию выигрыша и не обращает внимания на функции выигрыша осталь- остальных игроков. В этой главе исследуем, напротив, случай «полной информированности», когда каждый игрок знает все функции выигрыша. При некооперативном поведении игроков это по- порождает взаимные стратегические ожидания следующего вида: игрок i ожидает, что все другие игроки / исключат свои до- доминируемые стратегии. На основе этого ожидания, возможного благодаря полной информированности, у некоторых игроков могут возникнуть новые доминируемые стратегии и т. д. Сложное поведение будет определено сначала для игр в нор- нормальной форме (разд. 1), затем эквивалентным образом для игр в развернутой форме (разд. 2). В разделах 3, 4 и 5 демонстри- демонстрируются некоторые приложения теоремы Куна. 1. ПОСЛЕДОВАТЕЛЬНОЕ ИСКЛЮЧЕНИЕ ДОМИНИРУЕМЫХ СТРАТЕГИЙ Пример 1. Выборы большинством голосов с решающим игро- игроком при равном числе голосов (Фаркуарсон [1969]). Сообщество II, 2, 3} должно выбрать одного из трех кан- кандидатов {а, Ь, с\. Правило голосования есть правило большин- большинства, при этом голос игрока 1 оказывает решающее влияние при равенстве голосов. Другими словами, множество стратегий (множество предложений) имеет вид Х,= {а, Ь, с) для i =1, 2, 3. Если игроки выдвинули кандидатуры {л^, х2, х3}, то выборы происходят по правилу , . I х., если х„ = х,, Л (Xit *,, X.) — { 2 3 , S 1 s *' [ xt, если хг Ф х3.
Гл. II. Сложное поведение 39 Предположим, что функции выигрыша игроков при избра- избрании того или иного кандидата имеют следующую структуру (парадокс Кондорсе1)): Щ. (с) < "i Ф) < "i (a), «» Ф) < «з (а) < «г (с)> и3 (а) < и3 (с) < иа ф). В игре трех лиц в нормальной форме (Х1( X2, Х3, щоп, игоп, к8оп) каждый игрок имеет единственную лексикографи- лексикографически осторожную стратегию (см. задачу 5 гл. I), а именно голосовать за наиболее предпочтительного для себя кандидата. Следовательно, лексикографически осторожное поведение при- приведет к избранию кандидата а. При условии полной информи- информированности ситуация будет совершенно другой. Заметим, что стратегия Х2 = Ь игрока 2 доминируется (стратегией х\ — с) и что стратегии а и с не доминируемые, но и не эквивалентные; и2ол F, а, с) = щ (Ь) < и2 (с) = и2оя F, с, с), и2ол ф, а, а) = и% (а) > ы2 ф) = игол ф, с, а). Значит, йJ(и2) = {а, с}, и аналогично eD3(ua) = {b, с}, С дру- другой стороны, игрок 1, чей голос разрешает спорные ситуации, имеет доминирующую стратегию, а именно а (проверку этого факта оставляем читателю). Таким образом, если считать, что игроки не будут использовать доминируемые стратегии, то множества стратегий сузятся до Yi = {a), У2 = {а, с), У8 = {&, с}. При данном усечении множеств стратегий для игрока 2 стратегия а теперь доминируется стратегией с и поэтому может быть исключена: и3оп(а, а, хя)^игоп(а, с, х9) для Xg = b, с, и неравенство становится строгим при хй — с. Аналогично стратегия b игрока 3 теперь доминируется стратегией с: иаоп(а, хг, b)^u3on(a, xt, с) для х2 = а, с, неравенство становится строгим при xs — c. Следовательно, после двух раундов исключения доминируе- доминируемых стратегий у каждого игрока останется по одной стратегии и кандидат с будет избран, несмотря на то что он является наихудшим для игрока 1! Следовательно, право первого игрока х) Классический пример того, что для большинства членов сообщества исход а лучше нехода ft, Ь лучше сие лучше а,—Прим. перев.
40 Ч. I. Некооператибное поведение игроков ^ разрешать спорные ситуации оказывается его слабым пунктом в игре, потому что оно дает возможность сразу предвидеть его стратегический выбор. Определение 1. Для игры в нормальной форме G = = (X,-, ut; i ? N) последовательное исключение доминируемых стратегий означает построение последовательностей X,- = = X°i=>X1i=>...=>Xti=>Xtl+lzD... для всех i?N, где Xf+1 = = SM«V. Х<„ i?N). Скажем, что игра G разрешима по доминированию, если существует целое t, такое, что для всех i функция выигрыша и; не зависит от xt на X'N: Va;,, y^Xl Vxt^X't U;(xit xi) = ul(yl, xt). A) В этом случае назовем X'N множеством сложных равновесий в игре G. Ясно, что если A) выполнится для некоторого t (и неко- некоторого i € N), то Х'( = X?+1 = ..., поэтому если игра разрешима по доминированию, то выбор конкретного t не изменит мно- множества Х^,. Следовательно, множество сложных равновесий определено корректно. Для того чтобы получить стратегию, соответствующую сложному равновесию, каждый игрок i должен найти последовательности X), t$H для всех /?N, полностью использовав таким образом знание функций выигрыша. Эти вычисления производятся независимо каждым игроком в пред- предположении, что остальные игроки делают то же самое. Только в этом ограниченном смысле сложное поведение может быть названо изолированным. Разрешимость по доминированию игры G. означает, что после конечного числа раундов исключений все стратегии каж- каждого игрока станут для него эквивалентными (яо не для других. См. пример 3, гл. I). Если функции выигрыша для йсех игроков взаимно однозначны на XN, то множество сложных равновесий (если оно существует) состоит из одного элемента^ Следовательно, в таких разрешимых по доминированию играх сложное пове- поведение игроков детерминированно. Сложное равновесие обобщает равновесие в доминирующих стратегиях в следующем смысле. Лемма 1. Если в игре G множество D равновьСий в доми- доминирующих стратегиях не пусто, то игра G разрешима по доминированию и D есть множество сложных равновесий Доказательство сразу следует из леммы 2, г,л \ Если только у одного игрока / есть доминирующая стратегиЯ) то> очевидно, D/ (и,-) является t-й компонентой множест-ва сложных равновесий, если последнее существует.
Гл. II. Сложное поведение 41 Для игры в нормальной форме не известны достаточные условия разрешимости по доминированию. Для того чтобы по- получить такие условия, необходимо использовать другое пред- представление игры, а именно развернутую форму. 2. ИГРЫ В РАЗВЕРНУТОЙ ФОРМЕ И ТЕОРЕМА КУНА Пример 2. Выборы с правом вето Пусть сообщество N = {1, 2, 3} выбирает одного кандидата из множества А = {а, Ь, с, d}. Правило голосования таково: начиная с игрока 1, каждый игрок последовательно налагает вето на выбор кандидатуры одного из неотведенных кандида- кандидатов. Единственный оставшийся кандидат считается избранным. Пусть заданы функции выигрыша игроков ult u2, ua на множестве А. Возникшая ситуация описывается игрой в нор- нормальной форме: Множество Xi = A: стратегия игрока 1 состоит в объявлении кандидата, на избрание которого он первым накладывает вето. Множество Х2 состоит из отображений хг из А в А, таких, что хг(а)фа для всех а?А. Стратегия хг означает, что если игрок 1 уже наложил вето на кандидата а, то игрок 2 после этого накла- накладывает вето на кандидата х2(а). Множество Х8 состоит из отображений л;8, которые определяют для пары (а, р), уже отведенных кандидатов, кандидата х3 (а, Р) € А\{а, Р}, которого отво- отводит игрок 3. Исход, соответствующий данной тройке (% х2, xa)Q €ХйхХ2хХ3, определяется так: П(Хи Х%, ХЯ) = А\{ХЬ X2(Xt), Х3(ХЬ Нормальная форма игры представима в следующем виде: (Xj, X2, Х3, ихол, игол, и3ол). Язык теории графов более удобен; на рис. 1 изображена развернутая форма игры: Каждой нефинальной вершине этого дерева игры соответст- вуетг некоторый игрок, имеющий право выбирать любую из следующих вершин. Каждая финальная вершина определяет избранного кандидата. Предположим теперь, что функции вы,-
42 Ч. I. Некооператибное поведение игроков Вето на а Вето на Ъ Рис. 1 игрыша удовлетворяют следующему условию: Ui (d) < щ (с) < и, (Ь) < щ (а), «I (с) < и, (d) < и, (а) < и2 (?>), B) и3 (с) < и, (а) < и, (?>) < и, (d). Вначале заметим, что игрок 3 имеет доминирующую стра- стратегию: он отводит менее предпочтительного для себя кандидата из двух еще оставшихся в списке. Это определяет единственный элемент л? из Х3. Далее отметим, что ни у первого, ни у второго игрока нет домини- доминирующей стратегии. В самом деле, во множестве Xt ни одна стратегия не доминируется, поэтому й^ (щ) — Xt. Для того чтобы проверить это, докажем, например, что стратегия первого игрока—отвести наилучшего для него кандидата а—не является доминируемой. Рассмотрим следующие стратегии х2 € Хг, х3 ? Х2: x2(a) = d, ха(а, d) = < Хг (а) = а для всех а фа, хй (a, a) = Тогда (a, xt, лг3) == ы4 (&) > Mj b, если а Фа, b, c, если a = b. хг, хя) при афа, т.е. 1 ct = a—недоминируемая стратегия игрока 1. Аналогично можно проверить, что игрок 2 имеет 2* недо^ минируемых стратегий среди З4 элементов множества Х2; стра- стратегия х2 принадлежит множеству Й>2 (ы2) тогда и только тогда, когда для всех xt € Xj кандидат хг (xt) не является наилучшим по функции ы? среди кандидатов из множества Л\{л:Л.
Гл. //. Сложное поведение 43 Второй раунд исключения доминируемых стратегий позво- позволяет игроку 1 с пользой распорядиться имеющейся у него информацией. А именно, если игрок 1 будет сугубо осторожен и наложит вето на наихудшего для него кандидата d (Pt (мх) = {d}), то произойдет избрание кандидата b (поскольку функции вы- выигрыша игроков 2 и 3 на исходах а, Ь, с определяют один и тот же порядок, то b будет избран при любой паре недоми- недоминируемых стратегий: & = л({^}хй>2(и2)х{л;^})). Однако игрок 1 может надеяться на лучший исход, чем избрание Ь. В самом деле, если на Ь наложить вето, то для игроков 2 и 3 возникнет следующая игровая ситуация. СЗто на с / \ Вето на а : доминируемая стратегия /Вето на d Если игрок 2 не обращает внимания на функцию выигрыша игрока 3, он при осторожном поведении наложит вето на с(Р2(и2) = {х2}, где для всех хх кандидат xt(xt) является наи- наихудшим по и2 среди ЛХ!*!}), тем самым навязывая избрание d, что означает полное поражение игрока 1. Если, напротив, иг- игрок 2 достаточно хорошо информирован, то он имеет возмож- возможность предвидеть поведение игрока 3, и в этом случае опти- оптимальным является вето на d, обеспечивающее избрание а. Возвращаясь к последовательному исключению доминируе- доминируемых стратегий, мы обнаруживаем, что после двух раундов исключения стратегий игроки 2 и 3 имеют полностью опреде- определенные стратегии (xl = {xf}, xl — {xt}), а после трех раундов игрок 1 также остается с единственной стратегией, таким образом исход игры при сложном поведении есть избрание кандидата а. Определение 2. Конечное дерево есть пара Г = (М, а), где М—конечное множество вершин, а а сопоставляет каждой вер- вершине ее ближайшего предшественника, причем: • Существует единственная вершина т0, такая, что о (т0)=то. Назовем ее начальной вершиной. • Существует целое I, такое, что о1 (т) = т0 для всех т € М. Наименьшее такое / назовем длиной дерева Г. Вершина т, для которой о~1(т) = 0, называется финаль- финальной вершиной Г, а множество таких вершин обозначается через
44 Ч. 1. НекооЛерйтивное поведение игроков Г (Г). Для нефинальных вершин т множество о (т) состоит из преемников т, т. е. из следующих за т вершин. Определение 3. Пусть N — заданное конечное сообщество. Игрой в развернутой форме со множеством игроков N назы- называется следующая совокупность: • Конечное дерево Т — (М, о). • Разбиение (М,-),-6д/ множества М\Т (М). • Для каждого игрока i ? N функция выигрыша и,- из Т(М) в R. Разбиение (M;)i e n определяет, какой игрок ходит в каж- каждой конкретной нефинальной вершине. Если mo?Mh то игра начинается с того, что игрок i должен выбрать преемника т0, т. е. следующую за та вершину, скажем вершину тх из а (т0). Если т1?Т (М)—финальная вершина, то игра окончена и вы- выигрыши игроков суть и^т^ при i?N. Если т1(?Т (М) — нефинальная вершина, то игрок /, для которого m1 € Mt, имеет право хода и выбирает следующую за ту вершину, скажем тг^а-1{тх) и т. д. Рис. 2 Отмеченные вершины являются финальными. Заметьте, что по нашему предположению на каждом шаге игры игрок, делаю- делающий ход, имеет полную информацию о текущей вершине и общей структуре игры: это предположение обычно характери- характеризуется как полная информация. Теорема Куна утверждает, что конечная игра в развернутой форме в общем случае разрешима по доминированию и что в ней легко может быть вычислен исход сложного равновесия. Для того чтобы это продемонстрировать, рассмотрим описанную выше игру: выборы с правом вето (пример 2, рис. 1). Поскольку во всех вершинах, предшествуюш.их финальным, ходит игрок 3, то остальные игроки, зная его функцию выигрыша из B), мо- могут предвидеть его поведение. Это позволяет редуцировать игру, изображенную на рис. 1, к следующей:
Рл. It. Сложное поведение 45 d d b dad d Рис.3 a b Поскольку в этом новом дереве во всех вершинах, пред- предшествующих финальным, ходит игрок 2, то игрок 1 может предвидеть результат этих ходов по функции иа, и в итоге получается игра с одним участником —первым игроком. 1 Рис.4 Предлагая отклонить кандидата Ь, игрок 1 реализует страте- стратегию, являющуюся компонентой сложного равновесия. Приведенная выше попятная процедура может быть обоб- обобщена для любой игры в развернутой форме при довольно сла- слабом предположении о взаимной однозначности. Определение 4. Пусть G = (M, о; Mh и,; (?N) — игра в развернутой форме, такая, чю для любых т, т' € Т (М) имеем /^ uf(tn) = uf(m')]. C) Пусть L(M) — множество вершин, для которых все после- последующие вершины являются финальными: Тогда игре G соответствует редуцированная игра О* =* = (Л1*, о*; Mf, ut; i € N), в которой
46 4.1. Некооперативное поведение игрока» • множество вершин определяется равенством М* = =М\Г0(М), где T0(M) = {m^T(M)\a(m)^L(M)}; • отображение о* есть сужение а на М*; • финальные вершины дерева (М*, о*) таковы: Т (М*) = L (М) U {Г (М)\Т0 (М)}; = М,- П { М* \ Г (М*)}, значит, (Mf)i е л/ — разбиение \Г (М*) \ • функция выигрыша и? имеет вид если пг?Т (М)\Т0(М), то uf (m) = и,- (tn), если m g L (M) и m ? МЛ то «f (tn) — u{ (tnf), где т} — оптимальная для игрока / следующая за т вершина; "/(m/)= SUP u,(tn'). Лемма 2. ?сли (М, а)—дерево длины I, то дерево (М*, а*) имеет длину (I— 1). Доказательство леммы 2. Заметим сначала, что множество L (М) не пусто. Если оно пусто, то для каждой нефинальной вер- вершины т множество а (т) содержит хотя бы одну нефинальную вершину, и поэтому мы можем построить бесконечную последо- последовательность различных вершин т0, ть ..., mt, ..., где mt+i€a~l (Щ)\ это противоречит тому, что длина дерева (М, а) конечна. Выберем далее вершину т, такую, что o/(m) = m0, а^(т)фта. D) Такая вершина существует по определению /. Предположим, что a(m)^L(M). Тогда найдется вершина т' ?М\Т (М), такая, что a(tn') = a(m). Выбирая любую вершину m"g a (m'), получим a2 (tn") == a (tn), следовательно, a' (m") = a1-1 (m) Ф m0. Получили противоречие. Итак, мы доказали, что o(m)?L(M). Ввиду того что вершина tn является финальной, приходим к заключению, что т?Та(М). Поэтому никакая вершина, удовлетворяющая D), не может входить в М* и, следовательно, дерево (М*, о*) имеет длину, не превышающую (/—1). Легко показать, что (М*, о*) имеет длину в точности (I—1). Алгоритм Куна состоит из последовательных редукций игры G. После этих / редукций дерево игры (М*1, о*1) имеет длину 0, т. е.'М*1 = {т0), а о*'—тождественное отображение. Обозначим через 0(. -- и? (т0) (единственное) значение выигрыша игрока i в G*'. Теорема 1 (Кун). Пусть G = (M, а; М{, и,-; i&N)—uzpa в развернутой форме, для которой выполнено условие C). Тогда
Гл. //. Сложное поведение 47 игра G, рассматриваемая как игра в нормальной форме, раз- разрешима по доминированию, а выигрыши ф{)иы, соответствую- соответствующие сложному равновесию, задаются алгоритмом Куна. Доказательство. Вначале уточним, что мы понимаем под нормальной формой игры G. Поскольку игрок i должен при- принять стратегическое решение в каждой вершине множества Мt, то стратегией х{ будет отображение из М( в М, причем такое, что xl{m)^.a~1{m) для всех m^Mt. Пусть X, — множество таких отображений. Заданный набор x—(xi)iuN порождает партию т0, пц, ..., mk, где mt е Т (М) => k = и соответствующие выигрыши задаются равенством и,-(л;)=ы/(т4). Мы должны доказать, что игра (Х{, щ\ i?N) разрешима по доминированию и выигрыши игроков в сложном равновесии определяются алгоритмом Куна. Редукция игры G к игре G* (определение 4) позволяет выкинуть все вершины из Т0(М), превращая вершины из L(M) в финальные и приписывая вер- вершине m из L (М) П Mt вектор выигрышей, который соответство- соответствовал'бы оптимальному ходу игрока i в вершине т. Далее, пусть А1 обозначает следующее подмножество множества Х(: А, = [xt € X, | Vm € L (М) П М{ щ (х; (т)) = sup щ (т')\. Тогда игра в нормальной форме (А{, и(.; / ? iV) изоморфна реду- редуцированной игре G* (заметим, что если игрок i безразличен по отношению к двум каким-либо следующим за т € L (М) П М.{ вершинам, то в силу C) и все остальные игроки безразличны к выбору из этих вершин, а потому соответствующие стратегии во множестве А( могут быть отождествлены). Заметим теперь, что стратегия Xi?X;\A{ является доминируемой стратегией игрока i (в самом деле, х{ доминируется стратегией у{ g A{, совпадающей с xt на множестве M{\L(M)). Итак, мы имеем E) Теперь мы используем следующую основную лемму,
48 4.1. Некооперативное поведение игроков Лемма 3 (Роше [1980]). Пусть G = (X{, и,-; i ^N) —конечная игра в нормальной форме, причем для любых двух исходов х, х' 6 X выполнено [it <Е N щ {х) = щ (*')] => [V/ ?Н и, {х) = и, (*')]• F) Пусть далее для всех i € N множество At является подмно- подмножеством Xt, удовлетворяющим условию E). Тогда игра G разрешима по доминированию {d-разрешима) в том и только в том случае, если игра # = (Л,-, щ; i?N) разрешима по доминированию, а векторы выигрышей, соответ- соответствующие сложным равновесиям, совпадают. Применяя индуктивно лемму 3, получаем G d-разрешима Ф* G* d-разрешима ФФ G** d-разрешима ФФ..., и все эти игры имеют одни и те же векторы выигрышей в слож- сложных равновесиях. Поскольку игра G*1, очевидно, d-разрешима и ей соответствуют равновесные выигрыши (РДел/. теорема 1 полностью доказана. Лемма 3—достаточно важный результат: в процессе после- последовательного исключения доминируемых стратегий некоторые игроки могут оказаться «ленивыми» и не исключить всех своих доминируемых стратегий или исключение может производиться последовательно (сначала игрок 1 исключит доминируемые стра- стратегии, потом игрок 2 и т. д.), тем не менее разрешимость по доминированию сохранится, а вектор выигрышей в сложных равновесиях не изменится. Этот результат существенно повы- повышает доверие к понятию сложного поведения. Упражнение 1 Приведите пример игры в развернутой форме, для которой не выполнено предположение C) об однозначности и соответ- соответствующая игра в нормальной форме не разрешима по доми- доминированию. Задача 1. Доказательство леммы 3 (Гретлейн [19801, Роще [1980]) Пусть игра G = (X{, щ; igN)—фиксированная конечная игра в нормальной форме с условием F) и для игры Я = — (Alt и,-; i^M) выполнено условие E). Положим Xjv= Xs>, (U{, XN), Л^= X S>(u{, AN). ieN ieA/ 1) Если стратегии х{ и у{ игрока i эквивалентны для игрока i в игре G, то в силу F) получаем У/€ЛГ, Ух,?Х, Uj(xh хг) = иу(у;, xt),
Гл. //. Сложное поведение 49 Выведите отсюда, что если отождествить эквивалентные страте- стратегии каждого игрока в игре G, то это не повлияет на d-разре- шимость игры. 2) Отождествляя соответствующим образом стратегии игро- игроков, эквивалентные в игре Я, и используя условие E), пока- покажите, что 3) Завершите доказательство леммы 3, последовательно при- применяя при построении множеств A'N и X'N утверждения п. 1 и 2. 3. ИГРЫ ДВУХ ЛИЦ С НУЛЕВОЙ СУММОЙ Вначале докажем вспомогательный результат. Лемма 4. Пусть G = (Xb Х2; щ)—игра двух лиц с нулевой Суммой и конечными множествами стратегий. Тогда сложное равновесие в игре G есть седловая точка по функции ut. Сле- Следовательно, разрешимые по доминированию игры двух лиц с нулевой суммой имеют цену. Доказательство. Для данных подмножеств FjcX,, Y2cX2 Обозначим через S(Fj, Y2) множество седловых точек (возможно пустое) в игре (Уь у„ щ). Далее положим Zt = S>,(ut; Yu Yt). Пусть (хи х2)—седловая точка в игре (Zt, Z2, и±), и предпо- предположим, что (#1, х2) не является седловой точкой в игре iXi, Y2, щ). Пусть, например, существует г/xe^i, для которого «f(*i> X2)<Ui(yi, Х2). G) Положим У± (Уд = {y'i € Yt | Vy2 € Y^ ut (yu y2) < щ (у[, y2)}. 1Лы утверждаем, что Yt(yi) имеет непустое пересечение с Zt. В частности, если zf доставляет максимум функции Фх на Yi где то можно проверить, что стратегия zt не доминируема в игре (F Y2, щ). Следовательно, zt принадлежит множеству Zf, и из G) получаем Щ (х» х2) < щ (ги х2), шему предположению j, Z2, Mf). Итак, дока S(Zit Z,)cS(^, Yt). что противоречит нашему предположению о том, что (л^, х,л) — седловая точка в (Zj, Z2, Mf). Итак, доказано, что
50 4.1. Некооперативное поведение игроков Повторное применение данного включения приводит к следую- следующей цепочке включений: S(XU XJ=>S(X\, Xi)=>...=>S(Xi, Х'2). Далее, если игра G d-разрешима, то существует целое /, для которого все стратегии из Х\ эквивалентны для игрока t при условии, что стратегии игрока / ограничены множеством X) (определение 1). Для такого t мы, в частности, получаем S(X{, Xi) = X{xXl = {сложные равновесия игры G}. Это завершает доказательство леммы 4. Следствие из теоремы 1 и леммы 4. Каждая конечная игра двух лиц с нулевой суммой в развернутой форме имеет цену. Каждый игрок имеет по крайней мере одну оптимальную стра- стратегию. Свойство C) следует из «2 = — щ. Иллюстрацией данного следствия является теорема Цермело: в шахматах либо белые могут форсированно выиграть, либо черные могут форсированно выиграть, либо при правильной игре обеих сторон партия закончится вничью. В действительности шахматы являются ко- конечной игрой двух лиц с нулевой суммой в развернутой форме (с тремя значениями функции выигрыша: белые выигрывают, ничья, черные выигрывают), поскольку действует правило, по которому засчитывается ничья, при троекратном повторении на доске одной и той же позиции *). Пример 3. Игра Ним Для любого целого числа п^ 1 обозначим G* следующую игру двух лиц с нулевой суммой. Если п=\, то G}—три- G}—тривиальная игра, в которой выигрывает игрок 1. Если /г>2, то игрок 1 должен выбрать целое число л(! Klrtj^n—1. Далее, игрок 2 выбирает либо пи либо пг = = п—щ. Назовем п{ выбором игрока 2. Тогда следующий шаг состоит в том, чтобы играть в игру G\. — аналог игры Gln., где первый ход делает игрок 2. В частности, если либо п±, либо п% равно 1, игрок 2 выигрывает, выбирая данное число2). Это определяет игру в развернутой форме длины (п—1). Из полученного выше следствия получаем, что множество 1) Еще сильнее ограничивает длину партии правило, по которому засчи- засчитывается ничья после 50 ходов без продвижения пешки или взятия фигур.— Прим. перев. 2) Можно представлять себе, что имеется куча из п камешков. В игре G}, игрок 1 произвольно делит кучу на две части, а игрок 2 выбирает одну из них и начинается игра G^, и т. д. ... Игрок, выбравший часть, состриг ш,ую из одного камешка, выигрывает.— Прим. перев.
Гл. II. Сложное поведение 51 натуральных чисел разбивается на N = Wx U М2, где N( есть множество тех п, при которых игрок i может гарантировано выиграть в игре GJ. Проводя индуктивные по п рассуждения, получаем, что наше разбиение удовлетворяет следующим свой- свойствам: 16^1 и, кроме того, А У/г€Л\(/г>2) 3/г1( 1^/г^/г—1, /г, ? N2 и n—n^N^ \ Vn?N2 Vnj (I <«!<«— 1) rtjgNj или n—^ZN^ (8) Предоставляем читателю проверить, что эти условия дают следующий результат: Afj = {/г| Эр]> 1, п — Ър или п = Ър— 4 или п = Ър— 1}. Рассмотрим теперь игры FJ, Г* с теми же правилами, за исключением того, что игрок, выбравший 1, проигрывает, дру- другими словами, в игре Г{ игрок /", / Ф i, выигрывает. Аналогичные соображения доказывают существование раз- разбиения N = Ml U М3, причем 1 g М2 и (8) выполнено для Mt вместо Nit i = l, 2. Отсюда в свою очередь получается, что Mi—множество четных чисел. В качестве упражнения читатель может описать выигрываю- выигрывающие стратегии игрока 1 в G\, n^Nt, и в игре Г?, п—четное и выигрывающие стратегии игрока 2 в G},, п € Af2, и в Г?, п нечетное. Задача 2. Мариенбадская игра Фиксируем целое число р, р^\, и для любого набора п= (Лц ..., пр), где nv ..., пр — целые неотрицательные числа, определим игры Gj, Gl по индукции. Для данного п ^@, ..., 0) скажем, что п' следует за п, если существует k, \^k такое, что j n'k, = nk, для всех k', \^.k'^.p и k'Ф k, Если п = @ 0), то в игре Gln игрок i выигрывает. Если п Ф @, -..., 0), то игра Gln разыгрывается следующим образом: игрок i выбирает п', следующее за п. Если п' = @, ..., 0), то игрок /, / ф i, выигрывает партию, в противном случае начи- начинается игра Gn', в которой игрок / выбирает п", следующее за п', если п" = @, ..., 0), то игрок i выигрывает, иначе начи- начинается игра Glnn и т. д. Можно себе представить, что имеется р рядов спичек по tii, '' •' пр ШТУК соответственно и каждый игрок последова- последовательно забирает произвольное ненулевое количество спичек,
Ч. I. Некооперативнде поведение игрбкбё но только из одного ряда. Игрок, который забирает последнюю спичку из последнего ряда, проигрывает. 1) Докажите существование разбиения для которого, если п ? Nit то игрок i может гарантированно выиграть в игре GJ,. Приведите условие, аналогичное (8), харак- характеризующее это разбиение. 2) Для всех n = (nv ..., пр) обозначим через двоичное разложение nk, где / есть верхняя граница числа разрядов, необходимых для представления nlt ..., пр, (сле- (следовательно, некоторые из чисел а\, ..., af могут быть нуле- нулевыми, но не все). Обозначим далее р р во-2«о, •••, а*= 2«*. Докажите, что N2 = M2\JP2, где Afa = {n|V/, 0 </</, а, четное и 3/, 1 < / </, ау > 0), Р2= {п | V/, 1 ^/, й/ = 0 и а0 — нечетное число^. Задача 3. Топологическая дуэль (Шоке) Пусть Е—метрическое пространство. Обозначим через О множество непустых открытых подмножеств Е. Наша игра устроена так. На шаге 1 игрок 1 выбирает А1 ? О. На шаге 2 игрок 2 выбирает Аг?О с единственным огра- ограничением А2сА1... . На шаге t игрок A, если t нечетно, и 2, если четно) выбирает At?O с единственным ограничением Ага.Аг_г...% и так до бесконечности. Скажем, что игрок 1 выигрывает, если П А1Ф'0. t=\ Если это пересечение пусто, то скажем, что выигрывает игрок 2. 1) Докажите, что если Е полное метрическое пространство, то игрок 1 может гарантировать победу. 2) Докажите, что если E = Q, то игрок 2 может гаранти- гарантировать победу. 3) Для любого ли Е наша игра имеет цену?
^^ Гл. П. Сложное поведение 53 4. ПОВЕДЕНИЕ ЛИДЕРА И ВЕДОМОГО Мы рассмотрели ситуации, в которых все игроки находятся на одном и том же уровне информированности (полное незна- незнание— гл. I и полная информация в этой главе). В ряде эко- экономических приложений, в частности при олигополистической. конкуренции с доминирующей фирмой, естественным образом возникает несимметричное распределение информации. С по- помощью теоремы Куна мы исследуем простейшую модель такого сорта: поведение типа лидер—ведомый в игре двух лиц *). Для данной игры двух лиц (Xlt X.z, и1г и,) обозначим через BR( график отображения наилучших ответов /-го игрока: (хи х2) g BR, фф Ul (хи хг) = sup ux (уг, х2) (симметричное определение для BR2). Определение 5. Назовем (л^, х2) i-равновесием по Штакель- бергу в игре (Х1( Х2, иу, и2), если (хи x2)?BRj и «,•(*!, х2)= sup «,(&, уг), (9) (у и BR j где i, / = 1, 2 и 1ф\. Можно интерпретировать 1-равновесие по Штакельбергу на основе, следующего сценария: игрок 1 (лидер) знает обе функ- функции выигрыша Ui и ы2 и использует эту информацию для пред- предсказания реакции игрока 2. Игрок 2 (ведомый) воспринимает стратегию игрока 1 как заданную экзогенно (обычно он не обращает внимания на функцию выигрыша игрока 1) и макси- максимизирует собственный выигрыш, полагая, что стратегия игрока 1 xt фиксирована. Таким образом, игрок 1, имея первый ход и предвидя, что игрок 2 использует один из своих наилучших ответов на хи найдет оптимальное решение задачи (9). Заметим, что если игрок 2 имеет несколько наилучших ответов на хи то в (9) предполагается, что он выберет наилуч- наилучший ответ по отношению к функции uv Это упрощающее пред- предположение не оказывает существенного воздействия на даль- дальнейшее изложение. Поведение лидера — ведомого было впервые рассмотрено экономистом Г. Штакельбергом (в начале этого столетия) при описании стратегий фирм, конкурирующих на одном и том же рынке (в условиях олигополии). В таких ситуациях нередко одна из фирм оказывается сильнее остальных и навязывает им свою цену. Концепция равновесия, описываемая определением 5, *) В отечественной литературе поведение этого типа первым исследовал Ю. Б. Гермейер (Гермейер [1971]). Библиографию по играм гермейерского типа см. в (Гермейер [1976]). Соответствующий математический аппарат используется для анализа иерархических симём.— Прим, перев.
54 4.1. Нектперати&ное поведение игроков служит для анализа поведения такой фирмы. В гл. VI мы опишем простую модель дуополии, в которой равновесия по Штакельбергу играют исключительно важную роль (см. пример 6 гл. VI). Принцип поведения, подразумеваемый определением б, весьма напоминает таковой при последовательном исключении доминируемых стратегий. Следующий результат показывает, что равновесия по Штакельбергу сводятся к сложным равно- равновесиям при надлежащем преобразовании исходной игры. Лемма 5. Пусть G = (Xi, Х2, uv и2)— конечная игра двух лиц, причем функции их и иг взаимно однозначны на ХххХ2. Тогда существует единственное {-равновесие по Штакельбергу, которое обозначим (xit х2). Рассмотрим следующую игру G = (XU Х*\ ~иь й2): | Xf' состоит из отображений i\, действующих из Хх в Х2; \ 2Xi щ{хи ti) = «,-(*i Тогда игра G разрешима по доминированию, причем единст- единственное сложное равновесие есть (xlt г\), где ц—стратегия наилучших ответов игрока 2, и ¦ц(х1) = х2. Доказательство. Существование и единственность 1-равно- 1-равновесия по Штакельбергу следует из взаимной однозначности ut на XjxX2. Игра G является нормальной формой игры в раз- развернутой форме, в которой игрок 1 выбирает стратегию из Xf первым, а затем игрок 2, зная выбор игрока 1, выбирает свою стратегию из Х2. В игре G стратегия наилучших ответов т| является доминирующей стратегией игрока 2. В самом деле, для любого Xi ? Х( и любой функции ц $ Xf' имеем U2 (xi> TD —иа (xi> Tl \xi))— SUP U2\xv Х2>^ иг (Xi, т] \Х1)) — иг (xit У]). Наше предположение о взаимной однозначности полностью определяет ц. Перед вторым раундом исключения доминируемых стратегий игрок 1 оказывается участником следующей игры (XJ, {у]\, «1, ы2), в которой его единственная доминирующая стратегия определяется так: ui (xt, Tl) = «i (xt, 'Ц (xt)) 7^ Щ (xit у] (xx)) = ut (xit Л) Для всех xt. В силу взаимной однозначности ы2 график отображения t| совпадает с BR2. Следовательно, (xf, i\(xt)) ecTb_l-равновесие по Штакельбергу в нашей игре, и поэтому х^^Хц'^К^ )=xt. Щ
Гл. //. Сложное поведение 55 Заметим, что существование i-равновесия по Штакельбергу можно гарантировать при обычных топологических предполо- предположениях \ХЬ Х2— компакты, щ, иг непрерывны). Однако лемму 5 непосредственно обобщить не удается. Пример 4. Процедура голосования по Ролсу Пусть А ~{1, 2, ..., 7} есть множество из 7 кандидатов, среди которых 2 игрока должны выбрать единственного. Каждый игрок в качестве своего предложения может расста- расставить кандидатов в некотором порядке. Следовательно, страте- стратегия Х[ есть взаимно однозначное отображение из А на А, при- причем если X/ (fl)=l, то а—это наилучший по мнению игрока кандидат (обман, конечно, разрешен). Обозначим через Z мно- множество стратегий игроков 1 и 2. Для данной пары (а;1? Z выбирается кандидат л(х^ х2), где г n(xt, xt) = mi{a\a€R(xu xt)}, \ R(xit хг) = {а?А\тах[х1(а), хг (а)] = minmax[xt (b), x2 У be A Очевидно, что R (xu x2) состоит не более чем из двух канди- кандидатов. Данное правило подобрано так, чтобы выбирался канди- кандидат, чья наихудшая оценка среди двух избирателей является наиболее высокой. Поскольку игроки могут выбрать любую расстановку кандидатов, то возникает стратегическая игра. Обозначим через ии u2?Z истинные мнения игроков 1 и 2. Тогда избиратели являются участниками следующей игры в нормальной форме: (Z, Z, —щоп, — и, о я). A0) (В качестве выигрыша игрока берется ранг избранного канди- кандидата с отрицательным знаком. Напомним, что игроки стремятся к максимизации своих функций выигрыша.) Вычислим теперь 1-равновесие по Штакельбергу в игре A0). Фиксируем стратегию x±^Z игрока 1. Заметим, что для всех x2?Z выполнено n(xit хг) = а=Ф^(й)>4. A1) Другими словами, предлагая xit игрок 1 отводит кандидатов xfxG), a;, F), хг1 E). Это справедливо, поскольку по крайней мере один кандидат а в xf1({4, 3, 2, 1}) должен быть таким, что х2 (а) ^ 4, поэтому j(a), x2 (a))< 4 < max (xt (b), x2(b)) для всех Ьъ xfl({7, 6, 5}).
56 Ч. I. Некооперативное поведение игроков Отметим далее, что при данном л^ игрок 2 может обеспе- обеспечить избрание любого кандидата из ^({-l, 3, 2, 1}): V4] n(xit xt) = a]. A2) Например, для того чтобы обеспечить избрание хг1 D), игрок 2 объявляет свое предпочтение так: Высший ранг: Х1 а b с d* е f 9 хг d* е f 9 а Ь с Низший ранг: Из A1) и A2) получаем, что любая стратегия наилучшего ответа хг на х± такова, что л {xt, х2) = а, где и2 (а) = inf {u2 (Ь) | xt (Ь) < 4}. A3) Отсюда, в частности, следует, что x*)<iBR2 ut(n(xit ^2))<4 (так как множество \b\ A;t(i>)^4} состоит из 4 элементов). Следовательно, игрок 1 как лидер может обеспечить избра- избрание кандидата из множества Л2 = «71({1, 2, 3, 4}). На самом деле, он может гарантировать выбор любого кандидата из Аг за счет подходящего сообщения. Например, для того чтобы обеспечить выбор а = иг1 C), игрок 1 объявляет: Высший ранг ¦. Низший ранг: ь с а d в f Я xi а е Г 9 Ь с d Это сообщение вызывает наилучший ответ xv такой, что в силу A3) л(хи х,) = а,
^ Гл. it. Сложное поведение 5? Наконец, заключаем, что выигрыш игрока 1 (выраженный в ранге избираемого кандидата) в любом 1-равновесии по Штакельбергу равен •Если игроки поменяются ролями, то в силу симметрии полу- получаем, что выигрыш (ранг избираемого кандидата) игрока 2 в любом 2-равновесии по Штакельбергу равен Интересное следствие состоит в том, что, вообще говоря, ранги Sj и S2 несовместны в следующем смысле: не существует такого а, что u1(a)^Si и «2(a)s^S2. A4) Более точно, пара (uit иг) либо удовлетворяет A4), либо такова, что ( условия щ(a*) ^S, и н2 (а*) ^S2 выполнены в точности для \ одного кандидата а*. Тогда Si = ul(a^) для 1=1, 2. Если для пары функций (мх, и2) выполнено условие A4), то игра A0) представляет типичную борьбу за лидерство: если игроки информированы о предпочтениях друг друга, то ока- оказывается выгодным иметь первый ход и вынудить другого игрока занять позицию ведомого. Мы детально исследуем этот вид конфликта в гл. VI разд. 4 в связи с анализом угроз. См. также пример 2 и лемму 2, гл. III. 5. ДРУГИЕ ПРИЛОЖЕНИЯ ТЕОРЕМЫ КУНА В заключение гл. II рассмотрим несколько примеров и за* дач, направленных на преодоление технических и концепту' альных трудностей, связанных с понятием сложного поведения. Когда множества стратегий X,- бесконечны при всех i?N (хотя бы и компактны), то весьма трудно формально определить сложное поведение. Одна из причин состоит в том, что в процессе исключения доминируемых стратегий компактность множеств Х\ не гарантируется (см. задачу 2 гл. I). Далее, сходимость последовательности Х\, t?N, к подмножеству эквивалентных стратегий может осуществиться только в пределе, отсюда допол- дополнительные топологические трудности... Наконец, предположе- предположение C) о взаимной однозначности, которое является решающим при доказательстве теоремы Куна, теперь трудно обосновать. Эти трудности демонстрируются в следующем примере, а также в приведенных ниже задачах 4 и 5.
Ч. I. НекоопершЛидное поведение игроков Пример 5. Дележ доллара при инфляции (Дутта, Дживерс [1981]) Участники {1, 2, ..., п\ делят доллар в соответствии со следующим правилом: Шаг 1. Игрок 1 предлагает дележ xl~{x\ х\), где п 2 х}=1, х}^0 при всех i?N. Затем игроки 2, ..., п имеют право выбора; утвердить х1 или отклонить его. Если все игроки соглашаются на х1, то этот дележ принимается. Если хотя бы один игрок отклоняет х1, то переходим к шагу 2. Шаг 2. Игрок 2 предлагает дележ хг на суд остальных игроков. Если они отказываются принять хг, то переходим к шагу 3. Шаг 3. Игрок 3 делает предложение и т. д. Если дошли до шага п и предложение игрока п отклонено, то вся процедура начинается сначала с предложения игрока 1 и т. д. Предположим, что доллар обесценивается за каждый период переговоров с коэффициентом дисконтирования т, 0<т<1. Так, во второй период от него остается 6=1 — т, в период 3 только б2 подлежит дележу и т. д. Ясно, что если процедура переговоров о дележе будет продолжаться до бесконечности, то выигрыш каждого игрока становится нулем. Предполагая существование сложного равновесия с исходом х* = (х*, ..., л;*) (точное определение и теорему существова- существования см. в работе Рубинштейна [1980]), проведем обычные рас- рассуждения, основанные на анализе стратегических ожиданий для вычисления х*. Предположим, игрок 1 на шаге 1 предла- предлагает а;1. Он знает, что игрок i, 1ф\, рассчитывает с шага 2, если таковой состоится, на равновесный исход Fл?, 6**, bxf, ..., 8xt-i). В самом деле, игра с шага 2 получается из исходной игры соответствующей перенумерацией игроков. Зна- Значит, для того чтобы предложение х1 было принято игроками 2, ..., п, необходимо, чтобы -i. A5) Предполагая, что предложение х* будет принято, получаем xf>6xf, .... xt>bxt-i. A6) Выберем теперь х\ так, чтобы х\ < 1— тогда существует допустимый дележ (х\, х\, ..., л?), превра- превращающий все неравенства из A5) в строгие и, следовательно, приемлемый для игроков 2, ..., п. Значит, неравенство
Гл. II. Сложное поведение 59 Х\ < 1—[bxf-{-...+8xt-i] противоречит оптимальности х* (сложные равновесия являются равновесиями по Нэшу—тео- Нэшу—теорема Д гл. IIJ). Таким образом, получаем lf?] ? A7) Используя A6) и A7), получаем для всех 1 = 1, ..., п xf > 6'-ijc* ^ A — б) б' + б'** >A — б) б' + 6"xf, откуда х*> -1 для всех '= Выражения в правой части в сумме равны 1, поэтому все они суть равенства. Заметим, что когда б стремится к 1, предель- предельный дележ становится справедливым (каждый игрок получает 1//г); тем не менее при 6=1 вся стратегическая аргументация оказывается некорректной. Для того чтобы точно описать в следующем примере неко- некооперативное поведение полностью информированных игроков, требуется уже комбинация концепций решения. А именно, усе- усеченная после исключения доминируемых стратегий игра стано- становится несущественной. Пример 6. Дележ пирога по Штейнгаузу Пусть отрезок [0, 1] символизирует неоднородный пирог, ко- который должен быть поделен между двумя игроками. Полезность доли А с [0, 1] оценивается для игрока 1 величиной а полезность доли В с [0, 1] оценивается игроком 2 как По мере того как время изменяется от t = 0 до t = 1, нож дви- двигается со скоростью I otjc = 0 к д:=1. В любой момент времени каждый из игроков может остановить нож. Если нож остановлен в момент / игроком i, то этот игрок получает долю [0, /], а другой игрок—[t, 1]. Значит, Xf=X2 = [0, 1], где страте- стратегия X; означает остановку в момент t = х,• игроком /, если другой игрок не остановил нож раньше. Функции выигрыша
50 4.1. Некооперативное поведение игроков определяются так: 3 х yf([0, Xi])-=^Yxi <Г ПРИ xi' I 1 1 1 /гл у ~|\ „ I yi ппм У Стратегия th i = l, 2, определяемая из условия есть единственная осторожная стратегия игрока ?. В самом деле, Ф,(*,) = inf щ(хи xi) = inf{o,([0, л;,.]), о, ([х„ 1])}, х/6[0, I] поэтому ф,- достигает максимума, когда доли [0, tt] и [th 1] равноценны для игрока i. При нашем специальном выборе v{ имеем tt < /2. Следова- Следовательно, при осторожном поведении игрок 1 получает долю [0, tj], а значит, свой гарантированный выигрыш aI = y1([0, ^]), в то время как игрок 2 оказывается более удачливым: У2AЛ, Ч) > >у2([/2, 1]) = а2. На самом деле, при осторожном поведении весь дополнительный по сравнению с гарантированными уров- уровнями (cCj, a2) выигрыш оказывается распределен в пользу игрока 2, а именно: »i(['i. П) = max {и, (*f, *i)|«f(A:i, В гл. V мы скажем, что этот исход является наилучшей пере- переговорной точкой для игрока 2. Первый раунд исключения доминируемых стратегий дает ®i(ui)~[U> 1]' поскольку стратегия х{ — остановить нож до момента t{ — доминируется осторожной стратегией /; (это легко проверить). Предположим теперь, что игрок 1 знает функцию выигрыша игрока 2 и поэтому может вычислить t2. При усло- условии, что игрок 2 не остановит нож до момента гг, второй раунд исключения доминируемых стратегий позволяет игроку 1 отбро- отбросить стратегии [tit t2). В самом деле, при всех л;, €[^f, Q имеем 01 ([0. *d) = «i (хи х2) < щ (th хг) = v ([0, t,]) при всех xt€\ti, 1]. Итак, Xj = [t2, 1] и дальнейшее исключение доминируемых стратегий невозможно, так как Xi^Xi = [tb 1] при />2.
Гл. //. Сложное поведение 61 Поскольку никакие две стратегии в Х\ не эквивалентны для игрока i на Х{хХ{, то мы заключаем, что наша игра не раз- разрешима по доминированию. Тем не менее редуцированная игра ([*2. 1]. [**» 1]» "i> ыа) является несущественной. В самом деле, у обоих игроков одинаковые осторожные стратегии xi = хг = t$. inf щ (tt, xj = vt ([0, f J) > Inf i, x2) = ox ([a;1( 1]) = inf U) > inf «2 i/ ij при при 1]) Более того, (alt a2) — оптимальный по Парето вектор выиг- выигрышей (определение 5 гл. I), как это видно из рис. 5. Из теоремы 1 гл. I заключаем, что xl = xi= 1г—оптимальные стра- стратегии игроков в 2-редуцированной игре. Можно считать исход {t2, t2) соответствующим случаю полной информации игрока 1 о функции выигрыша 2. Заметим, что вектор (a,, a2) = (v} ([0, t2]), уг([^> Ш оптимален по Парето и в исходной игре, причем перераспределяет весь дополнительный выигрыш в пользу иг- игрока l 1 t Рио. 5 Две кривые, пересекающиеся в (tb at), суть графики yf (JO, t]) и Vi([t, 1]). Две пунктирные кривые — графики у2([0, ф и vt([t, 1]). Упражнение 2. Каким будет некооперативное изолирован- изолированное поведение, если нож двигается от х = 1 к х = О?
62 Ч. I. Некооперативное поведение игроков ______ Упражнение 3. Аукцион неделимого товара Рассмотрим аукцион первого типа из примера 2 гл. I. Про- Проведите последовательное исключение доминируемых стратегий (двух раундов будет достаточно). Докажите, что эта игра не разрешима по доминированию и что редуцированная игра (после последовательного исключения) не является несущественной. Заметим, однако, что игрок 1 имеет единственную осторожную стратегию в этой игре, что позволяет говорить о «естественном» некооперативном исходе игры. Задача 4. Метод адели—выбирай» Теперь игрок 1 фиксирует xt^[0, 1], затем игрок 2 выби- выбирает [0, xt] или [хи 1] в качестве своей доли (игрок 1 полу- получает оставшееся). Пусть предпочтения игроков описываются теми же полезностями, что и в примере 6. 1) Сформулируйте игру в нормальной форме. 2) Докажите, что каждый игрок имеет по одной осторожной стратегии и осторожное поведение позволяет игроку 2 присвоить весь дополнительный по сравнению с гарантированным выигрыш. 3) Предполагая, что игрок 2 при равенстве для него частей пирога делает благоприятный для игрока 1 выбор, докажите, что игра разрешима по доминированию и исход сложного рав- равновесия отдает весь дополнительный выигрыш игроку 1. Можете ли вы предложить модификацию определения 1, которая позволила бы ослабить последнее предположение и полу- получить по существу то же поведение? 4) Какими будут t-равновесия по Штакельбергу в этой игре? Дайте интерпретацию результатов. Пример 7. Парадоксальный метод дележа Пираты делят добычу: 100 слитков золота. Процедура дележа устроена следующим образом. Сначала самый старший пират предлагает дележ по своему выбору. Если хотя бы половина пиратов согласна с этим дележом, то он считается принятым. В противном случае (т. е. если абсолютное большинство пиратов его отвергает) второй по старшинству пират предлагает новый дележ добычи среди оставшихся (п— 1) пиратов. Старший пират никакого участия в дальнейшем дележе не принимает. Если новый дележ отвергается большинством голосов, то предложив- предложивший его пират устраняется от дальнейшего участия в дележе, и процедура повторяется для (п — 2) пиратов. Примем достаточно реалистичное предположение о том, что каждый пират знает функции выигрыша остальных. А именно, каждый пират из двух данных дележей предпочитает тот, в кото- котором его доля золотых слитков больше (дележи, дающие ему одинаковую долю добычи, являются равноприемлемыми неза- независимо от долей остальных игроков). Дух всеобщего недоверия,
Гл. It. Сложное поведение царивший, как известно, среди флибустьеров, позволяет пред- предсказать, что их поведение будет некооперативным, а тогда остается только найти окончательный дележ. Вычислим сложное поведение пиратов. Если осталось только два пирата, то старший из них забирает всю добычу, поскольку младший пират не составляет абсолютного большинства. Пред- Предположим, что осталось три пирата. Тогда старший из них может предложить дележ, дающий 99 слитков ему и 1 слиток млад- младшему пирату. Младший пират вынужден согласиться с таким предложением, поскольку он понимает, что оставшись один на один со средним пиратом, он не получит ничего. Если пиратов четверо D, 3, 2, 1), то старший из них D) будет рассуждать следующим образом: «Если мое предложение будет отвергнуто, то три оставшихся пирата поделят добычу так: (99, 0, 1) (см. рассуждения выше). Следовательно, я должен предложить такой дележ, который хотя бы одному из них был 2р + 2 100—р 2р+1 100—р 0 0 1 ... 7 97 1 0 D 98 0 0 1 5 98 0 1 1 0 4 99 0 Г 0 0 1 3 99 0 1 0 1 • 1 0 2 100 0 1 0 1 0 0 1 I 100 0 1 0 1 0 1 1 0 Число пиратов 1 2 3 4 5 6 7 ... 2/>+1 2/>+2
64 Ч. I. Некооперативное поведение игрокоё выгоднее этого, а мне давал наибольшую возможную долю». Единственным решением этой задачи является дележ (99, 0, 1, 0), в котором старший пират D) жертвует всего лишь одним слитком в пользу пирата 2. Равновесный дележ для произвольного количества пиратов может теперь быть найден по индукции. Выше (с. 63) приведены соответствующие результаты в зависимости от общего числа пиратов. Итак, если п = 2р+1 или /г = 2р + 2, то в дележе, соответ- соответствующем сложному равновесию, доля старшего пирата равна A00 — р) слитков. По одному слитку получают р пиратов, кото- которые имеют номера той же четности, что и старший пират. Парадоксальность этой процедуры дележа состоит в том, что с виду она весьма «демократична», однако добыча делится отнюдь не поровну! Причина этого парадокса в том, что при последовательном исключении доминируемых стратегий не остается никакой воз- возможности для кооперации. Рассмотрим случай трех пиратов. Среднему пирату следовало бы поспешить предложить млад- младшему некоторый договор (например, о дележе E0, 50)), чтобы провалить предложение старшего пирата (99, 0, 1). Однако откуда у младшего пирата возьмется уверенность в том, что средний пират, став старейшиной, не отнимет у него всю до- добычу? Ведь именно такое поведение вытекает из стремления к максимизации выигрыша. Другими словами, предложение дележа E0, 50) является для среднего пирата доминируемой стратегией. Задача 5. Переговоры двух лиц при наличии дисконтирую- дисконтирующего фактора (Бинмор [1980]) Два игрока договариваются по поводу выбора вектора выигрышей из множества А с IR+, которое имеет вид Л = {(г„ г2) | 0 < г2 < Э (г,), 0<гх}, Где Э—дифференцируемая на [0, 1] функция, причем 0A) = 0, в' @ < 0 = 1, в"(о<о /при всех Процедура та же, что и в примере 5: на шаге 1 игрок I предлагает исход хх?А. Если игрок II отклоняет л:1, то он может предложить х2 € б- А, где б, 0 < б < 1, есть дисконтирую- дисконтирующий фактор. Если игрок I отклоняет х2, то он может предло- предложить а;3 ? б2 • А и т. д. Если соглашение наступило на шаге t, то выигрыши игроков в игре суть координаты х1. Если согла- соглашение не достигнуто ни на одном шаге, то выигрыши равны нулю.
Гл. ft. Сложное поведение 65 1) Докажите, что исход сложного равновесия соответствует достижению соглашения на шаге 1 и сводится к принятию некоторого оптимального по Парето вектора х (б) из А. Оха- Охарактеризуйте л: (б), используя функцию 0. 2) Докажите, что при б, стремящемся к 1, xt (б) уменьшается, а х2(Ь) возрастает. Докажите, что предельный исход хA) есть арбитражное решение по Нэщу на множестве А, т. е. решение следующей задачи: max z1-z2. геА Задача 6. Общественный механизм принятия решений с по- побочными платежами (Мулен [1981]) Сообщество N = {1,2, ..., п} должно принять одно реше- решение из конечного множества А = {а, Ь, с, ...}. Есть один частный товар (деньги), который позволяет осуществлять побочные пла- платежи, а полезность каждого игрока квазилинейна (как в за- задаче 4 гл. I). Исходная полезность 1-го игрока описывается вектором и{ g R.A. Если сообществом принято решение а и игрок i получает денежный платеж tt (он может быть как положитель- положительным, так и отрицательным), то окончательно полезность для него описывается величиной Решение (a; t) состоит из общественного выбора a g А и вектора t = (tlt ..., tn) денежных платежей, таких, что Обозначим через S) с A xR" множество всех таких решений. 1) Мы будем рассматривать два различных механизма. В пер- первом из них игроки последовательно предлагают решения, коте рые должны быть единогласно утверждены остальными. Игрок, чье решение отвергнуто, теряет в дальнейшем право вето, и денежный платеж ему больше не выплачивается. Более точно: Игрок 1 предлагает сначала решение d1 = (a1, t1) g 3) дли единогласного утверждения остальными участниками. Если каж- каждый из игроков 2, ..., п принимает d1, то это и есть оконча- окончательное решение. Если по крайней мере один игрок отклоняет d1, то тогда игрок 2 должен предложить решение d* = (a2, t2)?&) с единственным ограничением: t\ — 0. Решение d2 представляется для единогласного утверждения игроками {3, ..., п}. Если оно отвергается хотя бы одним из этих игроков, то тогда игрок 3 будет предлагать ds = (a8, t3) g ?D, такое, что t\ = t\ = 0, и теперь d3 будет представлено на едино- единогласное утверждение игроков {4, 5, ...,«} и т. д. Если пред- предложения игроков 1, 2 ..., (п — 2) последовательно отклоняются, тогда игрок (я—1) предлагает dn~l = (a"~1, t"'1), где t"~*
66 Ч. I. Некооперативное поведение игроков имеет вид /п-1 _ /Л Г) /1-1 in-l\ Только игрок п имеет право отвергнуть d", и в этом случае он выбирает окончательное решение d" = {an, 0). Докажите, что предложенный выше механизм определяет разрешимую по доминированию игру (при некоторых дополни- дополнительных предположениях, аналогичных принятым в задаче 3). Вычислите выигрыши, соответствующие сложному равнове- равновесию. Любое ли сложное равновесие оптимально по Парето? 2) В нашем втором механизме априори задано некоторое начальное решение (а*, I*). Приведенная ниже процедура сим- символизирует аукцион за право лидерства: i) каждый игрок назначает %; ^ 0 денег как цену за то, чтобы стать лидером; и) один из игроков, предложивший наибольшую цену (напри- (например, тот, который имеет наименьший порядковый номер), ста- становится лидером. Пусть это игрок i0; in) лидирующий игрок t0 платит ^0 каждому из остальных н предлагает решение (a; t)\ iv) это предложение ставится на голосование среди осталь- остальных игроков. Следовательно, на шаге (iv): — или предложение игрока t0 (a; t) поддерживается всеми остальными игроками, и тогда окончательное решение есть (a; t + s), где — или (по крайней мере) один игрок отвергает предложение игрока i0 и в этом случае принимается начальное решение (a*, t*). Учитывая денежные платежи, получаем окончательное решение (a*, t*-\-s). Проанализируйте игру, получающуюся из данного механизма на основе каких-либо функций полезности. Рассмотрите сначала игру G(i0), начинающуюся с шага iii), после того как опреде- определен лидирующий игрок t0. Докажите, что игра G (t0) разрешима по доминированию и найдите выигрыши сложного равновесия. Возвращаясь к шагу i), докажите, что вся игра не разрешима по доминированию, но что после соответствующего исключения доминируемых стра- стратегий, получается несущественная игра (см пример 5). Вычис- Вычислите соответствующие равновесные выигрыши.
л. П. Сложное поведение 67 ЛИТЕРАТУРА Берж (Berge С.) [1957] Theorie generate des jeux a n personnes. Paris, Gauthier-Villars. [Имеется перевод: Берж К. Общая теория игр нескольких лиц.—М.: Физматгиз, 1961.] Бннмор (Binmore K-) [f980] Nash bargaining theory II, London School of Economics, mimeo. Дутта, Дживерс (Dutta В., Gevers L.) [1981] On voting rules and perfect equilibrium allocation of a shrinking cake. * Гермейер Ю. Б. [1971] Об играх двух лиц с фиксированной последовательностью ходов, ДАН, 198, 5, 1001—1004. [1976] Игры с непротивоположнымн интересами. —М.: «Наука». Гретлейн (Gretlein R.) [1980] Dominance elimination procedures on finite alternative games. School of Urban and Public Affairs, Carnegie Mellon University, Pittsburgh. Мулен (Moulin H.) [1979] Dominance-solvable voting schemes. Econometrica, 47, 1337—1351. [1981] Implementing just and efficient decision-making. Journal of Public Economics, 16. [1981] См. литературу к введению. Роше (Rochet' J. С.) [1980] Selection of a unique equilibrium payoff for extensive games with perfect information. D. P. Ceremade, Universite Paris IX. Рубинштейн (Rubinstein A.) [1980] Perfect equilibrium in a bargaining model, I.C.E.A.D., London School of Economics. Фаркуарсон (Farquharson R.) [1969] Theory of voting; New Haven, Yale University Press, *) Звездочкой отмечены работы, добавленные при переводе.
ГЛАВА III РАВНОВЕСИЕ ПО НЭШУ Доминирующая стратегия, осторожное и сложное поведение могут быть определены игроками независимо друг от друга. Каждый игрок самостоятельно, зная только нормальную форму игры, может вычислить стратегию (или стратегии), рекомендо- рекомендованную тем или иным принципом рациональности. Синхронность стратегических выборов в этом случае не требуется. В противоположность этому равновесие по Нэшу может быть обосновано только динамическим сценарием, в котором страте- стратегические решения, принимаемые сегодня, зависят от предыду- предыдущих партий игры или хотя бы от начальной позиции. Таким образом, теперь уже общение игроков становится неизбежным. Они должны хотя бы наблюдать одни и те же прошлые исходы игры. Приведем определение и обсудим концепцию равновесия по Нэшу прежде, чем подробно исследовать ее привлекатель- привлекательные математические свойства (существование и устойчивость). 1. ОЙРЕДЕЛЕНИЕ И ОБСУЖДЕНИЕ Для данной игры в нормальной форме предположим, что игроки ведут себя так, как будто они не знают о своей стра- стратегической взаимозависимости: когда игрок i рассматривает переключение со стратегии xt на стратегию у{, он не учитывает реакции на свой ход остальных игроков, т. е. он ожидает, что остальные не изменят своей стратегии в ответ на его измене- изменение. Это предположение правдоподобно, если игроков так много, что воздействие, производимое на общий исход одним отклоне- отклонением, незначительно (см. пример 1). Альтернативная интерпре- интерпретация предполагает полное незнание игроком i функций выигрыша Uj при / g N\{i}. Игрок i может добывать информацию о функ- функциях «у, наблюдая реакции игроков из N\{t} на использование им стратегии, выгодной в предположении, что никакой реакции остальных не последует (эта линия рассуждений развивается в разд. 3).
Гл. III. Равновесие по Нэшу Определение 1. Пусть дана игра в нормальной форме G = (Xh щ\ i?N). Скажем, что исход x — (x;)c6N есть равнове- равновесие по Нэшу (кратко NE-нсход) игры G, если V'€N, у</,€*г ut{yit х/)<«,(Х(, xt). A) Обозначим через NE (G) множество равновесий по Нэшу в игре G. В равновесии по Нэшу х игрок i рассматривает стратегии Xt как экзогенно заданные и максимизирует функцию м,- на множестве своих стратегий yt. Свойство A) равновесия по Нэшу состоит в том, что Х(—это один из наилучших ответов на стратегии xt. Концепция равновесия по Нэшу не дает конкретных реко- рекомендаций по выбору стратегии, как это было в случае сложного или осторожного поведения. Обычно, если в игре есть два невзаимозаменяемых М?-исхода (см. пример 2 и лемму 2 ниже), то игроки не могут выбрать стратегии, порождающие равнове- равновесие по Нэшу, без некоторого механизма координации (на этот счет' см. также гл. V, разд. 2). Заметим однако, что в играх двух лиц с нулевой суммой Л^-исходы суть просто седловые точки (определение 6 гл. I), поэтому М?-стратегии совпа- совпадают с осторожными оптимальными стратегиями (теорема 3 fen. I). Представим себе два крайних сценария, мотивирующих Концепцию равновесия по Нэшу: 1) С нормативной точки зрения, предположим, что игроки сообща обсуждают, какой выбрать исход, пока не договари- договариваются до необязательною соглашения. В следующий момент они расходятся, и всякий обмен информацией между ними ста- становится невозможным. Затем каждый игрок тайно выбирает свою настоящую стратегию, не зная действительные стратеги- стратегические выборы остальных. Игрок может быть верен достигнутому соглашению, а может и отступить от него, не платя при этом штрафа, и использовать любую, угодную ему стратегию. Тогда (и только тогда), когда согласованный исход есть равновесие по Нэшу получаем стабильное соглашение: «Предполагая, что Все остальные лояльны, я тоже лучше буду лоялен (чем более бесспорна моя добродетель, тем больше побудительных мотивов Я дам остальным к тому, чтобы и им быть добродетельными)». Этот полукооперативный сценарий исследован в гл. V как особый способ кооперации: концепция равновесия по Нэшу связана как с некооперативной, так и с кооперативной частью теории. 2) С описательной стороны мы ищем устойчивые исходы
70 Ч. I. Некооперативное поведение игроков «близоруких» процедур нащупывания1), в которых каждый игрок придерживается оптимальной стратегии при (постоянно нару- нарушаемом) условии, что остальные не меняют своих стратегий. Когда эта процедура нащупывания по Курно (см. ниже разд. 3) сходится, мы получаем равновесный по Нэшу исход. Замечание: Метатеоретические соображения, предложенные фон Нейманом и Моргенштерном, дают альтернативный подход к нормативному обоснованию Л^-исходов. Рассмотрим случай полной информации и предположим, что некоторая теория ре- рекомендует в игре G для каждого игрока i «оптимальную» стра- стратегию х{. Поскольку каждый разумный и полностью информи- информированный игрок может сам восстановить всю теоретическую аргументацию и вычислить рекомендованный исход, то необхо- необходимо, чтобы наша теория предлагала NE-нсход, если мы хотим, чтобы эгоистичные игроки, максимизирующие свои функций выигрыша, действительно прислушивались к рекомендациям теории. Пример 1. Двоичный выбор с взаимным влиянием (Шеллинг [1979]) Пусть имеется много идентичных игроков. Каждый из них должен выбрать одну из двух стратегий: 0 или 1 (скажем, для определенности, использовать собственный автомобиль или об- общественный транспорт). Если t, O^/^l,— доля игроков, использующих стратегию 1 (общественный транспорт), то числа a(t) и b{t) обозначают соответственно выигрыши любого игрока, использующего стра- стратегию 1 и стратегию 0 (собственный автомобиль). Таким обра- образом, получается следующая игра в нормальной форме: Xj-=... = Х„={0, 1}, п велико, ja(t) при л;,= 1, А "< (*<*) = W при *, = 0, W ' Предположим, что а и b такие, как на рис. 1. Это означает, что если доля игроков, использующих об- общественный транспорт, больше tlt то уличное движение настолько свободное, что водитель автомобиля счастливее, чем пассажиры автобуса (учитывая агрегированный показатель затрат и ком- комфорта). Если же доля автомобилистов больше, чем A — t0), то движение настолько интенсивное (возможно с некоторым прио- приоритетом в правилах для автобусов), что сравнение теперь в пользу пассажиров автобусов. В этой игре равновесиями по 1) Такие процедуры принятия решений соответствуют гипотезе об огра- ограниченной рациональности участников, не заглядывающих в будущее.— Прим, перев.
Гл. ///. Равновесие по Нэшу Рис. 1 Нэшу являются исходы х*, для которых выполнено условие u где /* = -i- / =i означающее, что для каждого отдельно взятого игрока обе до- допустимые стратегии равноценны. Пусть величина б обозначает долю игроков, решивших пе- переключиться со стратегии 0 на стратегию 1. Заметим, что если О настолько велико, что b(t) = a(t) < a(t + d), то выигрыши этих игроков увеличатся при переключении, если стратегии остальных игроков останутся прежними. Однако если это переключение произойдет, то у игроков возникнет желание переключиться со стратегии 1 на страте- стратегию 0, поскольку выполнено условие a (t + б) < b (t 4- б). Если wo желание осуществится, то доля — уменьшится и вновь вернется на отрезок [t0, tt]. Аналогично, пусть б—доля игроков, переключившихся по каким-либо причинам (например, из-за случайных ошибок) со стратегии 1.на стратегию 0, причем t—б </0. Тогда в силу условия b(t—b) < a(t—б) у игроков появится Желание переключиться обратно на стратегию 1. При овущест- Влении этого желания доля — увеличится и вновь вернется йа отрезок [t0, Упражнение 1 Рассмотрим два различных варианта пары функций а(-), &(•).
72 Ч. I. НекоопераШиёное поведение игроков 1) Предположим, что обе функции а и b возрастают по t и a(t) < Ь (t) для всех ? ^ [0. !]• Докажите, что соответствую- соответствующая игра является обобщением дилеммы заключенного (пример 1 гл. I), в которой единственное равновесие по Нэшу является также равновесием в доминирующих стратегиях. 2) Предположим, что а и Ь такие, как на рис. 2. Докажите, что соответствующая игра имеет 3 типа Aff-исходов, один из которых не устойчив по отношению к рассмотренным выше б-отклонениям. МО) о@) / / / / / / / / / / / / I / 1 / -6 0) 0A) Рис, 2 Отложим до разд. 3 формальный анализ процедуры нащу- нащупывания по Курно, который является важным этапом на пути некооперативной интерпретации равновесия по Нэшу. Определение 2. Исход х игры G = (X{, м,-; i?N) называется индивидуально рациональным, если sup inf ut (уi, yt) = at ^ ut (x) для всех i € ЛЛ Лемма 1. Все NE-исходы индивидуально рациональны1). Доказательство. Из A) получаем, что для всех i справед- справедливо неравенство Vyi$Xl inf ut(yt, t/t)<ut(yt, л&) <«,(*). »/e xi Взяв супремум по yt в этих неравенствах, получаем B). 1) Утверждение леммы 1 можно усилить, заменив ос,- на inf sup щ(у{, у.)^а;.~Прим. п»рев>
Гл. IIL Равновесие по Нэшу 73 С одной стороны, NE-исход, дает каждому игроку по край- крайней мере его гарантированный выигрыш (индивидуальная рацио- рациональность), хотя Л^?-стратегия может и не быть осторожной (см. пример 2). С другой стороны, NE-ucxor может не быть оптимальным по Парето (как в примере 1, рассмотренном выше), фолее того, если каждый МЕ-исхоя оптимален по Парето, то сосуществование нескольких различных оптимальных по Парето #?-исходов порождает обычно борьбу за лидерство (гл. II, разд. 4), что убивает всякую надежду найти «оптимальные» стратегии. Это обстоятельство иллюстрируется следующим примером. Пример 2. Игра «перекресток» Два автомобилиста движутся по двум перпендикулярным дорогам и одновременно встречаются на перекрестке. Каждый из них может остановиться или ехать. Следующая игра 2x2 формализует данную ситуацию в предположении, что каждый Остано- Остановиться Ехать 1 2 1 1-е 1-е 0 2 0 Остановиться Ехать игрок предпочитает остановиться, чем пострадать в аварии (исход (ехать, ехать)), и проехать, если другой сделал оста- остановку. Неотрицательное число е соответствует неудовольствию от созерцания проехавшего, в то время как сам ты вежливо остановился; величина е определяется этическими нормами общества. Оба МЕ-исхоца (а именно, (остановиться, ехать) и (ехать, остановиться)) оптимальны по Парето. Тем не менее они не взаимозаменяемы. Для каждого игрока оптимальной стратегией является остановка, если другой игрок решил проехать пере- перекресток, и наоборот, выгодно проехать, если другой игрок остановился. Высказав решимость придерживаться неосторожной стратегии «ехать», игрок выигрывает, поскольку он заставляет другого остановиться и, следовательно, получает максимальный выигрыш, равный 2. Поскольку ни один исход не дает обоим игрокам выигрыш, равный 2, то неизбежна борьба за лидерство. Каждый игрок будет изображать, что он утратил способность переключиться со стратегии «ехать» на стратегию «остановиться» (например, прикидываясь пьяным), и в то же время внима- внимательно наблюдать за своим противником, чтобы выяснить, а
74 У. /. Некооперативное поведение игроков вдруг тот и в самом деле не сможет остановиться. Поразительно, что наиболее выгодным оказывается нарочито нерациональное поведение, которое тем самым оказывается вполне разумным. Симметричность ролей обоих игроков делает невозможным нахождение' арбитражного решения борьбы за лидерство на основе нормальной формы игры. Прекрасные примеры и глу- глубокий анализ читатель найдет в работе Шеллинг [1971], гл. II. Выводы предыдущего примера легко обобщить на произволь- произвольную игру двух лиц G — (XV Х2, их, иг). Используя обозначения определения 5 гл. II, назовем l-выигрышем по Штаке^ьбергу выигрыш игрока i в любом t-равновесии по Штакельбергу, обозначим его через S{: S,-= sup Ui(xlt x2), где {/, /} = {1, 2}. ()BR Таким образом, S(. — это выигрыш игрока i, действующего оп- оптимально в качестве лидера. Будем говорить, что в игре G имеет место борьба за лидерство, если не существует такого исхода х, для которого: Sr <«,(*), i=l, 2. C) Лемма 2. Предположим, что игра G имеет по крайней мере два оптимальных по Парето NE-исхода х1, хг с различ- различными векторами выигрышей; (Ul(xl), щ(х1))Ф(и1(х*), и2(х*)). D) Тогда в игре G имеет место борьба за лидерство. Доказательство. Заметим, что NE (G) = BRl (]BR2. Следова- Следовательно, по определению St имеем {*€#?(G)} =$>{«,(*)<$<. '=1, 2}. Если в игре G нет борьбы за лидерство, то найдется исход х, для которого справедливо C), что означает Щ(х1)<и,(х), i=l, 2, «,(*¦)<«,(*), t = l, 2. Поскольку х1 и х2 оптимальны по Парето, то все четыре не- неравенства должны обратиться в равенства, что противоречит предположению D). В порядке дальнейшего обсуждения М?-исходов сравним их с исходами при сложном равновесии. Теорема I. Предположим, что для всех i^N множества Хг конечны.
Гл. III. Равновесие по Нэшу 75 Если игра G=*(X{, u{; i?N) разрешима по доминированию, то любое сложное равновесие является равновесием по Нэшу1). Доказательство. Доказательство соответствует доказатель- доказательству леммы 4 гл. II. Сначала нужно убедиться в том, что для любого прямоугольного подмножества Y = X Yt множества XN F N выполнено включение NE (Z) с NE (Y), где Z, = S>, (щ; Y), a NE(Y)—множество Л^?-исходов игры (У,, «,-; i?N). Пусть X* = X XI обозначает множество сложных равнове- еий игры G, тогда Итак, для разрешимых по доминированию игр сложное по- поведение всегда приводит к М?-исходу. Обратное утверждение отнюдь не верно. NЕ-стратегия может быть доминируемой стратегией Этот факт является неожиданным. Проиллюстрируем его на примере игры 3x3 (т. е. игры двух лиц в нормальной форме, в которой каждый игрок имеет по три стратегии). М 1 1 0 0 1 0 0 1 1 0 0 1 0 1 0 1 1 0 Здесь (Г, L)—единственный М?-исход. Тем не менее, для игрока 1 (выбирающего строки), стратегия Т доминируется стратегией В, а для игрока 2 (выбирающего столбцы), страте- стратегия L доминируется стратегией R. После исключения домини- *) Из этой теоремы следует существование равновесий по Нэшу в играх в развернутой форме при условии взаимной однозначности C) разд. 2 гл. II. В отличие от случая разрешимости по доминированию это условие теперь может быть опущено. Для доказательства существования равновесий по Нэшу в игре в развернутой форме достаточно в алгоритме Куна каждой предфинальной вершине из L (М) приписать ход в финальную вершину с наибольшим выигрышем соответствующего игрока.— ирим. перев,
76 Ч. I. Некооперативное поведение игроков руемых стратегий остается игра с нулевой суммой, в которой нет седловой пары. Значение этого факта более наглядно для игр в разверну- развернутой форме. Пример 3. Выборы с правом вето (продолжение) ,}4з игры трех лиц примера 2 гл. II выделим игру двух лиц, предположив, что игрок 1 наложил вето на исход—Ь (что со- соответствует его сложному поведению в силу заданных предпо- предпочтений). Тогда игроки 2 и 3 участвуют в следующей игре; с а с d (иг(с)<иг(с1)<и2(а) \u3{c)<u3(a)<u3(d) Рис.3 Имеется три М?-исхода: (/, R), (p1, L) и (ft, L). 1) При (/, R) игрок 2 отклоняет кандидата d, а игрок 3 всегда выбирает правую дугу. Стратегия R есть доминирующая стратегия игрока 3, а (/, R)—сложное равновесие. Выбирается кандидат а. 2) В (/, L) и (#, L) игрок 2 накладывает вето на с и а, в то время, как игрок 3 использует следующую стратегию L: I идти направо, если игрок 2 накладывает вето на с или а, \ идти налево, если игрок 2 накладывает вето на d. Стратегии наилучших ответов игрока 2 на L есть в точности {/, #}. Более того, L— это наилучший ответ как на /, так и на 0, поскольку соответствует избранию наилучшего по и3 кандидата d. Следовательно, (/, L) и @, L) — Л/?-исходы. Заметим, что L не только доминируемая (стратегией R) стратегия игрока 3, но также и рискованная (не осторожная) стратегия: применяя L, игрок 3 угрожает избрать с, если только игрок 2 отклонит d, но такой вариант крайне не выгоден обоим игрокам, поскольку с—наихудший кандидат как по иг, так и по ы8.
^_ Гл. til. Равновесие ho Нэшу 7? Другой пример М?-исходов, использующих доминируемые стратегии, приведен в нашей простой модели аукциона: см. упражнение 2 ниже. Заметим, однако, что когда все функции выигрыша взаимно однозначны на Хд,, то никакой М?-исход не содержит домини- доминируемой стратегии и концепция равновесия по Нэшу обобщает равновесие в доминирующих стратегиях. Упражнение 2 Для аукциона второго типа (пример 2 гл. I) докажите, что для каждого игрока i и любой цены р, ограниченной сверху цен- ценностью товара для игрока i (p^a,-), существует МЁ-исход, в котором i-й игрок получает товар за цену р. Напротив, для аукциона первого типа покажите, что любой МЯ-исход таков, что игрок 1 получает товар по цене между аг и at. Задача 1. Почти несущественная игра двух лиц Пусть G = (Xj, Х2, их, ы2)—игра двух лиц, в которой Xf и Х% конечны. Скажем, что G почти несущественна, если всем индивидуально рациональным исходам соответствует один и тот же вектор выигрышей. Другими словами, для любых двух исходов х и у выполнено {х и у индивидуально рациональны} => {и, (х) = и,- (у), 1 = 1, 2}. 1) Приведите пример почти несущественной игры, которая Не является несущественной. 2) Предположим, что игра G почти несущественна и выбе- выберем пару (*!, х2) g Px (Mt) х Р2 («,) осторожных стратегий. Пока- Покажите, что исход (xlt x2) является оптимумом Парето, равнове- равновесием по Нэшу, t-равновесием по Штакельбергу для t=l, 2. 3) Всякое ли равновесие по Нэшу в почти несущественной игре является также t-равновесием по Штакельбергу A=1,2). А что получится, если обе функции выигрыша взаимно одно- однозначны на ХххХл7 2. ТЕОРЕМА НЭША О СУЩЕСТВОВАНИИ РАВНОВЕСИЙ С теоретической точки зрения наиболее привлекательной чертой концепции равновесия по Нэшу являются его хорошие математические свойства. Теорема Нэша дает достаточные условия существования по крайней мере одного равновесия по Нэшу. Эти условия оказались легко проверяемыми во многих прикладных моделях. Уже отмечались два различных достаточных условия для того, чтобы игра G имела хотя бы один М?-исход:
78 4. I. Некооперативное поведение игроков 1) если игра G несущественна, тогда по теореме 1 гл. I любой набор осторожных стратегий есть равновесие по Нэшу. 2) если игра G разрешима по доминированию, тогда всту- вступает в силу теорема 1 этой главы. Однако удобных условий на X,- и «,-, гарантирующих несу- несущественность или разрешимость по доминированию игры 6, не существует. Для игры в нормальной форме обычной явля- является ситуация, в которой и,- построены из элементарных функ- функций (полиномиальных, логарифмических, ...) на основе эле- элементарных операций. В этом случае оказался весьма полезным результат Нэша. Напомним, что действительная функция а вогнута, если для всех X, 0^%^\, и любых t, f выполнено la (t) -f A — X) a (f) < a (Xt -f A — X) t'). Теорема 2 (Нэш [1951]). Предположим, что для любого i?N множество стратегий Х{ есть выпуклое и компактное подмножество топологического векторного пространства (во- (вообще говоря, своего для каждого i). Пусть для всех i?N и,-— непрерывная действительная функция на XN, определенная так, что для всех xt?Xt функция иг(хь л;,-) вогнута по х{ на Xt. Тогда множество NE (G) равновесий по Нэшу игры G = (Xit и,-; i?N) непусто и компактно. Доказательство. Доказательство опирается на теорему о неподвижной точке из выпуклого анализа. Используем следую- следующий результат, который известен как лемма Кнастера — Кура- товского—Мазуркевича (ККМ), доказательство которой можно найти в работах: Берж [1957], Партхасаратхи, Рагхаван [1974]. Лемма. Пусть р—целое число и аи ..., ар—некоторые точки топологического векторного пространства. Пусть далее Ах, ..., Ар — некоторые замкнутые подмножества множества СО {alt ..., ар}, которое является выпуклой оболочкой мно- множества {av ..., ар], причем УТс{\, ..., р) множество U Ak содержит СО{ak\k?T}. *€ Т Р Тогда пересечение {\Ak не пусто Следующее короткое доказательство теоремы 2 принадле- принадлежит Жоржу Хаддаду. Определим действительную функцию ф на XNxXNi Ф(х, У)=-'11/[щ(х1, yt)—u{(y)] при х, y?XN. Из вогнутости ti{ по Х[ следует вогнутость Ф по х. К тому же Ф непрерывна по у. Определим многозначное отображение Е
Гл. ///. Равновесие по Нэшу 79 из XN в себя; F (*) = {«/€*л/1Ф(*. У)<Щ Для всех x?XN. Поскольку Ф непрерывна по у, то F (л;)—.компакт при всех х. Более того, х g F (х), поэтому F (х) не пустое множество. Фикси- Фиксируем целое р и р элементов х1, ..., %р из Xn. Утверждается, р р что любая выпуклая комбинация х= 2 k4** принадлежит U F (хь). В противном случае имеем V*=l, ..., р 0<Ф(л:*, л;). В силу вогнутости функции ф относительно первого аргумента получаем противоречие 0<ф( J] ^ ( ) р Следовательно, мы доказали, что СО {х1, ..., хр\ с U F (я*). *= i Поскольку это справедливо для любого р и любых х1, ..., хр, р то по ККМ лемме П F (д;*) не пусто. Так как непустые ком- ft= i пактные множества (F(x))xex таковы, что любое их.конечное семейство имеет непустое пересечение, то и пересечение всех множеств Г) F (я) также не пусто. Для любого х* из этого x пересечения имеем Vx?XN ф(х, л:*)<0, что может быть переписано в виде Vt € N, Vx; € X,- и, (х„ xf) - щ (*•) < 0. Таким образом, П F(x) — NE(G) и теорема 2 доказана. ¦ xexN Следствие из теоремы Нэша (фон Нейман). Пусть Хи Х2— выпуклые компактные подмножества некоторых топологичес- топологических векторных пространств, и пусть их — непрерывная дей- действительная функция, определенная на Х1хХ2, причем 1) для всех х2 g X2 ux (xlt x2) вогнута по xlt 2) для всех хг g Xl их {хх, х2) выпукла по х2. Тогда игра двух лиц с нулевой суммой (Xlt X2, ut) имеет по крайней мере одну седловую пару и, следовательно, цену. Теорема Нэша позволяет утверждать, что множество NE (G) не пусто. Для того чтобы его вычислить, требуется решить
80 Ч. I. Некооперативное поведение игроков следующую систему уравнений (i?N): щ (#*) = max ut (xt, xt). E) 4е xi Если и( вогнута по xt, то приведенная выше задача гло- глобальной оптимизации эквивалентна локальной задаче (как мы знаем из выпуклого программирования). Например, если х{ — внутренняя точка множества Х; и функция и, дифференцируема по X;, то условия E) эквивалентны условиям р.(х*)=:0 для всех i$N. F) Поскольку число независимых уравнений равно размерности XN, можно надеяться, что система F) будет иметь конечное число изолированных решений. По этой же причине для игр «общего положения» равновесные по Нэшу исходы не оптимальны по Парето (точный результат см. Грот [1974]). Проиллюстрируем метод вычисления, который мы описали в общих чертах, на некоторых примерах и задачах. Пример 4. Олигополия с назначением выпуска Пусть имеется п производителей с нулевыми затратами, которые регулируют предложение xlt ..., хп некоторого насы- насыщаемого по потреблению товара. Производители поставляют свой товар на рынок. Общее предложение равно # = #1 + ... ...+хп, а цена есть р(х), где р—убывающая вогнутая функ- функция на положительной полуоси: р@)>0, р'(у)<0, р"(у)<0 для */>0. G) Эту ситуацию можно представить как следующую игру: X; = [Q, -foo), ui(x)=xip(x), t = l, .... п. Из наших условий на р получается, что функция ut вогнута по Х[. Поскольку Х[ не компактные множества, положим, Y{ = = [О, S], где S есть предложение, порождающее нулевую цену: p(s) = O. Для усеченной игры (Y{, и,-; i=l, .... п) применима теорема Нэша, которая позволяет утверждать существование М?-исхода х в усеченной игре. На самом деле исход х есть равновесие по Нэшу в исходной игре. Действительно, гаран- гарантированный выигрыш каждого игрока в усеченной игре есть 0, поэтому по лемме 1 и{ (х) > 0> щ (yh х,) для y,?[S, +оо). В силу вогнутости н дифференцируемост'и и, на множестве X
Гл. III. Равновесие по Нэшд 81 /У?-исход х удовлетворяет системе F): х,р'(х)+р(х) = 0. Таким образом, наша игра имеет единственный /УЯ-исход на диагонали: _ - - —р (пх) Xl = xt ха-х, где*--^г-. Упражнение 3. Пример 4 (продолжение). Докажите, что общий выпуск пх при М?-исходе больше выпуска х*, максимизирующего общий доход хр (х). Докажите, что любая стратегия х(, для которой х* < х{, доминируете* стратегией х*. Является ли данная игра разре- разрешимой по доминированию? Упражнеше 4. Дуополия с назначением выпуска Предположим, что цена меняется по закону Рассмотрим дуополию, которая формализуется как игра двух лиц, в которой множество стратегий каждого игрока есть отре- отрезок [0, 1/2]. Докажите, что функция м,- (х) = ххр (х) вогнута по х{. Вычислите функцию наилучших ответов обоих игроков и найдите Л/?-исход. Сравните его с границей Парето. Задача 2. Игра агентов по продаже автомобилей (Кейз [1979]) В игре участвуют п игроков, которые являются агентами по продаже автомобилей. Общий спрос фиксирован и равен D. Пусть Х{—число автомобилей, которые агент i берет для про- продажи. Предполагая, что у каждого агента одно и то же число посетителей в единицу времени, получаем, что спрос на машины агента i равен D-J-, где ~х = х1+ ...+ хп. Пусть Р{—доход агента с одного проданного автомобиля, a Ct — его затраты на хранение одного автомобиля (в единицу времени). Тогда возникает следующая игра в нормальной форме! = [0, +оо), ut(x)=DPt^—ClXl, f = 1. ..., п, полагаем, что -q = 1.
82 Ч. I. Некооперативное поведение игроков 1) Найдите недоминируемые стратегии игрока i. Является ли наша игра разрешимой по доминированию? 2) Докажите, что наша игра имеет два Л^-исхода и вычис- вычислите их. Являются ли они оптимальными по Парето исходами? 3) Сравните соответствующие М?-выигрыши в случае, когда множество агентов разбито на подмножества {1 nj, {/ij'+l, ..., п}, таких, что для всех t=l, ...,-Щ величина =i С ' пренебрежимо мала, а для всех i = nt-{-\, ..., п величина -^— положительная константа. Задача 3. Финансирование общественных нужд по добро- вольной подписке Предположим, что у каждого члена i сообщества N имеется некоторый запас денег М-г Часть этих денег х) участник может выделить на общест- общественные нужды. Его функция полезности vt (q, m;) зависит от количества т1 оставшихся у него денег, а также от суммы q денег, выделенных всеми участниками на общественные нужды. Предположим, что функция v-t дифференцируема, строго монотонно возрастает по каждой переменной и вогнута по их совокупности. Таким образом, получается следующая игра в нормальной форме: Xt = [Q, М{\ щ(х) = х 1) Докажите, что исход х оптимален по Парето в данной игре тогда и только тогда, когда он удовлетворяет уравнению Л индала—Самуэльсона: /6 N 2) Докажите, что функция и; вогнута по переменной х{, и выведите существование М?-исхода. Охарактеризуйте М?-исход | N | условиями первого порядка. 3) Докажите, что в любом ЛГЕ-исходе количество денег, выделяемых на общественные нужды, меньше оптимального уровня. Более точно, для М?-исхода существует доминирую- доминирующий его по Парето исход, которому соответствует большее количество средств, выделенных на общественные нужды. Задача 4. Игра двух лиц с нулевой суммой Пусть Аи А2—две положительно определенные рхр мат- матрицы. В—произвольная рхр матрица и, наконец, а±, a^^Rp,
Гл. III. Равновесие по Нэшу 83 Рассмотрим игру двух лиц с нулевой суммой (Хи Х2, щ), в которой XX R , хг Jfi> + <a2, хгу. Докажите, что эта игра имеет единственную седловую пару и вычислите ее. Задача 5. Война на истощение (Милгром, Вебер [1980]) Каждый из двух игроков стремится завладеть некоторым предметом. Ценность этого предмета для игрока i описывается величиной V;. Победителем является тот, кто дольше остается агрессивным. Предполагается, что затраты на агрессивность у обоих игроков одинаковы и равны единице. Стратегия х{ игрока i означает: «Я буду агрессивным до момента времени t = x{, если только противник не остановится в некоторый момент времени х,- < *,-; в последнем случае я остановлюсь в момент Лу + е для того, чтобы получить предмет с минималь- минимальными издержками». 1) Возникает следующая игра в нормальной форме: Х1==Х2 = [0, +оо), vi—xt ПРИ *8<*i. -^—xt при x± = . —хг при x2 < | %—xt при xi = x2 (при равенстве для определения победителя бросается монета). Докажите, что наша игра имеет в точности три оптимальных по Парето вектора выигрышей, два из которых соответствуют равновесиям по Нэшу (значит, есть борьба за лидерство). Докажите, что в любом МЕ-исходе один из игроков исполь- использует свою единственную осторожную стратегию и получает гарантированный выигрыш, а другой очень рискованную стра- стратегию. 2) Предположим, что v± и v2—две независимые равномерно распределенные на [О, 1] случайные величины. Игрок i наблю- наблюдает 0{, но не наблюдает vf. Множество его стратегий теперь есть X,-: Х;?Х;: X; измеримое отображение из [О, 1] в Xt.
84 Ч. I. Йекооперативное поведение игроков Функции выигрыша определяются так: [О, !]• Докажите существование в игре (Xit X2, иь ы2) симметрич- симметричного, доминируемого по Парето Л^?-исхода xt = х2 = х* и вы- вычислите его. Заметьте, что при использовании игроками равно- равновесных стратегий реализуются войны сколь угодно большой протяженности во времени. Однако математическое ожидание длины войны конечно. Указание. Предположите, что функция х* возрастающая и дифференцируемая. Докажите тогда, что для всех у,- € [0. 1] функция (v,—x*(t))dt-y[l-(x*r4y)] о должна достигать максимума на [0, +оо) при y = x*(V[). 3. УСТОЙЧИВЫЕ РАВНОВЕСИЯ Даже в случае полной информированности (каждый игрок знает составляющие нормальной формы игры, включая функ- функции выигрыша других игроков) концепция равновесия по Нэшу не может быть обоснована, исходя из рассмотрения изолиро- изолированно принимаемых рациональных решений. Если допустим обмен информацией, то можно использовать сценарий с необя- необязательным соглашением (см. разд. 1). Напротив, в процедурах нащупывания по Курно исследуется динамический процесс принятия «близоруких» решений, напоминающий механизм совершенной конкуренции. Каждый игрок максимизирует свой выигрыш, полагая, что стратегии остальных игроков фикси- фиксированы. Эта процедура не может быть обоснована соображе- соображениями рациональности (поскольку предпосылка о том, что все остальные игроки будут неизменно использовать одну и ту же стратегию, постоянно нарушается). Тем не менее процедура имеет определенную описательную силу и позволяет разделить М?-исходы на устойчивые и неустойчивые. Более того, ее реализация требует минимальной информированности игроков, которую мы будем называть «полной неинформированностью» (каждый игрок знает только свою собственную функцию выиг- выигрыша, а контакты игроков сводятся к совместному наблюдению стратегий) Пример 5. Устойчивость в дуополии Курно с назначением выпусков
Гл. Ш. Равновесие по Иэшу 85 Два игрока поставляют на рынок некоторые количества xt и хг одного и того же товара, цена на который определяется следующим образом: р (лг) = 1 — х, где x = x1 + xt. Рассмотрим два различных предположения о функции затрат: а) постоянные затраты на выпуск единицы продукции при увеличении масштабов производства: затраты на производство у единиц оцениваются величиной -^У Для обоих игроков; б) убывающие затраты на выпуск единицы продукции при увеличении масштабов производства: затраты на производство у единиц оцениваются величиной у У—тУ* для °боих игроков. Наконец, максимальные производственные возможности обоих игроков равны -j- (поэтому цена и затраты неотрица- неотрицательны). В случае а) получаем следующую игру: Xi - Xt = [0, 1/2], щ (xit xt) = xt A -х)-\ х;, i = 1, 2. Легко вычислить наилучший ответ игрока i на стратегию xt игрока / (поскольку и,- вогнута по х(). BRt = {Xi - a (Xj)/0 < x, < Ц , где а (у) = -J-—~ у (мы используем обозначения разд. 4 гл. II). Единственный Л^-исход таков: Процедура нащупывания по Курно начинается из началь- начальной позиции {х\, х\), причем каждый игрок последовательно использует наилучший ответ на текущую стратегию противника: / *Л «0\ /v*! vO\ (г* Iv^\ v"\ ?L /¦?/? Iv*l v^\ /vl n (лЛ\\ ? fiD (Aj | A2 I —" ' lAjj 2/ "~~ \ \ 2/> "/ t ^*\ i "" ^ \"» "/ — \ 1' \ 1 // С ^¦*\ о—™ ' ., .-> (A;i, 4) = (a D). 4) 6 B^i —* D, 4) = = (*'„ a (*',))€?/?,—•¦... • (8) На рис. 4 мы изобразили две такие последовательности. Изобразив самостоятельно еще несколько последовательностей, читатель убедится, что из любой начальной позиции (х\, х\) последовательности (х',, xi) и (л;',, 4~') сходятся к МЕ-исхопу Т' т) • ^ качестве упражнения мы оставляем доказатель- ство этого утверждения, а также доказательство геометриче- геометрической скорости сходимости.) Скажем, что исход (-g-, 4") яв- является устойчивым NE-жхоцрм.
86 Ч. I. Некооперативное поведение игроков j 1/2 1/4 2 \BRt К Начало» . >- Начало 1/4 Рис.4 1/2 Обратимся теперь к случаю б). Получается следующая игра в нормальной форме: Х1 = Х2 = [0, 1/2], и,(хи *2) = *;A-F)-(T*,—f-*?),f=l,2. По-прежнему функция и; вогнута по х{ и кривые наилучших ответов имеют вид при -i}, где _1_ 2 ' 1— 2у при :?• Теперь мы имеем три NE-исхола NE = BR1nBR2 = f[[±,-L), (|, О), (о, Щ. На рис. 5 мы видим, что, начиная с любого исхода х° Ф (\ , -М , (О 2Л последовательность (8) всегда сходится к f-j, ОЛ или (О, 2Л (за конечное число шагов). Это справедливо даже в том слу- случае, когда точка х° сколь угодно близка к точке (-|-f ~\ , но
Гл. ///. Равновесие по Нашу 87 не совпадает с ней. Будем говорить, что f-|-, -5Л —неустой- чивый NE-исхоа, a f 4". 0) и @. т) (локально) устойчивые. 1/2 1/3 1/4 \\ \BR2 1 1 ! Начало +• Начало 1/4 1/3 1/2 Рис.5 Упражнение 5 На рис. 6 представлен один из вариантов расположения кривых наилучших ответов BR,, i = l, 2, для игры со множе- множествами стратегий Х, = Х2 = [0, 1]. Проверьте, что все три Aff-исхода неустойчивы. Весьма сложная структура динамиче- динамической системы (8) в подобной игре проанализирована в работе Рэнд [1978]. Можно дать несколько определений процедуры нащупыва- нащупывания по Курно в играх п лиц: игроки могут изменять свои стратегии последовательно (порядок имеет значение) или одно- одновременно. Соответствующие понятия устойчивости совпадают для игр двух лиц (п = 2) и не совпадают в играх по крайней мере с тремя игроками (п^З) (см. упражнение 6 ниже). Будем придерживаться второго определения. Определение 2. Пусть множество Xt при всех i g N наде- наделено некоторой топологией. Пусть далее G = (X;, u{; i?N) — игра в нормальной форме. Предположим, что каждый игрок имеет единственную стратегию наилучшего ответа на любые стратегии остальных игроков: для всех i ?N и всех xt € Xt существует единственная функция г,-(xt)€Xi, такая, что (/v(*f), xt)^BRt. (9)
88 Ч. I. Некооперативное поведение игроков С любым исходом х° g Хд, связана процедура (одновременного) нащупывания по Курно, начинающая из х°, а именно следую- следующая последовательность х°, Xх, ..., х*, ... из XN: xt=ri(xtt~l), i<tN, t=l,2 A0) Скажем, что равновесный по Нэшу исход х* устойчив в игре G, если для любой начальной позиции xa?XN процедура нащу- нащупывания по Курно, начинающаяся из позиции л;0, сходится к лс*. ,. X. 1/2 1 1/2 1 xt Рнс. 6 Заметим, что устойчивый М?-исход в игре G обязательно является единственным равновесием по Нэшу в игре G, поскольку если начальная позиция есть равновесие по Нэшу, то процедура нащупывания по Курно приводит к стационарной последовательности. Упражнение 6. Устойчивость процедуры последовательного нащупывания по Курно Для заданного порядка игроков N = {1,2, ...,п\ проце- процедурой {1,2 ^-последовательного нащупывания по Курно, начинающейся из х°, является последовательность Xй, х1, ..., х\ ..., где Скажем далее, что М?-исход х* является {1, ..., п\ -устойчи- -устойчивым, если для любой начальной позиции л;0 процедура {1, ..., п\- последовательного нащупывания по Курно, начинающаяся из х°, сходится к х*.
Гл. Hi. Равновесие по Нэшу 89 1) Если п — 2, то {1, 2}-устойчивость, ^2, 1 [-устойчивость и устойчивость согласно определению 2 совпадают. 2) Если /г^З, то зто разные понятия. Рассмотрим, напри- например, игру трех лиц , = R, f=l, 2,3 ¦ Единственным Л^-исходом является точка @, 0, 0). Докажите, что он не {1, 2, 3}-устойчив, но {2, 1, 3^-устойчив. Является ли он устойчивым в смысле определения 2? Достаточные условия устойчивости Л^?-исхода трудно полу- получить, и они оказываются весьма ограничительными (см. Габе, Мулен [1980], Окугучи [1976], Розен [1965]). Тем не менее если мы ослабим требование устойчивости таким образом, чтобы процедура нащупывания по Курно, начинающаяся около х*, в пределе давала г*, то тогда поя- появится возможность почти полностью описать локально устой- устойчивые М?-исходы. Определение 3 (те же обозначения, что и в определении 1). Скажем, что равновесный по Нэшу исход л;* локально устой- устойчив в игре G, если для каждого i?N существует окрестность V- точки xf, такая, что на VN = X V- выполнено предположе- ние (9) и исход л;* устойчив в усеченной игре (V;, ы;; i g N). Для того чтобы дать вычислимый критерий локальной устойчивости, предположим, что для всех i € N множество Х{ является подмножеством евклидова пространства Е{. Фикси- Фиксируем равновесие по Нэшу х*, для которого xf есть внутрен- внутренняя точка Х{ для всех ig N. Более того, предположим, что функция полезности и,- дважды непрерывно дифференцируема (С2-дифференцируема) в окрест- окрестности xf и что матрица вторых производных—^~ задает отри- цательно определенный оператор в я* (следовательно, (9) выпол- выполнено в подходящей окрестности л;*). Определим линейный оператор Т из EN= X ?; в себй: ie л/ Где все производные посчитаны в х*.
90 Ч. I. Некооперативное поведение игрокбЬ Теорема 3. Предположим, что все собственные числа опера- оператора Т по модулю меньше 1. Тогда лг*—локально устойчивый NE-ucxod. Предположим, что х*—локально устойчивый NE-ucxod. Тогда все собственные числа оператора Т по модулю меньше либо равны 1. Доказательство. Поскольку функция ¦^-L С1—ДИффереНЦИ- руема, а матрица —?~ не вырождена в точке х*, то по тео- теореме о неявной функции г; (локально в х*) есть ^-дифферен- ^-дифференцируемая функция, действующая из Х#\{/} в Х-. Следовательно, система A0) может быть локально записана как где / есть Сх-дифференцируемое отображение EN в себя. По предположению х* — неподвижная точка отображения /. Значит, из элементарного результата для динамических систем (см., например, Ортега, Рейнбольдт [1970]) получаем, что х* является локально устойчивым решением A2), если все собст- собственные числа оператора /' (х*) по модулю меньше 1. Обратно, если хотя бы одно собственное число оператора /' (л;*) по модулю больше 1, то исход х* не является локально устойчивым. Остав- Оставляем читателю проверку справедливости равенства T = f (х*). Следствие. Пусть п = 2, а множества Х± и Х2 одномерные. Предположим, что лг*—NE-ucxod в игре G = (X1( X2, uit иг), причем выполнены следующие условия! 1) х*—внутренняя точка Xt, 2) функция и{ С2-дифференцируема в окрестности х*, 6) "Z5 Тогда | dXi дХч 1 д^и; дхх дх2 получш д*и2 дхг дх2 дхг дх2 'М дх! дх] д2и2 дх\ =Фдг* локально устойчива, =&х* не является локально устойчивой A3) (все производные взяты в точке х*). В предположениях следствия множества наилучших ответов BRt являются двумя кривыми класса С1, пересекающимися в ***
Гл. ///. Равновесие по Нэшу 91 В неравенствах из A3) просто сравниваются модули накло- наклонов касательных к кривым BRt и BR2 в точке г*. Положим ' ~~ дх; дх± I дх; дх2' Тогда неравенства A3) можно переписать в следующем виде: | st | > | s21 => х* локально устойчива, |Sj| < |s2|=>x* не является локально устойчивой. Для случая б) примера 5 получается неустойчивое равно- равновесие по Нэшу, поскольку | sf | < | s, |, причем s( и s3 одного Рис.7 знака. Если | s± \ < | s21 и s(, s2 положительны, то получаем обычную нестабильность типа «паутины», изображенную на рис. 7. Если, напротив, |Sj|>|s2|, то может быть показано, что локально устойчивое равновесие по Нэшу г* является единст- единственным сложным равновесием для усеченной на достаточно малую прямоугольную окрестность г* начальной игры. Проиллюстри- Проиллюстрируем этот факт на следующем рисунке. Начинаем с игры ([аи &х], [а2, &2], щ, ы2), выбрав числа ah b; так, чтобы и{ была вогнута по х{ на [ао &х]х[а2хЬ2]. Затем замечаем, что при любом фиксированном хг?[аг, Ьг] выигрыш Mj(-, хг) возрастает на отрезке от at до /"j(a:2), затем убывает на |/i(*«)> ^]- Поскольку rt (хг) g [ct, dt] для всех *2€[а2> ^«1> то отсюда следует, что любая стратегия xt^[au ct] игрока 1 доминируется его стратегией си в то время как любая
92 Ч. I. Некооперативное поведение игроков стратегия х± € (d\, frj] доминируется стратегией а\. Отбрасывая доминируемые стратегии игрока 1, получаем игру ([с4, dj, [а2, bt], их, иг), в которой в силу аналогичных рассуждений множество недоминируемых стратегий игрока 2—отрезок [с2, d2]. Таким образом, получается редуцированная игра ([cj, dj], [с2, d2], ult н2). Если продолжить итеративно эту операцию, то \ Рис. 8 станет ясно, что множества стратегий стягиваются к устойчи- устойчивому ЛЛЕ-исходу х*, как это видно из рис. 8. Связь между локальной устойчивостью и локальной разре- разрешимостью по доминированию на самом деле является весьма общей. Скажем, что игра G локально разрешима по доминиро- доминированию в х*, если существует прямоугольная окрестность VN точки х*, такая, что усечение игры и на VN обладает следую- следующим свойством: последовательное исключение доминируемых стратегий стягивает VN в пределе к х*. Тогда в предположе- предположении теоремы 3 в работе Габе, Мулен [1980] доказано, что а) Если все собственные числа оператора Т по модулю меньше 1, то игра G локально разрешима по доминированию в х*.1) !) Это утверждение неверно, как показывает следующий пример, по- построенный В. А. Гурвичем. ^Рассмотрим игру четырех лиц с функциями
Гл. ///. Равновесие по Нэшу 93 б) Если игра G локально разрешима по доминированию в л;*, то абсолютная величина любого собственного числа опе- оператора Т не превосходит I. Замечание. На рис. 8 мы исключаем доминируемые страте- стратегии последовательно сначала у одного игрока, потом у другого. По лемме 3 гл. II (обобщенной на данный случай) получается в точности то же самое, что и при одновременном исключении. Как мы видели в упр. 6, для процедуры нащупывания по Курно это не так. Упражнение 7. Для игры трех лиц, в которой множества стратегий всех игроков одномерны, приведите почти совпадающие необходимые и достаточные условия локальной {1, 2, 3}-устойчивости, ана- аналогичные условиям теоремы 3. Упражнение 8. В детерминированном варианте войны на истощение (пункт 1 задачи 5) вычислите множества наилучших ответов BR( (в дан- данном случае они не являются кривыми размерности 1) и проана- проанализируйте устойчивость процедуры нащупывания по Курно. Обратите особое внимание на процедуру нащупывания, начи- начинающуюся из @, 0), и дайте интерпретацию этой процедуре как схеме эскалации. Далее рассмотрите вариант войны на истощение, в котором каждый игрок не может обнаружить агрессивность противника: стратегия x-t игрока i означает, что игрок i решает раз и навсегда быть агрессивным до момента t = xt. Тогда получаем игру в нор- нормальной форме: t —х1 при х2 < хи -f--*i ПРИ хг = хг. Функция и2 определяется аналогично. выигрыша, заданными следующим образом: Оператор У 3 Т для дайной игры является ортогональным, откуда следует, что все собственные числа оператора Т по модулю меньше единицы, однако игра не является разрешимой по доминированию. Утверждение будет спра- справедливым, если все элементы матрицы Т заменить их модулями.— Прим. мрев.
94 Ч. I. Некооперативное поведение игроков Докажите, что в этой игре нет Л^?-исходов и проанализируйте процедуру нащупывания по Курно. Сравните с игрой «Война на истощение». Задача 5. Устойчивость в олигополии с назначением выпусков Обобщим пример 4 за счет введения функции затрат с,- (у) на производство у единиц товара производителем i. Тогда воз- возникает игра Х, = [0, +оо), ui(x)^=xip(x)-ci(xi), i?N. На функцию р наложим ограничения G). О функциях с{ мы просто предположим с- > 0. Значит, затраты на выпуск единицы продукции могут быть воз- возрастающей, убывающей или вообще немонотонной функцией величины у. Пусть у каждого игрока затраты на выпуск единицы про- продукции возрастают или не слишком сильно убывают в следую- следующем смысле: С](У)>2Р'(У) + УР"(У) при у^О, 1=1, ..., п. A4) Покажите, что существует по крайней мере один NE-исхож- 2) С этого момента предположим существование NE-исхо- да х*, не требуя обязательного выполнения A4). Докажите, что исход х* локально устойчив, если выполнены следующие неравенства: с\ (xf) > (n-З) | р' (х*)| + (п-2) |р" (х*) \-xf. Указание. Полагая р' G*)+р" G*) • xf Pi = 2р> G*) + р" G*) • xf- с- (xf) ' докажите, что 0<р,<1 при всех t = l, ..., п (принимая во внимание, что п ^2). Далее заметьте, что собственное число К оператора Т либо равно —р,- для некоторого i = 1, ..., п, либо является решением уравнения 3) Пусть все игроки идентичны {с{ = с для всех i=l, ...,/г) и а;*—равновесие по Нэшу на диагонали: xf = xf = у*. Дока- Докажите утверждение, обратное сформулированному в п. 2. Если
/л. ///. Равновесие по Йэшу 95 выполнены неравенства 2р' + У*-Р" <с" < (п—3)\р'\ + (п—2)-у*-\р"\ (где все р' и р" взяты при х* = пу*, а с" взята в у*), то X* не является устойчивым Aff-исходом. Заметьте, что для NE- исхода х* выполнено неравенство 2р' -f- у*р" < с", поскольку функция ut от аргумента х( достигает максимума в точке х*. Следовательно, устойчивость исхода х* всегда имеет место для /г = 2 и требует выполнения все более жестких условий с ростом п. Задача 6 1) Докажите, что в игре агентов по продаже автомобилей (задача 2) нулевой М?-исход не устойчив. 2) Для ненулевого М?-исхода докажите, что оператор, опре- определенный по формуле A1), всегда имеет собственное число, рав- равное 1. Используя ту же технику, что и в задаче 5, докажите, что этот исход не является локально устойчивым, если по крайней мере для двух агентов выполнено неравенство с/ 3) В случае /г = 2 докажите непосредственно (т. е. найдя BRi и BR2 и нанеся их на рисунок), что ненулевой М?-исход устойчив. Аналогично проанализируйте устойчивость М?-исхода в дуополии с назначением выпусков из упражнения 4. Задача 7. Процедура нащупывания по Курно в непрерывном времени (Мулен [1977]) Пусть G = (Xit ut\ i?N) — игра п лиц, в которой каждое множество стратегий одномерно. Пусть ф—действительная функ- функция, определенная на R, причем ф @) = 0, ф' (t) > 0 при t € R. Допустим, что функция и{ дважды непрерывно дифферен- дифференцируема на XN при всех i € Л^. Рассмотрим следующее диффе- дифференциальное уравнение на XN: -?j- = ф (г, (xi)—х() для всех i € N. A5) 1) Дайте интерпретацию этого уравнения как непрерывной Версии процедуры нащупывания по Курно. 2) Любой Л/?-исход а;* игры G является неподвижной точ- точкой A5). Найдите почти совпадающие необходимые и достаточ- достаточные условия (выраженные в терминах оператора Г) того, что
. /. Йекаоператиёное Поведение игроков х*—устойчивое решение A5) (т. е. найдется окрестность V точ- точки х*, такая, что система A5) с начальным условием из V порождает траекторию, которая не покидает V и сходится к х*). Докажите, в частности, что если х*—локально устойчивый NE-исхож (определение 3), то он является устойчивым реше- решением A5). Приведите пример, показывающий, что обратное утверждение не верно. Задача 8. Локальная дилемма заключенного (Мулен [1979]) 1) Фиксируем nxn-матрицу A = [aif]u/=l „ и предполо- предположим, что аиф0 при всех t = l, ..., п. Для данных Xt > 0, ..., Я„ > 0 обозначим через G (А; X) игру (У, (%i), u{; i = 1, ..., п), где всех t = 1> •••» п> "«1 • • • = А- • В игре G (А; X) каждый игрок имеет единственную домини- доминирующую стратегию. Обозначим через х (X) ? YN (X) равновесие в доминирующих стратегиях. Докажите, что следующие четыре утверждения эквивалентны: 1) Для всех % > 0 исход х (к) не является оптимальным по Парето в G (А; X). 2) Для некоторого X > 0 исход х (X) не является оптималь- оптимальным по Парето в G (А; %). 3) Существует вектор x^R", такой, что .. /.л ^л } Для всех i==l п, гдев, = @, .... 0, 1, 0, .... 0)€К". т 4) Не существует таких р, q^= 0 (pt, 17,^0 н не равны нулю одновременно), что п 2 pflij — qflLi-j для всех / = 1, ..., п. Когда все эти условия выполнены, скажем, что линейные пла- платежи А индуцируют дилемму заключенного. 2) Рассмотрим теперь игру в нормальной форме G—(Xl, и4; i—\, ..., п), где Xt—открытые интервалы на действительной прямой, а щ—непрерывно дифференцируемая функция, задан*
Гл. III. Равновесие по Нэшу 97 ная на XN, Пусть дан исход x?XN, такой, что тр- ф0 для всех i = 1, ..., п. Скажем, что игра G имеет локальную дилемму заключенного в точке х, если матрица ,, * . индуцирует дилемму за- а [Xi, ..., хп) ключенного. Дайте интерпретацию этому определению на основе результатов первой части задачи. В олигополии с назначением выпусков из примера 4 найдите исходы, в которых возникает локальная дилемма заключенного. 3) В дополнение к предположениям п. 2 будем считать, что п = 2. Докажите, что игра G обладает локальной дилеммой заключенного в х тогда и только тогда, когда справедлива следующая система неравенств: xx dx2 dx2 dxt где все производные берутся в точке х. Докажите, что в случае «общего положения» любая окрест- окрестность ЛЛЕ-исхода или исхода, оптимального по Парето, пере- пересекается с областью A6) (дайте точное определение «общего положения»). Изобразив графически область A6) для двух моделей олиго- олигополии из примера 5, докажите, что область A6) лежит «между» #?-исходами и границей Парето. До какой степени эта конфи- конфигурация является общей? Как условие A6) обобщается на слу- случай /г = 3? Для произвольного целого п? ЛИТЕРАТУРА Берж (Berge С.) ^1957J Espaces vectoriels topologiques, Paris, Dunod. абе, Мулен (Gabay D., Moulin H.) 11980] On the uniqueness and stability of Nash equilibrium in non cooperative games, in Applied stochastic control in econometric and management science, Bensoussan, Kleindorfer, Tapiero Eds., Amsterdam, North- Holland Publishing Co. Грот (Grote J.) [1974] A global theory of games. Journal of Mathematical Economics, 1,3, 223—236. Кейз (Case J. H.) A979] См. литературу гл. 1. 4 № 563
98 Ч. I. Некооперативное поведение игроков Милгром, Вебер (Milgrom P., Weber R. J.) [1980] Distributional strategies for games With incomplete information. The Center for Mathematical Studies in Economics and Management Scie- Science, Northwestern University. Мулен (Moulin H.) [1979] On the asymptotic stability of agreements. In Systemes dynamiques et modeles economiques. G. Fuchs ed. Paris. CNRS. [1979] Two and three person games: a local study. Internationa! Journal of Game Theory, 8, 2, 81 — 107. [1981] Deterrence and cooperation. European Economic Review, 15, 179—193. Нэш (Nash J. F.) [1951] Non cooperative games, Annals of Math. ,54, 2,286—295. [Имеется перевод: Нэш Дж. Бескоалиционные игры. В сб. Матричные игры. /Под ред. Воробьева Н. Н. — М. : Физматгиз, 1961.] Окугучи (Okuguchi К.) [1976] Expectations and stability in oligopoly models. Lect. Notes in Econ. - and Math, systems, 138, Springer Verlag Ортега, Рейнбольт (Ortega J. M. , Rheinboldt W. C.) [1970] Iterative solution of non-linear equation in several variables. New York, Academic Press. *Партхасаратхи, Рагхаван (Parthasarathy Т., Raghavan Т. E.S.) [1971] Some topics in two-person games. New York, American Elsevier, [Имеется перевод: Партхасаратхи Т., Рагхаван Т. Некоторые вопросы теории игр двух лиц.—М.: Мир, 1974.] Розен (Rosen J. В.) [1965] Existence and uniqueness of equilibrium points for concave iV-person games. Econometrica, 33, 520—533. Рэнд (Rand D.) [1978] Exotic phenomena in games and duopoly models, Journal of Mathe- Mathematical Economics, 5, 2, 173—184. Шеллинг (Schelling T. C.) [ 1979] Micromotives and macro-behaviour, New York, Norton Publ. 11971] The strategy of conflict. Cambridge (USA), Harvard University Press, •Звездочкой отмечены работы, добавленные при переводе.
ГЛАВА IV СМЕШАННЫЕ СТРАТЕГИИ В некоторых играх в нормальной форме, хотя каждый игрок может выбирать по желанию любой элемент из своего мно- множества стратегий, тем не менее рациональное поведение заклю- заключается в добровольной рандомизации собственного выбора. Это порождает известную неопределенность в выборе стратегии игрока и вызывает реакцию остальных, которая может оказаться ему выгодной. . Рандомизация поведения требует держать в секрете действи- действительно выбранную стратегию (т. е. игроки должны определять стратегии независимо и одновременно). Рандомизация модели- моделирует блеф и отражает идею вездесущности оптимальных страте- стратегий. «Хитрить —это значит внушать, что действуешь таким-то образом, или в таком-то месте, в такой-то момент, тогда как в действительности все происходит по-другому. Это, следователь- следовательно, своего рода потенциальная вездесущность, как всегда было известно и отмечалось ранними авторами, говорившими о стра- стратегии. Ксенофонт писал, что знание того, что где-то находится отряд противника без знания его местоположения и сил, раз- разрушает безопасность и все места неизбежно становятся подо- подозрительными» (Гильбо [1968]). Допуская использование смешанных (рандомизированных) стратегий и предполагая, что игроки ориентируются на функции полезности в смысле фон Неймана и Моргенштерна, мы полу- получаем смешанное расширение исходной игры. При этом могут появиться новые равновесные по Нэшу исходы. Если исходные множества стратегий конечны, то смешанное расширение игры всегда имеет непустое множество равновесий по Нэшу (разд. 2). Если исходные множества стратегий бесконечны, то возни- возникают определенные топологические трудности. Компактности множеств стратегий и непрерывности функций выигрыша тем не менее оказывается достаточно для того, чтобы гарантировать существование по крайней мере одного М?-исхода (разд. 3). 4»
100 4. I. Некооперативное поведение игроков 1. СМЕШАННОЕ РАСШИРЕНИЕ ИГРЫ Пример 1. Игра де Монмора В конце 18-го века французский математик Рене де Монмор рассмотрел следующую ситуацию. Для того чтобы сделать подарок своему сыну, отец предлагает: «Я возьму золотую монету в правую или левую руку, а ты назовешь одну из них. Если монета у меня в правой руке и твоя догадка правильна, то ты получишь одну золотую монету. Если же монета у меня в левой руке и твоя догадка правильна, то ты получишь две монеты; в противном случае ты не получишь ничего». Затем Монмор спрашивает, во сколько следует оценить для сына этот подарок, принимая во внимание, что «если в этой игре игроки одинаково проницательны и наблюдательны, то нет возможности выработать правило поведения», т. е. не существует оптимальной стратегии в этой игре1). Наша игра 2x2 двух лиц с нулевой суммой такова: Сын- 2 0 0 1 Числа показывают выигрыш сына Отец В этой игре нет цены /supinf« = O, infsupM=lY Ни у одного из игроков нет оптимальной стратегии. Как в любой игре двух лиц с нулевой суммой, не имеющей цены, выясне- выяснение, какую стратегию использует противник, позволит добиться хорошего результата за счет использования оптимальных отве- ответов (см. гл. I, разд. 3). Следовательно, возникает борьба за второй ход, в которой каждый игрок желает скрыть свой окон- окончательный стратегический выбор и в то же время разведать намерения противника. Но даже глубочайшей секретности недо- недостаточно для того, чтобы не позволить противнику угадать стратегический выбор. Если игрок производит выбор на основе детерминированных дедуктивных рассуждений, то его разум- разумный противник может восстановить саму цепь рассуждений (см. замечание 1 разд. 1 гл. III). 1) На самом деле, современник Монмора Джеймс Уолдгрейв предложил в аналогичной игре использовать смешанные стратегии. Не ясно, однако, имел ли он хотя бы интуитивные представления об оптимальных смешанных стратегиях (см. исторический очерк Райвз [1975]).
Гл. IV. Смешанные стратегии 101 Естественный способ сделать собственный выбор непредска- непредсказуемым состоит в том, чтобы сделать его случайным: вместо выбора так называемой чистой стратегии х± из множества {L, Д\ сын может использовать рандомизированную стратегию цх, вы- выбирающую значения L и R соответственно, с вероятностями ри 1 — p-i. Представим себе, например, что сын изготавливает монету, которая с вероятностью р1 выпадает на одну сторону, и использует эту монету для выбора своей оптимальной стра- стратегии. Предположим теперь, что отец не может видеть броса- бросание монеты. Отсюда следует, что стратегия отца, является ли она случайной величиной или нет, не может коррелировать со стратегией сына и, значит, ожидаемый выигрыш, соответствую- соответствующий так называемой смешанной стратегии ци не менее inf \2plt Выбирая Pi = -g-, сын гарантирует себе ожидаемый выигрыш не менее 2/3. Рассмотрим теперь ситуацию с точки зрения отца. Применяя стратегии L и R соответственно с вероятностями рг, 1 — р2, он гарантирует себе проигрыш не более величины sup{2p2, 1 — /?,}. Выбирая рг = ^ > отеЦ гарантирует, что ожидаемый проиг- проигрыш будет не больше 2/3. Итак, мы заключаем, что внесение тактической неопределенности в стратегический выбор приводит к цене 2/3, которая является разумной оценкой щедрости отца. Упражнение 1 Используйте аналогичные рассуждения для игры «раз — два—три» (пример 4, гл. I). Докажите, что если игроки ис- используют рандомизированные стратегии, то цена игры равна 6/1 h Определение 1. Пусть G = (X,-,«,•; i?N) — игра в нормаль- нормальной форме, в которой X,- — конечные множества при всех!(;Л[. Смешанной стратегией игрока i называется вероятностное распределение ц,- на X,-. Следовательно, множество М( смешан- смешанных стратегий 1-го игрока есть единичный симплекс в R*<. Смешанным расширением игры G называется игра в нор- нормальной форме Gm = (М,-, ы(; i g N), где для всех ц € MN й, (ц) = 2 "j (*) Hi (*i) ^ (*i). •••.!*» (*„). (Ц XGXN В смешанном расширении Gm игры G стратегия игрока i есть вероятностное распределение (г,- на Х{. Под этим подра- подразумевается, что игрок i конструирует собственную лотерею, в которой стратегия xt g X{ выпадает в соответствии с fi,-. To, что лотерея его собственная, означает, что только игрок i знает
102 Ч. I. Некооперативное поведение игроков стратегию х{, которая действительно выпала в лотерее (даже если остальные игроки, возможно, знают вероятностное распре- распределение \it). Более того, лотерея 1-го игрока стохастически не зависит от лотереи /-го игрока при всех j, j Ф i (таким обра- образом, игрок / не может получить никакой информации о лоте- лотерее t-ro игрока на основе наблюдения своей собственной лотереи). Поскольку случайные переменные независимы в совокуп- совокупности, то U; (fi) есть ожидаемый выигрыш игрока I. Принимая щ за функцию выигрыша игрока i в игре Gm, мы тем самым считаем, что игрок i сравнивает различные лотереи ц на ц', попросту сопоставляя связанные с ними математические ожи- ожидания выигрыша и,- (ц) и U; (ц'). Другими словами, и{ есть функция полезности по фон Нейману—Моргенштерну, которая распространяет предпочтения игрока i на все возможные лоте- лотереи на XN. Дальнейшие обоснования этого предположения относятся к теории статистических решений и здесь не будут рассматриваться (см. Льюс, Райфа [1957]). Теперь существен- существенно, что функция щ (х) принимает действительные значения, в то время как в предыдущих трех главах важны были только отношения предпочтения, индуцированные функциями ut на Х#. Чистая стратегия xt g Xt игрока i в исходной игре будет отождествляться со смешанной стратегией Ьх. € Mh выбираю- выбирающей xt с вероятностью 1: В самом деле, из формулы A) сразу следует, что "гF*) = Щ (х) для всех x?XN и bx = (bx.)ieN. Поэтому будем рассматривать Х( как подмножество Mh а щ — как расширение ы; с Хы на М Теорема 1. Если Xt—конечное множество для всех i^ множество равновесных по Нэшу исходов в игре Gm является непустым компактным подмножеством множества Мц. Более того, оно содержит множество равновесных по Нэшу исходов в игре G: ^0. B) Доказательство. Выберем любой равновесный по Нэшу исход х в G. Обозначим
Гл. IV. Смешанные стратегии 103 и заметим, что sup ы,(^, 6\J = sup b) M ' x up поскольку Mt — выпуклая оболочка Xt (множество Xt отожде- отождествлено с подмножеством множества M.t) и функция щ линейна по переменной ц{. Теперь в силу того, что исход х есть равновесие по Нэшу, имеем sup и{ {yh xi) = щ {х) = и{ (Ьх , ЬХг). yeX Объединяя эти утверждения, получаем, что бх есть ЛШ-иа» ход в игре Gm. Заметим далее, что игра Gm удовлетворяет предположениям теоремы Нэша (теорема 2, гл. III). А именно, М{ является выпуклым и компактным в Rx', u{ непрерывна на MN и линей- линейна относительно переменной ц,. Доказательство теоремы 1 за- завершено, Щ В качестве следствия леммы 1, гл. IV получаем, что все #?-исходы в игре Gm со смешанными стратегиями являются индивидуально рациональными в Gm. На самом деле они также являются индивидуально рациональными в исходной игре G, как показывает следующий результат Лемма 1. Гарантированный выигрыш игрока i в исходной игре не больше его гарантированного выигрыша в смешанном расширении игрых для всех i?N sup inf щ (xit xi) ^ sup inf ul(u^, цг). ?$) Доказательство. Фиксируем игрока i € W, чистую стратегию Xj € X, и для каждого / € N\{i} некоторую смешанную страте- стратегию Цу € М/. Тогда ut F*, цг) есть математическое ожидание функции щ(х{, ')?R.X, (сужение ut на Xj для фиксированного х.) относительно произведения вероятностных мер ® цу на Xt, an/sin Следовательно, имеем inf щ {Xf, xt) < щ (ЬХ(, [щ). Это неравенство справедливо для всех ц, g Mt, поэтому ini u( (xit xi) ^ inf ut (ЬЯ{, ^t) ^ sup inf ut (ц1г y.t).
104 Ч. I. Некооперативное поведение игроков Поскольку выбор Х[ произволен, доказательство леммы 1 за- завершено. Применяя полученные выше результаты к играм двух лиц с нулевой суммой, сформулируем Следствие из теоремы 1 и леммы 1. Пусть для данной игры G = (Xit X2, ut) с нулевой суммой, в которой множества Л1, Хг конечны, игра с нулевой суммой Gm = (M1, Мг, щ) является ее смешанным расширением. Тогда игра Gm имеет по крайней мере одну седловую пару и цену, которую мы назовем ценой игры Gm (или ценой игры в смешанных стратегиях) и обозна- обозначим vm(u1). Более того, sup inf u1(x1, ^<«e(Hi)< inf sup ux (xu хг). D) X, хгеХг xitXtXteX, Предположим сначала, что исходная игра G имеет цену и у каждого игрока имеется оптимальная в игре G стратегия. Тогда смешанное расширение игры G имеет ту же цену и про- произвольные выпуклые комбинации оптимальных стратегий в игре G являются оптимальными стратегиями игроков в игре Gm (см. задачу 2, п. 1). Предположим напротив, что игра G не имеет цены и, сле- следовательно, у игроков нет оптимальных стратегий. В игре Gm каждый игрок имеет по крайней мере одну оптимальную сме- смешанную стратегию, и цена игры лежит на отрезке Г sup inf и1, L *i х, inf sup иЛ. (В «общем положении» в обеих частях D) имеют Хг X, J место строгие неравенства, см. задачу 1 ниже.) Типичным при- примером является игра Монмора (пример 1) со смешанной ценой 2/3 и оптимальными осторожными стратегиями обоих игроков (т^ + Т #) • См. также разд. 2, в частности упражнения 7, 8. В качестве еще одной иллюстрации к теореме 1 рассмотрим дилемму заключенного (пример 1 гл. I). В смешанном расширении этой игры агрессивная стратегия по-прежнему является единственной доминирующей стратегией для каждого игрока, поэтому NE(G) = iVjB(Gj. Наш последний пример демонстрирует возможность следую- следующей ситуации: Пример 2. Смешанные стратегии в игре «перекресток» В'игре «перекресток» (пример 2 гл. III) имеются два NE- Исхода в чистых стратегиях. В смешанном расширении возни*
Гл. IV. Смешанные стратегии 105 кает еще один #?-исход, а именно пара (ц$, \if): fifr^ E6+6 гДе 5) &i Фи)—смешанная стратегия, при которой с вероятностью 1 игрок проезжает перекресток (останавливается). Имеем В силу линейности ut относительно ц/ получаем «i(j*it |i*) = «iUi*. V*) Для всех Hi Меняя ролями игроков 1 и 2, в силу симметрии игры получаем «а №*> Ш) = «2 (Ц*» И*) ДЛЯ ВСеХ J Отсюда следует, что ([if, \if) — NE-исхоц в смешанном рас- расширении игры «перекресток». На самом деле мы обнаружили нечто большее: если игрок / использует стратегию ц*, то игро- игроку i безразлично, какую выбрать стратегию. Следовательно, равновесная стратегия игрока i создает как раз такой уровень неопределенности, что все ходы игрока / неразличимы для него по выигрышу. Это свойство рассмотренной игры не является редким. В разд. 2 мы покажем, что это необходимое свойство всех вполне смешанных NE-исходов, т. е. таких исходов, в ко- которых вероятность того, что данный игрок выберет любую данную стратегию, не равна нулю. Вполне смешанные равно- равновесия не только легко интерпретируются, но и легко вычис- вычисляются (см. лемму 3, разд. 2). Заметим пока, что в отличие от двух WjE-исходов в чистых стратегиях (вполне) смешанный М?-исход доминируем по Па- рето (соответствующий ему вектор выигрышей (l — WZT * 1—д— доминируется вектором выигрышей A, 1)). Однако ситуация (\if, \if) симметрична (fi* = ц*) и равноправна («* = и*), поэтому она может быть рекомендована с нормативной точки зрения. На самом деле в симметричных играх всегда существует сим- симметричное равновесие по Нэшу в смешанных стратегиях-
106 Ч. I. Некооперативное поведение игроков Упражнение 2. Пусть (Х{, и{; i?N)—симметричная игра: Х1 = Х/ для всех i, j?N, и{(х{, xNS{t.ih Xj) = Uj{Xj, xNs{i, i), xt) для всех», j?N, x?XN. Докажите, что смешанное расширение имеет по крайней мере один симметричный МЕ-исход щ Hi = Цу для всех i, j ? N. Указание. Следуйте доказательству теоремы 2 гл. II, положив Ф(ц, v) = «1(fi1, v/)—Mj(v) для всех ц, x&MN. Упражнение 3, в котором равновесная по Нэшу стратегия не является осторожной Мы уже знаем (примеры 2 и 3 гл. III), что М?-стратегия может не быть осторожной. Здесь мы покажем, что то же самое может случиться и в играх со смешанными стратегиями. Рас- Рассмотрим игру G 2x2: Игрок 1 Игрок 2 Докажите, что в смешанном расширении игры G каждый игрок имеет единственную осторожную стратегию ^ и сущест- существует единственный iVf-исход (ц", Цг). Проверьте следующие соотношения: 0 1 2 0 2 0 1 1 Дайте интерпретацию. = "i И, цУ) = "i 04,1*8)- Упражнение 4. Пример блефа Имеются две карты—старшая и младшая. Игрок 1 с рав- равной вероятностью вытаскивает одну из них, причем делает это в тайне от игрока 2. Затем он решает: либо дать доллар вто- второму игроку, либо играть дальше. В последнем случае игрок 2 принимает решение: либо спасовать, и тогда он дает доллар игроку 1, либо играть дальше. В последнем случае карта иг- игрока 1 открывается и игрок 2 платит 4 доллара игроку 1, если это оказалась старшая карта, в противном случае игрок 1 пла- платит 5 долларов игроку 2.
Гл. IV. Смешанные стратегии 107 Смоделируйте эту игру двух лиц с нулевой суммой в нор- нормальной форме и вычислите оптимальные смешанные стратегии обоих игроков и цену игры в смешанных стратегиях. Упражнение 5. Игра двух лиц с нулевой суммой и линей- линейное программирование Для игры G = (Xlt Х2, Mj) докажите, что решение задачи линейного программирования max a ц, ? Мь а < их (ц1( 6*,) для всех хг ? Х2 F) относительно переменных (а, цх) дает цену игры в смешанных стратегиях и оптимальную смешанную стратегию игрока 1. Что можно сказать о задаче, двойственной к F)? Задача 1. Смешанные стратегии в игре двух лиц с нулевой суммой выгодны обоим игрокам Пусть (Xt, Х2, «j)—игра двух лиц с нулевой суммой без цены: sup inf ut — aY < a2 = inf sup uv Xt Xt Xt X, 1) Предположим, что для любой фиксированной чистой стра- стратегии х{ ? Х{ отображение Xj —* ut взаимно однозначно на Ху ({'» /} —{^>2}). Докажите, что цена ym(Mt) принадлежит откры- открытому интервалу (йи а2). 2) Приведите пример (с нарушением предположения о вза- взаимной однозначности), в котором sup inf «j = vm (и,) < inf sup u±. X, Xj Xt *i Задача 2. 1) В предположении, что игра двух лиц G — (Xit Xt, щ) имеет цену, докажите, что любая выпуклая комбинация опти- оптимальных стратегий в игре G является оптимальной стратегией в игре Gm. Приведите пример, показывающий, что обратное утверждение не верно. 2) Пусть теперь G = (X,-, u{; i?N)—игра в нормальной фор- форме. Покажите на примере, что недоминируемая чистая страте- стратегия х{ игрока I в игре G (я, € ®,- («,•)) может быть доминируе- доминируемой в игре Gm. 3) Докажите, что если х{—доминируемая стратегия игро- игрока i в игре G (#,-<? й>, (и,)), то в игре Gm найдется по край- крайней мере один МЕ-исхоа ц, в котором игрок i не использует стратегию х{:
108 Ч. I. Некооперативное поведение игроков 4) Докажите, что если игрок i имеет доминирующую стра- стратегию fi,- в игре Gm (H|€^i(«i)). тогда все чистые стратегии х{, такие, что \i{ (я,) > 0, эквивалентны и на самом деле являются доминирующими в игре G {xi^.Di (ut)). Задача 3. Взаимозаменяемость смешанных NE-исходов в играх двух лиц (Партхасаратхи, Рагхаван [1971]) В смешанном расширении Gm = (Mit Мг, щ, и2) игры двух лиц AfjE-исходы, вообще говоря, не являются взаимозаменяе- взаимозаменяемыми: из щ ц'€ ME (GJ не следует (ц4) ц'2>), (ц'и yLj?NE(Gj. Такая ситуация имеет место, например, в смешанном расши- расширении игры «перекресток» (см. пример 2 выше). 1) Докажите, что Л^?-исходы игры Gm взаимозаменяемы тогда и только тогда, когда множество NE(Gm) является выпуклым подмножеством Rx<xlRX2 (множества Х{ предпола- предполагаются конечными). 2) В предположении, что NE (Gm) выпуклое (и, следова- следовательно, в силу 1) прямоугольное) подмножество множества MtxM%, докажите существование по крайней мере одного сме- смешанного #?-исхода ц*, который либо доминирует по Парето любой другой смешанный NjE-исход, либо имеет такой же век- вектор выигрышей: /=1,2. 2. ВЫЧИСЛЕНИЕ РАВНОВЕСИЙ ПО НЭШУ В СМЕШАННЫХ СТРАТЕГИЯХ Определение 2. Пусть Xt — конечное множество стратегий игрока i, i (* N. Для произвольной смешанной стратегии ц; ? М{ обозначим через [ц,] носитель цо т. е. множество чистых стра- стратегий игрока (', которые входят в ц/ с положительной вероят- вероятностью: Скажем, что смешанная стратегия fi; является вполне смешан- смешанной, если ее носитель есть все множество (чистых) стратегий, т. е. [[д,;] = Х;. Назовем исход ц в игре Gm вполне смешанным, если ц{—вполне смешанная стратегия при всех i?N. Теорема 2. Предположим, что исходная игра G = (Xit щ; i^N) имеет конечные множества стратегий. Пусть ц? ?NE(Gm)—равновесие по Нэшу в смешанных стратегиях. Тогда справедлива следующая система равенств: «|(в*,, |i/) = «/(|i). G)
Гл. IV. Смешанные стратегии 109 Доказательство. Фиксируем i?N. Тогда по определению ситуации равновесия по Нэшу имеем M6V R) ^ "«'0х) Для всех Предположим, что хотя бы одно из этих неравенств строгое; Умножая все неравенства из (8) на \i; (xt) и учитывая, что Mi (*?) > 0. получаем 0») = «/М- Полученное противоречие доказывает, что все неравенства в (8) на самом деле обращаются в равенства. Щ Согласно теореме 2, равновесие по Нэшу в смешанных стра- стратегиях ц обладает следующим свойством: любая смешанная стратегия ц'с с тем же носителем, что и ц,-, является наилучшим ответом игрока i на \ii. В частности, если ц есть вполне сме- смешанное равновесие, то любая стратегия игрока i является наилуч- наилучшим ответом на набор \it равновесных стратегий остальных игроков. Следовательно, в игре двух лиц в состоянии вполне смешанного равновесия игрок i выбирает стратегию, которая уравнивает выигрыши игрока / при всех его (смешанных) стра- стратегиях. Эта стратегия не зависит от функции выигрыша игро- игрока i. Этот факт проиллюстрирован на разобранном выше при- примере 2 и в лемме 3 (она будет приведена ниже). В то же время в игре с тремя по крайней мере игроками стратегии вполне смешанного равновесия должны определяться совместно, причем р{ зависит от платежной функции щ в силу системы G). Теорема 2 является основным инструментом, позволяющим вычислять исходы равновесий по Нэшу в смешанных страте- стратегиях. В самом деле, предположим, что мы ищем исход ц? g NE (Gm), считая носители всех стратегий ц,- заданными, т. е, [,*,] = У,с:Х„ t€W. (9) Тогда система G) переписывается в следующем виде: W € W V*,, У{ е Y; Щ (б,,, fif) =й, [6tl, fif). A0) Система A0) дает 2A^1 — 1) независимых одномерных урав- 16 N нений. В силу (9) каждая стратегия nt состоит из (|У,-1—1)
ПО Ч. I. Некооперативное поведение игроков независимых переменных I принимая во внимание условие 2 ц,- (*,•) = 1V Эти простые рассуждения могут быть сущест- существе у,. / венно развиты. Они приводят к следующему утверждению. Фиксируем X,-, i g N; тогда существует открытое всюду плотное подмножество Q из (RX^)N, такое, что для всех набо- наборов (m,)i6a/ из Q и всех прямоугольных подмножеств YN = = X У. из Хд, система (9), A0) относительно неизвестных ц{ g M;, *6 Л/ i € N, имеет не более одного решения. Поскольку XN имеет конечное число прямоугольных под- подмножеств, то отсюда следует, что если (и,-);ел/ принадлежит Q, то соответствующая игра Gm имеет конечное число N Е-нсходов: NE(Gm) в «общем положении» конечно (при (ы,),-6л/ из Q), Когда множества стратегий Х(, i g N, содержат (очень) малое число элементов, то следующий алгоритм позволяет пол- полностью определить NE(Gm). Фиксируем прямоугольное подмно- подмножество Yn из XN. Решаем систему (9), A0) относительно пере- переменных ц{ g М{ для всех i g N Для каждого решения \х нужно проверить остальные неравенства V« g N Va;,- € Х{ \ Yt п, (б,., щ) < щ (ц{, щ). Биматричные игры Для игр двух лиц описанные выше вычисления становятся более наглядными при использовании матричного представле- представления, которое мы уже описывали для простых примеров. Выиг- Выигрыши игрока i теперь заданы матрицей где Xj—множество строк, а Х2—множество столбцов. Смешан- Смешанная стратегия цх € М, есть вектор-строка а смешанная стратегия ц2 € М8 есть вектор-столбец Выигрыш игрока I есть обычное матричное произведение Предположим, что (fij, ц2)—вполне смешанный NE-жхоц. Тогда система A0) принимает вид
Гл. IV. Смешанные, стратегии 111 где v{ = fijt/;fi2 есть iVjE-выигрыш игрока i, a ±xt (соответст- (соответственно Цх,) — вектор-столбец (вектор-строка), все компоненты которого равны 1. Лемма 2. Пусть |ХХ| = |Х, | и Uv У2—две невырожденные XjXXj матрицы. Тогда если игра G — (XV Х2, Ult Ut) имеет вполне смешанный NE-ucxod (fa, ц2), то он единствен и за- задается так: '-1. 2- A2) Обратно, если векторы fa, ц2 удовлетворяют A2) и все их компоненты неотрицательны, то пара (ц1г ц2) является сме~ шанным NE-исходом в игре G. Доказательство. Умножая первое уравнение в A1) на t/j, получаем fi2= i^L^Hx,. Умножая последнее равенство на 1^,, имеем 1 = 1х,-М'2=;уДх!УГ1^х1, следовательно, число ух отлично от нуля и равно l/ix^lix,- Обратное утверждение доказы- доказывается также легко: из A2) выводим A1), поэтому I Mi^iM^ —Mi^iM1* для всех ц'^М^ \ ^1^А = ^1^2|Л2 для всех \h&M2. Заметим, что (fa, ц2) — вполне смешанный Л^?-исход только при условии, что все его компоненты положительны. Система A2) этого не гарантирует. Для вычислительных целей лучше пред- представлять равновесные выигрыши в A2) следующим образом: где Uc (xu х^ обозначает алгебраическое дополнение элемента (xlt хг) в матрице U. Часто приходится довольствоваться утверждениями для слу- случая «общего положения», т. е. верными для почти всех игр. Определение 3. Пусть множества стратегий игроков Xt и Х2 конечны. Скажем, что некоторое свойство Р выполнено почти для всех игр, определенных на XtxX2, если множество [(uuuJ?Rx**x»xRx**x*\Jifla игры (Хх, Х2, alf и,) не выполнено Р\ имеет меру Лебега, равную нулю, и содержится в некотором замкнутом подмножестве без внутренних точек пространству
112 Ч. I. Некооперативное поведение игроков хг (снабженного обычной топологиейI), Теорема 3. Пусть Хг и Х%—заданные конечные множества. Почти для всех игр, определенных на ХххХг, выполнено сле- дующее\ множество равновесий по Нэшу в смешанных стратегиях конечно8) и для любого равновесного по Нэшу исхода игры в смешанных стратегиях (цх, ц3) € NE (Gm) множества [[%] и ] состоят из одинакового числа элементов. Доказательство. Напомним, что система из k векторов {е1( ..., ек\ пространства R" называется аффинно независимой, если система из k — 1 векторов {ej—ek, ..., ей_х — ek\ линейно независима в R". Будем говорить, что игра регулярна, если выполнено сле- следующее условие: для любых ^cXj и /acXj 1) система из |/J векторов ы{>(л;1) = (ыг (хи х2))*2 s/2 (*i € Л) имеет максимальный аффинный ранг в R/z, A4) 2) система из |/3| векторов ик(хг) = (и2(хи xi))Xliil(xt^I^ имее-т максимальный аффинный ранг в R{. Ясно, что почти все игры, определенные на Х1хХ$, являются регулярными в смысле условия A4). Пусть игра (Xj, Х2, и1( ы3) регулярна и (ци ц2) g NE (Gm) — равновесие по Нэшу в смешанных стратегиях. В силу свой- свойства G) теоремы 2 для любого фиксированного элемента xl € [[а2] выполнено _ Vx2 € [щ] «i <M-i. 8х,) = "i (М-г» б^о), или / 2 й. (хи хг) [гх (хх) = 2 ы2 (xt Итак, | [ца] | векторов Ыз1 (х2) [хг € Г^2]) лежат в одной и той же гиперплоскости пространства Ш^. Если бы в [(xj содержалось меньше элементов, чем в [ц2], то это противоречило бы регу- регулярности в смысле A4). Таким образом, | [ц2] | ^ | [fix] j. Аналогичным образом из теоремы 2 вытекает, что ItHill^ILl*»]!- Следовательно, |[[ij| — — I Ци-al I- Осталось доказать, что множество NE(Gm) конечно. Если бы оно было бесконечно, то нашлись бы две пары по Нэшу смешанных стратегий (ци |.i2) и (\i'u |%), такие, что (Hi, 14)^0*1, 1*1). х) Напомним, что в R" существуют замкнутые подмножества без внут- внутренних точек, мера Лебега которых отлична от нуля (и даже такие, допол- дополнение к которым имеет меру не более произвольного е > 0). 2) К тому же нечетно (см. Харшаньи [1975J).
Гл. IV. Смешанные стратегии ИЗ Пусть, например, цх Ф щ. Выберем произвольный элемент х% € [ft,,]. В силу свойства G) теоремы 2 имеем = И, Однако |[[ij]| векторов и»**'1 (xg), *2€[[i2] имеют по предполо- предположению максимальный аффинный ранг в RIm.i1, другими словами, (| Ы1-1) векторов (и^1 (х,)-1№] (дй)), хг g |>J \ *S имеют максимальный линейный ранг, равный j [ji,] |—1 (напомним, что 1Ы1 = |[М1)- Между тем цх, ni€Afi и щ^И*. поэтому век- векторы [ij и [х( линейно независимы. Итак, в силу условия A5) получаем, что ранг системы век- векторов {(ulfJ (х2)-и1Г] D))\х,еШ ч 4 не больше [[щ] |-2. Полу- Полученное противоречие доказывает теорему. Теорема 4. Пусть Xt и Х2 — фиксированные конечные мно- множества. Почти для всех игр, определенных на Х1хХг, спра- справедливо следующее утверждение: Равновесные по Нэшу исходы в смешанных стратегиях, кото- которые не являются равновесными в исходной игре, не являются оптимальными по Парето в смешанном расширении игры. Доказательство. Пусть (\iit ^)€^Е(йт). Покажем, что исход ([%, цг) не является оптимумом Парето в игре Gm = = (Mv Mt, щ, и2). Пусть игра (Xit Xh щ, иг) регулярна (т. е. выполнено свойство A4)). Из доказательства теоремы 3 имеем I [m-i] I = I [М'а] I- Обозначим через U1 и U2 квадратные матрицы порядка | [[гх] | X | [[i2] |. полученные ограничением функций щ и и2 на [m-i] X [м-гЗ- Обозначим также через щ вектор-строку (^(xj, ^i€[Hi]). а чеРез &2—вектор-столбец (\it(x2), хя€[ця]). Пусть ii (i») обозначает вектор-строку (столбец) пространства №«1 с компонентами, равными единице. Из свойства G) теоремы 2 получаем Предположим, что матрицы Ui и V\ не вырождены (напом- (напомним, что они квадратные) и удовлетворяют следующему свой- свойству: I ^«2€K U-2UTX = a2.U В силу A6) имеем
114 Ч. I. Некооперативное поведение игроков Поскольку матрицы Ut и U2 невырождены, то и^щ, ц и U2(\iv ц2)ф0. Итак, свойство A7) эквивалентно следующему: Условие A8) можно переписать так: (Для доказательства эквивалентности A8) и A9) нужно исполь- использовать лемму Фаркаша.) В силу A6) для всех 1>0 и bit Ь2, удовлетворяющих A9), получаем -ад*.). B0) Аналогично vx. > о &+я^) у2 &+х&.) = х (&ху2|12+m>xi/А) +^г/2[Г2. Следовательно, в силу A9) для достаточно малой X > 0 имеем Отметим, что по построению [гх (а;х) > 0 при л;х g [(xj и [гг (х2) > О при дс2 € [щ]. Следовательно, в силу A9) для достаточно малых X > 0 получаем 2 ( х, е [ц,] ^ /22% 0, 2 ( + Щ 1 Иначе говоря, соответствующие векторам Oii+Ai>i) и смешанные стратегии ц^М^ с носителем [[гх] и [i° € jWi с но- носителем [[х2] в силу B1) удовлетворяют условию Итак, исход ((j,i, (j,2) не является оптимумом Парето в игре (Mj, M2, «j, ы2). Чтобы прийти к этому заключению, нам приш- пришлось предположить, что исходная игра регулярна и что огра- ограничения ых и ы2 на [nJxfuJ не вырождены (если их отож- отождествить с квадратными матрицами) и, кроме того, удовлетво-
Гл. IV. Смешанные стратегии 115 ряют свойству A7). Заметим, что свойство A7) заведомо не выполнено, если Ut и 11г—матрицы 1 х 1, или, другими словами, О-Ч» lh) — пара чистых стратегий. Напротив, если Ut и U^ — квадратные матрицы с хотя бы двумя строками, почти все пары (Uv иг) состоят из обратимых пар, удовлетворяющих условию A7). (Доказательство оставляем читателю.) Пусть й—множество регулярных игр, таких, что при /icXj и 1гаХ2 (|/JiH/,| > 1) ограничения их и ы2 на /1Х/2 явля- являются невырожденными матрицами, удовлетворяющими усло- условию A7). Тогда множество Q открыто и всюду плотно (как конечное пересечение конечных всюду плотных множеств) и его дополнение имеет меру Лебега, равную нулю (поскольку оно является конечным объединением многообразий коразмерности 1). Это доказывает утверждение теоремы 4. Пример 3. Биматричные игры 2x2 (у каждого игрока по две стратегии: Т, В и L, R, которым на рисунке соответствуют стратегии Верх, Низ и Слева, Справа). Рассмотрим следующее семейство биматричных игр Игрок 1 - Верх Низ bl c2 d2 , Слева Справа , Игрок 2 Предположим, что а{, b-t, с,-, d( — четыре различных дейст- действительных числа (/=1,2). Этого достаточно для исключения вырожденных случаев: множество NE (Gm) всегда будет конечно. Имеется три класса игр. Случай 1. В исходной игре G по крайней мере один игрок, скажем игрок 1, имеет доминирующую стратегию, скажем Т Тогда игра С и ее смешанное расширение Gm имеют един- единственную ситуацию равновесия по Нэшу: Jm) \ {(Г, К)} при аг < а. В самом деле, неравенства ах > bx, ct > dx приводят к тому, что в игре Gm чистая стратегия Т строго доминирует все ос- остальные смешанные стратегии.
116 4.1. Некооперативное поведение игроков Случай 2. Игра G не имеет равновесия по Нэшу Это может быть следствием выполнения одной из систем неравенств {&,<alt сх-<^; а2<с2, d3<?>2} или {ах < 6lf dx < ct; c2 < а„ ?>2 < d2} Тогда смешанное расширение Gm игры G имеет единственный NE-hcxor, а именно вполне смешанное равновесие: „• _ ( d2—b2 а2—сг „• _ Соответствующие равновесные выигрыши определяются так: Эти формулы являются непосредственным следствием леммы 3 и уравнения A3): в силу предположений случая 2 либо U{ — невырожденная матрица, либо мы можем добавлением кон- константы с к матрице Ut сделать матрицу Uj + c невырожденной. Эта операция не изменяет множество М?-исходов и добавляет ту же константу с к М?-выигрышам. Случай 3. Игра G имеет два равновесия по Нэшу Это получается при выполнении одной из систем неравенств {bi < (h, ct < d{, сг < a2, b2 < d2} или Тогда в игре Gm возникает еще один NE-hcxor, а именно вполне смешанное равновесие ([if, \if), определяемое из B4); В качестве упражнения оставляем читателю проверить, что случаи 1, 2, 3 есть в точности разбиение семейства биматрич- ных игр 2x2, удовлетворяющих условию о взаимной одно- однозначности. Упражнение 6 Приведите пример биматричной игры G 2x2, в которой ни у одного игрока нет эквивалентных чистых стратегий, а мно- множество NE (GJ бесконечно.
Гл. IV. Смешанные стратегии И7 Упражнение 7. Игры 2x2 с нулевой суммой Рассмотрите семейство игр 2x2 с нулевой суммой: Докажите, что оно разбивается на два подмножества. Случай 1. Пересечение [a, d]n[&, с] не пусто. Тогда игра G имеет цену. При рассмотрении ее смешанного расширения ничего нового не получается. Случай 2. Пересечение [a, d] П [Ь, с] пусто. Тогда игра G не имеет цены, а в игре Gm существует един- единственная седловая пара, причем она вполне смешанная. Цена игры Gm определяется так: /п. ad—be V»(G)=a+d-b-c' Упражнение 8 Дайте геометрический метод вычисления цены игры в сме- смешанных стратегиях и оптимальных смешанных стратегий для любой игры двух лиц с нулевой суммой, в которой хотя бы у одного игрока имеется только две чистые стратегии1). Примените этот метод к игре ГО 3 2 5 3/21 [62102 J- Упражнение 9 Пусть (Xlf Xj, Ut) — игра двух лиц с нулевой суммой, в смешанном расширении которой нет вполне смешанной сед- ловой пары. Для всех (xlt x2)€XiXXz обозначим через Kj(x1( лг2) цену игры в смешанных стратегиях. Платежная матрица этой игры полу- получается из исходной матрицы U., зачеркиванием строки я, и столбца х$. Докажите, что игра (Xit Xj, Vf) имеет седловую пару в чис- чистых стратегиях и ее цена равна цене игры Gm. Задача 4. Игра «таможенный досмотр» Имеются два игрока —таможенник (игрок 1) и коммерсант (игрок 2). Коммерсант появляется на таможне несколько раз. Каждый раз он решает —взять с собой контрабандный товар В случае затруднения см. Оуэн [1971] (пример П. 5.9).— Прим. перев,
118 Ч. I. Некооперативное поведение игроков или нет (ему нужно пронести этот товар ровно одни раз). Таможенник при каждом появлении коммерсанта может про- произвести досмотр. В игре Gn коммерсант появляется на таможне не более п раз. Игра кончается, если была попытка пронести контрабандный товар независимо от того, удачная она или нет. Если на шаге п игрок 1 проверяет игрока 2, а у того нет ничего предосудительного, то игрок 1 платит игроку 2 еди- единицу И начинается игра Gn_v Если игрок 1 отказывается от проверки, а игрок 2 проносит контрабанду, то игрок 2 полу- получает с(с^\) и игра кончается. Если игрок 1 обнаруживает контрабандный товар, то он получает награду f(f^c) и игра заканчивается. Если проверка не произведена, и контрабанда не пронесена, то никаких платежей не делается и начинается игра Gn_v 1) Предполагая известной цену yn_j игры Gn_t в смешан- смешанных стратегиях, найдите цену vn игры Gn в смешанных стра- стратегиях. 2) Вычислите vn и оптимальные смешанные стратегии обоих игроков. Задача 5 Зафиксируем конечные множества Xit X§ и для любой ма- матрицы Ut обозначим через vm (Uj) цену игры (с нулевой сум- суммой) (Xt, Х2, Uj) в смешанных стратегиях. 1) Докажите, что vm{U1) — непрерывная функция Uv 2) Докажите, что существует открытое всюду плотное мно- множество Q из R*'xx*, такое, что для любого U+ из Q смешан- смешанное расширение игры (Хх, Хг, Ut) имеет единственную седло- вую пару. Задача 6. Выгодные потери выигрыша при вполне смешан- смешанном равновесии по Нэшу (Мулен [1975]) Пусть G = (Xlt Х2, Ult иг) — биматричная игра, в которой множества Хг и Х2 имеют одинаковую мощность, а !/( и f/,— невырожденные ХххХ2 матрицы. На протяжении данной задачи предположим, что Gm имеет (обязательно единственное) вполне смешанное равновесие (ц1У цг), определяемое по лемме 2. Положим v1=u1- t-xJJj1. Таким образом, \г — вектор (строка) из RXl. Компоненты этого вектора могут иметь произвольный знак. Отметим, однако, что Vj-^a, = 1 и, следовательно, неко- некоторые компоненты v, неотрицательны. 1) Докажите, что vx есть смешанная стратегия игрока 1 тогда и только тогда, когда вполне смешанный /У?-выигрыш Uj (заданный в A2)) является ценой игры с нулевой суммой (Xlt Xit иг) в смешанных стратегиях:
Гл. IV. Смешанные стратегии 119 Если vx принадлежит множеству Mlt то вполне смешанный NE-вьтгрыш игрока 1 совпадает с его гарантированным выиг- выигрышем, Vj —осторожная смешанная стратегия игрока 1, a (Hj, вообще говоря, нет. 2) Предположим, что vx не есть смешанная стратегия (что в силу утверждения 1 эквивалентно vt > vm (?/x)). Тогда мно- множество Yl отрицательных компонент vx не пусто. Скажем, что X1xXz матрица Lx есть матрица У1-потерь, если Покажите, что для любой достаточно малой ненулевой матрицы У^потерь L1 игра (Xlt Х2, С/х — jLx, f/2) имеет единственное вполне смешанное равновесие. Соответствующий вектор выиг- выигрышей (у1; v2) удовлетворяет условиям i "I < »i. Интерпретация Игрок 1 несет потери L(xu •), если использует стратегию xl € Yv Это наказание в действительности влияет только на его собственный вполне смешанный М?-выигрыш, оставляя без изменения выигрыш игрока 2. 3) Рассмотрим игру 2x2, в которой обе функции выигрыша взаимно однозначны (как в рассмотренном выше примере 3). Охарактеризуйте те игры, для которых возникает ситуация из пункта 2. Дайте числовой пример. 3. БЕСКОНЕЧНЫЕ ИГРЫ Если множества чистых стратегий Х{ бесконечны, то даже для игры двух лиц с нулевой суммой нельзя утверждать су- существование цены в смешанных стратегиях. Тем более не га- гарантируется существование смешанного М?-исхода. Пример 4. «Китайский покер» Каждый из двух игроков выбирает (неотрицательное) целое число. Игрок, который назвал большее число, выигрывает доллар: и, {х1з х2) = ¦ + 1, если а;2<а;1, О, если х2 = хи —1, если xx <*$.
120 Ч. I. Некооперативное поведение игроков Вероятностное распределение на Xi — N принимает вид , где 2 (Мя) = 1> Мп)>° для всех N Обозначая через Mt множество таких распределений, мы по- получаем игру (Ми Mi, uj, где """" ^СЧ "VI 1 \М*1' г*2/ ^^ шЛ М*1 v*l/ * г^2 \ 2/ "ч™ ^^ 1*1 \**1/ * И'З \ 2/* 4.«.«N *„*,€ N ДГ» < ДГ, ДГ, < ДГ, Исходная игра является игрой с нулевой суммой без цены sup inf ux = — 1 < +1 = inf sup uv ДГ, Хг X, Xi На самом деле использование смешанных стратегий совсем не увеличивает гарантированный уровень игроков, поэтому и сме- смешанная игра (Ми Ms, щ) не имеет цены: sup inf щ = — 1 < 4-1 = inf sup uv B6) Для доказательства этого неравенства фиксируем вероятност- вероятностное распределение \iv Тогда для любого е > 0 найдется целое число tie, такое, что 2 l*i (я) < 8- Рассмотрим далее (чистую) стратегию х^ — пе игрока 2 «i(|ii, 6*) = - 2 1*1 (л) + 2 Mn)<-(l-e) + e = - п<пе п>пв Поскольку е может быть сколь угодно малым положительным числом, получаем inf at(fAj, ц.2) = inf «i(|*lf 6,J=—1, Цг Хг а значит, справедливо левое равенство в B6). Так как наша игра симметрична (см. упр. 1), то правое равенство также спра- справедливо. Сложность приведенного выше примера связана с неком- некомпактностью множеств чистых стратегий, а также множеств сме- смешанных стратегий. Когда те и другие множества компактны, непрерывность (исходной) функции выигрыша гарантирует су- существование равновесия по Нэшу в смешанных стратегиях.
Гл. IV. Смешанные стратегии 121 Определение 4. Пусть G — (Xt, uf, i?N) исходная игра \N\ лиц в нормальной форме, для которой Х{—компактное подмножество некоторого ~| евклидова пространства R < | для всех i ?N. щ—непрерывная функция на XN ) Смешанная стратегия щ игрока i является вероятностной мерой Радона на X,-; это положительный непрерывный линейный функционал, заданный на множестве непрерывных действитель- действительных функций, определенных на X,-, наделенном топологией равномерной сходимости. Значение этого функционала на функ- функции, тождественно равной единице, есть единица. Обозначим через М{ множество всех смешанных стратегий игрока i. Смешанное расширение игры G—это игра Gm = (М{, щ\ i g N)i щ(х)= J и, (х) dp (x), X J XN i где du(x)** ® dPi(xd~ произведение вероятностных tsN мер jii,-, i?N. Теорема 5 (Гликсберг [1952]). В условиях определения 3 смешанное расширение Gm игры G имеет по крайней мере одно равновесие по Нэшу. Доказательство. В силу стандартного результата из функ- функционального анализа (см. например, Данфорд, Шварц [1957], Колмогоров, Фомин [1972]) имеем: Множество Mt *-слабо компактно в пространстве, сопря- сопряженном к пространству непрерывных функций на Х{, наделен- наделенному топологией равномерной сходимости. Функция и{ линейна относительно переменной (А,- и непрерывна на MN при условии, что последнее множество наделено произведением «-слабых топологий. Таким образом, теорема Гликсберга следует из теоремы Нэша (теорема 2, гл. III). Пример 5. Игра «размещение магазинов» На одной улице должно быть размещено два магазина спорт- спорттоваров. Владельца магазина дешевых товаров назовем игро- игроком 1, а дорогих—игроком 2. Если магазины расположены близко друг от друга, то покупатели зачастую предпочитают приобрести дешевый товар. Спрос неэластичен. Игрок 1 стре- стремится разместить свой магазин как можно ближе к магазину игрока 2, а тот старается по возможности увеличить расстоя- расстояние между магазинами.
122 Ч. I. Некооперативное поведение игроков Более точно, мы предполагаем, что функции выигрыша имеют следующий вид: Х1 = Хг — [0, 1], *n х2) = 1— [*!—xt\, \х1—хг\, если \x1—x2\<j, 2 2 ", если \xl — xil^-^, Отметим, что если расстояние между магазинами хотя бы 2/3 (длину улицы мы считаем равной единице), то влияние магазина дешевых товаров прекращается. Исходная игра не имеет равновесия по Нэшу. Это показано на рис. 1, где приведены множества наилучших ответов для обоих игроков. Поскольку множество Xt компактно, а ы,—непрерывные функции, теорема 5 гарантирует существование по крайней мере одного исхода в смешанных стратегиях равновесия по Нэшу. Равновесием по Нэшу является следующая пара смешанных стратегий (f f) \if) _ 6j_ i h-
Гл. IV. Смешанные стратегии 123 Ни одна из двух смешанных стратегий не является вполне смешанной (определение 2 непосредственно обобщается на слу- случай бесконечных игр на основе понятия носителя меры Радона: см., например, Рудин [1966], Колмогоров, Фомин [1972]). Тем не менее пара (ц*, \if) обладает типичным свойством вполне смешанного равновесия, а именно: иДщ, \if) = щ (nf, (if) для всех \it^Mlt 2 и2 ((if, (i3) = ы2 (\if, (if) для всех [х3 € Мг. Для проверки первого свойства фиксируем чистую стратегию xt игрока 1 и вычислим — / +\ 1 1 1 Ux \&Xl, [ia)=-2 (I—xi)~\ (^ — 0—A;i)) = 'o Для всех xi€Xv Как и в конечном случае, если функция и1{-, \if) постоянна на множестве чистых стратегий, то она постоянна также и на множестве смешанных стратегий (поскольку последние являются пределами выпуклых комбинаций чистых стратегий). Фиксируем далее чистую стратегию х2 игрока 2 и вычислим 1 ... 1 / 1 \ . 1 B__ \ , J_ ? 3 Mi" з ' з • 3 'T следовательно, "з;"'" 6 1 если -я- 2 если -д всех Отметим, что ц*—оптимальная осторожная стратегия игрока 1 в игре с нулевой суммой (Ми Mt, и,). В самом деле, их {\av ц2) == »= их ([i2, (ij) для всех [j,j, [j,2, а значит, верхнее уравнение в B7) приводит к тому, что пара (\\?, \if) является седловой отно- относительно функции и,. Следовательно, цена игры в смешанных стратегиях по функции ut равна 1/2 н совпадает с Л^?-выиг- рышем игрока 1.
124 Ч. I, Некооперативное поведение игроков Аналогичными рассуждениями можно показать, что (ц*, $) является (единственной) седловой парой в игре (Ми Мг, —й2), таким образом, смешанный гарантированный выигрыш игрока 2 равен 7/18 и совпадает с его Л^?-выигрышем. Заметим, наконец, что наш М?-исход доминируем по Парето. Вычисление смешанных iVE-исходов является чрезвычайно трудной задачей даже в случае, когда исходные множества стратегий являются выпуклыми компактными подмножествами евклидовых пространств. Поэтому мы не будем заниматься дальнейшим изучением этого вопроса, а отошлем читателя к работам Партхасаратхи, Рагхаван [1971], Тийс [1981] и указанной в них литературе. Два наших следующих примера—это игры, в которых мно- множества стратегий игроков одномерны, а функции выигрыша разрывны. В первой из этих игр выигрыши равномерно огра- ограничены, тем не менее не существует равновесия по Нэшу в смешанных стратегиях. Этот факт указывает на то, что в условиях теоремы Гликсберга нельзя отбросить требование непрерывности функции выигрыша. Пример 6. Игра двух лиц в единичном квадрате, не имею- имеющая цены в смешанных стратегиях (Сайон, Вулф [1957]) Положим Х1 = Х2 = [0, 1] и ( — 1, если *, < х2 < хх-\-\, и1(х1, хг) = < 0, если хх = хг или х% = х^-\-\> 1+1, если хг < хг или хх-\-~ <.хг. Утверждается, что смешанное расширение этой игры двух лиц с нулевой суммой не имеет цены. Более точно, выполнено sup inf «j = — < у = inf sup и,. Докажем правое равенство от противного, предположив, что существует стратегия ц2, для которой supM,FXi, ц,)<{, B8) Подставляя последовательно в B8) ^=1, а;1 = 0, получаем! >Т> B9) -о<Т. C0) где а = [х2@, —J, Ь=фДу, lj. Далее применяем B8) при T—8 и предполагаем, что е стремится к нулю: C1)
Гл. IV. Смешанные стратегии 125 Суммируя C0) и C1), получаем {})f- C2) С другой стороны, [х2—это вероятностное распределение, сле- следовательно, ({т}) <33) Суммируя C3) и C0), имеем Суммируя C4) и C2), получаем противоречие с B9). Следова- Следовательно, мы доказали, что о inf sup щ !> y • Иг Hi Взяв смешанную стратегию • 1с . 2 „ 4 с ? 0 + 6 + получаем, что она гарантирует игроку 2 проигрыш не больше 3/7. Упражнение 10 Докажите, что sup inf«! = -я-. Hi ' И. Указание: осторожная стратегия игрока 1 равна м?=4" §о + j sj_ + -j Si- 2 В нашем последнем примере множеством стратегий будет дейст- действительная полуось, а функция выигрыша будет разрывна и неограниченна. Тем не менее докажем, что существует вполне смешанный #?-исход. Пример 7. Игра „аукцион" Доллар распределяется между п участниками, которые тайно делают ставки. Обозначим эти ставки через хи ..., хп. Пусть наибольшая ставка принадлежит игроку /0: w(x) = {i9}, fMfiw(x)—множество всех игроков, предложивших наивысшую |тавку, а именно w (x) = {i?N I xt — sup Xj),
126 Ч. I. Некооперативное поведение игроков Правило аукциона состоит в том, что игрок /0 выигрывает доллар и должен уплатить вторую из назначенных цен, в то время как каждый из остальных игроков платит то, что он объявил: игрок t, i#/0, должен уплатить свою ставку xt. Если наивысшую ставку предложили одновременно несколько игроков, то для того чтобы определить, кому достанется дол- доллар, эти игроки бросают жребий. Получается следующая игра в нормальной форме: Х,. = [0, +оо) 1— sup X/, если w(x) = {i\, «*(*)=¦{ L — X;, если i?w(x) и |а»(х)|>2, C5) —xh если 1^ш(^). Эта игра является вариантом игры „война на истощение" (задача 5 гл. III), в которой предмет конкуренции имеет оди- одинаковую ценность для всех игроков, а число игроков произ- произвольно. Анализ исходной игры в нормальной форме C5) анало- аналогичен исследованию игры „война на истощение". Игра C5) имеет п существенно различных #?-исходов в чистых страте- стратегиях; все онн оптимальны по Парето. В каждом из таких исходов один игрок делает ставку больше единицы в то время, как остальные не ставят ничего. Любое равновесие приводит к резкой несимметрии между игроками: для того чтобы сделать равновесие правдоподобным исходом игры, один из игроков должен выступить в качестве лидера, заявив окружающим, что он будет делать ставку больше единицы. Игроки знают о симметричности игры, поэтому вполне возможно, что никто из них не сделает подобного заявления. В этом случае не может реализоваться исход, в котором какой- либо из игроков является лидером. Совсем другая картина наблюдается при использовании смешанных стратегий. Здесь уже каждый игрок должен сохра- сохранять в тайне чистую стратегию, которая является реализацией смешанной стратегии. Отсюда вытекает симметричность и вполне смешанность равновесия по Нэшу. Для того, чтобы доказать это утверждение, мы введем вероятностное распределение v* на [0, 4-°°)> такое, что для всех i € N ui F*, цА) не зависит от х € X,- C6) при условии, что \i* ss v* для всех j€N\{i\.
Гл. IV. Смешанные стратегии 127 Вероятностное распределение v* выбирается с непрерывной функцией плотности /: v* (Л) = ^ f(t)dt для любого измеримого множества Ас[0, -f оо). А Обозначим через F функцию распределения: Если каждый игрок / из #\{t} использует смешанную стра- стратегию v*, то случайная переменная SUp X/ N\{t) имеет функцию распределения F" с соответствующей плот- плотностью fn~(n—1)F"~S/. Следовательно, мы можем вычислить X + 00 В силу непрерывности / приведенное выше выражение диффе- дифференцируемо по х и условие C6) приводит к Поэтому G~Fa~l является решением дифференциального урав- уравнения 6' (x) + G(x) — l, и, принимая во внимание, что F@) = 0, окончательно получаем 1 F(*) = [l— е"*]"-1 для всех х>0. Следовательно, в симметричном вполне смешанном #?-иеходе каждый игрок использует одну и ту же функцию плотности» Заметим, что для любого сколь угодно большого числа % Вероятность того, что игрок сделает ставку выше % не равна Нулю (а есть в точности 1—A—е~х)п~х) . Отсюда следует, что Наш nE-исхоа доминируем по Парето. Тем не менее математи*
128 Ч. I. Некооперативное поведение игроков ческое ожидание а наибольшей ставки является конечным: Заметим, наконец, что, как показывают простые вычисления, iVE-вЫигрыш для каждого игрока в точности равен нулю. Задача 6. Модифицированный китайский покер", имеющий цену Каждый из двух игроков выбирает натуральное число. Если эти два числа ие равны, то выигрыш равен нулю. Если выбран- выбранные числа совпадают xt = х% — р, то выигрыш игрока 1 равен ар, где а^ аг ^ ... ^ ар ^ ... —неубывающая последовательность положительных чисел. Таким образом, игрок 2 сталкивается со следующей дилеммой. Чем больше число, которое он выберет, тем меньше вероят- вероятность того, что игрок 1 его угадает, но тем более опасным становится угадывание данного числа. Исходная игра двух лиц с нулевой суммой такова: 1X1 0, если х1фхя. Ее смешанное расширение может быть определено следующим образом: = l и v(p)>0 для всехрк I +« S aPVi (P) Pi (P) p=i может принимать значение -f-oo). Возможно и другое определение: при этом значения функции иг всегда конечны. При ответе на следующие вопросы можно использовать любой из этих двух вариантов определения смешанного расширения. 1) Докажите, что если + 09 pmlap
Гл. IV. Смешанные стратегии 129 то смешанное расширение игры G имеет цену, каждый игрок обладает единственной оптимальной стратегией v*, причем стра- стратегия v* вполне смешанная. 2) Докажите, что если 1 " то смешанное расширение G имеет цену, но ни один игрок не имеет оптимальной стратегии. ЛИТЕРАТУРА ¦Данфорд, Шварц (Duniord N., Schwartz J. Т.) [1957] Linear operators. New York, John Wiley. [Имеется перевод; Данфорд H., Шварц Дж. Т Линейные операторы. Общая теория.—М.: ИЛ, 1962] Гильбо (Guilbaud G.) [1968] Elements de la theorie mathematique des jeux. Paris, Dunod. Гликсберг (Glicksberg I. L.) [1952] A further generalization of the Kakutani fixed point theorem with application to Nash equilibrium point, Proc. Amer. Math. Soc, 3, 170—174. [Имеется перевод: Гликсберг И. Л. Дальнейшее обобщение теоремы Какутани о неподвижной точке с приложением к ситуаци- ситуациям равновесия в смысле Нэша. В сб. Бесконечные антагонистические игры./Под ред. Воробьева Н. Н. —М.: Физматгнз, 1963, 497—503.] "Колмогоров А Н., Фомин С. В. [1972] Элементы теорий функций и функционального анализа. —М.: Наука. Льюс, Райфа (Luce R. D,, Raiffa H.) [1957] См. литературу гл. I. Мулен (Moulin Н.) [1975] Extension of two-person zero-sum games. Journal of Mathematical Analysis and Application, 55, 2, 490—507. *Оуэн Г. [1971] Теория игр. — М.; Мнр. Партхасаратхи, Рагхаван (Parthasarathy Т., Raghavan T.E.S.) [1971] См. литературу гл. III. Райвз (Rives N. W.) [1975] On the history of the mathematical theory of games. Hope 7, 4, Рудин (Rudin W.) [1966] Real and complex analysis. New York, McGraw-Hill. Сайон, Вулф (Sion M,, Wolfe P.) [1957] On a game without a value, Contribution to the theory of games, vol. 3, Annals of Maths. Studies, 39, Princeton, Princeton University Press, 299—306. [Имеется перевод: Сайои М., Вулф Ф., Об игре не обладающей значением. В сб. Позиционные игры./Под ред. Во- Воробьева Н.Н., Врублевской И. Н. —М.: Физматгиз, 1967, 290—299.] Тийс (Tijs S. Н.) [1981J Nash equilibria for non-cooperative n-person games in normal form. SIAM Journal Appl. Math., 23, 2, 225—237. Харшаньи (Harsanyi J.) [1975] The tracing procedure: a bayesian approach to defining a solution for n-person non-cooperative games. Int. Journal of Game Theory, 4, 61—94. * Звездочкой отмечены работы, добавленные при переводе.
ЧАСТЬ II Кооперативное поведение игроков В первой части книги мы изучали сообщество, в котором отсутствовал явный обмен информацией между участниками. Это могло быть следствием физических ограничений, юридичес- юридических барьеров или же результатом взаимного недоверия. Един- Единственным косвенным способом обмена стратегической информа- информацией (см. процедуру нащупывания по Курно, гл. III, разд. 3) являлось совместное наблюдение тактических ходов. Теперь же мы хотим создать поведенческие модели коопера- кооперативного сообщества, в котором имеется явный обмен информа- информацией. Структурная неэффективность некооперативных равно- равновесных исходов (присущая большинству примеров игр с нену- ненулевой суммой, рассмотренных в первой части книги) теперь будет интерпретироваться как побудительный мотив к коопе- кооперации. Попытаемся определить ее основные черты. После этапа переговоров об условиях кооперации, который может включать взаимное выяснение функций выигрыша, торг и различные психологические маневры, игроки приходят к ко- кооперативному соглашению. Соглашения могут быть обязатель- обязательными (когда несколько игроков подписывают контракт об ис- использовании определенных стратегий и выполнение этого конт- контракта обеспечивается некоторым контролирующим органом, ко- которому подчиняются все игроки) или необязательными (когда такого органа не существует, и поэтому соглашение во мно- многом напоминает международные договоры, которые действуют до тех пор, пока не выгодно их нарушать). Наш подход состоит в изучении разумных исходов перего- переговоров. При этом не делается никакой попытки дать описание самого процесса переговоров. При рассмотрении необязатель- необязательных соглашений возникает целый ряд вопросов стабильности, которые могут быть исследованы наилучшим образом при фик- фиксации некоторых информационных предположений (гл. V и VI). С другой стороны, изучение обязательных соглашений связано с нормативным определением справедливости, которая рассмат- рассматривается как некая сила, поддерживающая кооперацию. Обя- Обязательные соглашения не будут здесь рассматриваться (см. введение).
ГЛАВА V СТАБИЛЬНЫЕ СОГЛАШЕНИЯ Необязательные соглашения определяют исход и, следова- следовательно, конкретную стратегию для каждого игрока. Поскольку мы хотим, чтобы для каждого игрока была сохранена полная суверенность стратегического выбора, то предполагается, что никакого игрока и никакую коалицию игроков нельзя заставить использовать стратегии, рекомендованные соглашением. Таким образом, имеется единственный способ предотвратить возмож- возможное невыполнение соглашения отдельными участниками или коа- коалицией участников. Нужно сделать так, чтобы отклонение от соглашения было невыгодно отклоняющимся игрокам. Это и есть свойство стабильности. Стабильность является не таким уж простым понятием, как это может показаться на первый взгляд. В самом деле, откло- отклонение некоторых игроков, нарушающих рассматриваемое согла- соглашение, может заставить остальных игроков (которые первона- первоначально не собирались нарушать соглашение) изменить свои стратегии. Эти индуцированные изменения трудно предсказуемы независимо от того, предполагаем ли мы, что первоначальное нарушение соглашения убьет дух кооперации и вынудит игроков придерживаться некооперативного поведения. В самом деле, единственным бесспорным выводом первой части книги является то, что большинство игр в нормальной форме обладает несколь- несколькими различными некооперативными равновесными исходами (см. гл. III и IV). В соответствии с этим необязательные соглашения будут состоять из договоренности об исходе, а также из сценария реагирования каждого игрока i на отступление какой-либо коалиции, не содержащей i. Этот сценарий объявляется заранее. В следующей главе в качестве таких сценариев будут рассмот- рассмотрены угрозы, которые могут предусматривать различную реак- реакцию на каждое возможное отклонение от соглашения. На про- протяжении данной главы мы будем рассматривать очень простой сценарий реагирования, а именно полное отсутствие реакции.
132 Ч. П. Кооперативное поведение игроков Верность соглашению требует придерживаться условленной стратегии независимо от того, какие стратегии используют остальные игроки. Выше уже было сказано о том, что следует использовать соглашения, которые не выгодно нарушать. Такие соглашения как бы автоматически, обеспечивают свое выполне- выполнение, и в этом смысле мы называем их стабильными. Основным примером стабильного соглашения является согла- соглашение, базирующееся на равновесии по Нэшу. Его стабильность обеспечивается взаимным незнанием окончательных стратеги- стратегических выборов. Мы обобщим концепцию равновесия по Нэшу в двух направлениях. Если игроки-нарушители могут образо- образовывать коалицию, то выполнение соглашения подвергается опасности со стороны потенциальных отклонений любой коали- коалиции. Это приводит к концепции сильного равновесия (разд. 1). Если игроки могут использовать случайный механизм, реали- реализующий коррелированные рандомизированные стратегии и по- посылающий каждому игроку изолированно сигнал о том, какой стратегии ему придерживаться, то возникает новое понятие стабильного соглашения. Назовем его равновесием в совместных смешанных стратегиях (разд. 2). I. СИЛЬНОЕ РАВНОВЕСИЕ Пример 1. ^.Пиратские кораблю Два корабля уходят в один и тот же день на остров сокровищ. Каждый из п пиратов должен принять решение, на каком ко- корабле ему плыть: на корабле А или на корабле В. Если (— число пиратов, решивших плыть на корабле А, то путешествие на корабле А затянется на a(t) дней, а путешествие на ко- корабле В, на котором (п — /) пиратов, продлится Ь (п—t) дней. Каждый игрок стремится минимизировать длительность его собственного путешествия. Данная ситуация описывается сле- следующей игрой: Х{ = {0, 1} i<tN ( —a(t), если х{ = \, , ^ иЛх) = { . У А ' _ где *= % х iK ' \ —b(n — t), если xt = 0, ieN /' xt = 1 означает, что игрок i плывет на корабле А. Предположим, что функции а и b строго монотонно возра- возрастают на {0, ..., п} и выполнены условия а@)<?>(/г), 6@)<a(n). Некооперативным равновесием (М?-исходом) в данной игре является любой исход х*, для которого число t* = 2 xt UN
Гл. V. Стабильные соглашения 133 удовлетворяет следующим условиям: a(t*)^b(n—1*+\): нет желания переключаться со страте- стратегии 1 на стратегию О и b(n—t*) ^a(t*-\-1): нет желания переключаться со страте- стратегии 0 на стратегию 1. Предполагая для простоты, что аA)фЬ{п—t + 1) для всех t, получаем, что существует единственное целое число t*, удов- удовлетворяющее двум приведенным выше неравенствам, а именно t* = sup {* | a (t) < b (n — / -f 1)} = inf {11 b (n — t) < a (t + 1). Следовательно, исход х* есть равновесие по Нэшу тогда и только тогда, когда 2 x* = t*. Если игроки не могут обмениваться информацией перед выбором стратегии (они должны забронировать место на одном из двух кораблей заранее), то они не смогут скоординировать свои выборы так, чтобы достигнуть равновесия по Нэшу в чистых стратегиях. По-видимому, они будут использовать симметрич- симметричное вполне смешанное равновесие, которое в действительности доминируемо по Парето любым Wf-исходом в чистых стратегиях. Упражнение 1 • Докажите существование единственного вполне смешанного #?-исхода, в котором каждый пират выбирает стратегию 1 с одной и той же вероятностью р. Докажите, что этот исход, как правило, доминируем по Парето любым Л^?-исходом в чистых стратегиях. Имея возможность координировать свои действия, игроки могут договориться о выборе любого NE -исхода в чистых стра- стратегиях х*. Это соглашение устойчиво не только по отношению к возможным индивидуальным отклонениям (свойство NE-m- ходов), но также против отклонений коалиций. В самом деле, предположим, что для каждого участника i из некоторой коалиции Т, Т с N, оказывается выгодным переключиться со стратегии л;* на стратегию х{—\—xf U;(xT, A#c)>«i(**) Для всех i?T, j и{(хт, x*c) > ut (x*) по крайней мере для одного i$T. Предположим сначала, что число t, определенное формулой t — 2 xi + 2 х?> равно t*. Тогда по крайней мере для одной 2 i 2
134 4. II. Кооперативное поведение игроков пары /,, 13€.Т выполнено I х? = 0 х,, = 1, \ *?=1 *,, = <). Применяя A) последовательно к jlt /2, получаем следовательно, щ{хТ, x%) = ul(x*) для всех i$N, что проти- противоречит A). Предположим теперь, что / > t*. Тогда по крайней мере для одного t€ Т имееем х,* = 0, xt = \. Отсюда в силу A) Поскольку b(n—t*)<a(t*+\), окончательно получаем t<t*+\. Полученное противоречие доказывает наше утверж- утверждение. Мы доказали, что любое соглашение, основанное на использо- использовании конкретного Л^?-исхода, является устойчивым также по от- отношению к отклонениям коалицией, т. е. любой Af ?-исход является в данном случае сильным равновесием (см. определение 1 ниже). Если a(i*) и b{n—1+) достаточно близки, то все игроки в со- соответствии с соглашением получают приблизительно равные выигрыши, т. е. выбор конкретного #?-исхода не является конфликтной ситуацией. Для реализации одного из этих исходов пираты должны последовательно и открыто выбирать корабль по следующему алгоритму: х,= 1, если a(xl + ...+xi_l + \)<b(i—[xx+...+xi_1]), х, = 0, если &(i —[ж, + ...+x,_j])< a (*,+ ...+*,_, +1). Определение 1. Для данной игры в нормальной форме О = (Х{, и,-; i?N) скажем, что х*—исход сильного равновесия, если не существует коалиции игроков, для которых было бы выгодно отклониться от данного исхода в случае, если допол- дополнительная коалиция не реагирует на отклонение: VT с N VxT € Хт не выполнено V/6Г и,{хт, хЪ)>Щ{х*), BieT щ{хт, xtc)>ut(x*). Обозначим SE (G) множество сильных равновесий в игре G. Оно может быть пустым.
Гл. V. Стабильные соглашения 135 Полагая T — N в формуле B), получаем, что SE-исход оптимален по Парето. Полагая T = {i}, i^N, получаем, что этот исход является равновесным по Нэшу. Ясно, что для игр двух лиц Sf-исход—это просто оптимальные по Парето Л/?-исходы. Наша интерпретация свойства стабильности B) основана на двухэтапном процессе принятия решения. На первом этапе игроки приходят к договоренности о некотором конкретном исходе л:*. Далее обмен информацией прекращается, и каждый игрок самостоятельно принимает решение о своей окончатель- окончательной стратегии. Любой игрок i € А/ может отказаться от исполь- использования стратегии xf, но он не может информировать остальных игроков о своем отклонении. Может также сформироваться любая коалиция Т, отклоняющаяся от хт и выбирающая Xf, но игроки вне данной коалиции не могут быть информированы об этом изменении, поэтому ожидается, что они будут придер- придерживаться того поведения, о котором была достигнута догово- договоренность {xfc). Это ограничение обмена информацией является основным моментом, обосновывающим содержательность опре- определения 1, как показывает «от противного» приведенный ниже пример 2. См. также определение 1 гл. III и следующие за ним комментарии. (Заметим, что для сильных равновесий мы не обсуждаем никаких процедур нащупывания, поскольку близорукое поведение не может быть обосновано при коопера- кооперативном способе принятия решений.) На примере игр двух лиц мы убедились в том, что незыб- незыблемость любого Л/?-исхода разрушается, если возникает борьба за лидерство (см. пример 2 и лемму 2 гл. III). Аналогичная ситуация возможна и в игре п лиц, что демонстрирует наш следующий пример. Пример 2. Игра «переговоры» п игроков должны поделить доллар. Игроки дают свои заявки арбитру, который удовлетворяет их, если они совместны. В противном случае ни один игрок ничего не получает: Х\ = [0, 1] для всех i?N, xh если 2 xj ^а 1» щ (х) = Мы утверждаем, что /6 N О, если 2 •*/ /6 N ' N\ 2 x,= F/V
136 Ч. 11. Кооперативное поведение игроков другими словами, исход является сильным равновесием тогда и только тогда, когда соответствующие заявки в сумме дают ровно один доллар. Мы предоставляем читателю проверку этого утверждения. Заметим, что если коалиция Т, действующая в роли лидера, выберет некоторый набор стратегий х$ так, что выполнено условие 2*^=1—е (е > 0 мало), то коалиция Т, действую- 16 Г щая как ведомая, выберет в качестве оптимального ответа век- вектор заявок хтс, такой, что Следовательно, любой участник или коалиция, присвоив себе право выступать в роли лидера, может забрать почти весь доллар! Поэтому борьба за лидерство в таких переговорах должна быть весьма интенсивной. Выберем теперь конкретный Sf-исход х*, о котором могли бы договориться все игроки, скажем xf=-~ для всех tgAf. Для того чтобы сделать это соглашение стабильным, каждый игрок должен решить не обращать никакого внимания на заявки свыше 1/л со стороны любого игрока, который попытался бы захватить лидерство. Наилучшим образом такая политика глу- глухоты может быть реализована путем разрыва всех каналов обмена информацией между игроками, после чего каждый игрок может изменить свою стратегию, но он не может сделать этого публично. Решающим моментом, обеспечивающим стабильность соглашения, основанного на конкретном Sf-исходе, в рассмот- рассмотренной игре и аналогичных играх является ограничение обмена информацией между игроками. Это ограничение должно быть законом (как при системе тайного голосования) или физическим ограничением (спутники Одиссея затыкали уши воском). Следо- Следовательно, необязательные соглашения требуют некоторых обя- обязательных ограничений в обмене информацией. Этот момент станет особенно наглядным в концепции равновесия в совмест- совместных смешанных стратегиях, которой мы посвятим следующий раздел. В следующей главе нам потребуются симметричные инфор- информационные ограничения для того, чтобы использовать взаимные предостерегающие угрозы как механизм кооперации (см. гл. VI). Мы уже знаем (гл. III, разд. 2), что игра в нормальной форме, у которой множества стратегий являются открытыми подмножествами евклидовых пространств, а функции выигрыша дифференцируемы, в случае «общего положения» не имеет опти- оптимальных по Парето М?-исходов и тем более SZf-исходов. Однако
Гл. V. Стабильные соглашения 137 при некоторых очень сильных предположениях о выпуклости существование Sf-исхода может быть гарантировано (см. Ауман [1959]). Упражнение 2. Обобщение примера 1 Каждый игрок должен выбрать одно из р общественных благ. Если tk—общее число игроков, выбравших благо с но- номером k, k=\, ..., р, тогда каждый из tk потребителей полу- получает выигрыш — ak(tk), где ak(-) есть неудовлетворение при потреблении блага k, причем это строго возрастающая функция от tk. Следовательно, получаем игру *,- = {1, ..-, Р}, '€ЛГ, если xt = k и tk = \{l ?N\xf = k}\. Предположим, что aft@) = 0 и ak(n)— I, k— 1, ..., р. Дока- Докажите существование по крайней мере одного сильного равно- равновесия в данной игре и приведите условия, при которых все ^-исходы приводят к одному и тому же распределению (<i, •••, tP)- Упражнение 3. Игра «размещение магазинов с дополняющими товарами» Два владельца магазинов решают разместить свои магазины на одной улице (на отрезке [0, 1]). Они предлагают дополняю- дополняющие товары (как, скажем, магазин спортивного оборудования и бюро туристических путешествий), а потому успехи одного оказывают положительное влияние на другого (в противопо- противоположность примеру 5 гл. IV). Кроме того, игрок 1 желает раз- разместить магазин как можно ближе к точке 0, а игрок 2 — как можно дальше от точки 0. Таким образом, получается следую- следующая игра: 1 = Х2 = [0, 1], i || 112| где ах < 0 < а2. Предположим, что |а,|^1, t = l, 2. Докажите, что исход (хи х,) является сильным равновесием в этой игре тогда и только тогда, когда хх = х%. Разберите остальные случаи,
138 Ч. 11. Кооперативное поведение игроков 2. РАВНОВЕСИЕ В СОВМЕСТНЫХ СМЕШАННЫХ СТРАТЕГИЯХ Смешанные стратегии дают новые равновесные по Нэшу ис- исходы (по теореме 1 гл. IV каждая конечная игра имеет по крайней мере один Nf-исход). С кооперативной точки зрения равновесие по Нэшу в смешанных стратегиях есть необязательное соглашение, которое обеспечивается тайностью проведения лоте- лотерей, организуемых игроками для случайного выбора оконча- окончательного решения (т. е. чистой стратегии). Пример 3. «Вежливые водители-» Модифицируем выигрыши в игре «перекресток» (пример 1 гл. III): если один водитель остановился, то для него пред- предпочтительнее, чтобы другой проехал. Остано- Остановиться Ехать 1 2 1 1+е 1 + F, 0 2 0 Остано- Ехать виться (Этот пример известен в литературе под названием «семейный спор», см. Льюс и Райфа [1957].) В дополнение к двум чистым Aff-исходам с векторами выиг- выигрышей A+е, 2) и B, 1+е) соответственно эта игра 2x2 имеет вполне смешанное равновесие, а именно с вектором выигрышей ( ] . 1 s-r— ¦'-Г8 б )• Этот смешанный / М?) \ 4\в ¦'-Г8/ МЕ-исхоя доминируется по Парето (любым чистым М?-исходом), поэтому его можно обосновать только тем, что он приносит одинаковые выигрыши идентичным" игрокам и в этом смысле является справедливым. Однако в этом смешанном WZf-исходе каждый игрок получает выигрыш !+gXi' равный гарантиро- гарантированному выигрышу в смешанных стратегиях. Вместе с тем стратегии ц*, образующие Л^/Г-исход, не являются осторожными, а потому не гарантируют игроку этого выигрыша. Для проверки этого утверждения заметьте, что цена игры (Alf Xs, ur) в смешанных стратегиях равна l+s-r— и единст-
Гл. V. Стабильные соглашения 139 венная седловая пара есть (\к\, \if), где Более того, откуда ясно, что смешанная NЕ-стратегия ц* является более рискованной, чем осторожная стратегия ц?. Единственным стра- стратегическим аргументом в пользу равновесия в смешанных стратегиях можно считать свойство стабильности. Если игроки могут тайно проводить лотереи, то необязательное соглашение о реализации вполне смешанного Aff-исхода является стабиль- стабильным. Следовательно, для каждого игрока действия остальных вполне предопределены. С этой точки зрения аргументация в пользу осторожных стратегий обманчива, поскольку приме- применение осторожных смешанных стратегий индуцирует последо- последовательность наилучших ответов, что делает окончательный исход совершенно непредсказуемым. С одной стороны, смешанный М?-исход является разумным, если игрок считает своего партнера столь же рациональным, как и он сам, хотя Л/?-стратегия является более рискованной, чем осторожная стратегия, если партнер может сыграть глупо. С другой стороны, осторожная смешанная стратегия выбирается из соображений минимума риска и, следовательно, безопасна, насколько это возможно. Тем не менее у рационального игрока возникает желание одностороннего отклонения от исхода, со- состоящего из пары смешанных осторожных стратегий, поскольку такое отклонение увеличивает выигрыш. Возвращаясь к игре «перекресток», построим теперь случайный механизм, который не сводится к независимой рандомизации стратегий, причем этот механизм позволит сделать рановесныи исход оптимальным по Парето. Пример 3'. Игра «перекресток со светофором-» Игроки сооружают специальный случайный датчик, который показывает (зеленый, красный) и (красный, зеленый) с равной вероятностью. Соглашение состоит в том, что на зеленый свет следует проезжать без остановки, а на красный—останавли- красный—останавливаться. Это соглашение является стабильным, поскольку при каждом исходе лотереи получается равновесие по Нэшу. Резуль- Результирующее математическое ожидание выигрыша равно ~ + -^- для каждого игрока, тем самым обеспечивается оптимальность по Парето и справедливость.
140 Ч. II. Кооперативное поведение игроков Определение 2 (Ауман [1974]) Для игры G = (X{, и{; i?N) с конечными множествами стратегии обозначим через L = (L(x))x6xN совместную лотерею, т. е. вероятностное распределение на XN. Для всех i g N и для всех х{ € Х; обозначим через Lx условную вероятность реали- реализации xt€XN\{i]. г • L (X{, xt), если знаменатель не h yt) равен нулю- 0, если L(xh yt) = 0 для . |^ всех yt^XNSlt]. Скажем, что L есть равновесие в совместных смешанных стратегиях в игре G, если выполнены следующие неравенства: Vi € ЛГ, УХ{, yt € X,- 2 и, (х0 xt) Lx. (xf) > t(X,). C) Обозначим через CE(G) множество всех равновесий в совмест- совместных смешанных стратегиях в игре G. Кооперативный сценарий, служащий обоснованием опреде- определения 2, состоит в следующем. Игроки совместно сооружают случайный датчик, который может производить выбор исходов л; € -^yv c вероятностью L (х). Если реализовался исход д:, то игрок i получает информацию только о компоненте х(. Далее каждый игрок выбирает свободно и независимо, а также тайно свою настоящую стратегию. Сигнал xi воспринимается игроком i как необязательное предложение сыграть х{. Условия C) озна- означают, что выполнение соглашения о выборе х{ игроком i обес- обеспечено автоматически при той ограниченной информации, ко- которая доступна каждому игроку. В самом деле, пусть участ- участнику i предложено использовать стратегию xt. Он выводит из общего распределения L, что с вероятностью Lx(xt) набор xt будет выбран. Следовательно, [",•(</«> '). Ц-]= 2 ««(У{, xt) Lx.(xt) x*x есть математическое ожидание его выигрыша при применении стратегии yi € X{, если все остальные игроки согласны в вы- выборе стратегий следовать сигналу. Таким образом, условие C) означает, что использование стратегии, предложенной датчиком, есть оптимальный ответ игрока i при заданном уровне инфор-
Гл. V. Стабильные соглашения 141 мированности в предположении, что все остальные игроки под- подчиняются сигналу. Предположим, что стратегия xt такова, что L(xt, *f) = 0 для всех xt €.XN\{i], т. е. вероятность того, что стратегия х{ будет предложена датчиком, равна нулю. Для такой стратегии х-х условие C) выполняется тривиально, следовательно, мы мо- можем переписать систему C) в эквивалентном виде Vt 6 N Vx,-, уi ? X, 2 ut (xh x,) L (xt, xt) > Xi6XN\{i} > 2 ",.(</;, x,)L(Xi, x,). D) ХГе N\{i) Отсюда следует, что лотерея L является равновесием в сов- совместных смешанных стратегиях тогда и только тогда, когда она удовлетворяет системе линейных неравенств D). Эта система всегда имеет решение, как показывает следующий результат. Лемма 1. 1) Множество СЕ (G) равновесий в совместных смешанных стратегиях в игре G является непустым выпуклым компактным подмножеством единичного симплекса в Rxn. 3) Если Ц — (ц{I еn является исходом смешанного рашире- ния игры G, т. е. исходом игры Gm, то определяемая по этому исходу лотерея L= (g) ц. L (x) = ® ц, (х) E) F/V есть равновесие в совместных смешанных стратегиях в игре G тогда и только тогда, когда ц—ситуация равновесия поНэшу в игре Gm. Доказательство. Пусть ц = (цг),- s N — исход игры Gm и L — соответствующее произведение лотерей, заданное равенством E). Тогда система D) примет вид HiixJ-u;^., nl)^ni(xi)uiFyr f*f) для всех I, x{, у{. F) Это неравенство очевидно, если ц{ (х{) = 0. Следовательно, си- система F) эквивалентна системе щ(Ьх., |i,) > щ (Ьу., Ц,) для всех i%N, ^€[^1. У{^Хг- G) Предположим теперь, что Ц—смешанный NE-hcxor в игре G. Тогда по теореме 2 гл. IV система условий G) выполнена. Обратно, из G) следует, что и~{ (Ьх., nt) не зависит от х{ g [\it] и, следовательно, равно u,(fi). Это завершает доказательство второго утверждения леммы 1.
142 Ч. II. Кооперативное поведение игроков Далее из теоремы Нэша (теорема 1 гл. IV) следует, что множество NE(Gm) не пусто, откуда получаем непустоту мно- множества CE(Gm). Выпуклость и компактность последнего мно- множества следует из приведенного выше замечания о том, что СЕ (Gm) определяется системой нестрогих линейных нера- неравенств. Щ Рассуждения, которые обосновывают стабильность соглаше- соглашения, базирующегося на равновесии в совместных смешанных стратегиях, во многом аналогичны кооперативному подходу к равновесию по Нэшу. В самом деле, согласно лемме 1 NE- исход как в исходной игре, так и в ее смешанном расширении, отождествляется с равновесием L в совместных смешанных стратегиях, где вероятностное распределение L есть набор не- независимых случайных индивидуальных стратегий. В этом слу- случае нет никакой корреляции стратегий различных игроков. Первый наиболее простой путь получения преимуществ от корреляции индивидуальных стратегий состоит в том, чтобы брать выпуклые комбинации МЕ-исходов. При этом получается лотерея L типа р 2 К = 1, 2 , 2 для всех а, (8) а=1 а=1 где Ьх—лотерея, в которой исход х выбирается с вероятностью 1, а ха—М?-исход в игре G. Такая лотерея является равновесием в совместных смешанных стратегиях в игре G (заметим, что выпуклая комбинация смешанных М?-исходов также содержится в СЕ (Gm)). Светофор (пример 3') служит примером такого СЕ- исхода. Во многих играх, однако, множество исходов равнове- равновесий в совместных смешанных стратегиях шире, чем выпуклая оболочка равновесий по Нэшу. Это показано в следующем примере. Пример 4. «Музыкальные стулья» Предлагается нестандартная версия игры «музыкальные стулья». Имеются два игрока и три стула, помеченные цифрами I, II, III. Стратегия игрока состоит в выборе стула. Оба иг- игрока несут потери при выборе одного и того же стула. Если же их выборы различны, то тот игрок, скажем i, чей стул сразу следует за стулом игрока /', выигрывает вдвое больше, чем игрок / (предполагается, что I следует за III). Итак, возникает биматричная игра:
Гл. V. Стабильные соглашения ш Стул I Стул II Стул И! 0 0 2 1 1 2 1 2 0 0 2 1 2 1 1 2 0 0 , Стул I Стул II Стул III В исходной игре нет равновесий по Нэшу. Единственное вполне смешанное равновесие по Нэшу таково: 1 s 1 1 •1 2 j з 3 Этот симметричный исход приносит каждому игроку выигрыш, равный единице, и доминируем по Парето. Причина этого в том, что в смешанном исходе (ц*, \nf) плохой детерминированный исход (i, i) реализуется с вероятностью 1/3. Рассмотрим сле- следующую лотерею L на Х1хХг: О, если хг = xt 1= 4- 0 1 6 1 6 6 0 1 6 J_ 6 1 6 0 Утверждается, что L есть равновесие в совместных смешан- смешанных стратегиях в игре (9). Предположим, например, что реа- реализовался детерминированный исход B, 3) и, следовательно, игроку 1 предлагается использовать стратегию II. При данном L игрок 1 может вывести, что игроку 2 предложено использовать одну из стратегий I или III с одинаковой вероятностью 1/2. Другими словами, предполагая, что игрок 2 согласен выбирать стратегию, поступающую с датчика, игрок 1 тем самым считает,
144 Ч. II. Кооперативное поведение игроков что игрок 2 использует смешанную стратегию ц2 = — б, + у б1М. Наилучший ответ на эту стратегию и есть стратегия II, по- поскольку "i (бн> Ш) = т > Щ (8„ ц2) = 1 > их F,ц, ц2) = i-. Аналогично игрок 2, которому поступает сигнал применять стратегию III, выводит, что игроку 1 предлагается выбрать стратегию I с вероятностью 1/2 или стратегию II с вероятно- вероятностью 1/2. В этом случае стратегия 3 является наилучшим от- ответом игрока 2 на смешанную стратегию ц, = y6j +4" 6ц ИГ. рока 1. В силу симметричности нашей игры мы получаем свойство стабильности C) лотереи L при любых допустимых реализациях. Заметим, что лотерея L приводит к оптимальным по Парето и справедливым выигрышам C/2, 3/2), что побуждает игроков вступать в кооперацию на основе использования совместных смешанных стратегий. Основной чертой необязательного соглашения применять стратегии, вырабатываемые датчиком L, является распределение информации. Оба игрока информированы о лотерее L, которую они выбрали по кооперативному согласию, тем не менее, после того как исход х реализовался как результат применения ло- лотереи, игрок i получает информацию только об t-й компоненте х{. Он не может наблюдать сигнал х;-, полученный другим игро- игроком /, а может только вывести из распределения L, что веро- вероятностное распределение х{ есть Lx.. Конечно, если L прини- принимает вид (8) при (Х1)аф(Х{)а, для всех I, а. Фа', т. е. рас- распределение L сосредоточено в точках ха, то сигнала xi% a до- достаточно для игрока /, чтобы в точности выяснить сигналы, посылаемые остальным игрокам. В этом случае свойство ста- стабильности C) требует, чтобы каждый исход был М?-исходом в первоначальной игре (см. пример 3'). Пример с музыкаль- музыкальными стульями объясняет, каким образом разумное ограниче- ограничение возможностей обмена информацией оказывается выгодным с кооперативной точки зрения. Замечание 1 Естественным обобщением определения 2 является рассмот- рассмотрение возможных отклонений любой коалиции Т с использо- использованием при этом совместной смешанной стратегии L'T на Хт и распространение свойства сильного равновесия на данный ран- рандомизированный случай. Это привело бы к понятию «сильного равновесия в совместных смешанных стратегиях», для которого тем не менее нельзя ожидать получения общих условий суще- существования: см., например, игру двух лиц из примера 5 ниже,
Гл. V. Стабильные соглашения 145 в которой ни одно равновесие в совместных смешанных стратегиях не является оптимальным по Парето. В следующем примере в качестве равновесия в совместных вмешанных сратегиях нельзя получить ничего, кроме единст- единственного равновесия по Нэшу. Тем не менее будет приведен новый механизм кооперации, который является более обяза- обязательной формой стабильного соглашения, основанного на сов- совместных смешанных стратегиях, и который позволит улуч- улучшить по Парето М?-исход. Пример 5. Конкуренция со специализацией Два дуополиста снабжают рынок одним товаром, но разного качества. Игра является симметричной. Каждая фирма может выбрать одну из трех стратегий: низкое (L), среднее (М), вы- высокое (Я) качество. Если оба поставят товар низкого качества или оба—высокого, то каждый получает нулевую прибыль. Если один игрок выбирает среднее качество, а другой — высо- высокое или низкое, то игрок, предложивший среднее качество, получает прибыль 2. Если оба товара среднего качества, при- прибыль обоих игроков равна 1. Для получения максимальной суммарной прибыли одна фирма должна предложить высокое качество, а другая —низкое, при этом игрок, предложивший высокое качество, получает 3, а предложивший низкое качество получает 1. Заметим, что эта модель может интерпретироваться как известная игра «размещение отелей». Игрок 1 < М Н 0 0 2 0 3 1 0 2 1 1 0 2 1 3 2 0 0 0 I М Н Игрок 2 Для игроков, придерживающихся некооперативного поведе- поведения, эта игра разрешима по доминированию: сначала выбра- выбрасываются стратегии L, затем Н. Таким образом, (М, М) яв-
146 Ч. II. Кооперативное поведение игроков ляется (единственнымх)) М?-исходом как самой игры, так и ее смешанного расширения. Эта игра также имеет единственное равновесие в совмест- совместных смешанных стратегиях, которое реализуется на лотерее, выбирающей (М, М) с вероятностью 1 (для проверки этого утверждения заметьте, что С?-лотерея приписывает нулевой вес любой строго доминируемой стратегии, и затем примените это замечание дважды). Тем не менее оптимальный по Парето выигрыш B, 2) может быть получен в результате следующего соглашения. Построим лотерею с вероятностным распределением L=-^b{H, d+ yfyL, Н). Каждый игрок независимо и тайно выбирает и посылает ней- нейтральному арбитру, который выбран обоими игроками, обяза- обязательный сигнал s;, принимающий одно из четырех значений для каждого игрока: три чистых стратегии и сигнал ОВ (согласно лотерее). Получив пару сообщений (s1( s2), арбитр определяет случайный исход (xt, x2) в соответствии с лотереей L. Финаль- Финальный исход игры определяется по следующему правилу (за этим следит арбитр); (xlt s2), если s1 = OB, s2 = L, M, Я, (Sj, хг), если s1 = L, M, H, sz = OB, (sj, s2), если st — L, M, H, i — l, 2. Другими словами, сообщение ОВ является обязательством применять стратегию, выпавшую по лотерее, причем это обя- обязательство принимается до проведения лотереи. Сообщение типа М есть просто обычная чистая стратегия М. Как и в слу- случае равновесия в совместных смешанных стратегиях, выполне- выполнение соглашения с проведением лотереи L обеспечено автомати- автоматически. В самом деле, п, (ОВ, ОВ) = 1 их (Я, L) +1 Ul (L, Н) > иу {уи ОВ) = = -2-«i(</i, ^) + Y"i(f/i. Щ для всех yt в {L, М, Щ, us(OB, OB)^=~u2(L, Я) + 1и2(Я, L) = 2>«2@5, y2) = = -2-ы2(Я, уг) + ^иг(Ь, уг) для всех уг в {L, М, Я}. х) В данном случае доминирование является строгим: дг; строго домини- доминирует yi, если ы/(jc,-, xt) > U{(yi, *f) для любого набора xs?X(.—Прим. перев.
__ Гл. V. Стабильные соглашения 147 В противоположность равновесию в совместных смешанных стратегиях решение о согласии с лотереей не может быть отме- отменено после реализации конкретного исхода: это решение должно быть принято раз и навсегда до случайной реализации. Определение 3 (Мулен, Виал [1978]). Для всех i?N обо- обозначим Lt сужение распределения L на XNS^}, а именно: Lt(xt)= 2 L(xh хг) для всех xt. Скажем, что лотерея L есть слабое равновесие в совместных смешанных стратегиях в игре G, если выполнены следующие неравенства: U{ (X) L. (X) ^ ?i Обозначим через WCE (G) множество слабых равновесий в игре G. Лемма 2. A) Множество WCE(G) есть непустое выпуклое компактное подмножество единичного симплекса в RXn. Оно содержит множество CE(G) равновесий в совместных смешан- ных стратегиях. 2) Если ц—исход игры Gm, то соответствующая лотерея L= ® Hi является слабым равновесием в совместных смешан- смешанны ных стратегиях в игре G тогда и только тогда, когда исход ц есть равновесие по Нэшу в игре Gm. Доказательство. По определению 3 лотерея L принадлежит множеству WCE(G) тогда и только тогда, когда У"€# yfy{?Xt 2 ы, (*)?(*)> 2 и,(у„ x,)L(x). X S Хд/ х 6 Ж/,/ Эти неравенства получены из системы D) суммированием по Х;$Х{ при фиксированных i и у{. Итак, окончательно имеем CE(G)(=WCE(G). Остальные утверждения леммы 2 очевидны. Щ Определение 3 является последним шагом в развитии кон- концепции стабильных соглашений, основанных на рандомизации и на тайном выборе стратегий. Начав с равновесий по Нэшу в чистых стратегиях, мы сначала допустили независимую рандо- рандомизацию индивидуальных стратегий (смешанные стратегии) и установили, что стабильные соглашения существуют, если игроки имеют возможность проводить свои лотереи тайно (теорема 1 гл. IV). Далее, если игроки могут устраивать сов-
148 Ч. Л. Кооперативное поведение игроков местные лотереи и посылать изолированные сигналы каждому участнику, то множество равновесий становится выпуклым. Из лемм 1 и 2 следует, что NE (G) с NE (G.) с СЕ (G) с WСЕ (G). Проходя по этой цепочке включений слева направо, мы должны накладывать все больше информационных ограничений для того, чтобы равновесный исход стал стабильным соглаше- соглашением. Для ME -исхода и для смешанного М?-исхода требуется только соблюдение секретности в выборе индивидуальных стра- стратегий. Для С?-исхода мы должны в дополнение к этому по- потребовать, чтобы отдельные игроки могли наблюдать только свои собственные реализации совместной лотереи. Для WCE- исхода нужен нейтральный арбитр, который реализует случай- случайный исход лотереи, ничего не сообщая отдельным игрокам. Затем этот арбитр спрашивает независимо и тайно каждого игрока, согласен ли тот «вслепую» использовать ту стратегию, которая реализовалась при проведении лотереи. Далее он должен сообщить тем игрокам, которые добровольно согласились с про- проведением лотереи, выпавший исход и заставить этих игроков действительно использовать рекомендованные стратегии. Короче говоря, арбитр должен иметь возможность пресекать любое стратегическое использование конкретной реализации лотереи. Общей чертой этих сценариев с усложняющейся информа- информационной структурой является невозможность по достижению договоренности о выборе некоторой совместной стратегии вести прямой обмен информацией между игроками. В случае много- многократного проведения лотереи кооперация становится неявной, и трудно обнаружить cav факт ее существования. Такая форма молчаливого сговора описана в литературе о поведении фирм в условиях олигополии: «Среди соглашений, возможных при олигополии, выделим те, при которых нет явного обмена ин- информацией между участниками. Одним из примеров такого соглашения является «сговор по электрическому оборудованию 1950-х годов» (Шерер [1970]), в который были замешаны 29 компаний США, продающих различные виды товаров. Прави- Правительство США организовало аукцион, в котором каждая фирма должна была тайно и независимо друг от друга назвать свою цену на некоторый вид электротехнического оборудования. Однако фирмы провели предварительные секретные переговоры, в которых была определена доля каждой фирмы, участвующей в аукционе. Затем продавцы согласовали свою политику назна- назначения цен на аукционе так, чтобы каждый из них оказался предложившим наименьшую цену (и, следовательно, получил бы заказ от правительства) достаточное число раз для захвата заранее определенной доли рынка. Это было достигнуто за счет
Гл. V. Стабильные соглашения 149 раздела рынка на четыре зоны, причем к каждой зоне были приписаны различные продавцы. Продавцы, прикрепленные к одной зоне, чередовали свои ставки. При определении при- привилегии назначения наименьшей цены ориентировались на «фазы луны». В результате получился якобы случайный про- процесс, имитирующий независимое поведение участников» (Жерар-Варе, Мулен [1978]). Упражнение 4 Докажите, что в игре «музыкальные стулья» (пример 4) все четыре множества NE (G), ME (GJ, СЕ (G) и WCE (G) различны. Докажите, что оптимальные по Парето С?-выигрыши покрывают отрезок (_(т> !")• D"> т)]' а оптимальные по Парето WCE- выигрыши покрывают отрезок. [B, 1), A, 2)]. Упражнение 5 Пусть в игре G = (X{, и:; i?N) каждое множество Xt состоит из двух элементов. Докажите, что CE(G)=WCE(G). Задача 1 Слабое равновесие в совместных смешанных стратегиях и равновесие по Нэшу (Мулен [1976]) Фиксируем игру двух лиц G = (Xv X2, ult и2) с конечными множествами стратегий Xlt X2 и обозначим через Gm — = (Mlt M2, Mj, u2) ее смешанное расширение. Для совместной лотереи L обозначим через Llt L2 (вместо L%, Li) сужение L соответственно на Xt, X2. Заметим, что L^Mi, i=l, 2. Обозначим, наконец, через [«,-, L] математическое ожидание выигрыша игрока i, i=\, 2, при лотерее L. 1) Исход (uf, ]if) игры Gm назовем сверхравновесием по Нэшу ((fif, nf") € N+E (Gm)), если не существует такой лоте- лотереи L, для которой выполнено f ut (nf, Lj)^[uh L] для i= 1, 2, )Ф i, \ причем по крайней мере одно неравенство строгое. Интерпретация: для любого возможного соглашения L либо у какого-то игрока возникнет желание выбрать стратегию N+E(Gm) (ui(\i*, Lj) > [и,-, L]), либо для обоих игроков нет разницы между применением стратегии N+E (Gm) и выполнением соглашения при условии, что партнер также выполняет согла- соглашение (й, (|if, Lj) =[«,-, L] для t=l, 2, /#0- Докажите, что /У+?-исход является смешанным А^-исходом. 2) Обозначим через N+E (Gm) множество всех N+E-hcxooob в игре Gm, а через Ж+?,- проекцию этого множества на мно.
Ч. II. Кооперативное поведение игроков жество М{. Докажите, что GJ. A0) Указание: если (^1( ц2) и (vlf v2) принадлежат множеству N+E (Gm), то докажите, что «•A*1. V2) = M2(^l. Vj). 3) Докажите, что равновесие в доминирующих стратегиях является также М+?-исходом: Dx («i) X Я. («.) = tf+? (GJ. Докажите, что при условии непустоты множества N+E (Gm) множество N+Et x N+E2 содержит доминирующий по Парето элемент ц*: = 1, 2 4) Докажите, что исход pf*" = (fx*, fif) является Л^+ дом в игре Gm тогда и только тогда, когда существует дей- действительное число X, 0<^< 1, такое, что < пх (nf, хг) + (\-Цпг (хи ^t) A1) (где с некоторым нарушением принятых обозначений щ (ц{, xj) стоит вместо и, (fi;, 6* )). Выведите отсюда, что множества N+E(Gm) и Af+?f, 1 = 1, 2, компактны. 5) Предположим теперь, что функция щ действительно за- зависит от х{, 1 = 1, 2, т. е. ut(xlt Xj)^Ui(x., xj). A2) Обозначим через W°CE(Gm) (возможно пустую) внутренность множества WCE (Gm) относительно единичного симплекса в IR*'**». Докажите следующую эквивалентность: L € WCE (GJ 4Ф [й, (х„ Lj) < [и„ L], i = 1, 2, / =? j, л;, € XJ. A3) 6) В дополнение к A2) предположим, что ни у одного иг- игрока нет доминирующей стратегии в игре Gm. Докажите следующую эквивалентность:
Гл. V. Стабильные соглашения 151 Указание: Полагая, что Z = Xt (J Хг есть объединение мно- множеств Хх и Х2, которые считаются непересекающимися, рассмо- рассмотрите следующую действительную функцию /, определенную на X{i2}XZ: fz?Z f((xv *, u1(x1, xj — u^z, x2), если и2(хи хг) — иг(хи г), если Проверьте, что цена v игры (Х{12}, Z, /, —/) в смешанных стратегиях является неотрицательной. Покажите, что величина v равна нулю тогда и только тогда, когда для некоторого %, 0<^<1, выполнено нера- неравенство A1). Покажите далее, что величина v положительна в том и только в том случае, если существует лотерея L, для которой выполнены неравенства из правой части A3). ЛИТЕРАТУРА Аумаи (Aumann R. J.) [1959] Acceptable points in general cooperative n-person games. Contributions to the theory of games, vol.4. Annals of Math. Studies, 40, Princeton, Princeton University Press, 287—324. [1974] Subjectivity and correlation in randomized strategies, Journal of Mathe- Mathematical Economics, 1, 67—96. Жерар-Варе, Мулен (Gerard-Varet L. A., Moulin H.) [1978] Correlation and duopoly, Journal of Economic Theory, 19, 1, 123—149. Льюс, Райфа (Luce R. D., Raiffa H.) [1957] См. литературу гл. I. Мулен (Moulin H.) [1976] Correlated and prudent equilibria of a two-person game, Cahier de Mathematiques de la Decision n) 7605, Paris, University Dauphine. Мулен, Виал (Moulin H., Vial J. P.) [1978] Strategically zero-sum games International Journal of Game Theory, 7, 3/4, 201—221. Шерер (Sherer F. M.) [1970] Industrial pricing. Chicago, Rand Mac Nally.
ГЛАВА VI СТАБИЛЬНОСТЬ НА ОСНОВЕ УГРОЗ В этой главе будем предполагать, что игроки по-прежнему стремятся к кооперации, однако, принимая во внимание стра- стратегическую взаимозависимость, присущую игре в нормальной форме, они теперь при выборе собственной стратегии учитывают возможную реакцию остальных. Угрожая друг другу, они мо- могут стабилизировать весьма обширное множество исходов. Поэ- Поэтому будем рассматривать угрозы как механизм кооперации. В течение длительного времени кооперация при взаимных предостерегающих угрозах изучалась в экономической литера- литературе, посвященной проблемам олигополии. Так, например, при рассмотрении дуополии по Курно (пример 5 гл. III) отмечалось, что исход, реализующий наибольшую суммарную прибыль, не является равновесием по Нэшу, поскольку одностороннее уве- увеличение какой-либо фирмой своего предложения увеличивает ее текущий доход. Это действие вынуждает другую фирму также увеличивать свое предложение, что в результате приводит к тому, что оба игрока проигрывают по сравнению с исходной ситуацией. Как отмечает Шерер [1970], «каждая фирма с большой неохотой идет на такие меры, которые могут в ре- результате реакции других фирм привести к последствиям, неже- нежелательным сразу для всей отрасли» (см. также пример 5 ниже). Предостережение является весьма мощным механизмом кооперации. Для достижения стабильности соглашения игроки угрожают друг другу, т. е. объявляют некоторую схему реа- реагирования на возможные отклонения. Поскольку отклоняюще- отклоняющемуся игроку может стать плохо, если объявленная угроза осуществится, то он поостережется отклоняться, и необязатель- необязательное соглашение окажется стабильным. Таким образом, предостережение является «разумным исполь- использованием потенциальной силы». Успешной является та угроза, которая никогда не реализуется (Шеллинг [1971]). Стабильные соглашения, рассматриваемые в гл. V, требовали полной секретности принятия стратегических решений. В про-
Гл. VI. Стабильность на основе угроз 153 тивопо$0гкность этому угроза является эффективной только в том случае, когда отклонение нельзя скрыть. Следовательно, для достижения стабильности на основе предостережений требуется, чтобы все индивидуальные выборы стратегий производились в открытую. Известны многочисленные военные и экономические примеры ограничения на секретность в выборе стратегий в целях стабилизации кооперативных решений (см. разд. 1). Основной концепцией равновесия в данной главе является а-ядро^ т. е. множество таких исходов, которые при соответ- соответствующих угрозах являются стабильными относительно откло- отклонений любых коалиций (разд. 2) Если возможны только инди- индивидуальные отклонения, то с помощью предостерегающих угроз можно-стабилизировать любой дележ игры (разд. 1). Если а-ядро пусто, то нужны более сложные сценарии предо- предостережений, включающие контругрозы, для того чтобы стаби- стабилизировать хотя бы некоторые дележи при возможности коали- коалиционных отклонений (разд 2) Если, напротив, а-ядро не пусто, то при наложении дополнительных условий на предостерегающие угрозы возникают специфические подмножества а-ядра. Одним из таких подмножеств является Р-ядро, которое в особенности полезно при анализе повторяющихся игр (разд. 3). В разд. 4 для игры двух лиц мы определяем другое подмножество а-ядра, а именно уяДР°; 7"ЯДР° состоит из тех дележей, которые могут .быть стабилизированы при правдоподобных угрозах, т. е. при поведении, основанном на наилучших ответах. Это приводит к качественной классификации игр двух лиц. В разд. 5 содержится другая формализация игры, а именно рассматриваются игры в характеристической форме (с побочными платежами). В качестве стабильного множества для таких игр вводится ядро, которое задается в данном случае конечной системой линейных ограничений, что позволяет получить простые численные результаты. 1. ДЕЛЕЖИ Пример 1. Кооперативное решение дилеммы заключенного Некооперативным исходом дилеммы заключенного является война (пример 1 гл. I): (Alt Л2). Для того чтобы обеспечить мирный исход (Pr, fj) при кооперации, каждый игрок объяв- объявляет принцип своего поведения: «как ты, так и я», т. е. |«еслй ты будешь вести себя мирно, то я тоже буду вести себя мирно, A) если ты будешь агрессивным, то и я буду агрессивным» Приняв во внимание такую угрозу от своего оппонента, каждый игрок предпочтет быть миролюбивым, так как это при-
154 Ч. II. Кооперативное поведение игроков водит к миру (исход (Plt Рг)), иначе будет война (исход (Аи Аг)). Так проявляется свойство стабильности' угрозы A). Двусторонние угрозы не образуют пару допустимых дейст- действий. Для того чтобы реализовать поведение типа A), игрок должен действовать как ведомый, т. е. знать выбор партнера. Если игроки выбирают стратегии раз и навсегда, то только один игрок может находиться в положении ведомого. Вместе с тем дилемма заключенного является симметричной игрой, и мы хотим, чтобы кооперативный исход (мир) был обеспечен сценарием предостережений, в котором игроки имели бы сим- симметричные роли. Для преодоления этой трудности можно пред- представлять себе, что игра является повторяющейся и совокупный выигрыш будет, грубо говоря, взвешенной ?суммой текущих выигрышей. Если краткосрочный доход от некооперативного отклонения перекрывается долгосрочными потерями, возникаю- возникающими в результате реакции типа A), то сценарий предостере- предостережений обеспечивает стабильность мирного кооперативного исхода (см. разд. 3 ниже). Здесь мы приведем наиболее простую с мате- математической точки зрения конструкцию для формализации коопе- кооперации на основе угроз. Игрокам нужно только прийти к дого- договоренности о некотором исходе игры, и для каждого игрока выбрать угрозу, предостерегающую его от отклонения от данного исхода. Определение 1. Пусть G = (Х{, и,-; i ?N) — игра в нормальной форме. Назовем сценарием предостережений набор (х, |?; i € N), где х € XN — исход игры G, а |i для всех i ? N обозначает угрозу игроку i, т. е. отображение из Xt в Хл/\{о» такое, что B) Проиллюстрируем сценарий предостережений, рассматривая игру, разыгрываемую на бесконечном интервале времени. В каж- каждый конкретный момент времени каждый игрок выбирает неко- некоторую стратегию, причем он может поменять свою стратегию в любое время. Игра происходит в открытую, т. е. стратегии всех игроков всем известны. Это главное информационное пред- предположение, которое делает невозможным тайное нарушение договора. Игрок, который выполняет соглашение, вначале выбирает согласованную с остальными стратегию х1 и затем наблюдает за текущими стратегиями ys других игроков. Пока yi = Xt, игрок i сохраняет стратегию xh как только какой-то игрок, скажем /, переключается на стратегию у,- Ф xJ} игрок i переключается раз и навсегда на t-ю компоненту |?(yf). Условие стабильности B) означает, что если все игроки выполняют договор, основанный
Гл. VI. Стабильность на основе угроз 155 на сценарии предостережений, то ни у какого игрока не воз- возникает повода для (одностороннего) нарушения соглашения. В самом деле, выигрыш на бесконечном интервале времени всегда превышает выигрыш на любом промежутке конечной длины. В определении 1 учитываются только отклонения отдельных игроков. В следующем разделе это определение будет обобщено на случай отклонений коалиций (см. определение 3). Конечно, иногда трудно выполнить требование вести игру в открытую. Так, в частности, при современном вооружении неожиданное нападение становится все более опасным. Таким образом, создание демилитаризованных зон, в которых видны все агрессивные действия, или соглашения о взаимной инспек- инспекции ядерного оружия — вот два примера механизмов обмена информацией типа предостерегающих угроз. Другим примером является «бюро открытых цен», которое удерживает конкури- конкурирующие фирмы от тайного применения политики скидок поку- покупателям и, следовательно, смягчает общую конкуренцию (Ше- . pep [1970]). С другой стороны, англо-японское соглашение об ограничении производства военных кораблей не включало в себя специаль- специального пункта о контроле за выполнением соглашения, поскольку оно было подписано в то время, когда тайное строительство таких объектов считалось невозможным. (См. Арон [1962].) Будем придерживаться обозначений, принятых в определе- определении 1. Лемма 1. 1. Пусть {х, tt', t'€^)—сценарий предостереже- предостережений. Тогда исход х является индивидуально рациональным: sup inf ut (у;, t/f) < щ (х) для всех i € N. C) h yt 2. Предположим, что Х(—компакт, а щ—непрерывная функция, i^N. Тогда в игре G существует по крайней мере один индивидуально рациональный исход. Для каждого такого исхода х при всех i$N существует набор угроз |f, такой, что (х, Ы i€.N) является сценарием предостережений. Доказательство. Из B) получаем *) Для всех У{€Х{. Отсюда следует первое утверждение леммы 1. Докажем обрат- обратное утверждение. При наших топологических предположе- предположениях у каждого игрока есть по крайней мере одна осторож- осторожная стратегия, скажем xt (см. лемму 3 гл. I). Тогда исход является индивидуально рациональным.
l&S Ч, П. Кооперативное поведение игроков Далее, для каждого igN и для любой стратегии у; g Xt, у1фх{ выберем элемент yt = ??(#,•)€ Xnw), такой, что «;(</«> </?) = inf "г (У/. г?) < sup inf щ (гг, 2f)<Mf(x). Это завершает доказательство леммы 1. Определение 2. Дележом в игре G — (Xh u{; i ? N) называется оптимальный по Парето индивидуально рациональный исход. Обозначим через / (G) множество дележей в игре G. Лемма 2. Пусть для любого t € N множество X,- компактно, а функция щ непрерывна. Тогда в игре G есть по крайней мере один дележ. Доказательство аналогично доказательству леммы 3 гл. I. Обозначим через IR{G) непустое компактное подмножество индивидуально рациональных исходов во множестве всех исхо- исходов игры G. Выберем далее элемент д: из IR(G), который мак- максимизирует 2 ui на //? (G). Тогда х является оптимальным по 16 N Парето исходом. Предположим от противного, что исход у домиг нирует по Парето исхода;. Тогда у g//? (G) и 2 "/(*)< 2 и/ (у)- ieN i6 N Полученное противоречие доказывает лемму. Дележ является оптимальным по Парето исходом и приносит каждому игроку по крайней мере его гарантированный выиг- выигрыш. По лемме 1 любой дележ является исходом оптимального по Парето сценария предостережений, т. е. необязательного соглашения, стабильного относительно индивидуальных откло- отклонений, а также относительно возражений коалиции N всех игроков (оптимальность по Парето). С другой стороны, двумя минималь- минимальными требованиями для кооперативных соглашений как раз и являются индивидуальная рациональность («никакого игрока нельзя заставить получать меньше гарантированного уровня, пока он сам контролирует выбор собственной стратегии») и опти- оптимальность по Парето (поскольку договор заключается при еди- единогласном одобрении всех участников). Следовательно, множество / (G) является максимальной областью переговоров о коопера- кооперации. Если игра G несущественна (или почти несущественна, см. задачу 1 гл. III), то множество / (G) одноэлементно и коопе- кооперативный исход игры не вызывает сомнения. Но в большинстве игр множество / (G) состоит из большого количества исходов, ч выбор среди них является острой конфликтной ситуацией. Пример 2. Игра «Торг» Игрок 1 продает (неделимый) товар игроку 2. Игрок 1 должен решить, какую назначить цену; высокую или низкую. Для поку—
Гл. VI. Стабильность на основе угроз 157 пателя в принципе приемлемы обе цены. Покупатель не может спорить о цене, он может либо сделать покупку, либо отказаться от нее. Игрок 1 Высокая ценз Низкая цена 2 ' t 1 2 0 0 0 0 Покупка Отказ Игрок 2 Исход (/, /) является равновесием в доминирующих страте- стратегиях, кроме того, он оптимален по Парето. Если игроки не имеют возможности обмениваться информацией, этот исход является, по-видимому, бесспорным итогом игры, Однако это не единст- единственный дележ игры. Другим дележом является исход (/7, /). Для того чтобы выиграть (т. е. продать товар по высокой цене), игрок 1 может объявить, что он будет продавать товар только по высокой цене, т. е. действовать в качестве лидера. С другой стороны, игрок 2 выигрывает, угрожая продавцу: «Я буду по- покупать по низкой цене и откажусь от сделки в случае назна- назначения высокой цены». Это кажущееся неразумным поведение (поскольку покупатель отказывается от выгодной сделки) ока- оказывается весьма выгодным, если только продавец поверит этой угрозе. С кооперативной точки зрения мы не можем отдать предпочтение ни одному из названных сценариев предостереже- предостережения или, другими словами, не берем на себя роль арбитра в этом конфликте с двумя антагонистическими угрозами (решимостью продавца назначить высокую цену и отказом покупателя при- приобретать товар, если не будет назначена низкая цена), которые могут осуществиться одновременно только на исходе, домини- доминируемом по Парето (несостоявшаяся сделка). В разобранном выше примере покупатель выигрывает, используя «радикальную» угрозу: «На любое твое отклонение я буду реагировать минимизацией твоей функции выигрыша (т. е. я буду применять наихудший для тебя ответ)» *). Этот радикализм может привести к тому, что выполнение угрозы окажется пагубным для обоих игроков. Объявление покупателя, что он отказывается от сделки при назначении высокой Цены, является, как он надеется, только предостерегающим сигналом. Однако, для того чтобы угроза произвела впечатление, нужно, чтобы не было сомнений в том, что она будет приведена !) В отечественной литературе такая угроза получила название страте- стратегии наказания.—Прим. перев.
168 Ч. П. Кооперативное поведение игроков в исполнение. В этом смысле даже наиболее убедительные и успешные угрозы являются рискованными, если объявленная реакция на отклонения не совпадает с наилучшим ответом угро- угрожающего игрока. Сравните, например, «агрессивную» угрозу и «предупреждение» в приведенной ниже лемме 3. Соотношение между убедительностью и рискованностью пре- предостерегающих угроз для игр двух лиц проанализировано в разд. 4. Ситуация, которая имела место в примере 2, легко обоб- обобщается на произвольную игру двух лиц. Рассмотрим игру двух лиц (Х1( Х2, ых, ы2), где множества X,- компактны, а функции щ непрерывны, i=\, 2. Наилучшим дележом для игрока i является исход х1, такой, что x<€/(G), ul(xi) = sup ui(x), что можно эквивалентным образом переписать так: *€/(G), Щ(xt) = suplut(x)\uj(x)>supit)Suj(yj, y{)\. D) I »/ '/ I Более того, любые два дележа, удовлетворяющие условию D), дают один и тот же выигрыш обоим игрокам: [л; удовлетворяет D)] =Ф [uj (х) = Uj (х1), / = 1, 2]. Доказательство этих двух утверждений оставляем в качестве упражнения читателю. Лемма 3. Пусть х'—дележ, для которого выполнено усло- условие D). Пусть 1{ — (агрессивная) угроза игрока i: inf «,(</;> Уд- Пусть \j—предупреждение игрока /, т. е. угроза вида и, F/(У,), Уд = sup uj(yf, у,). F) Тогда (х1, ||, |у)—сценарий предостережений. Доказательство. Из E) получаем "/(У/. It(«//))<supinfи;(z/( г,) для всех у,?Х}\{х)}. г1 Поскольку исход х1 индивидуально рационален (a;' g IR(O)), то получаем "/ (У/, Ы<//)Х «/(*') Для всех У/
^ Г4. VI. Стабильность на основе угроз 159 С другой стороны, из F) имеем «/ (Б/ («/,). Уд > inf sup а, (z,, z{) для всех уг 6 Xt\[xfi. Ч */ Зафиксируем теперь стратегию у{, у{ Ф х\, и предположим Щ (I/ (У,), Уд > Щ (х1). Последние два неравенства в совокупности с условием х' (? GIR(G) позволяют утверждать, что y = (^J(yl)> yi)^IR(G). В силу наших топологических предположений существует опти- оптимальный по Парето исход г, для которого выполнены неравенства Щ (У) < и,- (г), uf(y)^uf(z). Таким образом, для дележа г справедливо неравенство щ (х() < <ы/(г). Получили противоречие. Итак, мы доказали, что Щ (I/ («/;). Уд < ui (*0 Для всех Vi Следуя работе Шеллннг [1971], назовем предупреждением угрозу, которая совпадает с поведением ведомого. Такие ответ- ответные действия весьма убедительны. Все остальные угрозы напо- напоминают «машину страшного суда» *). В тот момент, когда при- придется приводить угрозу в исполнение, игрок либо должен от- отказаться от рационального (с точки зрения краткосрочных ин- интересов) выбора, либо все-таки не осуществить угрозу. Таким образом, успешное применение угроз в качестве механизма пре- предостережений требует, чтобы угрожающий игрок был обязан приводить угрозу в исполнение или по крайней мере чтобы все в это верили. Упражнение 1. Метаигры (Ховард [1971], Кукушкин [1974]) Для данной игры двух лиц G = (Xit Xa, uit ы2) с конечны- конечными множествами стратегий обозначим через S(l; G) ее расши- расширение, в котором игрок 1 действует в качестве ведомого (в лем- лемме 5 разд. 4 гл. II эта игра обозначается G): Рассмотрите игру tf = SB; S(l, G)). 2) Дайте интерпретацию данной игре. 1) В оригинале «doomsday machine».—Прим. перев. '*) С игрой S из гл. II иа самом деле совпадает игра SB; п).~Прим, перев.
160 Ч. (I. Кооперативное поведение игроков 3) Докажите, что пара (а1У аг) является вектором выигры- выигрышей для некоторого М?-исхода игры Н тогда и только тогда, когда выполнены следующие два свойства.. а) (flj, а2)—допустимый вектор выигрышей в игре G, т.е. для некоторого а;*^Х{1>2} (ах, a,) = («i(**), и, б) inf sup ил(х1, х2) sup inf и2 (хи х2) ^ м3 (х*). X, X, 4) Докажите, что 1-выигрыш по Штакельбергу в игре S(l; G) (см. лемму 6 разд. 4 ниже) совпадает с наилучшим выигры- выигрышем для первого игрока на множестве дележей в игре G. Вы- Вычислите также i-выигрыш по Штакельбергу в игре Я, i = 1, 2. 2. а-ЯДРО Определение 3. Для данной игры G==(X(., ut; i?N) а-ядром игры G называется подмножество (обозначаемое Са (G)) таких исходов х*, для которых: для любой коалиции TcN и любой совместной стратегии Хт €^7 существует совместная стратегия дополнительной коа- коалиции хтс?Хтс, такая, что не выполнено условие и{(хт, хтс)^и{{х*) для всех i^T, U;(xt, xtc)> U;(x*) по крайней мере для одного В целях упрощения мы привели формулировку определе- определения 3 без точных ссылок на сценарий предостережений, в ко- котором коалиции реагируют на совместные отклонения дополни- дополнительных коалиций. Формально сценарий коалиционных предо- предостережений должен быть таким1 (**, 1т, TcN), где Ъ,тс — такое отображение из Хт в Хгс, что не найдется коалиции T^N и совместной стратегии xj ?XT, для которых было бы выполнено j «/ (Хт, 1тс(хт))^и{(х*) для всех i?T, \ и((хт, |тс (хт)) > и{(х*) для некоторого i Таким образом, х* принадлежит множеству Са (G) тогда и только тогда, когда для любой коалиции Т s. N найдется такая угроза коалиции Те против потенциальных отклонений коали- коалиции Т, что (х*, \т', T^N) — коалиционный сценарий предо- предостережений.
Гл. VI. Стабильность на основе угроз 161 По определению 3 исход х* содержится в а-ядре игры G в том случае, если любому отклонению Хт коалиции Т может быть противопоставлен ход хТс дополнительной коалиции Тс, который предостерегает по крайней мере одного члена коали- коалиции Т от принятия стратегии хт, поскольку в этом случае этот игрок проигрывает: и((хт, хТс) < ut(x*) (или все игроки коалиции Т получают такой же выигрыш, как и раньше и{(хт, xTc) — iii(x*) для всех i Применяя это свойство последовательно к коалициям T = N и Т = {if, i?N, получаем, что любой исход в а-ядре является также дележом: Ca(G)cl(G). Отметим, что оптимальный по Парето Л^-исход также являет- является дележом (вместе с пассивной угрозой, состоящей в отсутст- отсутствии реакции, он образует сценарий предостережений). Сильное равновесие содержится в а-ядре (стабилизируется с помощью пассивных угроз): NE(G)ftPO(G)cHG), SE(G)c=Ca(G). Упражнение 3 иллюстрирует эти включения. В частности, при- приведена простая игра трех лиц, в которой нет сильного равно- равновесия в то время, как а-ядро состоит из двух точек (пункт 2). В игре двух лиц а-ядро совпадает со множеством дележей и, следовательно, всегда непусто (в топологических предполо- предположениях леммы 2). Интересно отметить, что в играх по крайней мере с тремя игроками а-ядро может оказаться пустым. Пример 3. Парадокс Кондорсе Пусть N — сообщество, состоящее из нечетного числа участ- участников, которые должны из конечного множества кандидатов А выбрать одного. Кандидат выбирается большинством голосов: каждый игрок голосует за одного кандидата, и выигрывает тот, у кого наберется максимальное число голосов. Для всех i € N обозначим через и; функцию полезности игрока i на А. Полезности любых двух исходов из А считают- считаются различными, поэтому существует ровно р\ отношений пред- предпочтения, где р — \А\ — мощность множества А. Стратегии игрока i составляют множество Х,. = Л. Прави- Правилом голосования является любое отображение я из Хн в А, такое, что для всех х g XNi a=*\{i€N\xl = aW^\\i?N\xt = b\\ для всех b?A. G) При фиксированных и{, i?N, возникает следующая игра в
162 Ч. И. Кооперативное поведение игроков нормальной форме: G = (X,, и,оя; t?N). Найдем в этой игре кооператнвно устойчивые исходы. Предпо- Предположим,- что х* ? XN содержится в а-ядре, и обозначим а = л (г*). Отметим, что любая коалиция Г, в которую входит более псь ловины участников (\Т\>~\, мо#ет обеспечить избрание любого кандидата Ь, если все ее члены будут голосовать за b (это следует из G)): [xt = b для всех i€T]=$,[n(xT, xTc)-b Для всех хТс?ХТс]. Следовательно, неравенство yi g T щ ф) > щ (а) (8) противоречило бы принадлежности исхода х* а-ядру (см. опре- определение 3). Таким образом, для всех коалиций Т, содержащих большинство голосов, и для всех кандидатов Ь, Ьфа свойство (8) не должно быть выполнено. Это утверждение эквивалентным образом может быть переформулировано так: | {I € W | Щ (а) > и; (b)\\> -iyi Для всех Ь, Ьфа. (9) В силу нечетности | N | либо сама коалиция содержит большин- большинство игроков, либо ее дополнение. Если выполнено свойство (9), будем говорить, что кандидат а является победителем по Кон- дорсе для порядков предпочтений «/> '€#• Такой кандидат наносит поражение любому другому кандидату при парном сравнении. Таким образом, мы доказали: . является победителем по Кондорсе при Обратное утверждение также справедливо» мы оставляем его читателю в качестве упражнения. Данным порядкам предпочтений щ, '€^, соответствует не более одного победителя по Кондорсе (из (9)). Соответственно могут возникнуть только два случая. Случай 1. Для порядков ии i?N есть победитель по Кон- Кондорсе (а). Тогда a-ядро игры G состоит из всех исходов х, для которых п(х) = а: Са (G) = я (а). Случай 2. Для порядков щ, i$N, не существует победите- победителя по Кондорсе. Тогда a-ядро игры О пусто: Случай 2 известен под названием парадокса Кондорсе, и воз- возникающая ситуация подробно исследована в обширной литера-
Гл. VI. Стабильность на основе угроз 163 туре по теорш общественного выбора (см., например, Сен [1970], Мулен [1981] Миркин [1974]). Для того чтобы построить поряд- порядки предпочтений, при которых нет победителя по Кондорсе, предположим, что р ^ 3 и \N\ = п^3. Выберем далее трех кандидатов с, Ь, с и три натуральных числа пи пг, п3 так, чтобы было ш полнено х) \ п*+Ъ>пт ПРИ всех {k, I, т} = {\, 2, 3}. Предположим далее, что сообщество N распадается на три однородные г)уппы Nk с числом игроков пк, k=\, 2, 3, причем для всех i 6 Я{. ut (a) > и{ (b) > ut (с) > щ (а), для всех i g Vj- щ (b) > и, (с) > и{ (а) > и, (а), для всех i € V3; и, (с) > и,- (а) > щ (Ь) > и, (а), для любого а$Л\{а, Ь, с): Участники из Nt и Na кандидата а предпочитают кандидату Ь. Поскольку п. + пг > /га, то i> не может быть победителем по Кондорсе. Аналогично, большинство, состоящее из Ых U /V2, пред- предпочитает канцидата Ь кандидату с, а большинство, состоящее из Nг U Ns, пэедпочитают кандидату а кандидата с. Упражнение 2 Докажите, что дележ х из а-ядра игры G не обязательно является сил1ным равновесием. Тем не менее из пустоты мно- множества SE (G] следует пустота множества Са (G) и наоборот. Более того, ии соответствует избрание одного и того же канди- кандидата Что изменится в примере 3 при четном | N | ? В игре с пустым а-ядром кооперативная стабильность не может быть достигнута только за счет предостерегающих угроз. Даже тот факт, что стратегические отклонения могут быть со- совершены только в открытую, не гарантирует от возможного существования коалиции, для которой отклонение является вы- выгодным, несмотря на соответствующие действия остальных иг- игроков. В этом случае для обеспечения стабильности введем более гибкий сценарий поведения, в котором реакция игроков, поддерживающих соглашение, состоит в том, чтобы подкупить некоторых членов из коалиции отступников, причем таким об- образом, чтобы остальные члены коалиции отступников понесли существенные потери Напомним, что | Л/1 нечетно.— Прим. перев.
164 Ч. //. КоопеРаттное поведение игроков Рассмотрим, например, ИГРУ «выборы большинством голосов» (пример 3) с тремя игрокам» и тремя кандидатами, в которой порядки предпочтений образуют цикл Кондорсе щ (а) > «1 (Ь) > щ (с), иг (Ь) > и, (с) > и, (а), Щ (с) > и, (а) > и3 (Ь). Рассмотрим исход х— (Ь, Ь, с), при котором выбирается кан- кандидат Ь. Стабильность, исхода х может быть нарушена коали- коалицией {1, 3}: игроки 1 и 3, выбирая кандидата а, увеличивают свой выигрыш, не боясь каких-либо стратегических действий со стороны игрока 2: и,(а, *„ а)>щ{Ь, Ь, 0 для i=\, 3 и для всех х2&Х2. Тем не менее игрок 2 уожет предложить игроку 3 лучший вариант: голосуя вдвоем за кандидата с, они обеспечат его избрание, и тем самым игРок 3 получит наибольший возмож- возможный выигрыш. При этом iirpOK 1 получит наименьший возмож- возможный выигрыш. Предвидя, что игрок 2 может подкупить игро- игрока 3, игрок 1 не станет входить в коалицию {1, 3} первона- первоначального отклонейия от договора, поскольку иначе его выиг- выигрыш в конечном счете может уменьшиться: их (с) < их (Ь). Двухэтапный сценарий, в котором ход коалиции порождает контрмеры, связанные с подкупом некоторых игроков данной коалиции, для того, чтобы предостеречь остальных игроков из этой коалиции, приводит « концепции стабильности, обобщаю- обобщающей понятие а-ядра. Правда, изложенный выше сценарий уг- угроз и контругроз достаточно сложен технически. Содержатель- Содержательность такого сценария является спорной, однако это понятие обладает хорошими матек»а™ческими свойствами, а именно в работе: Лафон, Мулен [1^80] доказано, что соответствующее множество равновесных «сходов не пусто. В задаче 3 этот результат приводится для случая трех игроков. Замечание 1 В литературе по теории игр встречается несколько двух- этапных концепций стабильности: решение Неймана—Морген- штерна (Льюс, Райфа [195*]). сильное решение по Викри[1959], подрешения и сверхядро (Р°т [1976]) и др. Обзор соответствую- соответствующей литературы сМ- в Розенталь [1972]. Упражнение 3 1) Дилемма заключенного с тремя игроками. У каждого игрока есть агрессивная стратегия (А) и коопе- кооперативная стратегия (Q. Игра симметрична. Ниже перечислены
Гл. VI. Стабильность на основе угроз 165 возможные варианты выигрышей игроков: (С, С, С) приводит к вектору B, 2, 2), (А, С, С) » C, 1, 1), (А, А, С) > B, 2, 0), (А, А, А) » A, 1, 1). Например, пусть игроками являются три конкурирующие фирмы, которые могут назначить обычную цену (Q или исполь- использовать политику демпинга (А). Максимальный суммарный вы- выигрыш равен 6 (достигается, если все игроки придерживаются кооперативного поведения) и уменьшается на единицу при уве- увеличении на единицу агрессивности игроков. Каждый игрок, переключаясь со стратегии С на стратегию А, получает допол- дополнительно единицу выигрыша и уменьшает на единицу выигрыш каждого из оставшихся двух игроков. Докажите, что в этом варианте игры «дилемма заключен- заключенного» равновесие в доминирующих стратегиях доминируемо по Парето и не существует сильного равновесия. Докажите также, что в этой игре ровно четыре дележа и а-ядро совпадает со множеством дележей. 2) Каждый игрок может выбрать одного из трех игроков, в частности самого себя. Таким образом, Выигрыши в этой игре частично приведены ниже, а остальные векторы выигрышей восстанавливаются в силу симметричности игры1). (хи хг, х3) = {1, 2, 3} выигрыши: @, 0, 0), = {1, 2, 1} » @, 0,-1), = {1, 3, 1} » @, 0, 0), = {1, 1, 1} » C, 1, 1), = {1, 3, 2} » @, 2,2), = {2, 3, 1} » B, 2,2), = {2, 3, 2} » (-1, 3, 3). Докажите, что в этой игре нет ни равновесия по Нэшу, ни сильного равновесия. Докажите, что каждый из пяти дележей данной игры отно- относится к одному из двух типов: A, 1, 1) игрок выбирается единогласно, х) Каждый исход этой игры можно представлять себе как ориентиро- ориентированный граф с тремя вершинами и тремя дугами. Таких графов семь с точностью до изоморфизма.— Прим. перев.
Ч: II. Кооперативное поведение игроков B, 3, 1) каждый игрок получает ровно по одному голосу. Докажите, что а-ядро состоит из двух исходов типа B, 3, 1). Задача 1. Теорема Накамуры (Накамура [1979]) Для данного конечного сообщества N правильная простая игра *) задается подмножеством W множества непустых коали- коалиций из N, для которого выполнены следующие свойства: Для данного конечного множества кандидатов А правилом голосования сообщества /V по выбору кандидата нз А является отображение л из AN в А (каждый игрок выдвигает ровно одного кандидата). Скажем, что правило голосования я порож- порождено правильной простой игрой W, если выполнено следующее свойство: Vx?AN VagA [ЗТ$W VtgF i/aj]*[a(r) = a]. Обозначим через L(A) множество (линейных) порядков на множестве А, а через u?L(Ay совокупность порядков пред- предпочтений на А: для каждого l?N функция ut показывает полезность элемента а для игрока i (равенство полезностей для различных элементов из А недопустимо). Заданная правильная простая игра W и правило голосова- голосования л, порожденное W, определяют для каждой конкретной совокупности порядков предпочтений и игру G (и): множество стратегий X, = А, функция выигрыша игрока i: щ о л для всех t$N. 1) Обозначим через С (и) следующее, возможно пустое, подмножество А: a&C(u)&Vb&A {i6-N\и,(а) < щ (Ь)\| W. Докажите, что С (и) является образом при отображении я а-ядра игры Q (и). В предположении, что простая игра W является сильной, т. е. выполнено условие докажите, что *) Правильной простой игрой здесь называется монотонная и суперад- дитнвиая простая игра (см. Оуэн [1971]).— Прим. перев.
Гл. VI. Стабильность на основе угроз 167 2) Предположим, что для некоторой совокупности и мно- множество С (и) пусто. Докажите, что существует р = | А | не обя- обязательно различных коалиций Тк, &=1, ...,р, для которых выполнено Тк € W для всех k=l, .'.., р, 3) Предположим, что |Л^| = л^р==|Л|. Докажите следую- следующую эквивалентность (теорема Накамуры): где v(W) обозначает число Накамуры для простой игры W, которое определяется как минимальное число подмножеств (Та) из W, таких, что ПГа=0. а Дайте интерпретацию. Задача 2. Выборы с правом вето. Кооперативное поведение (Мулен, Пелег [1982]) . Фиксируем сообщество N, множество кандидатов А и пред- предположим, что \ = \A\-l. A0) Отображение я из AN в А называется выборами с правом вето, если Va;? ANVi?N п(х)фх{. Из A0) следует, что такие правила существуют. ' 1) Для данных порядков предпочтений u$L(A)N (см. обо- обозначения задачи 1) обозначим через CV (и) следующее подмно- подмножество множества А: где Р(Т, а, и) = {Ь?А\ V/6 Т и{ (а) < щ (Ь)\ — множество кандидатов, которых коалиция Т единогласно предпочитает кандидату а. Докажите, что CV (и) всегда не пусто. Указание: рассмотрите последовательность alt ..., а„, опре^ деленную по индукции! аг—наихудший кандидат по и± среди А, at+1—наихудший кандидат по ы<+1среди ЛХ^, ..., at\. Докажите затем, что а = А \{ах ап\ принадлежит множе- множеству CV (а).
168 Ч. //. Кооперативное поведение игроков 2) Обозначим через G (и) игру со множествами стратегий Xj = A и функциями полезности uton, i?N. Докажите, что а-ядро игры G (и) является прообразом множества CV (и) при отображении п: 3) Докажите, что множество CV (и) является образом мно- множества сильных равновесий игры G (и) при отображении я: n(SE(G(u)))=>CV(u). Указание: Выберем a^CV(и) и обозначим Qt = {&€ А |щф)<Щ (а)}. Множества Qt являются подмножествами множества Л\{а}, в котором п элементов. Более того, они удовлетворяют условию VTciV U QA>\T\. t т I Таким образом, по лемме о паросочетаниях *) элементы множе- множества Л\{а} можно занумеровать так, что а{ g Q{ для всех t?Af. Докажите теперь, что (аи ..-, an)$SE(G (и)). Задача 3. Возражения и контрвозражения в играх трех лиц2) (Лафон, Мулен [1980]) Пусть (Хи Хг, Хя; иг, ы2, «з) — игра трех лице конечными множествами стратегий Xt. Для данного исхода х^Хц, 2. з}, обозначим через Оп(х) множество возражений коалиции {1, 2} против х: [(V» У*) € <2п (*)] & Pnf ui to* У» У»] > Ui (Xl> х*> х^" *в 1.21. L v> J Контрвозражением коалиции {2, 3) против возражения (уи у2) g € Q12 (х) является пара (г2, г3)€л2хХ3, такая, что / inf и, (гг, г21 г») > irf и, (г/„ г/г> г/3), SUp «i Bj, г„ 28) < Щ (Xlt Х„ Х3). W г, Игрок 3 навязывает кооперацию игроку 2: «Если ты будешь настаивать на возражении (у1г уг), то я сделаю так, чтобы твой выигрыш был не больше т\иг(уг> у2, у3). Если же ты V» х) См. в Берж ?1962], Оре [1980].— Прим. перев, 2) Похожий анализ игры трех лиц, о*- в работе Гермейера [1973], Прим. перев.
Гл. VI, Стабильность на основе угроз примкнешь ко мне и мы выберем (г2, г3), то тебе будет обес- обеспечен выигрыш inf ы2 (ги z2, г3)». Наконец, нижнее неравенство г, в A1) предостерегает игрока 1 от внесения возражения (у1У у2). Множество DE (G) в игре G состоит из всех дележей, для которых на каждое возражение со стороны коалиции U, /} найдется контрвозражение коалиции {i, k] или коалиции {/, k}. Докажите, что множество DE (G) игры G непусто. Указание: Предположим сначала, что I (<u) = X{h2,a)- Ска- Скажем, что возражение (ylt у2) ? 013 (х) коалиции {1,2} против Л является максимальным, если 1) на него нет контрвозражения; 2) для всех возражений (zr, z2) g O12 (х) из неравенств inf и,- (г„ гг, г,) > inf щ (уи у2, у3), /=1,2, следует, что эти неравенства обращаются в равенства. Пред- Предположим далее, что множество DE (G) в игре G пусто. Опре- Определим следующую последовательность: х», {S\x% (S\x*), ...,(S*,**), где ^о — произвольный элемент множества {1зь Xх ^-максимальное возражение коалиции S' против ж*, на которое нет контр возражения (t~^\). Докажите, что любые два исхода' х1 различны, что противоре- противоречит конечности множества X 3. ПОВТОРЯЮЩИЕСЯ ИГРЫ Определение 4. 0-ядром игры в нормальной форме G= «=(Xf, u{; i?N) называется множество C$(G) исходов х*, обла- обладающих следующим свойством. Для любой коалиции Т, Т с N, существует совместная стратегия дополнительной коалиции х?с ? Xj-c, такая, что для любой совместной стратегии хт?Хт не может быть выполнена следующая система неравенств: f и{ (хт, хТс) > и,- (х*) для всех i € Т, \ и{ (хт, хТс) > и{ (х*) по крайней мере для одного t?T. Стабильность исхода из Р-ядра является более сильной, чем стабильность исходов из а-ядра: коалиция Тс Может пресечь отклонение коалиции Т, даже если члены коалиции Т выбиь рают свою совместную стратегию хт тайно. Конечно, сам факт того, что коалиция Т собирается отклониться от согласованной стратегии х*, должен быть известен, иначе игроки коалиции
170 4. II. Кооперативное поведение игроков ___ Тс не узнают о предательстве и не смогут ему ничего противо- противопоставить. Сравнивая определения 3, 4 и определение 1 гл. V, получаем Для того чтобы дать интерпретацию определению 4, предста- представим, что игра G повторяется во времени. В момент t, t=\,2, ..., каждый игрок i, зная предыдущие ходы х1, ..., х*'1, выбирает стратегию х\. Выборы игроков в момент t могут быть смешан- смешанными или коррелированными стратегиями, могут производиться независимо или после некоторого этапа обмена информацией. Важно только, чтобы реализация лотерей, проводимых в мо- момент t, становились известными к моменту / + 1. Наконец, выигрыш каждого игрока i есть среднее Чезаро его текущих выигрышей: t lira 4" ? "* И- В работах Аумана [1978] и Рубинштейна [1979]1) доказано, что все исходы из смешанного 0-ядра игры G могут быть по- получены как сильные равновесия в повторяющейся игре G (оо). Обратно, выигрыши, соответствующие сильным равновесиям в игре G (оо), покрывают выпуклую оболочку выигрышей, соот- соответствующих смешанному Р-ядру игры G. Таким образом, с помощью повторений исходной игры формализуется весьма существенная черта кооперации с применением угроз. Отклоне- Отклонения, выгодные в краткосрочном плане, становятся невыгодными в долгосрочном плане, если объявленная угроза приводится в исполнение. Для этого необходимо, чтобы долгосрочные вы- выигрыши всегда перевешивали краткосрочные, как это неявно предполагается в нашей интерпретации сценариев предостере- предостережений. Среднее Чезаро A2) обеспечивает выполнение этого условия. Мы не будем воспроизводить сложное доказательство этих результатов. Вместо этого разберем более простой вариант повторяющихся игр, в котором общий выигрыш является дис* контированной суммой текущих выигрышей. Повторяющиеся игры с дисконтированными выигрышами Предположим, что в исходной игре G = (X,-, щ; i^N) функ> ции и{ равномерно ограничены на множестве XN (например, Х{ компактны, а и( непрерывны при всех i?N) Пусть в момент 1) По этому вопросу см. также Васин [1978], Васин [1983.]— перев.
Гл. VI. Стабильность на основе угроз 171 i = 1 разыгрывается игра G. Исход игры G обозначил: через х1. Далее некоторый случайный механизм диктует либо закончить игру с вероятностью A—б), в этом случае общий выигрыш игрока i равен «^(л;1), i$N, либо продолжать игру (с вероят- вероятностью б), и тогда игра G разыгрывается заново в момент t = 2. После каждой партии игры G с вероятностью A — 6) считается, что соответствующий исход является окончательным, а с вероятностью б все предыдущие партии аннулируются, и проводится очередная партия игры G. Другая интерпретация повторяющейся игры, формально эквивалентная приведенной выше, состоит в том, что игра G разыгрывается бесконечное число раз, а общий выигрыш иг- игрока I, соответствующий последовательности исходов х1, х2,... ..., х{, ..., равен A — 8){щ(х1) + 6и, (х2)+... +&-% (*')+...} для всех i?N. A3) Известно, что при стремлении б к 1 значение ряда A3) стремится к среднему Чезаро A2), если предел в A2) существует. Положим Р? = inf sup и,-. Р,-—это максимальный выигрыш игрока i, который он может себе обеспечить при условии, что к моменту выбора своей стратегии он знает стратегии всех остальных игроков. Выберем дележ г* так, чтобы выполнялось условие Р, < и{ (х+) для всех i g N, Будем считать, что х* является соглашением, которое игроки хотят сделать стабильным в повторяющейся игре с дисконти- дисконтированием. Для этого найдем NE-hcxor о* в повторяющейся игре, который дает каждому игроку выигрыш «,•(**). Заметим, что стратегия о* игрока i в повторяющейся игре является объектом весьма сложной структуры. Эта стратегия на каждом шаге t?N сопоставляет предыстории х1, .... хх~х выбор х\ иг- игрока I. В действительности для реализации вектора выигрышей uN(x*) как вектора М?-выигрышей в повторяющейся игре достаточно рассмотреть весьма простой исход о*. Стратегия а* игрока i, которую он использует по соглашению, есть чистая стратегия xf до тех пор, пока никакой игрок / не отклонился от х* Если отклонившийся игрок / обнаружен, то стратегия of впредь диктует наказание данного игрока. Поскольку мы интересуемся только равновесиями по Нэшу, то коалиционные отклонения от о* пока не учитываются. Для того чтобы формально описать данный Л^?-исход, для каждого /€ W выберем стратегию х", игроков N\{/}, такую,
172 Ч. //. Кооперативное поведение игроков ЧТО uj(x/t Ц) = ру. Для каждого t ? N стратегия оД игрока i в повторяющейся игре определяется следующим образом: x} = xf: в момент 1 выбирать х?; если ^* = ^2= ... =xt~1 = x*, то x' = x*: в момент t при- придерживаться условленной стратегии, если все остальные игроки до сих пор делали то же самое; если хг = х2 =... = х*~*Фх*~1, тогда выбрать /, такое, что xf'1 Ф х?, и далее играть х{ = х\ = xi+' = ... . При каких условиях поведение, определяемое по о*, пре- предостерегает игроков от отклонений в одиночку? Краткосроч- Краткосрочный доход игрока i от отклонения в момент i (которому нельзя ничего противопоставить до следующей партии) должен перекрываться долгосрочными потерями от наказующего пове- поведения игроков Af\{/} (которые по предположению придержи- придерживаются стратегии о*\ш в моменты времени / + 1, t-^2, ...). Полагая uf{xt) — sup и{{х{, xf) xi и сравнивая дисконтированное значение в момент t кратко- краткосрочного дохода и* (xf)—и,- (дс*) с долгосрочными потерями, получаем следующее свойство стабильноетш uf (xt)-и{(х*)<б(щ (х*)^-р,) + б2{щ(х*)- которое эквивалентно системе неравенств Таким образом, если б достаточно близко к 1, условия A4) выполнены, и, следовательно, о* является N^-исходом повто- повторяющейся игры (с дисконтированным выигрышем A3) или со средним Чезаро A2)). Лемма 4* Если система A4) справедлива, то повторение игры G с дисконтированным выигрышем A3) имеет равновесный по Нашу исход, которому соответствует последовательность Аналогичные условия получены в работе Гермейер, Штильмаи [19751.
Гл. VI. Стабильность на основе угроз 173 исходов х* = л:1 = х2 = ... = х* — .... Таким образом, NE-выигрьш игрока i равен щ(х*). Заметим, что мы не описали полностью множество NE- исходов, возникающих при повторении игры G. Известно (см. Ауман [1978]), что множество векторов выигрышей, соответст- соответствующих Л^?-исходам, может разрывным образом зависеть от б. Приведем пример, который демонстрирует другой подход к повторяющимся играм. В этом примере каждый игрок при- принимает во внимание только последние наблюденные ходы своих партнеров. Пример 4. Повторение игры «дилемма заключенного» (Ауман [1978]) Предположим, что игра «дилемма заключенного» (пример 1, гл. 1) повторяется во времени и каждый игрок использует стационарную стратегию с памятью на один ход1). Таким обра- образом, стратегией игрока i является тройка (xt; ylt г{), где х{, yt, z{ принадлежат множеству {А, Р} и интерпретируются сле- следующим образом: 1) игрок i выбирает xt — x} в первом повторении игры С=1), 2) в момент t > 2 игрок t выбирает y[t если игрок / вел себя мирно в момент времени t — 1, и ведет себя агрессивно, если игрок / был агрессивен, т. е. 4жУц если х^ = Р, х\ = г(, если х)~х=,А. Типичной стратегией является стратегия «как ты, так и я», а именно (Р; Р, А). После того, как каждый игрок выбрал стратегию {х{; yt, z{), единственным образом определяется последовательность х1, ..., х*, ... и средний выигрыш A2). Следовательно, возникает следующая биматричная игра (8x8)j 1) В некоторых случаях рассмотрение стационарных стратегий с па- памятью на одни ход не ограничивает общность рассуждений (см. Меньши- Меньшиков [1977]),— Прим, перш.
174 Ч. II. Кооперативное поведение игроков a b с d e f 9 h 1 3 4 3 3 4 4 4 3 a 3 0 3 3 0 0 0 3 0 1 1 1 0 0 1 0 b 4 1 1 1 4 '4 1 4 / 3 1 3 2 2 2 1 3 с 3 1 3 2 2 2 1 3 3 1 2 1 2 2 1 3 3 1 2 1 2 2 1 3 0 4 2 2 2 4 4 0 e 4 0 2 2 2 0 0 4 0 4 2 2 0 2 4 0 4 0 2 2 4 2 0 4 0 1 1 1 0 0 1 0 9 4 1 1 1 4 4 1 4 3 4 3 3 4 4 4 3 Л 3 0 3 3 0 0 0 3 a = P c=P;P,A e = P';A.P f~A;A,P A5) Здесь Р—краткая запись «чисто» мирной стратегии (Р; Р, Р). Аналогично А —(А; А, А) обозначает «чисто» агрессивную стратегию. Следовательно, «северо-западная» 2x2 подматрица A5) является собственно матрицей игры «дилемма заключен- заключенного». Отметим, что для удобства вычислений мы слегка изме- изменили числа по сравнению с примером 1 гл. I (см. упр. 4 ниже). При цикличности последовательности (х{) вектор выигрышей является средним арифметическим соответствующих элементов исходной матрицы 2x2. При этом возможны три варианта: 1) (Р, А) (А, Р)(Р, А) например (Р; Р, А) против (А; Р, А); 2) (Р, Р) (Р, А) (А, А) (А, Р) (Р, Р) например (xt; P, А) против (хй А, Р) для всех xlt x3;
, Гл. VI. Стабильность на основе угроз 175 3) (Р, Р)(А, А)(Р, Р), .... например (Р; А, Р) против (f; a, P). Во всех других случаях последовательность (х{) становится стационарной после некоторого конечного числа ходов, и соот- соответствующий выигрыш является «чистым». В приведенной выше биматричной игре (8x8) две страте- стратегии каждого игрока сразу же могут быть вычеркнуты, а именно (Р; А, А) кгк эквивалентная А и (А; Р, Р) как эквивалент- эквивалентная Р. Таким образом, останется игра Fx6) с двумя равновес- равновесными по Нэцу исходами, а именно (А, А) (некооперативное равновесие исходной игры) и (Р; Р, А)(Р; Р, Л) —новый NE- исход, в котором оба игрока применяют стратегию «как ты, так и я». Интерпретация этого специфического устойчивого соглашения в повторяющейся игре в точности аналогична интерпретации сценария предостережений в примере 1. Заметим, что в игре A5) стратегия Р (мирная) не домини- руется больше стратегией А (агрессивной). Однако после после- последовательного исключения доминируемых стратегий мирная стратегия в конце концов окажется отброшенной. Оптималь- Оптимальный по Парето М?-исход (т. е. применение стратегии «как ты, так и я» обоими игроками) является исходом сложного равно- равновесия игры A5). Упражнение 4 Докажите, что игра A5) разрешима по доминированию и сложному равновесию соответствует выигрыш C, 3). Сохра- Сохранится ли этот результат, если исходная игра будет иметь струк- структуру игры «дилемма заключенного», но трем предельным цик- циклам будут соответствовать различные средние выигрыши? 4. КЛАССИФИКАЦИЯ ИГР ДВУХ ЛИЦ В этом разделе мы ограничимся рассмотрением игр двух лиц. Для таких игр а-ядро совпадает со множеством дележей, а Р-ядро и у-ядро (определение 5) являются его подмножест- подмножествами, причем по крайней мере одно из них непусто (теорема 1). С этих пор мы предполагаем заданной игру двух лиц G = = (Х1( Х2, ии и2) с конечными множествами стратегий Х1У Х2 (хотя большинство результатов, приведенных ниже, остается справедливым и для компактов Xi и непрерывных функций и{, 1=1, 2). Лемма 5, а-ядро игры G совпадает со множеством всех дележей
1?6 Ч. II. Кооперативное поведение игроков _^ fi-ядро игры G задается условиями: С вектор х* оптимален по Парето, Доказательство немедленно следует из определений 3 и 4 И поэтому будет опущено. Отметим, что Р-ядро G может быть пустым: рассмотрите, например, игру двух лиц с нулевой сум- суммой, не имеющую цены. Пример 5. Модифицированная координационная игра Два игрока выбирают натуральное число из множества {1, 2, ..., 10}. Пусть выбраны ху, х% и *х-|-л;2= 10, тогда выигрыш игрока i равен xt. В оставшихся случаях платежный вектор равен D, 0), если xt-\-x2 четно, и @, 4), если х1 + х1 нечетно. Гарантированный выигрыш игрока I sup inf u{ равен x/ Нулю, т. е. совпадает с минимальным возможным выигрышем. Дележи являются оптимальными по Парето исходами, т. е. для них выполнено xl-\-x2=l0. Тем не менее inf sup и,-= 4, i=l, 2, поэтому из леммы 4 xl xi следует, что C-ядро состоит только из трех исходов D, 6) E, 5) F, 4). Для того чтобы стабилизировать с помощью предостерегающих угроз дележ B, 8), необходимо, чтобы оба игрока согласились на выбор стратегий в открытую. В противоположность этому реализация дележа из р*-ядра требует более слабого информа- информационного ограничения: нужен лишь сигнал, информирующий игрока об отклонении его партнера. С другой стороны, во мно- многих играх двух лиц а-ядро и C-ядро совпадают. В частности, это верно для смешанного расширения, поскольку обе игры с нулевой суммой (Ми М2, ых) и (Mlt M2, — й) имеют цену. Рассмотрим подмножество таких дележей, которые могут быть стабилизированы парой предупреждений, т. е. парой угроз, совпадающих с наилучшими ответами игроков. Определение 5. -у-ядро игры G состоит из таких дележей х*, Для которых существует сценарий предостережений (х*, llt ?„), где угрозы 1„ 1 = 1, 2, суть предупреждения: Л ",(*/- ?/(*/))<«/(**>- ^х,Фх,- j U{(x.^ lt(xj))^ sup u;(xp xt)> Будем использовать обозначение Cy(G) для v-ядра.
Гл. VI. Стабильность на основе угроз 177 Лемма 6. Предположим, что функция щ взаимно однознач- однозначная, 1=1, 2. Напомним, что S{ обозначает i-выигрыш по Штакельбергу S, = sup {«,(*,, Xj)\(x{, x,)€BRf} i=l, 2, где BR,—множество наилучших ответов игрока j (см. гл. II, разд, 4). Тогда у-ядро игры G состоит из таких оптимальных по Ларето исходов х, для которых S,<m,(x) i-l, 2. A6) Доказательство. Предположим, что х*—оптимум Парето, удовлетворяющий A6). Для любого х.фх* обозначим через Xj~%j(xi) наилучший ответ игрока/. Но определению S,-имеем Щ (*,'. I/ (*/)) < S, < щ (х*), I = 1, 2, х{ф xf. Следовательно, (**, ?,, ^2) является сценарием предостереже- предостережений, а поэтому исходя* индивидуально рационален (по лемме 1; мы можем также утверждать справедливость неравенства sup inf U/^S.), Таким образом, исход х* является дележом, { / поскольку по предположению он оптимален по Парето. Докажем обратное утверждение. Пусть х* принадлежит у- ядру игры 0. Тогда существует сценарий предостережений (**, ?i» ?2)> в котором %i{xj)—(единственная в силу предполо- предположения о взаимной однозначности) стратегия наилучшего ответа игрока i на Xj. Докажем, что х* удовлетворяет A6). Выберем сначала х{=Фх*. По свойству ?у имеем Осталось доказать, что Предположим противное: щ (**)< щ (xf, х,). В силу оптимальности по Парето исхода х* получаем SUp Uf (xf, yf) = U, (xf, Xj) < U, (X*). 4f Полученное противоречие доказывает лемму.
178 Ч. II. Кооперативное поведение игроков Замечание. Предположение о взаимной однозначности может быть опущено в формулировке леммы 6, если St заменить на inf u,(xt, x,f). Доказательство аналогично предыдущему и оставляется чита- читателю в качестве упражнения. Предупреждение предполагает выбор игроками своих наи- наилучших ответов и, следовательно, является весьма правдопо- правдоподобной угрозой. Характерным примером может служить угроза «как ты, так и я» в игре «дилемма заключенного» (A) в при- примере 1). В противоположность этому любая стабилизирующая угроза, которая отличается от предупреждения, имеет черты запугивания, а именно: «Если ты отклонишься, то я пожертвую своими краткосрочными интересами, чтобы наказать тебя и тем самым обеспечить долгосрочную стабильность кооперации». В рабо- работе Шеллинг [1971] содержится замечательный пример такого сорта. В этом примере речь идет об индусском монахе, который без всякого оружия охранял в пути драгоценности одной лишь угрозой покончить с собой, если эти драгоценности будут укра- украдены. Традиции моральной стойкости оказалось достаточно для убедительности этой угрозы. Лемма 6 устанавливает связь между осуществимостью ста- стабильности с помощью предупреждений и борьбой за лидерство (гл. III, разд. 1.) Она утверждает, что в игре G возникает борьба за лидерство в том и только в том случае, если ее -у-ядро пусто. Таким образом, в игре с пустым уядрш стабильности любого дележа угрожает возможность захвата лидерства одним из игроков. Вместе с тем, другой игрок в этом случае может использовать угрозу типа «машины страшного суда». Правдо- Правдоподобность успеха той и другой тактики с точки зрения сто- стороннего наблюдателя конфликта одинакова- Пример 6. Дуополия с назначением выпуска Рассмотрим дуопольную игру, аналогичную игре, рассмат- рассматриваемой в примере 5 гл. III. Две фирмы поставляют некото рый товар на рынок, /-я фирма предлагает товар в объеме %ь 1=1, 2. Цена на товар определяется формулой р0—(^, + ^2) (для xl-[-x2^.pa). Функции затрат одинаковы у обеих фирм, причем затраты на выпуск единицы продукции линейны отно- относительно количества выпускаемого товара. Затраты на выпуск единицы продукции при увеличении масштабов производства г) Величина у,- характеризует максимальный гарантированный выигрыш лидера (игрока () без предположения благожелательности ведомого.—Прцм,. перев.
Гл. VI. Стабильность на основе угроз 179 могут быть как возрастающими, так и убывающими. ^1 = ^2 = j^> Y Ро\ » ut (*i> хя) — [Ро — х]Х{ — (с + e*i) х(, t=l, 2, где х — хл + xt, а р0, с, е—фиксированные параметры, удовлет- удовлетворяющие условию Предполагается, что е мало по сравнению с р0—с. Случай 1. Постоянные затраты на выпуск единицы продукции Заметим, что «3 + ^2 —[/?о—х]х—сх — — х2 + (/?о—с)х, следовательно, исходы х, такие, что являются оптимальными по Парето. Верно и обратное утверж- утверждение, т. е. все оптимальные по Парето исходы удовлетворяют условию x = y(Po—^)- Проверку этого утверждения предостав- предоставляем читателю (нужно приравнять нулю определитель матрицы («1. «г) \ Максимальный общий доход равен -^(Ро—с)г- Гарантированный выигрыш равен 0 ( поскольку sup inf«J= = sup и] (xlt yPo) )• Таким образом, дележи представляют собой произвольное распределение максимального суммарного дохода (при условии, что не получается отрицательных выигры- выигрышей). Для вычисления выигрышей по Штакельбергу нам пона- понадобится вычислить наилучший ответ игрока 1: I Таким образом, Y2 = S2= sup ul(BR1(x2), x2) = о < х2 < — р„ о < х, < у р„ Симметричными рассуждениями получаем S1~\-(pa—сJ, сле- следовательно, вектор выигрышей (S,, Sj) соответствует некото-
180 Ч. П.Кооперативное поведение,игроков рому дележу, а значит, по лемме 6 у-ядро состоит из единст- единственного дележа (х1У х^={-~(ро—с), \{ро~с)\ распределяю- распределяющего максимальный суммарный доход поровну между игроками. В этой симметричной игре у-ядро является справедливым коо- кооперативным исходом, реализующим с помощью естественных угроз BR±, BR2. Реализация любого несправедливого распре- распределения максимального общего дохода требует применения тактики запугивания. Такие угрозы выглядят менее убеди- убедительно. Случай 2. Возрастающие или убывающие (ефО) затраты на выпуск единицы продукции С помощью аналогичных вычислений, использующих аппрок- аппроксимацию первого порядка (возможную в силу малости е), получаем Предположим сначала, что е > 0. По определению функции и* имеем и? (х) < и\ (х) для всех хг > 0, х2 > 0. Отсюда получаем, что вектор выигрышей (Sx @), S2 @)), соответ- соответствующий некоторому дележу в игре G, не является допустимым в игре G (е), е > 0. Тем более вектор выигрышей (Sx (e), S2 (e)) не является допустимым, и -у-ядро игры G (е) пусто. Аналогич- Аналогичные рассуждения (с учетом S{ (е) < S{ @) и и? > «J для е < 0) показывают, что -уядро игры G (г) непусто при убывающих затратах на выпуск единицы продукции (е < 0). Рисунок 1 показывает разницу между случаями убывающих и возрастающих затрат на единицу выпуска. е < 0 — убывающие затраты на единицу выпуска <у-ядро есть [«!, а2] Кривые линии опре- определяются условием
Гл. VI. Стабильность на оснбёе угроз 181 8>0 V-ядро пусто на [Pi. Рг] оба игрока используют угрозы типа запугивания. Рис. 1 Упражнение 5 Докажите, что в модифицированной координационной игре (пример 5) множество {и{ (х) > S,} пусто. Тем не менее ?-ядро не пусто (здесь нужно воспользоваться замечанием 2). Пока- Покажите, что 7*ядро состоит из единственного дележа E, 5), кото- который является справедливым исходом игры. Упражнение 6 Предположим, что ||-||,- — гильбертова норма в ^(порожден- ^(порожденная положительно определенной симметричной матрицей 2x2) и at^Ra, i = l, 2, фиксированы. Рассмотрим игру Покажите аналитически и геометрически, что у-ядро не пусто. Из леммы 6 следует, что 7"ЯДР° данной игры G пусто в том (и только том) случае, если в этой игре возникает борьба за лидерство. Из леммы 4 получаем, что C-ядро игры G пусто тогда (и только тогда), когда вектор выигрышей Р = (inf sup ы„ inf sup ы2) Уг Уг У\ Уг не является допустимым (т. е. не существует исхода х, для которого было бы выполнено неравенство ^^(ы^л;), и2(х)). Действуя в качестве ведомого, игрок i гарантирует себе резуль- результат inf sup щ (поскольку перед выбором у{ он знает yf). Таким образом, пустота р-ядра порождает „борьбу за право второго хода": какой бы дележ ни был выбран, по крайней мере одному
182 Ч. //. Кооперативное поведение игроков игроку выгоднее подождать пока будет окончательно определена стратегия его партнера, а затем действовать в качестве ведо- ведомого: Vx?X{12) 3i€{l, 2} и, (*)< inf sup и,. »j «i Как показывает следующий результат, эта терминология является корректной, борьба за лидерство (право первого хода) и борьба за право второго хода не могут возникнуть одновре- одновременно. Теорема 1. у-ядро и fi-ядро не могут быть пусты одновре- менно. Если у-ядро и fi-ядро не пусты, то они пересекаются. Следствие. Игры двух лиц распадаются на три класса: I. Ср = 0, СУ ФФ: борьба за право второго хода, II. СЧ = Ф, С&ФФ: борьба за лидерство, III. СрОСуФФ: в этом случае CpnCv является благопри- благоприятной областью для кооперации с использованием угроз. Доказательство. Пусть xl, i = \, 2,— равновесие по Шта- кельбергу, в котором игрок i является лидером. Пусть D{ -~ Множество исходов, удовлетворяющих следующим неравенствам! ъ < ui (*)- h < и/ (*)• Поскольку х\ является наилучшим ответом игрока / на х\, то множество Dt содержит х' и поэтому не пусто. Предположим теперь, что у-ядро и Р-ядро пусты. Выберем оптимальный по Парето исход х из Dx (например, максимизи- максимизируя их-\-щ на Dj). Тогда имеем Поскольку хй принадлежит Z)j, заключаем, что исход г* доми- доминирует по Парето исход х. Получили противоречие. Предположим теперь, что у-адР0 и Р-ядро не пусты и дока- докажем, что их пересечение также не пусто. Положим у = (уи у^. Если Y^aP> T0 CpcCv, и все доказано. Аналогично, если то С^[)Су = Су. Осталось рассмотреть случаи типа Pi < Yi. Vi < К Тогда любой дележ из Dv например а;1, принадлежит Cv f) Q. Щ Характерным примером игр класса I являются игры с нуле- нулевой суммой без цены. На самом деле игра класса I не имеет равновесий по Нэшу.
Гл. VI. Стабильность на основе угроз 183 Упражнение 7 Если Р-ядро игры G пусто, то NE (G) также пусто, и игры в нулевой суммой (Xj, Х2, ых) и (Хи Х2, —и2) не имеют цены. Примером игр класса II является игра „перекресток" (при- (пример 2 гл. III). Упражнение 8 Для игры G из класса И выполнено P/<Yi. ' = 1. 2. Для любой игры класса III пересечение Cvf|Cp является под- подходящей областью для кооперации с помощью угроз *). Ниже приведены два упражнения и задача. Они показывают, что типичными примерами игр класса III могут служить игры, имеющие равновесие в доминирующих стратегиях, а также игры с оптимальным по Парето вектором у или р, как это имеет место в следующих двух упражнениях и задаче. Упражнение 9 Пусть каждый игрок имеет строго доминирующую страте- стратегию, т. е. Ui(xf, Xj)>u{(xh xj) для всех хгфх* и для всех Xj, тогда игра G принадлежит классу III. Приведите пример, пока- показывающий, что игра G, в которой каждый игрок имеет доми- доминирующую стратегию, может принадлежать классу II. Упражнение 10 Игра G, для которой вектор у является вектором выигрышей по крайней мере для одного дележа, принадлежит классу III. Задача 4. Квазинесущественные игры Скажем, что игра G является квазинесущественной, если P = (inf sup ult infsup«2) является вектором выигрышей по У: У< </i Уг крайней мере для одного оптимального по Парето исхода. 1) Из доказательства теоремы 1 следует, что класс III естественным образом разбивается на четыре группы игр. 'Hi- ^RnCv=Co. В этом случае, как и для игр класса II, ведомым быть лучше, чем лидером, так как pSay. Однако теперь возможен компро- компромисс, при котором у лидера нет оснований отказываться от лидерства. П12. СрПС^=С . Лидером быть лучше (уSap"), но возможен компро- компромисс, устраняющий опасность захвата лидерства ведомым игроком. III». СрПСг = Dj = {x\u1(x) Ssvi. «2 (*Ms Рз}- „Естественным" лиде- лидером в играх этой группы следует считать игрока 1. Ш4. С„Г\С =^D2~{x\ н2 (*Mг Y2> "i (*) Ss Pi}- Случай, симметричный Ш8. Компромисс фактически сводится к выбору лидером игрока 2.— Прим.
184 Ч. П. Кооперативное поведение игроков 1) Предположим, что функции ult ы2 взаимно однозначны на и что игра G квазинесущественна, Тогда (единственный) исход х*, для которого (и1 (х*), ы2(л;*)) = Р, является i-равнове- сием по Штакельбергу для /= 1, 2. Этот дележ также является единственным Л^-исходом игры G. 2) Приведите пример квазинесущественной игры, в которой нет М.Е-исхода. 3) Предположим, что игра G квазинесущественна. Докажите, что игра G несущественна в том и только том случае, если игры с нулевой суммой (X,, Х^, ut) и (Х1( Xj, —иг) имеют цену. Приведите пример квазинесущественной игры, не являющейся несущественной, в которой функции и{, / = 1, 2, взаимно одно- однозначны. Задача 5. Сценарий гарантированных предостережений (Мулен [1977]) Пусть (л;*, lv la) — сценарий предостережений игры G. Назовем угрозу гарантированной, если ее реализация не прино- приносит убытков угрожающему игроку- 1A I'( 1\ I для лю^ых хь g-ядром игры G является подмножество, обозначаемое С (G), таких исходов х*, для которых существует по крайней мере один гарантированный сценарий предостережений (х*, |х, |2). 1) Докажите следующую эквивалентность- х € Cg (G) фф [х оптимален по Парето и и,(л:)^|3,]. 2) Докажите, что g-ядро является подмножеством, возможно пустым, уяДРа: Cg(G)cCy(G). 3) Приведите примеры игр нз класса I, показывающие, что g-ядро может быть как пустым, так и непустым. Указание: рассмотрите следующую игру 2x2: 0 2 3 1 2 0 1 3 и опишите необязательные соглашения в этой игре (включая вмешанные Л/?-исходы и равновесия в совместных смешанных стратегиях).
Гл. VI. Стабильность на основе угроз 185 4) Для игры G, принадлежащей классу III, докажите, что либо ее g-ядро пусто, либо игра G квазинесущественна (задача 4). В последнем случае докажите, что Cg = C4 = C,=(ult и,Г1(Р). 5. ИГРЫ В ХАРАКТЕРИСТИЧЕСКОЙ ФОРМЕ: ЯДРО Пример 7. Игра „джаз-оркестр" (Янг [1979]) Владелец ночного клуба в Париже обещает 1000 долларов певцу (S), пианисту (Р) и ударнику (D) за совместную игру в его клубе. Выступление дуэта певца и пианиста он расцени- расценивает в 800 долларов, ударника и пианиста в 650 долларов и одного пианиста—в 300 долларов. Другие дуэты и солисты не рассматриваются, поскольку присутствие фортепиано владелец клуба считает обязательным. Дуэт певец—ударник зарабаты- зарабатывает 500 долларов за вечер в одной удобно расположенной станции метро, певец зарабатывает в среднем 200 долларов за вечер в открытом кафе. Ударник один ничего не может зара- ботать. Суммарный доход трех музыкантов максимален A000) в слу- случае их совместного выступления в ночном клубе. Если певец выступает отдельно от пианиста с ударником, то все втроем они получают 650 -f- 200 долларов, если пианист один выступает в ночном клубе, то 300 + 500 долларов. Наконец, суммарный доход равен 800 долларов, если пианист и певец отказываются от участия ударника. Какое распределение максимального общего дохода следует признать разумным, учитывая описанные возможности игроков в смысле частичной кооперации и инди- индивидуального поведения? Определение 6. Для данного конечного сообщества N игрой в N-характеристической форме назовем отображение v из мно- множества непустых коалиций игроков Р (N) в R. Игра (N, v) называется супераддитивной, если для любых непересекающихся коалиций Т, S g P (N) выполнено A7) Свойство супераддитивности (условие A7)) не является необ- необходимым для большинства результатов, приведенных ниже, однако оно необходимо для интерпретации числа v (T) как мак- максимального общего дохода в случае, когда игроки в коалиции Т действуют независимо от дополнительной коалиции Те. Нера- Неравенство A7) означает, что коалиция T()S имеет не меньше возможностей, чем две независимые непересекающиеся коали- коалиции Т и S,
186 Ч. II. Кооперативное поведение игроков _______ Из супер аддитивности у с очевидностью следует, что для любого разбиения Sx, ..., Sh множества N выполнено л/ k=i Следовательно, не существует такого разбиения Sx, ..., Sk, которому бы соответствовал суммарный доход, превышающий доход коалиции всех игроков у (N). Таким образом, кооперация всех игроков является единственным эффективным коопера- кооперативным исходом. Замечание 1. В определении 1 предполагается, что исход кооперации может быть выражен в одних и тех же единицах измерения, т. е. существует трансферабельный товар, на основе которого могут быть осуществлены побочные платежи между игроками. Теория игр в нормальной форме развита в более общих предположениях, индивидуальные функции полезности здесь не предполагаются траисферабельными и даже сравни- сравнимыми (см. гл.1, II, III и VI, разд. 1 — 4). В данном случае мы ограничиваемся трансферабельными функциями единственно в целях простоты. Ссылки на литературу по играм в характе- характеристической форме без побочных платежей могут быть найдены в работе Аумана [1976]. Следующие два определения аналогичны определениям деле- дележей и а-ядра для игр в нормальной форме. Определение 8. Дележом в игре у в Af-характеристической форме называется вектор лг=(л;4){ел/ из R^, для которого 2 Xi — v(N), Xt^v({i}) для всех i?N. Обозначим через / (у) множество дележей игры (N, у). Применяя итеративно условия супераддитивности A7), по- получаем 2 v(\i})^v(N). i?N Для супераддитивных игр множество дележей / (v) не пусто. v({i})—это уровень дохода, который игрок i может себе гаран- гарантировать сам. Поэтому v({i}) играет роль гарантированного выигрыша для игр в нормальной форме. Доказательство леммы 2 подчеркивает прямую связь двух понятий дележа. Если игра (N, у) такова, что выполнено равенство 2 y({f}) = 16 Л/ == у (N), то множество / (v) состоит из одной точки, а игра (N, у) называется несущественной (см. интерпретацию определения 5 гл. I). В этом случае из супераддитивности v следует ее адди-
^ /л. Vl, Стабильность на основе угроз t8? тивность (из A8)): для всех SczN v(S)=^v (Ш). ieS (Доказательство этого факта оставляем читателю в качестве упражнения.) Для игр, не являющихся несущественными, ядро — это возможно пустое подмножество дележей, стабилизируемых простыми угрозами. Определение 9. Ядром игры (N, у) называется подмножество таких дележей х g / (у), для которых выполнено: для всех коалиций S е N 2*j>o(S)- A9) Будем обозначать ядро через С (у). Пусть игроки договариваются о выборе кооперативного согла- соглашения. Поскольку игра у супераддитивна, такое соглашение предполагает образование коалиции всех игроков N. Обсуж- Обсуждаться может только вопрос о способе дележа общего дохода v(N), т. е. о выборе вектора x?RN, для которого 2 x{ = v(N). Минимальным требованием для получения согласия игроков выбрать вектор х является индивидуальная рациональность этого вектора, т. е. условие x^v ({t}), i € N. Таким образом, игроки договариваются о выборе конкретного дележа х. Против выбора дележа х может возражать некоторая коалиция S, требуя для себя более выгодного распределения (например, y?l(v), для которого yt > х{ для всех i ? S). Коалиция S выдвигает это требование, угрожая в противном случае нарушить общую коопе- кооперацию (эта угроза вполне реальна, ибо для достижения дохода v(N) требуется единодушное согласие всех игроков). Предполо- Предположим, что остальные игроки Se реагируют на эту угрозу отказом от всякой кооперации с членами коалиции S. После этого мак- максимальный суммарный доход коалиции S оценивается числом y(S). Условие A9) означает существование стабилизирующей угрозы коалиции S со стороны коалиции Sc. Таким образом, ядром игры (N, v) является множество устойчивых в смысле коалиционных угроз распределений числа v{N). Кроме указанной интерпретации ядра с предостерегающими угрозами приведем эквивалентную интерпретацию с нормативной точки зрения. Лемма 7. Пусть x?l(v)—дележ игры (N, у), х принадле- принадлежит ядру в том и только том случае, когда для всех коали-
Ч. li. Коопертиёное поведение иёрокбё ций ScN выполнено Доказательство. Поскольку 2 xi = v(N), то приведенное выше неравенство можно переписать так: 2 Пример 7 (продолжение). Вектор x=(xs, xp, xD) в игре .джаз-оркестр" принадлежит ядру тогда и только тогда, когда \ ( Дележ a;s + a;d>500 } ядро. Это множество является выпуклой оболочкой следующих трех дележей: C50, 450, 200) C50, 500, 150) C00, 500, 200). Таким образом, выигрыши всех игроков определяются с точ- точностью до 50 $. Типичным представителем ядра является центр (среднее арифметическое крайних точек) множества С (v), а именно: х* = C33.3, 483.3, 183.3) Для дележа х* характерно, что все двухэлементные коалиций имеют одинаковый дополнительный доход: xi + x/—v({i, /}) = = 16.6 $. Дележ х* является справедливым компромиссом внутри С (у). Из того, что ядро пусто, не следует невозможность коопе- кооперации всех игроков N. Это означает просто, что никакой дележ не может быть стабилизирован с помощью простых, естествен- естественных угроз, описанных выше. В этом случае кооперативная устойчивость требует более сложного поведенческого сценария подобно угрозам и контругрозам, описанным в разд. 2 (см., в частности, задачу 3). На этом пути мы придем к концепции переговорного множества, предложенной в работе Аумана, Машлера [1964]. Пустота ядра наблюдается в том случае, когда промежуточ- промежуточные коалиции слишком сильны. Это утверждение проясняется следующим примером. Пример 8. Симметричные игры В симметричной игре коалиции с одинаковым числом игро- игроков имеют одинаковый выигрыш. Характеристическая форма v
1. СтабилЬнобШ /to Шобе ytpei имеет следующий вид: , где s = |5| для всех S <= N. Предположим без потери общности, что и*A) = 0 и ЛГ = 2, ..., п). Тогда множеством дележей игры у* является дующий симплекс в Rn: 2 х, = v* (п), п. Ядром С (у*) является подмножество / (у*), определенное ко- конечным числом (точнее: 2П—п—2) линейных неравенств A9). Ядро непусто Ядро пусто Таким образом, ядро—это, возможно, пустой, выпуклый мно- многогранник внутри симплекса / (у*) *). В силу симметричности v ядро С (и*) тоже симметрично, т. е. инвариантно при любой перестановке компонент хи .... х„. Учитывая, кроме того, выпуклость C(v*), получаем, что множество С (о*) не пусто в том и только в том случае, когда оно содержит центр х* множества /(и*), а именно x*=*l/n, t = l, ..., п. Возвращаясь х) Крайние точки ядра симметричной игры описаны в работе Меньши- Меньшикова [1976].— Прим. перев.
Ч. //. Кооперативное поведение игроков к системе A9), получаем, что [С (v*) Ф 0] & [для всех s=l, .... п i v* (s) ^ ^ v* (я) ] . Таким образом, ядро С (у*) не пусто тогда и только тогда, когда не существует промежуточной коалиции S, в которой средняя доля каждого игрока больше соответствующей вели- величины в коалиции N. Возвращаясь к общему случаю, охарактеризуем непустоту ядра с помощью линейного программирования. Определение 10. Для данного множества N обозначим через Р (i) множество коалиций, содержащих игрока ?: Сбалансированным семейством коалицийх) назовем отобра- отображение б из P(N) в [0, 1], для которого для всех i$N 2 6S«=1. Наконец, игру в характеристической форме (М, v) назовем сба- сбалансированной, если 2 6sy (S) < v (N) для всех сбалансированных семейств StP{N) коалиций б. B0) Теорема 2 (Бондарева [1962], Скарф [1967]). Игра (N, v) имеет непустое ядро тогда и только тогда, когда она сбалан- сбалансирована. Доказательство. Пусть x?C(v), а б—сбалансированное се- семейство коалиций, тогда *(S)>i>(S)=s>6s*(S)>6si>(S) для всех Суммируя эти неравенства, получаем 2 S5y(S)< 2 6sx(S) = 2 S SeP{A/) SeP(N) teNSsP(i) Наоборот, если ядро С (v) пусто, то система линейных неравенств v (S) для всех S с N не имеет решения. Используя стандартные рассуждения (теорему двойственности), получаем, что для всех S найдется неотрица- Соответствует термину «сбалансированное покрытие».— Прим. перев,
Гл. V/. Стабильность на основе угроз тельное число 6S, такое, что: для всех x?RN% 2 sB SgP(N) \ies 2 bsv (S) > v (N). SeP(N) Первое из этих свойств эквивалентно тому, что б—сбаланси- б—сбалансированное семейство коалиций, что и завершает доказательство теоремы 2. В качестве приложения теоремы 2 рассмотрим игру трех лиц | Л/" | = 3. Каждому разбиению N соответствует тривиальное сбалансированное семейство коалиций; разбиение N: 6^=1, 6s = 0 для всех S=?N, разбиение {<}{/&}: 6tf}== I, 6{;-fc, = l, 6S = 0 в остальных случаях. Применяя условие A8) к этим б, получаем условие супе- радднтивности игры v v @ + v (/*)< v (N) для всех {i, /, А} = {1, 2, 3}. B1) Далее, коалиционной структуре {12}, {23}, {31} соответствует сбалансированное семейство коалиций б* fi*} = 1/» для всех /, /, гф\, б* = 0 в остальных случаях. Применяя B0) к б*, получаем B2) Пусть теперь читатель убедится в том, что все сбалансирован- сбалансированные семейства коалиций для N являются выпуклыми комбина- комбинациями 6^, б<1> ('*> и б*. Следовательно, непустота множества C(v) характеризуется системой неравенств B1), B2). Следствие из теоремы 2. Любая супераддитивная игра трех лиц имеет непустое ядро тогда и только тогда, когда вы- выполнено B2). При увеличении числа игроков проверять сбалансирован- сбалансированность игры v становится все труднее1). Например, суперадди- супераддитивная игра четырех лиц обладает непустым ядром в том и 1) Это объясняется тем, что сбалансированных семейств коалиций (сбалансированных покрытий) становится «слишком много». Их полное опи- ?9цие при |Л/|<6 см. в работе Меньшикова [1977].— Прим. перев.
192 Ч. II. Кооперативное поведение игроков только том случае, когда v A2) + v B3) + v C4j + о D1 )< 2v A234), 1>A23)Н-рB34L-»A34) + оA24)<З v A23) + v B34) + v A4)< 2v A234), а также выполнены пять аналогичных неравенств, которые по- получаются из данных перестановкой игроков. Упражнение 11. Докажите сформулированное выше утверж- утверждение. Задача 8, приведенная ниже, иллюстрирует типичное при* ложение теоремы 2 к экономическим моделям. Задача 6. Ядро в простых играх Игру (N, v) назовем простой, если для всех S^N v(S)=tO или 1. Обозначим через W множество выигрывающих коалиций, т. е. 1) Докажите, что игра (N, v) супераддитивна тогда и только тогда, когда подмножество W множества всех коалиций является монотонным и собственным: W для всех S, Г, 2) Игрока i*?N назовем диктатором W, если {/*} — вы- выигрывающая коалиция! {(*} € W. Полагая игру (Af, v) супераддитивной, докажите, что W имеет (единственного) диктатора тогда и только тогда, когда игра несущественна. 3) Пусть W не пусто и не имеет диктатора. Игрока I* на- назовем вето-игроком, если W\{/*} не является выигрывающей коалицией. Обозначим через Л^^. возможно пустое множество вето-игроков. Докажите, что ядро C(v) не пусто тогда и только тогда, когда не пусто множество N+. В этом случае докажите, что , = 1, *, = 0 для всех J$N*, xt ^ 0 Для всех М
Гл. VI. Стабильность на основе угро5 193 4) Пусть для каждого i голос игрока i имеет вес <7*|>0. Обозначим через q0 такое число, что ieN Определим взвешенную мажоритарную игру Wq следующим образом: Докажите, что Wq монотонная и собственная простая игра. Докажите, что в этой игре игрок i* является диктатором тогда и только тогда, когда <?„ <<?.*, и i* является вето-игроком в том и только том случае, если 5) Сравните полученные результаты с задачей 1 гл. VI. Задача 7. Выпуклые игры Пусть (N, v)—выпуклая игра, т. е. такая, для которой справедливо ) для всех S, TsW. 1) Докажите, что v(N)—v(S')= sup {v(S[}T) — v(T)} для всех ScN. Сопоставьте этот факт с утверждением леммы 7. 2) Для любого порядка 1, 2, ..., п в N рассмотрим вектор «х-оA), */ = »(!, 2 i)~v(l, 2 г-1), t=2 п. Докажите, что х принадлежит ядру игры (N, v). 3) Докажите, что C(v) является выпуклой оболочкой деле- дележей ха, полученных в 2), при условии, что а принимает зна- значение всех возможных порядков в N. Задача 8. Ядро экономики обмена Пусть для всех i?N ut~функция полезности, определен- определенная в неотрицательном ортанте Щ. Мы интерпретируем zgRf как вектор потребления, а и( (г) — полезность для игрока i век- Тора г. Обозначим через wt g Щ. начальный запас товаров у игрока I.
l?4 Ч. 11. Кооперативное поведение игроков Игру «экономика обмена» (с побочными платежами) с функ- функциями (и,-, i g N) определим следующим образом: для всех S^N v (S) = sup / 2 "; (г<) 2*;= 2 да,, ; [ieS i<=S ieS 1) Предположим сначала, что р=1 и N —B[)S, где для i$B (покупатель) w{ — 0, а для igS (продавец) да, = 1. Пусть функция щ имеет следующий вид: ( и{ (г) = 0 для г < 1, если i?B { . . , . , \ U; (Z) — bi ДЛЯ 2^1, = — s, для г < 1, «^ /€S < ¦¦'-' О ДЛЯ 2>1. S \И,B) = Упорядочим В и S так, что 6^для t€B = {l, .... пь}, S1<...<S/<...<5m, ДЛЯ / € «S = {1, ..., ms}. i* Докажите, что v (N) — 2 Ф;—s;), где i* — наибольшее целое i=i число, для которого i*^inf(n6, ms), s^^b^. Докажите, что если дележ х принадлежит ядру С (у), то должна существовать цена q, такая, что l x^bt — q для i?B, f<f*. \ ^ = 0 для i€fi, i>t*. ( ; Г Xj-q-s, для /€S, /<i*. \ jc,-0 для ^' Найдите интервал / = [</lnii ^suP]. обладающий таким свойством! для q?l дележ B3) принадлежит С(v). Докажите, что все цены конкурентных равновесий этой эко- экономики обмена принадлежат интервалу /. 2) Пусть теперь р—произвольное натуральное число и для всех i ? N и, —вогнутая функция, определенная на R?. Докажите, что игра (N, v) является сбалансированной и, следовательно, имеет непустое ядро. Докажите, что конкурент- конкурентное равновесие принадлежит ядру С (у). ЛИТЕРАТУРА Арои (Aron R.) [1962] Paix et guerre entre les nations. Paris, Caiman - Levy Ed. Ауман (Aumann R. J.) [1976] Lecture on game theory, Stanford, Stanford University, IMSSS*
Гл. VI. Стабильность на основе угроз _195 [1978] Survey on repeated games. Stanford, Stanford University, IMSSS. Ауман, Машлер (Aumann R. J., Maschler M.) [1964] The bargaining set for cooperative games. Advances in Game Theory, Annals of Math. Studies n° 52, Princeton N. J., Princeton University Press. ¦Берж К. [1962] Теория графов и ее применения. —М.: ИЛ. Бондарева О. Н. [1962] Теория ядра в игре п лиц. Вестник ЛГУ, сер. мат., мех., астрон., 13, 3, 141-142 *Васин А. А. [1978] Сильные ситуации равновесия в некоторых сверхиграх. Вестник МГУ, сер. мат., мех., 1, 30 — 40 [1983] Модели процессов с несколькими участниками.—М.: Издательство МГУ. Викри (Vickrey W. S.) [1959] Self-policing properties of certain imputations sets. Annals of Math. Studies 40, Princeton, Princeton University Press. Термейер Ю. Б. [1973] К теории игр трех лиц. ЖВМ и МФ, 13, 6, 1459—1468. Термейер Ю. Б., Штильман М. С. [1975] Некооперативные повторяющиеся игры с произвольным дисконтиро- дисконтированием. ДАН, 211, 1, 22—25 'Кукушкин Н. С. [1974] Точки равновесия в метаиграх. ЖВМ и МФ, 14, 2, 312—320. Льюс, Райфа (Luce R. D., Raiffa H.) [1957] см. литературу гл. "I. •Меньшиков И. С. [1977] Стационарные стратегии в играх со скользящим дисконтированием. Вестник МГУ, сер. мат., мех., 4, 10—17. •Меньшикова О. Р. [1976] Крайние точки С-ядра симметрических игр. Вестник МГУ, серия мат., мех., 5, 63—72. [1977] Методы поиска ядер кооперативных игр и их приложения. Диссер- Диссертация, Московский университет. •Миркин Б. Г. [1974] Проблемы группового выбора. —М.: Наука. Мулен (Moulin H.) [1977] Cours de theorie des jeux a deux joueurs. Cahier de Mathematiques de la Decision n° 7709, Paris, Universite Dauphine. Мулен, Пелег (Moulin H., Peleg B.) [1982] Stability and implementation of effectivity functions, Journal of Mathematical Economics 10, 1, 115—145. Мулен (Moulin H.) [1981] см. литературу к введению Накамура (Nakamura К.) [1979] The vetoers in a simple game with ordinal preferences. International Journal of Game Theory, 8, 1, 55—61, •Ope O. [1980] Теория графов. — M.: Наука. • Оуэн Г. [1971] см. литературу гл. IV. . Розенталь (Rosenthal R.) [1972] Cooperative games in effectiveness form. Journal of Economic Theory, 5, 1. * Звездочкой отмечены работы, добавленные при переводе.
196 V. //. Кооперативное поведение игроков Рот (Roth A.) [1976] Subsolution and the supercore of cooperative games, Mathematics for Operation Research, 1, 1. Рубинштейн (Rubinstein A.) [1979] Equilibrium in supergame with the overtaking criterion, Journal of Economic Theory, 21, 1, 1—9. Сен (Sen A.) [1970] Collective Choice and Social Welfare, San Francisco, Holden Day, Скарф (Scarf H.) [1967] The core of an N-person game. Econometrica, 35, 50—69, ловард (Howard N.) [1971] Paradoxes of rationality: theory of metagames and political behaviour. Cambridge (USA), M. I. T. Press, Шеллинг (Schelliig T. C.) [1971] см. литературу гл. III. Шерер (Sherer F. M.) [1970] см. литературу гл. V. Яш- (Young H. P.) [1979J The market value of a game, 11 AS A working paper, Laxenburg,
УКАЗАТЕЛЬ Арон 155 аукцион 20 — Викри 21 — второго типа 21, 77 —• неделимого товара 20, — первого типа 20, 82 Ауман 137, 140, 170, 1 82 2 173, 186, 188 Берж 67, 78 биматричиые игры ПО—117 Бинмор 64 блеф 106 Бондарева 190 борьба за лидерство 57, 74, 178, 182 — — право второго хода 182 — — — первого хода 182 Брамс 14 Браузр 36 Ввбер 83 ведомый 53 Виал 147 Викри 164 война иа истощение 83, 84, 93, 94, 126 Вулф 124 выборы большинством голосов 38 «»40, 161, 164, 167 "¦ о правом вето 41—43, 76 выпуклые игры 194 Габв 89, 92 гарантированный выигрыш 27, 103, 138 Гильбо 99 ГликЫкре 121 голосование по Рому 55.^57 Данфорд 121 двоичный выбор с взаимным влиянием дележ 156, 175, 186 дерево 43 дилемма заключенного 19, 104, 153, 164, 173 •- — локальная 96—97 Дживерс 58 доминирование по Парето 20 — стратегий 16 доминирующая стратегия 17 Дутта 58 дуополия 22, 81, 84^-87, 95, 145, 178 дуэль 34 — бесшумная 35 •*• топологическая 52 ¦>- шумная 34 Жерар-Варе 149 Игра о нулевой суммой 30^37, 49=52, 79, 82 107, 117 игра 15 — агентов по продаже автомобилей 8|, 95 — «аукцион» 125 — «вежливые водители» 138 — «джаз-оркестр» 185 — «китайский покер» 119, 128 — мариенбадская 51 ¦» «музыкальные стулья» 142 — Ним 50 ¦»• «переговоры» 135 *"• «перекресток» 139 — — в смешанных стратегиях 104 —• «пиратские корабли» 132 — «раз-два-игра» 33, ! 01 — «размещение магазинов» 121, 137 •- с нулевой суммой 30—37, 49»52, 79, 82. 107, 117 •- «таможенный досмотр» П7 — «торг» 156 индивидуально рациональный исход 72, 155 исход игры 15 Кларка — Гроувза механизм 24 Кнастера — Куратовского',» Маауркевищ лемма 78 Кондорсе 9, 161 — парадокс 161 контругроза 168 Кун 46 — алгоритм 46 — теорема 46 Курно 91, 84 -• процедура нащупывания 84—95 Лексикографически осторожная страте. гия 29 лидер 53 лидерство 53 лотерея 101 —• индивидуальная (собственная) 101 -» совместная 141 Льюс 19, 102, 164 Машлер 188 Метод «дели-выбирай» 64 методы дележа 69 « парадоксальный 62 Милгром 83 деМонмор 100 Мулен 14, 23, 29. 35, 6S, 89, 92, 95, П8. 147, 149, 163, 164. 168, 184. Наилучший ответ 31. 85, 88, 109 — — отображение 53, 85, 177 Накажу ра 166 недоминируемая стратегия 16 фон Нейман 79, 164 несущественная игра 27 — —• квази 183 «" ш> почти 77
198 Указатель нормальная форма 15 — — игра в 15 носитель смешанной стратегии 108, 112 Нэш 69 — равновесие 69, 87, 90 — теорема 78, 102 Олигополия 22—23, 80, 94—95 Окугучи 89 Ортега 98 осторожная стратегия 26, 106 Партхасаратхи 108, 124 Пелег 167 повторяющиеся игры 171 — 173 полная информация 44 последовательное исключение Домини- Доминируемых стратегий 40 почти для всех нгр 111 предостережение 154 — сценарий 154 предупреждение 158 Равновесие — в доминирующих стратегиях 17 — в смешанных стратегиях 102 — в совместных смешанных стратегиях 140 — по Нэшу — 69 — по Штакельбергу 53 — сильное 134 — слабое 147 — сложное 40 Рагхатн I08L 124 "разрешимость по доминированию 40 — локальная 92 Райт 100 Райфа 19, 102, 164 редуцированная игра 45 Рейнбольдт 98 Розен 85 Розенталь 164 Рот 164 Роше 48 Рубинштейн 67, 170 Рудин 123 Рэнд 87 Сайон 124 седловая пара (стратегий) 31, 79 Сен 163 сильные равновесия 134 смешанное расширение игры 101 смешанные стратегии 101 — — вполне 108 соглашение 131 — необязательное 131 — 132, 148 — стабильное 131, 142, 147—149 стратегия 15 стратегическая обоснованность голосова- голосования с упорядочением 23 сценарий предостережений 154 Типе 124 Угрозы 154 устойчивое равновесие 87—88 — локально 89 Фаркуарсон !4, 38 финансирование общественных нужд добровольной подписке 82 Характеристическая функция 185 игра в форме 185 Цена игры 30 с нулевой суммой 30—31 — ~ в смешанных стратегиях 79 Цермело 50 Шахматы 50 Шведиауэр 14 Шеллинг 70, 74, 178 Шварц 121 Шепли 36 Штакельберг 53 Штейнгауз 59 Шоттер 14 Эквивалентные стратегии 18 экономика обмена 193 Ядро 187 а-ядро 160, 175 р-ядро 169, 182 ¦у-ядро 176, 182 Яне 185 по
ОГЛАВЛЕНИЕ Предисловие редактора перевода , 5 Предисловие , • 8 Введение 10 Часть I. Некооперативное поведение игроков Глава I. Некооперативное поведение изолированных игроков . , . 16 1. Доминирующие и недоминируемые стратегии , , . 16 2. Осторожные н оптимальные стратегии , 26 3. Игры двух лнц с нулевой суммой . , ,,,.,, 30 Литература ' . , , . , 37 Глава II. Сложное поведение , • > • 38 1. Последовательное исключение доминируемых стратегий , , , , . 38 2. Игры в развернутой форме и теорема Куна ,,.....,,,. 41 3. Игры двух лиц с нулевой суммой ,,,.,..., 49 4. Поведение лидера и ведомого 53 5. Другие приложения теоремы Куна ,,,,,......,.., 57 Литература , . . . , 67 Глава III. Равновесие по Нашу 68 1. Определение и обсуждение , . , 68 2. Теорема Наша о существовании равновесий ........... 77 3. Устойчивые равновесия 84 Литература ,...,.,..••.,,.. .• 97 Глава IV. Смешанные стратегии ..,,».,..,...,... 99 1. Смешанное расширение игры . , , , 100 2. Вычисление равновесий по Нэшу в смешанных стратегиях , , , , 108 3. Бесконечные игры ,,,,,,,,.,,.,,,»,., . , • t 119 Литература ...,,,,...,,.., .,,,.» 129 Часть II. Кооперативное поведение игроков , , 130 Глава V. Стабильные соглашения . , , , , ,..,.. 131 1, Сильное равновесие ,..,.,..,... , 132 2. Равновесие в совместных смешанных стратегиях , , , 138 Литература . ,,,.., 151 Глава VI. Стабильность иа основе угроз , , . . 152 1. Дележи . . , . . , 153 2. а-ядро 160 3. Повторяющиеся игры 169 4. Классификация игр двух лиц 175 6. Игры в характеристической форме: ядро 185 Литература 194 Указатель , , , , ,,,,..,..,,»,,,,»,,,,,,, 197