Текст
                    Экономико-
математическая
БИБЛИОТЕКА
Г. И. ДЮБИН
В.Г. СУЗДАЛЬ
ВВЕДЕНИЕ
В ПРИКЛАДНУЮ
ТЕОРИЮ ИГР

ё/кономико- МАТЕМАТИЧЕСКАЯ БИБЛИОТЕКА Г. Н. ДЮБИН, В. Г. СУЗДАЛЬ ВВЕДЕНИЕ В ПРИКЛАДНУЮ ТЕОРИЮ ИГР Под редакцией Н. IL ВОРОБЬЁВА ! МОСКВА «НАУКА» ' ГЛАВНАЯ РЕДАКЦИЯ ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ 19 81
22.18 05 УДК 519.6 Введение в прикладную теорию игр. Г. Н. Дюбип. В. Г. Су- здаль.— М.: Наука. Главная редакция физико-математической ли- тературы, 1981. Книга посвящена систематическому изложению прикладной теории игр и состоит из пяти частей (конечные и бесконечные ап- тагониЬтические игры, многошаговые игры, бескоалиционные и кооперативные, игры). Каждая часть включает теоретическую гла- ву ^ приложения. В теоретических главах устанавливаются прин- ципы оптимальности,.доказываются теоремы существования’и при- водятся методы решения игр. Прикладные главы содержат при- меры. конфликтов из различных сфер человеческой деятельности, приводящие к тем или иным теоретико-игровым Моделям.' Книга предназначена для специалистов в области исследова- ния операций и экономической кибернетики, студентов и аспиран- тов вузов. Геннадий Николаевич Д jo б и н " Виталий Григорьевич Суздаль, * ВВЕДЕНИЕ В ПРИКЛАДНУЮ .ТЕОРИЮ ИГР (Серия: «Экономико-математическая библиотека») М.,1981 г., 336 стр с илл. Редакторы: И. В. В и к т о р е и к о в а. Е. Ю. X о да н Технический редактор В. Н. Кондакова Корректор С. Н. М а к а р о в,а , ЦБ К» 11048 Сдано в набор 30.09.80. Подписано к печати 31.03.81. Т-067464 Бумага 84x108’/», тип. ’№ 3. Обыкновенная гарнитура. Высо- кая "печать. Условн. печ. зг/ 17,64. Уч.-изд. л. 18,09. Тираж 12 000 экз. Заказ № 311. Пена книги 1 р. 40 к. Издательство «Наука» Главная редакция физико-математической литературы 117071. Москва, В-71. Ленинский проспект. 15 4-я типография издательства «Наука»,’630077, Новосибирск. 77, Станиславского. 25. Д^огйя?767-81- 1502W000 (Р)Издагельство «Наука». ^Главная редакция физико-математической дитературы. 198|
ОГЛАВЛЕНИЕ Предисловие редактора .... . . . . . . . ’ _ 5 Предисловие 1 ЧАСТЬ I. КОНЕЧНЫЕ АНТАГОНИСТИЧЕСКИЕ ИГРЫ « . 13 Глава 1. Основы теории 13 * § 1.1. Матричные игры ' . . г.......................13 § 1.2. Методы( решения матричных игр . . . . • 41 Глава 2. Приложения............ . . . . 54 § 2.1. Примеры приложений в экономике .... 57 § 2.2. Примеры приложений в военном деле . . . 80 § 2.3. Другие приложения . . 100 ЧАСТЬ II. БЕСКОНЕЧНЫЕ АНТАГОНИСТИЧЕСКИЕ ИГРЫ. , ЮЗ Глава 3. Основы теории................. . . . 105 х § 3.1. Бесконечные игры.......................... 105 , § 3.2. Решение бесконечных антагонистических игр , 113 Глава 4. Приложения . . . . .- . . . . . 120 § 4.1. Примеры приложений в экономике . .... 121 § 4.2. Примеры приложений в военном деле . . 138 § 4.3. Примеры приложений в технике и других об л ас- ’ тяХ' человеческой деятельности . f , 155 ЧАСТЬ III. МНОГОШАГОВЫЕ ИГРЫ . . .. . . « > 164 Глава 5. Основы теории . . . . . . 164 § 5.1. Конечные позиционные игры . ... . % 164 § 5.2. Детерминированные, стохастические и рекурсив- ные игры . . ........ . 175 Глава 6. Приложения . ......... 188 § 6.1; Примеры приложений теории позиционных игр 195 § 6.2. Примеры приложений теории детерминированных, / стохастических и рекурсивных игр . 217 ЧАСТЬ IV. БЕСКОАЛИЦИОННЫЕ ИГРЫ . * , . t < а 232 Глава 7. Основы теории . . . . . . * , . , 232 § 7.1. Бескоалиционные игры п лиц . , 232 § 7.2. Игры с бесконечным числом игроков • • « 240 !♦ , '
к ' ОГЛАВЛЕНИЕ Глава 8. Приложения .................................... 244 § 8.1. Примеры приложений теории бескоалиционных игр п лиц .... ... 245 § 8.2. Примеры приложений'неатомических бескоалици- онных игр . •. . . . *. . . . . . 263 ЧАСТЬ V. КООПЕРАТИВНЫЕ ИГРЫ . , _ . « . . . 266 Глава 9. Основы теории . . . . . ‘ . 266 § 9.1. Арбитражные схемы..............................266 § 9.2. Классические кооперативные игры . . v . 272 § 9.3. Кооперативные игры с бесконечным числом иг- роков ............................... . . . 290 Г л а в а 10. Приложения . 298 § 10.1. Примеры приложений арбитражных схем . . 300 § 10.2. Примеры приложений кооперативных игр п лиц 306 Дополнение . , 321 Литература............................................. 330 Предметный указатель 335 Указатель обозначений.....................................336
ЙРЕДЙСЛОВЙЁ РЕДАКТОРА Среди проблем, которые стоят перед современной тео- рией игр, важное место занимают проблемы литератур- ные: многие разделы и аспекты теории игр еще ждут своего тщательного, систематического и притом достаточ- но элементарного изложения. В частности, необходимы теоретико-игровые руководства широкого профиля, по ко- торым начинающему можно было бы войти в курс боль- шинства основных вопросов современной теории игр и вместе с тем познакомиться с их приложениями в раз- личных отраслях человеческой деятельности. Попыткой восполнить этот пробел является предлагае- мая читателю монография. Ее структура несколько не- обычна — она предусматривает «парность» составляющих книгу глав: после каждой теоретической главы, излагаю- щей тот или иной раздел теории игр, следует глава, по- священная соответствующим приложениям. Такая компот зиция книги позволяет, с одной стороны, дать возмож- ность читателю сквозным образом -изучать теоретический материал, не перебивая его частными конкретными за- дачами, а с ^другой — не отрывать , теорию от ее при- ложений. Наряду с традиционным теоретико-игровым материа- лом в книгу включены и новые научные факты. В част- ности, заслуживает упоминания основанное на не совсем обычных соображениях доказательство теоремы о’мини- максе: хотя оно в силу своей громоздкости и не может педагогически заменить известные сжатые и прозрачные доказательства этой теоремы (одно из таких доказа- тельств приводится в книге), но положенные в его основу идеи, по-видимому, получат и дальнейшее развитие. Авторы не рассматривают ориентированных на ис- пользование ЭВМ численных методов решения игр (т. е. нахождения для конкретно, численно заданных, игр реа- лизаций применительно к ним принципов оптимально- сти), однако, стремятся во всех случаях, когда это оказы-
g ЙРЁДЙСЙОЁЙЁ РЕДАКТОРА -—вается^-возможным/ довести анализ игры до аналитиче- ских расчетных формул. Такая «расстановка акцентов» имеет свое методологическое основание: уже среди игр умеренной сложности, встречаются такие, что для «грубо численного» их решения не хватит'никакого машинного быстродействия; поэтому разработка аналитических мето- . дов и теоретическое усовершенствование алгоритмов представляются весьма важным делом. Книга рассчитана на достаточно широкий круг чита? телей — представителей различных специальностей, зани- мающихся вопросами исследования операций и их прило- жениями. Требования, предъявляемые к математической подготовке читателей, довольно скромны; необходимые сведения по топологии и функциональному анализу мож- но почерпнуть буквально из первых страниц любого учеб- ника по соответствующим предметам. Никаких предва- рительных знаний по теории игр у читателя не предпо- лагается. После прочтения данной книги читатель будет подготовлен для изучения специальных статей и моно- графий по теории игр. Н. Н, Воробьев
ПРЕДИСЛОВИЕ В природе и обществе часто встречаются явления, в. которых те' или иные участники имеют несовпадаю- щие интересы и располагают различными путями для достижения своих целей. Такие явления называются конфликтами, и они > являются- предметом изучения тео- рии игр.-. Следуя Н. Н. Воробьеву [19], под конфликтом / будем понимать всякое явление, применительно к кото- рому можно говорить, ktq и как в этом явлении участ- вует,; каковы могут быть у этого явления исходы, кто в этих исходах^ заинтересован и ъ чем эта заинтересован- ность состоит. Ход событий в конфликте зависит от решений, прини- маемых каждой из сторон, и поэтому поведение любого участника конфликта, если оно в том или идом смысле . разумно, должно определяться с учетом возможного по* ведения всех его участников. * Для конфликта характерно то, что ни один из его участников заранее не знает решений, принимаемых ос- тальными участниками, т. е. вынужден действовать в ус- ловиях неопределенности. Неопределенность исхода может проявляться не только в результате сознательных дейст- вий других участников, но и как результат действия тех или иных «стихийных сил» (непознанной природы). Важ- но лишь то, что наличие двух или более4стороп с раз- личными целями (в том числе сознательных индиви- дуумов или природы) исключает априорную оценку ка- ких-либо вероятностных распределений того или иного / исхода, которая тем самым предопределяется конфликт- постьф явления. Конфликт может возникнуть также из различия целей, которые' отражают не только несовпа- дающие интересы ‘ различных сторон, по и многосторон- ние интересы одного и того же. лица. Например, конст- руктор обычно преследует многосторонние интересы, . согласуй противоречивые технико-экономические требова- ния, предъявляемые к конструируемому изделию (мипи- L
8 ПРЕДИСЛОВИЕ мизация габаритов и стоимости, максимизация надежно- сти, обеспечение простоты в изготовлении и т. п.). В* ус- ловиях социалистической системы хозяйства план любого предприятия разрабатывается с учетом интересов различ- ных «сторон» (плановых органов, ведомств, предприя- тий-изготовителей, предприятий-потребителей и др.). Наконец, прямо противоположные интересы различных сторон явно проявляются в непосредственной борьбе (военной, дипломатической, экономической, спортивной и т. д.). Таким образом, единственная общность, которая объ- единяет все конфликты независимо от их физической и социальной природы, состоит в* столкновении интересов нескольких (двух или более) сторон. Основной аспект этого столкновения заключается в том, что стороны пре- следуют различные цели, имея для их достижения не- которые наборы альтернатив, каждая из которых приво- дит к одному (или к одному из нескольких) возможных исходов. При этом результат любого мероприятия каждой из сторон зависит от того, какой образ действия выберут другие стороны. В таком представлении конфликты со- ставляют содержание многих процессов из области эко- номики, военного дела, социологии, техники, дипломатии, спорта и других видов человеческой деятельности, а так- же встречаются в природе (например, в условиях межви- довой борьбы за существование). Все ято говорит о прак- тической важности и специфической сложности конфлик- та как.явления, основу которого составляют разумные действия лиц и коллективов с различными интересами. Формализация содержательного описания конфликта представляет собой его математическую модель, которую называют игрой. Участников конфликта называют игро- ками. При этом в качестве единого игрока может высту- пать целый коллектив, имеющий некоторые общие ин- тересы (фирма, предприятие, спортивная команда, вою- ющая сторона и т. д.). Теория игр изучает оптимальное поведение игроков в играх в том или ином смысле. Настоящая монография посвящена прикладному ас- пекту теории игр и состоит из пяти частей, каждая из которых содержит теоретическую главу и набор приложе- ний, разработанных в этой главе концепций. В теорети- ческих главах устанавливаются принципы оптимальности,
‘ Предисловий 9 доказывается существование соответствующих этим прин- ципам решений и определяется каково это решение в той или иной теоретико-игровой модели. Теоретические гла- вы, с одной стороны, являются фундаментом теоретико- игровых приложений, а с другой стороны, дают необхо- димую информацию для читателя, лишь в малой степени знакомого с теорией игр. Кроме того, специалисты — ма- тематики найдут здесь монографический материал, явля- ющийся дальнейшим развитием как традиционно класси- ческих, так и современных направлений теории игр. Прикладные главы содержат примеры конфликтов, при- водящих к тем или иным моделям теории игр. Авторы убеждены, что конкретно разобранный пример информи- рует читателя несравненно больше, чем общие рассуж- дения о вопросах, касающихся тех или иных прикладных аспектов. По традиции мы начинаем изложение с теории^анта- гонистических игр, моделирующих антагонистические конфликты, т. е. конфликты двух лиц, интересы которых прямо йротиврположны. Поэтому в антагонистическом конфликте у сторон нет почвы для согласования дейст-. вий. Исход антагонистической игры оценивается вещест- венным числом, которое одна из сторон старается макси- мизировать, а другая — минимизировать. Отсюда выиг- рыш (в самом широком смысле) одной из сторон в анта- гонистическом конфликте составляет проигрыш (потери) противной стороны. Теория антагонистических игр раз- вивается в частях I—III. Часть I содержит теорию конечных антагонистиче- ских, или матричных, игр. В этих играх игроки для до- стижения своих целей располагают лишь конечным чис- лом возможных для них действий (стратегий), которые они выбирают независимо друг от друга. В части II рассматриваются бесконечные антагони- стические игры; которые отличаются от матричных лишь тем, что’ один или оба игрока имеют бесконечное число стратегий. Концептуально эти игры ничем не отличаются от. матричных. Педагогически их разделение связано преимущественно с тем, что в части I вводятся основные и первоначальные, возможно, трудноусваиваемые понятия и концепции теории антагонистических игр. В > этом случае хотелось использовать минимум необходимого
10 ПРЕДИСЛОВИЕ математического аппарата. После того как читатель ос- воится с основными идеями матричных игр, он уже может читать часть II, не затрудняя себя особыми размышления- ; ми о том, почему игроки стремятся к той или другой си- туации, а преодолевая лишь математические трудности. Часть 11! посвящена многошаговым играм. Из огром- ного материала, имеющегося в настоящее время, мы включили в эту часть лишь конечные позиционные игры, детерминировапныё игры, стохастические игры и их частный случай — рекурсивные игры’ Это связано каК с ограниченным объемом книги, так и с желанием сде- лать изложение достаточно простым. Поэтому, например, общие динамические игры,, требующие более тонких ма- тематических конструкций, нами пе рассматриваются. Все игры этого раздела характеризуются тем, что игроки совершают свои выборы не раз и навсегда (как в частях Г и II), а последовательно во времени. Поэтому они рас- полагают той или иной информацией о развитии игры в прошлом. Все это требует введения' новых понятий, и поэтому выделение многошаговых антагонистических игр в отдельную часть нам кажется оправданным. Суще- ствует также теория многошаговых игр п лиц. Однако ее изложение потребовало * бы значительного расширения объема книги. Читатель, познакомившись с частью IV, в которой излагается теория бескоалиционных игр, без труда может перенести понятия и результаты теории антагонистических многошаговых игр па неантагонисти- ческий случай. . . Бескоалиционные игры описывают конфликты, в ко- торых интересы игроков не являются диаметрально про-» тивоположвыми (в частности, эти интересы могут совпа- дать). В этих играх игроки стремятся к ситуациям рав- новесия, т. е. к таким ситуациям, отклонение от которых отдельного игрока, если остальные игроки не изменяют своих стратегий, может привести разве лишь к его про- игрышу. Конфликты, в которых, принимает участие очень боль- шое число участников, моделируются играми с бесконеч- ным числом игроков. Мы затрагиваем только, некоторые вопросы этой теории — йгры, в которых выигрыш игрока определяется лишь его собственным выбором и «мерой» множества остальных игроков, сделавших такой же вы*
ПРЕДИСЛОВИЕ , 11 бор. В приводимых примерах каждый из бесконечного множества игреков может совершить лишь конечное число действий, а множества этих действий у всех игро- ‘ ков одинаковы* G другой стороны, часть примеров посвящена играм, в которых множество игроков конечно, а множество воз- можных стратегий каждого из них бесконечно. Антагонистические и бескоалиционные игры, рассмот- ренные в частях I—IV, составляют основное содержание- теории стратегических, игр. При этом участникам антаго- нистической игры нет никакой выгоды как отклоняться от своих оптимальных стратегий, так и договариваться до игры о выборе совместного плана действий. В бес- коалиционных играх игрок, отклоняющийся от ситуации равновесия, может лишь проиграть при условии, что ос- тальные игроки будут стараться ее сохранить. Однако если от ситуации равновесия отклонится несколько игро- ков, то они'могут и выйграть. Поэтому в бескоалицион- ных играх правила игры не предусматривают вступление игроков в коалиции. В реальных конфликтах такие ог- раничения возникают иногда^ из-за «физической» невоз- можности' объединения или в силу * законодательных актов. Вместе с тем природой ряда конфликтов между участ- никами допускается сотрудничество (кооперирование, со- гласование способов действий, обмен информацией и т. п.). В результате стороны могут использовать совместную стратегию. В этом случае исход игры определяется мно- жеством их возможных выигрышей или выигрышей от- дельных групп (коалиций) игроков. Поэтому модели этих игр, не имея стратегического аспекта, называются не- стратегическими. Кооперативная теория, которая излага- ется в части V, как раз и рассматривает вопросы, свя- занные с нестратегическими играми. • Основная проблема теории кооперативных игр состоит ’ в том, чтобы «разумно» разделить выигрыш, который может получить коалиция из всех игроков, между этими игроками или указать множество возможных дележей выигрышей. В последнем случае выбор конкретного де- лежа может быть произведен по соображениям, не отра- женным в теоретико-игровой модели. Естественно, что распределение выигрыша должно производиться «разум-
12 ПРЕДИСЛОВИЕ по»; Различные понятия «разумности» приводят к раз- у / личным решениям. Конфликты, приводящие к моделям кооперативных игр с очень большим числом участников, хорошо моде- лируют кооперативные игры с бесконечным числом игро- _ ков. Поэтому Bz части V затронуты вопросы, касающиеся и этой проблематики. Части I—IV рассчитаны на то, чтобы их читать по- следовательно. Часть V можно читать, пропустив преды- дущие Ласти. Однако нам представляется, что~в этом слу- чае проникновение в существо дела будет не столь глубоким. Читатель, в зависимости от своих интересов и подго- товки, . может пропустить доказательства теорем сущест- вования, если они ему покажутся трудными (теоремы 1.2—1.6, 3.1—3.6, 5.1, 5.2, 7.1—7.8). Однако перед каж- дой прикладной главой совершенно необходимо усвоение ,хотя бы основных понятий теоретической главы. Для читателей, не знакомых с топологией и функцио- нальным анализом, книга имеет^дополнение, в котором приводятся необходимые сведения из теории множеств и меры, а также определения метрических и топологических пространств. Список литературы включает, с одной стороны, те ис- точники, которые использовались при написании данной . книги, с другой стороны, те работы, ио которым читатель может глубже проникнуть в суть теоретико-игровой про- блематики. В книге не рассматриваются вычислительные аспекты теории игр и, в частности, вычисление минимаксных зна- чений функций. Поэтому в ней не отражены работы Ю. Б. Гермейера и его учеников, которые далеко про- двинулись в этом отношении. Ряд их работ «приводится в списке дополнительной литературы. Авторы приносят самую искреннюю благодарность редактору книги проф. Н. Н. Воробьеву за множество ценных замечаний и советов при работе над рукописью. Г. Н. Дюбинг В. Г, Суздаль
4 A GT Ь I КОНЕЧНЫЕ АНТАГОНИСТИЧЕСКИЕ ИГРЫ Глава 1 ОСПОВЫТЕОРИИ § 1.1. Матричные игры 1. Природа и структура конечных антагонистических игр. Важными и хорошо изученными играми являются антагонистические игры. Определение 1.1. Тройка . Г = <я,//,/7> * . (1.1) (где ж и у — множества, Н — функция от двух перемен- ных х^ х и у у) называется антагонистической игрой.. Если множества я? й у конечны, то тройка (1.1) называ- ется конечной антагонистической игрой. Множества ж, у называются множествами стратегий. Элементы г е х на- зываются стратегиями (точнее чистыми стратегиями) иг- рока I, элементы у у — {чистыми) стратегиями игро- ка II, функция Н — функцией выигрыша игрока I или просто функцией выигрыша, а пара {х, у) — ситуацией в чистых стратегиях. Процесс разыгрывания конечной антагонистической игры состоит в<том, что игроки I и II, независимо друг от друга, выбирают соответственно некоторые чистые стратегии х и у, в результате чего складывается ситуа- ция (х, у). После этого игрок I получает выигрыш H(x,sy). Игрок II столько же проигрывает. Поэтому ве- личину Н(х, у) также называют проигрышем игрока П. Понятия проигрыша и выигрыша чисто условны, так как величина Н{х, у) может быть отрицательна. Считая, в силу антагонистичности игры Г\ выигрыш игрока . II равным величине его проигрыша с обратным знаком, функцию — Н называют функцией выигрыша иг- рока П. '
14 ЧАСТЬ I. КОНЕЧНЫЕ АНТАГОНИСТИЧЕСКИЕ ИГРЫ Поскольку число возможных действий каждого из иг- роков конечно, а названия стратегий для нас несущест- венны, можно полагать «={1,2, .. . иу={1,2, (здесь т и п — соответственно число чистых стратегий игроков I и II). Тогда значения функции 11 естественно представить в. виде матрицы Н = НЛ0И, .= , 1^/<п, - в 1?ё строке которой последовательно расположены .вы- игрыши игрока I в ситуациях (г, 1), (i, 2), ..., (i, n), а в столбце у — его выигрыши в ситуациях (1, /), (2, /), . ..,(тп, /). Таким образом, всякую конечную антагонистическую Игру можно задать вещественной матрицей, которая. на- зывается матрицей выигрышей. В этой терминологии ко- нечная антагонистическая игра называется матричной, вы- бор игроком I стратегии i означает выбор строки I, а вы- бор игроком II стратегии / — выбор столбца /. Выигрыщ игрока I будет при этом равен элементу матрицы Я, стоящему па пересечении г-й строки и ./-го столбца. 2. Принципы оптимальности. Если игрок I выбирает стратегию аг°е«^то игрок II мож.ет /выбрать такую стратегию у е у; при которой выигрыш игрока I будет / равен наименьшему из чисел Ж«°, у), т. е. min Я (я0, у}. ’ i/sy Поэтому игрок. I будет склонен- выбрать свою стратегию «° так, чтобы этот минимальный выигрыщ был наиболь- - шим, т. е. равным . _ - ' min Я («°, у) = max min Я (х, у) = v (Г). (1.2) ~ у^у х^х уеу . • “' Величину j?(D будем называть нижним значением игры Г = <«, у, Н). Соответствующую этому значению стратегию игрока I называют его максиминной чистой стратегией. Применяя эту стратегию, игрок I при любом поведении игрока II обеспечивает себе выигрыш, не меньший чем к(Г). Это можно записать в виде неравен-^ ства Я («°, у) г(Г) \fyt~ у. (1.3) Аналогично стратегия г/°, определяемая из равенства Шах Я («, #°) = min max Я(«, у) =v (Г), м
Глава 1. основы теории 15 называется минимаксной чистой стратегией игрока II. Применяя ее, он при_любых действиях игрока I проигрьь вает ему не больше у(Г)7 что соответствует неравенству ,. Н (х, у0) (Г) ух е х. (1«5) - Величину р(Г) будем называть верхним значением игры Г = <#, у>Н>. - Полагая в (1.3) у==у°, а в (1.5) х=.х°, мы получим’ ^(Г)СЯ(х^у°0^р(Г). (1.6). - Придерживаясь стратегии х°, игрок I поступает очень осторожно: он желает получить величину р(Г) независи- мо от действий игрока Ц. Принцип, которому он следует, называется принципом максимина, потому что гаранти- рованный выигрыш игрока I как раз равен величине max min Н (х, у). ае* у^у Если игрок IT придерживается стратегии, у0, то оп тоже следует этому принципу, так как его выигрыш ра-. вен — 7/(х, у), а 4 * max min (— ~ (х, у)) == — min max II (х, у), ае* у^у у&у х&с - Таким образом, ^его проигрыш по превосходив р(Т) при любых действиях игрока I. Принцип максимина был впервые явно сформулиро- ван Дж. фон Нейманом [37] в 1928 г. Этот принцип име- ет ва'жпое значение и широко используется в теории игр. В частности, теория антагонистических игр изучает по- ведение игроков, придерживающихся именно этого прин- ципа. Л е м м а 1.1. Ёсли - 9 £;(Г)==р(Г), . , (1.71 л /' —— * а х*, у* — соответственно максиминпая и минимаксная чистые стратегии игроков, то * //(х, у*) < Л(х*, у*) Шх*,' у), (1.8) Доказательство. При условии С1.7) двойное не- равенство (1.15) превращается в р(Г) == р(Г) «=* Я(х*, у*).
16 ЧАСТЬ I. КОНЕЧНЫЕ АНТАГОНИСТИЧЕСКИЕ ИГРЫ 9 Теперь, подставляя в неравенства (1.3) и (1.5) вместо ж р(Г) и р(Г) выражение Жя*, у*), мы получим двойное 1 неравенство (1.8). . Верно и обратное утверждение. ' | Лемма 1.2. Если для некоторых чистых стратегий . | х* и у* справедливо двойное неравенство (1.8), то х* и л у* являются соответственно максиминной и минимаксной % стратегиями игроков} кроме того, выполняется равенств I во (1.7). * I Доказательство. Из (1.8) получим У v (Г) = min max Н (х, у) max Н (х, у*) Н (х*, у*) у&у хе* хе* min И (х*, у) max min Н (х, у) =₽= v (Г). (1.9) 4 i/ey хе* уеу В силу (1.6) все неравенства (1.9) на самом деле явля- . ются равенствами, что и доказывает лемму. Определение 1.2. Ситуация (х*, у*) называется ситуацией равновесия в чистых стратегиях, если для лю- . Gwlx^x, у^у выполнено двойное неравенство (1.8). Ситуация равновесия приемлема для каждого из иг- роков, ибо, как видно из (1.8), ни одному из них не вы- годно отклоняться от этойг ситуации. В этом смысле ситуация равновесия является устойчивой. Если каждый из игроков стремится достичь ситуации равновесия, то принцип, которому они следуют, называют принципом ✓ равновесия. В антагонистических играх, действуя соглас- но этому принципу, игрок поступает также согласно принципу максимина (при том очевидном условии, что этот принцип реализуем, т. е. при условии существования ситуации равновесия). Как мы выясним в главе 7, в не- антагонистических играх принцип равновесия и принцип максимина приводят, вообще говоря, к различным ре- зультатам. Для игры, заданной матрицей выигрышей Н «ИЛ^И, равенство (1.7) записывается в виде • maxmin Л# = min max h^, (1.10) i з 3 i. а неравенство (1.8) — в виде /*) С Я(1*, /*) Я(г?, /), (1.11)
ГЛАВА 1. ОСНОВЫ ТЕОРИЙ 17 • где г*, /* — чистые максиминна^ и минимаксная страте- гии соответственно игроков I и 'II. Выигрыш в ситуации равновесия (/*, /♦) равен мини- муму всех элементов строки j* матрицы выигрышей игры и максимуму элементов столбца /*. Поэтому ситуацию равновесия в чистых стратегиях иногда называют седло- вой точкой. Нахождение ситуаций равновесия (седловых точек) может быть выполнено по следующей схеме: Общее значений максимина (1.2) и минимакса (1.4) будем называть значением матричной игры с матрицей выигрышей Н. Это значение игры будем обозначать че- рез Он или просто через о. Пример 1.1. Пусть задана матрица выигрышей игрока! -3 — 2 5 4 3 2 -> min = — 3 з -> min — 0 i 23 ->min h„- = 2 i 3 max min — 2. i 3 2 maxh^—2 maxh|2—5 min ma х/ц a—2 3 i 3 * Седловой точкой ^является пара (f* = 3, /* = 1), при которой о = р(Г) — р(Г) = 2. Заметим, что хотя выигрыш zb ситуации (3, 3) также равен 2 « р(Г) — v(Dv она не является седловой точкой, так как этот выигрыш не является максимальным среди выигрышей третьего столбца. . - _ * 2 Г. И. Дюбин, В. Г. Суздаль
18 4 ЙАСТЬ 1 КОЙЕЧЙЫЁ АНТАГОНИСТИЧЕСКИЕ ИГРЫ матрица выигрышей иг- Пример 1.2. Пусть задана рока I _ 710 30\^>10 ~U0 20/->20 ' Г • , 40 30 z v(D=30 Из анализа матрицы выигрышей видно, что_у(Г)< v(D, т. е. данная матрица не имеет седловой точки, а игра не имеет ситуаций равновесия в чистых стратегиях. Если теперь игрок I выбирает свою чистую максимипную стра- тегию i°«2, то игрок II, выбрав свою чистую минимакс- ную стратегию /° = 2, проигрывает только 20. В этом слу- чае игроку I выгодно выбрать стратегию i = 1, т. е. отклониться от своей чистой максиминпой стратегии и выиграть 30. Тогда игроку II будет выгодно выбрать стра- . тегию / == 1, т. е. отклониться от своей чистой минимакс- ной стратегии и проиграть 10. В свою очередь игрок I . должен выбрать свою 2-ю стратегию, чтобы выиграть 40, а игрок II ответит выбором своей 2-й стратегии и т. д. Естественно возникает вопрос: как следует поступить игрокам, если ситуации равновесия в чистых стратегиях не существует? Ответ па пего содержится в п. 3. 3. Смешанное расширение матричной игры. Анализ примера 1.2 показывает, что если игра не имеет ситуа- ции равновесия в чистых стратегиях, то игроки, приме- " , цяя свои максиминную и минимаксную чистые страте- гии, создают неустойчивую ситуацию, которую один из игроков может изменить с выгодой для себя. С другой стороны, представляется, что ничего другого осторожным игрокам рекомендовать нельзя, И все-таки из этого по- ложения есть, выход. Каждый из игроков может выбрать свои чистые стратегии случайно, *т. е. может определить распределение вероятностей па множестве чистых стра- тегий, а затем предоставить выбор конкретной чистой стратегии случайному механизму. Выбор игроками своих чистых4 стратегий с некоторы- ми, заранее заданными вероятностями х—по существу один из планов проведений игры и, в этом смысле, тоже явля- ется некоторой стратегией. В отличие от первоначально заданных, такие стратегии называются смешанными^
/ ТПкВк 1. ОСНОВЫ ТЕОРИИ 19 Определение 1.3. Распределение вероятностей на множестве чистых стратегий игрока называется его слсе- шанной стратегией. Множество всех смешанных стратегий игрока I будем обозначать через X. Смешанная стратегия X е X являет- ся вещественной функцией Х = Х(х), для которой ХСт) > >0 и S Х(я)=1,а чистая стратегия — это такая функ- хе* . . ция, что Х(я°) = 1 и ХЫ = 0 для х*±х°. Таким образом, чистая стратегия является частным ’ случаем смешанной, стратегии. Например, чистая стра- тегия I игрока I есть вектор (0, ..., О, 1, 0, 0), i-я компонента которого равна 1, а остальные равны нулю. Помня, что такой вектор есть не- что иное как чистая стратегия мы далее будем обозначать его через I. Вследствие этого, множество смешанных стратегий игро- ка I называют смешанным расширением множества чи* стых стратегий. . . . - • Множество всех смешанных стратегий игрока II бу-» дем обозначать через Y. Смешанная стратегия УеУ является вещественной функцией У=У(у), для которой Y(y)>0 и S ¥ (у) = 1» а чистая стратегия — это такая функция, что У(у°) = 1 и У(у) = 0 для у у9. Если чистые стратегии игрока I занумерованы числа- ми 1, 2, ..., т, то каждая стратегия Х^Х может быть представлена как вектор 771 x = Gi,E2,li>0, 5 li-С (1.12) 1=1 ч где — вероятность выбора игроком I - чистой страте- гии j. * - Аналогично множество всех смешанных стратегий Y будет состоять из векторов_ У = (П1, Т12, •••» Пп). 2]U'=1. (143) где T]j — вероятность выбора игроком II чистой страте- гии /, а п — число чистых стратегий игрока II. Множества смешанных стратегий игроков I и II мож- но отождествить с подмножествами евклидовых прост-. 2*
20 ЧАСТЬ I. КОНЕЧНЫЕ АНТАГОНИСТИЧЕСКИЕ ИГРЫ ранств R”1 и Rn, определяемыми формулами (1.12) и (1.13). Эти подмножества замкнуты и ограничены, а по- тому компактны. \ На рис. 1.1 изображено множество смешанных стра- тегий игрока, имеющего три чистые стратегии. Это мно- жество является равносто- ронним треугольником (двумерным симплексом). Если игрок имеет п чи- стых стратегий, то множе- ство его смешанных стра- тегий можно представить ' в виде (д — 1)-мерного симплекса в n-мерном про- z странстве. Применение смешан- ных стратегий превращает процесс игры в некоторое случайное испытание, ис- ходами которого являются ситуации игры. Это слу- испытание называется ситуацией в смешанных Рис. 1.1. Ччайное . .. , v , ___ стратегиях и обозначается через (X, У). На первый взгляд кажется» что применение смешанных стратегий некоторым образом осложняет положение игрока. Действительно, ис- пользуя смешанную стратегию, игрок I может в качестве вы- игрыша получить, вообще говоря, любой элемент матрицы выигрышей Н — НЛцН,* в том числе самый малый элемент этой матрицы, который для некоторых матриц он заве- домо не получил бы, применяя свою максиминную стра- тегию. Однако при достаточно правильно выбранной стран тегии ситуация, соответствующая минимальному элемен- ту матрицы, будет осуществляться с малой вероятностью. Отказываясь от применений только чистых стратегий, игрок отказывается и от получения заведомо гарантиро- ванного результата. Он старается максимизировать мате- матическое ожидание своего выигрыша. Отсутствие какого-либо обмена информацией между игроками делает их случайные выборы своих чистых стратегий независимыми. Поэтому, если они применяют свои смешанные стратегии XeZ, УеУ, то каждая ситуация в чистых стратегиях (х, у) реализуется с веро-
ГЛАВА 1. ОСНОВЫ ТЕОРИИ 21 ятностъю ,Х(я)У(у). Следовательно, математическое ожи- дание выигрыша игрока I можно вычислить по формуле H(X,Y)= 2 .2 H(x,y)X(x)Y(y)t (1.14), или, в матричной форме записи, ч т п H(X,Y)^^^h^; _ (1.15) i=l j=l Таким образом, мы пришли к понятию смешанного • расширения матричной игры. Определение 1.4. Тройка Г = (X, У, /7>, где X, У — смешанные расширения чистых стратегий игро- ков, а функция выигрыша игрока I определяется выра- жением,(1.14) или (1.15), называется смешанным расши- рением матричной игры. Смешанное расширение матричной игры, является ан- тагонистической игрой, в которой множество чистых стра- тегий каждого из игроков бесконечно, функция выигры- ша игрока I задана формулой (1.14) или (1.15), а функ- ция выигрыша игрока II равна —Н. Функция, ЖХ, - У), являясь билинейной функцией в евклидовом пространстве, -непрерывна на множестве ситуаций. X х,У.* Вследствие .замкнутости и ограничен- ности множества смешанных стратегий первого игрока^ определена и непрерывна функция v (X) = min Я (X, У) = min Я (X, j). (1.16) У 3 Действительно, каждая из функций ЖХ, /) (1^/^п) непрерывна, а значит, вследствие замкнутости и ограни- ченности, и равномерно непрерывна. Таким образом, так как число функций ЖХ, /) конечно, для любого 8>0 существует такое 6>0, что из условия IXх — X"|<6 будет следовать неравенство 1ЖХ', /) — ЖХ", /)| < 8 при 1 п. Далее," если v(X') = Н(Х', j')9 v(X") ==• ^ЖХ",/"), то р(Х') + 8 = ЖХ', /') + 8 > ЖХ", /') > > iAX") > ЖХ', j") - 8 > v(X') - 8. Следовательно, Ii?(X') — v(X" )| < 8, что доказывает непрерывность функции и(Х). -Поэтому существует
22 ЧАСТЬ I. КОНЕЧНЫЕ АНТАГОНИСТИЧЕСКИЕ ИГРЫ стратегия X*, определяемая равенствами min Н (X*, У) = max и (X) = р'(Г). ' (1.17) Y X ~ 4. Теорема о минимаксе. Величину называют нижним значением игры Г = (X, У, Я), а. стратегию X* — максиминной стратегией игрока I. Применяя ее, игрок I при любых действиях игрока II выигрывает не меныщг чем у (Г); в формальной записи Я (X*, У)^р(Г) для любого УеУ. (1.18) Аналогично игрок II, используя стратегию У*, опре- деленную равенствами max Н (X, У*) = min max Н (X, У) = и (Г), (1.19) X - Y X t может быть уверен, что не проиграет больше величины р(Г). Это число называют верхним значением игры Г = <Х, У, Я>, а стратегию У* — минимаксной стратегией игрока II. Как и раньше, из' компактности и непрерыв- ности легко устанавливается существование минимаксной стратегии. Следствием равенств (1.19) является неравенство Я(Х, У*)<г(Г) Хе=Х. ' (1.20) Полагая в неравенстве (1.18) У = У*, а -в неравенстве (1.20) Х = Х*, получим _у(ГХЯ(Х*, У*)<р(Г). (1.21) Двойное неравенство (1.21) является аналогом (1.6). Замечание. При определении верхнего и нижнего значений игры, а также минимаксных и * максиминных' стратегий мы не пользовались никакими свойствами иг- ры Г, ‘кроме замкнутости и ограниченности множеств стратегий игроков и непрерывности функции Н: Поэтому для любой игры Г s= <#, у, Я), в которой множества х и у замкнуты и-юграничены, а Я — непрерывная функция от двух переменных х е х и у^у, таким же образом можно определить все эти понятия, и для них, очевидно, будут справедливы формулы (1.17)—(1.21) при соответ- ствующей замене символов X, У на-символы у.
глава 1. основа теорий 28 V Определение 1.5. Если р(Г) « 7(Г), _ (1.22) то величина г;=.£(Г) = у(Г) называется значением игры Г == <Х, У, Н>, ' которое называют также значением иг- ры. Г = (ж, у. Н}. . Оказывается, что для смешанного расширения любой матричной игры выполняется равенство (1.22). Этот за- мечательный факт составляет содержание одной из важ- нейших в теории игр теоремы, которая известна как теорема о минимаксе. Существующие доказательства этой теоремы основаны на теореме о неподвижной точке или свойстве отделимости выпуклых множеств. По традиции мы прежде всего, приведем доказательство теоремы о ми- нимаксе, использующее теорему об отделимости выпукло- го множества от точки в_ евклидовом пространстве. Теорема 1.1 (о разделяющей гиперплоскости). Если заданы замкнутое ограниченное выпуклое множество С с ROT< и некоторая не содержащаяся в этом множестве точка z* е Rm, то существует набор чисел ait ..., ат и чис- ло 6, для которых ttjZ? + #2^2 + • • • Ц; Лт2п= Ь,‘ (1.23) UiZt Ч* U2%2 “I- ... OmZm b (1.24) для всех z С. * , , Доказательство. Пусть р(С, z°) — расстояние между^точкой 2° и точкой се С. Так как множество С замкнуто и ограничено, а потому компактно, эта функ- ция непрерывна ег достигает в некоторой точке" с° своего минимума. Обозначим через Р гиперплоскость, проходя- щую через точку 2° и перпендикулярную прямой, соеди- няющей точки с° и 2°. Докажем, что ни одна из точек множества С не содержится/в гиперплоскости Р. Действительно, если с' <=С и с' е р, то в двумерной плоскости, являющейся линейной оболочкой точек с\^с' и z°, эти три точки определяют прямоугольный треуголь- ник cQz°c,c прямым углом при вершипе z° (рис. 1.2). Но тогда расстояние от точки с"—основания перпендику- ляра, опущенного'* из вершины z° на гипотенузу с°с/,— до точки z° строго меньше, чем расстояние or точки с° до точки z°. С другой стороны, точка с" является выпуклой
24 Часть t. конечный айтаГойистическйе, игры комбинацией точек с°, с&С, так как находится внутри отрезка, соединяющего эти точки. Следовательно, с'&С, так как предположение принадлежности точки У мно- о жеству С противоречит тому, z что функция р(С, z°) достигает минимума в точке с°. / Таким образом, пи одна из / X. точек множества С не содер- / ^0* жится в гиперплоскости Р. Сле- £-----“-----------—довательно,. все множество С с с ' содержится в одном из двух Рис 1.2., полупространств, определяемых гиперплоскостью Р. Как . из- вестно, эти полупространства определяются неравенствами" ajZ! + a2z2 +... + amzm > 6, (1.25) aiZi + a2z2 + ...^г amzm< b, (1.26) где числа (1 i т) и b являются коэффициентами уравнения гиперплоскости Р: a2z2 • *4* dmZm=ss 6. t (1.27) Очевидно, умножая, если нужно, коэффициенты урав- нения (1.27) на —1, можно считать, что полупространст- во, в котором содержится множество С, определяется не- равенством (1.25). Это доказывает теорему. Лемма 1.3 (о двух" альтернативах). Какова бы ни была матрица Н, имеет место одна из двух возможностей («альтернатив»): а) существует такой вектор X = (|х, Е2, ..Em) е X ' что - 7И -2Ы«>0х (1.28) 1=1 б) существует такой вектор Y — (т]и ц2, ..т]п) е У, что (1.29) 5=1 Доказательство. Пусть С — выпуклая оболочка m + п векторов ' е1 = (1, 0, ..., 0), fe1 =v (Ди, h2ii ..fewl),
ГЛАВА I. ОСНОВЫ ТЕОРИИ 25 в2 в (0, lt • • 0), Л2 — (^121 ^22, • • •, fem2)f ет = (0, 0, ..1), fc* == (fetn, h2n, .;hmn\ a 0 = (0, 0, 0) — вектор в m-мерпом евклидовом про- странстве. Тогда могут быть два случая: и О&С. Предположим, что О&С (рис. 1.3). Запишем вектор О в ви^е выпуклой комбинации векторов в* (£= 1, 2, ..., т\ и hj (j = 1, 2, ..., л): 2 сце1 + 2 = 0, (1.30) 4-1 7—1 где <& > 0, 1 i С т, р, > О, 1</С га, (1.31) i«i+S₽i = l. (1.32) i—1 ;=1 Распишем векторное равенство (1.30) покоординатно: a< + S₽Xij = 0. (1.33) 7=1 Так как а<>0, то из (1.33) следует 2 <0, 1 < i < т. (1.34) ^==! Па основании (1.31) имеем Р=2в>б. 7=1 Допустим, что р = 0, т. е. ^ = 0 (/«1, 2, м) (так как каждое из чисел р, является неотрицательным). Тогда из (1.33) следует, что а»«0.(1«1, 2, ..., тп), а это* проти- воречит равенству (1.32). Следовательно, Р=2&>0. (1.35) 7=1 Положим теперь т|; == (J/p. Легко видеть, что вектор т)з, TjJ’ является смещапной стратегией игро-
26 ЧАСТЬ I. КОНЕЧНЫЕ АНТАГОНИСТИЧЕСКИЕ ИГРЫ Я ка II (см. (1ЛЗ)). Разделив (1.34) на Р>0. мы не из-» Я мецим знака неравенства в получим ' Я « / 1 2j < 0, 1 < г < /п, 1 i что доказывает справедливость альтернативы (б) лем* з мы 1.3. к | Пусть теперь О&С (рис. 1.4). Тогда согласно теоре- ме 1.1 существует гиперплоскость, которая проходигче- ; рез точку 0, а все точки мно- жества С содержатся в од- _ 1 ном из соответствующих по- лупространств. На основании j (1.23) выполняется равенство ] 2X*i, ; j т. е. Ь = 0, а из (1.24) следу* '! ет. что - ! т длй всех z^ С, в том числе, если z являются любым из т + п векторов е*, h\ Поэтому 2/гъ-а}>0, 1<у<п, (1.36) 4-1- 2<И=а>0. ‘ (1JJ7) Легко установить, что вектор X я= (Hj, • • •» ^m) == • • •, является .сметанной стратегией игрока I (см. (1 12)). Да- лее, разделив (1.37) на а>0, получим ^2 Oj 1 7
Глава 1. бсйбйь! Феорйй что доказывает справедливость альтернативы (а) лем- мы 1.3/ На основании теоремы 1.1 и леммы 1.3 докажем те- перь теорему о минимаксе. ' Теорема 1.2 (о минимаксе). Пусть Н ® 11/Ц1 — не- которая матрица и пусть Н(Х, У)— математическое ожи- дание выигрыша игрока I, которое для.-, любого X == X и любого У = (ти, т]2» • • •» ТЬ) е У опре* делено, выражением (1.15). Тогда. max min Н (X, У) = min max Н (X, Y).~ (1.38) х У УЛ Доказательство. Пусть для матрицы Я выпол- няется альтернатива (а) леммы 1.3, т. е. существует та- кой вектор ХеХ, что *’ . 2 > 0» 1 7 1=1 > \ . - Тогда, если игрок II применит смешанную стратегию У, то математическое ожидание выигрыша игрока I будет положительным, т. е. m - п. , ’ Я(Х,У) = 2 2Ыиь>о. (1.39) i—lj=l Так как (1.39.) справедливо , для любого Y У, то min-Я(X, У)>0 V и тем более . max min Н (X, У) > 0. . 1 (1.40) Аналогичным Ъбразом гфи условии выполнения аль- тернативы (б) леммы. 1.3 получим min max Я (X, У) 0. (1.41) * у х , Очевидно, что в силу леммы 1.3 выполняется только одно из двух. неравенств (Г.40), (1.41) и, следовательно, ни для какой матрицы не • может выполняться двойное неравенство max min Н (X, У) < 0<min max Я (ХГУ). (1.42) XX хх
28 ЧАСТЬ t КОНЕЧНЫЕ АНТАГОНИСТИЧЕСКИЕ ЙГРЫ * V е Допустим теперь, что теорема 1.2 несправедлива. Тог- да в силу неравенства (1.21) существует число £,'для.ко- торого выполняется двойное неравенства max min Н (X, Y) <t <Z mih max H (X, У). - х y y x Это неравенство эквивалентно каждому из неравенств max min Н (X, Y) — i < 0 < min max И (X, Y) — Г, X У . г х max min (Я (X, У) —7) < 0 < min max (Я (X, У) — i), х у * Y х max min Я (X, У) 0 < min max Я (X, У), х Y Y х где Н == ll/itjll == llfey — ill. Следовательно, неравенсдва (1.42) выполняются для матрицы Нт Но, как уже было показано, эти неравенства не могут быть справедливыми ни для одной матрицы. Это противоречие доказывает теорему 1.2. Установим ряд вспомогательных результатов, которые нам понадобятся в дальнейшем.» Лемма 1.4. Если функция Н(Х, Y) вогнута по X е X при всех Y е У, где X — подмножество линей- ного векторного пространства?, Y — произвольное множе- ство, то функция Л ДЧХ)^тГЯ(Х, У) . " у вогнута^ . Если функция Н(Х, У) выпукла по У е У при всех X е X, где Y— подмножество линейного векторного про-, странства, X— произвольное ^множестёо, то функция Л2 (У) = sup Я (X, У) X выпукла. Доказательство. Пусть О С а < 1. Тогда h1 (ах* + (1 - а) X2) = inf Н ((аХ1 + (1 - а) X2), У)> , > inf (аЯ (X1, У) + (1 - а) Я (X2, У)) > а inf Я (X1, У) + Y Y + (1 - а) inf Я (X2, У) = аЛ1 (X1) + (1 - а) fe1 (X2).
ГЛАВА 1. ОСНОВЫ ТЕОРИИ 2g Эти неравенства доказывают вогнутость функции fe4(X). Аналогично доказывается выпуклость функции й2(У). Лемма 1.5. Пусть Н(Х, Y) — произвольная функ- ция, заданная на X х Y. Тогда \ sup inf Н (X, Y) < inf sup Н (X, Y). X Y У X Доказательство. Очевидно, что Н{Х^ УХ-sup Н(Х, Y). . х * Из этого следует, что' точная нижняя граница левой части не превосходит точной нижней границы лравой части, т. е. z inf Н (X, У) < inf sup Н(Х У). У У X Это неравенство справедливо при . всех X е X. По- этому sup int Н (X, Y) inf sup Н (X, У). х у \ v ' * * Лемма доказана. Пусть Г = <Х, У, —смешанное расширение ко*» нечной антагонистической игры Г, X' и У' — замкнутые выпуклые подмножества X и Y,H(X', Y') — сужение функции*) на X' х У\ X'—чмаксиминная стратегия в игре Г = <Х', У', Н} Для любого ё>0 определим множество У" = {Уе.Г|// (X', У)^р(Г') + е}. Так как У' является выпуклым компактом, а функция Н линейна по У, множество- У* образует выпуклый компакт. Лемма 1.6. Пусть?" = <Х', У", Я>. Тогда справедливы не* равенства «•» Р(Г")0(Г')0(ГКНГ"). - (1.43) ' ♦) Сужением функции f, заданной на множестве Г, на множе* ство Т° cz Т называется функция определенная на множестве Г° и совпадающая на этом множестве с функцией /. 4
, SO ^АСТЬ I, ЙОЙЁЧЙЫЁ АЙТАГбЙЙсТИЙЁСКЙЁ ИГРЫ Доказательство. Y" cz Y', следовательно, v (Г") =^min max Н (X, У) > min max Н (X, У) = у (Г'), УеУ" x<=xr ygF'хеХ' так как минимум по меньшему множеству не меньше минимума по большему. Среднее неравенство. является следствием леммы 1.5. Таким образом, остается доказать первое из неравенств . (1.43). Положим р(Х)= min Я(Х, У), г/(Х)= min Н (X, У),. УеУ' УеУ" , - ’ Предположим, -что • н(Г")>р(Г')< * (1.44) Тогда для некоторого X'е Х'должны, выполняться неравенства (1.45)' р'(Х') > р(Х')< (1.46) Обозначим через [X', X'] множество точек симплексах, имею* щих вид w •Х(Х)=^+(1-51)Г, где 0 Х^1. Рассмотрим две линейные функции на отрезке [X', X']; /(Х(Х)) = Ь(Г') + (1 - Х)н'(Х'), , g(X(X)) « Х(у(Г') 4-е) 4- (l-X)y(X'). силу неравенства (1.46) и очевидного неравенства р(Г')4-е> ♦ > £(Г') разность g — / поло- жительна при X — 1 и отрица- тельна при X =0. Поэтому (см. рис. _1.5) существует такое X, 0 < X < 1, при котором ~ , /(Х(Х)) «g(X(Xn. (1.47) По лемме 1.4 функция R'(X(X)) вогнута. Следователь- но, ^'(Х(Х))> Ху'(*Х') + (1-Х)р'(Х')> >Х^(Г')4-(1-Х>'(Х). Воспользовавшись неравенст- вом (1.44), получим В v v’(X’) v(x) Рис. 1.5. а v'(X(X)) > Ху(Г') 4- (1— Х)р'(Х') «/(X(X))f (1.48) "Аналогично доказывается неравенство ' (1.49)
ГЛАВА 1. ОСНОВЫ ТЕОРИИ 31 Из неравенств (1.48), (1.49) п равенства (1.47) следует, что min Н (X (X), У) = min / min Н (X (X), У), inf Н (X (Х),У)1 1п=У'« УеУ'\Г'4 у J - >min(/(X(X), g(X(X))) = /(X(X))=g"(X(X))< Отсюда имеем У(Г')^= max min Н (X, У) min Н (X (X), У)>#(Х(Х)). лгеХ' Yer' Yei" (1.50) Число g(X(X)) является выпуклой комбинацией чрсел г (Г') + 8 и t/(X'). "В силу неравенства (1.45) оба эти числа - больше £(Г'). Поэтому 2(Х(Х))>р(ГЪ • \ Принимая во внимание неравенство (1.50), мы получим *, \ 2>(Г') >»(Г'Г, (1.51) что неверно- Так как неравенство (1.51) является следствием неравенства (1.44), то неравенство (1.44) также не. имеет места, а значит, справедливо первое из неравенств (1.43). Лемма доказана. Лемма 1.7. Пуспгь~у" = <Х", Y't Н>, где ' X" = {X е G-X'l Я(Х,У)^у — е) (У — некоторая минимаксная стратегия иг* рока II в игре Г'). Тогда справедливы неравенства '^(Г") <£(Г')‘^Т(Г') С ^(Г")< (1.52) Лемма 1.7 доказывается аналогично лемме 1,6--._. Теперь-мы приведем еще одно доказательство [61] теоремы 1.2 о минимаксе, основанное на других идеях и имеющее интерес- ные обобщения (теорема 1.2 приводится в несколько иной форме). Теорема 1.3 (о миппмаксе). Любая матричная игра имеет значение. Д о к а в а т е л ь.с т в о. Обозначим через Г1 игру <Х, У, Я>, а через X1, У* множества X, У и определим индуктивно после; довательпость игр;- П = <Х\ У1, Я>, уп+1 *= (у е у” I а (х*"-1, у) < v (г2п-1) + 9-^), где Х2п~’ — некоторая макспмипная стратегия *) первого игрока в игре Г2п“*; х р2П-- /уП yn'+l 3'nM = U е хп I а (X, Y2n) > V (Г2П) - е/(2л)}, ♦) Вследствие замечания к п. 4 J 1.1 эта стратегия опредо* ясна.
32 ЧАСТЬ I. КОНЕЧНЫЕ АНТАГОНИСТИЧЕСКИЕ ИГРЫ где У2я — некоторая минимаксная стратегия второго игрока в игре Г2я; Г2П+1 = <Xn+1, Уп+1, Я>, в —произвольное положительное число. В силу лемм 1.6, 1.7 справедливы неравенства £(Гп)<р(Гв“1)<1’(Г’-1Х»(Г»), (1.53) из_которых следует, что £(ГЯ) монотонно убывает с ростом п% а р(Гп) монотонно возрастает. Кроме того, из определения мно- жеств Кп Yn, а также верхнего и нижнего значений игр Г" сле- дуют неравенства р (Г2*-1) < Н (X2*-1, У) < р (Г2*-1) + 8/(2л 1) (1 .о4) ори кеУпЧ v (Г2в+«) > В (X, У2П) > V (Г2П) е/(2п) (1.55) при X е Хп+1. Пусть Г00 = <Х“, У00, Я>, где Xх = П Хв, У°° = А У". Так как,Хп+’ <= Xя. Ув+1 <= У”, п=1 п=1 а множества Xn, Y” выпуклы и компактны, множества л У * непусты и обладают теми же свойствами. Не ограничивая общности, можпо считать^ что последователь- ность Х2*-1 сходится к некоторой стратегии Х*, а последователь- ность У2п — к стратегии Р°° (в противном'случае можпо перейти к соответствующим подпоследовательностям). Докажем равенства В (X, У°°) = const, X е X00, . в (х~, у) = const, у е у". Действительно, так как -функция Н(Х, Y) непрерывна на X1 х УА,а значит, и равномерно непрерывна^ (множество X х У1 компактно), последовательность функции Я(Х2я-1, Y) равномерно сходится к функции /7 (Xе®, У). Поэтому для любого в( > 0 су- ществует такое число п, что при п > п выполняются неравенства е/ (2« — 1) < В1/3. |£7(Х2~-|, У) —Л7(Х~ У)| <в|/3. (1.57) Принимая во внимание неравенства (1.54) и равенства (1.56), для У'. У" еУ°° получим ^(Х., У') - /7(X«> У")| « \НХ*\ Y'}_- ЩХ**-\ У')+* + 1ЦХ**~\ Y'}-H(X**-\ У")+Я(Г2я~\ Y")-e(X^ У")| ^|Z/(X«, У') - А/(Х2*~\ Г)1 У') ~<7(Х2я;-\ Y")| + |/7(X2-*, У") - Г) | < et/3 + ei/3 + 8i/3 « eh
ГЛАВА 3. ОСНОВЫ ТЕОРИИ 33 ' . . J В силу. произвольности 61 второе из равенств (1.56) доказано. Аналогично доказывается первое равенство. Далее, так как У°°(Е У00, Х°°6= Х°°, из равенств (1.56) получаем Я(Х, У99) = Я(Я“", У°°) = Я(Х", У) ' (1.58) для всех X 6 Г, У е У°°, т. е. £(Г°°) =х 7(Г°°) = Я(Х", У90)', (1.59) Вследствие монотонного убывания последовательности »£(Гп) пз неравенства (1.54) следует неравенство Я(Х2я-\ У) ^(Г1) + в/(2п- 1). Переходя в этом неравенстве к пределу при п->оо, имеем П(Х°\ У) <£(Г!), УеУ90. Наконец, учитывая равенств* (1.58) . п (1.59), получим^(Г90) ^(Г1). ' Аналогично, с учетом монотонного возрастания последователь- ности р(Г^) и неравенства (1.55), доказывается неравенство 7(Г") >р(Г’). Следовательно, £_(г°°) р(Г) <7(Г’) <7(Г"). Так как р(Г") = о (Г99), то , * р(Г‘) =- 7(Г) =2>(Г) = 7(Г); Теорема доказана.' 5. Ситуации равновесия и оптимальные стратегии. ^Теорема о минимаксе показывает целесообразность вве- дения множества смешанных стратегий. Оказывается, что в смешанных стратегиях любая матричная игра имеет ситуацию равновесия.. Определение 1.6. Ситуация (X*, У*) называется ситуацией равновесия-матричной игры, если для любых X е X, Y&Y выполняются неравенства ? ад. у*) жх*, у* j < жх*, у). • (гео) В ситуации равновесия "ни одному из игроков не вы- годно от нее отклоняться. Определение 1.7. Стратегия игрока называется оптимальной, если существует стратегия другого игрока, в паре с которой она образует ситуацию равновесия. Теорема 1.4. Каждый из игроков имеет хотя бы одну оптимальную стратегию. Множество всех ситуаций равновесия является прямым произведением множества 3 Г. П Дюбин, В. Г, Суздаль
34 ЧАСТЬ I. КОНЕЧНЫЕ АНТАГОНИСТИЧЕСКИЕ ИГРЫ оптимальных стратегий первого игрока и множества оп- тимальных стратегий второго игрока. Множество опти- мальных стратегий первого игрока равно множеству его максиминных стратегий, а множество оптимальных стра- тегий второго игрока — множеству его минимаксных стра- тегий в игре Г. Выигрыши во всех ситуациях равновесия одинаковы и равны значению игры. Доказательство. Пусть X*, У* — произвольные максиминная и минимаксная стратегии. По теореме 1.2 справедливо равенство (1.22). Поэтому из неравенства (1.21) следует равенство ЖХ*, У*) «у, после чего нера- венства (1.60) являются следствием неравенств (1.18) и (1.20). Таким образом, всякая ситуация прямого произ- ведения множества максиминных и минимаксных страте- гий есть ситуация равновесия. Выигрыши во всех таких ситуациях равны значению игры. Осталось доказать, что всякая ситуация равновесия образована из максиминпой и минимаксной стратегии. Действительно, если X* и У* удовлетворяют неравенствам (1.60), то шах Н(X, У*)< Н (X*, У*) <min Н(X*, У), X V откуда ?(Г) == min max Н (ХЛ У)< Н (X*, У*)< УХ , max min Н (X, У) = о (Г). ХУ - Из леммы 1.5 следует неравенство р(Г) v(D. По- этому ^(Г) « и(Г) « и « ЖХ*, УЧ z /Тя ЖХ, У*) С /7(Х*, УЧ Следовательно, max Н (X, У*) < П (X*, У*). х По при X = X* имеет место равенство. Таким образом, шах Н (X, У*) = Н (X*, У*) = и (Г) = и и стратегия У* минимаксна по определению. Аналогично доказывается максиминность стратегии X*. Наконец, су-
ГЛАВА 1. ОСНОВЫ __ТЕOP ПИ 35 ществование оптимальных стратегий следует из пепусто- ты подмножеств максиминных и минимаксных стратегий. Теорема доказана. Таким образом, мы установили, что любая матричная игра имеет значение р, а игроки в этой игре — оптиЙЙль- ные стратегии X*, У*. Тройку (X*, У*, и) будем называть решением матричной игры. Теорема 1.5. Справедливы равенства max min Н (X, у) = min max Н (ж, У) = V. (1.61) Ху Y х . Доказательство. В силу теоремы 1.2 ’ - - max min Н (X, У) = min max Н (X, У) = и. х y , Y х Так как максимальное из чисел множества, которое яв- ляется выпуклой оболочкой конечного подмножества пря- мой, равно максимальному из чисел этого подмножества, а минимальное—* минимальному, последние равенства эк- вивалентны равенствам (1.61). Теорема 1.6. Пусть.множество 7' вещественных чисел состоит из тех и только тех чисел v, для которых существует такая стратегия Yf игрока II, что справедли- вы неравенства Я(я, У')^р€ при х^'х. Тогда значение матричной игры Г равно наименьшему из чисел множества V'. Если H(x>Y*)^v при х<=х, (1.62) то Y* — оптимальная стратегия игрока II. Доказательство. Пусть У* — оптимальная стра- тегия игрока II. Тогда в силу теоремы 1.4 она является минимаксной стратегией, и поэтому выполняются нера- венства (1.20) для всех стратегий игрока I, в частности, и для его чистых стратегий. Так как р(Г) = v (теорема 1.2), то v&V'. G другой стороны, если v'Q& V1 и то Я(гг, У') р0, откуда max Н (ж, У1) < Таким образом, tnin max Н (Xj У) v'a < и, • , Y х 3*
36 ЧАСТЬ I. КОНЕЧНЫЕ АНТАГОНИСТИЧЕСКИЕ ИГРЫ что противоречит теореме 1.5. Первое утверждение тео- ремы доказано. Далее, из неравенства (1.62) следует неравенство max Й (X, У*)^и. Но по теореме 1.5 min max Н (х, У*)= х х = V. Поэтому v — min max Я (ж, У)^тах Н (х, У*) = v. Ух х Следовательно, max Н (х, У*) = V, что эквивалентно ра- ' И венству. ' max Н (Xt У*) « о = v (Г). X Таким образом, У* —»минимаксная стратегия (см. (1.19) VOna оптимальна в силу теоремы 1.4. Теорема до- казана. Теорема. 1.7. Пусть подмножество V" веществен* ных чисел состоит ив таких чисел v", что существует такая стратегия X* игрока I, для которой справедливы неравенства - ' х * Тогда значение игры Г равно наибольшему из чисел мно- жества У", . ‘ Если H(X*,y)^t>, уе№, . (1.63) то X* — оптимальная стратегия игрока I. Доказательство теоремы 1J аналогично доказательст- ву теоремы 1.6. 6. Свойства решений матричной игры. Мы уже знаем, в чем состоят принцип максимина и принцип равнове- сия. Мы выяснили также (теорема 1.4), что эти принци- пы, примененные к смешанному расширению матричной игры, эквивалентны. Оказывается, что придерживаясь этих принципов, мы автоматически придерживаемся еще более естественного и простого принципа доминирования. Этот принцип можно сформулировать так: игрок не дол- жен использовать с положительной вероятностью те чис- тые стратегий, применяя которые, он при всех действиях другого игрока выигрывает строго меньше, чем при ис-' пользовании некоторой другой стратегии. В отличие от принципа .максимина и принципа равно- весия принцип доминирования не приводит „к понятию
ГЛАВА 1. ОСНОВЫ ТкОРИЙ 37 ситуации, которая удовлетворяет этому, принципу. Это - принцип запрета. Чтобы показать, что принцип равнове- сия согласуется с принципом доминирования, дадим не- сколько определений и докажем ряд утверждений.^ Определение 1.8. Стратегия X* игрока I "строго доминирует стратегию X2, есди П(Х\у\>ГЦХ\у), ус-у.. < (1.64) Стратегия X2 называется строго доминируемой. Определение 1.9. Стратегия У1 игрока II строго доминирует стратегию У2, если — Я(ж, У1)> —Я(ж, У2), х^х. ИЛИ ' H(x,Y')<ff(x,Y*)> хе=х. ' (1.65) Стратегия У? называется строго доминируемой. ~ _ > Когда неравенства (1.64) для некоторых чистых стра* тегий игрока II не являются строгими, говорят, что стра- тегия X1 доминирует стратегию X2. Стратегия X2 называ- ется доминируемой. Аналогично, когда неравенства (1.65) не .являются строгими, говорят, что стратегия У1 доминирует стратегию У2, а стратегия У2 называется доминируемой. - - - В матричной форме записи неравенству (1.64) и (1.65) записываются следующим образом: Х1Ял>Х2ЯшЬ 1</<п; где Hia й соответственно строка i и столбец / мат- рицы Н. В частности, чистая стратегия i' игрока I строго доминирует его чистую \ стратегию i2, если для любого / выполняются неравенства а чистая стратегия /* игрока II строго доминирует его чистую стратегию f, если для любого, i выполняются не- равенства ' . ' _
г 38 ЧАСТЬ I. КОНЕЧНЫЕ {АНТАГОНИСТИЧЕСКИЕ игры Определение 1.10. Спектром смешанной страте- гии игрока в конечной антагонистической игре называ- ется множество всех его чистых стратегий, вероятность х применения которых согласно этой стратегии положи- тельна. - Было бы странно, если бы строго доминируемые чи- - стые стратегии игрока содержались в спектре какой-ни- будь его оптимальной стратегии. Это противоречило бы здравому смыслуГ“И на самом деле такого не бывает. Прежде чем установить это, докажем теорему, которая будет полезна при нахождении решений конечных анта- гонистических игр. Теорема 1.8. Если чистая стратегия одного из иг- роков содержится в спектре некоторой его оптимальной стратегии, то выигрыш этЪго игрока в ситуации, образо- ванной данной чистой стратегией и любой оптимальной * стратегией другого игрока, равен значению конечной ан- 1 тагонистической игры. Доказательство. Пусть, например, чистая стра- тегия х9 игрока I содержится в спектре его оптимальной стратегии X*, т. е. X*Gr°)>Oj a Y* есть оптимальная стратегия игрока II. По теореме 1.4 пара (X*, У*) явля- 1 ется ситуацией равновесия, в которой ЖХ*, У*) = о. Поэтому (см. 1.60) имеем Н (я0, Y*) v, х е х, а если лемма неверна, то Жя°, У*) < V. Тогда Я (Х*,У*) = 2 Я (я, У*) X* (я) < р, так как осел X* (xQ) > 0, 2 (%) = Это противоречит определе- хел нию .значения игры. Следовательно, Я(я°,У*) = р, х&х. (1.66) Симметричные рассуждения доказывают теорему 1.8, для чистой стратегии ч/°, содержащейся в спектре неко- торой оптимальной стратегии игрока II. В результате имеем равенство Я(Х*,^) = р, у&у, (1.67) где X* — оптимальная стратегия игрока L Если чистые стратегии игроков занумерованы числа- v ми 1, 2, m; 1, 2, ..., п, то равенства (1.66) и (1.67)
ГЛАВА 1. ОСНОВЫ ТЕОРИИ 39 можно записать следующим образом: 2 Jtytyni = V, (1.68) 5=1 т 2М* = Р» (t69> i=l 4 А где &>0, т^о > О* Теор-ема 1.9. Ни одна строго доминируемая чистая стратегия игрока не содержится в спектре его оптималь- ной стратегии. Доказательство. Пусть некоторая стратегия К’ игрока II строго доминирует чистую стратегию р°, т. е. Я(х,У°)<Я(х,у»); хех. (1.70) Из. (1.70) получим - Я(Х* ГХЯ(Х*,/), (1.71) где X* — любая оптимальная стратегия игрока I. Если теорема 1.9 неверна и содержится в спектре некоторой оптимальной стратегии игрока II, то ЯСХ*,у0)= = v (см. теорему 1.8). Таким образом, из неравенства (1.71) следует Я(Х*. р°) < и, .-*** что противоречит оптимальности стратегии X*. Симметричные рассуждения доказывают теорему для доминируемой Стратегии игрока I. - - Определение 1.11. Игра Г1 = у0, Я'> назы- вается подыгрой игры Г = Н), если у0 cry, а функция Н' является сужением функции Н на мно- жество а?0 Ху0*). Множество чистых стратегий каждого из игроков в игре Г' содержится в множестве его чистых стратегий в игре Г, откуда следует, что множество сме- шанных стратегий каждого из игроков в игре Г' содер- жится в множестве смешанных стратегий игры Г. Теорема 1.10. Пусть Г » <а?, у, Я> — конечная ан- тагонистическая игра, Г1 =<ж\я°, у, — подыгра игры ?) В 'дальнейшем функцию /7' будем обозначать тем *це сим волом fl.
40 ЧАСТЬ I. КОНЕЧНЫЕ АНТАГОНИСТИЧЕСКИЕ ИГРЫ * , Г, ах9 — чистая стратегия игрока I игре Г, домини- руемая' некоторой стратегией Х\ спектр которой не со- держит я0. Тогда всякое решение (X*, У*; р) игры Г* яв- ляется решением игры Г. Доказательство. По определению решения игры имеем // (х, У*) < Н (X*, У*) < Н (X*, у), х €= ж\ж°, у €= у, ? ч (1.72) а по определению доминируемой стратегии имеем Н Н(х\у), уе=у. Следовательно, Н (®«, У*) = 2 Н (х°, у) Y* (у)< Н (Х°,У*). (1.73) ley . • Наконец, по определению ситуации, равновесия, в иг- ре Г справедливо соотношение Н(Х\ У*) < /7(Х*, У*) = и. (1.74) Последнее равенство следует из теоремы 1.4. Теперь^из (1.73) и (1.74) получаем, что неравенства (1.72) верны также и при х — х9. Таким образом, X* . и У* — оптимальные стратегии игроков в игре Г, а р —ее значение. Теорема 1Л1. Пусть Г <ж,у, Н) —конечная ан- тагонистическая игра, ГЛ=<ж, у\у°, Ну — подыгра игры Г, а у9 — чистая стратегия игрока II в игре Г, домини- руемая некоторой стратегией У°,? спектр которой не со- держит ^у9. Тогда всякое решение игры Г* является ре- шением игры Г. Доказательство аналогично доказательству теоремы 1.10. Теорема 1.12; Если для чистой стратегии х9 игрока I выполнены условия теоремы 1.10, а для чистой стра- тегии у9 игрока II выполнены условия теоремы 1.11, то всякое решение игры Г" — у\у°, Ну является ре- шением игры Г = (я, уч Ну. Доказательств.о. Из теоремы 1.10 следует, что всякое решение игры Г' является решением игры Г. Очевидно, что чистая стратегия у9 останется доминируе- мой и в игре Г\ так как число чнстых стратегий игрока
ГЛАВА 1. ОСНОВЫ ТЕОРИИ 41 II осталось неизменным, а число чистых стратегии иг* рока' I уменьшилось. Применение теоремы 1.11 к игре Г доказывает теорему. ~ Теорема 1.13. Тройка (X*, У*, v) является реше** _ наем игры Г = тогда и только тогда, когда (X*, К*, kv + a) является решением игры \ч^{х,у,кН 4- + а>, где а — любое вещественное число, к > 0. Доказательство. Утверждение теоремы следует _ из того, что неравенства Н (х, У*) < Н (X *, У*) < Н (X*, у), х^х, у^у, кН(х,У^)+а^кН(Х^,У^ + а^ <кН (Х*,у) + а, тех, цец, ' эквивалентны. * > § 1.2. Методы решения матричных игр 1. Прямое (непосредственное) решение игры. В арин* цине любая матричная игра может быть решена путем решения системы линейных неравенств (1.62), (1.63) и линейных уравнений (1.12), (1.13). Однако это требует большого объема вычислений, который растет с увеличе- нием числа чистых стратегий игроков. Поэтому в первую очередь следует, по возможности используя теоремы 1.9, 1.10, уменьшить число чистых стратегий игроков (заме- тим, что исключение доминируемых стратегий может’ привести к потере некоторых решений; если же исклю* чаются только строго доминируемые стратегии, то мно- жество решений игры не изменяется)." Затем следует во . всех случаях проверить выполнение равенства (1.10), Если равенство (1.10) выполняется, то игроки имеют чистые оптимальные стратегии (игрок I — чистую макси- минную, а игрок II — чистую минимаксную). В против- ном случае хотя бы у одного игрока оптимальные стра- тегии будут смешанными.' Для матричных игр неболь- шого размера эти решения можно найти, применяя теоремы 1.8 —1.13. Пример 1.3. Пусть Г = <#,у, Н>, где #={1,2,3, 4}, #=={1, 2,3, 4},а функция выигрыша Н задана следующим
42 ЧАСТЬ I. КОНЕЧНЫЕ АНТАГОНИСТИЧЕСКИЕ ИГРЫ образом: (2с с 2с Зс\ Зс Зс/2 с 2с \ 2с 2с с с г с с с c!2J где с > 0. Прежде всего заметим, что по. теореме 1.13 достаточ- но решить игру Г1 = <#, у, Я1), где Н' = Н/с. В матрич- ной форме игра Г1 определяется матрицей выигрышей (2123ч > 3 3/2 1 2 \ 2 2 1 1 Г 1 1 1 1/2/ Элементы четвертой строки этой матрицы не больше соответствующих .элементов третьей строки, и поэтому третья стратегия игрока I доминирует четвертую. Кроме того, элементы первого столбца матрицы Я1 не меньше соответствующих элементов второго столбца. Следователь- но, вторая стратегия игрока II доминирует его первую стратегию. . ‘ Далее, из теоремы 1.12 следует, что всякое решение игры Г2 == <#\{4}, #\{1}, Я1) является решением игры ’ Г1. В матричной форме игру Г2 можно представить мат- рицей / 1 2 3\ Я2 р/2 1 2 I \ 2 1 1/ , • / в которой i-й строке матрицы соответствует f-я страте- гия, а /-му столбцу — / + 1-я стратегия. Очевидно, что элементы второй строки этой матрицы не меньше полу- суммы соответствующих элементов первой и третьей строк. Следовательно, вторая стратегия игрока II доми- нируется смешанной стратегией, которая с равными ве- роятностями использует первую и вторую стратегии - этого игрока. Кроме того, элементы третьего столбца матрицы Я2 не меньше соответствующих элементов вто- рого столбца. Это значит, что стратегия под номером ”3 доминирует стратегию под номером 4. Применяя теорему 1.12, получим,- что всякое решение игры Г3 = <#\{4, 2}, г/\{1, 4}, Я2) является решением игры Г2, а значит, и иг- ры Г1.
ГЛАВА 1. ОСНОВЫ ТЕОРИИ 43 Игра Г3 определяется матрицей в которой первая" строка соответствует стратегии под но- мером 1, вторая — стратегии под номером 3 первоначаль- ной игры, а второй и третий столбцы соответствуют стра- тегиям 2 и 3 первоначальной игры. Матрица Н3 не имеет седловой точки, так как не выполнено равенство (1.10), а игра Г3 не имеет' решения в чистых стратегиях, т, е. оптимальные стратегии игроков являются смешанными. Эти стратегии легко пайти из анализа структуры матри- цы Я3. .Поскольку матрица Н3 симметрична, можно пред- положить, что игроки в оптимальной стратегии исполь- зуют свои чистые стратегии с равными вёроятностйми. Действительно, если игрок I применяет стратегию, смешивающую с равными вероятностями первую и вто- рую строки матрицы игры Г3, или (что то же самое) вы- бирает с равными вероятностями стратегии 1 и 3, то при применении любой из двух чистых стратегий игроком 11 математическое ожидание выигрыша игрока I будет рав- но либо (1/2)1 + (1/2)2 == 3/2, либо (1/2)2 (1/2)1 = 3/2. Аналогично, если игрок II использует свои чистые стра- тегии 2 и 3 с равными вероятностями, то математиче- ское ожидание его проигрыша будет равно 3/2. Следова- тельно, указанные стратегии являются оптимальными в игре Г3,' а величина 3/2 — значением игры Г3. Из преды- дущего следует, что эти стратегии оптимальны и в Г1. Таким образом, стратегия X* = (1/2, 0, 1/2, 0) явля- ется оптимальной стратегией игрока'I, . стратегия У* = — (0, 1/2, 1/2, 0)—оптимальной стратегией игрока II в игре Г1, а значение игры Г1 равно 3/2. В силу теоремы 1.11 решением игры Г будет тройка (X*, У*, Зс/2). При решении примера 1.3 нам пришлось столкнуться с решением 2 X 2-игры. Сначала мы догадались, как выг- лядит решение, а потом проверили, что оно действитель- но является решением. Оказывается любую 2 X 2-игру можно решить по следующей стандартной^схеме. В общем виде 2 X 2-игра определяется матрицей
44 ЧАСТЬ I. КОНЕЧНЫЕ АНТАГОНИСТИЧЕСКИЕ ИГРЫ / . Прежде всего необходим# проверить выполнение ра- венства (1.10). Если оно выполняется, то по лемме 1.1 игра имеет решение в чистых стратегиях, причем опти^ мальными стратегиями игроков I и II соответственно будут чистая максиминная и чистая минимаксная стра- тегии. Если же игра с матрицей выигрышей Я не имеет решения в чистых стратегиях; то оба игрока имеют лишь такие оптимальные стратегии, которые используют все свои чистые стратегии с положительными вероятностями. Действительно, в противном случае один из' игроков (скажем, игрок I) имеет чистую оптимальную стратегию; а другой —только смешанные. Не ограничивая общ- ности,, можно считать, что оптимальной стратегией игро- ' ка I является выбор с вероятностью единица первой*, строки. Далее из теоремы 1.8 следует, ^что и матрица имеет вид / (v v \ , \i - • Легко видеть, что для матриц такого вида одна из стра-- . тегий игрока II является доминируемой. Следовательно/ по теореме fell этот! игрок имеет чистую оптимальную стратегию, что противоречит предположению. Пусть X* — (В*, 1 — В*)”” оптимальная стратегия йг< рока I. Так как игрок II имеет смешанную оптимальную стратегию, из теоремы 1;8 получим Я(Х*, /) = р, 7 = 1, 2, или, в подробной, записи, ~ ? , "Ь ^21(1 — В*) == и, , (175) М* + М4-В*)=Х ‘ ' Отсюда следует, что при и =/= 0 столбцы матрицы Н не могут быть пропорциональны с коэффициентом про- порциональности, отличным от единицы. Если же коэф- фициент пропорциональности равен единице, то матрица Н принимает вид /\1 V12 hlJ - . и игрок I имеет чистую оптимальную стратегию (он вы- бирает с вероятностью единица ту из строк, элементы ко- , торой не меньше соответствующих элементов другой),
-ГЛАВА 1. ОСНОВЫ ТЕОРИИ 43 что противоречит предположению. Следовательно, если и.игроки имеют только смешанные оптимальные стратегии, то определитель~матрицы Н отличен от нуля. Из этого следует, что система уравнений 41.75) имеет единственное решение. Решая ее, находим + (176) р _ АПА22 ~ А12А21 _ А11 А12 А21 ~ А22 Аналогичные рассуждения приводят нас к тому, что оптимальная стратегия игрока II У* в (т)*, 1 — ц*) удов- летворяет системе уравнений Лиг|* + Ml - ц*) = у, (177j Л21т]* + Л«(1 — ц*)«-?, откуда А22 ““ А12 ,Т)* = ------------------ — h (1.78) Таким образом, для решения матричной 2Х2-игры необходимо сначала проверить равенство- (1.10). й если оно выполняется, то игроки имеют чистые .оптимальные стратегии (игрок I — чистую максиминную, а< игрок II — чистую минимаксную). В противном случае следует по формулам (1.76), (1.78) найти значения, оптимальные стратегии игроков. В некоторых случаях, когда игра имеет решение в смешанных стратегиях, из анализа структуры матрицы выигрышей можно получить некоторое представление о тех чистых стратегиях, которые должны применяться с положительной вероятностью. Другими словами, иногда можно угадать подмножества гв® и у® чистых стратегий, а затем согласно теореме 1.8 решить систему ’ Н (X, j) == ₽, j & у* су, 2 St«1» ‘®*° . (1.79) Н(Г, У) =s v, iexac:x, 2 аIе Если решение системы (1.79) удовлетворяет неравен- ствам (1.60), та оно является искомым. решением игры
46 ЧАСТЬ’ I. КОНЕЧНЫЕ АНТАГОНИСТИЧЕСКИЕ ИГРЫ Г. В противном случае можно последовательно переби- рать подмножества я0 и j°, решая соответствующие системы и проверяя каждое решепие до тех пор, пока^не будет получено решение исходной игры Г. Кроме того, можно ограничиться подмножествами, имеющими равное число- элементов, то есть в матричной записи перебрать квадратные подматрицы матрицы выигрышей. Можно показать (см. [34]), что в этом случае обязательно при каких-нибудь, ж0 и у0, имеющих по одинаковому числу элементов, решение системы (1.79), будет. единственно и является, решением игры Г = Я>. Выше мы по- казали это для 2 X 2-игр. Напомним, что рассмотренный метод непосредствен- ного (прямого) решения годится лишь для игр неболь- шого размера и для игр, которые сводятся к таковым отбрасыванием доминируемых стратегий, либо для 'игр, 4 которые имеют некоторую обозримую аналитическую структуру и для которых можно угадать. спектр опти- мальных. стратегий. Поэтому если^игра сложная, то луч- ше всего для ее решения воспользоваться численными методами линейного программирования (например, симн-* лекс-методом). 2. Сведение матричной игры к задаче линейного прог- раммирования» Пусть требуется решить матричную игру Г = <я, у, Я>, х = {1, 2, ..., т}, у = {1, 2, ..., п), для v > 0 (в противном случае можно прибавить достаточно большую константу; ко всем элементам матрицы выигры-' шей этой игры, что по теореме 1.13 не меняет множест- - ва оптимальных стратегий игроков). Сведем данную игру Г к паре двойственных друг другу задач линейного прог- раммирования. По теореме 1.6* значением игры является минимальное из чц&ед v't для которых найдется вёктор Y = (Их» Па» •» Пп), S W — 1, !Ъ > 0» (1.80) удовлетворяющий неравенствам • Я(^У)<р', 1&х, (1.81) а вектор ‘ У*, для которого справедливы неравенства (1.81), при v' = v будет оптимальной стратегией игрока IL Таким образом, найти значение игры, надо найти минимален®© значение i/, удовлетворяющее не-
\ глава 1. основы Теорий 47 равенству (1.81). В подробной записи неравенства (1.81) записываются следующим образом: • п f-l_, Положим й} — T)^/^z и разделим обе части последнего неравенства на р'; оно примет следующий вид: п 2 ^jU;<l, ?еж. 5-1 Учитывая, что 5=1 j=l задача минимизации v'. сведется к задаче максимизации п 1/р', или, что то же самое, максимизации. 2 из при ог- 5*1 раничениях п ' 2 1. i е Ж, 5=1 ' Uj 0. Пусть и* = (и*,и*, ...,ип)— оптимальный план этой задачи линейного программирования; тогда / ** *\-1 v = 2 , (1.82) \5—1 / а оптимальная стратегия игрока II равна Y* =(т)*, т)*,... v>!ln)> где (п \-1 2 и* 1 , 1<7<ге. (1.83) 5=1 / Так кате v>Q и оптимальная стратегия игрока II существует, все щ це могут одновременно равняться нулю, поэтому равенство (1.83) имеет смысл. Симметрич- ные рассуждения приводят нас к решению следующей вадачи линейного программирования;
4Й ЧАСТЬ I. КОНЕЧНЫЕ АНТАГОНИСТИЧЕСКИЕ ИГРЫ - .‘-S'— найти - .rm 2j ti, - ' i«l при ограничениях ' „ . 4=1 Если tf =? (ii, t*> .. .»^m) — оптимальный план этой задачи, то (т \ —1 2d Л , • (1.84) fe=l / - si = vtl = A11 t*h) 1 (1.85) \fe-i 7 Последней задача двойственна первой из рассмотрен* ных, поэтому имеет место равенство _ которое следует также и из теоремы 1.2. Пример 1.4. Найти решение игры с цатридей вьь игрышей ' . _ . 5 6 • 3 0\ . ' Н = Ю 5 12 10 . Aid о Хгог Все элементы этой матрицы положительны, а седловой точки она не имеет. Напишем задачу линейного программирования: 1 ' «1 + “г + w3 + u4 =-^-->тах; 5ux + 6u2 4- 3ug ^1, - । . IOuj + 5u2 -J- 12u8 4- 10u4^l, lOuj 4- Su8 4- 20u4 1, 0.
ГЛАВА 1. ОСНОВЫ ТЕОРИИ 49 которая в капбййческой форме принимает вид ' * '41 + “2 +w3 + u4 = -^-->max; (1.86) 5иг + 6u2 + 3u3 -j- иь = 1, - *4* 5ua -р 12u3 10^4 -|- Uq = 1, . (1.87) lOuj -j- 5u3 -j- 20u4 —|— u? = 1. Таким образом, необходимо найти такие неотрица- тельные uj, удовлетворяющие равенствам (1.87), при ко- торых линейная функция (1.86) достигает максимума. В результате применения симплекс-метода находим , : и* = (0, 1/6^0, 1/60), - (1/12г 1/10, 0), • ~ / 1/р «11/60. Переходя от задачи линейного программирования к матричной игре и испрльзуя формулы (1.82)—(1.85), окончательно получим 7 у X* = (5/11, 6/11, 0), У 4 У*« СО, 10/11, 0, 1/11), ? \ = 60/11. ;; Пример 1.5. Рассмотрим игру, в которой игрок 1 имеет две чистые стратегии, а игрок II — произвольное число п чистых стратегий. Матрица .выигрышей игрока II Такой игры имеет следующий вид: jj __ /Л11 \\1 ••• ^2п/ Для этой игры .эквивалентная задача линейного прог- раммирования.записывается следующим образом: ty + ^2 == “р—>min; (1’88) Л>0, t2>0. . <1.89) Следовательно, требуется найти такое неотрицатель- ное решение системы линейных неравенств- (1.89)—оп- тимальный план£* = (^i, ^г)’ при котором целевая функ- 4 Г^П. Дюбин, В. Г. Суздаль
so часть г конечные антагонистические игры ция (1.88) достигает минимума. Область значений I — s(^i, U, удовлетворяющая неравенствам (1.89), образует множество допустимых планов. Первое Рис. 1.6., неравенство hxxtx + h2it2> 1 ограничивает ту область, которая- состоит из точек (th t2),. удовлетворяющих этому' нера- венству. Для построения этой области найдем две точки (одну на оси tx, а дру- гую на оси U, через которые проходит граничная прямая hxxtx + h2Xt2 ** 1. Если tx — 0, то t2« l/feail если t2 = 0, то >ti » «1/Ли. Обе точки (0, 1/Aai) и (l/feH,0) лежат на данной граничной прямой (рис. 1.6). Все точки, лежащие в за- штрихованной области и на ее границе, удовлетворяют неравенству h^tx + h2lt2> >1. Для второго неравенства hxztx +' + h2iti > 1 граничной прямой * будет huti + hnti — 1, ее точки пересечения с осями коорди- нат (l/fe)2, .0) и (0, 1/Л22), а все точки заштрихованной области и ее границы удовлетворяют этому неравенству (рис. 1.7). Аналогично строится область значений, удов- летворяющих каждому неравенству hi}tt + h2jt2 > 1 (рис. 1.8) и т. д. Множество точек неотрицательного квадранта tt>0, t2>0, удовлетворяющих неравенствам (1.89), легко най- ти, наложив заштрихованные области друг на друга — их -
ГЛАВА11. ОСНОВЫ ТЕОРИИ 51 пересечение и есть множество допустимых планов (рис. 1.9). Теперь найдем из множества допустимых пла- нов такие точки которые минимизируют целевую функцию (1.8$). . " При перемещении прямой + t2 я 1/v' параллельно самой себе в направлении стрелок функция 1/р' будет убывать. Проведем такую прямую, как показана на рис. 1.9, и будем её перемещать параллельно самой себе, в направлении убывания 1/v', до точки Л/, являющейся последней общей точкой прямой и множества допустимых цланов. В точке М функция t^ + t2 достигает минимума, равного l/v, среди значений, принимаемых на множестве допустимых планов, и поэтому оптимальный план зада- ется именно этой точкой. Теперь достаточно, решив систему двух уравнеь&й, определяющих точку М, найти t* = (£, и затем из 4*
52 ' ЧАСТЬ Т. КОНЕЧНЫЕ АНТАГОНИСТИЧЕСКИЕ ИГРЫ (1.88) получить 17р, а по формуле (1.85) определить оптимальную стратегию игрока I. Если прямая (1.88) параллельна одной из сторон многоугольника допустимых планов, а функция fi +-£>убы- вает в ^направлении данной 4 стороны, то множество опти- мальных планов будет со- стоять . из всех ее точек .(рис. 1.10). Описанные построения по- зволяют находить также оп- тимальные стратегии игро- ка II. Так, если функция + достигает минимума в. единственной точке М мно- жества допустимых планов, которая не принадлежит осям - р ! Z, и ij, то спектром смешан- ной стратегии игрока II бу- дут чистые стратегии /, и (см. рис. 1.11). Действительно, тогда в 2Х2-подыгре как значение, так и единственная оптимальная стратегия «игрока I бу- Рис. 1.11. Рис. 1.12. дуу теми же, что и в исходной 2 X n-игре, а игрок II, Й пользуясь только двумя стратегиями /гЦ /2, не даст игроку I выиграть больше, чем и. В силу- теоремы 1.11 J
ГЛАВА 1. ОСНОВЫ ТЕОРИИ 53 оптимальная стратегия игрока. II в 2 X 2-подыгре являет- < ся оптимальной его стратегией и в исходной игре. Для ее вычисления можно воспользоваться формулой (1.7$), Рис. 1.13. Рис. 1.14. _ которая в данном случае записывается следующим об- разом: — h1}j ' Я* = т-------(1.90). hiii + Если точка М принадлежит оси h (рис. 1.12) или осп t2 (рис. 1.13), то игроки имеют чистые оптимальные стра- тегии. • - Пример 1.6. Рассмотрим игру, в которой игрок II имеет две чистые стратегии, а игрок I — произвольное
54 ЧАСТЬ I. КОНЕЧНЫЕ АНТАГОНИСТИЧЕСКИЕ ИГРЫ число т стратегий. Матрица выигрышей такой игры име- ет следующий вид: /^11 \‘2 \ Я=|Л21 1 \п2 ' Для этой игры эквивалентная задача линейного прог- раммирования запишется следующим образом: ' ih + u^-1—>max; (1.91) Ы1и1 + ^12U2 1 j 772, Ui О, U2 0. (1'92) Графоаналитический метод решения этой задачи ли- нейного программирования аналогичен решению преды- дущей задачи минимизации (см. рис. 1.14). Глава 2 ПРИЛОЖЕНИЯ Реальный конфликт может моделироваться конечной антагонистической игрой, если он отвечает следующим условиям: • . 1. Конфликт определяется антагонистическим взаимо- действием двух сторон, каждая из которых располагает лишь конечным числом возможных действий. 2. Свои действия стороны предпринимают независимо друг от друга, т. е. каждац из них не имеет информации о действии, совершаемом другой стороной; результат этих действий оценивается вещественным числом, кото- рое определяет полезность сложившейся ситуации для одной из сторон*). • 3. Каждая из конфликтующих сторон оценивает как для себя, так и для противника полезность любой воз- можной ситуации, которая может сложиться в результа- те их взаимодействия. *) В силу антагонистичности конфликта можно считать, что полезность такой ситуации для другой стороны равна этому чис- лу, взятому с отрицательным знаком,
ГЛАВА 2. ПРИЛОЖЕНИЯ 55 4. Действия конфликтующих сторон в силу своей природы являются нерасчдененными и однократными, т. е. структура каждого из них не имеет каких-либо формальных отличительных, свойств. Это позволяет ин- терпретировать действия сторон как элементы некото- рых абстрактных множеств, отличая различные действия друг от друга лишь по степени полезности сложившейся ч ситуации.. . Если конфликт удовлетворяет четырем перечислен- ным условиям, то назвав одну из сторон игроком 4, а другую — игроком II, мы можем описать его антаго- нистической игрой Г —’ где х — множество возможных действий игрока I, у — множество возможных действий игрока II, Я —функция полезности игрока I, которая определена на всех парах возможных действий игроков. Условия 1—4 как раз и дают возможность представить конфликт в виде игры Г. , В теоретико-игровой терминологии х будет множест- вом чистых стратегий игрока I, у — множеством чистых стратегий игрока II, Н — функцией выигрыша игрока Г. . С другой стороны, всякая конечная антагонистическая пгра удовлетворяет условиям 1—4, если конфликтующи- ми сторонами считать игроков, множествами их возмож- ных действий — множества х и у, а полезностью сторо- ны, соответствующей игроку I, в ситуации (х е а?, у е — его выигрыш в этой ситуации. На самом деле реальные конфликты почти , никогда не удовлетворяют приведенным условиям. Число возможных действий конфликтующих сторон либо бесконечно, либо настолько необозримо, что невозможно их перечислить, не говоря уже о том, чтобы еще знать заранее все воз* можные ситуации, которые могут сложиться. Редко также бывает, чтобы стороны совершали свои действия неза- висимо: в реальных конфликтах обычно та или другая информация становится известной противоположной сто- роне, а полезность результата действий сторон обычно бывает известна не совсем точно. Поэтому в чистом виде антагонистические, конфликты встречаются редко (пожалуй, ^только в боевых действиях и спортивных состязаниях). Однако довольно часто кон-
56 ” ЧАСТЬ I. КОНЕЧНЫЕ АНТАГОНИСТИЧЕСКИЕ ИГРЫ фликты, в которых интересы сторон противоположны, практически можно моделировать матричными играми^ допуская, что множества способов действий сторон ко- нечны. Если при этом функция полезности найдена практически верно, а существенные действия в действи- тельности определяют конфликт, то в результате решения теоретико-игровой модели мы получаем количественные результаты: конкретное руководство к оптимальному действию сторон, среднюю полезность. Когда же функ- ция полезности лишь улавливает основную суть конфлик- та, мы получаем качественные результаты: общее ру- ководство к действию, оценки средней полезности. Разумеется, чаще главные действия, определяющие конф- ликт и оценки полезностей возможных ситуаций, легче выделять специалистам тех областей, в которых исполь- зуется теоретико-игровая модель: экономистам — в эко- номике, военным — в военном деле и т. д. Как уже указывалось в гл. 1, поскольку число дейст- вий сторон конечно, конечную антагонистическую игру Г можно задать в виде матрицы . /\1 ^12 • \ /7==ТЛ21 Л22 ••• h#n ) . ' ^7Л2 • • • / ' где ш.—число чистых стратегий игрока I, п — число чистых стратегий игрока II, = /)—выигрыш игро- . ка'1 в ситуации (i,/). г Матрица Н по существу является теоретико-игровой, моделью (матричной игрой) реальных конфликтов, кото- рые отвечают условиям 1—4. Ее~построение и последую- щий теоретико-игровой анализ, завершающийся нахож- дением оптимальных стратегий, составляют приложения теории конечных антагонистических игр в экономике, в военном деле, спорте^ биологии и т. д. Обычно для этих сфер можно выделить реальные конфликты с, ра- зумно действующими сторонами и явления, в которых неопределенность обусловлена совокупностью объективно существующих обстоятельств (например, борьба с приро- дой, принятие статистических решений и т. д.). Такие явления, но будучи конфликтами й собственном смысле
ГЛАВА 2. ПРИЛОЖЕНИЯ 57 слова, могут быть интерпретированы как конфликты. Если при этом удовлетворяются условия 1—4, то модели- рование подобных . явлений --приводит к Специальному классу матричных игр, которые принято называть «мат- ричными играми против природы^. § 2.1. Примеры приложений в экономике ' Любая экономическая ситуация складывается в ре- зультате взаимодействия (поведения) совокупности - эле- ментов, составляющих ту или иную экономическую си- стему и представляющих собой различные организации пли их объединения, а также отдельные индивидуумы^ Как правило, поведение элементов экономической систе- мы "зависит от целого ряда факторов, флуктуации кото- рых заранее предвидеть не всетда представляется воз- можным (например, погодные условия, конъюнктура на рынке,- покупательский спрос, поставки смежных отраслей народного хозяйства и т. д.). В результате экономиче- ские конфликты протекают в условиях тех или иных спон- танных процессов и неопределенности действий отдель- ных элементов, влияющих на эффективность принятых решений, что обуславливает целесообразность построения теоретико-игровых моделей. Ниже рассматриваются при- меры таких моделей, которые иллюстрируют теоретико- игровой анализ и показывают, что рекомендации этого анализа 'соответствуют объективным условиям принятия решений, а попятив, игры как математической формали- зации экономических конфликтов является довольно общим. - Пример 2.1*) (планирование посева). До-z пустим, что сельскохозяйственное предприятие может посеять, одну из трех культур, которые обозначим через А3. Необходимо определить, какую из культур сеять, если при прочих равных условиях * урожаи этих культур зависят главным образом от погоды, а план по- ♦) За немногими исключениями примеры являются иллюстра- тивными, а численные значения исходных данных в этом и других примерах, будучи гипотетическими, выбирались на оснований чи- сто методических соображений.
58 ЧАСТЬ I. КОНЕЧНЫЕ АНТАГОНИСТИЧЕСКИЕ ИГРЫ сева должен обеспечить наибольший доход. Если сельско- хозяйственное предприятие, располагает достоверными статистическими данными о погодных условиях в даннохм районе или имеет надежный способ прогноза погоды, то оптимальный план посева довольно просто получить, основываясь на максимизации математического ожидания дохода. В противном случае планирование посева должно осуществляться с учетом наиболее неблагоприятного со- стояния погоды. Последнее обстоятельство допускает трактовку данной сельскохозяйственной ситуации следу- ющим образом: с одной стороны — сельскохозяйственное предприятие (мы назовем его игроком. I) заинтере- совано в том, чтобы посеять культуру, дающую макси- мальный урожай, с другой стороны — природа (мы на- зовем ее игроком II), от которой зависят погодные усло- вия и которая тем самым может максимально повредить сельскохозяйственному* предприятию, преследует прямо противоположные интересы. Принятие природы за про- тивника -равносильно планированию посева с учетом наиболее неблагоприятных условий, а если они окажутся благоприятными, то полученный план даст возможность увеличить доход. Таким образом, налицо антагонистический конфликт. Какие стратегии в данном конфликте имеет природа? Число ее'стратегий (состояний природы) следует пола- гать бесконечным. Однако, как это часто принимают, мы будем «в. первом приближении» считать, что год.может быть засушливым, нормальным и с обильными осадками («дождливым»), т. е. будем считать, что игрок II (при- рода) имеет только три стратегии. У предприятия име- ются также три стратегии: засеять поле культурой Ль засеять поле культурой Л2, засеять поле культурой Л3. Чтобы представить описанный конфликт в виде матрич- ной игры, необходимо задать функцию полезности игро- ка I. В качестве функции полезности возьмем функцию доходов предприятия от реализации своей продукции. Допустим, что на основании опыта известно, что при сухой погоде с одного гектара снимают Лц центнеров культуры Л<, при нормальной hi2 центнеров культуры Л(, при влажной центнеров культуры Ah 1^1, 2, 3. Тогда, если пренебречь стоимостью семян и затратами
ГЛАВА 2. ПРИЛОЖЕНИЯ * ’ 50 на возделывание почвы, матрица аЛз\ а2^21 а2^22 a2^28 L ^3^31 Я3^32 Л3^33' (2.1) где а< — цена одного центнера культуры 4<, и будет матрицей доходов предприятия от реализации своей продукции с одного гектара при всех возможных ситуа- * циях. Читатель без труда может написать матрицу до- ходов предприятия, учитывающую как стоимость семян, так и затраты на возделывание почвы. Мы здесь на де- лаем этого, чтобы избежать громоздкости. Таким образом, конечная антагонистическая игра, задаваемая матрицей (2.1), является теоретико-игровой моделью описанного конфликта. Согласно ’теоремам 1.4 и 1.7 в этой игре игрок I имеет хотя бы одну оптималь- ную стратегию X* «= (£*, Вз)» для которой выполня- z ются неравенства . + ^2^27^2 4“ «зМз 7 = 1, 2, 3, , (2.2) где v — значение игры. - Очевидно, что сумма, стоящая в левой части неравен- ства (2.2), равна ожидаемому доходу с одного гектара при /-м состоянии природы, если предприятие £1-ю долю гектара засеет культурой Alf Вг-ю долю гектара — куль- турой А2 и долю гектара — культурой А3. Таким образом, предприятие, засеяв поле культурами Ait А2, А3 в пропорции Bi:^2:^3, получит при всех погодных ус- ловиях ожидаемый доход не меньше, чем v. Так как v — значение игры, это наибольший ожидаемый доход, который предприятие гарантирует (теорема 1.7). Заметим, что ожидаемый доход с одного гектара при J-м состоянии природы принципиально отличен от факти- ческого, который является случайной, величиной, при- нимающей значения с вероятностью L, a2h2j — с вероятностью В* и ^3fe3;—с вероятностью 1з‘ Следо- вательно, при /-м состоянии природы предприятие, реа- * лизуя оптимальную стратегию X*, получит* с вероят- ностью фактический доход, равный с вероят-
60 ' ЧАСТЬ I. КОНЕЧНЫЕ АНТАГОНИСТИЧЕСКИЕ ИГРЫ к ' - постыо Й—доход и с вероятностью £3 —доход a3fe3j. Однако, в силу закона больших чисел, средний фактический доход за.фяд лет с большой вероятностью будет равен ожидаемому доходу v. . I Здесь мы столкнулись с ситуацией, когда смешанная стратегия дрпускает «физическую» реализацию. И вместо того, чтобы максимизировать математическое- ожидание своего дохода, предприятие максимизирует свой гаранти- рованный доход. В данном случае это стало возможным вследствие того, что вероятности Si можно трактовать как части площади поля. К сожалению, такая трактовка ' не всегда допустима. - 'г < Читатель без труда обобщит рассмотренный конфликт на случай, когда высеивается одна из т культур, а со-1 стояния природы более тонко отдифференцированы^ ‘ Кроме того, . аналогичные модели легко построитьх для случая,' когда предприятие-имеет возможность варьиро- вать не только культуры, которые оно сеет, но и способы обработки поля. Решим теперь численный пример для исходных дан- ных, приведенных в табл. 2.1. Т а б л и ц а 2.1 Исходные условия Урожайность культуры в центнерах Ai аГ. | А, . Сухая погода Нормальная погода Дождливая погода . Цена за.один центнер в рублях 20 5 15 2 7,5 12,5 , 5 Ъ 0 7,5 10 • 8 Матрица выигрышей игрока I [40 10. 30\ 30 50 20 Л 0 60 80/ Легко установить, что матрица Н не имеет седловой точ- ки, й поэтому оптимальная стратегия игрока I оказыва- ется смешанной.
ГЛАВА 2. ПРИЛОЖЕНИЯ 61 ? Предположим, что выполняется теорема -1.6, т. е. g* > 0, t)* > 0 (i = 1, 2, 3, / = 1, 2, 3). Тогда на основа- нии (1.68), (1.69) справедливы, следующие две системы: - ’ . 401* + 30 |г* + 0g£ = v, 40 г]Г + .10 + 30 Пз‘ = 10g* 4- 50 g£ 4- 60|з = v, 30^1 + 50 т)2 4- 20i]J = v, 30 gf + 20 gj 4- 80g3‘ = v, 0 nJ 4- 60 r|2* + 80 т]з = v. 3 3 Решая их с учетом того, что 2 g« = 2 4/= 1» найдём <=1 j=i V* ( 22 18~ $ \ П - QA к ТТ % \45 ’ 45 ’ 45/’ ^ ~ \45’ 45’ 45/’Позтому тройка (X*, У*а и) есть решение игры, заданной матри- цей Я. . Смешанная стратегия X* задает вероятность, с кото- рой игрок I выбирает чистую стратегию i е х. В данном примере предприятие с вероятностью 22/45\ посеет пшеницу сорта А^ с вероятностью 18/45 — пшеницу сорта А2 и с вероятностью 5/45 — пшеницу сорта А3. Для определения конкретного сорта пшеницы из, таблицы слу- чайных чисел случайным образом . выбирается . число. Если оно окажется в пределах от 0 до 21, то засеять нужно пшеницу сорта At; если ойо попадает в диапазон от 22 до 39, то выбирается пшеница сорта А2;^ наконец, если это число равно от 40 до 44, то засевается пшеница ' сорта А9; если же число находится в пределах от 45 до 99, то оно отбрасывается и из таблицы выбирается сле- дующее число (выше или ниже .первого в соответствии с заранее принятым условием). - < Реализация репщнйя построенной игры с. помощью физической смеси- стратегии состоит в том, что случай- ный выбор одной из трех чистых стратегий игрока I заменяется применением третьей стратегии — засеять поля пшеницей трех сортов в отношении 22:18:5, что гарантирует получение дохода при всех погодных усло- виях не меньше 31,5 руб. с гектара. Пример 2.2 (поставка товаров). Предполо- * жим, что на базе торговой организации имеется п типов одного из товаров ассортиментного минимума. В магазин До л же выбыть завезен только один из п типов данного
62 ЧАСТЬ I. КОНЕЧНЫЕ АНТАГОНИСТИЧЕСКИЕ ИГРЫ | товара. Требуется выбрать тот тип товара, который деле- | сообразно завезти в магазин. Если товар типа j, 1 у || будет пользоваться спросом, то магазин от его pear || лизации получит прибыль pj. Если же этот товар не бу- 1 дет 'пользоваться спросом, то убытки от его хранения, порчи и т. д. принесут магазину убыток Zj*). Очевидно, что при детерминированном спросе поку- пателей на некоторый товар несложно не только выбрать ' тип товара, но и рассчитать нормативы, обеспечивающие ' минимальные издержки при организации системы товаро- снабжения. Однако для некоторых реальных ситуаций характерна неопределенность покупательского спроса в пределах^известных границ. В этом случае формализация конфликта, товароснабжения наиболее естественным об- разом осуществляется на теоретико-игровой основе. В нашем примере мы будем считать, что спрос неиз- вестен. Тогда моделью рассматриваемого конфликта бу- дет игра, в которой в качестве одной из конфликтующих. сторон выступает магазин (игрок I), а в качестве дру- гой— природа — покупательский спрос (игрок II). Каж- дая из сторон имеет по п стратегий: i-я стратегия игрока I I —завоз i-ro товара, /’-я стратегия' игрока II —спрос на | /-й товар. Полезностью магазина (игрока I), очевидно, будет его доход. В этом случае конечная антагонисти- ческая игра, задаваемая матрицей выигрышей / ₽i ••• -гА ' Н — I “ Ч Р2 Ч • • • ““ ^2 \“ ~ • • • Рп' I и будет теоретико-игровой моделыр рассматриваемого | конфликта. Далее мы будем считать, что доходы от про- | дажи каждого из товаров равны между собой, т. е. f Pi« р > 0. j Вычтем из всех элементов матрицы выигрышей число 1 р, что согласно теореме 1.13 не изменяет множества оп- ? тимальных стратегий игроков, а значепие игры умень- шается на р. После этого преобразования матрица ♦) Для удобства убудем считать, что числа расположены в порядке убывания и попарно различны. ♦
ГЛАВА 2. ПРИЛОЖЕНИЯ / 63 примет вид (* о* ... -ц _ \ 0 "~л2 ••• — Лд hn hn ... О/ где hi« Z< + р, причем йд > h2 >.;. > hn > 0. Найдем оптимальные стратегии игроков конечной антагонистической игры, задаваемой матрицей Hiu Преж- де всего заметим, что значение этой игры меньше нуля. Действительно, с одной стороны, применив стратегию (1/п, 1/п, .1/п), согласно которой игрок II выбирает свои чистые стратегии с равными вероятностями, он не проиграет больше чем шах fe^< 0 (заметим, что здесь мы пишем «не проиграет», хотя реальный игрок II выигрывает, так как его выигрыши отрицательны); следовательно, и < 0. С другой стороны, выбрав свою п-ю чистую стратегию, игрок I выигрывает по меньшей мере —fen (согласно принятой терминологии и в этом случае, когда игрок I фактически проигрывает, мы говорим о его выигрыше). Следовательно, —fen^P. Так как fen^fe<, 1 i < п, то и — hi р, 1 < i п. Рассмотрим случай, когда га-я чистая стратегия игро- ка I является его оптимальной стратегией. Если это так, то значение игры р, очевидно, равно — fen, так кек Жл, 1) « —fen. Пусть Цз, ..., Цп)— оптимальная стратегия игрока IL В ситуации равновесия математи- ческое ожидание выигрыша Я(п, У*)- игрока I должно быть равно значению игры, т. е. —fen. Следовательно, п-1 Н (п, У*) = - hn з w = - h^i. - lb) = - hn. w Отсюда следует, что Цп = 0» так как fe«> 0. В силу оп- тимальности У* должны выполняться неравенства ДО, У*)--4,(1l<t<n'-l, (2.3) равносильные неравенствам
64 ЧАСТЬ I. КОНЕЧНЫЕ АНТАГОНИСТИЧЕСКИЕ ИГРЫ ~ j Если найдется стратегия У*, для которой т)п == 0 и : выполняются неравенства (2.4),. а значит, и неравенства > (2.3), то значение игры равно — hn и эта стратегия явля- ется оптимальной стратегией игрока II (как легко видеть, 1 в этом случае неравенство (2.3) при i — n превращается в равенство). . Для того чтобы нашлась такая стратегия, необходимо и достаточно, чтобы выполнялось неравенство n-i 1 < п — 1 — Лп 2 ТГ ’ - ?=1 3 или эквивалентное ему неравенство - " п-1 . . 0.<п-2-Ла2тГ- (2-5) ? ' W * - . 1 В одну сторону это утверждение прямо следует из не- равенств (2.4), а так как числа 1 — hn/hj пеотрицатель; ны и не превосходят единицы, то верно и обратное ут- верждение. . Таким образом, прежде чем приступить к решению игры, определяемой матрицей выигрышей Нь необходи- мо проверить неравенство (2.5). Если оно выполняется, то значение игры равно —а игрок I имеет чистую оптимальную стратегию — выбирать - последнюю строку j матрицы или, что то же самое, выбирать чистую ; стратегию под номером п. Подобрав числа Ц; таким об- разом, чтобы они удовлетворяли неравенствам (2.4), что \ нетрудно сделать," если справедливо. (2.5), мы найдем ; оптимальную стратегию игрока II. • ‘ Далее мы исследуем случай, когда неравенство (2.5) ; не выполняется, т. е. справедливо неравенство « / п \ - ’ ) — (« — 1)>0. ~ ‘ (2.6); \j=l / Оказывается, Sb этом случае каждый из игроков имеет оптимальную стратегию, в которой все чистые стратегии игрока используются с положительными вероятностями. Действительно, предположим, что это-так; тогда , в силу теоремы 1.8 оптимальная стратегия У* игрока II
ГЛАВА 2. ПРИЛОЖЕНИЯ 65 (2.7) откуда найдем, что v'= удовлетворяет системе уравнений 11 (i, Г*) = — h, (1 — г)Г) = у,- Из уравнений (2.7) легко найти, что t]*= 1 + v/hj, 1 п. ~ (2.8) Суммируя равенства (2.8) по / и принимая во впима* нпе равенство 2 Ш = 1? получим s П - \ п — 1 • 2 iMj 7=1 Подставив значение v в равенство (2.8), мы опреде- - лям вероятность r)j стратегии F* до формуле hj. 4 = 1 3 (2.9) —, 1 (2.10) неравенства (2.6) все числа что их сумма равна едини- определяют некоторую сме- Так как > hn, то в силу, г)* положительны. Очевидно, це, так что равенства (2.10) шанную стратегию, удовлетворяющую системе уравнений (2.7), в которой число и определяется формулой (2.9).„ ' Заметим теперь, что смешанная стратегия X* = {£, игрока I, определяемая равенствами / п \ —1 (2.И) удовлетцрряет системе уравнений* ' ll(X*,j) = 2 Hifi = 5 Г, II. Дюбин, В. Г. Суздаль
66 ЧАСТЬ I. КОНЕЧНЫЕ АНТАГОНИСТИЧЕСКИЕ ИГРЫ в которой v также определяется, по формуле (2.9). Из всего этого можно заключить, что значение рассматри- ваемой игры определяется равенством (2.9), а оптималь- ные стратегии игроков — равенствами (2.10) и (2.11). Как уже отмечалось, эти' же стратегии будут оптималь- ными в первоначальной игре, заданной матрицей Я, а чтобы получить значение этой игры, надо прибавить к (п \—1 2 i/hj число р. Принимая во внима- 5=1 / ние равенства hj = lj — р, ле*гко видеть, что значение этой игры i/ равно = --1—. (2.12) Определим теперь, когда магазину рентабельно заво- зить товар при неизвестном спросе. Для этого необходи- мо, чтобы выполнялось условие г п п \ VI V 1 Йч + f 1Й!; + Р ИЛИ п 2nf7-("-1)>0- ’ (2ЛЗ) 5=1 } Если условие (2.13) не выполнено, то магазину невыгод- но завозить товар, а если выполнено, то его необходимо завозить согласно стратегии, определяемой равенствами (2.11). . Как и в предыдущем примере, выясним смысл вели- чины t i#=5 Очевидно, эту величину можно трактовать как ожидае- мый доход ♦) магазина при условии, что /-й тип товара ♦) Напомним, что ожидаемый доход не совпадает с реальным выигрышем.
ГЛАВА 2. ПРИЛОЖЕНИЯ 67 пользуется спросом, а в магазин завезли весь ассорти- мент товаров в пропорциях £2‘- • • -- In- Таким образом, если магазин имеет возможность за- возить разные типы товаров, то вероятности можно трактовать «физически»* как-доли товаров, которые необ- ходимо завезти в магазин при правильной торговой по- литике. Доход и при использовании смешанных стратегий гарантируется лишь в среднем. , • Приведём теперь численный пример для исходных данных, указанных в табл.^2.2. Табл п*ц а 2.2 / Тип товара 1 2 - з * 4 1 1 » Доход от реализации • (усл. ед). Убыток при хранении 32 32 32 32 32 (усл. ёд). 16 . 8 4 4 2 ' Необходимо решить конечную антагонистическую иг- ру, заданную матрицей'выигрышей (32 — 1,6 - 16 — 16 — 16\ — 8 32 — 8—8 — 8| — 4 — 4 32 — 4 — 4 |. ' — 4 — 4 — 4 32 — 4 ) — 2 — 2 — 2 — 2 32/ Преобразуем матрицу Я, вычтя из каждого ее элемента р = 32. В результате получим матрицу / 0—48 / — 40 0 -48 -40 — 48 -40 -4?’ — 40 н1 == 1 — зб —^6 0 — 36 -36 1—36—36 — 36 0 — 36 \— 34 -34 -34 -34 0. Для установления рентабельности завоза данного то- вара проверим выполнение неравенства (2.13): ' 32 32 , 32. , 32 '32 ’', h ' 16-1-32 8 +32 4 + 32^4 +32 + 2 +32 Условие (2.13) выполняется, и поэтому товар завозить 5*
68 ЧАСТЬ L* КОНЕЧНЫЕ АНТАГОНИСТИЧЕСКИЕ ИГРЫ целесообразно. Оптимальную стратегию найдем на-осно- вании равенств (2.11): X* « (0,16; 0,19; 0,21; 0,21; 0,23), - а значение игры вычислим подформуле (2.12): v' « -30,6 + 32 « 1,4. > ' Обычно вероятности можно трактовать как доли каждого тина товара, завозимого в магазин.-Если, допу- стим, магазин может завезтивесь ассортимент данного товара ,в объеме 1000 ед., то согласно стратегии X* сле- дует завести 160 ед. товара 1-го типа, 190 ед. товара 2-го ; Tlirta, 210 ед. товара 3-го типа, 210 ед. товара 4-го типа и 230 чед. товара 5-го типа. В этом случае доход магазина будет, равен значению игры, т. е. 1,4 усл. ед. . . Пример 2.3 (профилактические меро- приятия). 'Предположим, что может произойти одно из п нежелательных для некоторой стороны явлений (на- пример, наводнение, уровень которого можно ^предсказать лишь приблизительно, томили иное рассогласование неко- торого механизма, нарушение функционирования некото- рой организации по той или* иной причине и т. д.). В свою очередь эта сторона может провести одно из п мероприя- тий, причем мероприятие / сводит убытки от явления j к нулю и влияет’ на убытки, причиняемые действием .1 (i^ j). Пусть затраты на мероприятие / равны’ а убытки от явления г, если произведено мероприятие ] 'г ,(/^0, равны Здесь мы опять имеем конфликт с природой. Если под полезностью природы (игрок I) по- нимать убытки, которые опа причиняет рассматриваемой стороне (игрок II), то этот конфликт можпо Кюделировать конечной антагонистической.игрой, определяемой матри- цей выигрышей , ; / Pl Ги + Рг ••• Г1п +Рп п = I Г21 + — 'гп+.А A+V.J'?*’ рп Очевидно^ игрок II бу^ет стремиться минимизировать j свои убытки и, рассчитывая на худший случай, должен 4 считать, что игрок I (природа) ему антагонистичен. Рас- • 1 смотрим отдельные случаи, 1
ГЛАВА 2. ПРИЛОЖЕНИЯ -Случай 1..Здесь мы считаем, что мероприятия упо- рядочены и таковы, что (/ + 1)-е мероприятие охватывает мероприятие /. Тогда, очевидно, pJ+1 > ph ri} == 0, если i^j. Кроме того, будем считать,-что в остальных'случа- ях ущерб; Пе зависит от того, проведено мероприятие или нет. Положим его' для стратегии / равным ljt Тогда мат- рица Н будет иметь вид f' Pi p + Pi ••• Pn . >. _ Vn+\ p2... pnJ Естественно считать, что ln > pn, т. e. убытки без про- ведения профилактических мероприятий больше затрат па их предотвращение, иначе задача пе имеет смысла. Легко видеть, что элемент рп, стоящий па пересечении я-го столбца и n-й строки, является -седловой точкой мат- рицы Н. Следовательно, рк — значение игры, а оптималь- пые2стратегии соответственно игроков I и II — выбирать п7ю строку и n-й столбец.: Такая ситуация наблюдается, например, при строительстве -плотин, когда проектиров- щики при составлении проекта рассчитывают на /худшее из возможных условий. " / Случай 2 (случай независимости). Здесь мы пред- полагаем, что только мероприятие./. нейтрализует страте- гию природы /, т. е. rjj ~ 0, я в остальных случаях убыток не зависит от того, произведено мероприятие или нет. Для стратегии / природы положим убыток^ как и в пре- дыдущем случае» равным />. Для удобства будем считать, что Zf > li >... > 1п» Кроме’'того, положим l pt = 0. Этот случай моделирует конфликты, -в которых ' затраты наг: профилактические мероприятий пренебрежимо* малы по ^сравнению с возможным ущербом. Тогда матрица Н при- нимает вид , ' / /0 1Г ... Z х рг.!2.- Игра с матрицей выигрышей //-предыдущего случая приводится на основании теоремы 1.13 к такому же виду, если все pi равны между собой* Найдем решение рассмат- риваемой игры.* ' :
70 ЧАСТЬ I. КОНЕЧНЫЕ АНТАГОНИСТИЧЕСК11Е ИГРЫ Пусть для всех 3 С к С п справедливы неравенства /А>(Л —2)/2,-р (2.14) Тогда для всех j = 1, 2, ..., п выполняются,неравенства ^>(п-1)/24-« (2-15) / i=l * так как числа lj убывают с увеличением индекса. Вслед- ствие неравенств (2.15) стратегия У*, компоненты кото- рой определяется равенствами Ч 2 1/z« - («-1) = -------а (2-16) л • Л21/г< ' « ’ i=l является смешанной стратегией игрока II. Применяя ее против чистой стратегии i игрока f, он получит, величину А(г1У*) = Г,2пТ = (1-Ш = z I П = («-1)/2т-> !<»<«• (2.17) / Л=1 Если игрок I.применит стратегию X*, Для которой / - п \—1 против чистой" стратегии / игрока II, то он получит • = !</<«. (2.19) Из - (2.17) и (2.19) следует,, что величина (п \ —1 2 / является значением игры, а смешан- Й=1 / ные стратегии X* и У* — оптимальными смешанными стратегиями игроков I и II. *
ГЛАВА 2. ПРИЛОЖЕНИЯ 71 Допустим теперь, что неравенства (2.14) для некото- рых значений к не выполняются. Тогда существует ми- нимальный индекс р, дЛя которого неравенства (2.14) еще выполняются, а для р + 1 — нарушаются, т. е. / р X-1 1 Мр-1)2т •' (2.21) \i=l г ) В силу неравенств (2.20) числа li 2 ~ (Р ~ ь-i ________________ р • . h £ "b i—1 1 < 7 < Р, (2.22) неотрицательны- и в сумме равны единице. Следователь- по, стратегия У* = (Лп • • •> 1Тр, 0, ..., 0) определяется равенствами (2.22) и является смешанной стратегией иг- рока II. Применяя ее против чистой стратегии i игрока I, он проиграет Я(£, У*), причем для i*«l, 2, . .., р спра- ведливы равенства (р \~i 2-г . (2.23) k j а для i > р + 1 из того, что числа убывают, и из нера- ' венств (2t21) следуют неравенства . / р \-х H(ijy*j = (l^i1r)Zi = /i<ZP+i<(p-l) 2-т- • \fe=l J ' (2.24) 0, Аналогично, применяя стратегию X* = .., 0), где ' р h 2 -г- для 1 < I < pj, . h ) \ £ * • • •! 6р, (2-25) • 0 для 1>рг
72 ' \ ЧАСТЬ ,1. КОНЕЧНЫЕ АНТАГОНИСТИЧЕСКИЕ ИГРЫ ДЛЯ 1 < / р игрок I .получит Я(Х», П = 2^‘ = Ф-1>( 2'7") • - (2-26) \fe=l kJ . \ ‘ / - Если же j > р, то - ' " А р / р» \-1 ; / р \-1 я(Ай-2«:=р ' >(р-1) 2-г • < ' i=i . \h=l А / \Л=1 h / ' (2.27) Таким образом, из (2.23) — (2.27) следует, что Ж*, У*) С ЖХ*, У*) С Я(Х*, у), \ ’ (2.28) ' 1 I n,' 1 7 га, где . . (р \-г 2 т- ' ч Следовательно, (р \ -1 2 т- ’ а оптимальные стратегии игроков определяются равен- ствами (2.22) и (2.£5). _ Проиллюстрируем построение и анализ математичек- ской модели рассмотренного, типа конфликта с природой (выбор оптимального; профилактического мероприятия в условиях неопределенности) па . 'примере проектирова- ния защищающей от наводненпяд'амбы и профилактиче- ского осмотра технической системы. ' . Допустим, что высота дамбы в зависимости от уровня наводнения должна быть не менее 1,- 2, 3, 4. или 5 м, а сметные, затраты на строительство .такой дамбы соот- ветственно равны 2, 4, 6, 8 и.10 млн. руб. Пусть "ожидает мьп? ущерб от наводнения, уровень которого не превосг ходит’двух метров, составляет 10 млн. руб., 3 метров—’ 13 млн. руб., 4..метров — 16 млн. рубГи5 метров — 20 млн.
ГЛАВА 2. ПРИЛОЖЕНИЯ , , . .73. руб. Очевидно, что ущерб будет причиняться только в том случае, когда высота дамбы окажется недостаточной для . удержания воды. Поскольку заранее высота подъема воды неизвестна, будем высоту дамбы рассматривать как чи- стую стратегию проектировщика (игрок II) в игре с при- - родой z (игрок I), чистой стратегией которой является уровень наводнения. За, полезность игрока I естественно принять затраты 'па строительство дамбы и ущерб от на- воднения при отсутствий дамбы, высота которой превы-, шает вровень подъема воды. Тогда выигрыш игрока I молено записать в виде табл. 2.3. - ' . ^Таблица 2.3. Выигрыш игрока I V Уровень Высота дамбы/ на во дне- . НИЯ 1 2 • 3 4 5- *.1 2 4 • -6 . “ 8 10 . 2 . 12 4,6 8 10 1 15 18 7 ' 6 20 .22 8 8 10 10 5 22 24 26 28 - ' 10 Из табл. 2.3 видно, что матрица выигрышей игрока I имеет седловую точку (5,5). Следовательно, оптимальной стратегией проектировщика является высота дамбы,- рав- ная 5 м.' " ‘ \ . Теперь предположим, что техническая система состоит из пяти блоков .элементов, отказ одного из которых ведет к отказу врей системы. Для предупреждения простоя си- стемы можно провести перед началом ее работы проверку и замену неисправного элемента одного изх блоков. Если проверяется блок (/«4, 2, .. 5), а отказал элемент блока (&== 1,;2, ..., 5) и i то система простаивает, что 4 приводит .к убытку Ц, который существенно превышает, допустим, расходы -на профилактический Осмотр и замены неиецравных элементов.» .Поэтому можно принять == 0. Требуется выбрать блок для профилактического осмотра при условии минимизации математического ожидания убытка. - Пусть Ц = 19 тыс. руб., 12 = 18 тыс. руб., 13 — 17тыс. руб. и k — iQ тыс. руб.ЛТрипимая технолога за игрока II и оценивая полезность игрока I (природы) убытком Z{, придем к антагонистической конечной-игре, которая, моде-^
74 J ЧАСТЬ t. КОНЕЧНЫЕ антагонистические игры лирует рассмотренный конфликт с природой и задается матрицей выигрышей ' / 0 19 19 19 19’ '18 0 18 18 18 н = 17 17 0 17 17 т 1 i 16 16 16 0 16 \15 15 15 15' 0 Легко установить, что данная игра относится к слу- чаю 2 (случай независимости) примера .2.3, и поэтому для ее решения проверим выполнение неравенств (2.15). Эти неравенства выполняются, поскольку справедливы нера- венства (2.14). Следовательно, для вычисления оптималь- ной стратегии технолога можно • воспользоваться форму- лой (2.16). В результате найдем У* « (20/69,20/80,17/81, 12/80, 8/80), а значение игры вычислим по формуле / й=1 k Пусть теперь убыток (i «1, 2, ..., 5) принимает та- кие значения, что матрица выигрышей игрока I имеет > вид , /01/2 1/2 1/2 1/2\ w /1/3 0 1/3 1/3 1/3 \ Н1 = Г 1/4 1/4 0 1/4 1/4 4 1/5 1/5 1/5 0 1/5 / \1/6 1/6 1/6 1/6? 0 / ►Проверка неравенств (2.14) показывает, что минимальный из индексов р, для которого эти неравенства еще выпол- няются, равен 3, а для р + 1 = 4 — нарушаются. Следова- тельно, для вычисления компонент вектора оптимальной стратегии технолога (игрок II) необходимо использовать формулу (2.22), а значение игры найти по формуле (2.28). Выполнив вычисления, получим У* = (5/9, 3/9, 1/9, 0, 0) и v = 2/9. Характерной особенностью, рассмотренных в примере 2.3 конфликтов с природой является невозможность фи- зической реализации смешанной стратегии, что требует применения Ьлучайного механизма для выбора чистой стратегии. 1
ГЛАВА 2. ПРИЛОЖЕНИЯ 75 Пример 2.4 (планирование выпуска по- ?б о ч н о й , п р о д у к ц и и ) L15J. Предположим, что в не- котором городе имеются два предприятия, которые поми- мо своих основных изделий могут выпускать для населе- ния некоторую побочную продукцию одного и того же назначения. Эту продукцию они предполагают продавать в том же городе, никуда ее не вывозя. Хотя назначение этой продукций одно, она отличается по оформлецию, по удобству пользования и т. д. — иначе говоря, типы продукции разные. Первое, предприятие может выпускать продукцию типа Д2, ..Дт- Второе — продукцию ти- па Mi, М2, ..Мт. Себестоимость и продажная цена всех видов продукции одинакова. Срциологй — специалисты до прогнозированию спроса — установили, что в городе най- дет сбыт N единиц .товара всех видов, причем, если пер- вое предприятие (игрок I) будет выпускать продукцию типа Д-, а второе (игрок II) — продукцию'типа Mh то в городе найдет сбыт ptjN товаров типа Дг й (1 — pn)N то- варов типа Мзг 0^ рц^1. Мощности предприятий, та- ковы, нто ’каждое из них может обеспечить город. Прини- • мая доход от продажи единицы товара равным единице, а полезность игрока I — равной его доходу, матрицу вы- игрыша Н игрока I можно записать в следующем виде: /P11N P12N PlmN \ ч ff —Р21^ Р22^ ’ ’ * Р2т^ J \PmlN \ Pm$N • • •' Ртт^ ' Аналогичным образом записывается матрица выигры- шей игрока II, элемент , (i, /) который равен. (1-Чръ)Я. Так как в любой ситуации сумма доходов игроков I и II равна одному и тому же числу N = p^N + (1 — p^N, увеличение выигрыша игрока I эквивалентно уменьшению выигрыша игрока II, т. е. интересы игроков противопо- . ложны. Поэтому игрок II, минимизируя сбыт р{$ товаров Д< игрока I, максимизирует сбыт (1 — p^)N своих товаров Mj. Следовательно, игра Г, заданная матрицей Я, моделщ рует рассматриваемый конфликт. Таким образом, решение игры Г определяет оптималь- ные стратегии X* и У* соответственно игроков I и II, , а также математическое ожидание выигрыша игрока I," * равное v.B этой игре математическое ожидание выигры-
*76 Л ЧАСТЬ 1. КОНЕЧНЫЕ АНТАГОНИСТИЧЕСКИЕ ИГРЫ _ ша игрока II равно Так как сумма продаппых това- ров равна N, математическое ожидание реализованных товаров предприятия!! равно N — v. * Покажем решение игры на конкретном числовом при- мерелДопустим, что предприятие А может-помимо-своей основной продукции выпускать детские игрушки типа Дь' Д2, Дг, Дъ д5, а предприятие В — игрушки типа ЛЛ, Л/2, Л/3, Л?4, М5/ Для простоты буДем считать; что затраты на производство каждого типа игрушек одинаковы и что эти игрушки реализуются по одной и той же цене. Прогнози- руемая . доля сбыта игрушек предприятия А задана табл. 2.4. ' - .. ’ Таблиц а 2.4. Прогнозируемая ,доля сбыта игрушек предприятия А Предприятие А , Предприятие В Л1, • Mt ’I М„ . Д1- ' 0,5. 0,5 ол 0,5 . 0,2 г Да 0*5 0,4 . 0,7 0,1 ' 0,6/ Дз 0,2 . 0,3 0,4 0,1 0,7 д<, 0,3 0,6' 0,7 .0,3 0,2 Дб 0,4 0,4 ДЗ 0,0 0.2, _ Ожидается, что всего, будет реализовано 1000 игрушек. Требуется. определить типы игрушек, выпускаемых' каж- * дым предприятием.-В этом случае матрица выигрышей игрока i будет иметь вид ' , 500 500 400 500 200' 500 400/700 100 600 200 300 400 100 700 300-600 700 300 200 400 400 300 0 200, ' Прежде всего заметим, что по теореме 1.13 достаточно решить игру Г1 = <я, у' В1}, - где П' 1/100)//.. В мат- ричной форме игра Г1 определяется матрицей (' 5 5 4 5 2\ 547161 2 3 4 1 7 1. : 3 6 7 3 2 / , 4 4 3 0 2/.
ГЛАВА 2. 1ГРИЛ0/КЕН11Я 77 Легко установить, что элементы, пятой строки матрицы И1 не больше соответствующих элементов первой строки, и поэтому первая стратегия игрока I доминирует пятую. Кроме того, элементы первого и второго столбцов пе меньше соответствующих элементов четвертого столбца/ Следовательно, четвертая стратегия игрока II доминирует его первую-и вторую стратегии. Далее, из теоремы 1.12 следует, что всякое решение игры Г2 = <а?\{5}, у\{1,2}, Я1> является решением игры Г1 = <#, у; Я1). В матрич- , пой форме игра Г2 задается матрицей /4 5,2\ - \7 3 2/ ' - Заметим, что f-й строке матрицы II2 соответствует ья стратегия, а /-му столбцу (/ + 2)-я стратегия игры Г1. /Анализ, матрицы Н2. показывает, что третья стратегия игрока II доминируется смешанной стратегией, которая с вероятностями 3/5 и 2/5 использует соответственно чет- вертую и пятую стратегии., Применяя теорему 1.11, полу* чаем, что всякое решение игры Р= <#, #\{3}, Я2> яв-_ ляется решением игры Г2/а значит, игр Г1 й Г. Игра Г3 определяется матрицей - - / ' '3 2/ . 7 ' Из анализа матрицы ЯЛ-легко установить, что элемен- ты второй строки не больше соответствующих элементов третьей строки, & элементы четвертой строки —элементов первой строки. Поэтому первая и третья стратегия игро- ка I доминируют соответственно четвертую и вторую его стратегии. Отсюда в силу теоремы 1.10 имеем, что всякое решение игры Г4 <#\{2, 4}, у, Я3 >. является решением игры Г3, а следовательно, игр Г2, Г1 и Г. Игра Г4 задается матрицей , 1 L ' • ’ Матрица Я4 не,имеет седловой точки, так как не вы- полпяетсяг равенство (1.10), т. е. оптимальные/стратегии
78 ЧАСТЬ I. КОНЕЧНЫЕ АНТАГОНИСТИЧЕСКИЕ ИГРЫ игроков являются смешанными. Найдем эти стратегии по формулам (1.76) и (1.-78), а-значение игры Г4 — по фор- муле (1.77). В результате будем иметь В* = 2/3, £2 = = 1/3, ц* = 5/9, ц* = 4/9, v = 11/3. Стратегиям X* = 2/3, 1/3) и У* = (5/9, 4/9) соответствуют стратегии X* = (2/3, О, 1/3, 0,0) и У* = (0, 0, 0, 5/9, 4/9) первоначальной иг- ры. По теореме 1.13 значение игры Г равно 1100/3. В со- держательной терминологии примера это означает, что предприятие А выбирает выпуск игрушек Д1 и Д9 с веро- ятностями, равными соответственно 2/3 и 1/3, а пред- приятие В — выпуск игрушек М4 и М5 с вероятностями соответственно 5/9 и 4/9. При этом математическое ожи- дание числа реализованных игрушек предприятий А и В , соответственно будет равно 1100/3 и 1900/3. Пример 2.5. (антагонистическая конку- ренция). Предположим, что фирма А в условиях капи- талистической экономики производит некоторый сезонный товар, который •име^т спрос в течение п единиц времени. Этот товар поступает на рынок в момент i (i = 1, 2, ... ..., п). Для конкурентной борьбы с фирмой А дочерняя фирма В концерна D, не заботясь'в собственных доходах, производит аналогичный товар, который поступает на ры- нок в момент J (/ = 1, 2, v., п). Ее цель — разорение пер- вой фирмы, после чего ей будет легко, опираясь на капи- тал Р, наверстать упущенное. Для этой цели проще всего продавать товары по пониженной цене. Однако иногда имеются законы или соглашения, запрещающие поступать подобным образом. В этом случае единственным закон- ным инструментом этой фирмы является выбор моментаk поступления товара на рынок. И она должна заранее J готовить свое производство к выпуску и продаже товара * в выбранный период времени. А чтобы разорить первую фирму, вторая фирма должна минимизировать ее доходы. Пусть качество конкурирующих товаров зависит от времени их поступления на рынок относительно друг дру- га — чем позже товар выбрасывается на рынок, тем ка- i чество его выше, а реализуется только товар более высо- I кого качества. Тогда, если фирма. Л выбросит свой товар | в момент г, а фирма В — в момент j > /, то фирма Л, не имея конкурента в .течение / — i единиц времени, получит | за это время доход с(/ — /), где с доход от продажи това- | Иг
ГЛАВА 2. ПРИЛОЖЕНИЯ 79 ра в единицу времени*). В момент времени j на рынке появляется товар фирмы В, который имеет бодее высокое качество. Поэтому с момента j фирма А теряет рынок и в дальнейшем дохода не получает. Если же i > j, то фир- ма 4, выбросив на рынокхболее качественный товар, будет получать доход в течение всего отрезка j, п. Так как чис- ло оставшихся единиц времени равно п — i + 1, то доход фирмы А будет равен с(п — / + 1). В том случае, когда i = /, т. е. на рынок одновременно поступают оба товара, естественно считать, что эти товары имею? одинаковый спрос, и поэтому фирма А получит доход, равный c(n —j+D/2^ ' . ' Фирма А выбирает i-ю единицу времени поступления товара на рынок, стремясь максимизировать свой доход, а фирма В, выбирая /-ю единицу, преследует прямо про- тивоположную цель — минимизировать доход фирмы А. Следовательно, рассмотренная ситуация конкуренции двух одинаковых фирм является антагонистическим кон- фликтом. Для построения математической модели этого конфликта — конечной антагонистической игры — примем за игроков I и II соответственно фирмы 4 и В. Очевид- но, что х = у = {1, 2, \ .., п} — множество чистых страте- гий игроков I и II, а функция выигрыша игрока I опре- деляется равенством Р(/ —1),. i</; Н с (и — i + 1), с (n —j + 1), Решение построенной игры для х—у = {1, 2, 3, 4} было получено в примере 1.3, а именно X* == (1/2, 0, 1/2, 0), У* = (0г-1/2, 1/2, 0), v == Зс/2. Следовательно, фирма 4 с равными вероятностями должна выбрасывать товар в 1-ю и 3-ю единицы времени, а фирма В с равными; вероятностями —во 2-ю и 3-ю единицы времени. В этом случае математическое ожидание дохода фирмы'4 будет равно Зс/2. Эта игра еще встретится в § 2,2, где она бу- дет решена в общем виде. *) Записывая доход в таком'виде, мы считаем, что затраты на разработку технологии изготовления товара- пренебрежительно ма- лы по сравнению с величиной с.
80 ЧАСТЬ Т. КОНЕЧНЫЕ. АНТАГОНИСТИЧЕСКИЕ ИГРЫ § 2.2. Примеры приложении в военном деле Вооруженная борьба в силу ее объективных законо- мерностей представляет собой взаимосвязанную совокуп- ность стратегических и оперативно-тактических конфлик- тов. В любом военном конфликте, независимо от его масштабов, явно участвуют враждующие стороны^ имею- щие для достижения своих целей наборы альтернатив, каждая из которых приводит к одному из ряда возмож- ных исходов. Часто военный конфликт состоит из насту- пательных действий одной стороны и оборонительных мероприятий другой, возникающих из прямой противопо- ложности интересов этих сторон. Так, оборона всегда строится с расчетом уменьшить свои потери (в самом широком смысле), а наступающая сторона стремится уве-. личить потери обороняющихся. Если при этрм^ стороны располагают конечным .-числом. возможных действий, предпринимаемых независимо друг от друга, и результаты действий можно оценивать вещественными числами, то адекватными моделями таких военных конфликтов ока- зываются конечные антагонистические игры (при* допу- щении, что стороны имеют йолную информацию о набо-. рах альтернатив и исходах любой возможной ситуации, которая может сложиться в результате * их взаимо? действия).. Следующие ' примеры иллюстрируют, использование теории конечных антагонистических игр для обоснования оптимального распределения поисковых усилий, а также организации нападения и защиты в различных условиях. Пример 2.6 ‘ (распределение^ поисковых усилий). В одном из п районов^акватории находится подводная лодка стороны Для поиска этой подводной лодки сторона А имеет г противолодочных кораблей, ко- торые могут быть раецределены по районам различным образом. Например, все корабли можно выделить для по- иска в 1-м районе или в 1-й район послать г—1 корабль, во 2-й — одищ-в остальные— пи одного и т. д. Очевидно, что вероятность обнаружения подводпой лодки одним противолодочным" кораблем в /-м районе (/ e 1, 2, ..., п) зависит от размеров и физико-гидрогра- фических условий района. Обозначим эту вероятность через и будем считать, что обнаружение, подводной лод-
ГЛАВА 2. ПРИЛОЖЕНИЯ 81 ки каждым из противолодочных кораблей являются неза- висимыми событиями: : 1 Обычно противоборствующие-стороны располагают ап- риорной информацией о\ значениях го/ (/ = 1, 2, ..., п), и поэтому каждая из них может определить вероятность обнаружения подводной лодки в /-м районе по формуле Aj=l-(1-^)4 (2*.29) где — число противолодочных кораблей в /-м районе (/= 1,-2, «).' в Сторона А должна распределить противолодочные ко- рабли по районам, а сторона В — выбрать район для дей- ствий подводной лодки. Следовательно, имеется конфликт двух сторон: сторона А — игрок I и сторона В — игрок II. Игрок I распределяет корабли по районам с расчетом м а ксимизировать вероятность обнаружения подводной лодкига игрок II выбирает район с, расчетом минимизи- ровать эту вероятность. Очевидно, что игроки преследуют прямо противоположные цели, и поэтому конфликт анта- гонистичен, т. е. выигрыш игрока I в точности равен проигрышу игрока II. Кроме того, конфликт удовлетворя- ет условиям 1—4, сформулированным в начале главы. Таким' образом, математической моделью распределе- ния поисковых усилий противолодочных кораблей сторо- ны Л и выбора района действий подводной лодки стороны В является конечная антагонистическая игра Г, которую можно задать матрицей выигрышей /\1 7*12 \п\ 7 /д = I ^21 Л22 ••• \п I, ^m2 * * ’ где /72 — число чистых стратегий игрока I, тг—.число чи- стых стратегий игрока II, = /) —выигрыш^ игро- ка I в ситуации G, /). ~ ‘ Чистой стратегией*) игрока I является вектор 2 = • • •? #«)> гДе ^7 I®» П — целые пеотрица- *) Читатель может убедиться, что число чистых стратегий иг- рока I равно числу сочетаний с повторением из п + г—1 элемен- тов но г элементов, т. е. = ^n+r-i “ г| (п _ 1)Г • 1 6 i\ Н. Дюбан, В. Г,- Суздаль
82 ' ЧАСТЬ I. КОНЕЧНЫЕ АНТАГОНИСТИЧЕСКИЕ ИГРЫ Z 4 П ' тельные числа, 2 & = r, gj—число противо- 3=1 . лодочных кораблей, направленных в j-й район согласно i-й чистой стратегии. Чистой стратегией j игрока II явля- ется выбор /-го района (/х= 1,2,..., п). Полезностью нападающей стороны (игрока I), очевидно, будет вероят- ность обнаружения подводной лодки % J-м 'районе, кото- рая определяется с учетом (2.29) по формуле i " hi} = 1-(1-^)4 (2.30) Пусть п = г = 2, <of == 0,6, g)2 = 0,4. Тогда рассматри- ваемую ситуацию распределения поисковых усилий мож- но представить в виде табл. 2.5i Т а б л*и ц а 2.5. Выигрыш игрока I Стратегия игрока I Стратегия игрока П 1 2 1 =3 (2,0) . 0,84 0,00 2 = (1,1) 0,60 . 0,40 / 3 = (0,2) 0,00 0,64 Следовательно, матрица выигрышей игрока I равна . /0,84 0,00\' ' Н'= 0,60 0,40 . \0,00 0,64/ Согласно теореме 1,2 игроки I и II имеют оптималь- ные1 стратегии, которые найдем, применяя графический метод (см. пример 1.6). В результате получим X* — (О, 16/21, 5/21), F* - (2/7, 5/7) и v - 16/35. Таким образом, с вероятностью 16/21 в каждом районе осуществляет поиск один корабль, а с вероятностью 5/21 оба корабляГ осуществляют поиск в районе № 2. В свою очередь подводная лодка с вероятностью 2/7 выбирает район Кз. 1 и с вероятностью 5/7 — район № 2. В резуль- тате вероятность обнаружения подводной А лодки будет равна 16/35, что соответствует объективным условиям поиска, размерам, физико-гидрографическим факторам и тактико-техническим данным (кораблей и подводной лод- %
ГЛАВА 2. ПРИЛОЖЕНИЯ 83 ки). Отклонение стороны А от приведенного оптимального распределения противолодочных кораблей может умень- шись эту вероятность, а отклонение стороны В от оп- тимального выбора райбна для действий подводной лод- ки >может привести к увеличению этой вероятности. Пример 2.7 (выбор объектов атаки и за- щиты). Предположим, что сторона А планирует нане- сение удара по одному из п объектов стороны В, которая в силу ограниченного количества защитных средств “может организовать эффективную оборону только одного объек- та. Пусть ценность объекта i равна bt (^== 1, 2, ..., и) и все числа bt различны ♦). Тогда математическое ожидание ущерба, наносимого стороне В, при выборе сторонами А и В соответственно объектов i и / (i = 1,2,..., п, / = 1, 2, ..., п) можно определить по формуле /bi(l-p), если i = 11 2S .... *hv3 = , _v_ . . 4 n (2’31) . \bh если 7 = 1, 2....An, f где p — вероятность неуничтожения обороняемого объекта. Очевидно, что .сторона А стремится максимизировать hi}, а сторона В — минимизировать hih т. е., интересы сто- рон прямо противоположны и их взаимодействие состав- ляет . содержание антагонистического конфликта. Если принять сторону А за игрока I и сторону В — за игрока II, то рассматриваемый конфликт моделируется конечной антагонистической-игрой, матрица выигрышей которой /(i-p) ь/ Ь1 ... дд Я = | Ъ2 Ь2 *2 I, \ • • • (1 Р) Отметим, что эта матрица уже встречалась и ее реше- ние было найдено при р = 1 (см. пример 2.3). Этот инте- ресный факт встречается довольно часто — когда различ- ные по своей фцзической и социальной природе конф- , ликты приводят к одинаковым теоретико-игровым мо- делям., Здесь проявляется одна-и та же закономерность, теоретико-игровые описания которой одинаковы, а при- ложения различны. В частности, при р = 1 спектр опти- *) Заметим, что допустив равенство чисел мьг существен- но усложним задачу. 6*
84 ЧАСТЬ Е КОНЕЧНЫЕ АНТАГОНИСТИЧЕСКИЕ ИГРЫ. Я мальных стратегий игроков состоял йз одинакового числа Я чистых стратегий, причем оба игрока использовали всво- 1 их смешанных стратегиях свои^ первые по индексу к— 1 стратегии. Естественно предположить,, что и для' р я оптимальные стратегии игроков X* и К* устроены так же, 1 т; е. = 0, = J), / > fc, для некоторого к (к = | 2, ..п), а еслил, j. С к, то£* 0 и ц* > 0. Это" не про- z. 4 тиворечит и здравому смыслу — игрок I нападает на бо- | ' лее ценные объекты, а игрок II их_ защищает; Так, чита^ 1 тёль без труда может проверить, что если XI—р)6х > fe2, ' ' 1 то элемент (1—рУЬ^ является седловой точкой. матрицы _ Я,~а игроки имеют'чистые оптимальные стратегий: игрок ; I —нападать на объект 1, а игрок II —защищать объ- ект 1. Поэтому будем считать, что (l~p)di<d2, т. е. : , . . . ~ - <2.32) | Пусть р — минимальный из индексов, для которого неравенство „ , -z ' л-1 у-1 Ьр>(р-.р-1) 2hH ’ (2.33) " 7 \i=1 ' ' ' справедливо, а при р + 1 нарушается, т. е. (р \ -1 2-r-J . .. (2-34) г-1 i J ' Заметим, что дри р « Д .это, неравенство эквивалентно неравенству (2.21), так что имеется полная аналогия решения рассматриваемой игры с решением игры из при- мера 2.3. Положим к = р и заметим, что если наши пред- положения о виде оптимальных* стратегий Х& и У* спра- ведливы, то в силу теоремы 1.8 должны , выполняться равенства " . H {i, У*) = (1 - Р) bi + bi (1 - !b) = ' 1 < i <P. . • (2.35) и - ‘ , H (X*, j) = (1 - p) b& + ,2. b£ = v, 1 < 7 < p, (2.36)
ГЛАВА 2. ПРИЛОЖЕНИЯ 85 Читатель может-легко проверить, что решением этой сп- стемыхявляются числа - / р , \-1 ₽ = (₽-?) 2'г » (2.37) \/l=l \/ ' - - * bi — V .. шГ=-276-. (2.38) ' Л Р \ -1 & = 12-ТГ .< 1<*<Р- <2-39) \i=l * / _ > . , Таким образом, для тогочтобы показать, что смещай- ные стратегии X* = (Е*, • ••>£*, 0, 0) и У* == =(у|Ь Яг» О» ...» О) являются оптимальными стра- тегиями игроков, достаточно проверить неравенства ' . Я(Х*, j) > и, 7 > Р> . (2.4'0). H\it 1>р. ‘ \ (2.41Г Но при / > р имеем ' р / р \~i я(х«,/)-2^’ = рД2т~ > , - i—1 " \k=l ® J . ' - / 0' X-l >(p-p). . =^. \fc=r / ' ' i Следовательно, неравенства (2.40) справедливы. G дру- гой стороны; при i р выполняется соотношение ч р . Н (г, У*) = S= MN= bi <-^+1.- ' . Л ’ i=1 \ Так как в .силу неравенству (2.33) число ЬР+1 не пре- восходит V, неравенства (2.41) также доказаны. Из (2.35), / р \-i (2.36), (2.40) и (2.41) следует, что число (р —р) | 7. / является значением игры, а стратегии X* и У* — опти- мальными стратегиями игроков. Рассмотрим теперь численный пример, предположив/ что сторона А (игрок I) планирует’ нанесение- удара по одному из трех объектов военно-морской базы стороны В
86 ЧАСТЬ I. КОНЕЧНЫЕ АНТАГОНИСТИЧЕСКИЕ ИГРЫ (игрок II), которая имеет в распоряжении для организа- ции ПВО этих объектов' только один комплекс зенитных ракет. Пусть р = 1/2, bi = 1/2, b2 = 2/5, b3 = 1/3. Соглас- но формуле (2.31) матрица выигрышей /1/4.1/2 1/2Х . Н = 2/5 1/5 2/5 . \1/3 Д/3 1/6 J Находим минимальный из индексов, для которого спра- ведливы неравенства (2.33), (2.34), а именно, р = 2. За- тем по формулам (2.37)—(2.39) вычисляем v = 1/3, У* == = (2/3, 1/3, 0), X* = (4/9, 5/9, 0). Таким образом, сторона В должна с вероятностью 2/3 защищать 1-й объект/ с вероятностью 1/3— 2-й объект и не защищать 3;й объект вовсе, а сторона А должна с ве- роятностью 4/9 атаковать 1-й объект, с вероятностью 5/9 — 2-й объект и не атаковать 3-й объект. На первый ^взгляд оптимальная стратегия игрока I выглядит стран- ной, так как она не рекомендует атаковать 3-й объект, который не защищается игроком II. Однако ничего уди- вительного здесь на. самом деле нет, так* как значение игры равно ценности незащищаемого объекта (v = b3 = = 1/3), и поэтому в результате применения своей опти- мальной стратегии игрок I гарантирует себе математиче- ское ожидание выигрыша, равное ценности 3-го объекта. В сущности этот объект как раз потому и це защищается, что нападающему невыгодно тратить на него усилия. При.мер 2.8 (распределение сил нападе- ния и средств защиты). Сторона А располагает к однотипными единицами, предназначенными для унич- тожения двух объектов, а сторона В,, имея г однотипных средств защиты, организует их оборону. Допустим, что уДары по объектам наносятся последовательно одной ата- кующей единицей за другой, каждая из которых с веро- ятностью р поражает любое средство защиты и уничто- жается с вероятностью (1 — р). При этом атакующая еди- ница достигает объекта и уничтожает его тогда, когда оказываются уничтоженными все средства защиты. Сто- рона А стремится так распределить атакующие единицы по объектам, чтобы максимизировать ущерб, наносимый стороне В, а сторона Z? — распределить средства защиты с расчетом минимизировать этот ущерб.
. ГЛАВА 2. ПРИЛОЖЕНИЯ - 87 Следовательно, интересы сторон прямо противополож- ны, и поэтому конфликт антагонистичен. Поскольку при этом множества распределяемы^ единиц сторон А и В конечны, математической моделью этого конфликта будет конечная антагонистическая игра Г=<я, у, Н), где а» == {(/q, &2) | к19 ,к2^ [О; к]} — целые неотрицательные числа и + к2 = к; у = {(гъ г2) | гх, г2 е [0, г]} — це-. лые неотрицательные числа и п + г2 = г. Функция выиг- рыша игры Г вычисляется по формуле ’ Н(х, р) = aP(kh п) + ЪР(к2, г2), / (2.42) где а и b — ценности объектов, а Р(Аг, г) — вероятность уничтожения объекта при условии, что его * атакуют к единиц , и защищают г единиц. Поскольку при нападении атакующая единица унич- , тожаётся средством защиты с вероятностью (1 — р), а с вероятностью р — его уничтожает, справедливо рекур- рентное соотношение. 4 Р(к, г) = (1 — р)Р(к - 1, г) + рР(к, г - 1), (2.43У причем Р(к, 0) = 1, Р(0, г) == 0. Принимая во внимание граничные условия, из равенства (2.43) можно вычислить вероятности Р(Аг, г) для любых к и Например, Р(1, г) = рг, Р(*, 1) = р + (1- р\р + (1 -р)2р Ъ.... + (1 - р)*-‘р, Р(2, 2Г= (1 - р)Р(1,- 2)+рР{2, 1) = рг(2С1-р) + 1Г. После того, как вычислены вероятности Р(Аг, г), функ- ция Н(х, у) вычисляется по формуле (2.42). Так, если а = Ь — 1, к = г « 2, то игру можно4 представить в виде табл. 2.6. 1 Анализ табл. 2.6 показывает, что матрица выигрышей имеет седловую точку (3.3), т. е. игроки должны поровну распределить атакующие единицы и средства защиты. В этом случае математическое ожидание ущерба будет равно 2р. Если игрок I отклонится от своей оптимальной стратегии, то математическое ожидание ущерба будет меньше 2р, а если отклонится игрок II, /го математиче- ское ожидание ущерба будет больше, чем 2р.
88 ЧАСТЬ I. КОНЕЧНЫЕ АНТАГОНИСТИЧЕСКИЕ' ИГРЫ Пример 2.9 (обоснование тактических приемов использования орудия и т*е**нич_е? ск их средств). Пусть сторона В (игрок <П) для укло- нения от самонаводящйхся торпед может применить у-е (/ = 1, 2, 3) средство гидроакустического противодействия (ГП'Д), а сторона А (игрок I)'— использовать в устройстве самонаведения i-e (i^»l’, 2; 3) помехозащитное устрой- ство. Будем считать, что помехозащитное устройство, I Таблица 2.6. Выигрыш игрока J , Стратегии игрока 1 Стратегия игрока II - - 1 | г 3 42,0) • | (0,2) _ . (1.1 >' » 1 - 2 ' 3- (2,0) (0,2)’. (1,1) 41—р)рЧ-р(р+ • +(1-р)р)* 1 X Р2+! . 1 / (1^/?)Н-р(р+ +(1^р)р) рЧ-1 - р+(1—р)р р+(1— р)р 2р - снижает эффективность средства гидроакустического про- тиводействия у до нуля, т./е. если* выборы сторон совпа- дут (г =/), то выигрыш каждого игрока равен нултд. В остальных, случаях будем полагать, что 1-е помехоза- щитное устройство «проигрывает» по двадцать единиц 2-м и Згм средствам ГПД,-2-е помехозащитное устройство «проигрывает» по десять единиц 1-м и 3-м средствам ГПД, а 3-е. помехозащитное устройство «проигрывает» по одной единице 1-м и;2-м средствам ГПД.‘Следовательно, матрица выигрышей игрока I - ’ : / - 0 — 20 — 20\ Н = I - ю о - io 1 \ т 1 — 1 ""о/ , Подобная структура матричной игры нам уже встре- чалась в примере 2.2. Как было установлено, в первую очередь необходимо проверить выполнение неравенства (2.5). Поскольку неравенство (2.5)/выполняется, значение игры равно v == —*lt а игрок I имеет чистую оптймаль- -
ГЛАВА 2» ПРИЛОЖЕНИЯ - >89 ную стратегию, X* = (0, О, l)j т. е.'.сторона А должна использовать 3-е помехозащитное устройство. Компоненты оптимальной стратегии игрока II должнй удовлетворять неравенствам (2.4). Легко установить, что компоненты векторов У* = (1/10, 9/10, 0) и У* - (19/20, 1/20, 0) удовлетворяют неравенствам (2.4) и являются крайними точками выпуклого множества^ определяемого этими не- равенствами. Поскольку каждую дочку выпуклого мно- жества можно представить как выпуклую комбинацию его крайних точек, игрок Д1 имеет бескопечное/мпоже- ство4 оптимальных стратегий (при решении примера 2.2 было показано, что всякая стратегия второго. игрока, удовлетворяющая неравенствам (2.4), является оптималь- ной). ’Игрок II может применять любую оптимальную . стратегию. Если игрок 1 -применяет X*, то игрок II про- игрывает ,в точности v. Однако, если игрок I будет дей- ствовать неоптимальным образом, то есть будет приме- нять неоптимальную Стратегию, то игрок II, выбрав некоторую црнкретную оптимальную стратегию, может, проиграть меньше, чем и. ~ " Стратегию. У*, которая использует возможность ошиб- ки со 'огороды первого игрека, называют предпочтитель- ной'оптимальной стратегией. Систематический метод для выбора предпочтительной стратегии излагается в [3]. Ни- же рассматривается выбор7 предпочтительной -стратегии У*- для условий данного примера. ^ * _ _ /ПустьГ = У*, J/>, где х == (Г, 3), У* = {У*, У*}. В ситуации (i, У*),* где У* равно У* или/У*, функ- х 'ция выигрыша этой игры равна, математическому ожида- нию выигрыша первого игрока в первоначальной игре, т. е. У*>. . ' - Так, значение функции выигрыша в ситуации (f = 1, У* = (1/10, 9/10, tf)) вычисляется следующим образом: 7 Я(1, У*)~^ * \ Вычислив значение функции выигрыша во всех ситуа- циях; запишем выигрыши гйгрока I в виде табл. 2.7. - Очевидно, что игрок I ошибется, если он выберет .ртра- тептю i, длд которой его выигрыш в ситуации, (f, У*) или (Z, У*) меньше и. Как'видно из табл. 2.7, игрок I будет . ошибаться, выбирая 1-ю или 2-ю свои, чистые стратегии.
90 ЧАСТЬ I. КОНЕЧНЫЕ- АНТАГОНИСТИЧЕСКИЕ ИГРЫ Исключим из табл. 2.7 те чистые стратегии игрока I, применяя которые, игрок I получит математическое ожи- дание выигрыша, равное v при всех стратегиях игрока II. В результате получим матрицу выигрышей /-18 -1 \ 1 ~ V — 1 -19/2/ Тогда игроку^!! с целью максимального использования Таблица 2.7. Выигрыш игрока! ' i У*=(1/10, 9/10,0) У*=(19/20, 1/20,0) 1 . - 18 -1 2 — 1 -19/2 3 -1 -1 ошибок игрока Г надо применять в игре, заданной мат- рицей выигрышей оптимальную смешанную страте- гию. По формулам (1.77) и (1.78) находим У* = (1/3, 2/3), р(Я£) « - 20/3, где У*—оптимальная стратегия-игрока II в игре ^мат- рицей Яь а у(Я1) — значение этой игры.^ Применение оптимальной стратегии У* эквивалентно применению некоторой оптимальной стратегии первона- чальной игры. Эта_стратегия является выпуклой комби- нацией стратегий У* и У*, веса которых определяются согласно найденной стратегии У*, т. е. уо = т*Г + (1-пГ)Г*= ' - . = 2L(_L Л 0U —— оУ=(— JL о) 3 И0Л 10’ 3 \20’ 20’ J \ 3 ’ 3 ’ г Таким образом, сторона А должна цспользовать в уст- ройствах самонаведения торпед 3-е помехозащитное уст- ройство; а сторона В — с вероятностями 2/3 и 1/3 при- менять 1-е й 2-е средства ГПД,, что гарантирует стороне А выигрыш v = -4. Если же сторона А будет использо- вать 1-е или 2-е помехозащитное устройство, то ее вы- игрыш окажется равным — 20/3.
ГЛАВА 2. ПРИЛОЖЕНИЯ ‘ ~91 Пример 2.10 (теоретико-игровая модель постановки и траления одной неконтакт- ной мины). Одним из эффективных средств борьбы на море являются донные неконтактные мины, которые взрываются от воздействия физических полей проходяще- го корабля. Траление,этих мин заключается в том, что тральщик с помощью трала в широкой полосе воздейству- ет на мины, которые взрываются^ ер тем самым обеспечи- вается безопасность проходящих по, фарватеру кораблей после траления. В свою очередь донные мины оборудуют- ся приборами кратности, которыёчпредотвращают взрыв мины до установленного числа воздействий физических полей на дежурный канал неконтактного взрывателя ми- ны. Если мина, имея прибор кратности, взрывается после f-го воздействия, то говорят, что она поставлена «на кратность i». Пусть в условиях сложившейся оперативно-тактиче- ской обстановки максимальное число тралений фарватера, по которому должен пройти корабль стороны В, равно п, а мина стороны А » может быть поставлена на кратность j = 0, 1, . .Обозначим через вероятность того, что после ] тралений корабль подорвется на мине, поставлен- ной на кратность L Величины рц определяются либо на. основании теоретических расчетов, либо/ если это возмож- но, в результате статистической информации, а число п предполагается известным. Примем ^торону А за игрока I, который, выбирает чистую стратегию i е х = {0, 1, v.. ..., тп}, а сторону Z? — за игрока II, который выбирает чистую стратегию / е у = {0, 1, ..., и}. Тогда минно- тральная ситуация, которая складывается на фарватере при проходе одйого корабля и поставленной одной мине, моделируется конечной антагонистической игрой о функ- цией выигрыша игрока I, заданной матрицей Н = HAJI,' где Иц = pi}. Рассмотренная ситуация носит скорее теоретический характер, так как обычно ставится негодна, a N мин/ Этот более реальный случай будет "рассмотрен в гл. 4. Здесь же мы ограничимся случаем, когда рц= 0, j ¥= у, и Ра == р_. Если п > тп, то /торой игрок имеет листую опти- мальную стратегию /* = п, а значение игры равно нулю. При т стратегий первого игрока i = п + 1, п + 2, ...
92 " ЧАСТЬ I. КОНЕЧНЫЕ АНТАГОНИСТИЧЕСКИЕ ИГРЫ ..., тп+1 демпфируются каждой из стратегий i С п. По- этому согласно^ теореме 1.10 всякое решение йодыгры, заданной матрицей (i, / ~ 0, 1, ..п + 1), hi} = — 0 (iV8/), hn = p, является решением первоначальной игры. Выпишем матрицу z (Р 0 ... 0\ . 0 р ... 0 п , О О ... р/ - Очевидно, что если игрок I применяет стратегию X* = = (l/(n + 1), 1/(лг +1), ..., l/(n+ 1)), то математическое ожидание его выигрыша будет равно 1). Если вто- рой игрок применяет стратегию У* = (1/(п + 1), 1/(п + +1), ..., 1/(п + 1)), то математическое ожидание выигры- ша игрока I также будет равно pKh + 1). Следовательно^ стратегии Х*хи У* являются оптимальными, а р = р/(п + + 1К Стратегия X* игрока I соответствует- в первона- чальной игре стратегии X* = Qh, £2» • • •> iX+i)? где = = 1/(п + 1) дляЙпи ^*= .О для i > п. Таким образом, при п>т сторона В должна до при- хода корабля выполнить не менее т + 1 тралений, в ре-„ зультаТё чего вероятность подрыва корабля на мине будет равна нулю. Если же время траления ограничено так, что т, то сторона В с вероятностью 1/(п+ 1) производит до прихода корабля / тралений, а сторона А с вероят* ностыо l/(n + 1) ставит мину на кратность i = 0, 1, ... ..., п). В. этом случае вёроятнбеть подрыва корабля на мине будет равна р/(п + 1). Пример 2.11 (теоретико-игровая модель наступа'те ль но г о боя). Авианосной ударное со- единение (АУС) «зеленых» планирует панесепиё ударов по авианосному ударному соединению (АУС) «синих» в пе- риод Г, который состоит из п • единиц времени/ Удары, начиная’ с' момента г, наносятся в каждую последующую единицу времени г + 1, i + 2, ..., п. В свою очередь, АУС «синих» теля защиты кораблей предполагает в тот же пе- риод Т использовать средства радиоэлектронного проти- водействия (РЭП), которые после постановки' в мрмент j создают противодействие в .каждый последующий, момент времени 7 +1, 7+ 2, ..., п без изменения своих харак-. теристпк. Допустим, что .средства. РЭП, поставленные до
ГЛАВА 2. ПРИЛОЖЕНИЯ 93 начала нанесения ударов, обнаруживаются средствами доразведки,, в результате чего эффективность этих средств снижается до нуля.-С другой.стороны, если удары нано- сятся рацее постановки средств РЭП, то эти средства снижают эффективность оружия до нуля. Кроме того, бу- дем считать, что запланированное время нанесения ударов, и постановки средств РЭП не может быть изменено, ал удацы Наносятся с одинаковой интенсивностью. Пусть математическое -ожидание, числа уничтоженных кораблей «синих» в единицу' времени , при нанесении ударов без противодействия-средств РЭП равно с (в усло- виях противодействия будет с = 0). Кроме того, примем, что если удары' наносятся одновременно с использованием средств РЭП, то математическое ожидание числа уничто- женных «кораблей «ёиних» в единицу времени равно с/2 и остается постояпнылГдля соответствующего отрезка пе- риода Т\ Допустим теперь, что i < j, т. е. «зеленые» нано- сят удары без ? противодействия средств ТРЭП в течение единиц времени, а через f-rU единиц средства РЭП сведут эффективность, последующих. ударов к нулю. Следовательно, математическое ожидание числа унич- тоженных кораблей «синих» за период , Z будет равно с(у—0. Если «зеленые» начнут наносить удары' после/ис- пользования «синими» средств РЭП (i1> /), до эффектив- ность средств РЭП будет равна нулю, а математическое ожидание числа уничтоженных кораблей «синих» за пе- риод Т окажется равным с(п—i + f). Наконец, если уда- *ры наносятся одновременно с использованием средств РЭП , (г = /), то математическое >ожидапие числа уничто- женных кораблей «синих» за период Т будет равно г + 1)/2. «Зеленые» выбирают г-кк единицу времени начала ударов, стремясь максимизировать математическое ожидание числа уничтоженных кораблей «синих» за пе- риод Г, а «синие», выбирая /-ю единицу времени начала использования средств РЭПГ преследуют прямо противо- положную цель — минимизируют, математическое ожида- ние числа уничтбженных кораблей за период Г*). ♦) Описанная, конфликтная ситуация довольно, просто интер- претируется как наступательный бой, так как под средствами РЭП можно понимать л!рбой комплекс оружия и. технических средств, а также маневр, использование которого снижает эффективность противника (в данном случае ударов АУС «зеленых»). .
94 'ЧАСТЬ I. КОНЕЧНЫЕ АНТАГОНИСТИЧЕСКИЕ ИГРЫ . Следовательно, математическая модель данной ситуа- ции—конечная антагонистическая игра Г = <#, у, Я>, где ж={1, 2, ..., п} — множество чистых стратегий игро- ка I (АУС «зеленых»), у =={1, 2, п} — множество чи- стых стратегий игрока II, а функция выигрыша игрока I на основании принятых допущений о боевых возможно- стях задается следующим образом: с(/ —0 . Для *<Л #(U) = 4 (п — i + 1) Для * = /, (2.44) с (и — г 4-1) ' дял <>/. ( Аналогичная игра была построена в примере 2.5. Таким образом, мы еще раз видим, как разные по 1 своей природе конфликты приводят к одинаковым теоре- тико-игровым моделям, т. е. одна и та же закоЦомерность действует в различных условиях, и поэтому теоретико- игровые модели таких конфликтов совпадают. Теперь решим эту игру в общем виде. Разделив функ- цию выигрыша на с > 0, что не изменяет множества оп- тимальных стратегий, а значение игры изменяется про- . порционально 1/с в силу теоремы 1.11, запишем игру в матричной форме: • ч * /п/2 2 —2 п — 1\ I п— 1 (п — 1)/2 1 ... п — 3 п — 2 1 Н = ............................... 12 2 2 ... 1 1 I \1 \ 1 1 ... 1 . 1/2 / • Как легко видеть, при п > 2 вторая стратегия игро- ка II доминирует первую. В оставшейся матрице равно- вероятная смесь первой и третьей стратегий игрока I доминирует вторую стратегию. Поэтому согласно теоре- мам 1.10 и 1.11 всякое решение игры <#\2, у\1, Н) яв- ляется решением игры <ж, у,НУ- Заметим также, что элементы последней строки мат- рицы Н не превосходят элементов предпоследней, а в ос- тавшейся матрице элементы последнего столбца не мень- ше элементов предпоследнего. Это. значит (согласно. тео- ремам 1.10 и 1.11), что игроки:'имеют оптимальные стратегии, в которых n-я строка и n-й столбец участвуют
ГЛАВА 2. ПРИЛОЖЕНИЯ ‘ 95 с нулевыми вероятностями. Можно также увидеть, что после этой процедуры, при достаточно большом п, (п—1)-я стратегия игрока I доминируется равновероятной’выпук- лой комбинацией первой и третьей строк матрицы Н. После ее отбрасывания (п —1)-я стратегия игрока II до- минируется (п — 2)-й стратегией и т. д. Это делает прав- доподобным предположение о том, что игрок I имеет сме- шанную оптимальную стратегию, в которой с положи- тельными вероятностями выбираются чистые стратегии 1; 3, 4, ..., к + 1, а игрок II — оптимальную смешанную стратегию, использующую с положительными вероятно- стями чистые стратегии 2, 3, 4, ..., к +1, где к — неко- торое положительное число. Кстати, пример 1.3, разоб- ранный в гл. 1, не! противоречит этому предположению. Если это предположение верно (а, как окажется далее, так оно и есть), то согласно теореме 1.8 решение игры (X*, У*, Ь) удовлетворяет.системе уравнений = 7=2,3,^...^ + ^ к+1 ’ i=3 H(t, У) = v,- i = 1, 3 4, .. +1, к+1. 2 w = i- _ 5=2 Решим относительно Y и v систему (2.46). Очевидно, что она эквивалентна системе уравнений , к+1 ' 3=2 = v-(n — i + l)l i = li31 ,..лк + 1£ к+1 . ' Snj = 1>; , , или, в более подробной записи, —(п — 1)г|2 — (п— 2)г1з — ... — (n — AOris+i = V — п, —1/2(и — 2)г|? —... — (п — &)ть+1 = v — (п — 2), —1/2(п — к + l)f]s — (п — &) = v — (п — к + 1), —1/2(п —/с)г]А+1 = р — (п —/с). (2.45) (2-46)
96 ..ЧАСТЬ I. КОНЕЧНЫЕ АНТАГОНИСТИЧЕСКИЕ ИГРЫ Как легко видеть, эта система уравнений имеет, един- ственное решение. Находя последовательно т)А+ь z £+1 ..., T]z и учитывая равенство 2 W = 1, читатель, 7=2 ' ведя вычисления, может убедиться в том, что V = Qk (2 (п - к) Фй + 20^- (2 [4] - *) ГП’ n*, произ- (2.47) где - №/2] фА = 2! (^— к + 2г — 2)”1 (п ~ к+ 21—. I)”1 i=l ' ' ’ • ' ' [Л/2] ' ’ . . ©А = 2 (п - к + 2Г- 1Г1, . (?л= 2ФН 1 1 п — 1 а стратегия У*, удовлетворяющая системе уравнений (2.46), определена равенствами Лг = Л? - z2 — (п — /г — гл) . ---'--------к четно, , 1 + (п — к —.и) 7 —5—:—-л-----к нечетно; 2 (п — к— v) j —7Ъ_ г > —7 нечетно, 2 (!-(«-*-и , . ' (2-48*) ----г---г-г~7--» * — 7 четно, . (2.48) л — / -h j 7 - 3, 4, fc+i Так как 2 Э—2 * — 1,то для того .чтобы вектор У* опре- ' делял смешанную стратегию игрока II, необходимо и достаточно выполнение неравенств т]; 0 (/ = 2,3,... ...,fc + lb а для этого, как следует из равенств. (2.48), и (2.48*), ~ необходимо и достаточно выполнение нера- венств * - n-.t-p>0, (2.49) 1-(и-7с —р)>0. (2.50)' :
. <\JIABA 2. ПРИЛОЖЕНИЯ -97 Таким образом, если наше предположение верно, то число к должно удовлетворять неравенствам (2.49) и (2.50), в которых число v определено равенством 42.47). Далее мы докажем, что существует единственное ft, удовлетворяющее неравенствам (2Г.49) и (2.50). Пусть число к удовлетворяет этим неравенствам. Решим теперь систему уравнений Н(Х, 2)-Я(Х,7) = 0, 7 = 2;, 3, Я(Х,& + !)=< ' ' й+1 <—3 или, в более подробной записи, -^+4-(П-2)^ . ; =0, -2|i+ ,.(п-ЗНз + -1-(п + 3Н4. = 0, — (к — 1) 4- (п — к) 58 + ... + — (п — к) 5^+1 =* 0, «Г *Bi+. (* — 12)ё3+ ... + — (га — ку^ь+ъ^», Bi + В8 + • • • + Bft+i = !• Находя последовательно £3, В*, - -Bh+i как функции от li, а затем подставляя их в последнее равенство, получим решение системы (2.45): z ' . C = 2O2(?ft, . (2.51) Заметим, что X* является единственным решением си- стемы (2.45). Однако нам еше остается проверить равен- ство, правая часть которого равн^ р. Имеем Н(Х*, /с 4-1)== ' = к£ + (к - 2) 5; + (к - 3) Ь* + Й + 4- = б! 7 Г. Н. Дю бин, В. Р, Суздаль
$5 '98 ЧАСТЬ I. КОНЕЧНЫЕ АНТАГОНИСТИЧЕСКИЕ ИГРЫ* , А = + £з + (£з + £4) + f • • + 2 + ~2~ (п — ^A+i ~ i=3 (Л-1 \ ’ \ ^Г1+2^Ф1 + (п-к)(Фк--Фк_1) =р. 1=2 J Эти равенства следуют из формул 1 п-^1 ’ ®i+i 7 1—2 Фь-Фь-, ___№ ^)___। О(Т) (п— к) {п — ly справедливость которых читатель может легко установить . простым подсчетом с помощью -равенства (2.47). Таким образом, если выполнены неравенства (2.49) и (2.50), то системы уравнений (2.45) и (2.46) имеют единственное решение, определяемое равенствами (2.47), (2.48), (2.48*) • и (2.51).' , х . Заметим теперь, что - ’ ъ-к-р.= г-и-А-; где . • . - ' А Л — 20г, I четно, . , -----; — 2©ь I нечетно. \п — 1 ° • Легко видеть, что Ч',-Т (2.52) 2Ф^1-1/(п-1) т. ,e. последовательность Ч^ убывает строго монотонно. При п > к имеем 4%^ О, 4rn-i < 0. Поэтому, существует единственное А, при котором 4\ > 0, Ч\+1 < 0. В силу равенств (2.52) при этом к будут выполняться неравен- ства (2.49) и* (2.50). Строгая монотонность последователь? ности Yi их равенство ($.52) гарантируют единствен- ность числа к, удовлетворяющего неравенствам (2.49) и (2.50). ' - Нам остается теперь показать, что тройка.(X*, У*, р), , определяемая равенствами (2.47), (2.48), (2.48*) и (2.51), является решением игры Г = у> Н)- Для этого до-
ГЛАВА 2. ИРЙЛОЯШЙИЯ 99 статочно проверить выполнение неравенств ЖХ*, 7)>w, / = Н1; к+1, .... п, На, Y*) v, _ i = k + 2, к +3, ..., п. (2’53) Так как • H(i' к+ 2).^ H(i, j),- . i=l, 3, ..‘,Л+1; j>k + 2, нас + 2,/)>на,j), / = 2,3,...,к + 1; i>к-t2, то справедливы неравенства . HIX*, к + 2) С ЖХ*', /), 7 >* + 2, . ' . Н(к + 2, Y*)> Ha- .Y*), i>k + 2._ ' ' ' ' Поэтому достаточно установить справедливость неравенств (2.53) лищъ при i — к + 2, / = к + 2. В силу того, что Н(Х*, к +.1) — V, неравенство ЖХ*, k + 2)^v эквива- лентно неравенству Н (X*, к + 2)-Н {Х*\ к + 1) = 1 - (п - к) £+1 0. Следующие преобразования при четном к доказывают , это неравенство: ~ , 1 ~4 <" ~ к} = !-(«- fc) Q* (Ф* - Фл«) = . = Qh [2Ф„ + - (н - *) (ФЙ - Фй_г)].в. = r4--2(n-fc-l)<I>J(2S = <2/|^n-2(n-\ ' — к~*>— *)(«- 4-+ 1) + (n —fr + 2) (л —Л + 3) + • ” • • • + ел-4 - <? -к * • X- (_____________h_______________h • •. \(n — к~ 1,(" — ~~к)1п ~ *+ 1) ’ • • • + (п — 2) (л — 1))] ~ — 1 7»
100 ЧАСТЬ 1. КОНЕЧНЫЕ АНТАГОНИСТИЧЕСКИЕ ИГРЫ Г % Следовательно, Я(Х*? fc + 2)>n. чЧто касается нера- венства. Н(к + 2» Y♦) С у, то применяя стратегию под но- мером к 4- 2 против стратегии У*, игрок 1 получит вы- игрыш п — к—1, который меньше и в силу неравенства (2.50)._Таким образом, тройка (X*, У*, v) является реше- нием игры Решим численный пример, приняв п — 6. Здесь .« -1/6, 02«1/5, 0,«5/ 12, ^«7/15, Ч\«3/5 и iV,»—1/30. Следовательно, к « 2.^ Далее найдем Ф2 =» « 1/20, Q2 = 10/3, у-2, r£=0, ih 1, ёГ= '2/3~ ёз = 1/3. Таким образом, X* = (2/3, 0, 1/3, 0, 0, 0), У* ~ (0, 0, 1, 0, 0, 0), и —2. В содержательной терминологии примера 2.10 тройка (X*, УД и) означает, что «зеленые» с вероятностями 2/3 в 1/3 начинают нанесение ударов соответственно в 1-ю и 3-ю единицы времени, а «синие» используют средства РЭП в 3-ю единицу времени. В этом случае математиче- ское ожидание числа уничтоженных кораблей «синих» будет равно 2с, ' х § 2.3. Другие приложения Теоретико-игровой подход в экономике и военном де- ле наиболее естествен, так как теория игр как научная дисциплина была специально создана для формализации содержательных моделей экономической науки, а пред- мет военной науки конфликтен по существу. Однако в равной степени4 теория конечных антагонистических игр может быть использована для анализа соответствующих конфликтов из других областей человеческой деятельно- сти. Так, прозрачны спортивные приложения этой теории в реален теоретико-игровой аспект правовых конфлик- тов. Например, как антагонистический конфликт можно рассматривать .противоречие между сторонами в судеб- ном процессе (истцом в ответчиком или обвинением и защитой). Для медицины, техники и отчасти прогности- ки довольно характерным является наличие неопреде- ленных факторов, ято позволяет принятие решений трактовать как конфликт с природой и строить соответ- ствующие «игры против природы», если выполняются условия 1—4, сформулированные в начале главы. Воз- можно приложение теории конечных антагонистических
ГЛАЙА 2 ЦРЙЛОЖЕЙйЦ Ml игр к проблемам передачи информации. Наконец,, прило- жения этой теории занимают определенное место и в биологии. Поведение представителей живой природы 'в биологических конфликтах (таких как, например, в кон- фликтах эволюции) не лишено своеобразной «разумно- сти», что обусловливает адекватность теоретико-игровых конструкций некоторым явлениям живой природы. Сле- дующий пример иллюстрирует получение нетривиальных результатов, которые в противном случае остались бы возможно за рамками описательных моделей биологиче- ской науки. , , Пример 2.12 (аспекты эволюционной тео- рии и игры) (691. Мир живых существ непрерывно развивается, и для отражения разнообразия форм жиз- ни с учетом саморегуляции и некоторой целенаправлен- ной активности живых существ, а также сложности структуры их поведения возникает основание для постро- ения теоретико-игровой модели биологических ситуаций, одна из которых рассматривается в качестве данного примера. Предположим, что на ограниченной территории оби- тают два вида, I и II. Первый вид имеет пг фенотипов, второй п. Биомассу всех отдельных экземпляров. фено- типа I вида I будем обозначать через b\9 а биомассу фенотипа / вида II —через Мы рассматриваем такую ситуацию, когда количество ресурсов территории, па ко- торой/проживают виды I и II, хватает лишь на то, что- бы сохранить биомассу R. Мы считаем также, что в мо- мент времени t«0 общая биомасса как раз и равна Я. Пусть — количество ресурсов, которое может по- требить единица биомассы фенотипа i вида I, а г)1— количество ресурсов, которое может потребить единица биомассы фенотипа / вида II. Через будем обозна- чать эффективность преобразования ресурсов, которые потребляет фенотип i вида I, в новую биомассу, а через у)1 — аналогичную характеристику фенотипа / вида II, (O^Yf, Естественная плодовитость единицы био- массы фенотипа i вида I равна а плодовитость еди- ницы биомассы фенотипа^ / вида II равна гр* Мы пред- полагаем также, что в условиях ^ограниченности ресурсов
102 ЧАСТЬ fc КОЙЕЧЙЫЁ АЙТАЁОЙЙСТИЧЕСЙЙЁ tifi>bi J биомасса каждого фенотипа пропорциональна биомассе, . которую он имел бы, если бы не было ограничений на рёсурсыЛМы также .предполагаем, что оба вида выжива- ют. Задача состоит в -том, чтобы выяснить, какие из фе- нотипов выживают в процессе эволюции. Рассмотрим антагонистическую- игру* в которой игро- ками 1 и II являются виды I и II, а их чистыми стра- тегиями—выбор своих фенотипов. Выигрыш, вида I, ес- ли он выбрал фенотип i, а вид II — фенотип /, положим равным Н} (*’ 7) = -ГТгАгпЛТ- (2.54) Число J7i(f,/) по смыслу является нормированным коэфЛ фициентом прироста единицы биомассы фенотипа i. Нор- мированный коэффициент прироста биомассы фенотипа 7 равен . . - Hutt, 7)- т-ТТЛ! u if , (2.55) Очевидно, что для любой ситуации (i, f) имеет место равенство Ял(/, /) + Hntt, ]) = 1. Вследствие этого, мини- мизируя коэффициенты прироста фенотипов вида I, -иг- рок Д1 максимизирует коэффициенты прироста фепоти-- 'нов вида II. Поэтому рассматриваемая игра моделирует ситуацию, в которой каждый из видов стремится макси- мизировать коэффициенты прироста своих фенотипов. Найдем оптимальные стратегии игроков. Для этого покажем сначала, что . max = max (2.56) f * i Действительно, если равенство (2.5В) не выполнено (ска- жем, левая часть меньше правой), тр ПГГЛТТГ 1 f zn, / (2.57) г-v?cU А) . где /’о — индекс, при котором достигается максимум в правой части равенства' (2.56). Учитывая, чю масса фе-
ГЛАВА 2. ПРИЛОЖЕНИЯ <03 . вотипа г пропорциональна его массе, когда нет ограян* чений на: ресурсы, а общая биомасса равна Я, получим 4(* + 1)----------(2.58) 2 4 <о 444 + 2 4J 4I4I4I. {-*1 ?—1 г где 4(0, 6? (0 — биомассы фенотипов 1 п 7 в времени t. Из равенства (2.58) следует, что Я4<°) (444)‘: момент М (« + 1) = - (2.59) т п - * 2 4«»Ж4У. + 2 4«» (,*ад‘ ИЛИ bi{t 4-1) = -у—-112----------- р 24(0)(^)+241(0)(j^) h±f k 444 J , \ 444 J . ; , (2.60) Вследствие неравепствах(2.57) при каждом l хотя бы од* но из чисел в числителе правой части равенства (2/60) стремится к бесконечности. Таким образом, &{(£)-> 0 при t -* ». Цо мы предположили, что оба вида выживают, тог« да хотя бы для одного i нуль не является пределом Последнее рассуждение попутно доказывает, что выжи* вают лишь те фенотипы i* и /*, которые реализуют ра* венство (2.56). х Покажем, что каждая такая пара стратегий в игре, определяемой матрицей выигрышей Нь является, парой оптимальных стратегий. Действиюльно, так как iii —. ~ n4ci [ | ; 1I , r<*Yi*cl* то справедливо неравенство , 414441+444 < 444 _Hjr«. I „Г ;J J- J ‘ _ r^*r^4cj« ’T rpri*'|s
104 ЧАСТЬ I. КОНЕЧНЫЕ АНТАГОНИСТИЧЕСКИЕ ИГРЫ из которого следует, что J J J -IJJ Г1 J » II II 11 I I 1.11 11 II А т. е. . 42.61) Аналогично доказывается, что /7n(i*, /). (2.62) Принимая во внимание, что Н1 + Нц = И1 из нера- венств (2.61) и (2.62) получим Таким образом, мы доказали, что i* и /♦ являются парой чистых оптимальных стратегий при условии, что виды в качестве чистых стратегий выбирают фенотипы, а функция выигрыша каждого из видов определяется нормированными коэффициентами прироста биомассы. Оптимальными стратегиями в этой игре являются выборы тех фенотипов, которые выживают в процессе эволюции.
• ' ~ ЧАСТЬ 11 БЕСКОНЕЧНЫЕ АНТАГОНИСТИЧЕСКИЕ ИГРЫ , Г л а- в а 3 4 ОСНОВЫ ТЕОРИИ § 3.1. Бесконечные игры 1. Природа и структура бесконечных игр. Часто в кон- фликтных ситуациях стороны, преследующие прямо про- тивоположные цели, выбирают значения некоторых не- прерывно изменяющихся* параметров (времени, цены, вё- са, расстояний, количества того или иного ресурса и т. п.). Обычно в этом случае множество допустимых для выбо- ра значений параметра является бесконечным (счетным или континуумом), и поэтому теоретико-игровые. моделц таких конфликтов называются бесконечными антагони- стическими играми. Бесконечная антагонистическая игра, так же как и конечная, задается тройкой Г = <#, у, Н}, где х — мно- жество чистых стратегий игрока I, у— множество чистых стратегий игрока II, Я —функция выигрыша. Единст- венное отличие бесконечных антагонистических игр от конечных состоит в том, что в бесконечной игре хотя бы один из игроков имеет бесконечное множество чистых стратегий*). Поэтому в этих играх игроки могут следо- вать тем же принципам 'оптимальности, которые были рассмотрены ₽ предыдущей главе. Однако эти принципы здесь реализуются уже не всегда. Первая трудность за- ключается в конструировании смешанного расширения игры. 2., Смешанное расширение бесконечной антагонистиче- ской игры. В первой главе уже говорилось, что игроки могут расширять стратегические возможности, - выбирая *) Заметим, впрочем, что если хотя бы один из игроков имеет конечное число стратегий, то исследование игры существенно уп- рощается.
106 <1ас1'Ь 11 БЁСКоПЕЧЙЫЕ АПТАГОЙЙСТИЧЁСЙПЁ ИГРЫ свои стратегии согласно вероятностным распределениям (вероятностным мерам) на множествах их чистых стра- тегий. В бесконечном случае поступают таким же обра- зом. Однако мер бесконечного множества, для которых измеримы все подмножества бесконечно^. множества, сравнительно мало: это меры, сосредоточенные на счетных множествах точек. Используя лишь такие меры, игроки обедняют свои возможности. Поэтому обычно используют менее «обширные» наборы подмножеств, с помощью ко- торых определяются вероятностные меры. Но в этом слу- чае не* всякая, функция Н на яX# окажется измеримой, и вследствие этого нельзя будет .определить математиче-. ское ожидание выигрыша. Тем^самым нельзя будетопре- делить понятия равновесия, значения игры и оптималь- ных стратёгий. Однако; если множества х и у и функция Я достаточно «хороши», то все эти понятия определимы и реализуемы. . В дальнейшем мы будем считать множества х и у ъъ- парабельными метрическими компактами (чаще всего они будут подмножествами евклидовых пространств), а функцию Н — либо * непрерывной,либо кусочно-непре- рывной. . . - _ Определение 3.1. Множество вероятностных мер X, заданных на (ьалгебре борелевских множеств прост- ранства ж, называется множеством смешанных ' страте- гии первого игрока. Аналогично множество вероятност- ных • мер У, заданных на* о-алгебре борелевских мно- жеств Пространства у, называется множеством смецьан- ных стратегий второго игрока. ‘ ' - , • ' Определение, 3.2. Тройка Г = <Х, У, Д>, Где Н(Х, У),Х еХ. УеУ — математическое ожидание вы- игрыша игрока I, равное . ’ H(XtY) =• J J Н (х, у) dx (х)ИУ_(у), к v называется смешанным расширением бесконечной анта-' гонистич<еской игры. - Если игроки -применяют смешанные стратегии X и У, то как и в конечном случае, игра разыгрывается по следующей ,схеме: сначала согласно вероятностным ме- рам X и У случайно и независимо выбирается по точке
ГЛАВА 3. ОСНОВЫ ТЕОРИИ 107 х&х, у €= Уч после чего первый игрок выигрывает у вто- рого величину Я(.г, у). Пара (X, Y) называется ситуаци- ей в; смешанных стратегиях. 3. Значение бесконечной антагонистической игры, максимине ые и минимаксные стратегии, ситуации 8-рав- новесия. Введем следующее определение^ Определение 3.3. Если ' . ' sup inf’Я (X, У) = irif sup Я (X, У), (3.1) * Xf=X Y^Y Y&Y ХеХ то |Общее значение этих двух величин называется значе- нием игры.: Как видно из формулы (ЗЛ), это определение совпа- дает с определением значения для конечных антагони- стических игр. Действительно, при конечных множествах х..и у функция'Жх, у) будет непрерывна на.произведе- нии двух компактных множеств X и У, и поэтому вме- сто точной нижней границы можно писать минимум, а _ вместо, точной верхней границы — максимум.-В отличие от матричных игр, в которых значение всегда существу- ет, существуют бесконечные игры, не имеющие значения. Вопрос о-существовании значения игры в его полном объеме выходит за рамки этой книги. Читатель, желаю- щий познакомиться с ним более детально, может найти соответствующие теоремы в [40]. Здесь же .мы ‘наметим доказательство лишь для случая непрерывных функций. Предварительно введем следующее определение. Определение 3.4. Стратегия А * е X называется максиминной стратегией в игре Г, если >inf//(X*, У) = max inf Я (Хг У). J (3.2) Y , . X Y Стратегия У* е Y называется минимаксной страте-, гией в игре Г, если sup Я (X, У*) = min sup Я (X, У)>“ (3.3) X Y X < Z В бесконечных антагонистических играх максимин- ные и минимаксные стратегии существуют не всегда. Од- нако, если-а? и у— сепарабельные компакты и функция Я непрерывна на их произведении, то X и У будут , метрическими компактами в топологии слабой 'сходимо- сти мер, а Я(Х? Y) — непрерывной функцией на их про-
108 ЧАСТЬ II. БЕСКОНЕЧНЫЕ АНТАГОНИСТИЧЕСКИЕ ИГРЫ изведении. Так как па компакте непрерывная функция достигает своих точной верхней4 и точной нижней границ, а функции min/7(X, У) и шах ЖХ, У) в этом случае у 4 х > будут непрерывными, максимннная и минимаксные стра- тегии существует. Теорему 3.1. Игра Г = <ж, у, Н), где х, у — метри- , ческие сепарабельные компакты, а Н —непрерывная функция на их произведении, имеет значение. Доказательство. При доказательстве лемм 1.6 и 1.7 и теоремы 1.3 мы не использовали других свойств множеств X, У, кроме компактности, метризуемости (метризуемость. использовалась при доказательстве рав- номерной сходимости функций), непрерывности функции Н на XxY и ее линейности по каждой из переменных. Как известно, в условиях доказываемой теоремы в топо- логии слабой сходимости множества мер X и У будут , метрическими компактами, а функция Н — непрерывной и, очевидно, z линейной по каждой переменной. Поэтому нам остается только -заметитьЛ что доказательство теоре- мы 3.1 полностью совпадает с доказательством теоремы 1.3. Читатель может в этом убедиться, вернувшись к гл. ,1. Определение 3.5. Ситуация (X*, У*) называется ситуацией равновесия бесконечной анагонистической иг^ ры, если для любых X е X, Fg У выполняются нера- венства ' ' , ЖХ, У*)^ЖХ*, У*)<ЖХ*, У). (3.4) Как и в конечных антагонистических играх, ни од- ному из игроков не выгодно отклоняться ат ситуации равновесия. Неравенства (3.4) совпадают с неравенствами (1.50), если множества х и у конечны. Определение 3.6.. Стратегия игрока в бесконеч- ной антагонистической игре 'называется оптимальной, ес- ли существует стратегия другого игрока, в паре с кото- рой она образует ситуацию равновесия. Определения 3.5 и 3.6 аналогичны определениям 1.6 и 1.7. Тройку (X*, У*, и), где X* и У* — оптимальные стратегии игроков в игре Г, a v — ее значение, будем называть решением игры. Теорема 3.2. Если игра Г имеет значение, игро^ ки — оптимальные стратегии^<то множество всех ситуа-
ГЛАВА 3. ОСНОВЫ ТЕОРИИ 109 ций равновесия является прямым произведением множе* ства оптимальных стратегий первого игрока на множеств во оптимальных стратегий второго игрока; множество оптимальных стратегий первого игрока равно множеств ву его максиминных стратегий, а множество оптималь* ных стратегий второго игрока равно множеству его ми* нимаксных стратегий в игре Г; выигрыши во всех ситу* ациях равновесия одинаковы и равны значению игры. Доказательство аналогично доказательству теоремы 1.4. Теорема 3.2 показывает, что принципы максимина д равновесия для бесконечных ^антагонистических игр экви- валентны. Следствие. В условиях теоремы 3.1 каждый из игроков, имеет хотя бы одну оптимальную 'стратегию. Действительно, из теоремы 3.2 следует/что множест- во-оптимальных стратегий игрока I равно множеству максиминных стратегий, а игрока II — множеству мини- максных стратегий. Но в условиях теоремы 3.1 эти мно- жества непусты; Теорема 3.3. Если' игра Г = (ж, Ц* НУ имеет значе* ние, а игроки— оптимальные стратегии, то max ini Н (X, у) — о, Х ’ (3.5) min sup Н (х, Y) =з о\ 4 ' равенства « 4 inf Н (X*, у) = оЛ (3< у ' sup Н (х, Y*) =5 v , (3.7) ' X являются необходимыми и достаточными условиями on* тимальности стратегий X* и Y*. Док а з а те л ь с т в о. По определению о » sup inf Н (Xt У). (3.8) При фиксированной^ стратегии X множество ЖХ, У), Уе К, является выпуклой оболочкой чисел ЖХ, у\ Так как точная нижняя граница любого множества дей- ствительных чисел совпадает с точной нижней границей
110 ЧАСТЬ II. БЕСКОНЕЧНЫЕ АНТАГОНИСТИЧЕСКИЕ ИГРЫ *3 выпуклой оболочки этих чисел^ то inf Н\Х, Y) = mfH(X,y). (3.9) v у Пусть. X*; У* — оптимальные стратегии игроков. По теореме 3.2 выигрыш в ситуации (X*, У*) равен значе- нию игры. Вследствие этого и правого* пз неравенств (3.4) точная верхняя граница -в (3.8) достигается. Поэто- му символ sup можпо Заменить на Символ max. Прини- мая во внимание (3.9), получим - v = max inf Н (X, у). - . Ху Аналогично доказывается второе из равенств' (3.5). Далее, так как справедливо равенство, (3.9), из (3.6) и (3.7) следует, что X* и У* — соответственно максимип- ная^и минимаксная стратегии. Поэтому X* и Y* опти- мальны в силу теоремы 3.2. С 'другой сторойы, если <Х* и У* оптимальны, толю теореме 3.2 они являются соот- ветственно максиминной и минимаксной стратегиями и следовательно, должны согласно (3.9) удовлетворять ра-, ,венствам (З.бУи (3.7). Теорема доказана. Следствие. Если второй, игрок имеет чистую оп- тимальную стратегию, то ' min sup Н (х, у) = и. . ух.' Если первый игрок имеет чистую оптимальную страте- гию, то тйх-inf Н (х, у) = и.' X- у ' ~ О п р е д е_л е п и е 3.7. Игра Г1 называется непрерыв- но изоморфной игре Г, .если существуют непрерывные , в обе стороны взаимно однозначные отображения ср: х-*х1, г|>: у-*у\ для которых '• ^(у)) = Й(хГу). (3.10) Любое непрерывное взаимно однозначноё отображе- ние /:гг->я2 устанавливает взаимпц однозначное соответ- ствие между . борелевскими множествами топологиче- ских пространств z1 и z2 , и'поэтому устанавливает вза- имно однозначное соответствие между множествами
ГЛАВА 3. ОСЙОВЫ ТЕОРИЙ ' вероятностных мер Z1 и Z2 5 /(Z1)-^2,. 7 где / (Z1), Z1 е Z1 —'мера, определенная формулой / (Z1) (4) = Z1 (/~х (4)), А — любое борелевское подмноже- ство из г2. х ~ Теорема 3.4. Значение и оптимальные стратегии в игре Г1, изоморфной' игре Г, существуют тогда и только тогда, когда они существуют в игре Г. Оптимальные стратегии в игре Г1 определяются по формулам : ‘ х* = ф(х*), у* = $(у*), - ' где X* и Y* — оптимальные стратегии игроков в игре Г, а X* иТ*—оптимальные стратегии в игре Г1/ Доказательство. В силу равенства (3.10) ^ЯЧфСХ), $(У)) в ЖХ, У), , (3.11) причем отображения ср: X X1, ф: У-> У1’являются вза- имно однозначными. Поэтому значение, в играх Г и Г1'су- ществует или не существует одновременно. Равенство (3.11) доказывает также второе утверждение терремы, так как из пего следует, что неравенства (14) для стра- тегий X* и У* в игре Г эквивалентны аналогичным не- равенствам для стратегий X* и У* в игре Г1. Замечание. Так как любой сегмент можно взаим- но однозначно отобразить па сегмент [0, 1J, всякая игра Г =г (а?, у, НУ, в которой а? и у являются произвольными отрезками, изоморфна некоторой игре на единичном квадрате. ' Теорема 3.5. Если (X*; УД—и) — решение игры Г == (а?, у, Нут то (У*, ,ХД —и) — решение, игры —Гт = ~ (у,\Х, — Нту,где —Нт —функция на множестве yxxi определяемая равенством -НЧу, х) = -Н(х, у). . . Доказательство. Умножив неравенства (3.4) на —1, мы сразу получим неравенства - L -H4Y, Х*)^-Ж(У*, Я*)Ч;--ЛГ(У*, X), * ъ т. е. (У*, X*) являются ситуацией равновесия в игре
412 ЧАСТЬ II. БЕСКОНЕЧНЫЕ АНТАГОНИСТИЧЕСКИЕ ИГРЫ —Гг. Так как выигрыши во всех ситуациях равновесия равны значению игры, то w р(-Гт) = -ЯТ(У*, X*) = -ЖХ*, У*) = -и. Теорема доказана. * >. Определение 3.8. Пара (Х8, У8) называется ситу- ацией s-равновесия в игре Г = (ж, у, Н), если ЖХ, У8) - g ЖХ8, Уе) ЖХ8, У) + в. (3.12) Стратегии Х8 и У. называются s-оптималъными страте- гиями игроков. . Теорема 3.6. Игра Г имеет ситуацию s-равновесия для любого 8 > 0 в том и только в том случае, когда существует ее значение. ) Доказательство. Пусть для любого 8 существует ситуация e-равновесия (Х8,У8), для которой выполняются неравенства (3.12). Взяв точную верхнюю границу в ле- вом выражении этих неравенств и точную нижнюю гра- ницу в правом, получим sup Н (X, у:) - е < Н {xl, Y*e) < inf Н (Х8, У) + е X ' у х и тем более, 4 inf sup Н (X, У) - 8 < Н (Х8, У8) <sup inf Н (X, У) + 8. Y X X У Так как 8 можно взять сколь угодно малым, то inf sup Н (X, У)< sup iuf Н (X, У). У X . X Y t В'силу леммы 1.5 справедливо противоположное неравен* ство. Поэтому значение игры существует. Пусть теперь значение игры существует, т. е. > sup inf Я (X, У) = inf sup Н (X, У) => и. X * Y Y X Отсюда по определению точной верхней и точной нижней границ следует, что для любого s/2 существуют стратегии Х8 и У8, для которых sup Н (X, Уе) - е/2 < и < inf Н (Хе, У) + 8/2; X Y поэтому ЖХ, Уе)-8/2^ЖХе, У) + е/2. (3.13),
ГЛАВА 3. ОСЙОВЫ' ТЕОРИЙ 113 Полагая в этом неравенстве X = X., получаем ЖХе, Уе)^ЖХе, У) + е. ’ (3.14) Далее, подставив У= Уе в неравенство (3.13), придем к неравенству ЖХ, У8) - в ЖХ8, У8). ’ (3.15) Из неравенств (3.14) й (3.15) следуют неравенства (3.12). Теорема доказана.’ Замечание. В силу равенства (3.9) для выяснения, является «ли ситуация ситуацией равновесия или ситуаци- ей 8-равновесия, достаточно проверять неравенства (3.4) и (3.12) лишь для чистых стратегий игроков, т. е. прове- рять неравенства Н(х, У*) С ЖХ*, У*) С ЖХ*, у), (3.16) Н(х, У*)^Н(ХЛ, у) + е. -(3.17) § 3.2. Решение бесконечных антагонистических игр ^ 1. Свойства решений бесконечных антагонистических игр. Для бесконечных антагонистических игр верпы ана- логи теорем 1.8 — 1.13. Прежде чем их сформулировать, дадим некоторые определения. Эти Ъпределепия соответ- ствуют определениям 1.9—1.12. Определение 3.9. Стратегия X1 е X игрока I стро- го доминирует стратегию X2 X, если Я (X1, i/) >Я (X2, у), у<=у. (3.18) Стратегия X2 называется строго доминируемой. Определение 3.10. Стратегия У1 еУ игрока II строго доминирует стратегию У2^У, если Я (ж, У1) < Н (х, Y2), х^х. (3.19) Стратегия У2 называется строго доминируемой. Когда неравенства (3.18) не являются строгими, гово- рят, что стратегия X1 доминирует стратегию- X2. Стратегия X2 называется доминируемой. Аналогично, когда неравен- ства (3.19) не являются строгими, говорят, что стратегия У1 доминирует стратегию У2; стратегия У2 называется доминируемой. 8 Г, Н. Дюбкн, В. Г. Суздаль
114 часть it бесконечные антагонистические игры Определение 3.11. Спектром смешанной стратегии Z{Z = X, У) называется наименьшее замкнутое множество Z-мера которого равна единице. Легко видеть,"что определения 3.9 и 3.10 почти совпа- . дают с определениями 1.9 и 1.10л Отличие состоит лишь н том,- что смешанными стратегиями игроков являются меры не на конечных, а на бесконечных множествах. И только определение 3.11 имеет свою специфику: в спектр стратегии игрока бесконечной антагонистической игры могут входить точки с нулевой* мерой. Например, ' если множеством чистых^ стратегий одного из игроков яв- ’ ляется единичный интервал, я его стратегией — лебегова ; мера на этом интервале,, то все точки этого интервала имеют нулевую меру, хотя .спектр этой стратегии равен - ' всему замкнутому интервалу. С другой стороны, опредц- . ление З.И для конечных множеств# и у совпадает с оп- . ределевием 1.11: в дискретной топологии всякая точка .открыта и замкнута. J • Теперь сформулируем аналоги теорем 1.8-Г-1.13.•- Теофема 3.7. ЕслйУ~{х, у, Н}—бесконечная ан- тагонистичес^ая игра, имеющая решение (X*, У*, р), а функция у\ непрерывна по у, то справедливо ра- венство П(Х*У у°) — V для любой точки у\ содержащей- ся в спектре стратегии У*. . . ' Если функция Н(х, У*) непрерывна по х, то спра- ведливо равенство Н{х\ У^) = у для любой точки #°,- содержащейся в спектре стратегии X*. Доказательство. Так как по теореме 3.2 выигры- • шй во всёх^ ситуациях равновесия равны значению' иг- ры, то ' г . • „ ' , Я(Х*, y)> i>, у<=у. (3.20) Если теорема неверна, то 'ЖХ*, у0) > р. Вследствие не- прерывности функции ЖХ*, у) неравенство (3.20) являет- ся строгим в некоторой окрестности точки у0. Очевидно, * что У* — мера этой окрестности положительна, потому что у0 является точкой спектра стратегии У*. В силу этого и неравенств (3.20) получим I? = Н (X*, Y*) = $H (х5 ^*) dX* (х) < V, У . , • что абсурдно. Следовательно, ЖХ*, у0) = v. Равенство - - Ж#°, У*) «Р доказывается аналогично.
I ГЛАВА 3. ОСНОВЫ ТЕОРИИ 115 х Мы привели доказательство этой теоремы, чтобы от- метить специфику доказательства утверждений для беско- нечных антагонистических игр. Последующие теоремы мы приведем без доказательств— они мало чем отличаются от доказательств теорем 1.9—1.13. Теорема 3.8. Для бесконечной антагонистической игры, имеющей решение, ни одна строго доминируемая стратегия игрока не содержится в спектре его оптималь- ной стратегии. Теорема 3.9; Пусть Г=<ж, у ^НУ—бесконечная ан- тагонистическая игра, имеющая решение, а каждый эле- мент открытого множества х° ах доминируется некото- рой стратегией ' Х°, спектр которой не пересекается с #°. Тогда всякое решение игры Г1 = <яг\#°, у, Н) является решением игры Г. ' / Теорема 3.10. Пусть Г==<ж, у, И} —бесконечная антагонистическая игра, имеющая решение, а каждый эле- мент открытого множества yQ а у доминируется некоторой стратегией Y9, спектр которой не пересекается с ^°. Тогда всякое решение игры Г1 — <«r, у\у\ Н) является реше- нием игры Г. Т е о р ц м а 3.11. Если для открытого множества xQax выполнены условия теоремы 3.3, а для открытого .множе- ства yQay<— условия теоремы 3.4, то всякое решение -игры V2 —{х\х® ^у\у®, Н) является решением игры Г. Теорема 3-42. Тройка (X*, У*, и) является, решени- ем игры Г = <х, у, Ну тогда и только тогда, когда (X*, У|*, kv + a) есть решение игры Г1 = <ж, у,"кН -J- + а>, где а — любое вещественное число, к > 0. 2* Нахождение решений бесконечных антагонистиче- ских игр. Приближенные решения бесконечных антагони- стических игр можно находить, используя их аппроксима- ции матричными играми, для/решения которых применя- ются методы линейного программирования. Поступая по- добным образом, можно найти 8-оптимальные стратегии для любого 8 > 0. Для практических- цел ей этого обычно достаточно. Однако, если функция выигрыша бесконечной антаго- нистической игры имеет некоторые специфические свой- ства (выцукл ость/кусочная линейность, аналитичность и т. д.), то можно заранее сказать, как устроены оптималь- ные стратегии, и затем, используя эту информацию, нахо- 8* . - •
116 ЧАСТЬ II, БЕСКОНЕЧНЫЕ АНТАГОНИСТИЧЕСКИЕ ИГРЫ дить (здесь уместна аналогия с матричными играми) с помощью теорем 3.7—3.12 и некоторой изобретательности решения рассматриваемых игр в явном виде. Ниже мы до-* кажем ряд теорем, касающихся этих вопросов. Теорема 3.13. Если я и у—ограниченные и замкну- тые многогранные подмножества, образованные пересече- нием конечного числа полуплоскостей в и Rn, а функция Н является билинейной функцией на хху,т. е* имеете вид н = 2 3 hi}x'iyh ;=-1 то играГ— <х, у, Н)имеет решение в чистых стратегиях, причем эти решения определяются решениями некоторой матричной игры. Доказательство. Как известно, в условиях тео- ремы множества всех крайних точек ж и у конечны. Обо- значим их соответственно через х=±{х\ х2, .. м хг}, у={^А> у?, ..У*}- Пусть далее а* = (а*, а^, ..а*), а*>0, 2 = 1} 0* = (Й, Й, • • Й), Й> 0, 2 Й = 1- рпти- i=»l ' $-1 мальные стратегии конечной антагонистической игры Г1 = ‘{х, у,-Н), где BW, — у*). В "силу тео- ремы 1.4 такие стратегии существуют. Так как они оп- тимальны, для каждой пары смешанных стратегий (а, 0) выполняются неравенства Й(а*, 0) > Я(а*. 0*) > Н(а, 0*). (3.21) Обозначим соответственно через х*, у*, х в у векторы 2 а*®1, 2ЙуЛ ijaiX1, 2₽я^. i-1 W i»=1 • ?=1 Используя билинейность функции Д,_получпм /7(а*,р)=» «Жж*, у), Жа*, р*)«Жж*, у*), Жа, р*) = Жж, у*). Таким образом, неравенства (3.21) эквивалентны неравен- ствам Жж*, у) > Н(х*9 у*) Н(х, у*). (3.22) Если теперь вспомнить, что каждая точка выпуклого множества является выпуклой комбинацией его крайних
ГЛАВА 3. ОСНОВЫ ТЕОРИ11 117 точек, то в силу произвольности аир видим, что нера- венства (3.22) выполняются для всех х^х, у^у. Следова- тельно, (х*, у*) — ситуация равновесия игры Г. Теорема доказана. Теорема 3.14. Еслих и у—сепарабельные компак- ты, множество xcz выпукло, а функция Н непрерывна на хх У и вогнута мх&г при каждом значении у^уг то в иареГ=<х, у, НУ первый игрок имеет оптимальную чистую стратегию. Доказательство., П® следствию к теореме 3.2 иг- роки имеют оптимальные смешанные стратегии X* и У*. / Так как множество вероятностных мер с конечным носй-ч телем всюду плотно во мйожестве всех вероятностных мер на х, существует последовательность стратегий Хп с ко- нечным спектром, слабо сходящаяся к стратегии X*. Пусть спектр-стратегии Хп состоит из точек х1, х2, ...,xftft, а ве- роятности, с которыми выбираются эти точки, согласно этой стратегии, равны Й, •••Дьп- Тогда в силу,нера- венства Йенсена для вогнутых функций йп < В (Хп, у) = 2 (х\ у)^Н (х*«, у), (3.23) i=l где х*"= 2 Переходя, если нужно, к подпоследова- i=1 • тельности х*", а затем к пределу в неравенстве (3.23), по- лучим ' f7(X*,j/)<fl(J*,y), ре у, (3.24) где х* — предельная точка^ последовательности ж*". Отсюда inf Н (X*, y)sS^inf Я(х*, у). Это неравенство на самом у * ’ У деле является равенством. Действительно, в противном случае из формул (3.5) и (3.6), теоремы 3.3 мы пришли бы к абсурдному неравенству v = inf И (X*, у) < ini Н (х*, у) < max inf Н (X, у) = v. у у " X, у Следовательно, inf Н (х*, у)=v, п из теоремы 3.3 следует, _ у * что х* — оптимальная стратегия/Теорема доказана.
118 ЧАСТЬ II. БЕСКОНЕЧНЫЕ АНТАГОНИСТИЧЕСКИЕ ИГРЫ Аналогично доказывается следующая теорема. Теорема 3.15. Если х и у— сепарабельные компак- ты. множество уczRm выпукло, а функция Н непрерывна на хХуи выпукла по у^у при каждом значении х^х.то в игре Г=<±, у. Н} второй игрок имеет чистую оптималь- 1 ную стратегию. Пусть единичный квадрат ; некоторым образом составлен из конечноТо числа многоуголь- ! пиков, т. е. является их объеди- пением, а множества Q1? Q2, ... х-е ..., Qi внутренних точек этих < многоугольников попарно не пересекаются. Тогда всякую не- л прерывную функцию на еди- ' . Рис. 3.1. ничнодГквадрате, линейную на = каждом из множеств £2/, будем называть непрерывнои-кусочно линейной функцией. Положим Ф = (J (Qj Л )• На рис. 3.1 ПО! множество Ф для функции Гн--Ь (« — {/) при Гх-у|<'8.: Н ~ 1 4- -Ь(у — х) при х^у, \х — (3-«25) О при | х — у | > б. Оно состоит ИЗ/ точек квадрата, лежащих на прямых у = х+8. у — х. у = х — б. Определим многозначные отображения / и g соответ- ственно множеств х и у в множества подмножеств у и х следующим образом.(см. рис. 3.2): , /-(ж) = 1/)еФ}, g(y) = {х<=х\(х, Теорема 3.16. ПустъУ—^х. у. Н}—игр^ на единич- ном квадрате С -непрерывной кусочно, линейной функцией Л. Тогда каждое решение конечной антагонистической иг- ры Гх==<а, Ь. Ну,где а и Ъ— конечные множества, для ко- * торых справедливы условия аах.' Ьс^у (0. lea, Q* left), _ / (a) cz 6, g (6) c a, является решением игры Т, :
, ГЛАВА 3. ОСНОВЫ ТЕОРИЙ 11Й Доказательство. Пусть Х\ Р — оптимальные стратегии в игре Г1. Они являются'также стратегиями В игре Г. Расположим точки множеств, а, Ъ вг порядке воз- растания/ так что «1 =Ю < а2 < ... < = 1, = 0 < Ь2 < <...<6П=Д. Если первый игрок в игре С применяет стратегию то его выигрыш при у е у равен m z . ЩХ\у) = %&Н(а1,у). X - . г-1 Для точек множества; b в силу оптимальности страте- гии X1 в игре Г1 справедливы неравенства тп i=l где р — значение игры Г1. Каждая из функций у) ли- нейна п# каждом из отрезков 16;, В-противном слу- чае одна из точек множества /(а<) содержалась бы. внутр*и интервала (6j, 6j+i), что противоречит включению /(а)с:&; Следовательно, функция ЖХ1, у) линейна на каждом'от- резке [6;, 6;+1Г как сумма линейных функций-. В - точках bj и bi+i значение этой линейной функций не меньше р. Поэтому для 6;+i] справедливы соотношения HiX\ y)>v = ЖХ\_Г), (3.26)
120 ЧАСТЬ II, БЕСКОНЕЧНЫЕ АЙТАЕОЙИСТйЦЕСЙИЕ ИГРЫ ' Так как точки 0 и 1 содержатся в Ь, всегда найдется от- резок [bh bJ+J, в котором содержатся У^-У- Поэтому не- равенство (3.26) справедливо при всех у е у. Аналогично доказывается неравенство ' Н(х9 У1) > v = ЖХ1, У1). , (3.27) , В силу замечания к теореме 3.6. из неравенств (3.26), (3.27) следует, что X1, У1 — оптимальные стратегии в игре . Г, a v—ее значение. Теорема доказана. Для игры , на единичном квадрате, функция выигрыша .которой определена формулой (3.25), образ нуля при ото- бражении / сострит из двух точек (У и б, а образ едини- цы—из точек 1 и 1 — 6. Далее, g(0) = {0, б), g(6) = {0, &, 26), g(l — б) = {1 — 26, 1 — 6,1), g(l) = {l-6, 1). Рас- сматривая затем /-образ множества {0, 6, 26, 1 — 26, 1 — 6, 1), затем g-образ этого /-образа и т. д., мы придем, нако- нец, к множествам а = {0, б, пб, 1—пб, 1-(п-1)б, 1}, (3.28) Ь = {0, 6, пб, 1 — пб, 1 — (лг — 1)б, ..., 1}, (3.29)’ п = [1/6], для которых / (a) cz Ь, g (6) cz а. Следовательно, любое решение конечной антагонистической игрыГ = <а, Ь, Я>,где Н определена по формуле (3.25),» является реше- нием игры Г = <#, у, Ну. • > _ х / Г л а в а 4 * * ПРИЛОЖЕНИЯ Реальный конфликт может моделироваться бесконечной антагонистической игрой, если он отвечает, следующим условиям. ' ,. z 1. Конфликт определяется . антагонистическим взаи- модействием двух сторон, из которых хотя бы одна или обе располагает бесконечным числом возможных действий. 2. Свои действия стороны предпринимают независимо друг от друга, т. е. каждая из них не располагает никакой информацией о действии, совершаемом другой стороной; результат этих действий оценивается вещественным чйс-
ГЛАВА,, 4. ПРИЛОЖЕНИЯ - 121 лом, которое определяет полезность сложившейся ситуа- ции для одной из сторон *). 3. Каждая из конфликтующих сторон знает как для себя, так и для противника полезность любой возможной ситуации, получаемой в результате их взаимодействия. 4. Действия' конфликтующих .сторон в силу своей природы являются нерасчлененными и однократными, т. е. структура каждого из них не имеет каких-либо от- личительных свойств. Это позволяет интерпретировать действия сторон как элементы некоторых абстрактных множеств, отличая различные действия друг от друга лишь по степени полезности сложившейся ситуации. Таким образом, перечисленные условия отличаются от условий 1—4, сформулированных в начале гл. 2. . Если конфликт удовлетворяет перечисленным услови- ям, то назвав одну из сторон игроком I, а другую —игро- ком II, мы придем к бесконечной антагонистической игре Г=<ж, у, Ну, где а? — множество возможных действий иг- рока I, у — множество возможных действий игрока II, Н — функция, полезности игрока I, которая определена на всех парах возможных действий игроков. Условия 1—4 дают возможность построить модель конфликта — беско- нечную игру Г. < . . § 4.1. Примеры приложений в экономике . „ Пример 4.1 (антагонистическая конку- ренция двух фирм, непрерывный g-л уча й). Представим себе, что в примере 2.5 время не дискретно, а непрерывно, причем каждая из фирм может начать по- ставлять товар на рынок в любой момент времени отрез- ка [0, 1]. Тогда, если первая ,фир$а поставляет товар в момент х, а вторая — в момент у, то функция выигрыша первой фирмы запишется в виде с (у — х) . при х < у, И (х, у) = (1 — х) при х = у, (4.1) с(1 — х) при х>у. ♦) В силу антагонистичности конфликта можно считать, что полезность такой ситуации для другой стороны равна "этому чис- лу, взятому со знаком минус.
122 ЧАСТЬ П. БЕСКОНЕЧНЫЕ АНТАГОНИСТИЧЕСКИЕ ИГРЫ к ' Разделяй элементы матрицы выигрышей примера 2.5 на< с и п, что не изменяет множества оптимальных стратегий игроков, получим матрицу *<<<<" , где функция Н определена формулой (4.1 )• Таким образом, матричная игра примера 2.5 в некото- ром смысле аппроксимирует рассматриваемую здесь беско- нечную игру, что вполне согласуется со здравым смыс- лом — моделируемые конфликты ;отличны только в одном: в перром случае вредш дискретно, а в другом -- непрерыв- но. Так гкак оптимальные стратегии игроков не зависят от с, в дальнейшем мьГбудем считать с = 1. Напомним, что решении игры примера 2.5 было полу- чено при разборе примера 2.11. Как 'читатель может лег- ко убедиться, все; вероятности,, участвующие в образова- нии оптимальной стратегии игрока II примера 2.11, с ростом п стремятся к нулю.ДТоследнее хверно также и по отношению к вероятностям оптимальной стратегии игрока I, за исключением (см. (2.51)). Кроме того;-решение игры с дискретным временем. реализовалось на квадрат- ной- подматрице. Поэтому естественно предположить, что в описываемой намр здесь игре с непрерывным временем, во-первых, оптимальная стратегия К* игрока II задается плотностью ga, отличйой от нудя лишь на отрезке 10, al, а<1. Во-вторых, оптимальная, стратегия игрока I точку.О использует с "положительной вероятностью, а далее также определяете^ плотностью, которая равна нулю вне отрез- ка lOf 11. Обозначим такую стратегию через X* =» (а70, /»). Эта запись означает,**что число нуль используется е ве-' роятиостью о&, а все числа из отрезка tO, al — с общей ве- роятностью 1 — а, причем условная плотность распределе- ния на [0, al равна /а/(1 — а). Вычислим „ 1 а Я (х, У*) = J Н (х,.у) dY* = J Н (х, у) ga (у) dy = . ‘ V, \ О о X и ' . = J(l — X) ga{y)dy(у -x)ga{y)dy . Q - ®
ГЙАЁА 4. ЙРИЙОЙСЕЙИЙ . • . Ш при Как легко видеть из этой записи, функция Жя, У*) непрерывна по х< Поэтому, если предположить, что все числа отрезка [0, al входят в спектр оптимальной стратегии игрока 1,< то в силу теоремы 3.7 имеет место ра- венство j (1 — «) ga.(y) dy + j {у — x) ga (у) dy.= v; - (4,2) 0 x Дифференцируя равенство (4.2) по у,.получим (1 — X) ga (х) — J ga (у) dy—§ ga\y) dy = 0. (4.3) - О X ' Так как здесь а а а !ga(y)dy + jga(y)dy = fga(y)dy=lt, 0 X о' . . то решая ^уравнение (4.3) относительно ga(x), имеем ga(x) = 17(1 — х). (4.4). Следовательно, а J ЛУ = ~ 1п (! - а) = 1» - о ' • ♦ т. е. а = 1—1/е. Подставив ga(y) в 1/(1— #) для 1 — Не в равенство.(4.2), находим ч , х 1-1/е о * - (что справедливо для любого 0«Сх^а). Далее, Н{Х*,у)=\{у — х) /а (х) dx + f (1 — х) fa (х) dx 4- ay, о . V, , (4.5) . Ч О<0<1 — 1/е.
124 - Часть ti. бёсйойёчйыё айтаГоййстйчёсййе игры Рассуждая аналогично, придем к равенству у • а - I (у — X) fa (ж) dx + ) (1 — ж) /а (ж) dx + ay = V, 1> у • (4.6) О < у < а. Будем предполагать, что плотность /.(ж) на отрезке (О, al дифференцируема. Продифференцировав равенство (4.6) два раза до у, ^получим дифференциальное уравне- ние 2fa (у) = (1 — у) fa (у). Его можно записать в виде /а (У) - 2 ' la (V) ~ 1 — U’ откуда In /а(р) — —2 In (1 — у) + ct так что функция /«(у) =•”' = с/(1—у)* (с — произвольная константа) является реше- нием этого уравнения. Мы предцолагаем 1—1/е J fa (х) dx — 1 — а, , - • ' \ поэтому . ’ 0<*<Г-4- W-7) Подставим эту плотность в равепства (4.6). После интег- рирования по. я придем к равенству % , У + аУ.= °- М Для того чтобы последнее равенство было тождеством при всех 0 < у С 1 — 1/е, необходимо, чтобы а= 1/е. Та- ким образом, если /в(ж) задана формулой (4.7), а а = 17е, то ЖХ*, у) ® о ч при 0 < у 1 - Г/е. (4.9) Если же ga(y) определена формулой (4.4) при — — 1/е, то Я(ж, У*) и при 6 < ж < 1 — 1/е. (4.10) Докажем, что найденные стратегии X* и У* опти- мальны, а значение игры равно 1/е. Для эгого сначала
ГЛАВА 4. ПРИЛОЖЕНИЯ 125 вычислим Я(Х*, 0)== 1-17в [ 1 ~х 2 * е е J (1 —*)2 о ^=4.х+х>_1 Теперь в силу тождеств (4.9) и (4.10) достаточно до- , казать неравенства И(Х»л)>р-й(Х*, У*) при 1-1/е<х<1, (4.11) Н(х, = /7(Х*. У*) при Г-1/е<у<1. (4.12) Функция 1-1/е .W(x.,9)=A9 + J- S>1-A, линейно возрастает по у. Так как В(Х*, 1-1/е) = 1/е = р, то из возрастания этой функция следует неравенство (4.11). При 1 — 1/е < гг выполняется-неравенство . ' ’ 1—1/е ' ' П(х, У*) = J l=^ = l-x<X = v. ,° • - Таким образом, значение игры равно и1/е; оптималь- ная стратегия игрока II на сегменте [0,1 — 1/е] задается плотностью 1/(1 — #); соответствующая оптимальной стра- тегии игрока I функция распределения имеет в точке 0 «скачок», равный 1/е, а на интервале (0,1 — 1/е) опреде- ляется плотностью 1/(е(1 — я))2. . Пример 4.2 (з а х в а т р ы н к о в сбыта). Пусть одна из фирм (игрок II) имеет п рынков сбыта, а другая (игрок I) желает их захватить.. На эту цель она может выдёлить капитал в .размере Л. Игрок II для защиты сво- их рынков сбыта также располагает некоторой суммой В. Не? ограничивая общности, будем считать, что В => 1. Стратегиями игрока I в этой ситуации являются всевоз- можные распределения суммы А между рынками сбыта. Если для захвата рынка i он выделяет сумму а игрок II для защиты этого рынка выделяет сумму #<, то игрок 1 на этом рйнке выигрывает — #<), если —#<>0, . и ничего не выигрывает Тв противном случае. Коэффици- ент ki определяет степень важности рынка, а коэффици-
^6 ЙАСУГЬ It. ЁЕСЙОНЕЧЙЫЁ АЙТДГОНИСТЙЧЁСКЙЕ ИГРЫ ент or— степень сопротивления рынка i фирме, проводя- щей экспансионистскую политику. Суммирование по всем рынкам показывает, что выиг- рыш первого игрока равен, величине Н (х, = шах (0, — У г))- (4-13) - Таким образом, мы приходим к игре Г = <», у, Н), где х =« ix = (хъ х^ п Oka Н определяется = (l/n Уг, У ) 2 yi = l, Ул и 1=1 формулой (4.13). п ЕслК 4 2 а fCk то решение игры тривиально, а_зна- i—1 . • ' •чение игры равно нулю. Поэтому будем считать; что * п А 2 ai > 1. , По_ лемме 1.4 каждая из функций Щах (0, kitotiXi-- у У) выпукла как по х^ так if по yh по- этому-и функция Я выпукла по х е х и по у^у. Следо- вательно, в силу теоремы -3.15 игрок-ll имеет чистую опти- мальную стратегию у*.‘ Так как максимум выпуклой функции на выпуклом множестве достигается на одной<йз крайних точек этого множества, а шах Н(х, у*) по теоре- аг ме 3.3 равен v, то теорема 3.7 наводит нас па мысль о том, что топки спектра оптимальной стратегии первого игрока' могут содержаться в множестве вершин симплекс#чистых ' стратегий первого игрока. Обозначим через i (i = l, 2, ..., п) вершину симплекса я, у которой все координаты кроме г-й равны нулю, а 1-я равна Л. 1 ; — Пусть некоторое подмножество вершин симплек- са т, а X — стратегия, согласно которой вероятности выбора вершин i^S равны Все остальные вершины не содержатся в спектре страте- гии X > т. е. используются с нулевыми вероятностями.
ГЛАВА 4. ПРИЛОЖЕНИЯ 127 Таким ’ образом, вероятность выбора вершины I е *$ об- ратно пропорциональна важности этого рынка. Тогда справедливы неравенства Н (Xs, у)> (4.14) Таким образом, ,игрок I независимо от действий игро- ка II может получить любую ?йз величин, стоящих в пра- вой' части равенства (4.14). Очевидно,«что правая часть равенства (4.14) зависит лишь от подмножества S.' Ес- тественно, что первый игрок должен выбрать такое и такую соответствующую этому множеству стратегию X % при которых он. получит максимальный выигрыш. Покажем," что величина и = max Ч $ (4.15) является значением игры а стратегия X ° является оптимальной стратегией. первого игрока. Для этого в си- лу неравенств (4.14), при S =» So,. достаточно показать, ; что второй игрок имеет стратегию, при которой 4 ‘ х . (4.16) Найдем такую стратегию. Если у* — оптимальная стратегия игрока II и если предположение о том, что множество^ вершин 50 симп- лекса х является спектром некоторой оптимальной стра- тегии первого игрока, верно, то в силу теоремы 3.7 долж- ны выполняться равенства — у*) = u, is 50,. от-. куда isS0, (4.17)
128 ЧАСТЬ II. БЕСКОНЕЧНЫЕ АНТАГОНИСТИЧЕСКИЕ ИГРЫ / Легко видеть, что 2 У*1 = 1- Обозначим через у* век- ie5° тор, для которого yi =0, j^S0,.a при z &90 координата у* определяется равенством (4.17).'Очевидно, что2уь=1* 2=1 Для того чтобы доказать, что этот вектор является стратегией игрока II, достаточно проверить неравенства i^SQ. Заметим, что неравенство Уг <Z 0 эквива- лентно неравенству Так как на So достигается максимум правой части ра- венства (4.15), то' (4.19) Далее, длхя любых дробей а/ft и c/d с положительными знаменателями дробь (а + с)/(Ь ~Нй) содержится строго между этими дробями. Полагая числитель и знаменатель левой части неравенства (4.18) соответственно ^равными а и ft, а числитель и знаменатель правой части неравенст- ва (4.19) соответственно равными с и Й, из этих неравенств получим (а + c)/(ft + d) < v. С другой стороны, что противоречит предыдущему неравенству. Таким-образом, у* является некоторой стратегией иг- рока II. Докажем, что она оптимальна. Как уже указы- валось, в силу выпуклости функции Н(хч у*} ^достаточно проверить, что в вершинах симплекса т выполняются неравенства (4.16). Для вершин, входящих в 6^, эти не-
. ГЛАВА 4. ПРИЛОЖЕНИЯ 129 равенства проверять не нЗйо, так как в них неравенства (4.16) являются равенствами — мы из этого предположе- ния и определяем стратегию у*. Для вершины & ле- вая часть неравенства (4.16) , равна Поэтому нера- венства (4.16) эквивалентно неравенству А 3 “i-1 ос/ < ie5o Если бы последнее неравенство не выполнялось, то. имело бы место двойное неравенство Л 2 а{ —1 А 2 а{ + Ла — 1 у 1 у 1 1 1 Д ** A kt+ ' ki * У Первое из этих неравенств противоречит определению множества Sb* Следовательно, неравенства (4.16) справед- ливы для всех вершин, а поэтому и для ‘всех точек симп- лекса х. Таким' образом, X ° и у* — оптимальные страте- гии, а р — значение игры Г. Может показаться,, что стра- тегия X 0 не зависит от коэффициентов сопротивления рынков. Однако при нахождении множества So эти ко- эффициенты учитываются. Следовательно, обе фирмы учитывают их в своих оптимальных политиках. Если все коэффициенты равны а<“1, т. е. рынки не оказывают сопротивления, то формула (4.15) перепишется, в виде v = шах Л I ^1 — 1 где | S | — число элементов множества S. Из последнего равенства видно, что множество S состоит из вершин . симплекса, соответствующих наиболее, важным рынкам, так как (Л | S | — 1) ( S 1/fcjV1 возрастает при возраста- нии kt. Г» Н, Дюбин, В, Г» Суздаль ' L
130 ЧАСТЬ П БЕСКОНЕЧНЫЕ АНТАГОНИСТИЧЕСКИЕ ИГРЫ Следовательно, 1А _ 1 гД.— 1 v == шах —г----------------- — М—1 » = А — { , ' е‘ - V <“1 1 Г.' Покажем теперь построение, и решение игры Г, моде- лирующей борьбу за рынки сбыта, приняв следующие ги- потетические данные. Пусть одна фирма (игрок II) имеет три рынка сбыта и располагает для их защиты от другой фирмы (игрок I) суммой денег, равной 300000 долларов. В свою очередь игрок I длязахвата этих, рынков выделил сумму денег,* равную 600000 долларов. Примем Л = 2 и В — 1, а харак- теризацию рынков зададим -табл, 4.1. . ~ Таблица 4Л. Значение коэффициентов а< и 1ц ♦ Рынок i 1 2 3 at 1 0,6 ОД ' * 2 4 , 1 Перебирая все подмножества множества {1, 2, 3), най- дем, что максимум в формуле (4.15) достигаетсяt на мно- жестве So = {1^2}, v = 44/15. Затем, используя, равенства (4.17), получим Уг = 7/15. Компоненты опти- мальной стратегии игрока I вычисляются по формуле - - Ki I п,1 1 т,е. £ = ’2/3, ^1/3.
ГЛ АЙ A 4.'ПРИЛОЖЕНИЯ ‘ 131 Таким образом, одна фирма распределяет денежные средства для .защиты только первого - и второго рынков, выделяя соответственно 160000 и 140000 долларов, а дру- гая фирма с вероятностями 2/3 и Ч/З выделяет 600000 долларов соответственно для захвата первого и второго рынков.. Математическое ожиданце выигрыша второй фирмы будет равно 880 000 долларам’. Предположим теперь, что 1 (i— 1, 2,-3), т. е. рын- ки не оказывают сопротивления. Тогда / = 2, u = 4,*/i = = 0, у2 == 1, £i = 2/3, £2 = 1/3. Следовательно, одна фирма все средства выделяет на защиту второго рынка, а другая фирма с вероятностями 2/3 и 1/3 направляет свои средства соответственно для захвата первого и вто- рого рынков. Математическое ожидание выигрыша в этом случае будет равно 1 200000 дойларам. Пример 4,3 (п л а н и р о в а н и е посева в усло- виях капиталистической экономики) [62]. Пусть арендатор земли площади L может посеять тп^ти- пов зерпа. Обозначив через у\ урожайность зерна типа f, через — долю площади, засеянную эти^Г зерном, а че- рез Pi — цену единицы веса этого зерна, можно выразить цену полученного им продукта формулой * т - M=.^y.thLPi. ' . (4.20) i=l Обычно на рынке цена произведенного однотипного про- дукта является функцией от его количества, т. е. . (4.21), где gi — общее количество зерна i-ro типа на рынке/ k В нашем примере мы полагаем, что хозяйства доста- точно малы. Вследствие этого, не слишком огрубляя .мо- дель, можно считать, что gt = y,r\iT, (4.22) где у{ — средняя' урожайность зерна i-ro типа, Т —> общая •площадь полей всех остальных производителей, а тр “' доля этой площади, на которой - посеяпо зерно i-го типа.
5 t 132 Часть ti. бесконечные антагонистические игры Подставляя формулы (4.21) и (4.22) в выражение (4.20), получим 7П х М = 2 М (у^Т). . (4.23) I - ' i=l Как и в гл. 2, обозначив через игрока I отдельно арен- датора, а через игрока II — рынок, мы придем к антагони- стической игре, в которой стратегиями игрока I будут т векторы л = (|1г ^2, ..ч bU«>0, = стратегия- i=l ми игрока II — векторы у=(Яь Яг» • • •» Яш). !Ь^0» т 24i = 1; функция' выигрыша задается формулой i=l • ‘ ? (4.23). Очевидно, что чем больше произведено зерна, тем меньше его рыночная цепа. Следовательро, каждая из - функций ft монотонно убывает. Будем считать, что это убывание происходит с показательной скоростью, т. е. каждая из функций ft имеет вид fi = a>igi коэффици- енты сц и показатели е( находят статистическим методом, используя регрессионные модели. После подстановки выражения для ft в формулу (4.23) получим т - —е • , м = -2 \ г=1 ИЛИ М = s kiL^e\ , (4.24) i=*l где ki = )е<. В этом случае функция выигрыша (4.24) является ли- нейной по стратегии игрока I и выпуклой относительно стратегии игрока П. Следовательно/ на основании теорем 3.14, 3.15, каждый из игроков имеет оптимальные чистые стратегии. Найдем оптимальные стратегии игрока I (арен- датора) и игрока II (рынка), используя данные по про- изводству пшеницы, кукурузы, овса и сои в США на пло-
ГЛАВА 4. ПРИЛОЖЕНИЯ 133 щади Т =182 625 000 акров за 1958 год [65], которые приведены наследующей таблице: Вид зерна Пшеница Кукуруза Показатели 1 2 Уг^У1 (бушели/акр) Si , ai 27,3 (1,52-109)1’85= =9,69-101в 51,7 2,63 (3,56.109)М3= =2,05-10^ ki 3,030 4,000 Вид зерна .Овес « Соя Показатели 3 4 Уг^Уг (бушели/акр) Si ‘ »i 44,7 5,00 (1,20.109)5=2,49.104? 24,2 0,515 (1,47’10»)*.8^= - =5,27-104 ki 0,003 13,750 После подстановки величйн Т, у,, уъ 8j, af в формулу (4.24) получим - М г З^ЗОДл 1’85 + 4,000Д2пГ' ’ '3 + О,ОЗОД3т)Г5’°°+ • / \ ' + 13,750Lg4T]70‘615- Тогда . , * v = min тах^.ОЗОЬ^Г1,85 + 4,000^72183 + у X - ' ' . ' O,O3OL|3V00 + 13,750Д4п7°'515] = _ = min max {З.ОЗОЬт]?1’85; 4,000Лть 2’вз; 0,030L?b s’°°; 13,7507л]7°,И5Е Минимум правой части последнего равенства дости- гается при соотношении 3,030т]Г1>85 = 4>00т]72*вз =« , = 0,003nZ5,oo=13,750n7o’515.
134 ЧАСТЬ П. БЕСКОНЕЧНЫЙ АНТАГОНИСТИЧЕСКИЕ. ИГРЫ .Отсюда получим систему уравнений З.ОЗОпГ1’88 == 4,000т]72,вз, . О,003т]78,о° = 13,750п7°’61в, з.озотц1,86 = хз.тбОш0*515» П1 + П2 + П3 +П< = !» решением'которой является, вектор у* — (0,262; 0,432; 0,153; 0,153). Кроме того, находим, что v — 36,1 денежных - единиц с акра. Для вычисления оптимальных стратегий-игрока I най- дем частные производные функции м =\2 (piTfii) ~4 ' 1=1 по аргументам r;< U—1, 2, 3>L принимая во внимание, что;1)* — 1 — т|, — т)3 — и» и Jh *= У», а затем приравняем их нулю. В результате придем к системе уравнений _ е1пГ1_\1?1а17'_в’ + в^Г^Ч^Г^ть84 « 0, . ЛЛГ1 -1-е( 1-8г6 -,-е —8.2п2 ’у2 i2aaz* 2 + ' “Г 84£М Hi — 0ЛГ1 ~l~8s l-c3fc Ш*ез . >=—88Пз *Уз sl3a#r 3 + "Ъкх.») +8^l“4a4rA)7l'4=o, решением которой будет вектор х* —(0,246; 0,184; 0,053; 0,517). ' • - ' Таким образом, оптимальная стратегия арендатора со- стоит в'том, чтобы йод 1-й тип зерна выделить долю & площади L, а значение шры (т. е. ожидаемый доход в наименее, благоприятном случае) будет. равен п —36,1 долларов с акра. При этом наименее благоприятный слу- чай возникает тогда, когда реализуются «состояния при-: роды» согласно у*, т. е. когда на-рынок поступит i-й тио зерна, засеянного на доле п< площади Т.
ГЛАВА 4. ПРИЛОЖЕНИЯ 135 (р а с п р е д е л е н и е с р е д с т в). Пусть планирующей организации имеется N надо распределить между п районами, Пример 4.4 в распоряжении рублей, которые для их экономического развития. Однако незвестно, сколь- ко средств целесообразно выделить каждому району. Это может выясниться лишь в будущем. Предположим, что для нормального и гармонического функционирования в хозяйственной _жизни страны на развитие всех этих районов целесообразно выделить М , , п рублей, причем на район I необходимо Mt рублей, 2 = ' 1=1 = М.. Если планирующая организация отпускает на раз- ° витие района I сумму Nt, S N, — N, неудовлетворен- • 1=1 ность района i в средствах для оптимального функцио- нирования измеряется коэффициентом MJNt. Цель рас- пределения средств- планирующей организации, естест- венно, состоит в том, чтобы минимизировать максималь- ный коэффициент неудовлетворенности. Таким образом, мы- опять приходим к игре Г = = (.М, N, НУ планирующей организации (игрок II) с при- родой (игрок I). В этой игре л7 = (Mlt ма) 2 = м, ok i-l J Г ' n > п = и =х (N;, N„ . . функция выигрыша Н задается равенством НШ, N) - MJN* . .MJNn}. После замены переменных. Mt Мтл, Nt^=Nyt получим игру Гх = <«, у, Uly, где п X — (х — («„ х2, Уп) Jj У = \У =G/i, Уп т — — max — —I • - N U ’ у,-’.’”’ М‘.
136 ЧАСТЬ II, БЕСКОНЕЧНЫЕ АНТАГОНИСТИЧЕСКИЕ ИГРЫ Игра Г1, очевидно, изоморфна игре Г. В силу теоремы 3.4 достаточно решить игру Г1, после чего автоматически получим решение игры Г. Наконец, уменьшив функцию Я1 на N/M, что по теореме 3.12 не меняет множества стра- тегий игроков, мы сведем нашу задачу к решению игры Г = <л, у, Я>, Л = Найдем решение игры Г. По лемме 1.3 функция выиг- рыша игры Г выпукла по у при каждом значении х. По- этому игра Г удовлетворяет всем условиям теоремы 3.15 за исключением непрерывности функции Н — на границе симплекса у она не определена. Предположим в£ё-таки, что теорема 3.15 справедлива для этой игры, т. е. что второй игрок имеет чистуюч оптимальную стратегию. Тог- да по следствию к теореме 3.3 * v = min max Н (х, у), у X Очевидно, что У1 Уг ’ ’ yoJ . (Ъ я хп I fl 1 1 1 = max maxi—, —, ..—I maxi —, —, .. • » —L * Hi V M Pl , Уп ) Минимум последнего выражения достигается при у* = ==<1/п, 1/п, ..., 1/п). Поэтому v = Из теоремы 3.3 так- же следует, ,что у* — оптимальная стратегия второго иг- рока. v Далее, ' ч Н (х, у*) = max тах{пж1? пх2, . . м пхп}. X Пз этого равенства следует, что Н(х, y*) — n = v лишь для стратегии ^j==0, i =£]~х\=Л. Следовательно, точ- ками спектра оптимальной стратегии первого игрока мо- гут быть только точки х1 (теорема 3.7). Соображения сим- метрии делают вероятным предположение о том, что эти точки выбираются с равными вероятностями. Обозначим такую стратегию через X*. Все наши* рассуждения 'основывались на более или менее правдоподобных, предположениях. Поэтому для до- казательства оптимальности стратегий в силу замечания
ГЛАВА 4, ПРИЛОЖЕНИЯ 137 к теореме 3.6 необходимо проверить неравенства (3.16). Проверим их.. Действительно, Н\Х*,у*) = п, Н (х, у*) = max {пхх, пх2, ..., пхп} п, Я(Х., й = 42. Последнее неравенство следует из того, что произведешь чисел, в сумме дающих константу, максимально при рав- ных значениях этих чисел, а предпоследнее — из тбго, что среднее арифметическое не меньше среднего геометриче- ского. Таким образом, неравенства (3.16) справедливы, и поэтому X* и у* — оптимальные стратегии игроковЗа- метим, что стратегии у* соответствует стратегия N* = — (N/n, N/n, ..., N/n) игры Г. Эта стратегия не зависит от М. Следовательно, планирующая организация может оптимально распределять ресурсы, не имея информации о том, сколько средств целесообразно отпустить на разви- тие п районов. Разобранный пример моделирует, не совсем реальную ситуацию. самом деле, на практике из тех или других соображений можно оценить границы, в , которых изменяется М{. Моделью* такой ситуации будет игра Г1 = <ЛР, JV, 7Z>, где И1 = М = (МХ) м2) S Mi=M, i=l ..,МП) Пусть 0<AfF» Mi <1. Проделав такие же преобра- зования, какие мы совершили над игрой Г, получим игру Г1 = <«1, у, ну, где - Д? — 1 х — (хх, Х2, • • •, Хп) п S = 1, 1=1 OCj Pi ' a, =r М?/М, ₽{ = . Игра Г1 удовлетворяет всем условиям теоремы 3.15. Поэтому второй игрок имеет чистую оптимальную страте- гию у*; По теореме 3.3 эта стратегия определяется из
138 ЧАСТЬ II. БЕСКОНЕЧНЫЕ АНТАГОНИСТИЧЕСКИЕ ИГРЫ равенства max Ц (х, у*) = и, < X * ' а по следствию к теореме 3.3 . • и г» min max Н (аг, у), v Очевидно, max Н (х, у) == max max {Xjjyi} = max X к t . v Минимум последнего выражения достигается, когда все числа равны между собой, откуда П Л „ . 10 = ₽i/2 Pi, V ₽« 2 Pi- /ft=l , i-1. -Стратегииу* =(y*, у*, . .-.,’Pn) соответствует стратегия . v* / ₽Л МРл\ ' . . . . 12Pi- 2Pi 2Pi - \i=l i=l i«l / (M®AT m,n 2"f 2«f 2"? ) Ь-l a /1=1 / игры f*. Эта стратегия не зависит от нижних границ Mt. Поэтому планирующая организация может _ оптимально распределять средства, не имея информации о том, сколь- ко средств целесообразно выделить на развитие 9 райо- нов, и не зная нижних границ этих потребностей. Сред- ства необходимо распределять пропорционально верхним границам потребностей. 7 - § 4.2. Примеры приложений в военном деле х • Пример 4.5 (теоретико-игровая модель постановки и траления мин, непрерывный случай). Предположим, что (см. пример 2.10) на участ- ке общей длины L доля мин, поставленных на кратность i (i = 0, 1,- ..., т), равна &, а общее число мин равно Л', причем мины распределены на отрезке [0, L} независимо й
ГЛАВА Д ПРИЛОЖЕНИЯ 13Э равновероятно. Тогда вероятность того, что на отрезке длины AZ окажется ровно одна мина кратности i, равна (через o(AZ) обозначена величина более высокого поряд- ка малости, нежели ДО. В этом случае вероятность под- рыва корабля на -мине на участке AZ после / тралений, очевидно, будет равна m ’ —-------------+ ®(AZ). . Здесь, как и в примере 2.10, рч — вероятность подрыва корабля после / Тралений на мине, поставленной на крат- ность i. ' Обозначим через p,(Z) вероятность того, что корабль после / тралений пройдет nd фарватеру расстояние I и не подорвется на мине. Так как pt(l AZ) •= p,(Z)p,(AZ), имеем 7 V P;(Z + AZ)==Pi(Oyi—] + ПЛИ . • m > - р} (I + Al) - р} (0 __ п ,п , О (ДО . : д/ • l PiW-r ,Д/ • Переходя к пределу, получим р5я=-—рДО-' Так как р,(0) = 1, то решение этого дифференциального . уравнения имеет вид , - • I N^hPil V - - . Pj(0 = expl-------^-7----Ч- ^-25)
140 ЧАСТЬ П. БЕСКОНЕЧНЫЕ АНТАГОНИСТИЧЕСКИЕ ИГРЫ В рассмотренном конфликте стратегией игрока I (сто- т ропа 4) являются векторы х = (£0, 5Ь ..5m), 3 Н= 1» i=o t > 0. Использование таких стратегий расширяет возмож- ности игрока I по сравнению с игрой, рассмотренной в при- мере 2.10, в которой игрок I располагает лишь стратегия- ми вида х == (0, ..., 1, ..., 0). . Пусть теперь фарватер разбит па п +1 отрезков длиной AZj (у —0, 1, ..., п), а игрок II (сторона В) в от- резке Д/j производит / тралений. Использование таких стратегий также расширяет возможности игрока II по сравнению с ситуацией примера 2.10. Обозначим через тц величину Mj/L. Тогда стратегии игрока II образуют множество # = = Пп •••Лп) п = (4.26) 2=0 - J Если на участке длиной AZj производится / тралений, то при использовании игроком I стратегии х согласно формуле (4.25) вероятность непотопления корабля на этом отрезке равна (т \ — N 5 • 2=0 / Следовательно, вероятность потоплеппя корабля при про- ходе всего фарватера равна п / т \ - Н (х, у) = 1 — П exp — N 2 = ' / 5=1 \ г=о / = 1 — ехр7— N S liP «ЯД ' (4.27) \ 7 Таким^образом, игра Г — <.г, у, Я>, где у и И определя- ются формулами (4.26) и (4.27), а X — \Х — (5о, ?1, • • •, ?т) • п 2=0 J ‘ моделирует постановку и траление неконтактных мин. Пусть X* и У* — оптимальные стратегии игроков в пгре примера 2.10, т. е. 2 liPi^ < 2 liPijw < 2 fiPiMK С4-28)
ГЛАВА 4. ПРИЛОЖЕНИЯ 141 Допустим, что = и у* = У*. Так как е*"* —моно- тонно убывающая функция, из (4.27) и двойного нера- венства (4.28) следуют неравенства Я(х, у*) < Н(х*, у*) Жх*, у), 1 которые означают, что векторы х* и у* являются опти- мальными стратегиями в игре Г. В примере 2.10 компо- ненты этих векторов были равны вероятностям, а в рас- сматриваемом примере они — вполне реальные физиче- ские величины: Bi — доля мин, поставленных на крат- ность г, Ц; — доля фарватера, в которой производится 7 тралений. Если ри — р, а р# = 0 при то значение игры Г легко получить из формулы (4.27), а именно V = 1 — exp f--== 1 — ехр (— N —?• А Практическая реализация решения игры Г состоит в том, что сторона А равномерно распределяет по всей длине фарватера мины, поставленные на кратность i (f = = 0, 1, ..., п), а сторона В на участке фарватера Zj== = L/(ra + l) производит j тралений. В этом случае вероят- ность того, что корабль, пройдя фарватер после тралений на участках (j = l, 2, ..., п), подорвется ja мине, рав- на v. Так, если L = 20 миль, = 100, р = 0,01 и п = 4, то = Е2 == Вз == = 1/5, и поэтому каждые 20 мин ставятся соответственно на кратность 0, 1, 2, 3 и 4, а затем они случайным образом независимо и равно- мерно распределяются на фарватере. В свою - очередь сторона В на каждой 1/5-й доле фарватера произ- водит соответственно 0, 1, 2, 3 и 4 тралений. Тогда вероятность того, что после производства траления на фарватере корабль подорвется на мине, t будет равна 1 _ ехр (_ Ю0-ВД «0,18. Пример 4.6 (теоретико-игровая модель поиска на рубеже и его прорыва; случай одного наблюдения). При организации действий на рубеже объект поиска (сторона В) выбирает точку про- рыва у [0, 1], а наблюдатель (сторона Л) позицию на- блюдения х^ 10, 1], относительно которой осуществляет-
142 ЧАСТЬ II. БЕСКОНЕЧНЫЕ АНТАГОНИСТИЧЕСКИЕ ЙГРЫ ся то или иное мипеврирование ♦)• В зависимости от ха- рактеристик, наблюдателя и объекта поиска, в также спо- соба маневрирования определяется вероятность р(х, у) об- наружения прорывающегося объекта. Данная ситуация моделируется игрой Г == <х, у, Я> на единичном квадрате, где х и у —пара единичных сег- ме.птов, а Жх, */) = р(х, у). Очевидно, чем "ближе нахо- дятся точки х и ук друг другу, тем больше вероятность 7 обнаружения. Естественно считать, что вероятность р яв- ляется функцией от траверзного расстояния между наблю- дателем и объектом поиска, т. е. от |х — у[. Довольно, часто (см. (21) вероятность р хорошо ап- проксимируется функцией . Р 1 * у | м, v Н(х,у)~ (О в противном случае. (4.29) с Заметим, что при пеподвижпрм наблюдателе, который вероятностью единица обнаруживает; объект поиска, ес- ли траверзное расстояние меж- ду ними не превосходит неко- ~ торого числа, и не обнаруживает его в противном случае, функ- ция р в точности равняется фунте- , ции Я, а 6 можно трактовать как дальность обнаружения. Решим игру Гб = <х, у. Н}, в которой' Н задается формулой (4?29). Если б > 1/2, то первый игрок имеет чистую оптималь- ную стратегию х* —1/2, а зна- чение игры равно единице; лю- бая стратегия второго игрока является его оптимальной стратегией. Пусть теперь ~б< < 1/2. Легко видеть, что стратегия х==б доминирует все ч истые/стратегии х < б, а стратегия х = 1 — 6 — стратегии ^>1 — 6 (см. рис. 4.1k Поэтому по теореме 3.9 каждое * решение игры Fj = (х\ у, Н\ где х1 = [б, 1—: б], явля- . ляется решением игры Г., ' / ♦) Здесь мы полагаем, что шприна . рубежа равна единице.
РЛаёа 4. АМЛоЯсёЙйЯ (43 Предположим, что стратегия ,Х* состоит в том, чтобы выбирать точки- Xi = б < < xs <... < *“ 1 - 6 с рав- ными вероятностями, а.расстояние между любой парой -соседних точек не превосходит 26. Тогда . любая точка у е у попадает в б-окрестность хотя бы одной точки Следовательно, ЖХ*, у) > 1/т. (4.30) С другой стороны, если второй .игрок равновероятно выбирает точки yt =» 0 < . < у* « 1, а расстояние между любой парой соседних точек больше 26, го‘суще- ствует не более одной точки у^ в 6-окрестности которой . содержится точка х. Следовательно, i ’ Жя, (4.3D где ’ Y* — только что определенная стратегия ~ второго игрока; v Если бы существовали стратегий' X* и У* с указан- ными -выше। свойствами, а т равнялось п, то, очевидно, в силу неравенств (4.30) и (4.31) они были бы оптималь- ными стратегиями .игроков, а 1/л —»f/m — в (из нера- венств (4.30) и (4.31) следовали бы неравенства (3.1в))« Такие стратегии X* и У* существуют. Действительно, при г 1 1. -хг, если -ко- — целое, - »-г. , (4.32) Hr Н* в противном случае: - точки Ж4 = 6 + Ь^(/_-1), « = 1,2,(4:33)' отстоят друг от друга не более чем на 26, а расстояние между соседними'точками . , V1 =« / = !. 2, ..., п, (4.34) строго больше 26. Поэтому 1/м — значение.игры Р, а оп- тимальные стратегии игроков X* и К* являются равно- вероятными смесями чистых стратегий, определяемых соответственно (4.33) и (4.34). Как уже указывалось, это решение игры Г4 будет также решением игры Г. Таким образом, наблюдатель должен равновероятно выбрать одну из точек множества (6, б + (1 — 2о)/(/г —
144- ЧАСТЬ II. БЕСКОНЕЧНЫЕ АНТАГОНИСТИЧЕСКИЕ ИГРЫ — 1)> •. «11 — 6}, после чего маневрировать в некоторой окрестности этой точки, а объект поиска должен проры- ваться в одну из точек множества {0, l/(n —1), 2/(п — — l)j 1}, предварительно осуществив испытание, име- ющее , п равновероятных исходов. Пусть теперь Н (+ У\~, Р (®, у) = ‘ ' 1 — -^-^-У) при п₽и У>х> <4,3^ ' • .' 0 > при | х — у | > 6, т. е. вероятность обнаружения равна единице, если точки прорыва совпадают с точкой, вокруг которой маневрирует' наблюдатель, а затем линейно убывает до нуля по мере увеличения. траверзного расстояния. Величину 1х —у| можно интерпретировать также как время нахождения цели в зоне действия средств обнаружения (время «поис- кового контакта»). Тогда ситуацию прорыва на рубеже моделирует игра;Т = <ж, у, Ну, где Н = р, а ® и у, как и до сих пор,—единичные отрезки. Эта игра уже нам встречалась в гл. 3. Там же было показано, что любое решение игры Г? = <а, Ъ, Ну, в которой конечные мно- жества а и Ь определяются равенствами (3.28) и (3.29), * является решением игры Г. ' Пусть У* — оптимальная -Стратегия игрока II в' игре Г*. Обозначим через , ть и + вероятности, с которыми выбираются числа- 6j и 1 — 6} (/**0, 1, п) согласно стратегии У*. Заметим, что при е a, i/e 6 справедливо соотношение Н (+ У) ^ ч z 1 при . ' X = у] п 4-1----g- при х = кд, . у = 1 — (п — к) __ или ж=1 — кд, у = (п—к)8} ---п при x = i — кд, у — (ц — к + 1)6 или х = кд, у — 1 — (п — к + 1) 6; 0 во всех остальных случаях. . .
ГЛАВА 4. ПРИЛОЖЕНИЯ 145. Предположим, что все чистые стратегии множеств а и Ь входят в спектр некоторых оптимальных стратегий X* а У*. Тогда по теореме 1.8 Н (О, У*) = По* + цп* (» + 1 - 4") = (4.36) Я(Л6, У*)« , . «= ~ ") + Як + Пл +1 — -у) = V, 1<А<ге. Суммируя-все эти равенства, получим 1 — Йо(4* ~ га) = <" + *)”• Аналогично, Н (1, У*) - По + Йп [п + 1-= и, — У*)= \ (4.37) (4.38) s= /n + 1 — -j") Пп-к + Й* + (4- “ Йп-к+1 — V, После суммирования равенств (4.38), мы придем к ра- венству \ . , • 1 — Пой—— (п 4- 4) v. (4.39) Из равенств (4.37) и, (4.39) можно найти и» и ц0, а затем, последовательно разрешая равенства (4.36) и (4.38), все остальные вероятности ц» и Л»* Наконец учитывая, что , можно найти V. В результате ь=о ‘ • " И 6 ’ 2 , 1 • п + 2 6 (и + 1) (и + 2) ’ -♦___ n — & 4-1 Як — Пй — (п+1) (п + 2)’ (4;40) Аналогично находится оптимальная стратегия первого игрока. Оказывается, первый игрок выбирает точки fc6 и 1 — fe6 с теми же вероятностями, что и второй игрок. Таким образом, объект поиска должен прорываться в точках к8 и 1 ~Л6, /с = 0, 1/..., щ выбирая их с вероят- но Г. Н. Дюбин» В. Г, Суздаль
146 ЧАСТЬ It. БЕСКОНЕЧНЫЕ АНТАГОНИСТИЧЕСКИЕ 'ИГРЫ - Z'" > костями, определяемыми формулой (4.40). Наблюдатель долщен маневрировать около этих 'точек и выбирать их с такими же вероятностями, что и объект поиска.. Пример 4.7 (теоретико-игровая модель по- иска на рубеже и его-про р ы в а пр и к на блю- дателях). При осуществлении.поиска на рубеже сторона (игрок I), имеющая к наблюдателей, может расположить их в любых точках отрезка [0, 11. Поэтому, множеством чистых стратегий первого игрока будет прямое произве- дение к „ экземпляров отрезка [0, 1J (т. е. ^мерный куб 10, 1J*).- Множеством чистых стратегий объекта поиска (игрока II), как и в примере 4.6, будет отрезок (0, 1]. Если наблюдатели маневрируют около точек ®г, • • ., xk, а объект поиска совершает, прорыв в точке у, то за функг цию выигрыша игрока I естественно принять вероятность обнаружения объекта .поиска хотя бы. одним наблюда- телем. Таким образом, рассматриваемая ситуациях моделиру- ется антагонистической игрой Г* = <®ft, jr.:, Н?}, где у — отрезок (0, 11, ак— прямое произведение к экземпляров сегмента [0, 1], Я* — вероятность обнаружения объекта ' х поиска. Когда вероятность обнаружения объекта* одним, наблюдателем 'определяется формулой (4.29), вероятность его обнаружения к наблюдателями будет равна . fl при т1п{|ач-рК6}, ((«!, Х4, ...» ®ft)> У)— в Пр0тивн0м^СЛучае/ , Решим игру Г*, Предположим, что наблюдатели будут, располагаться в тех же точках, что ив игре , примера 4.6, т. е. в точках — б + (1 — 26)(i — i)/(ra —1),.(1 i ?г)_. Находиться в одной из этих .точек более чем одному на- блюдателю, очевидно, невыгодно. Во всем остальном эти точки равноправны. Обозначим через X** стратегию иг- рока I, которая равновероятно выбирает любые наборы неравных друг другу точек xi. Если, число к>п, то, рас- , положив в каждой из точек х< по одному наблюдателю, игрок I обнаружит объект поиска с вероятностью 1.' По- этому будем считать, что к < п. Тогда число всевозмож- ных й-наборов точек х{, определяемых стратегией X*, будет равно С*. При прорыве рубежа в точке у по край- ней мере для Ca-i точек спектра стратегии X* значения -i Й I d %
1 ГЛАВА 4. ПРИЛОЖЕНИЯ • 147 функции Я* не меньше единицы, так как (см. пример 4.6) хотя бы одно Xi будет отстоять от у на расстоянии, не превосходящем 6. Следовательно, гЛ-1 .• (4.41) С другой стороны, если игрок II будет применять такую же стратегию У*, что и в примере 4.6, то его обнаружит не более А. наблюдателей. Поэтому х2, Л.иял), У*)<й/п. / (4.42) Из неравенств (4.41) и (4.42) следует неравенство (3.16). Факим образом, значение игры Т* равно fc/n, a X*h и У* — оптимальные стратегии игроков; Как мы видим, при оптимальном поведении игроков, вероятность об- ‘ паружения объекта поиска линейно зависит от числа на- блюда^елей. Разумеется, после того как эта вероятность достигает единицы, она перестает расти. Пример 4.8 (теоретико-игровая модель наступательного боя). Непрерывным аналогом/тео- ретико-игровой модели наступательного боя, рассмотрен- ной в примере 2.11, является следующая бесконечная ан- тагонистическая, игра. . ’ Обозначим через t момент начала нанесения «зелены- ми» ударов, по авианосному ударному соединению (АУС) «синих», а через г — момент использования «синими» средств радиэлектронного противодействия (РЭП), где О < f, г < Т. Примем «зеленых» за игрока I, «синих» — за игрока II .и введем обозначение x = t/T* у = г/Т. Тог- да чистой стратегией игрока I будет число х ^ [О, 1Г, а чистой стратегией игрока II — число у^ [0, 1]. Выбран- ные стратегии определяют ситуацию (я, у),~в которой игрок I получает выигрыш Жя, у). Множество ситуаций (я, у) • заполняет единичный квадрат [О, 11 X [О, 1], на котором определим, с учетом принятых допущений в примере 2.11 о боевых возможностях «зеленых», функцию выигрыша игрока I следующим образом: с^у—х) при ,х<у, Я(х, у) ^ \Ц1_-х)/2 с (1 — х) при X = у, при X > у. 10»
148 ЧАСТЬ II. БЕСКОНЕЧНЫЕ АНТАГОНИСТИЧЕСКИЕ ИГРЫ Приняв с = 1, получим игру на квадрате, решенную в примере 4.1. Приме-р 4.9 (восстановление контакта с уклоняющейся подводной лодкой) [39]. Пред- положим, что подводная лодка, находившаяся в надвод- ном положении, обнаружена самолетом с помощью ради- олокационной станции. Установив факт обнаружения, подводная лодка произвела срочное погружение и начала уклонение в подводном наложении. Пусть самолет для восстановления контакта использует через . промежуток времени t активный радиогидроакустический буй, даль- ность действия которого равна 8. В свою очередь будем считать, что подводная лодка, выполняя уклонение, через промежуток времени t находится в одной из точек круга единичного радиуса. Очевидно, что если 8 > 1, то самолет, поставив буй в. центре данного круга, восстановит кон- такт, а в противном случае восстановление контакта бу- дет зависеть от расстояния между буем и подводной лод- кой. Поэтому при 8 < 1 самолет выбирает точку постанов- ки буя, а подводная лодка точку своего положения через время t В результате складывается так называемая ситу- ация вторичного поиска (или поиска по вызову), которая относится де антагонистическим конфликтам. Не ограничивая общности, будем считать, что в исход- ный момент подводная лодка находится в точке (0, 0), а через промежуток времени / — в точке у = (уь у2), где 1-Примем подводную лодку за игрока Нечи- стой стратегией которого является выбор точки у е у = = {(У1, У г) IGi + 1/2)^ 1}- Соответственно самолет примем за игрока I, чистой стратегией которого является выбор точки х е х = {(^i, *г) I (*i + ®г) < 1 }• • Тогда моделью рассматриваемой ситуации вторичного поиска будет беско- нечная антагонистическая игра Г = <ж,у, Я>, где н\х,л} = \1' есл” +(».-».)<«. (МЗ) 10 в противном случае. Пусть X* и У* — оптимальные стратегии игроков I и II, а Га и Г/—преобразования кругов х я у, поворачи- вающие их соответственно на углы а п р. .Через Ха и Ур обозначим меры на кругах о? и у, которые, определяются
ГЛАВА 4. ПРИЛОЖЕНИЯ 149 равенствами Х% (а) = X* (jraxa), a cz х, У$(Ъ) = У*(?7р1&), fed у. Оказывается, чтск при любых а, р е [0,2л] страте- гии Ха и Yр будет оптимальными стратегиями игроков в игре Г. Деиствительнр, если Н(х, У*) < Н (X*, У*) С Н (X*, у), х е= х, у е= у. то вследствие равенств Н {Т^1 (я), (у)) = Н (х, у) вы- полняются неравенства ,H(Xty} = ^H(x,y)dX^x)~ X = J Н (Та1 (х), Та1 (У)) Л (Та1 (X)) ± ч . z , -Яил ТаЧ^ ^ЯСХ*, У*), (4.44) H(x1Y;')^= Н (x,y)dY$(x) = У = Н (Тр1 (х), У*) < Н (Х*\ У*). (4.45) С другой стороны, интегрируя нераврдств'а (4.44) и (4.45) соответственно по Ур и Ха, мы придем к фавенст- ву Я(х:, Ур)=Я(Х*, У*). Из последнего равенства и неравенств (4.44) и (4.45) следуют неравенства (3.16) дляХа й Ур, т. е. для всех а, р, хех, у^у справед- ливо ' ' ' H(x,Yl)<H(X*,Y;)^H(X*,y). (4.46) Таким образом, Xj и Ур - оптимальные стратегии иг- роков.4 ~ ~ Определим теперь меры X' и Y равенствами X (а) = J JdX^da, а ах. • О а ~ ^(b)=^ndy^pi ч о
150 ЧАСТЬ П, БЕСКОНЕЧНЫЕ АНТАГОНИСТИЧЕСКИЕ ИГРЫ Покажем, что .меры X и Y являются оптимальными стра* тегиями игроков в игре Г. Действительно, в силу нера- венств (4.46) л 4 2Л " Я (х, У) = ^- J Я (х, у;) W < В. (Х*, у;). . (4.47) о По теореме 3.2 выигрыши во всех ситуациях равновесия (X*, Ур) равны между собой, поэтому г 2Л 2Л - у;)<*₽=я(х:, у;), о о Следовательно, неравенства (4.47), эквивалентны неравен* ; ствам ''' - - Я(х,Г)<Я(Т, Г), уех. Аналогично доказываются неравенства \ Я(Х,»)>Н(Х,У), v ' .Таким образом, для стратегий X и У выполняются не^ равенства (3.1б)?, в силу замечания к . теореме 3.6 эти стратегии ^являются оптимальными стратегиями игр’оков. Меры X и Т, по самому их определению, инвариант- ны относительно поворотов на любые,углы a и Р, т, е, X (а) = *Х (Таа), a cz х, as [0, 2л]; ; ' У(Ь)=.У(Т>), &<=у, ре [0, 2л].: ’ Любую инвариантную' относительно^ всех поворотов меру Х^Х можно задать мерой X, определенной на от- резке х = |0, 1], причем мера множества . а = {(жх, х^ | = х cos a, х2 = х sin а/ г1 будет определяться равенством а2 ’ •^(а) = ^-papX(r). ' (4.48)
ГЛАВА 4. ПРИЛОЖЕНИЯ 151 _ Если же мера X определяется равенством (4.482, где X — произвольная вероятностная мера на отрезке а>, то очевидно, она инвариантна. Аналогичное утверждение справедливо для любой инвариантной стратегии Y s У и произвольной меры на у~— (0, 1|. Как мы уже видели, игроки в игре Г имеют оптимальные инвариантные стра- тегии. Если мера X сосредоточена *в точке ж&ж,то мера будет равномерно распределен- ной мерой'на окружности-pa- /ZZ"— диуса х. Это. наводит на мысль, что решение игрыГ= у, Н), / 7 Za\\' в которой игроки в качестве чи- / / / \ стых стратегий используют рав- II I ) J/f I номерные меры на концентри- \ \ \ 7 ческих- окружностях, будет_ре- \\ / / шением игры Г. Функция Н бу- \ У' у > дет равна математическому -----"Ту ожиданию выигрыша при ис- ------------------- .. пользовании игроками только - Рис- 4.2. что описанных стратегий. . Множества х и у <йожно. отождествить с точками сот- резка 10, U.. Тогда выбор чистых стратегий хе (0,-11, у.е [0, 1] в игре Г будет означать выбор, смешанных стра- тегий в игре Г, которые соответствуют_равпомерным рас- пределениям на окружностях радиусов х и у. В этом слу- чае функция Я определяется равенствами Я (ж, у\ = arccos ——— при (ж 4- у) >• 6, я %ХУ . _ _ 1 IX — у I < S, 1 _при (^ + у) < 5, 0 в противном случае. / (4.49) В самом деле, (см. рис. 4.2) для любого у^у, ]/"у1 + У2 == математическое ожидание выигрыша пер- вого игрока Н(х, у), будет равно относительной длине ду- ги окружности радиуса л?, находящейся внутри круга ра- диуса б с центром в точке у. В свою очередь, эта длина равна 2а/(2л), где угол а определяется цз равенства х2 +
152 часть и. весконечныекантагонистические игры ’ + у2 — 2ху cos а = б2. ^Разрешая последнее. равенство отно- сительно а при х + у>6, lx — у\ б, у = (i/i, у2\ У1 + у1 —У) мы получим равенство Н (х, у) = — arccos х . ж 2ху Так как последнее выражение справедливо для всех чи- стых стратегий у, расположенных на окружности радиу- са у, интегрирование по вероятностной мере, равномерно распределенной по этой окружности, при указанных зна- чениях х и у, дает равенство (4.49). Если же (х + у) ^б, то (см. рис. 4.3), очевидно, любая окружность радиу- са б описанная около лю- бой точки у, расположен- ной на окружности радиуса у, целиком захватит окруж- ность радиуса х. Следовательно, Жх, у) =?= 1. Наконец, ес- ли |х —у|>б, то (см^ рис^_ 4.4) эти окружности не пере- секаются, и поэтому Жх, у) =0. _ Докажем, что любая пара оптимальных стратегий X* и Y* в игре Г определяет решение игры Г. Пусть X' — мера на х/ определяемая стратегией X*, Y' — мера на У,определяемая стратегией У* ЛТо определению функции Я ЖХ*, У*) = ЖХ;, У'), Жх, У*) = Жх, У'), ЖХ', у)-
ГЛАВА 4, ПРИЛОЖЕНИЯ 153 ==ЖХ*, у). Аргументы х и у функции Н надо понимать» как смешапные_стратегии, выбирающие точки окружно- стей радиусов хну равновероятно. Вследствие только что приведенных равенств и оптимальности стратегий X* и Y* справедливы неравенства Н(х, Y') ЖХ', Г) ЖХ', у) (4.50) при всех х и у. * Предположим, что для некоторого xQ'^ х Жх°, У')>ЖХ', У'). (4.51) Тогда в силу инвариантности стратегий У' при любом-а Я(Га(^), У') = Жх°, У'). Следовательно, при всех х еж, удаленных от центра круга на такое же расстояние, как и х°, справедливо равенство Жх, У')=Жх°, У'). Прини- мая во внимание неравенство (4.51) и последнее равенст- во, получим Н (х, У') > Н (X7, У'), х е х- Интегрируя это неравенство по мерр, равномерно распределенной на окружности, содержащей точку х, мы придем к неравен- ству Жх, У') > ЖХ', У'). Это неравенство противоречит первому из, неравенств (4.50). Следовательно, для всех х выполняется неравенство Жх, У'ХЖХ', У'). \ Аналогично доказывается неравенство Н(Г,У<)<яф,У),. Таким образом, для получения оптимальных стратегий игроков в игре Г достаточно решить игру Г. Заметим, что при 1/V2 < б< 1 игра Г имеет решение в чистых стратегиях х* — У1 — б2 ,ч у* = 1. Действительно, при 1/V2 < 6 < 1 имеем IV1 — 62 — у'\ ^б. Поэтому min Н ( ]/1 — S2 , у) v 1 1 — 2б2 — mm arccos л у—~ 1/>д-И1-д2 __ 1 ' Л 772 е== min 11,’• 2 /1_62 у 1 — 2б2 4- Т2 mm arccos------ vXS-Vi-J2 2/1 —б2 у
154 - .ЧАСТЬ И. БЕСКОНЕЧНЫЕ АНТАГОНИСТИЧЕСКИЕ ИГРЫ •.Функция, которая стоит под знаком arccos; монотонно возрастает. Так как функция arccos у является монотонно убывающей функцией, минимум функций. ff((l — 6s)y) до- стигается в точке у == 1. Следовательно, Я((1 - 6s), у) > 1). (4.52) . С другой стороны, . ' max Н (х, 1) =s max (0, — max arccos —^-=----к Так как функция, стоящая под знаком arccos, достигает, минимума в точке г = У1 — 6s, а функция arccos х моно- тонно убывает, то тах77 (®, 1) = Я (]/1 — ба , 1) и ' 4 JC Н(х, 1). (4.53) Неравенства (4.52) и_(4.53) доказывают оптимальность стратегий х* » VI — б\ у* и1, Значение игры будет равно . р ss A arccos . 26 - arccos /1 — б2. (4.54) я 2/1-б2 V Стратегии ж* «VI — б2, y*«l в игре Г означают, что подводная лодка/должна с равной вероятностью-"следо- вать в одну из точек окружности радиуса единица, а са- молет должен с равной вероятностью сбрасывать буй в одной из точек окружности радиуса VI — б2. В этом слу- чае вероятность обнаружения подводной лодки будет за- даваться формулой (4.54). Решение игры Г в общем случае,нам неизвестно. От- метим -только, что- при -б «1/2 оптимальная стратегия первого игрока состоит в выборе с вероятностью 1/7 точ- ки нуль и с вероятностью 6/7 — точки V3/2. Оптимальная стратегия игрока II состоит в выборе с вероятностью 1/7 точки нуль и с вероятностью 6/7 —точки 1. Значение игры равно 1/7. Это означает, что подводная лодка с ве- роятностью 1/7 остается на месте и с вероятностью 6/7 двигается в одну из точек окружности единичного радиу- са. Самолет с вероятностью 1/7 сбрасывает буй в центре круга и € вероятностью 6/7 в одной из точек окружности
ГЛАВА 4. ПРИЛОЖЕНИЙ 455 радиуса V3/2. При таком поведении вероятность обнару- жения подводной лодки будет равна Л/7. Без труда мож- но убедиться в оптимальности указанных стратегий. Бо- лее подробно о решении игр, подобных рассмотренной в этом, примере, можно узнать из 1331. Игра Г относится к классу игр инвариантных при не- которой. группе преобразований. Общая теория таких игр содержится в4291. § 4L3. Примеры приложений в технике и других ' областях человеческой деятельности 2 J 1 Рис 4.5. (4.55) Пример 4.10 (расчет оптимальных сече- ний балки в_условиях отсутствия инфор- мации^ о свойствах материала). Пусть неразре- занная балка единичной длины лежит на трех равноотстоя- щих опорах 1, 2, 3 (см. рис. 4.5) и находится дюд-равномерно рас- пределенной нагрузкой. Опоры >яв- ляются призматическими стойка- ми. и суммарная площадь их сече- ний Л, F2 и Ft равна единице. Если Rf— реакция i-й опоры, то напряжение, которое в ней возникает, равно RJFi. Необходимо выбрать сече- ния F2 и Ft так, чтобы максимальное напряжение, которое в них возникает, было минимально. Из уравне- ний статики следует, что . R. + Ri + Rt^i Ri “ Йз. При отсутствии информации о материале^ из которого изготовлена балка, и опоры, больше никаких сведений о реакциях не имеется. Поэтому в этих условиях возможен любой набор реакций, лишь бы он подчинялся уравне- ниям (4.55). Из соображений симметрии ясно, что Ft « Ft. .Положим х Ri, a y^Fi. Тогда максимальное на- пряжение запишется, в виде а (®, У) = tnaX (4.56) Задача проектировщика v выбрать такое число у (или, что. тоже самое, сечение средней опоры), при котором
15Й ЧАСТЬ П. БЕСКОНЕЧНЫЕ АНТАГОНИСТИЧЕСКИЕ ИГРЫ величина Н(х, у) была бы минимальна. Так как он не имеет никакой информации об у, рассчитывая на худший случаи (как это обычно и нринято при проектировании), он дол- жен считать, что реакция у для него наименее благопри- ятна. Следовательно, как это было уже не раз, поставлен- ная задача сводится к игре против природы, которая в данном случае старается максимизировать функцию вы- игрыша Н(х, у). Эта игра нам уже . встречалась совсем в других обстоятельствах (пример 4.4). Значение этой игры равно двум. Проектировщик имеет чистую опти- мальную стратегию у* = 1/2, а. стратегия, природы состо- ит в выборе с равными вероятностями точек ^ = 0 и х~ / = 1. Следовательно, в условиях поставленной задачи Fz = = 1/2, Л = F3 - 1/4. - Если бы проектировщик заранее знал реакции опор, то полагая ===/?<, бп получил бы на’всех трех балках одинаковые, равные единице напряжения. В рассмотрен- . ном примере он такой.информации не имеет, естественно поэтому, что v> l. Величину и — 4 можно считать цен- ностью’ информации о реакциях опор.. Пример 4.11 (расчет оптимальных сече- нии б а лк и при наличии информации о свой- _ ствах материала). Пусть проектировщик знает, что опоры жесткие, материал, из которого сделана балка, одно- родный и т. д. Как известно из теории изгиба 'балок (см., на- пример, [4, 51J), в этих предположениях можно выг числить точные значения сечений: Л == 3/16, F2 = 10/16, * F8 = 3/16. В реальных условиях эти предположения могут не выполняться. Предположим, однако, ^то возмож-. ' ные деформации балки таковы, что реакция х средней* опоры лежит в некотором отрезке [а, р]. Рассуждая ана- логично предыдущему, мы придем к выводу, что проек- тировщику необходимо решать игру, в которой функция выигрыша природы задана равенством (4.56), множество стратегий составляет теперь не отрезок [0, 1], а отрезок [а, р]. Множество стратегий, проектировщика остается тем же, что и в предыдущем случае. Эта игра является частным случаем игры, фазобранной в примере 4.4. В обо- значениях примера 4.4 0i = 0, р2 = 1“а, п = 2, У1 = =0/(1 + 0 — <*)» Уъ = (1 — а)/(1 +0 -*• а). Следовательно, Z/* = У Г =» 0/(1 + 0 — а); Значение игры равно (h «Ь =
примем равными единице. .ГЛАВА 4» ПРИЛОЖЕНИЯ <57 Таким образом, « Е»_____Р____ Г» __ П __ 1 1 - ОЬ Г2“1+₽-а’ гз—2 1J-P—а’ Как и следовало ожидать 1 и 2, ибо проектиров- щик имеет некоторую, хотя и неполную, информацию о реакции средней опоры. Цен- ность этой, информации рав- на ft —а. Предположим теперь, что для проектировщика непри- емлемы напряжения, превос- ходящие некоторое допусти- мое напряжение о0. Мы бу- * дем считать, что ситуация, в которой не возникает на- пряжений, , превосходящих допустимые, не порождает потерь для проектировщика. - В противном случае его потер! Тогда возникает игра против природы ГСо = <ж, у, ЯСТо>, функция выигрыша которой задается формулой „ . . /О при , Н (х, р)<а0, (1 прИ Н(х,у)>о0, или ^а0 — о при— ------------2—, о , о 1 в противцохм случае. На рисунке 4.6 показаны области, в которых функция Яа0 (я, Нравна нулю и единице. Заметим, что чистая стратегия второго игрока у=* = (о0 — 1)/о0 доминирует все чистые стратегии у<у> а чистая стратегия у «5» 1/а0 — все .чистые стратегии у > у. Следовательно, по теореме 3.10 любое решение игры Г°го~1 1] , — I, является реше- но Га0 = <Ж' У'> гДе У1 = нием игры г а0.
158 ЧАСТЬ П, БЕСКОНЕЧНЫЕ АНТАГОНИСТИЧЕСКИЕ ИГРЫ . Пусть у2, Н^у, где (*,?)« У^У2, 1 в противном,случае, = %±11 У [ 2 ’ 2 ]•• Тогда игра Г^о изоморфна игре Г^о, так как при заме- ,не переменных?^1) == у'а0 —(о0— 1)/2, у'&у1, отрезок у1 отображается в отрезок г/2, а Но0 (х, у1) « Н„о (х, g (|^))’*По' теореме 3.5 достаточно решить игру Г20. *- Обозначим через игру, в которой множества стра- тегий Игроков таковы же, что и в . игре Г*о, а функция выигрыша во всех ситуациях на единицу меньше.- Вслед- ствие теоремы 3.12 оптимальные стратегии игроков в этих играх совпадают, а значение игры Г’о на единицу меньше? значения игрыГ$0. Заметим теперь, что Гъ0= = — Г^0-1)/2, где Г(аоГ1)/а—игра, разобранная в примере 4.6. Следовательно, в силу- теоремы 3.5 значение игры равно — 1/п, где п определяется равенством Х4.32) при б =Хо0 — D/2. Так как значения игр ГСТ(|, и Гд0 рав- ны между собой и отличаются на единицу от значения игры Г®0, значение игрыГац равно (п —1)/п. В силу те- оремы 3.5 оптимальной стратегией первого игрока в игре Га0 будет' стратегия, которая равновероятно использует точки х{= (1— 1)/(ге— 1) (1<1^л), так как эта страте- гия была оптимальной стратегией в игре Г(<,0-1>/2» а опти- мальная стратегия игрока II равновероятно использует точки - - \ VI (/“!)> !</<«» о о так кай ее образ при отображений g равен оптимальной стратегии игрока II в игре Г’о> равной оптимальной стра- тегии первого игрока в игре Г(СТа_1?/а.~
ГЛАВА 4. ПРИЛОЖЕНИЯ 159 Пример 4.12 (оценка параметров мультиол и* а л ь и о г о р а с пр е д ел ев и я, приложение теории игр в социологи и). Как известно, в’-обществе можно выделить раз- личные группы, которые характеризуются теми,или иными призна- ками. Например, группы курящих и некурящих людей.-Предпо- ложим, что статистику потребовалось определить долю людей, характеризующихся признаком I. Пусть т признаков взаимно ис- ключают друг друга, число людей, которых можно опросить^ равно п < 2V, а число людей, характеризующихся признаком I, равно кл т ' , (1 < i < m), 2 ^1 s N* Кроме того, будем считать, что т — до- i—i - статочно велико, а п —достаточно мало "по сравнению 2V$). Тогда, если статистик выбирает для опроса любого из N человек с веро- ятностью 1/2V, то вероятность того, что выбранный индивидум при- надлежит группе I, будет равна - Pi— (4.57) Таким образом, налицо п 'испытаний Бернулли, каждое из ' которых имеет т исходов, а вероятности этих ирходов образуют вектор р — (рь р* .ря). Как известно, вероятность того, что из' п опрошенных к\ будут принадлежать первой группе, « второй и т, д., наконец, кт — группе т, равна п! кл' Информация, которой статистик располагает. после опроса, пред- ' т ставляет собой вектор к = [к^ к^ ..., km)t S Ф*8 Л Следователь- 1-1 но, задача статистика состоит в том, чтобы указать вектор т ' у (Л) = (р, (fc),Ут (*))’, 2 = 1.который по его- мнению^ , будет давать распределение людей по груцпам. Обозначим через Я(р, и) величину потерь статистика, если реальная ситуация характеризуется вектором р, а оценивается' вектором и. В этом случае математическое ожидание его потерь будет равно - я (/?. У) = 2 fcjfcgl ... ктГ • • • Р™Н v • Л • • _ где у —набор векторов у (к), k^(kv к^, Ясно, что стати- стик будет стараться уменьшить свои потери. Его возможные действия определяются множеством всевозможных наборрв век- * / _ — *) Такое предположение в некоторыхслучаях весьма упрощает ситуацию, а. иногдаг попросту неприемлемо,
160 ЧАСТЬ II. БЕСКОНЕЧНЫЕ АНТАГОНИСТИЧЕСКИЕ ИГРЫ | т • торовр(&), 2 у.(&)=!, При фиксированном к множество векторов i=i образует симплекс у (к), который является подмножеством (т— 1)- мерного пространства. Тогда любое его действие определяется * множеством у~ ш (&), где произведение берется по всем векто- h к . т рам к = (к^ к2, ...« km)f S к^ » 1.Это множество является выпук- . <=1 , ' ~ лым подмножеством JjRw(fc), где Rm (&) — евклидово простран- fe - ство, в котором лежит симплекс у (к). Задачей статистика является йахождение оптимальной .стратегии в игре с природой Г == <р, у, ~* Н (р,- у)>, где р—симплекс, состоящий из вектора р = (рх, ра, т i=l / , Рассмотрим различные формы задания Я(р, к), где р и » I суть тп-мерные вероятностные векторы ; Случай!. {0, если max I р4 —' 1 < 8, * (4.58) 1 в противном случае. При такой функции Л(р, к) функция Я(р, у) будет равна вероят* ности того, что статистик, используя стратегию у, ошибется по- крайней мере на 8. Игра Г в этом случае состоит в том, что ста- тистик минимизирует вероятность недопустимой для него ошибки, а природа всячески мешает этому. Во многих случаях игра, функ- ция выигрыша которой определяется функцией, задаваемой равенством (4.58), адекватно моделирует рассматриваемую ситуа- цию. Однако решение ее, даже если число признаков давно двум, в аналитическом виде неизвестно. Поэтому такие задачи следует решать численно. Случай 2. т (4.59) i=l Функция Н(р, у) в этом случае будет равна -среднему расстоянию между реальными вероятностями и предполагаемыми — иными словами равна матема!ическому ожиданию потерь статистика. Игра Г состоит в том, что игрок II минимизирует потери, а игрок I (природа) максимизирует. Стратегиями игроков явля- ются множества у и р. ♦) Здесь модель огрублена, так как pi определяется форму-» лами (4.57), однако при большом N это не играет роли.
ГЛАВА 4. ПРИЛОЖЕНИЯ 161 Попытаемся найти решение игры Г. Сначала заметим, что каждое из слагаемых правой части формулы (4.59) является выпуклой функцией относительно второй переменной. Поэтому Я(д, появляется выпуклой функцией в как сумма выпуклых . функций. Следовательно, она выпукла и па симплексе вероятности ч - пых векторов, являющихся подмножеством Rw* Из этого вытекает, ' что функция Я (р, у) выпукла по второй переменной. Теперь в силу теоремы 3.15 игрок II имеет чистую оптимальную стратегию. Этого, очевидно, нельзя сказать про первого игрока: если бы он имел чистую стратегию р*, то игрок II, полагая при всех к вектор у (к) === р*, проиграл бы нуль, чего он никак не смог бы добиться. Если бы игрок I выбирал свои чистые стратегии согласно вероят- ностной мере, задаваемой плотностьюра(р)=с (а) (Pv Р2, •••> Рп)а, где с (а) — нормирующий коэффициент, т. е. С(а) ~ J(Pr Р2, .... Ра)а^’ ч^ р— симплекс вероятностей. Почему мы взяли плотность такого вида? Дело в том, что все вероятности равноправно входят в функ- * цию выигрыша. Поэтому естественно ожидать, что плотность будет симметрической функцией, т. е. функцией, не меняющейся при любых перестановках элементов. Произведение всех вероят- ностей — самая простая из симметрических функций,' «гармониру- ющих» с функцией выигрыша игры Г. С другой стороны, несом- ненно трудней угадывать, вероятности, если они приблизительно равны. Выбирая а достаточно большим, мы как раз добиваемся того, чтобы игрок I чаще выбирал точки р&р, элементы которых приблизительно равны. Очень большим брать число а тоже нель-. зя — это почти тоже самое, что выбор с вероятностью единица вектора (l/wi, Цт, ..., 1/т), что, как мы уже видели, нехорошо. ' Если игрок I применит стратегию ра (р), та в ^йлу строгой выпуклости функции Я (р, у) ее минимум будет достигаться в одной точке. Мы не будем здесь останавливаться на вычислениях. Они идейно очень просты, так как функция Я(р, у) квадратична по каждому у (к), и после дифференцирований все сводится к линейному случаю. Однако вычисления технически довольно трудоемки. Читатель, знакомый с простейшими свойствами Г- и В-функций, может провести их самостоятельно. Скажем только, что минимум достигается в точке у*', для которой при всех к == -5=7. (кц kit t«•, кm) (4.60) N у* , где₽ = а + 1, N = п + тп(а 4-1). Таким образом, предположение об оптимальности стратегии Р'а (Р) приводит нас к утверждению об оптимальности у* — чистая оптимальная стратегия всегда содержится среди точек минимума функции Н (р* (р), у). Минимум в нашем случае единствен, 11 Г, Н, Дюбин, В, Г1 Суздаль
162 ЧАСТЬ П. БЕСКОНЕЧНЫЕ АНТАГОНИСТИЧЕСКИЕ ИГРЫ с Далее, из теоремы 3.7 следует ♦), что Я (р, у*) » рп, где vn — значение игры Гл. ' . Вычислим величину Я(р, у*). Для этого сначала заметим, что JL ' о 2 CnPk U — Р)“ = + Р)”1в=1 = пА h==0 п (4.61) ' 2 С“Р& “ Р^~Ь к^==‘~ду nP^+i~- Р)П~г Ь-1 ~ fe«==o =г « (» - 1) Р2 + пР- Далее, . । - / m \ н (р, у*) = 2 fcj fc2l ... kml prp?2 “ • Pm ( 2 (pi~y* W)2 j = \ i=l * J . • ' / m \ -2 w"... v ' - . s,p,)"-’1 (f,-№x 1 jq . . _ 2(”—m1 ./ Pi \ftf / Pi~i V4-1 У ... ^_х1 fc{+li ... kmi l 1 - Pi j • • • I 1 — Pi j x Ч 4 . 4 7 4 z v! Pi+' Vi+1' ( Pm \hm : \i~Pij ”\l—Pi) ' П U к , - -S. где ki = (fo, ki+u km). Теперь, подставляя значения у*(кл), определяемые формулой (4.60), и пользуясь равенствами (4.61), получим- я (А У*) =-jy- 2 pii - 2nN - п + к2) + г=1 ' - • • ’ , ' +4-(» + 2п₽-2ЛГ₽+тр2). Если у* — оптимальная стратегия игрока II, то р должно мини- мизировать' величину, стоящую" вне знака суммирования правой х *) Конечно, если верны наши предположения,
ГЛАВА 4. ПРИЛОЖЕНИЯ 1вЗ части предыдущего выражения. Эта величина —^квадратный трех- член относительно' 0. Очевидно, что при — Уп/m опа достигает свой минимум. Наконец выберем N таким, чтобы функция Я(р, у*) не зависела от р. Для этого необходимо и достаточно выполнения равенства 2nN т- п + п2 « О, которое справедли- во при Л^=п±Уп. Hq при N — n — ]/п величина у(п) « sss п! (п — У<г) .> 1, и поэтому не может, быть вероятностью. Сле- довательно, N =• п + У/г. t Таким образом, при £ « N в п + Ул стратегия у* тако- ва, что применяя ее, игрок II независимо от действия' игрока I проиграет ровно .. ' < * . __ If ( 2п y5i , У п п \ ч« + у «Я’ +"2(й+у") “ + = ' ' - . тп — 1 С другой, стороны, лучшим ответом игрока. II па стратегию ц* игрока I (Р = У?г/ллг, N = п 4- Ул)является стратегия у* при тех же самых, р и N, Следовательно, игрок I не может получить боль- т — 1 • т — 1 ше —77—77=72,1, е. величина /4"; является значением /п (1 + у п)” . m(i+у пУ игры, а.р* и у* при р « Уп//п, N » п + У» — оптимальными стра- тегиями игроков. Другими словами, если статистик узнал, что ре- \ аультат п испытании характеризуется вектором (ки к2, кт), то его оптимальное поведение определяется- распределением. веро-, ятностей y*j • ' '
' - ЧАСТЬ III МНОГОШАГОВЫЕ ИГРЫ Глава 5 ОСНОВЫ ТЕОРИИ § 5.1. Конечные позиционные игры 1. Природа и структура конечных позиционных игр. В предыдущих главах теоретико-игровому анализу под- вергались такие антагонистические конфликты, динамика развития которых не оказывала влияния на поведение’ участников. Отсюда стратегии игроков при задании игры вводились как элементы некоторых абстрактных мно- жеств, а процесс игры сводился к независимому выбору . каждым игроком одной из своих стратегий. Вместе с тем во многих содержательных и практиче- ски важных играх, исходя из динамики конфликта и сте- пени информированности участников о фактически скла- дывающейся обстановке, полезно использовать стратегии, которые отражают как динамику конфликта, так и сте- пень информированности в процессе этой динамики. Конфликты, в которых детализируется поведение уча- стников конфликта во времени, моделируются многошаго- выми играми. Частным случаем многошаговых игр явля- ются позиционные игры. Понятие позиционной игры восходит к работе Церме- , ло [73], изучавшего случай полной информированности игроков. В принятой сейчас форме позиционные игры бы- ли определены Нейманом и Моргенштерном [36]7 а также Куном [31], которые учитывали степень информирован- ности игроков. Здесь мы следуем формализму, предло- женному Воробьевым 120], согласно которому дадим еле-" дующее определение. Определение 5.1. Деревом игры {древовидно упоря- j доченным множеством) называется конечное множество j К, частично упорядоченное отношением <, в котором: а) каковы бы ни были а, Р, е Я, из условий а < у и р < 7 следует, что либо а р, либо Р а (условие предпочтения сверху Г;
ГЛАВА 5j ОСНОВЫ ТЕОРИИ 165 б) существует такое что. q^q для любого q^K- - s Элементы древовидно упорядоченного множества назы- ваются позициями. В каждой позиции делает ход один из игроков I, II, 0, где цифрой 0 обозначен фиктивный иг- рок (природа), которая делает ход согласно заданному распределению вероятностей. Дерево игры обычно изображается графически с по- мощью диаграммы — плоской фигуры, состоящей из ко- нечного числа вершин. Вершины являются позициями, а ребра соединяют позиции, непосредственно следующие друг за другом. Ребра, соединяющие некоторую позицию с непосредственно следующими за ней, называются аль- тернативами этой* позиции. Альтернативы каждой пози- ции нумеруются натуральными числами (мы будем нуме- ровать по часовой стрелке). Если позиции а и [} находят- ся в отношении а < [}, то позицию а называют предыду- щей, а позицию 0 — последующей. Позиции, не имеющие последующих, называются окончательными, а остальные — неокончательными. Множест- ва окончательных и неокон- чательных позиций будем обозначать соответственно че- рез Т и Q. Очевидно, что T(}Q = 0 и TUQ = K. Построение диаграммы иг- ры начинается ’с начальной позиции, в которой указыва- ется, какой из игроков дела- ет ход (рис. 5.1). Из верши- ны проводятся ррбра, соот- ветствующие альтернативам' игрока, который делает пер- вый ход. Они соединяют вер- игроков, которые де- шину с'вершинами (позициями) лают следующий ход, и т. д., до тех пор пока не будут обозначены окончательные вершины. 11а диаграмме рядом с каждой вершиной цифрами О, I и II указывается игрок, который -делает ход. Каждая окончательная вершина. определяет единст-. венную цепь — последовательность идущих друг за другом Дуг, ведущую от начальной вершины к данной.. Эта цепь
166 ЧАСТЬ' Ш. МНОГОШАГОВЫЙ ИГРЫ является’ партией игры. Число различных партий равно числу окончательных вершин. 11а множестве окончатель- ных вершин определена функция 3/U), которая указыва- ет, сколько выигрывает игрок I, если .игра закончится, в вершине t е Т. Разбиение*) множества Q на подмножества Qt (i — ««О, I, II)-позиций игрока г устанавливает чередование ходов. Поэтому множества Q< пазываютсямножествами очередности* т. е. в позиции q&Qi очередность хода при- надлежит игроку i. * Каждое из множеств очерёдности разбивается на по- парно пе пересекающиеся информационные множества. .При этом всё позиции, из одного информационногохмво- • жества должны иметь одно и то же число альтернатив и никакая.позиция не должна следовать за другой пози- цией из того же самого информационного множества. Со- держательный смысл информационного множества \состо- ит в том, что игрок в каждый мо- мент игры знает, в каком инфор- мационном множестве оп нахрдит- ся, но не знает, в какой именно позиции данного множества. Оче- с х видно, что если информационное у множество состоит из одной пози- ции, то игроку известно, как про- текала партия до этого момента. - Поэтому говорят, что игрок имеет полную информацию в игре, если каждое его информационное мно- жество состоит из одного элемен- та. Семейство всех информацион- . ных множеств игрока i • (t = О, I, < II) будем обозначать через Ut* принимая, что каждце множество из С70 одноэлементно. На диаграмме игры позиции, при- надлежащие одному и тому же информационному мцо- — жеству, объединяются замкнутыми линиями (рис. 5,2). Таким образом, динамика конфликта отражается в игре посредством множеств очередности, а информатив- *) Под разбиением понимается полное разложение множества на'Непустые и непересекающиеся множества (в данном случае Qi П‘<2в^= 0Л*хП &« Ф. <?иП Qq « Ф, CiU «hU « 0. ^5 $ t? $ Рис. 5.2.
. ГЛАВА 5. ОСНОВЫ ТЕОРИИ 167 ность игроков, определяется семействами информацион- ных. множеств. j Определение 5.2. Позиционной структурой С на- зывается следующая -система: а) ориентированное дерево позиции К с начальной по- зицией (дерево отражает структуру ходов, т. е. связь каж- дого хода со всеми другими ходами; а начальная пози- ция—-первый ход игры); б) разбиение множества Q = К\Т; всех неокончатель- ных позиций на множества очерёдности QQi Qh Qn (раз- биение указывает для каждого хода, какой из игроков его делает); ” — ' в) подразбиение .множеств очередности Qi и Qu на информационные множества Ui и Un' (подразбиение от- ражает информацию игрока i (i ?= I, II/ для каждого его хода на дереве игры); . - г) вероятностные распределения на множествах аль- тернатив^ каждой позиции q из С70;' ... . - / д) нумерация^ альтернатив каждой позиции из одно- го информационного множества одними и темп же чис- лами 1, 2, ..., к (каждое число определяет дю одной аль- „тернативе в каждой позиции данного информационного множества). Процесс игры с позиционной структурой С определя- ется следующим образом. Первый ход сострит в выборе альтернатив в. начальной .позиции qv. Пусть п ходов уже произведены,; в результате чего получена позиция t е Т. Тогда процесс считается законченным, а игрок i (i = I, II) получает выигрыш M^t); Если; позиция q^Q^ то игра переводится из позиции q в одну из последующих позиций, . которая определяется- согласно. распределе- нию вероятностей на множестве альтернатив позиции q. Если же q^U{aiQu U\-j-e информационное мно- жество игрока i (&==I, II, /==1, ...5, 5 — число инфор- мационных множёств игрока г), то игрок f, зная, что на- ходится в одной из позиций информационного множества Ui, выбирает произвольно одну из альтернатив^ и тем са- мым игра приходит в позицию g и т. *д. Заранее определенную последовательность ходов игрока в зависимости от информации о ходах -другого игрока и ходах игрока 0 (природы) будем называть W-*
168 ЧАСТЬ III. МНОГОШАГОВЫЕ ИГРЫ стой стратегией игрока. В таком понимании чистая .стра- тегия, будучи планом проведения игры со структурой С данным игроком, предопределяет выбор одной из аль- тернатив, имеющихся в его распоряжении на каждом очередном ходе. Формально чистой стратегией игрока i в игре со структурой С называется функция, определенная на £7», значениями которой являются альтернативы информа- ционных множеств. Если игрок имеет г информацион- ных множеств, причем любая позиция l-ro (Z = 1, 2, ... ♦.., г) множества обладает kt альтернативами, то общее число чистых стратегий игрока равно П*п Z (5.1) Z=1 Определение б.ЗЛБудем говорить, что задана ан- тагонистическая конечная позиционная игра Г, если за- даны: а) позиционная структура С; б) принимающая вещественные значения функция выигрыша ЛШ), определенная на множестве всех окон- чательных позиций дерева структуры С. • В том случае, когда в игре не участвует игрок 0, вы-, бор игроком I чистой стратегии %, а игроком II—чистой стратегии у однозначно определяет исход игры, т. е. упо- рядоченная -пара т = (ж, у) приводит к t-м. окончатель- ной вершине и игрок I получает выигрыш M(t). Если в игре участвует игрок 0, то пара т определяет распреде- ление вероятностей на множестве Т = {^, t2i ,.ts} окончательных вершин Р (т, о > О, S Р (т, ti) = 1, (5.2) г=1 где Р(т, ^—вероятность того, что партия закончится в вершине t е Т. Распределение вероятностей Р(т, t) естественным об- разом приводит к математическому ожиданию выигры- ша игрока I, которое определяется следующим образом: \т\ ЛГ(т) = 2 M(t-)P(x,t}), (5.3) 0=1
ГЛАВА ОСНОВЫ ТЕОРИЙ 169 где Mktj) — выигрыш игрока I в окончательной позиции th a ITI — число окончательных позиций. Исходя из сказанного, можно заключить, что каждая пара чистых стратегий игроков I и II приводит к неко- торой ситуации, в которой игрок I долучает определен- - ный выигрыш или математическое ожидание выигрыша. Другими словами, на множестве пар чистых стратегий задана функция II, которая указывает выигрыш или ма- тематическое ожидание выигрыша игрока I, если игроки будут применять данные чистые стратегии. Эта функция называется функцией выигрыша игрока I. Поскольку в конечной позиционной игре число ситуа- ций в чистых стратегиях конечно, ‘функцию выигрыша игрока I можно записать в виде некоторой прямоугольной матрицы. Если число чистых стратегий игрока I равно тп, а число чистых .стратегий игрока II равно п, то эта мат- рица H — Whijli имеет*размер тХп. Такое представление позиционной игры называется нормальной формой пози- ционной игры. t Следовательно, конечная позиционная игра Г в нор- мальной форме определяется тройкой <#, у, IT), где ж, у— множества чистых стратегий соответственно игроков I и II, а Н — функция от двух переменных: х^х и у^у (см. главу I). 2. Позиционные игры с полной информацией. В игре с полной информацией каждый игрок делает очередной ход, зная, какие альтернативы были выбраны на всех предыдущих ходах. Информационные множества игроков в такой игре одноэлементны (рис/ 5,1). Оснрвпая особен- ность игры с полной информацией состоит в том, что ее нормальная форма (матрица выигрышей)* имеет хотя бы одну седловую точку. Теорема 5.1. Пусть х и у—множества чистых стра- тегий соответственно игроков I u II в конечной позицион- ной игре с полной информацией Г, а Н функция выиг- рыша, заданная на 'прямом произведении хх у. Тогда игра Г имеет седловую точку. Для доказательства теоремы 5.1 введем понятие усе- чения позиционной, игры с полной информацией. После отбрасывания начальной позиции графа игры Г этрт Граф разбивается на к связных подграфов, где к — число аль- тернатив начальной позиции игры Г, Так, исключив на-
170 ЧАСТЬ III. МНОГОШАГОВЫЕ игры чальную позицию графа игры, диаграмма которой при- ведена на рис. 5.1, будем иметь два связных подграфа (см. рис. 5.3). Каждый такой подграф определяет игру а полной информацией Гг, (г — 1, 2, ..., к). / Определение 5.4. Игра Гг называется усечением игры с полной информацией Г. - Очевидно, что каждой чистой стратегий* игрока в первоначальной игре Г соответствует усеченная стратегия в игре Г6 которая представляет собой функцию, опреде- ляющую выбор тех же самых альтернатив, что и перво- начальная стратегия, но только в позициях игры Гг. Слет ft- t, -ts К ts t, Ь Ъ Рпс. 5.3. ^2 ' а) : довательпо, множество усеченных стратегий каждого из игроков в игре Гг определя- ется множеством его чистых стратегий в. игре Г. На осно- вании этого функция выиг- рыша Нг в игре Гг является сужением функции Н на множество xr X уг, где хг и у г —множество усеченных стратегий соответственно иг- роков I и II в игре Гг. Число усеченных игр рав- но числу, альтернатив в на- чальной .позиции qt игры Г, Так, игра Г, диаграмма дере- ва которой показана- па рис. 5.1, усекается двумя играми Г1 и Г2, соответствующими двум альтернативам началь- ной позиции Диаграммы деревьев усеченных игр 1\ и Га приведены соответственно, на рис. 5. За и 5.36. , Доказательство теоремы 5.1. Пусть Г — конеч- ная позиционная игра с полной информацией, Г*; Г2, ... ..., Гй —усеченные игры с пачальпымй позициями </2, .дл+i, л —число позиций в самой длинной воз- можной партии игры Г.*Тогда игры Гь Г2, Г* имеют; самое большее, длину n — 1. Обозначим через хт, уг произвольные чистые страте- гии игроков I и II в игре Г2, т. е. хг^хг и уг^уп а-через х. {/ — произвольные чистые стратегии игроков I и II в игре Г, т. е. х&с и у^у. Доказательство проводим индук- цией по числу п. Для игр длины 0 (не имеющих ходов) теорема - очевидна, Предположим, что седловая точка су-
ГЛАВА 5. ОСНОВЫ ТЕОРИИ 171 ществует для игр длиной п - 1, и пусть {хг, ут )—седловая ~ точка в игре Гг, а /7,— функция выигрыша в игре Гг. Тогда на основании определения 1.2 имеем Яг{хг, {/*)< Пт(х*, у*} <7/. (аг*, у^ ' (5.4) для любогох, е х, в любого уг е ут (г = 1, 2, ..к). Теперь допустим, что в позиции д, игры Г делает ход игрок 0, т. ег альтернатива г в позиции qA выбирается с ( ' А \ а, ^0, 2<zr == 1 I. Пусть q — произволь- . г=Н / ная позиция игры Гг, и если опа соответствует ходу иг- рока I, то х* (д) = ж* (д), а если ходу игрока II, то д* (д) =* == у г (д). Поскольку в позиции 7, делает ход игрок 0, то х* определена в любцй позиции игры Г/соответствующей ходу игрока I и, следовательно, х* е х Аналогично у* е у. Тогда, если х^х и у^у, то Н (х, у) == а ^Hr (xrj уг), В частности, . - г=1 /7 (х, у*)'= 2 «г/7г {хг, у*\ 7. (5.5) в (X*, у) = 2 аг11г (ж?, yr)t ' . ' Г“1 _ ' k ^ (^, ,^*) = 2 ar/7r (а;?, г/Г). (5.6) . г«1 . Из двойного неравенства (5.4) с учетом аг>0 (г = 1, 2, ..., к) следует двойное неравенство А г .А 2 агНг{хг, у*) С 2 ar/7, (a:*, yV) < 2ar77r(x*, у*). ' Г=1 (5.7) После подстановки (5.5) п (5.6) в (5.7) получим Н(х, у*) Жж*, у*) < Жж*, у). Следовательно, (ж*, i/*) — седловая точка игры Г. Допустим, теперь, что в позиции gi игры Г делает ход игрок Д. Пусть ' max Нг (х*, у*) /7Й (а£, (5.8)
172 ЧАСТЬ III. МНОГОШАГЬВЫЕ ИГРЫ Я определим чистую стратегию-#* игрока I следующим об- ж . р&зом: #*(^i) ц, , (5.9) Я а если q — позиция игры Гг, соответствующая ходу игро- ка I, то Ц #*(?) = #г*(<7). Z (5.10) | - .Чистую стратегию у* игрока II определим, положив / уЧо) = Уг(У), ' (5.И) | 1 S где q— прзйция игрока II в игре Гг. it Следовательно, и у*^у. Покажем, что (#*, у*)— седловая точка игры Г. Из равенства (5.9) видео, что если игрок I применяет стратегию#* е х, а игрок II лю- бую стратегию у е у, которой ’в усеченной игре Ги coot- g ветствует усеченная стратегия i/ц у^ то •Н (#*, у) = Уц). В частности у* е у, у*<^ Уп> и на основании Я (#*, У*) = Яц('*и, Уи)-. ~ Тогда для любых у ^у, у^ принимая во 45.4), (5.12) и (5.13), можно записать Я(#*, Пусть теперь игрок I в игре Г применяет такую стра? ж тегию х е #, что.#((/1) ='i. . SJ Пусть х{ — усеченная стратегия игрока I в усеченной i игре Г/, соответствующая стратегии х. Тогда, если у — U любая стратегия пгрцка II в игре Г, а соответствует ей -1 усеченная стратегия yt в игре Г<, то Ж#, у) = Н^х^ уд; В в частности, для у* ^у и уг е у{ справедливо равенство ж (5.15) I (5Л2) | (5.12) (5.13) | внимание | f У*) = («ц, У$ <-Я(#н, Ун) = Н (#♦, у). >(5.14) 4 Н(х,у*)=Щ(хьу*). Вместе с тем из (5.8) имеем (5.16)
- ГЛАВА 5, ОСНОВЫ ТЕОРИИ 173 Следовательно, из (5.4), (5.13), (5.15) и (5.16) полу- ним, что Н (х*, у*) = Яц(жд, г/р)>Я{(4, у*) = t, -h t3 'A t5 fs h h Рис. 5.4. . = H(x, y*). (5.17) Окончательно из (5.14) и (5.17) видно, что (х*, </*) —сед- лова’я точка игры Г, Аналогичным образом доказывается теорема 5.1 для случая, когда в позиции qt делает ход " игрок II. 3. Позиционные игры с полной памятью. Обобщением позиционных игр с полной информацией являются пози- ционные игры с полной памятью, в которых каждый из игроков, делая ход, помнит свои предыдущие ходы, но может не знать, какой выбор сделал другой игрок. Если , игроками являются отдельные лица, то условие запоми- нания. предыдущего хода, как правило, соблюдается. Но игроком может быть и - некоторая группа, отстаивающая единые интересы (предприятие, фирма, воюющая сторо- на, спортивная команда и т. д.У. Такой игрок может по- переменно «забывать»4 или «вспоминать» ' свои выборы. В этом случае позиционная игра не будет игрой с полной памятью. - Формально игрок имеет полную память, если для его двух любых информационных множеств U и V можно из одного, расположенного «ниже» на дереве игры (скажем V), попасть в , множество U по единственной альтернативе. Так, из информационного мно- жества {gj можно попасть в мно- жество {gA, gj, двигаясь, только из вершины gi в вершину q2i а в множество {д6, д?) из вер- шины gi в вершину д3 (рис. 5.2). Напротив, из информациойного множества {qil можно попасть в множество, {gA, ?5, q^ как проходя через вершйну д2, так и через вершину q3 (рис< 5.4). Следовательно, в первом случае игрок I пол- ную память имеет, а во втором случае не имеет. Значение игр с полной памятью определяется тем, что каждый игрок этой игры может обойтись так называемы-
174 ЧАСТЬ 1Й, МНОГОШАГОВЫЕ ИГРЫ ми стратегиями поведения, задание и реализация кото- рых значительно проще, чем смешанных стратегий. Определение 5.5. Стратегией поведения называет- ся набор из г вероятностных распределений, каждое из 'которых задано на множестве возможных альтернатив в каждом, информационном множестве. Различие между ’ смешанной стратегией и стратегией поведения довольно удачно пояснил Кун [311 следую? щим образом. - Можно представить себе каждую чистую стратегию - как книжку инструкций, в которой жаждая страница от- носится лишь к одному информационному множеству и точно устанавливает, что нужно делать игроку в этом ин- формационном^ множестве. Множество чистых стратегий соответствует библиотеке-, таких книг. Смешанная страте< гия выбирает одну книгу посредством .случайного меха- низма с распределением вероятностей, совпадающем с рас- пределением вероятностей смешанной стратегии. Страте- гия поведения представляет одну книгу, но особого рода: каждая, страница этой книги, соответствующая тому или - иному информационному множеству, задает распределе- ние вероятностей на множестве альтернатив данного мно- жества. - - В. широком смысле стратегия поведения данного игро- ка есть функция, определенная -на классе информацион- ных множеств, которая соотносит каждому информацион- ному множеству распределение вероятностей выбора аль- тернатив этого множества. Стратегии поведения /♦ и g* игроков I и II являют- ся оптимальными, если выполняется двойное неравенство g*) < Ж/*, £*) Ж/*, g), (5.18) . где /, g — любые стратегии соответственно игроков I и II, Я(/, g) — функция выигрыша игрока I. Оказывается, как показал Кун [311, в конечных пози- ционных играх с полной памятью игроки имеют оштп- мальные стратегии поведения: Как показано в [45],4 для нахождения оптимальных стратегий поведения ’ игры с полной памятью достаточно решить некоторую матрич- ную игру с ограничениями, которая сводится к задаче ли- нейного программирования (см. пример 6,5),
. ГЛАВА 5. ОСНОВЫ ТЕОРИИ 175 J § 5.2. Детерминированные, стохастические й рекурсивные игры - 1. Природа и структура детерминированных, стохасти- ческих и рекурсивных игр. Динамика антагонистического конфликта довольно часто принимает форму некоторой последовательности чередующихся между собой взаимо- действий двух сторон с противоположными интересами, которая делится на ряд характерных циклов. Общая схе- ма цикла, .как правило,. включает независимые выборы способов действий (принятия решений) каждой из сторон и реализацию некоторого случайного испытания, после чего обе стороны информируются о выбранных способах/ и исходе. На этом цикл заканчивается, и действия сторон в зависимости от его исхода могут прекращаться или пов- торяться. Конфликты такого, рода можно рассматривать как:систему с множеством состояний 5, каждому элемен- ту $ которого поставлено в соответствие множество х8 х X у8, где у8— множества действий сторон. На очередном шаге игроки I и II, зная s^S, неза- висимо друг от друга выбирают соответственно xsi е x*t и yst^ysi. В результате складывается ситуация z*t = = (#4 Каждой такой ситуации соответствует вероят- ностное распределение на множество состояний S, в соот- ветствии с которым определяется следующее состояние. ?2. После чего игра продолжается по той же схеме. Функция выигрыша определена' на последовательностях состояний. В зависимости от. вида вероятностного распределения та- кие игры , называют детерминированными, стохастически- ми или рекурсивными. 2. Детерминированные игры. Если для каждой ситуа- ции z8 ==? (я*, у8) однозначно определено следующее состо- яние е S9 то такие игры называются , детерминирован- ными. Мы не будем рассматривать детерминированные игры во всей их общности, объясним только, как они ра- зыгрываются, на примере. Пусть игра может продолжать- ся лишь. N шагов, на каждом шаге игроки имеюъ лишь, по две чистые стратегии. Положим Au kl2 \ - Гь= “ , Г0 = Л22, ^==0,1, I кН г* I* ™ 9 • „ • Vai
176 ЧАСТЬ III. МНОГОШАГОВЫЕ ИГРЫ Набор формальных матриц ГЛ будет задавать детермини- рованную игру. На первом щаге, когда до конца игры остается N шагов, игроки соответственно выбирают по чистой стратегии £и/. Если ситуация (£,/) ^ (2,2), то пер- вый игрок выи/^ы^ает величину fey и игра на этом закан- чивается. В противном случае игра продолжается так же, как и на первом шаге, последующие выигрыши определя- ются матрицей Гу-i. Наконец, если игра не закончилась за 'N — 1 шаг, то игроки разыгрывают матричную игру /\1. ^12^ \\1 Л22/ ' После чего игра заканчивается. Читатель без труда может интерпретировать этот' пример в соответствии со схемой, изложенной в предыдущем пункте. Полезно представить эту игру в позиционной форме. Общий метод решения детермипированрой игры сво- -.дйтся к составлению рекуррентных соотношений для зна- чения игры на . каждом шаге, начиная с последнего (т. е< когда до конца игры остается один шаг). На основании этих рекуррентных соотношений и граничных условий вычисляются значения игры и оптимальные стратегии для каждого шага (от первого и до последнего), и тем самым находится решение всей игры. Как это делается, будет показано на , примере в гл. 6. 3. Стохастические игры. Пусть S = {1, 2, р), xk и конечные множества (fe==l, 2, р). Для каждого zh е xh х yh *= задано распределение вероятностей* g(zft) на .множестве S. Зная fee S, игроки I и II независимо друг от друга выбирают соответственно xk ^xh и yk Затем согласно распределению вероятностей g(z*) (? = «7 (я*, у*)) определяется а игроки, зная предысторию = выбирают элементы х 1^х1, у1^у1й т. д. В резуль- тате образуется бесконечная последовательность о =* (coL, р k 4 ’♦••), где со$ е J z =R. Первый игрок выигрывает ве- h—1 личину Ж<о), определенную на множестве всех последо- вательностей Q. Функция Н называется! функцией выиг- рыша. Второй игрок проигрывает величину, выигранную первым игроком. Описанная конструкция' определяет ан- тагонистическую стохастическую игру<
ГЛАВА 5* ОСНОВЫ ТЕОРИИ |77 Обозначим через R*+1 прямое произведение t множеств R. Смешанная стратегия стохастической игры определя- ется набором функций Xkt, заданных на U== l, 2, A = l, 2, р), значения которых—xh) при ' каждом е R* удовлетворяют условиям 2 £м(п>) = 1, — - (5.19) Iм (rh xh) >0, где хк) — вероятность выбора игроком I на шаге/ чистой стратегий xk^xh при известной ему предысто- ^рии rt. ' Аналогично смешанная стратегия игрока II опреде- ляется как набор функций Ykt, значения которых . yh). удовлетворяют условиям 3 <п, ук) = Ь (5.20) где ци(п, ук) — вероятность выбора игроком II на шагу t чистой стратегии yh е yh при известной ему предысто- рии rt. - Л ' t Набор (Xм, Ykt) определяет распределение вероятно- стей на множестве Q, а математическое ожидание выиг- ‘ , рыша Я(Х, У) есть функция выигрыша бесконечной игры, которая задана системой. _ * Г==<Х, У, Я, (5.21) - где X — множество всех смешанных стратегий X игрока I, У —множество всех смешанных стратегий Y иг- рока II, $о —начальная позиция. Нередко рассматривают лишь частные случаи игры (5.21), полагая, что ,на множествах zh заданы функции ft*, которые определяют числовую последовательность {ft(Gh), Мсог), .. Л, где ft(oh) = ftft(cot), если Наиболее часто функцию Н задают следующим об- разом: z (a) ...) = _ i{m Ч^) + Чюг)+--+Ч^); ' •' “ .4— лг • » ' JV~>OO 12 г. И. Дюбин, В. Г. Суздальz
17g Часть in.' многошаговые игры ь где N — номер шага, ' . (б) . Я(<в) = 2Л(®0₽(-1, t=l где Р — дисконтирующий множитель • (0 < £ 1), означа- ющий,' что ценность единицы выигрыша на шаге t равна Определение 5.6. Состояние sQ^S называется пог- лощающим, если при попадании в нега на, следующем шаге игра с вероятностью, равной единице, остается в том же состоянии. Если среди элементов S существует поглощающее со- - стояние $о, для которого h&Q (zso) = 0, состоит из одно- —. го элемента, а распределения q(zh) таковы, что для^любого отличного от «о состояния при любых действиях игро- _ - ков игра с вероятностью единица за конечное число ша- гов переврдитря в $0, то часто функцию Я (со)-полагают ~~ СО . равной 2 h ((Oh). Тогда попадание в состояние $о можно Л=1 * трактовать как окончание игры, а функцию Ж со?, <о2, ;*.) как математическое ожидание выигрыша до .оконча- ния игры. . _ . - Если для каждого элемента вероятностное рас- пределение g(zft) таково, что с положительной вероятностью переводит состояние fc в состояние s0, то очевидно, веро-^ ятность того, что партия закончится за конечное число .шагов, равна, единице..Пусть’ a?ft = {l, 2,..., иг*}, yh == ={Г, 2, . ♦., nh}. Тогда, если множество S состоит из р +1 элементов, рассматриваемую стохастическую игру можно задать с^ помощью множества Г = {Г\ Г2, ..., Гр} формальный матриц ♦ г*=pt (5.22) > где р - * . 2$<1. ' (5.23) ’ * , - , , 1=1 ч Элемент матрицы Г* означает, что если на очередном шаге в состоянии к (игра начинается с матрицы Г*) игроки I и II выбирают.соответственно чистые стратегии ' . i и то выигрыш игрока 1 равен и с ^ороятностыо -
ГЛАВА 5,- ОСНОВЫ ТЕОРИИ 179 gij на следующем' шаге игра переходит в состояние I (разыгрывается, игра с матрицей ГО, а с вероятностью 1 — р == —в поглощающее состояние $0 (игра Г* за- «=1 ' канчивается). ,Если все числа равны (J, то рассматри- ваемую игру с поглощающим^состоянием «о можно трак- товать • как стохастическую игру с р состояниями, функ- ция выигрыша которой имеет вид (б). Стохастическую игру, заданную множеством Г «{Г1,* Г2, ♦.., Гр) и начинающуюся с формальной матрицы Г\ будем обозначать тем Лке символом Г*, а , из контекста все- гда будет .ясно, какой смысл имеет символ Г*. Нетрудно показать, чтов рассматриваемой стохасти- - ческой игре игроки могут обойтись лишь стратегиями, зависящими только от номера шага и независящими от предыстории. Более того, оказывается, цни имеют ситуа- ции равновесия, в еще более просто устроенный страте- гиях — стационарных. Определение 5.7. Стратегия игрока стохастической игры называется стационарной, если она ..зависит лишь ' от состояния, в котором находится игра. Если для некоторых стационарных р* и X* игроков I и II соответственно выполняются неравенства ЖХ, V) ЖрЛ, 1*) С Жр*,У). . . , при всех Х.е X, У е У, через ЖХ, У) обозначено мате- матическое, ожидание выигрыша игрока I, то р* называ- ется оптимальной стационарной стратегией игрока I,. а , Z* — оптимальной стационарной стратегией ^игрока 1Г. Будем обозначать стационарную, стратегию игрока I через р — (р,1, . р,р), где для каждого к^S. компонента и* = (hi> ' • •« НиД где S Hi = !. Hi>0, — вероят- ность выбора игроком I в состоянии к чистой. страте- гии I. Стационарную стратегию игрока II будем обозна- чать через Х.= (А,*, А2, Ар), где для каждого k^S компонента ДО = (kJ, А, ; ..A.*h), где 2 A,J = 1,. 0,-т вероятность выбора игроком IL в состоянии к чистой стратегии
180 ЧАСТЬ III. МНОГОШАГОВЫЕ ИГРЫ ' тг * ' Далее мы покажем как находятся оптимальные ста- ционарные стратегии. Обозначим через Р%1 (р,, X) и Н± (р,, %) соответственно вероятность перехода системы из сос- тояния к в состояние I и математическое ожидание выиг- рыша игрока I за один шаг при условии, что игрок I . использует стационарную стратегию ц, а игрок II —стра- тегию %. Очевидно, что . w nJ1 • Р1'(М)== 2 3 (5.24) 1 1=1 3=1 , nk Я1(М)= S 34(44 ' (5.25) ' . i=l j=l Тогда при заданных стационарных стратегиях р, X и начальном состоянии к математическое ожидание выиг- ' рыша -за N + 1 шагов будет ,' и ' N р (ц, %) = 3 3 Р* (И. Ь) (и, 1) + (р,, %), (5.26) t=l 1=1 где ' .. р рк1+1 (и, %) = 3 pks (и Д) р$ (ИД). Значение стохастической игры за N шагов есть р-век- тор Vn — (v]v, v.n, ..их), где vn = (p*, X*). Если игра на шаге N не заканчивается, будем . предполагать, что на' N + 1-м шаге игрок I выигрывает нуль (Z = l, 2, ..., р) и игра .заканчивается. В этом случае говорят, что игра усечена на /V-м шаге посредством выиг- рышей vQ = (vj, i?o, ...»Vo). Тогда на TV-м шаге в состоянии к (fc = 1, 2, ..., р) должна разыгрываться матричная игра rj(po)=|4+ 2$4~ ' (5.27) Обозначим значение игрыГх (р0) через т. е. Vj = = val Г1 (v0). Очевидно, что на N — 4-м шаге в состоянии к (k==i, 2, ..., р) должна разыгрываться матричная игра . г£(и£), значение которой обозначим через v%'. Продол-
ГЛАВА 5, ОСНОВЫ ТЕОРИИ 181 жая обратную индукцию, положим для любого целого t p?+1=vair?(p?), Г? = h’lj + 2^ J» i = Ь, 1, В частности, на первом шаге •4 = vair^._1C4_i), hij + S |. H-l II (5.28) . (5.29) 1-7V-1 = Итак, в результате N шагов итерационной процедуры строится последовательность векторов ' p( = W,A.’..^). (5.30). / Можно показать, (см., например, [39]), что последователь- ность (5.30) сходится к пределу « р = (р1, у2, , vp) при N ^5.31) Оптимальные стационарные стратегии игроков в сто- хастической игре отыскиваются путем решения матрич- ных игр _ ‘ р . 11 rft(v)= 4- + S&V Г (5.32) Очевидно, что вероятность продолжения стохастиче- ской игры более N шагов, какие бы стратегии не исполь- зовались, не превосходит Р^'где _________ ___ {р ) ’ 2 ffo . (5.33) J Таким образом, есйи N достаточно велико, можно пренебречь как достаточно малой величиной и стохасти- ческую игру можно аппроксимировать игройг усеченной после N шагов. В этом случае оптимальные стратегии X*, .-YN в усеченных играх (у) в пределе-при JV -*
182 ЧАСТЬ Ш. МНОГОШАРОВЫЕ ИГРЫ ' сходщся к оптимальным стационарным стратегиям стоха- стической игры, а вектор v дает ее значение. 4. Рекурсивные игры. Пусть среди состояний 5 игры (5.21) существует хотя бы одно. поглощающее состояние, множество zh которого, одноэлементно, а функция выиг- рыша Я определена следующим образом! ; . , ' Я(оМ(4 - ’ Л (5.34) Где j _ первый шаг, при котором игра попадает в погло- щающее состояние. Если игра продолжается бесконечно долго," то выигрыш, принимается равным одному и тому' же числу (обычно нулю). Такую игру (5.21) будем назы- вать рекурсивной. Согласно (5.34), если, рекурсивная иг- ра Г попада в поглощающее состояние Z, то игрок I по- лучает выигрыш hl. Обозначим через L* множество поглощающих состоя- ний, в одно из которых рекурсивная'игра Г может перей-' ти, находясь в состоянии к. Тогда рекурсивную игру мож- но задать множеством формальных матриц :Г> = |-2-$а1+ 2 (5.35) р ' . где 2 9ii =т 0, к = 1, 2, . р. Запись (5.35) озпа- ? Z==1 ' ' ' - ‘чает, что если в состоянии к игроки I и II выберут.чистые стратегий соответственно I 0 е» 1/2', ..., тк) и / (/= 1, 2, ..., nft), то с вероятностью q™ (Z=~l, 2, . .*, г) игра переходит в одно из поглощающих состояний и закан- чивается, а игрок I получает выигрыш. Л*. В противном случае игра с вероятностью (Z^LA) переходит в одно из непоглощающих состояний и продолжается, опреде- ляясь формальной матрицей 1\ и т. д. < Процесс^ рекурсивной игры Т можно определить сле- дующим образом. На первом шаге, начиная с фиксиро- ванной матрицы (скажем, Г*), игроки I и II независимо выбирают строку i и столбец / соответственно. Затем со- гласно распределению ^.случайно выбирается элемент I. Если будет .выбран .элемент Z (ZeL*)^ то игра за- канчивается и игрок I получает, выигрыш h\ а в против-
ГЛАВА 5. ОСНОВЫ ТЕОРИЙ 183 ном случае делается следующий шаг и игра продолжается, . определяясь матрицей Г\ и т. д. Если игра продолжается бесконечно долго, то выигрыш полагается равным нулю. Стратегия X игрока I есть вероятностное распределе- ние на множестве^строк каждой матрицы как функция - от любой первоначальной последовательности ходов до те- кущего выбора и представляет собой для состояния к и шага t набор тп*-векторов, - удовлетворяющих условиям (5.19). Аналогично стратегия К игрока II есть вероят- ностное распределение на множестве столбцов каждой ' матрицы и представляет собой для состояния к и„шага > t набор ^-векторов, удовлетворяющих условиям (&.20). Каждая пара стратегий (X, У) и произвольная началь- ная матрица, а также вероятностное' распределение оп- ределяют вероятностное распределение PCX’, Ю на про- странстве последовательностей . (0= (©!, ©2, . ..)!©;• е 0 -zk I. (5.36) х k=1 J" При этом если' для i </, то по- следовательность со имеет вид * ' со = (coi, ..co^i,.coj, %, ♦?.). (5.37) Функция выигрыша-Я(со) = fe(^)—для всякой после- довательности (5.37) и Жсо) = 0 — в лрртивном случае. Эта функция разрывна в топологии прямого произведения, заданной да Q. Однако, для пары. (X, У) существует математическое ожидание выигрыша игрока I и можно определить нижнее иА верхнее значение игры Г следую- щими равенствами: ^(r) = supinf J tf(<o)dP(X,y), ' Х У \ ‘ (5.38) v (г) = inf sup J Н (<о) dP (X, Y). ' Всегда ч?(ГГ< п(Г); если v(D -НГ), то игра Г имеет значение и(Г).. ’ Наконец, стратегии X и У называются ^стационар- ными, если вероятности выбора соответственно строк и столбцов в матрице Г* зависят только от Г* и не зависят от предыстории (предыдущих ходов и числа ходов).
t 184 ЧАСТЬ III. МНОГОШАГОВЫЕ ИГРЫ Теорема 5.2. Рекурсивная игра Г имеет значение для каждой начальной матрицы Г*, и существуют г-оп~ тималъные стратегии для каждого-игрока. Доказательство. Пусть рекурсивная игра Гг+1 задана Множеством формальных матриц . ' ’ . Г = {Г1, Г2, Гг, Гг+1}, где Г = ИМ, Г2 = ||М,..Гг = ИМ» А (5.39) Заменив в игре (5.39) символ Гг+1 значением р, получим одноша- говую игру ' rr+1(0= 2 9'Х+?иМ>- (5.40). О ' V V Рис. 5.5. в которой с вероятностями j (Z = 1, 2, n'gjt1 игрок I co- - ответственно получает hl и v. ' . * Обозначим через T = тах|Л/|, пусть ре [—Л Г]. Будем рас- сматривать val Гг+1(р) как функ- цию от р. Исследуем уравнение Л/(р) •« valTr+1(p). (5.41) В силу того, что значение мат- ричной игры изменяется непре- рывно и монотонно относительно элементов матрицы " выигры- шей*), имеем непрерывное ото- бражение М* [—Т, Г] в отрезок [—Г, Т], определяемое формулой (5.41). Действительно, M(v) — мо- нотонно неубывающая п непре- рывная функция от р, Л7(— > — Т и М(Т)^.Т. График этой ' функции при р = —Т (рис. 5.5) лежит не нцже прямой, образую- щей* с осями координат угол 45° ' и не выше'этой прямой при р = Г, а при —Г р Т пересекает эту прямую, т. е. уравнение (5.41) имеет решения. Однако^ прп ^возрастании, р график нигде не пересекает эту прямую. Поэтому >1 ♦) Это следует из очевидных неравенств • _ р(Л) v(B) < v(A + е) « v(A) -}- е, |6ij —bij aj/.
ГЛАВА 5/ОСНОВЫ ТЕОРИИ 185 Следовательно, пме^гся непустое замкнутое множество непод- - вижных точек М. Пусть р* будет неподвижной точкой с минимальной абсо- лютной величиной и пусть р* >• 0. Тогда при • 0 < v < р* (5.42) справедливо неравенство . (5.43) Действительно, на основании (5.42) можно записать v = р* — б. б > 0. Тогда имеем М(р) = М(р* —б) > М(р*) — б = р* — б — v‘ Действительно, |Г ’ II 2 dX + (\* -б) > i±i М (и*) — 6 = val Г^1 (v*) — S = val 2 II (=1 -6 = =val 2 glu W — e) + fit1 Очевидно, что . y val | 2?’iX + fiP <'l>* ~ 6>|> val |s gij № — 6) + fif1 (v*~fi) > и поэтому M(P* — б) М(и*)—б. Если M(v) = р, то придем к противоречию, так как р* является минимальной по абсолютной величине неподвижной точкой. Значит, выпс .шлется только нера- венство (5.43). На основании неравенств (5.42), (5.43) для любого е е (0, р*) существует такое б, что для и' = i>* — е будет ДО(р')>р' + б. (5.44) Пусть теперь игрок I в игре Г использует оптимальную страте- гию для матричной игры Гг+1(р')^ Очевидно, что такая стратегия является стационарной, и поэтому обозначим ее через ц = = (Ць Ц2, •••, М-m). В свою очередь игроку II достаточно приме- нять стратегии, зависящие только от номера шага, а не всей предыстории, т. е. Y* = (ц*, т)п)> где t — номер шага. Тог- да результат шага t игры Г можно символически записать следую- щим образом: . . Et + qh (5.45) где S РчЛ*?;/1"- вероятность, того, что игра'Г будет продол- М г жаться, a Et = 2X2 — математическое ожидание чвыиг- рыша игрока I за шаг t. На основании выражения (5.45) мате- матическое ожидание выигрыша игрока I за N шагов EN
186 ’ ЧАСТЬ Шг'МНОГОШАГОВЫЕ ИГРЫ запишется следующим образом: EN == Ei + qi(E2 + 92(^3 + <7з(#4 + • • ♦+ e = Ei + qiE2 + qiq2E$ +«?, + qi»** (5.46) Умножим * (5.46) на qQ и-полупим ‘ ‘ . qaEN- = go^i + <Zo0i^2 + qtfhqtE + ... + £o • • • (5.47) Окончательно ’(5.47) запишем следующим образом:, N 5-1 (5.48) 5=1 /=о - где го = 1. > - • , Математическое ожидание выигрыша игрока I за каждых! шаг /, если он применяет стратегию ц, а игрок II стратегию П, ' в игре Г(р') равно Е$ + q^v'. Стратегия р является оптимальной в игре Г (г/), поэтому с учетом неравенства (5.44) + valr(y') > у' + 6. (5.49) Отсюда _ * ' i/(l-<7Л +«. (5.50) ’ Используя теперь (5.48), получим „ _ - - • 5—i ® j*~i да в 2П > ✓. 3 Пgt О - +~е S П <5-51> 5=1 /=о 5=1/=о . ’ j=i f=o Преобразуем ' * . ' N 5-1 ' " v' 2 П 0 - ?j) = v' 0 - «1)+ v' (М1 - + v' (Мг (1~?з)+ S~1 t=o . + ... 4- v' (?х?г ... ?w_! (1 - <?„)))= V'- - v'q^ + р' qt - v'91?2 4- + v'q^ - v' qiq2q3 + ... + «’'?192 ... qN^ ~ v'q± ... qN_v— 1 / N ' '' — • • • QN = v' — v' П gv (5*52) t=0 - После подстановки (5.52) в (5.51) получим N N 5-1 - J - ' , • »'П gtf 6 -2H>r (5-53) t=0 . 5=1 Полагая т = v'/dt преобразуем два последних члена в (5.53): / N 5-1 N \ 6 2П«(- ТП’| • З5-54) \j=ir-o ' W /
ГЛАВА 5.^ОСНОВЫ ТЕОРИЙ 187 k . . Полагая = JJ qt, перепишем- (5.54) в виде t==O / N V « : <5-55> \М /- Числа шагов N может быть сколь угодно велико. Поэтому всегда- можно взять N > хи ' . 2 Li-\ ~ + А2 ~ ln+ • • • + £т+1 — ln + j-i ' + Ьт+2 + .. • +<£'Д_1> 0, '• так как Lk > Lft+t для к « 1,. 2, /V —2. Следовательно, выра- жение (5.55) неотрицательно, что влечет,за собой / .- . EN ^v' > р* - в. . (5.56) Итак, если и* > О, то игрок I имеет такую стационарную стра- тегию, для которой выполняются неравенства (5.56). С другой сто- роны, если р* 0, до, как видно из предыдущего доказательства, используя на каждом шаге.оптимальную стратегию в игре Гг+,(-р*), игрок I выиграет по крайней мере р*, как бы игрок II не играл. Ввиду симметрии, аналогичными рассуждениями можно доказать, . что игрок IL для любого в ^> 0 имеет стационарную стратегию, применяя которую, он не проиграет больше р* 4-е. Это доказывает теорему 5.2 для рекурсивных игр, заданных одной формальной матрицей Tr+I. Из доказательства следует, что при у* > 0. игрок II имеет оптимальную стационарную стратегию, а.игрок I лишь е-оптимальпую. При р* < 0 ситуация меняется — игрок I имеет оптимальную стационарную стратегию, а игрок II лишь е-оптимальную. Далее индукцией до числу формальных мат- риц можно завершить доказательство этой теоремы. Строгов до- казательство дано в [64], а мы ограничимся только следующими рассуждениями. • Пусть 'рекурсивная игра Г* задана множеством Г={Г1, Г2, ...ГГГ, Р+1, Гг+2}. Заменим разыгрывание игры Гг+2 значением ₽2 матричной игры Гг+2, чем сведем игру ГА к рассмотренной выше игре Гг+1. .Как известно, итра Г'44 имеет значение рь которое, естественно, зависит от р2; обозначим это через/ р* (р2). Следова- тельно, val Гг+2(р*'(р2), р2) = М(р2). -Функция M(v2) в интервале [—Г, Т] является-монотонно неубывающей, а ее график подобен графику на рис. 5.5. Покажем, что вектор р* = (р* р*) — зна-» чение рекурсивной игры Г*. Пусть р^ (р*) > 0 и р* > 0. Возьмем ниже р * и возможно ближе кчр2- Тогда точкам* (*>2) будет близка к точке р* (р2) , а поскольку р* ~ неподвижная точка с
188 ЧАСТЬ III. МНОГОШАГОВЫЕ ИГРЫ минимальной абсолютной величиной, то - val Гг+2 (₽'), a'j > v'2. Если Pj подставить в Гг+1 вместо Гг+2, то v*t (р') будет значе- нием игры Гг+1. Следовательно, существует точка v'v произвольно близкая к и* (p'j, такая, что val Г' (р', р') > р'. Наконец, точка близка к точке и* (р2), а поскольку она также близка к (р2)., то пЗ непрерывности функции M(vz) следует, что val Гг"^2(р', р')> Таким образом, для игрока I существует вектор р'=( Рр р0, лежащий произвольно близко к р* ==(р* (р2), т- е* существует математическое ожидание выигрыша игрока J не меньше р* — е =’ —8> у2 —&)‘ Аналогичными рассуждениями можно пока- зать, что для игрока II существует вектор р" =(рр р") , лежащий произвольно близко Ю’^)' т-е- существует математи- ческое ожидание проигрыша игрока II не больше р*+е =(р* (p2)“F + е, р2 + е) Обобщая полученные результаты, можно заключить, что всякая рекурсивная игра, заданная множеством формальных матриц Г = {Г1, .:Г?}, имеет вектор значений р* = (р*+1, ...» р’), а игроки I и II имеют е-оптпмальные стратегии, Компоненты век- тора р* находятся из соотношений vk 4lJ k Глава 6 ПРИЛОЖЕНИЯ Реальные конфликты, как правило, протекают во вре- мени и пространстве. При этом могут удовлетворяться ус- ловия 1—3 главы 2 и, кроме того, участники на каждом этапе динамики конфликта могут приобретать новую (до- полнительную) информацию о фактически складываю- щейся обстановке или, наоборот, утрачивать ее, а резуль- тат их действий может оцениваться вещественным числом, которое определяет степень полезности сложившейся си-
ГЛАВА б. ПРИЛОЖЕНИЯ 189 / туацпп для одной из сторон. Такой конфликт моделиру- ется многошаговой игрой (позиционной, детерминирован- ной, стохастической, рекурсивной). Методика приложения теории конечных позиционных игр двух лиц в экономике и других областях человечес- кой деятельности аналогична методике приложения мат- ричных игр. Единственная особенность приложений по- зиционных игр обусловлена построением позиционной * структуры игры и нормализацией с последующим реше- нием в смешанных, стратегиях или стратегиях поведения. Эта особенность часто затрудняет применение теоретико- игровых методов, создавая комбинаторную сложность, преодоление которой требует других математиче- ских средств. Однако, если число ходов и альтернатив сравнительно мало,' так ' что диаграмма дерева игры практически обозрима, то позиционная игра, являясь до- вольна адекватной моделью динамики конфликта, позво- ляет получать содержательный и далеко нетривиальный анализ принимаемых решений. > '• Пример 6.1. Пусть первый ход заключается в том, что с вероятностями 2/3 и 1/3, соответствующими ^числам 1 и 2, выбирается число {1э 2). Если ot = l, то -на втором ходе игрок I выбирает число о2^{1, 2}, а на третьем — игрок II выбирает число о3е {1, 2). Если же 01=2, то второй ход делает эдгрок II, выбирая . число • о2 е {1, 2), а третий ход делает игрок I,. выбирая число о3е{1? 2). После того как ‘выбраны числа о1} о2 и о3, игрок I выигрывает Л/Дщ, о2, о3). Отметим начальную вершину qh указав, что первый ход делает игрок 0, п проведем из нее два ребра, которые обозначим числами 1.п 2 (рис. 5.1). Ребро 1 соединяет вершину 71 с вершиной д2, в которой второй ход делает игрок I, а ребро 2 —с вершиной q3, принадлежащей па второхМ ходе игроку II. Альтернативы второго хода игро- ков I и II изображаются ребрами, идущими вверх соот- ветственно из вершин q2 и q3. Одна пара этих ребер сое- диняет вершину 72 с вершинами 74 и 75, в которых третий ход делает игрок II, а вторая пара соединяет вершину q3 с вершинами q6 и 77, принадлежащими на третьем ходе игроку I. Аналогично / соответствующие пары ребер сое- диняют вершины четвертого (последнего) хода с оконча- тельными вершинами .., tA.
190 ЧАСТЬ III, МНОГОШАГОВЫЕ ИГРЫ Чистую стратегию L игрока 1в данной игре можно записать как систему iв ’ где io — альтернатива, которую игрок. I выбирает на втором ходе, если на первом выбрана 1-я альтернатива (^=1, 2), it — альтернатива, которую игрок I выбирает на третьей* ходе, если на пер- вом ходе выбрана 2-я альтернатива, а на втором — 1-я Таблица 6.1. Список аистых^стратегпй игроков К8 страте- гий Формальная вались Описание стратегий ' * 1 2 ‘ ‘ 3 1 пиши Выбрать на втором и третьем ходах 1-ю аль- тернативу» 2 1И1112Ц Выбрать на втором ходе 1-ю альтернативу, вы- брать на третьем ходе i-ю альтернативу, если на втором ходе выбрана 1-я альтернатива, и выбрать на третьем ходе 2-ю альтернативу* ‘ 11111210 если на втором ходе выбрана 2-я альтернатива. 3 Выбрать на втором ходе 1-ю альтернативу, вы- брать на третьем ходе 2-ю альтернативу, если . на втором ходе выбрана 1-я альтернатива, и выбрать на третьем ходе 1-ю альтернативу,, если на втором ходе выбрана 2-я альтернатива. 4 Ц1022Ц Выбрать на втором ходе 1-ю альтернативу, вы- брать на третьем ходе 2-ю альтернативу. . 5 Ц2||И|| Выбрать на втором ходе 2-ю альтернативу, ;вьк брать на третьем ходе 1-альтернативу; 6 * «2||121Ь Выбрать на втором ходе 2-ю альтернативу, выб- рать' на третьем ходе 1-ю альтернативу, если - на втором ходе выбрана 1-я альтернатива, и выбрать на третьем ходе 2-ю альтернативу, если на втором ходе выбрана 2-я* альтернати- тива. 7 Ц2Ц21Ц Выбрать на втором'ходе 2-ю альтернативу, выб- рать на третьем ходе 2-ю альтернативу, если на втором ходе выбрана Рая альтернатива, и выбрать на.третьем ходе 1-ю альтернативу, если на втором ходе выбрана 2-я альтернатива. 8 Ц2Ц22Ц Выбрать на втором ходе 2-ю альтернативу, выб- рать на третьем ходе 2-ю альтернативу не- „ зависимо от выбора на втором ходе. альтернатива (i* « 1, 2), i3 — альтернатива, которую игрок. I выбирает на третьем ходе, если' на первом и втором ходах выбрана 2-я альтернатива (г2 ==* 1, 2),
ГЛАВА 6, ПРИЛОЖЕНИЯ ' 191 Аналогично записывается стратегия / игрока II / = == где /0 — альтернатива, которую игрок II выби- рает на втором ходе, если на первом выбрана 2-я альтернатива (/0 e 1, 2), ]\ — альтернатива, которую иг- рок II выбирает на третьем ходе, если на первом выбрана 1-я альтернатива, а на втором 1-я альтернатива (Ji =т= 1, 2), — альтернатива/ которую игрок II выбирает на третьем ходе, если на первом выбрана 1-я альтернатива, а на втором — 2-я альтернатива (/2 = 1, 2). ' , Список чистых стратегий игроков ч приведен в * табл. 6.1, а значения функции выигрыша партии игрока! в табл. 6.2. Таблица 6.2. Функция выигрыша партии игрока I Окончатель- ная позиция' *1 • *3 ^5 4 h - ; -M(t) •—I 5 2 —3 4 1 —2 6 Сведем к нормальной форме, используя табл. 6.1 и 6.2, позиционную игру, диаграмма которой представлена на рис. 5.1. Допустим, что игрок Г выбрал стратегию 3 = = 111112111, ,а игрок II —стратегию (7 = 112112111. Тогда если на первом ходе игрок 0 выбрал 1-ю альтернативу, то вто- рой ход делает игрок I, выбирая согласно 37й стратегии 1-ю альтернативу, а /третий ход делает игрок II, выбирая согласно 7-й стратегии 2-ю альтернативу. В результате . пара (2, 7) приведет к окончательной вершине t2, а игрок I получит Л7(/) = 5. Если же па первом ходе выбрана 2-я альтернатива, тХ) на втором ходе игрок IГ выбирает 2-ю альтернативу, а на третьем — игрок I выбирает 1-ю, аль- тернативу. Следовательно, игра придет, к окончательной вершине t7 и игрок I получит 'M(t) = — 2. Поскольку 1-я ч и 2.-я альтернативы, на первом ходе выбираются соответ- ственно с вероятностями 2/3 и 1/3, математическое ожи- дание выигрыша игрока I равно ь —5.JL_____2-——“ Аналогично, вычисляя hi} для г=1, 2, ;;;, 8, j = 2, ;;; .8'(где Аномер чистой стратегии игрока I, / — номер
192 ЧАСТЬ III. МНОГОШАГОВЫЕ ИГРЫ чистой стратегии игрока II), получим матрицу ’ 2/3 2/3 14/3 14/3 -4/3 - -4/3 8/3 8/3' 2/3 2/3 14/3 14/3 4/3 4/3 16/3 16/3 -1/3 -1/3 11/3 11/3 -4/3 -4/3 8/3 8/3 -1/3 -1/3 11/3 11/3 4/3 4/3 16/3 16/3 8/3 -2/3 8/3 -2/3 2/3 - -8/3 2/3 -8/3 1 8/3 -2/3 8/3 -2/3 10/3 0 10/3 0 , 5/3 -5/3 5/3 -5/3 2/3 -8/3 2/3 -8/3 5/3 -5/3 5/3 -5/3 10/3 0 10/3 0 которая является нормальной формой позиционной игры (рис. 5.1). Легко установить, что матрица имеет седло- ' вую точку (2,2). Следовательно, решением позиционной игры, будет тройка (i* = 2, /* = 2, г? = 2/3), т. е. оптималь- ной стратегией игрока I (также как й игрока II) являет- ся стратегия II1II1211. Согласно оптимальным стратегиям каждый из игроков, делая второй или третий ход (неза- висимости от исхода первого хода, который делает игрок 0), выбирает свою 1-ю альтернативу. В результате игрок I гарантирует себе математическое ожидание выигрыша не менее 2/3, а игрок II — математическое ожидание про- игрыша не более 2/3. Допустим теперь, что игрок I не имеет информации об исходе случайного испытания ц выборе игрока II, а • игрок II знает только, какую альтернативу выбрал игрок *0. Диаграмма этой игры приведена па рис. 6.1. Она отли- чается от диаграммы на рис. 5.1 тем, что подмножества ’ неокончательных позиций {g2, g6? игрока I и {#4, gJ 4 игрока II объединены замкнутыми линиями. Тем самым 1 графически показаны информационные множества пгро- | ков I и II. . _ i Обычно информационное множество содержит пози- . к ции одного и того же хода. Так элементами информа- 1 ционного множества {#4, q5) является позиции, в одной | из'которых находится игрок II на третьем ходе, а эле- | ментом информационного множества {д3} является пози- | ция второго хода (рис. 6.1). Такое положение складыва- t ется тогда, когда игрок знает номер хода. Вместе с тем, I поскольку информационные множества составляют раз- I биение соответствующего множества очередности, эле- i ментами некоторых из них могут быть позиции различных. | ходов.. Однако при этом любая партия не должна иметь I
ГЛАВА 6. ПРИЛОЖЕНИЯ 193 *5 k Ь $ *2 h К 2 7 Рис. 6.1. двух позиций, принадлежащих одному и тому же инфор- мационному множеству. Другими словами, любая цепь дерева игры (последовательность идущих друг за другом ребер) должна пересекать одно и то же информационное множество не более одного раза. Так, из рис. 6.1 видно, $ что любая ветвь диаграммы дерева пересекает каждое z информационное множество только один раз, т. е. ника- , кая вершина (позиция) не Q следует за другой вершиной (позицией) из того же само- го информационного множе- ства. В этой игре отсутствие, информации у игрока I при- водит к тому, что он не зна- ет, делает ли он второй или третий ход. Именно поэтому позиции второго и третьего хода игрока I принадлежат одному и тому же информационному множеству. В данной игре каждый игрок имеет по две'стратегии. Пусть функция выигрыша игрока I задана табл. 6.2. Тог- да нормальной формой этой игры 'будет следующая мат- рица: jr _(2/3 8/3\ х / 2~\5/3 О )' Матрица Н2 седловой точки ре имеет. По формулам « (1.76)—(1.78) находим оптимальные стратегии игроков X* —(5/11, 6/11), У* = (8/11, 3/11), а также значение игры v = 40/33. Понижение порядка матрицы Н2 по срав- нению с матрицей Н{ вызвано уменьшением объема ин- формации, доступной игрокам, что, в свою очередь, при- вело к уменьшению числа чистых стратегий. Пример 6.2. Пусть первый ход делает игрок 0, выби- рая с вероятностями р, = 2/3 и р2 = 1/3 число ^^{1,2}. Затем игрок I, не зная исхода случайного испытания, Делает второй ход, выбирая число a2^{i,2}. Наконец, третий ход принадлежит игроку II, который, не зная ис- хода случайного испытания на первом ходу, но зная, ка- 1^ г. Н. Дюбин. В. Г. Суздаль
194 ч ЧАСТЬ Щ. МНОГОШАГОВЫЕ ИГРЫ кое число о2 выбрано на втором ходу, выбирает число о3 е {1,2}. Кроме того, допустим, что если выбраны числа OiK о2 и Оз, то игрок II платит игроку I сумму ЛШ) == = ]И(О1, о2, Оз)ь где М — функция, которая принимает значение согласно табл. 6.2. ' Диаграмма дерева игры с выделенной вершиной qh, множеством неокончательных вершин Q = {дч, д2, .. W, множеством окончательных вершин T = {t^ t2, ..., t3}, а также информационными множествами UQ = {<7i}, Ui = = {$& ?з}> Uii = {?б, и Uu = {g4, ?6} представлена на рис. 6.2. - В данной игре стратегия игрока II есть упорядочен- ная пара (Л, /2), где ji — альтернатива, выбираемая иг- роком II при условии, что игрок I выбрал 1-ю альтерна- тиву (7\==1, 2), /2 — альтернатива, выбранная игроком II при. условии выбора первым игроком 2-й альтернативы (j2 = 1,2). Следовательно, игрок II имеет . чистые стра- тегии 1 =d,1), 2 = (1,2}, 3 = (2,1), 4 = (2,2). . Пусть игроки I и II применяют соответственно стра- тегии 1 и 2. Тогда если игрок 0 на первом ходе выберет 1-ю альтернативу, то согласно стратегиям игроков партия закончится в окончательной вершине ti и игрок I получит Л/(£) = —1 (см. тйбл. 6.2). Если же в результате хода
ГЛАВА 6, ПРИЛОЖЕНИЯ ' ч 195 . • ♦ игрока 0 будет выбрана 2-я альтернатива, то игрок I по- лучит M(t) = 4 (табл. 6.2). Поэтому математическое ожи- дание выигрыша игрока I будет равно ' ha = ».(-!) + 4-4-4-' ’ Аналогично, вычислив все Лу, получим матрицу гт /2/3 2/3.1173 1’1/3\ г Лз~\2/3 0, 2/3 О/’ которая является нормальной формой7 позиционной игры (рис. 6.2). Матрица Hi имеет седловые точки (1,1) и (1,2), поэтому первая стратегия . игрока I является оп- тимальнощ а у игрока II две оптимальные стратегии:, (11) и (12). Значение игры равно 2/3. z Более сложной является методика приложения теории детерминированных, стохастических и рекурсивных игр. Здесь прежде всего необходимо перечислить все состоя- ния и для каждого из них построить формальную матри- цу, моделирующую обстановку на каждый дискретный момент принятия решений. Если при этом множество состояний одноэлементно и на каждом шагу дискретно изменяются/лишь ресурсы игроков, а продолжительность конфликта во времени зависит только от принятых ре- шений и объёма ресурсов, то конфликт хорошо моделиру- ется детерминированной игрой. Если же решения, при- нимаемые на том или ином этапе динамики конфликта, приводят к ситуациям, каждая из которых случайным образом завершает конфликт или обуславливает его дальнейшее развитие, то строится стохастическая (или рекурсивная) игра. Нижеследующие примеры иллюстрируют приложения теории позиционных, детерминированных, стохастических и рекурсивных игр в экономике,-военном деле и спорте. § 6.1. Примеры приложений теории позиционных игр Пример 6.3 (планирование цикла посева). Предположим, что колхозу требуется определить опти-' мальное^чередование чистого пара, тех или иных сортов культур и многолетних трав в зависимости от. ожидае- мого характера метеорологических условий каждого года 13*
196 ЧАСТЬ III. МНОГОШАГОВЫЕ ИГРЫ планируемого цикла. Неопределенность долгосрочных прогнозов погоды обуславливает, как это было показано в приложениях матричных игр, целесообразность теорети- ко-игрового подхода^ если принять за игроков I и II, пре- следующих прямо противоположные цели, соответствен- но агронома и природу. Тогда для конечного множества альтернатив, имеющихся в распоряжении агронома, и ко- нечного множества прогнозов погоды на каждый ? год цикла можно построить позиционные игры, а затем найти оптимальную последовательность чередования. Допустим, что в первый год цикла предполагается засеять некоторую площадь культурой № 1 или много- летней травой А и что согласно долгосрочному прогнозу ожидается четыре варианта метерологических условий (Пр, П|, nJ, П4). Если засеять культуру № 1«й метео- рологические условия первого, года цикла будут П}, то культура №1 успеет созреть, и на следующий год засе- ваем культуры № 2 и № 3. При этом культуры № 1 и № 2 дают доход с одного гектара площади для условий nJ погоды второго года севооборота, равный ti9 а для условий П| — равный t2. Культуры № 1 и № 3 дают доход, равный Лз и h соответственно для условий nJ и П2. Если же на первом году засеять культуру № 1, а метеорологические условия окажутся nJ, П|хили HJ, то на второй год вря площадь отводится под чистый пар, что обеспечивает доход, равный соответственно £5, U и Ъ- Многолетняя трава А сменяется культурой № 4 или № 5, если подтверждается прогноз условий или nJ,и куль- турой № 6 или № 7, если подтверждается прогноз условий П| или nJ. При этом культура № 4 (№ 5) в условиях П} первого года дает доход ts или t9 (£ю или tn) в* зависимости от условий П^ или П| второго года, а в условиях П| первого года дает доход £12 (£43) неза- висимо от условий второго года. Культуры № 6 и № 7 в'условиях П| первого года, независимо от условий вто- рого года, дают соответственно доход и ti5, а в усло- виях nJ первого года — соответственно, доход и ti7. 'Построим диаграмму. дерева позиционной игры (рис. 6.3), считая, что йгрок II не имеет информации о
ГЛАВА 6. ПРИЛОЖЕНИЯ 197 выбранных альтернативах игроком I на каждом- ходе. Очевидно, что первый ход делает игрок I, находясь в информационном: множестве Ui = {g^} и имея две альтер- нативы (1-я — культура № 1, 2-я — многолетняя трава Л). Второй ход принадлежит игроку II, который нахо- дится в информационном множестве С7п = {^2^3} и име- ет четыре альтернативы (альтернатива к соответствует игрок I, выбирая одну из двух альтернатив: в информа- ционном множестве Ul = {q^} альтернатива 1 — культу- s ра № 2 и альтернатива 2 —культура № 3; в информа- ционном множестве Z7i = {q^ qQ} альтернатива 1 — куль- тура № 4 и альтернатива 2 —культура № 5; в инфор- мационном множестве Ux = {g7, «у8} .альтернатива 1 —
198 ЧАСТЬ III. МНОГОШАГОВЫЕ ИГРЫ культура № 6 и альтернатива 2 — культура № 7. Нако- нец, четвертый ход делает игрок II, находясь в информа- ционном множестве J7n = {^9, Уп} и. выбирая одну из двух альтернатив (альтернатива 1 — погодные условия второго года П*, альтернатива 2 — погодные условия вто- рого тода П|). Чистую стратегию игрока II можно записать как сле- дующую систему где — альтернатива, выбирае- мая на втором ходе (/1 = 1, 2, 3, 4), а ]2 ^ альтернатива, выбираемая на четвертом ходе (j2 =« 1, 2). Обозначим первую л вторую чистые стратегии игрока I соответственно через ЛИНИ и II1II2II, что означает выбор альтернативы 1 на первом ходе, а альтернативы 1 и 2 на третьем ходе. Последующие стратегии игрока запишем в виде системы Il2lliifell, согласно которой на первом ходе выбирается альтернатива 2, а на третьем — альтернати- ва ii (ii —1, 2), если игрок II на втором ходе выбрал 1-ю или 2-ю альтернативу, и i2 (fe —1, 2), если игрок II. на втором ходе выбрал 3-ю или 4-ю альтернативу. В результате функция выигрыша игрока Г будет пред- ставлена таблицей 6.3. • — Пусть tk принимает такие значения, что функцией выигрыша игрока I будет матрица 37834783 37835783 9 9 5 7 И 9 5 7 а 9 9 6 11 11 9 6 11 ’ 6 7 5 7 8 7 5 7 L6 7 6 7 8'7 6 11 Используя лемму 1.10, находим, что. всякое решение игры Г3:=<ж\{2,3,5,6}, у\{2,5,6}, НУ является решением иг- ры Г = <#, у, Н). Представим игру Г1 матрицей 3 8.8 3V 9 6 6 11/’ в которой 1-я строка соответствует 2-й стратегии, 2-я строка —4-й стратегии, 1-й столбец —1-й стратегии, 2-й столбец —3-й стратегии, 3-й столбец — 7-й стратегии и ' 4-й столбец — 8-й стратегии игры Г. Из анализа матрицы Н1 на основании теоремы 1.11 находим, что всякое реше- Я1 =(
ГЛАВА 6. ПРИЛОЖЕНИЯ 199 ние игры Г2 = <а?, </\{7,8}, Н1) является решением игры Г1 и, следовательно, игры Г. Запишем игру Г2 в мат- ричной форме: Н2 — (З п \9 6/’.% ' ; 1-й столбец которой соответствует 1-й стратегии, а 2-й столбец — 3-й стратегии игры Г. Таблица 6.3. Функция выигрыша игрока 14 HUIHI Стратегия игрока I -НИ II *1 1121II *5 1131II *6. 1141Ц ' *7 ' 1112Ц *2 ||22 II *5 1132Ц *6 Ц42|) . *7 Ц1Ц211 h *5 *6 *7 *5 *6 *7 112Ц11Ц *12 *14 *16 *9 *12 *14 • *16 Ц2Ц12Ц *8 *12 *15 - .*17 ' *9 *12 *15 *17 ‘||2||2Н1 *10 *13 *14 '*16 *11 *13 *14 *16 -Ц2Ц22Ц *10 *13 *15 *17 *11 *13 *15 *17 Матрица Н2 не^имеет седловой точки, так как не вы- < полняется равенство (1.10). Поэтому решение игры Г2 найдем по формулам (1.76)—(1.78),. а именно ((3/8, 5/8), (1/4, 3/4), 27/4). "Стратегия Х*='(378, 5/8) и Т* -(174, 3/4) игры Г2 .соответствуют 'стратегии Х* = (0, 3/8, 0, - 5/8, 0, 0) и У* = (1/4, 0, 3/4, 0, 0, 0, 0) игры Г. Таким образом, игрок I с вероятностью 3/8 выбирает альтернативу 1 на первом ходе и альтернативу 2 на третьем ходе, а с вероятностью 5/8 — альтернативу 2 на первом ходе и' альтернативу 1 на третьем ходе, если на втором ходе будет выбрана альтернатива 1 или 2, и альтернативу 2, если на втором ходе будет выбрана альтернатива 3 или 4. В содержательной терминологии примера 6.3 агроном должен с вероятностью 3/8 засеять ‘ культуру № 1 в первый год и культуру № 3 во второй год, а с вероятностью 5/8 засеять многолетнюю траву А в первый год и культуру № 4 во второй год, если под- твердится прогноз П? или и культуру № 7 — во вто- рой год, если подтвердится прогноз П| или Пд. Разуме- ется; если возможно использовать «физическую» смесь стратегий (распределение посевной площади между
00 ЧАСТЬ III. МНОГОШАГОВЫЕ ИГРЫ культурами и травами в первый й второй годы), то аг- роному целесообразно в первый год выделить 3/8 площа- ди под культуру № 1 и 5/8 под многолетнюю траву 4, а во второй год выделить 3/& площади под культуру № 3 и 5/8 площади под культуру № 4 (если подтвер- дится прогноз П? или П2) и культуру № 7 (если под- твердится прогноз П| или П£). Пример 6.4 (теоретико-игровая модель боевых действий различной информа- цией о функции выигрыша у игроков). В вооруженных столкновениях часто складываются конф- ликтные ситуации, в которых одна из сторон не может количественно оценить эффективность способов действий или оружия противоположной стороны. Так, например, корабль, уклоняясь от торпедной, атаки, как правило, не знает, сколько торпед будет в залпе, и, следовательно, не может оценить эффективность уклонения для каждого способа стрельбы и каждого йаневра уклонения. В про- тивоположность- ему атакующий корабль обладает этой информацией/и может ее использовать в своих целях. Традиционно проблема информаций о функции выиг- рыша решается в двух аспектах: принимается допущение о знании игроками функции выигрыша или теоретико- игровая модель строится таким образом, что неизвестный параметр включается как элемент стратегии соответст- вующего игрока. Однако не всегда эти аспекты приводят к построению достаточно адекватной модели, и поэтому возникает необходимость учесть разные объемы информа- ции у игроков о функции выигрыша. Один из таких под- ходов приводит к некоторому специальному классу пози- ционных антагонистических игр двух лиц. Игроками I и II, каки в матричных играх, являются противники, преследующие прямо, противоположные цели и имеющие конечное число возможных вариантов действий. Функция выигрыша игрока I задана множест- вом матриц Я = {Я\ Я2, .. Нг}. Игрок .0 делает ход, не преследуя какой-либо цели (д силу объективных факто- ров, независимых, от воли игроков), выбирает к^К~ == {1, 2, ..., г). Число к сообщается только игроку I. Последний, зная матрицу Нк || hij |, выбирает число i ($ = 1, 2, ..., т). В отличие от чего игрок II должен
ГЛАВА 6. ПРИЛОЖЕНИЯ 201 выбрать число j (/ — 1, 2, ...., п), зная только множество jMl, 2/..., г} и распределение вероятностей на нем, в соответствии с которым выбирается к ^К. Игрок I, зная последнее обстоятельство, может* использовать его в своих интересах и увеличить выигрыш. Игроку II тог- да остается только не дать игроку I увеличить выигрыш более, чем это обусловлено разными объемами информа- ции о функции выигрыша. Для вычисления оптимальных стратегий и значения игры представим ее как позиционную, игру с неполной информацией, в которой первый ход делает игрок 0, второй —игрок I, а третий — игрок II (рис‘ 6.4). > - Стратегия игрока. I — это функция на семействе ин- формационных множеств Ui = {#ь • • которая при- нимает значение из интервала 1, т. Поскольку у игро- ка I имеется г различных информационных множеств, стратегию игрока I можно изобразить наборном г чисел (f±, ^), где 4 е И, т} для 1, 2, ..., г. Обозна- чим чистую стратегию игрока I через Игрок II не имеет информации о первом и втором ходах, поэтому его стратегия определяет только выбор числа у*. Следовательно, стратегию этого ^игрока можно
202 ЧАСТЬ III. МНОГОШАГОВЫЕ- ИГРЫ записать следующим образом: = (0, ..0,1, 0, ..0) для / = 1,2, .. .,п. Очевидно, что число чистых ^стратегий игрока I равно тг (поскольку ik пробегает тп значений и имеется г зна- . чений числа гА), а число чистых стратегий игрока II равна п. Каждая пара стратегий '(я(гг..гг), У>) определяет ма- тематическое ожидание выигрыша Л(^..лгр игрока I в по- зиционной игре с неполной информацией: Й-(гг..гг)7 (6-1) которое является соответствующим элементом тпгХп — матрицы нормальной формы позиционной игры. Оптимальную стратегию игрока I запишем следую- "чцим образом:* - I . , ‘ \ ' (6.2) где ~ вероятность применения чистой стра- тегии х{1„Лг. Оптимальная стратегия игрока II будет Х*=г={т]*(уР}, ' (6.3) где rj*(#p—вероятность применения чистой стратегии yj. Соответственно значение игры v будет равно SS Ач-Ч’ (хч-О Я* (ю). (6.4) Далее воспользуемся стратегией поведения, так как рас- _ сматриваемая игра является игрой с полной памятью и, следовательно, у игроков' существуют , оптимальные стра- тегии поведения. . . Определим оптимальную стратегию поведения йгрока I следующем образом: Ю,....Ю.Ю), (6.5) где '
ГЛАВА 6. ПРИЛОЖЕНИЯ 203 где в свою очередь = 1, = о для I = 1, 2, .... г. Для игрока II оптимальная стратегия поведения со- ответствует его оптимальной смешанной стратегии, т. е. g* = (ri*(yi), •••» (6:6) Проиллюстрируем построение и решение игры с раз- личной информацией о функции выигрыша у игроков на конкретном примере. Предположим, что противоло- дочный самолет для обнаружения подводной лодки, на- ходящейся в некотором районе, может использовать радиогидроакустические буи (1-е средство поиска) или магнитометр (2-е средство поиска). В свою очередь подг водная лодка, зная эффективность этих средств, может выбрать глубину погружения At или Л2. Поскольку под- водная лодка и противолодочный самолет преследуют прямо противоположные цели, моделью этой конфликт- ной ситуации является антагонистическая одноходовая конечная игра. Для ее построения за критерий эффектив- ности примем вероятность необнаружения подводной лодки. Пусть в гидроакустических условиях 1-го типа матри- ца выигрышей игрока I (подводная лодка) имеет вид UiV, • где hlj — вероятность необнаружения подводной лодки в гидроакустических условия^ 1-го типа при i-й глубине погружения и /-м средстве поиска. Очевидно, если гидроакустические условия в районе поиска будут 2-го типа,, то матрица выигрышей игрока I примет следующий вид: = Ап ** \л2 л2 Г ' \Л21 Л22/ где Л-у — вероятность необнаружения подводной лодки в гидроакустических условиях 2-го типа при i-й глубине погружения и у-м средстве поиска.
204 ЧАСТЬ III. МНОГОШАГОВЫЕ ИГРЫ Предположим теперь, что противолодочный самолет (игрок II) не знает, какой именно тип гидроакустиче- ских условий в районе поиска. Тогда матрица выигры- шей игрока I примет следующий вид: \Л21 Л22у где h^j — вероятность необнаружения подводной лодки в гидроакустических условиях fc-ro типа при i-й глубине погружения и /-м средстве поиска. Как видно, в этом случае игроку! известно значение функции выигрыша, а игрок II знает только множество значений этой функции. Обычно из многолетних наблюдений известно распре- деление вероятностей на множестве типов гидроакусти- ческих условий для большинства районов Мирового окра- на. Предположим, что для данного района вероятность 1-го типа равна 1/3, а 2-го —2/3, т. е. Pi = 1/3 и Р2 = =•2/3. Кроме того, пусть критерий эффективности при- нимает такие значения, что матрицы выигрышей игрока имеют следующий вид: 0,30 0,50\ • 2 __ /0,30 0,40\ 0,20 0,30/’ Н = \О,'6О 0,20/ / , Найдем оптимальные стратегии. и значение игры. Представим рассмотренную игру в виде позиционной игры (рис. 6.4) и составим ее нормальную форму (табл. 6.4). Решаем матричную игру с матрицей выигрышей Н: ^*(яи) == 3/5, g*Gr12) = 2/5, g*(x2i) = O, g*(x22) = O, • ^(yJ-2/5, ' т]*(у2) = 3/5, v—0,38. Определяем стратегию поведения игрока I: /* = ((1,0), (3/5, 2/5)). Находим оптимальные стратегии игроков в исходной игре: Х*(1) = (1, 0), Х*(2) = (3/5, 2/5), У* = (2/5* 3/5). 7-7 7 9
ГЛАВА 6. ПРИЛОЖЕНИЯ 205 ! Следовательно, подводной лодке рекомендуется в гидроакустических условиях 1-го типа находится на глу- бине At. В условиях >2-го типа подводной лодке целесо- образно находиться попеременно^ на глубинах At и А2 пропорционально вероятностям выбора чистых стратегий, т. е. ^(2)— 3/5 и g2(2) = 2/5. Обозначим через Т время . Таблица 6.4. Матрица выигрышей игрока I Х11 У1 0,9/3 У2~ 1,3/3 #12 1,5/3' 0,9/3 . #21 0,8/3 ' 1,1/3 #22 ' 1,4/3 0,7/3 нахождения подводной лодки в районе поиска ее про- тиволодочными самолетами. Очевидно, что Т = Л + Т2, где Л — время нахождения на глубине А^ а Т2—- время нахождения'на глубине А2. Так, если Т = 100 часов, то подводная лодка на глубине At должна находиться = = 60 часов, а на глубине А2 — Т2 = 40 «часов. В резуль- тате смешанная стратегия игрока I оказалась реализо- ванной путем применения «физической» смеси его чистых стратегии. j Таким образом, отсутствие информации об элементах обстановки, которые влияют на эффективность решения боевой задачи при одних и тех же способах действий сторон, приводит к целесообразности построения пози- ционной игры и вычисления оптимальных стратегий. Пример 6.5 (динамика морского боя). До- пустим, что сторона А планирует нанесение двух после- довательных ударов двумя корабельными ударными^ груп- пами (КУГ-1; и КУГ-2) по отряду боевых кораблей (ОБК) сторойы В. Первый удар наносит КУГ-1 в боевом поряд- ке № 1 или № 2, а' второй КУГ-2 в боевом порядке № 1 или № 2. Кроме того, КУГ-1 и КУГ-2 могут взаимодей- ствовать путем согласования вариантов боевых порядков. Так, КУГ-2 может Ьыбрай» боёвой порядок в зависимости
206 ЧАСТЬ Щ. МНОГОШАГОВЫЕ ИГРЫ от того, в каком боевом порядке наносила удар КУГ-1. В свою очередь ОБК может организовать оборону по ва- рианту Кг 1 или №2. Следовательно, динамика данного конфликта состоит в том, что на первом этапе наносит удар КУГ-1, на втором этапе ОБК организует оборону и отражает удар КУГ-1, а на третьем этапе наносит удар КУГ-2. Пусть игроком I будет КУГ-1 и КУГ-2 стороны А, а игроком 11 — отряд боевых кораблей стороны В. Пер- вый ход делает игрок I, имея две альтернативы: 1-я-г- КУГ-1 наносит удар в боевом порядке № 1, 2-я — КУГ-1 . наносит удар в боевом порядке № 2. Игрок II делает второй ход, имея так же две альтернативы: 1-я — органи- зовать оборону по варианту № 1, 2-я — организовать оборону по варианту № 2. Наконец, третий ход принад- лежит игроку I, который может выбрать одну из сле- дующих двух альтернатива 1-я —КУГ-2 наносит удар в боевом порядке № 1, 2-я —КУГ-2 наносит удар в боевом порядке № 2. Каждый из игроков не знает, какой ход делает другой игрок, но игрок I помнит, какой выбор он сделал на первом ходе. Это игра с неполной информацией, но с пол- ной памятью, а диаграмма дерева игры- показана на рис. 5.2. * v Стратегия поведения игрока I есть функция /, опре- деленная на информационных множествах J7i Vi =Ч?4, <7б}, Uf = q?} следующим образом: f№) = (а, 1 -а), f(ul) = (₽,!-₽), /(С7?)=(тЛ-т), где а — вероятность выбора 1-й альтернативы игроком I на первом .ходе; 1Ч а — вероятность выбора 2-й альтер- нативы игроком I на первом ходе; р — вероятность вы- бора 1-й альтернативы игроком I на третьем ходе, если на первом ходе была выбрана 1-я .альтернатива; 1-т^ — вероятность выбора 2-й альтернативы игроком I на третьем ходе, если на первом ходе была выбрана 1-я альтернатива; т— вероятность выбора 1-й альтернативы игроком I на третьем ходе, если на первом ходе была выбрана 2-я альтернатива; 1 — — вероятность выбора 2-й альтернативы игроком I на третьем ходе, если на первом ходе была выбрана 2-я альтернатива.
ГЛАВА б, ПРИЛОЖЕНИЯ 207 Стратегия поведения у игрока Н есть функция, опре- деленная на множестве (7ц = g(J7n) — (со, 1 — о), где со — вероятность выбора 1-й альтернативы игроком II на втором ходе; 1 — со — вероятность .выбора 2-й аль- тернативы игроком II на втором ходе. , Обозначим через Ж/, g) математическое ' ожидание выигрыша игрока I при условии, что игроки I и II при-* меняют соответственно стратегии поведения f и g.* Оче- видно, что ‘ „ H(f, g) = (J + М2асо(1 — 0).+ — со)0 + + Jf4a(l — со) (1 — р)+М5(1 "-а)соу + Мв(1 — а)со(1 — 7')+ + ВД - а)(1 - со)у+^И8(1 - <х)(1 — £)(!-7), (6.7)’ где Mi — выигрыш игрока I в окончательной позиции й, заданный табл. 6.5. Таблица 6.5. Функция выигрыша партии Окончатель- ная вершина Выигрыш . *1 ♦ ^2 - Н ^4 ^5 ^6 /7 2 0 1 0 0 1 - 0 2 Преобразуем выражение (6.7), введя следующие пе- ременные: at = оф, а2 = а(1 — р), а3 = (1 — а)т; а4 = = (1 — а)(1 — 7), со4 = со ито2 = 1 —со. В результате по- лучим Ж/, ==* + Jf2Qt2co/+ J/3aiC02 + M4a2co2 + + Л/5ощсО1 + M6a4C0i + М7а3со2 + 7И8а4со2 (6.8) . при наличии ограничений _ 7 а1 + а2 + а3 + а4 — 1, C0i + co2 = i. ' (6.9) Легйо убедиться, что ограничения (6.9) удовлетворяют всем значениям переменных й coj. / Следовательно, надо найти такие а* и со,, кото- рые удовлетворяют .ограничениям. (6.9) и при которых
208 ЧАСТЬ III. МНОГОШАГОВЫЕ ИГРЫ справедливо равенство max min Н (f, g) == min max H (f, g), f g ч g f что эквивалентно решению матричной игры с матрицей выигрышей игрока I f мз\ гг \ЛЛ MR / или (после подстановки значений Mt из табл. 6.5) игры с матрицей выигрышей (2 *\ 0 0 1 оо Г 12/ , В результате найдем at = 1/2, аг = as = 0, сс4 — 1/2, a = = (1/2, 0, 0, 1/2), 0 = (1/2, 1/2) и 0 = 3/2. Отсюда 1/2 = = оф, 0 = а(1 — 0), 0 = (1 —aty, 1/2= (1 — а)(1 — 7); окончательно получим ' а = 1/2,- (J = 1, 7 = Q. Найдем теперь решение данной игры в смешанных стратегиях. Очевидно, что чистой стратегией игрока I является тройка IlillhiJI, где I— номер альтернативы, ко- торую игрок- I выбирает на первом ходе, а ik (Л = 1,2)— номер альтернативы, которую выбирает игрок I на треть- ем ходе, если на втором ходе игрок II выбрал альтерна- тиву к. Так, например, стратегия 111112111 означает, что на первом ходе игрок I выбирает 1-ю альтернативу (КУГ-1 в боевом порядке № 1) и затем на третьем ходе выби- рает 2-ю альтернативу (КУГ-2 вбоевом порядке № 2), если игрок II на втором ходе выбрал 1-ю альтернативу- (оборона ОБК по варианту № 1); и выбирает 1-ю аль- тернативу (КУГ-2 в боевом порядке № 1), если игрок II на втором ходе выбрал 2-ю'альтернативу (оборона ОБК по варианту № 2). Чистой стратегией игрока II является число /, пред- ставляющее выбор альтернативы на<втором ходе. Сведем позиционную игру к нормальной форме (табл. 6.6).
ГЛАВА 6. ПРИЛОЖЕНИЯ 209 - В результате решения полученной матричной игры имеем Х* = (1/2, 0, 0, 0, б, 1/2), У* = (1/2, 1/2), v = 3/2. Из X* видно, что «1-я и 6-я стратегии должны приме- няться соответственно с вероятностями = 1/2 и = = 1/2. Следовательно, игрок Г на первом ходе должен Таблица 6.6. Дозиционная игра с полной памятью в нормальной форме - ' '1 1 1 2 . 1 = Ц1||1 1|| 2 1 2 = ||1||1 2|| 2 1 3 = ||1||2 1|| , 0 0 4 = 1И112 2|| 0 0 ' 5 = ||2||1 1|| 0 0 6 = ||2||1 2|| 1 2 7 = ||2||2 1|| 0 0 8 = ||2||2 2|| . 1 2 выбирать 1-ю альтернативу с вероятностью 1/2, на треть- ем ходе в информационном множестве £7? = {?<,' qb}— только 1-ю альтернативу, а в информационном множест- ве Ui = {#6,1 #7} — только 2-ю альтернативу. Поэтому а = 1/2, р = 1 и 7 = 0. В результате получили распреде- ление вероятностей в каждом информационном множест- ве, т. е. стратегию поведения f* для игрока I, которая эквивалентна его оптимальной смешанной стратегии X*. Для игрока II стратегия поведения g* такая же, как и оптимальная смешанная стратегия У*. Пример 6.6 (теоретико-игровая модель до.игровки в йолейболе). Под доигровкой в во- лейболе понимается ситуация, которая складывается на площадке, когда мяч со цтороны противника -направля- ется через сетку передачей (сверху или снизу). Разуме- ется, что ответную атаку при доигрывании такого «про- стого» мяча следует начать с приема и передачи спосо- бом «сверху». При этом создаются благоприятные воз- 14 Г. Н. Дюбин. В. Г. Суздаль
210 ЧАСТЬ III. МНОГОШАГОВЫЕ ИГРЫ • * можностй «для опережения защитных действий против- : ника/ который находится в условиях неопределенности, так как возможность организации атаки через выходя- щего игрока с участием в атаке трех и даже четырех на- падающих, а также нападение с первой передачи или «откидки» лишает его информации Ьб избранном способе ответньрс действий. Рассмотрим построение теоретико- игровой модели доигровки при направлении мяча через сетку в зону № 5. . ' Первый • ход принадлежит игроку I (напомним, что игроком I является команда," владеющая мячом), дейст- вия которого , складываются из приема мяча сверху в зо- не № 5, «рейда» выходящего («ложного» или фактиче- ского) и первой передачи для "нападающего удара в зоне № 2 (3) или для организации атаки через выходящего. Следовательно, делая первый ход, игрок I может .выбрать альтернативу 1 (первая передача в зону №2), альтер- нативу 2 (первая передача выходящему) или альтернат тиву 3. (первая передача в зону № 3). Второй ход делцет игрок II, выбирая альтернативу 1 (подготовка одиночного блока) или 2 (подготовка двой- ного блокаХ 4 • Содержание третьего хода составляет завершение атаки с первой передали или ее дальнейшее развитие . Соткидка или вторая передача выходящим). При этом способ завершения атаки или её развитие зависит от характера. первой передачи (выбранной альтернативы на первом ходе). Поэтому альтернативы игрока^ 1 на треть- ем ходе определим в зависимости от выбранной альтер- нативы на' первом ходе. Если! на первом ходе выбрана альтернатива 1 (передача й зону № 2 для нападающего удара), то на третьем ходе (обозначим Мза) игрок I мо- жет завершить атаку нападающим ударом в зоне № 2 (выбрать альтернативу 1 на ходе Мза), выполнить откид- ку в зону № 4 (выбрать альтернативу 3 на-ходе Мза). Аналогично, если на первом ходе выбрана альтернатива 2, то игрок I может на третьем ходе (обозначим М3б) сделать вторую передачу в зону № 2, 3 или. 4 (выбрать альтернативу 1, 2 или 3 на ходе Мзб). Наконец, если на первом ходе выбрана альтернатива 3, игрок I может на третьем ходе (обозначим завершить атаку нападаю- щим ударом в зоне, № 3 (выбрать альтернативу 1 на
ГЛАВА 6. ПРИЛОЖЕНИЯ 2Ц ходе Мзв), выполнить откидку в зону № 2 или 4 (выб- рать альтернативу 2 или 3 наг ходе Мзв). На четвертом ходе игрок II может организовать оди- ночный или двойной блок (выбрать альтернативу 1 или 2 на четвертом ходе). Рис. 6.5. Ходы и альтернативы для случая, когда мяч направ- ляется в зону № 5, приводятся в табл. 6.7, а диаграмма дерева игры — на рис. 6.5. 14*
Таблица 6.7. Ходы и альтернативы Альтер- натива Игрок I (команда в нападении) м. МЛ За 36 1 Первая передача в зону № 2 Напад. удар в зоне Я® 2 < Вторая передача в зону № 2 2 Передача выходя- Откидка в зону Вторая передача ♦ щему № 3 в зону Яз*3 3 / Первая передача в зону Откидка в зону № 4 \ Вторая передача в зону № 4
SL- Игрок II (команда в защите) Мо Зе М, м4 Напад. удар в зоне № 3 Подготовка одиночного блока Организация одиночного блока Откидка в зо- ну № 2 Подготовка двойного блока Организация ДВОЙНОГО ’ блока Откидка в зо- ну № 4 — ЧАСТЬ III. МНОГОШАГОВЫЕ ИГРЫ ьэ м
ГЛАВА 6. ПРИЛОЖЕНИЯ 213 ' Стратегии игроков записываются посредством сле- дующих систем: . _ | IIМ у8 В для а = (1,3), l—I РАН Для kt = 2, 7= Ilgizs ||, ... где i —стратегия игрока I; / — стратегия игрока II; ki ~ альтернатива игрока I, выбираемая на первом ходе; к2 — альтернатива игрока I, выбираемая на третьем ходе; 15 — альтернатива игрока I, выбираемая на третьем ходе, если на втором ходе выбрана /-я альтернатива (/ = 1, 2); gi — альтернатива- игрока II, «выбираемая на втором ходе, если на. первом ходе выбрана i-я альтернатива U = -1, 2, 3). Стратегия игрока II предполагает, что при создании возможности для организации двойного блока на втором ходе, такой блок организуется на четвертом ходе. В про- тивном случае всегда при завершении атаки с первой передачи организуется одиночный блок, а в случае от- кидки— двойной блок. При развитии атаки через выхо- дящего и при второй передаче в зону № 3| организуется только одиночный блок, если на втором ходе не была создана возможность для организации двойного блока в этой зоне. Если же выходящий выполнил вторую переда- чу в зону’№. 2 или 4, а в зоне № 3 двойной блок,не организован, то такой блок организуется в соответству- ющей зоне (№ 2 или 4). В противном случае в зоне № 2 или 4 организуется только одиночный блок. Такое допущение обусловлено тем, что в рассматриваемой мо- дели предполагается первая передача на высоком техни- ческом уровне, обеспечивающая- завершение атаки на- падающим ударом. Техническая подготовка игрока, вы- полняющего передачу для нападающего удара, будет учтена ниже при определении функции выигрыша. Выбор каждым игроком одной из своих стратегий определяем зону нападающего удара' и характер блока. Предположим, что игрок I применяет стратегию 41111211, а игрок IIстратегию 1121111. Из описания стра- тегий игрока I видно, что на первом ходе он выбирает альтернативу 1, а из описания стратегий игрока II сле- дует, что на втором ходе он выбирает альтернативу 2. Возвращаясь к стратегии игрока I, заключаем, что на
214 ' ЧАСТЬ III. МНОГОШАГОВЫЕ ИГРЫ / W * третьем ходе он выбирает альтернативу 2. Так как игрок II на втором ходе создал возможность для организации двойного блока , в зоне № 2/ а откидка последовала в зону № 3, то на четвертом ходе игрок II противопо- ставляет атаке только одиночный блок. Следовательно, выбранные стратегии привели к атакующим действиям в зоне № 3 после. откидки из зоны № 2 и организации одиночного блока. Рассуждая аналогичным образом, для других возможных пар стратегий можно составить таб- лицу доигровки; в которой строки отводятся для страт тегий игрока I, столбцы —для стратегии игрока II, в клетках на их пересечениях указывается зона атаки и характер блока (табл. 6.8). Функция выигрыша за- дается вероятностью успешного завершения ата^и PiPh где pi — вероятность выполнения передачи для нападаю- щего удара согласно i-й стратегии игрока I; р/—веро- ятность успешного выполнения нападающего удара сог- ласно j-й стратегии игрока II. В общем случае для команды высокой техничесКой- подготовленности можно полагать, что всегда вероятность выполнения второй передачи выходящим или откидки будет не меньшей, чем вероятность первой передачи из глубины площади для нападающего удара (в рассмат- риваемой доигровке из зоны4 № 5).'Эффективность на- падающего, удара за счет перемещения игроков первой линии в основном определяется зоной атаки и характе- ром блока. На основании этого выделяются два варианта доигровки: первая передача выполняется не хуже, чем вто- рая и вторая передача выполняется лучше, чем первая. Для первого варианта доигровки нормальная форма игры — 21X 8:матрица имеет седловую точку, а игроки I, и II оптимальные стратегии j* == 113111311 и ц = ||112||, /а = || 1221|, /з = || 212 ||. Реализация оптимальной^ страте- гии i* достигается следующим образом (рис. 6.6). Из зоны № 5 выполняется взвешенная передача в зону № 3, делается «ложный» выход, к атаке в зоне № 3 готовится игрок зоны № 4, перемещаясь туда, а игрок зоны № 3 занимает -исходное положение для атаки в зоне № 4, если ему будет адресована откидка. Заме- тим, что выполнение первой передачи для нападающего
Та б лпц'а 6.8. Таблица доигровок в зоне № 5 (вариант № 1) Игрок II Игрок I _ » Номер и содержание стратегии игрока И 1=1111 111 2=||1 1 2|| •.. 8==||2 1 1|| На ходе 2 выбрать альтернативу 1 не- зависимо от перво- го хода На ходе 2 выбрать аль- тернативу 1 (если на ходе 1 выбрана альтер- натива 1 или 2) или альтернативу 2 (если на ходе 1 выбрана альтернатива 3) < На ходе 2 выбрать аль- тернативу 2 (если на ходе 1 выбрана аль- тернатива 1) или аль- тернативу. 1 (если на ходе 1 выбрана аль- тернатива 2 или 3) I Номер и содержание стратегии игрока I 1=||1||1 111 На 1 и За выбрать 1, независимо от выбо- ра на.2 ходе / Нападающий удар в зоне Яз 2 и органи- зация одиночного блока Нападающий удар в зоне № 2 и организа- ция одиночного блока Нападающий удар в зоне № 2* и организа- ция двойного блока 2=||1||2 1|| На ходе 1 выбрать 1, на ходе За выбрать 2 (если на ходе ^выб- ран 1) иди 1 (если на ходе 2гвйбрана 2) Нападающий удар N в зоне № 3 и орга- низация двойного блока Нападающий удар в зоне № 3 и организа- ция двойного блока Нападающий удар в зоне №2 й организа- ция двойного блока • * 1 21=||3||3 3||| На ходе 1 выбрать 3; на ходе За выбрать 3 (если на ходе 2 выбра- на 1) или 2 (если на ходе 2 выбрана 2) Нападающий удар в зоне Яз 4 и органи- зация двойного бло- ка у Нападающий удар , в зоне № 2 и организа- ция одиночного блока - Нападающий удар в зоне № 4 и организа- , цйя двойного блока ГЛАВА 6. ПРИЛОЖЕНИЯ . 215
Таблица 6.9. Таблица доигровки в зоне № 5 (вариант № 2) Игрок II Игрок I Номер и содержание стратегии игрока II 1НИ12Ц ' ; > 2= ||1 2 2|| На ходе 2 выбрать 1 (если на ходе. выбрана 1 или 2) или 2 (если на 1 । ходе выбрана 3) На 2 ходе выбрать 1 (если на 1 ходе выбрана 1) или 2' (если на 1 ходе выбрана 2 или 3) IНомер и содержание стратегии игрока I Т-1 <М I На ходе 1 выбрать 2, на ходе 36 выбрать 1 Нападающий удар в зоне № 2 и организация двойного блока Нападающий удар в зоне № 2 и орга- низация одиночного блока а | . 2=112 2|| | На ходе 1 и 36 выбрать 2 ч / Нападающий удар в зоне № 3 и орга- низация одиночного блока Нападающий удар в зоне № 3 и орга- низация двойного блока , СО <м т со На ходе 1 выбрать 2, на ходе 36 выбрать 3 Нападающий удар в зоне № 4 и орга- низация двойного блока Нападающий удар в зоне № 4 и орга- низация одиночного блЬка - к , 216' ЧАСТЬ ИГ МНОГОШАГОВЫЕ ИГРЫ
ГЛАВА 6. ПРИЛОЖЕНИЯ 217 удара в зону №^3 из зоны № 5 возможно в ситуации, показанной на рис. 6.6, й при условии высокого качества первой передачи. Если игрок II не организовал на взве- шенную передачу двойной блок (отклонился от оптималь- ной стратегии }’*)» то выполняется нападающий удар. Если игрок II реализует оптималь- ную стратегию то делается от- кидка в зону № 4 или 2, в зави- симости от организации группово- го блока. Таким: образом, реали- зация оптимальных стратегий и ]* обуславливает завершение, атаки в зоне № 4 или № 2 про- тив одиночного блока. Для второго варианта (когда ситуация доигровки из зоны № 5 исключает возможность первой передачи или в этой зоне находит-, ся игрок, техника которого не позволяет стабильно выполнить первую передачу для нападаю- Рис. 6.6. щего удара в зону № 3) исход- ная матрица на основании теорем 1.10—-4.12 сводится к ЗХ 2-матрице (табл. 6.9). Для решения полученной игры путем статистической обработки материалов офи- циальных встреч и тренировочной работы определяются величины и pj. Смешанные стратегии игрока I в этом случае реализуются известным способом при организации атаки через выходящего. Это. позволяет определить с учетом конкретных возможностей команды целесооб- разное чередование известных способов атаки в зависи- мости от тактики противника при осуществления блоки- рования. § 6.2. Примеры приложении теории детерминированных, стохастических и рекурсивных игр Пр им ер 6.7 (теоретико-игровое обосно- вание оптимального расхода ресурса). В некоторых военно-экономических ситуациях расход ресурса зависит от выбранных способов действий про-
218 . ' ЧАСТЬ IIL МНОГОШАГОВЫЕ ИГРЫ тивоборствующих сторон, а достижение цели определяет- ся наличием ресурса при условии израсходывания ресур- са противоположной стороны. Такие конфликты хорошо моделируются детерминированными играми, одну из ко- торых можно описать следующим образом. Пусть первоначально игроки I и II имеют соответст- венно г и R — г едириц некоторого ресурса, а также по две чистые стратегии. Допустим, что если игроки выбе- рут одинаковые по номеру чистые стратегии, то ресурс игрока II уменьшается на единицу. Если же игроки . хвыберут разные по номеру чистые стратегии, то на еди-~ лицу уменьшается ресурс игрока I, Игра заканчивается после того, к^к ресурс одного из игроков станет равным нулю. При этом игрок I получает выигрыш, равный 1, если ресурс игрока II станет равным нулю, и выигрыш^ ~ 1, если станет равным нулю его собственный ресурс. Обозначим через Г*, г многошаговую игру, в которой игрок I имеет7 к 2, г) единиц, а.игрок И — I (2 = 1, 2; ..., Д -гг) единиц ресурса. Эта детерминиро- ванная игра имеет следующий вид: I — I Г Г р Vfe-1,1 ГМ-1/ где р ____Р Ц р ________ ( * . A fe,° - 1),, 1.0,1 - _ iJ- Рассмотрим первый от конца шаг, т. е. когда у обоих игроков осталось по одной единице ресурсов* Очевидно, что на этом шаге разыгрывается следующая детермини- рованная игра: А а ее значение val Лд, которое обозначим через рав- но 0 (см. (1.77)). На втором от конца шаге, т. е. когда у игроков осталось три единицы ресурсов, разыгрывается детерминированная игра г 1 ГХд)’ИИЖ'ГМ-Лг11 1 , 1\,2
ГЛАВА 6. ПРИЛОЖЕНИЯ 219 где элемент Г1Д является'таким исходом игры Г1|2 или Ггд, при котором игроки должны разыгрывать игру Г,.!. Так как значение игры Гм равно 14,з, можно считать; что значение игры Г112 или Г211 равно значению -игры I72(i4,i) или Г2>1 (14,3), в которой элементы Г,., заменяют- ся величиной*!?!^. Следовательно, игры Г112 и Г2,, можно заменить матричными играми следующего вида: / IV /1 «4 Л Г1.,К0 = (^.1' ) - г..,= 7д1' ). Путем решения матричных игр Г1>2(Р1,1) и r2>i(i?ifl). на- ходятся их значения^ Vi,2 = val Г1>2(р1Л) и v2>1 = vair2(i(i?ltl). _ На третьем шаге от конца (т. е. когда у игроков име- ется в общей сложности 4 единицы ресурсов) разыгры- вается одна на следующих игр: (г ______4\ - 7 г г\ /1 г \ I’2 г г _ I м 1Д| г —I 2»1! л р Ь А 2 — |р р I» Ь,1 1р л )• 1 Vm х2,1' V 2,1 Х / Эти игры заменяются матричными играми (Р1 « — 1 — 1 V 1 Р1,2 г / \ _ Г2,1 1,1,2 I 1 2,2 (У1,21 V2,l)— I „ „ /» V 1,2 ”2,1/ / 1 V2 1\ Г,Д(Р2Д)= ( . \Л2Д 1 / -В результате решения матричных' игр 17,(14.2), Гг,г(1>1,2, 1>2,Л Г311(г?2,1) находятся значения v1>s = val 17,(147), 14.2 = val17,2(14,2, viA), l- i?3,i = val 17,3(14,1). Далее можно решить все игры, в которых Общая вели- чина ресурсов составляет пять единиц, затем шесть еди- ниц и т. д.' Наконец на N шаге от конца или первом от начала получим следующую детерминированную игру: (^r,R—г—1 1,В—г\ р т г
Гг,д_г (pr—i,Vr,R—г—1) 220 ЧАСТЬ III. МНОГОШАГОВЫЕ ИГРЫ которая заменяется матричной игрой уг,н—г—1 1,В—г\ pr—1.R—г уг,7?—г—1/ где 1?г— 1, R— г = val Г>— 1, R— r(vr— 1, В—г, Рг—2, R— г), Уг, R—T— 1 = val 1\ В-г-Д^г, к-г-2, Pr—1, В-г-1). Решая игру Гг, r-t, Рг.я-r-i), получим X* (г, R - г) = У* (г, R - г) = (1/2, 1/2), ' . • 1 Уг,В-г == ~2 (У г, Л-r-l + tfr-l.B-r)» где vTt R—r — значение игры Гг, B_r; X*(r, R — г) — опти- мальная стратегия игрока I; У* (г, Я— г) —оптимальная стратегия игрока ПГ Пример 6.8 (теоре тико-игр ово е обоснова- ние оптимальной организации поисковых действий на рубеже и оптимального вре- мени его форсирования). В примерах 4.6 —4.7 была рассмотрена поисковая ситуация на рубеже при условий, что поисковые единицы ‘ осуществляют поиск непрерывно, а момент прорыва объекта поиска через ру- €еж равновероятен. Теоретико-игровая модель такой ситуации позволяет определить оптимальное распределе- ние наблюдателей на линии рубежа и выбрать точку прорыва, а также вычислить вероятность обнаружения (значение игры). Однако время поиска на рубеже, как правило, ограничено, а объект поиска, осуществляя про- рыв, выбирает не только точку прорыва, но, и момент прорыва. Поэтому при ^организации поисковых действий на рубеже необходимо учитывать не только статику, но и динамику развития поискового конфликта, сущность которой довольно часто заключается в следующем. Пусть по данным разведки в один из периодов вре- мени Т объект стороны В должен форсировать рубеж, ширина которого равна 1. Для обнаружения этого объек- та сторона А выделила одну поисковую единицу, которая может осуществлять поиск в течение £ периодов времени Кроме того, допустим, что если объект форсиро- вал рубеж не будучи обнаруженным, то по истечении
V ГЛАВА 6. ПРИЛОЖЕНИЯ 221 любого периода времени N=?T, Т— 1, ..., 1 сторона А об этом информируется. С учетом этой информации для каждого периода времени сторона А принимает решение осуществлять поиск .или не осуществлять и выбирает точку наблюдения, а сторона В — форсировать рубеж или не ’ форсировать рубеж и выбирает точку прорыва. Другая интерпретация динамики поискового конфлик- та на рубеже связана с наличием двух проливов, один из которых выбирается сторонами А и В соответственно для форсирования в период времени' N и поиска в пе- риод времени L Очевидно, что сторона А стремится так ' организовать патрулирование на рубеже (определить период времени и место патрулирования), чтобы макси- мизировать эффективность поисковых действий. В свою очередь сторона В выбирает период времени и место прорыва, исходя из минимизации данной эффективности. Таким образом, налицо антагонистический конфликт, статика которого составляет содержание примера 4.6, а динамику-можно адекватно отобразить с помощью многошаговой детерминированной игры. Поэтому, во-пер- вых, .будем полагать, что если поисковая единица сторо- ны А (игрок I) осуществляет поиск и объект стороны В (игрок II) в этот период времени форсирует рубеж, то эффективность поисковых действий, равна av — b(l — v)9 где v — вероятность, обнаружения объекта на рубежё (значение игры Г, рассмотренной в примере 4.6), а — доля предотвращенного ущерба (0 < а С 1), Ъ — доля непредотвращенного ущерба (0^&^1). Во-вторых, для выбора периодов времени поиска и форсирования пост- роим следующую многошаговую детерминированную игру. Свяжем с каждым из N (N=T, Т—;19 ..1) перио- дов времени шаг игры и обозначим игру через 1\ t, где N — максимально возможное число шагов до, окончания игры, a t — число периодов времени поиска. На каждом шаге игрок I может производить поиск (стратегия 1) или не производить поиск (стратегия 2); игрок II может форсировать рубеж (стратегия 1) или не форсировать рубеж (стратегия 2). Если игроки действуют одновре- менно согласно оптимальным стратегиям поиска и про- рыва (см. пример 4.6), то игра Гя, f заканчивается на этом шаге и игрок Д выигрывает av — b(l — и). Разуме- ется, столько же игрок II проигрывает, т. е. выигрыш
222 ЧАСТЬ III. МНОГОШАГОВЫЕ ИГРЫ . игрока II равен —av+fA — vYb. В этом случае, когда игрок I не осуществляет поиск, а" игрок II форсирует рубеж, игра Гк, t также заканчивается, но игрок I естест- венно выигрывает —Ь. Рассмотрим теперь > результаты шага игры, когда, игрок II не форсирует рубеж и дейст- вия в силу имеющейся информаций переносятся на следующий шаг, т. е. разыгрывается игра, у которой число шагов равно N—i. Очевидно, что если игрок II не форсирует рубеж, а игрок I осуществляет поиск, то на следующем шагу разыгрывается игра а если игрок I не осуществляет поиск, то игра Гя-i.t. Итак, динамика конфликта формализуется следующей много- шаговой детерминированной игрой: - _ lva — {i — v)b Л rJM==. I к г ’ в которой на пересечении строки i и столбца / указан выигрыш игрока I, если игроки I и II выбирают соот- ветственно. чистые стратегии i и у, а элементы и Ix-ij означают, что. надо провести соответственно игры f-i И Г.№—1, f. Обозначим через vN, t значение игры t, т. е. vN, t =* ==vall\,t. Очевидно, что vN> 0 = — Ь для любого 2V>0 и рм== = va — (1— и)& для любого Ь>0. Если 7V=1, то игрок II 'имеет единственную чистую стратегию — форсировать рубеж, а игрок I — осуществлять поиск. Следовательно, i?itl = i?a—(1 — р)6. Если же t—1, то игра Гх,t является одношаговой, так как игроки I и II выбирают соответ- ственно для поиска и форсирования по одному периоду времени из АГ и игра заканчивается. Следовательно, игра Гх,4 является матричной игрой NXN, матрица выигры- шей которой имеет вид (va — (1 — v) ь — Ь ... — ъ \ — Ь va — (1 — Ъ) v ... ' —- Ь I — Ь — Ь va — (1 — v)b / ' а значение (см. пример 2.10) vn,i = Tftva — (i — 0 ъ + ъ — Nb) = = ^(va-(l-v)b-(N-l)b).
ГЛАВА 6. ПРИЛОЖЕНИЯ 223 При N, t>2 hl N ^{-заменим. в игре Гя,, разыгрывание игр Tw-i, t-i, Гх-i, t на их значения и получим следующую матричную игру: .... . /va — (1 — V) b = I _ъ которая не, имеет седловой точки. Vjv-l.t / Используем теперь формулу (1.77), и найдём следующее рекуррентное‘соот- ношение: (va — (1 — v) 6) vN.t 4- VN,t = va — (1 — v) ь — Pw_llt-1 -fc.fr + которое с граничными условиями vK, о = ’-Ь, Vtri = = va — (1 — v) — Ъ и vN, j = (va — (1 — v) — (N — l)b)/N определяет valTn, (. Пусть a = b — 1. Тогда рекуррентное соотношение (6.10) примет следующий вид: ~vn t = (2* ~(6.11) а граничные .условия станут следующими: vN,o=-s-l, vi't — 2v — l иyNi4 = 2v/N — 1. По формуле (6.11) вычислим v3, г — (4v — 3)/3, ^,2 = = (8v — 4)/4, ..., K5, 3 = (10v —5)/5 и т. д. Следовательно, ' (6.12) Действительно, если (6.12) подставим в (6.11), то полу- чим (6.12). Итак, решение разностного уравнения (6.11) является значением игры Г»;«(кх,»), начинающейся с АГ-то шага, т. е. когда до конца остается самое большее N шагов. Обозначим через ^(N, t) и T)i(2V, i) вероятность при- менения первой чистой стратегии соответственно игро- ками I и II, если число периодов времени, в течение которого игрок II должен форсировать рубеж (максималь- но возможное число* шагов), равно N, а игрок I может, осуществлять поиск в течение t периодов времени. Для вычисления оптимальных стратегий каждого иг- рока в игре Гу,, в матрицу Г^Ду^)" подставим вели- чины ашЬ = 1, а также (6.12) и получим матрицу . 2(t-i)v-(N-l} \ = I 2/г—’(TV —1) ’ v-1—— / ..
224 ЧАСТЬ Ш. МНОГОШАГОВЫЕ ИГРЫ Применив теперь формулы (1.76) и (1.78), найдем & (У, f) = (г < т,N = т, т -1,..., 1), (6,13) 0 = 4" (f<r’ Я = Т, Г-1,..... 1). (6.14) Таким образом, на ЛГ-м шаге (до конца игры остается самое, большее N шагов) игроки I и II соответственно с вероятностями (N, t) = t/N и rj* (N, £) = i/N выбира- ют свои первые чистые стратегии. Если игрок II выби- рает стратегию 1, то игра заканчивается и игрок I полу- чает выигрыш 2р—1 или -=-1 в зависимости от-выбран- ной стратегии. Если же результатом, случайного выбора игрока II будет стратегия 2, то^ игрок I об этом инфор- мируется и осуществляется переход к следующему шагу и т. д. Решение игры было получено при условии, что игрок I знает результат казвдого шага. Если снять это •ограничение, то, вообще говоря, следует решить другую игру в которой игрок I, сделав ход, не получает информации о ходе игрока II. Оказывается, что игра эквивалентна игре Гя, <, и поэтому тройка (Х*(ЛГ, £), Y*(N, t), vNt является ее решением. Действительно, допустим, что в игре игрок II на ЛГ-м шаге выбрал-1-ю чистую стратегию. Тогда игра заканчивается и игрок I выигрывает va—(1 vYb. или —Ь. Если игрок II выбрал 2-ю чистую стратегию, а иг- »рок I *этого не знает, то на. inare N — 1 разыгрывается игра Fjv-i.t-i или Tjv-i,/. Как в игре так и в игре игрок I, не зная хода игрока II, получает va+(l — v)b или —Ь, • если игрок II выберет свою 1-ю чистую стратегию. В про- тивном случае, если на iftare N — 1 разыгрывалась пгра то на шаге N — 2 будет разыгрываться игра Глг-2,г-2 или а если разыгрывалась игра .Гя-14, то игра 1\_2?г-1 или и т. д. В результате,' независимо от наличия информации о сделанном игроком II ходе, игрок I на каждом шаге выбирает 1-ю или 2-ю чистую стратегию, до пор пока игра- VNtt не закон- чится или не будет разыгрываться матричная игра Гя4
ГЛАВ A. 6, ПРИЛОЖЕНИЯ 225 (TVe Т, Т — 1, .. 1). В первом случае он получает выиг- рыш ра+(1 — г)Ь или — Ь, а во-втором— значение матричной игры Гхд. Следовательно, тройка (X*(2V, t), У* (TV, £), vN, Д является решением игры Гм,ь Многошаговая игра IV, t легко обобщается для к поисковых единиц посредством использования константы vh — вероятности обнаружения объекта к поисковым еди- ницам (значение игрй I* в примере 4.7 для к >2). Од- нако, если поисковые ресурсы, выраженные посредством t периодов времени поиска, зависят от числа одновре- менных патрулирующих единиц на рубеже (например, при наличии двух проливов), т. е. если t — f(k), то много- шаговая игра, -задается (к +1) X 2-матрицей следующе- го вида: vka ~ 0 — vk) 6 . ) v>k-la “7,0 ~ fw-l.t-fc+l : /ie-(l~pi)6 : rN-i,;-i - I ~ b rjV-l,t J или для а = Ь = 1 _ (2vk-l 2vk-l ~ 1 rN-l,t-h+l 2£>1~ 1 rW-l,t-l -1 ГЯ-1,*Х ' Игру можно решить, перебирая все 2 X 2-игры z и находя оптимальные стратегии игроков и значения каждой 2 X 2-игры с последующей проверкой выполне- ния неравенств (1.62), (1.63). Для иллюстрации решим игру /2t>a — 1 rw_i>f_a\ Гдгд = I 2»i — 1 Гх_м_х I. \ . ~1 / 5 На основании примера 4.7 примем vk = kv. Тогда 2i> — 1 I, “l / 15 Г. н. Дюбив, В. Г. Суздаль
226 ЧАСТЬ III. МНОГОШАГОВЫЕ ИГРЫ и она эквивалентна матричной игре /41л —1 / Глгд (vNt Д= I 2р — 1 I \ ““ 1 vN-l,t / с граничными условиями vNt о — ~ 1, vNf 1 = 2v/N — 1 и 1^1,2-4V—1. Полагая 51 = 0, легко установить, что в иг- ре оптимальными стратегиями игроков I и II со- ответственно являются Х*(ЛГ, t) = (0, i/2V, 1 — t/N), Y*(N, 1 —1/7V), а ее значение равно (2tv — N)/N. Кроме того, решив 2 X 2-игру, для которой матрица вы- игрыша игрока I равна /4^ — 1 PN_ljf_2\ * \ 1 vN-l,t / найдем vN t == {2tv - N)/N, X4N, t) = (^/(2^, 1 - t/(2NY) и У°(ДГ,- t) - (1/2V, 1-1/N). Отсюда X* GV, t) - (t/(2N), 0, 1 — t/(2N)) и У* GV, t) = (4/2V, Г— i/N), для которых вы- полняются неравенства (1.62), (1.63). Таким образом, сторона 4, и^ея две поисковые еди- ницы, может выделять для поиска в каждый из t перио- дов времени по одной единице или в каждый из t/2 периодов времени по две единицы соответственно с ве- роятностями t/N и tK2N). Пример 6.9 (радиоэлектронное противо- действие поис к у к Допустим, что сторона А пла- нирует ' использование самолетов-постановщиков средств • РЭП для обеспечения ведения воздушной разведки в рай- оне i (i«l, 2). Здесь же действуют истребители стороны € В с целью обнаружения и уничтожения самолетов-раз- ведчиков. Самолеты каждой из сторон могут действовать один раз в сутки и только в одном районе. Кроме того, в ближайшие’ сутки с вероятностью 1/2 ожидаются не- благоприятные метеорологические условия, исключающие действия авиации. Примем сторону А за игрока I, сторону В — за игро- ка II, а действия сторон в течение одних суток за один шаг игры. Очевидно, что на каждом шаге игрок I выби- рает район i (г — 1, 2), а игрок II — район / (/ = 1, 2).- У Допустим, что результаты действия. сторон А и В оцениваются так, что выигрыш игрока I задается
ГЛАВ А, 6, ПРИЛОЖЕНИЯ 227 табл. 6.10. Игроки вместе имеют 4 относительные еди- ницы, игра заканчивается после каждого щага-с вероят- ностью 1/2 или если один из игроков будет * иметь 0 единиц. ' Т а (Гл иц а- 6.10. Выигрыш игрока I ^На основании изложенного можно заключить, что рассмотренный конфликт моделируется стохастической игрой Г = {F1, Г?, Г3}, где Формальная матрица Г1 соответствует 1-му состоянию (одна, единица у игрока I и три у игрока II), формаль- ная матрица Г2 — 2-му состоянию (по две . единицы у каждого игрока), а формальная матрица Г3 — 3-му со- стоянию (три единицы у игрока I и одна единица у иг- рока II). Пусть игра Г начинается с формальной матрицы Г1. Тогда, если игроки выберут свои вторые чистые страте- гии, то в ситуации (2,2) игрок I выигрывает 1 единицу и на втором шаге игра с вероятностью 1/2 переходит во 2-е состояние, а с вероятностью 1/2, в поглощающее со- стояние. Допустим теперь, что в результате случайного испытания реализован исход Г2 (благоприятные метеоро- 15*
228 ЧАСТЬ III. МНОГОШАГОВЫЕ ИГРЫ логические условия), т. е. на втором шаге игра перешла во 2-е состояние (разыгрывается игра с формальной мат- рицей Г2). Тогда, если на. втором шаге игроки выберут вторые чистые. стратегии, то в ситуации (2,2) игрок I выигрывает 1 единицу и проводится случайное испыта- ние, в котором исход Г3 реализуется с вероятностью 1/2 И т. д. ; - Для решения игры принимаем и0 = (0; 0;< 0) и, ис- пользуя (5.31), находим (о — 1\ / 1 __ _4 J, Г?(р0)=[_1 J, (4 — / -11)-. Далее находим ifj = (!/&; 0; 0). По формуле* (5.33) полу- чим Р = 1/2 и принимаем N — 5, при котором Pw=l/32. Теперь, используя находим i>2 = (0,2; 0,5; 0), р3 = (0,21; 0,05; 0), . р4 = (0,21; 0,05; 0), - ' • . v5 = (0,21; 0,05; -0). Принимаем vs за вектор значений стохастической-игры и вычисляем по формуле (5.31) элементы матриц Г*(г>), а именно /2—1 \ - Г1М1 1,25/* ( 1 — 0,88\ Г2<М- 0,88 1 )’ Р(р)=( 1 -°’975). ’ 1 W 0,975 1 )' . В результате решения игр Г*(г) получим = (0,43; 0,57), %* = (0,43;'0,57), |х2 = (0,50; 0,50), %2 = (0,50; 0,50), р3 = (0,50; 0,50), к3 = (0,50; 0,50),' которые являются-оптимальными стационарными страте- гиями игроков I и II в стохастической игре Г.
ГЛАВА 6. ПРИЛОЖЕНИЯ 229 Таким образом, игроки I и II должны действовать следующим образом. Если игрок I имеет 3 единицы, а игрок II имеет 1 единицу, то игроки выбирают 1-й и 2-й райоды соответственно с вероятностями 0,43 и 0,57. Во всех остальных случаях районы выбираются с равными вероятностями. Пример 6.10 (теоретико-игровая модель динамики< морского боя). Предположим, что в море произошла встреча объекта стороны А, охраняемо- го двумя* единицами, с объектом стороны В, охраняемым одной единицей. Каждая сторона может атаковать объект противника и добиться успеха, если число единиц, ата- кующих объект, превышает число единиц, обороняющих тот же объект. В том случае, когда число атакующих единиц меньше числа обороняющих^ единиц, соответству- ющая сторона от атаки отказывается и атакующие еди- ницы возвращаются к своему объекту, а затем действия повторяются. ‘ Пусть выигрыш стороны А (игрок I) равен 1, если она уничтожает объект стороны В (игрок II), не теряя при этом свой объект, и в любом случае равен —1, если она теряет свой объект. Очевидно, что стратегию каждого игрока можно пред- ставить парой чисел II II, где i — число атакующих еди- ниц, а / — число обороняющих единиц. Например, стра- тегия 111 111 игрока I означает, что одна его единица ата- кует объект игрока II, а другая обороняет собственный объект. Аналогично стратегия ПО 111 игрока II означает, что егсиединица обороняет собственный объект. Исходом этой пары стратегий является повторение той же игры на очередном шаге и т. д. Если же игрок I выберет ту же стратегию ИНН, а игрок II стратегию П10Н, то игра " заканчивается и игрок I получает выигрыш, равный 1. Действительно, согласно стратегии ПНИ игрок I выделяет одну единицу для атаки и одну единицу для обороны. В свою очередь игрок II выделяет свор единицу для атаки. _ , • ' Следовательно, игрок I уничтожает объект игрока П и при этом не теряет свой объект. В результате его выигрыш равен 1 и т. д' * Определяя подобным образом исходы для остальных пар стратегий, получим рекурсивную игру, заданную
230 ЧАСТЬ III. МНОГОШАГОВЫЕ ИГРЫ множеством формальных матриц Г = {Г1, Г2, Г3}, Где Г1 = 11—111 и Г2 = 11111, а (Г3 г3\ Г3 1 к 1 — 1 J Пусть v° = 0. Найдем vl = val Г3(0) = 1/3, ц1 = (0, 2/3, 1/3)ч и X1 = (2/3, 1/3). Затем вычислим р2 = уа!Г3(1УЗ) = 1/2, И2 = (о, 3/4, 1/4), X2 = (3/4, 1/4) и т. д. Пример 6.11 (теоретико-игровая модель динамики волейбола). Динамика таких спортив- ных игр, как волейбол, баскетбол, футбол, хоккей, вод- ное поло и др. обуславливается рядом характерных цик- лов, начинающихся с разыгрывания мяча (шайбы) и завершающихся потерей мяча (шайбы) или выигрышем очка (взятием ворот, уходом мяча за пределы поля, по- ложением «вне игры» и т. д.). Поэтому для построения адекватных моделей этих спортивных игр целесообразно , использовать математическую теорию многошаговых игр. Так, например, рассмотрим динамику волейбола и пост- роим соответствующую многошаговую игру. Как известно, партия волейбола состоит из циклов, каждый из которых включает подачу мяча одной из команд (скажем командой 4), прием' и разыгрывания мяча для нападающего удара командой В, защитные действия с последующей организацией атаки командой Лит. д., до тех пор пока не будет выиграно очко коман- дой А или подача командой В. Пусть команда Л—игрок I, команда В —игрок II и право подачи принадлежит игроку I. Обозначим через а^ = {1, 2, ..., тк} и i/k={l, 2, ..., пк} множества чистых стратегий соответственно игроков I и II в состоянии k^S. Игроки I и II независимо друг от друга выбирают соответственно чистые стратегии ъ 0 = 1, 2, ..., тк) и / (; = 1, 2, ..., пь), а пара О, /) переводит игру из со- стояния к в состояние I 8 с вероятностью Множество состояний 8, в одном из которых к & 8 находится партия волейбола, а в другое Z 8 переходит на очередном шаге, состоит из следующих элементов:
ГЛАВА 6. ПРИЛОЖЕНИЯ 231 — мяч принят игроком II с ошибкой, мяч попал в игровую площадку игрока II, мяч ушел за пределы иг- ровой площадки игрока II от игрока II (состояние 1, игра заканчивается, игрок Г получает выигрыш hl — 1); — мяч принят игроком I с ошибкой, мяч попал в иг- ровую площадку игрока I, подача не состоялась, мяч ушел за пределы Игровой площадки игрока I от игрока I (состояние 2, игра заканчивается, игрок I получает выиг- рыш 0); — доигровка игрока I (состояние 3); — атака игрока II (состояние 4); доигровка игрока II (состояние 5); — атака игрока I (состояние 6); — подача игрока I (состояние 7). Тогда теоретико-игровой моделью динамики волейбола будет рекурсивная игра Г7, заданная множеством фор- мальных матриц Г = {Г1, Г2, . >., Г7}, где ««/г1], . (6.15) 2^ = 1 и <$>о.
ЧАСТЬ IV БЕСКОАЛИЦИОННЫЕ ИГРЫ .Глава? ОСНОВЫ ТЕОРИИ § 7.1. Бескоалиционные игры п лиц 1. Природа и структура бескоалиционных игр. На- равне с антагонистическими конфликтами довольно часто встречаются конфликты более общего характера, участ- ники которых преследуют различные, но не обязательно прямо противоположные интересы. Такие конфликты рассматриваются в теории’ игр п лиц. Те игры, правила которых не\ предусматривают совместных действий от- дельных групп игроков (коалиций), изучает теория бескоалиционных игр. Антагонистические игрым являются подклассом класса всех бескоалиционных игр. Определение 7.1. Бескоалиционной игрой назы- вается система . хГ = </, {Xi}u=j, {Я<)|ег>, в которой I — множество игроков, — множество чистых стратегий игрока i и Hi — функция выигрыша игрока f, заданная на прямом произведений множеств чистых стра- тегий игроков, т. е. на х = ТТ хг- . iGl ' Разыгрывание бескоалиционной игры происходит сле- дующим образом: игроки независимо друг от друга вы- бирают по элементу множества своих чистых стратегий каждый, в результате чего складывается ситуация х = (ж1» • • •» xn)> хг\ после этого каждый из игроков i получает выигрыш ЯДх). ♦ В том случае, когда множество I конечно, I = — {1, 2, ..,, п), бескоалиционную игру называют игрой п лиц. Если при этом множества Xt конечны, то игра называется конечной бескоалиционной игрой п лиц.
ГЛАВА 7. ОСНОВЫ ТЕОРИИ . . 233 Конечная бескоалиционная игра двух лиц называется биматричной. Такое определение оправдывается тем, что занумеровав'"множества чистых стратегий игроков числа-, ми 1, 2, .•.г и 1, 2;.. s, значение’ функций выигрыша. игроков можно расположить^ виде двух матриц , (Ь11 Ь1т\ А == I • : I и В = I • I asrJ , ^6Т' Элементы ау и Ъц этих матриц являются соответственно выигрышами игроков' I и II в ситуации (г, /). * 2. Смешанное расширение бескоалиционной игры. Мы будем рассматривать игры, в которых множества — компактные сепарабельные метрические пространства. Множество вероятностных мер Х^ заданных ла о-алгебре борелевских множеств множества #ь называется мно- жеством смешанных стратегий игрока i. Таким образом, определение смешанной стратегии игрока в бескоалиционной игре ничем не отличается, от соответствующего определения в антагонистических иг- рах. Если множество ^ конечно, то множество смешан- ных стратегий игрока i образует ’^мерный симплекс — здесь также имеется полное сходство с матричными иг- рами. _ ' ' Мы предполагаем, что функции Hi либо непрерывны^ лцбо кусочно непрерывны —и уже во всяком случае интегрируемы, по любой борелевской мере, заданной на , множестве#. Если каждый из игроков i применяет смешан- ную стратегию Xi^ то складывается ситуация Xs* = (Xh ..., Хп), а математическое ожидание' выигрыша игрока i будет равно . Hi (Хх, ..., Хп) = $Hi (xlt ..., xn) ... dXn, (7.1) где#—множество ситуаций в чистых стратегиях, т. е. х — ГТ #<. В дальнейшем мы всюду будем считать, что для всех функций выигрыша верна теорема Фубини, т. а. значение .интеграла в равенстве (7.1) равно любому из возникающих здесь повторных интегралов.
234 ЧАСТЬ IV? БЕСКОАЛИЦИОННЫЕ ИГРЫ Определение 7.2. Смешанным расширением бес- . коалиционной игры ' * Г = </, {tfjieb ] называется бескоалиционная игра 4 | Г = </, {XJiei, в котороймножество смешанных стратегий игрока j, а функции Hi определены формулой (7.1). 3. Ситуации равновесия. Теория бескоалиционных игр. изучает поведение игроков, придерживающихся принципа ; равновесия. л Обозначим через (ХНж,-) ситуацию (Хь ... < ..., X,-i, Xi+h ..., Х'п). j Определение 7.3. Ситуация * X* = (х*,X*) J называется ситуацией равновесия в смешанных страте- J гиях игры Г, если . j #i(X*||#i)<? Я$(Х*), хг^хг для. всех i^I. (7.2) I Пусть Х{ — произвольная смешанная стратегия f-го | игрока, X* — ситуация равновесия. Тогда, интегрируя | неравенства (7.2) по мере Х<, получим I Я(Х*||ж{) — JЯ(Х*||ж{)ЙХ{(х{)<Я1(Х*), ге/. (7.3) | •*г J Неравенства (7,3) показывают, что ни одному из игроков I невыгодно отклоняться от ситуации равновесия, если | другие игроки от нее не отклоняются. В частности, они | показывают, что ситуация равновесия бескоалиционной | игры является ситуацией равновесия ее смешанного | расширения. ' ' 1 Так как в бескоалиционных играх игроки не могут | создавать коалиции, ситуация равновесия приемлема для ] всех игроков. Оказывается, бескоалиционные игры с’ «хо- рошими» множествами стратегий и с «хорошими» функ- ; циями выигрыша всегда имеют ситуации равновесия в ; смешанных стратегиях. j Теорема 7.1*). Любая конечная бескоалиционная игра имеет хотя бы одну ситуацию равновесия в сме- ; шанных стратегиях. Ж ♦) Теорему 7.1 можно доказать, используя лишь теорему Бра- Я уэра о неподвижной точке, однако доказательство в этом случае Я будет более громоздким. Ж
ГЛАВА 7. ОСНОВЫ ТЕОРИИ 235 Для доказательства этой теоремы нам понадобятся некоторые предварительные сведения. Определение 7,4. Отображение /, ставящее в со- ответствие каждой точке х некоторого множества х. ле- жащего в евклидовом пространстве Rn, подмножество f(x) этого множества, называется полунепрерывным сверху, если из соотношений ^ xQ, уп-+ уо.хп^ х. уп& <^f(xn) следует включение уое/(^о). Полунепрерывные отображения замкнутых выпуклых подмножеств в себя/Обладают следующим свойством, установленным Какутани. Теорема 7.2.(о неподвижной точке). Пусть X — замкнутое выпуклое подмножество евклидова прост-* ранства Rn, a f — полунепрерывное сверху отображение этого множества, переводящее каждую точку х^Х в замкнутое выпуклое подмножество множества X. Тогда отображение f имеет неподвижную точку, т. е. такое xQ е X. что f(x0) =тХ<>. Доказательство этой теоремы выходит за рамки этой книги. Читатель может его найти в [40], теорема 1.11.5. Доказательство теоремы 7.1. Множество си- туаций в смешанных стратегиях конечной бескоалицион- ной игры является прямым произведением симплексов' Xi, каждый из которых является подмножеством неко- торого евклидова пространства. Следовательно, X = — Побудет подмножеством прямого произведения со- г ' _ ответствующих евклидовых пространств, которое являет- ся евклидовым пространством. Так как каждое из Xt выпукло, их прямое произведение тоже выпукло. Поста- вим в соответствие каждой ситуации X е JJ Xi множест- i во ситуаций / (X) = (X = (Хх, ..., Хп) | Hi (Х|| Xi) = = шахЯг(Х[|Х{), i = 1, 2, ..., п}. Функции Н£Х) линейны по Х<. Множество максимумов линейной функции выпукло и замкнуто. Легко проверить, что это отображение непрерывно сверху. Действительно, если а УП^/(ХП), то для каждой
236 - ЧАСТЬ IV. БЕСКОАЛИЦИОННЫЕ ИГРЫ ситуации X выполняются неравенства В силу непрерывности функций Яг (f = 1, 2, ..., п) эти неравенства будут выполняться и для предельных точек Х°, Х°. Выполнение этих неравенств и означает, что У0^ Таким образом, для отображения / выполнены все ус- ловия теоремы 7.2. Следовательно, это отображение име- ет неподвижную точку X*. По определению отображения для этой ситуации Н(Х*\\Х{)=тахН{Х*\\Х^ . I = 1,-2, ...., п. Из этих равенств следуют неравенства (7.2). Поэтому X* — ситуация равновесия. Теорема доказана. Используя только ~что доказанную теорему 7.1, можно установить следующий факт. Теорема 7.3. Любая бескоалиционная игра п лиц* в которой множества ^чистых игроков ’ сепарабельны и компактны, а функции выигрыша непрерывны на произ- ведении этих множеств, имеет ситуацию равновесия. Идея доказательства теоремы*7.3 состоит в том, что игры, удовлетворяющие условиям теоремы 7.3, хорошо аппроксимируются конечными бескоалиционными играми. Действительно^ для любого 8 каждый из сепара- бельных компактов имеет конечную е-сеть, в частности дляе = 1/п. ✓ По теореме 7.1 конечная., бескоалиционная игра Гп, стратегиями игроков которой являются конечные 1/тг-сети Xi множеств Xi, а функции выигрыша — сужения функ- ции Ht на прямое произведение множеств х™, имеет си- туацию равновесия Х*(п). Следовательно, Я1(Х*(п)й1) <Я(Х*, n), Xi^xt (ЧА) При достаточно большом и, для любого Xi е сущест- вует 'такая близкая ей точка Xi х™, что величина НАХ*(п\\\хд мало отличается от величины Hi(X*(n)\\xi), причем, отклонение стремится к нулю равномерно по x^Xi. Хотя этот факт и интуитивно ясен, он требует
i ’ A- ~ ~ ГЛАВА 7. ОСНОВЫ ТЕОРИИ . 237 доказательства. Следовательно, в силу неравенств (7^4) Н (X* (п) ]| хг) < Н (X* (п)) + 6 (п), е х,, (7.5) где величина 6(п) стремится к нулю с ростом п. Как известно, множество вероятностных мер на сепарабельном компакте компактно и сепарабельно в слабой топологии. Поэтому множества Х$, а значит, и их произведение, компактны и сепарабельны. Выбирая из последовательности Х*(п) сходящуюся к некоторой си- туации X* подпоследовательность и переходя в неравен- ствах (7.5) к пределу по этой подпоследовательности, , получим . ~ ,Я(Х*||^)<Я(Х*), Xit=Xi. Таким образом, X* — ситуация равновесия. Теорема 7.4. Если X* — ситуация равновесия бескоалиционной игры Г = <7, {#i}n=i, Hi), а функция Hi(X*\\xi) непрерывна'на Xi х^ то для любой стратегии х^ входящей в спектр стратегии Х^ выполняется равен- ство ' _ ” Н&Чх^Н<(Х*\ (7.6) До касательство. Доказательство этой теоремы - мало чем отличается от доказательства теоремы 1.8. Предположим, что равенство (7.6) неверно. Тогда ЯХХ*1Ь)<^(Х*), . (7.7) так как X* — ситуация равновесия (см. (7.2)). Вследст- вие непрерывности функции Н&Х^хд неравенство (7.7) ’ будет строгим в некоторой окрестности точки Поэтому , Hl (X*) = [ I Xi) dx* < f Hi (X*) dx* = H{ (X*). * Ввиду того, что ж* — мера любой окрестности точки Xi — по условию теоремы положительна, неравенство (7.8) противоречиво. Следовательно, верно равенство (7-6)./ Теорема доказана. Теорема 7.5. Пусть Г = <л,у, Ях,Яа> (7.9)
238 ЧАСТЬ' IV. БЕСКОАЛИЦИОННЫЕ ИГРЫ — бескоалиционная игра двух лиц, для которой х = у, Н^х, y)=Hi(y, х). Пусть, кроме того, — оптимальная стратегия игрока II антагонистической игры г1 = <«; у, н,у и У*— мера точек х е х, для которых нарушается ра- венство Н(х, У*) = р, (7.10) — равна нулю. Тогда ситуация (У*, У*) будет ситуаци- ей равновесия игры Г. Доказательство. В силу оптимальности страте- гии У* в. игре Г1 tZ Н(х, У*)^р, х^х. (7.11). Так как равенство (7.10) справедливо почти везде от- носительно меры У*, выполняется равенство ЖУ* У*) « v. Принимая во внимание (7.11), получим ДДХ У*)^Ж(У* У*). (7.12) Но, ’ Я1(д;,У*)=Я2(Г*, i/), у^х. Следовательно, Я2(У*, у)^Я2(У*, У*). (7.13) Неравенства (7.12) и (7.13) доказывают утверждение теоремы. 4. Стратегическая эквивалентность. Как мы видели, умножение функции выигрыша первого игрока в конеч- ной антагонистической игре на положительную констан- ту и прибавление к его функции выигрыша произволь- ной константы не изменили оптимальных стратегий игроков (теорема 1.13), а значит, и множества ситуаций равновесия. Оказывается, аналогичная картина имеет место в теории бескоалиционных игр. Определение 7.5. Игры Г'= <7, |Я1Ье1>,
ГЛАВА 7. ОСНОВЫ’ТЕОРИИ 239 называются стратегически эквивалентными, если для всех 1^'1, х^х справедливо равенство Я| (ж) = 'kiHl(z) + Ci, где ki > 0 и Ci — некоторые константы. Факт стратегической эквивалентности двух игр обоз- . начают знаком ~. Нетрудно видеть, что отношение ~ является отношением эквивалентности, т. е. 1) Г ~ Г; 2) если Г~Г', то Г'~ Г; 3) если Г ~ Г' и Г'~Г", то Г~Г". . ‘ Отношение стратегической эквивалентности разбивает множество бескоалиционных игр на попарно непересе- кающиеся классы. По существу стратегически эквива- лентные игры отличаются начальными капиталами и масштабами измерения полезности игроков, которые для разных игроков могут быть разными. Теорема 7.6. Множества ситуаций равновесия в стратегически эквивалентных играх совпадают. Доказательство. Очевидна, что вследствие по- ложительности ki неравенства • Я}(Х*М<Я$(Х*), ieZ, равносильны неравенствам Я? (X* II Xi) = kiHl (X* II Xi) + Ci ^kt Hl (X*) + Ci - ; - =я?(Х*), ieU. Это доказывает теорему 7.6, которая по существу "явля- ется аналогом теоремы 1.13. Определение 7.6. Бескоалиционная, игра называ- ется игрой с постоянной суммой, если суммы выигрышей игроков во всех ситуациях равны одному и тому же числу. Если это число равно,нулю, то бескоалиционную игру называют игрой с нулевой суммой. Очевидно, что антагонистическая игра по определе- нию является игрой двух лиц с нулевой суммой. . Теорема 7.7. Всякая бескоалиционная-игра п лиц с постоянной суммдй ^стратегически эквивалентна игре с нулевой суммой. ' Доказательство. Пусть сумма выигрышей всех игроков в любой ситуации будет с. Отняв от выигрышей
240 ЧАСТЬ IV. БЕСКОАЛИЦИОННЫЕ ИГРЫ одного из игроков это число, мы придем к игре с нуле-* ВОЙ суммой. к Как видно из теоремы 7.7, всякая игра двух лиц с . постоянной суммой стратегически эквивалентна некото- рой антагонистической игре. Поэтому игры двух лиц с постоянной суммой в теории бескоалиционных игр специ- ально не рассматриваются. По существу ситуации, моде- лируемых в примерах 2А и 2.12, были играми с постоян- ной суммой. Однако, осуществив неявно переход к стра- тегически Эквивалентным играм, мы моделировали эти ситуации антагонистическими играми. * § 7.2. Игры с бесконечным числом игроков О конфликтах, в которых число игроков весьма велико, можно судить; изучая игры с бесконечным числом игроков. Как мы ви- дели (см. примеры 2.5, 2.11 и 4.1), непрерывный аналог конечной антагонистической игры иногда поддается анализу легче, нежели сама конечная игра. Аналогично в тех случаях/ когда имеется мно- го игроков, иногда, чтобы качественно охарактеризовать конфликт и приближенно найти его количественные характеристики, легче решить некоторую игру с бесконечным числом игроков. В Част- ности, когда функция выигрыша каждого из участников конфлик- та зависит лишь от его поведения и совокупности действия парт- неров по игре, проще рассматривать бесконечное множество иг- роков с заданной'на этом множестве мерой. Эта мера вводится для того, чтобы количественно охарактеризовать множество игроков, предпринимающих то или другое действие. Итак, пусть 1 — множество всех игроков. Мы будем считать I сегментом [0,1 ]^а в качестве меры X на Ътом множестве возьмем обыкновенную "меру Лебега. Здесь мы будем считать, что каждый из игроков имеет одно и то же число п чистых стратегий, рче- видно^что в эту схему укладываются конфликты, в которых чис- ло чистых стратегий не превосходит ». Отождествим множество чистых стратегий каждого из игроков ехвекторами е2, ...» еп, где = (0, ...» 0, 1, 0, ..., 0), i-я ко- ордината равна единице, а оставшиеся п — 1 координат равны ну- лю. Тогда, как и в конечном случае, множество смешанных стра- тегий каждого* из игроков образует (» — 1)-мерный симплекс > 2_^i = i> хг>о, i=l i— 1,2...n |. Пусть £i — пространство отображений множества I в z R?, для которых каждая из координатных функций /<, /: Z->Rn, х= Х = (Х1,Х2, ...,хп)еяп
ГЛАВА Ъ ОСНОВЫ ТЕОРИИ ЗА! f^(fa fa • /») интегрируема по мере X. Через J'/dX обо- значим вектор /(* f^dK, .f fndh\. Как обычно, мы не будем V z > делать различий между отображениями, отличающимися лишь на множестве меры нуль. Для через f(t) мы будем обозначать значение в точке t любого представителя класса эквивалентных отличающихся лишь на множестве меры нуль отображений I в Rn. Определение 7.7. Если Y = (Ki, У2, ...^ Уп) содержится в и У (i) ^Х для почти всех f, то У называется ситуацией игры с бесконечным числом игроков. Множество всех ситуаций У является компактом в слабой топологии L{. Понятие ситуации игры с бесконечным числом игроков суще- ственно отличается от аналогичного понятия для игр с конечным ' числом игроков: в играх п лиц множество ситуаций являлось пря- мым произведением множества смешанных стратегий игроков, а в играх с бесконечным числом игроков множество ситуаций не является прямоугольным, так как на отображение У накладывает- ся требование измеримости. Таким образом, игроки не могут выбирать свои стратегии не- зависимо. Поэтому, естественно, встает вопрос, насколько адек- ватно такие игры отображают конфликты, в которых, число игро- ков очень велико. Здесь имеется известная аналогия с пределами кусочно постоянных функций. Их пределы, если только они су- ществуют, .всегда измеримы. Так и в играх, если некоторая игра с бесконечным числом игроков является пределом игр п лиц (мы не уточняем здесь, в каком смысле), то ситуация должна быть измерима. Другое различие состоит в том, что ситуации являются клас- сами измеримых отображений I в X, а не самими отображениями. Это связано с тем, что как уже указывалось, в играх с бесконеч- ным числом игроков на выигрыш отдельного игрока не должны влиять действия небольшого числа других. Обозначим через (t) (У) выигрыш игрока t в ситуации У при условии, что им выбрана чистая стратегия е/. Мы будем .счи- тать, что ' I _ ' 4 (1) отображение U: IxY Rnj определенное равенством непрерывно на Упри всех f^Z; Д (2) множество , . - " {t е 11 и1 w-Y) > (t) (У)} ; измеримо при всех У €= У (1< г, / < п). ' _ Математическое ожидание выигрыша в ситуаций У равно . . HtiYl^YiWU'WiY). . Определение 7.8. Ситуация У* 6 У называется ситуацией равновесия, есл.ц ддя любого У 6= У и почти всех t выполняются 16 Г. Н. Дюбин, В. Г. ^Суздаль
242 ЧАСТЬ IV, БЕСКОАЛИЦИОННЫЕ ИГРЫ неравенства я4(У*)>У(0 сг(*)(У*). ’ - Т е о р е-м а 7.8. Любая игра с бесконечным числом игроков, для которой отображение U удовлетворяет условиям (1),.(2), име- ет ситуацию равновесия. Доказательство. Разобьем доказательство теоремы на три этапа. 1. Рассмотрим отображение В(0.:У->Х, в (о (У) = {х е х | vx' е х-. х'и (*) (У) < хи (о (У)}. - Легко проверить, что множество B(t) (У) выпукло. Множество B(t)(Y) является множеством лучших ответов и1х рока t, если сложилась ситуация У. Докажем, что при всех t ото- бражение B(t) непрерывно сверху. Действительно; если,УпУ0, Хп &J3(t) (Yn), т. е. для каждого Х'&Х выполняются неравенства " X”tr(O(rn)>X'lf СО (У”), в = 1,2,,..., то в силу непрерывности отображения 17 (£) при каждом t (усло- вие (1)) эти церавенства будут выполняться и для предельных то- чек У0, Х°. Выполнение этих неравенств эквивалентно принадлеж- ности XQ множеству B(t) (У0). . \ 2. Пусть а (У) = {У' е У I У' (0 е в \t) (У) для почти всех t}. Тогда-для каждого У множество а (У) непусто и выпукло. Дей- ствительно, положим Очевидно, что (J / (у) = д а для i е It вектор е, е= B(t) (У). 1=1 В силу условия ч(2) множества Ц (У) являются измеримыми. Обб- значим через У ситуацию, определенную равенством i I t—1 . = если ^еЛ(У)\и Л(У). • U=1 Ситуация *Y принадлежит а (У). Из выпуклости B(t)(Y) сле- дует выпуклость-а (У). 3. Докажем, что отображение а: У -> У полунепрерывно свер- ху. Предположим, что это неверно, т. е. для некоторых Yn -> У0, уп-^уо (подразумевается слабая-сходимость) и Yn е^х(Уп),.но yQq£B(t)(YQ) для некоторого/подмножества Т с! положительной меры. Так как множество B(t) (У0) при каждом t является выпук- лой комбинацией некоторого подмножества*^; /г, .М, а число таких подмножеств конечно, существует такое множество TqcT положительной меры, что для feT множество 2?(£) (У0) равно вы- пуклой оболочке точек (е«, ец, ..., ей) (1 k С п). Вследствие
ГЛАВА 7. ОСНОВЫ ТЕОРИИ 243 этого существует X для которого ХУ0(£) > 0, а Хег-;= 0(1^ 7 &) • Поэтому __ ' X f Y°(t)dt>0. (7.14) _ ,Г°_ Из слабой сходимости Уп к У0 следует, что f У°<П = lim J yndi. " ' . Го Го С другой стороды, опять-таки в силу слабой сходимости, сущест- вует последовательность- У^каждый элемент которой содержится в выпуклой оболочке {Ут, Ут+\ ,сходящаяся по норме 1с У0 (см., например, [28]). Так как при-каждом I имеем (t) (= Rn, то существует п функций ..., emn(t), для которых Ym(0=33emi(0 = i. . 7=1 7=1 fmi.—одна из функций (Ут, Ут+1, ...). Переходя, если это будет нужно, к подпоследовательности, можно считать, что функции п - 2 етз^ сходится к функциям а функции 0mj(£) (1 < ] п) 7=1 > п к функциям 0Х (0.....0П (0, (0 = !• Поэтому для почти 1=1 ‘всех t 4 у° («у=iim-Fm (<)> 2 Qj (о *;<о- . 7' 1=1 Таким образом, почти при всех t величина У0 (0 содержится в выпуклой оболочке предельных точек последовательности Ут(0- Но ввиду п. 1 каждая предельная точка последовательности У"1 со- держится в B(t) (У0). Поэтрму limX f Y™dt = X f Y°dt = 0. т То Л Последнее равенство противоречит, неравенству (7.14). Следователь- но, предположение о том, что lim Y71 ф. В (t) (У0), неверно. Тем п самым доказана полунейрерывность отображения а. Теперь для доказательства теоремы 7.8 достаточно заметить, что каждая неподвижная точка отображения а является ситуа- цией равновесия.^ Существование неподвижной точки следует из полунепрерывностила, выпуклости компакта У, а также выпуклос- ти и компактности а (У) при каждом У (см. теорему Какутани [22], [57]). Теорема доказана. 16*
244 ' ЧАСТЬ IV. БЕСКОАЛИЦИОННЫЕ ИГРЫ Г л а в а 8 ПРИЛОЖЕНИЯ х В большинстве экономико-производственных, военно- цолитическйх, экологических и административно-юриди- ческих конфликтов целью каждого участника является получение по возможности большего индивидуального вы- игрыша. Участники таких конфликтов могут, например, выиграть все одновременно. Поэтому несовпадаю- щие . интересы участников оказываются не полностью противоположными, что делает конфликт неантагонисти- ческим. Такой конфликт может моделироваться бескоали- ционной игрой, если он отвечает следующим условиям: 1. Конфликт, определяется неантагонистическим вза- имодействием участников. , 2. Участники конфликта не могут (или не имеют права) заключать взаимно обязывающие соглашения*). 3. Свои действия стороны предпринимают независимо друг от друга, т. е. каждая из них не имеет информа- ции о действиях, совершаемых другими сторонами, ре- зультаты этих действий оцениваются вещественными числами, которые определяют полезность сложившейся ситуации для каждой из сторон. 4. Каждая из конфликтующих сторон знает как для себя, так и для остальных полезность любой возможной ситуации, которая может сложиться в результате их вза- имодействия. * При выполнении условий 1—4 строится бескоалици- онная игра Г = </, {а?г}<<=ь в которой I — множество игроков, Xi —множество чистых стратегий игрока i е I и Hi — функция выигрыша игро- ка i, заданная на х = ТТ id ' При моделировании тех или иных явлений бескоали- .. ционными играми необходимо выделять конфликты, ко- ♦) В некоторых случаях это условие может нарушаться, тогда бескоалиционная игра будет моделировать конфликт не совсем точно. Точность зависит от того, насколько сильно влияют совмест- ные действия на развитие конфликта.
ГЛАВА 8. ПРИЛОЖЕНИЯ 245 торые сводятся к распределению между игроками неко- торого постоянного количества. Для таких конфликтов строятся бескоалиционные игры с постоянной суммой, а если число участников в точности равно двум, то анта- гонистические игры (см. гл. 1—6). В тех случаях, когда сумма выигрышей, игроков хотя бы в одной ситуации не равна суммарному выигрышу в любой другой, строится бескоалиционная игра с ненулевой суммой. Анализ бес- коалиционной. игры с ненулевой суммой по существу об- личен от анализа антагонистической игры, и имеется не- сколько подходов; один из которых основан на принципе равновесия (см. гл. 7). Нижеследующие примеры иллюст- рируют построение бескоалиционных игр с ненулевой суммой и их- анализ на принципе равновесия для кон- кретных конфликтов. , f § 8.1. Примеры приложении теории бескоалиционных игр п лиц Пример 8.1 (неантагонистическая конку- ренция двух фирм в условиях ограничен- ного времени сбыт а). Пусть в некотором районе имеются две одинаковые фирмы, которые могут произво- дить товар одного и того же назначения. Известно, что товар может пользоваться спросом в некоторый фикси- рованный промежуток времени (например, носит сезон- ный характер). Не умаляя общности, можно считать, что этот отрезок времени есть сегмент [0, 1]. В условиях примера 4.1, если одна из фирм поставит на рынок товар в момент времени #е[0, 1]? а вторая — в момент време- ни уе[0, 1], то выигрыш первой фирмы задается соот- ношениями с(У — х) при Hl (х, у) = 4 с (1-х) £ при х= У, (8.1) с (1 — х) при х>у. - При условии, что вторая фирма не стремится разорить первую, а как и первая фирма, желает максимизировать свой доход, ее выигрыш по аналогичным соображениям
246 ЧАСТЬ IV. БЕСКОАЛИЦИОННЫЕ ИГРЫ определяется соотношениями с(1 —у) при X <У, Ни (я, у) = 4с с1 ~ У) при X = У, (8.2) р & — у) при X >У- Легко видеть, что Н^х, у) + Ни(х, у}=£ const, поэтому данный конфликт не моЖет моделироваться антагонисти- ческой игрой. С другой стороны, Н^х, у) = Яц(у, х). Предыдущее равенство наталкивает нас на мысль об ис- . * 1 пользовании теоремы 7.5. Для этого необходимо, чтобы все условия этой теоремы были выполнены. Обратимся к примеру 4.1. В антагонистической игре, рассмотренной t в этом пример.е, оптимальная стратегия У* игрока II на< сегменте [0, 1 — 1/е] задавалась плотностью 1/(1 —у), причем У*"— мера дополнения этого ,сегмента — была • равна нулю. Кроме того, на полуинтервале (0, 1 — 1/е] вьйюлняется равенство Жж, У*) = и (см. (4.10)). Так как У* — мера точки нуль — равна нулю, все условия теоре- мы 7.5 выполнены. Таким образом, по этой теореме си- туация (У*, У*) является ситуацией равновесия игры Г. В этой ситуации игроки используют одинаковые смешан- ные стратегии. Это и не удивительно — игра Г является симметричной. Следовательно, каждая из фирм должна \ поставлять товар , на рынок в один из моментов времени х, Уе [0, 1 — 1/е] в соответствии с реализацией случай- ной величины, функция распределения которой есть У*. Так как игроки действуют независима, то из симметрии решения игры не следует симметричность исхода. _ j Пример 8.2 (захват рынков сбыта). Пусть | имеются п рынков” сбыта, которые намерены захватить , j две одинаковые фирмы, располагающие единичным капи- | талом. Как и в примере 4.2, стратегиями каждой из фирм i являются всевозможные распределения капитала между | п рынками сбыта. Если одна из фирм (игрок I) на захват Ц иго рынка сбыта выделяет капитал х^ а вторая — капи- тал ytl то выигрыш игрока I на этом рынке будет равен -1 kiixt — уд при условии, что эта величина больше нуля, ж и равна нулю в противном случае. Коэффициент ki on- Ж ределяет степень важности рынка. - _ W
ГЛАВА 8. ПРИЛОЖЕНИЯ 247 Таким образом, суммарный выигрыш первого игрока в ситуации (х, у) будет равен ' , Hi (®, у) = 2 max (0, kt {xi — уд). 2=1 Ввиду симметрии ситуации (сравните .с примером 4.2) выигрыш второго игрока будет равен Я/у, х). Следовательно, конфликт моделируется бескоалицион- ной игрой ' - > Г = <л,у,Я1,Яц>,' где X -- |3/ - (^z^, • • • 7 %п) У = {у=(^ь п ' У, = 1, Xi О 2=1 - J п 2=1 Очевидно, множества х и у можно геометрически пони- мать как симплексы. Прежде чем решать игру Г, подвергнем ее некоторому упрощению: предположим, что капиталы фирм неделимы, т. ё. каждая из фирм может использовать свой капитал только целиком и только на одном из рынков. Этот конф- ликт будет моделироваться игрой Г =х<х, у, Нт, Яп>, где х и у — множества вершин симплексов?? и у. Если через i и / обозначить соответственно вершины симплек- сов х и у, i-я и /-я компоненты которых равны единице, а остальные равны нулю, то в матричной записи (О к± к± ... к1 \ 0 к2 * • ’ К 1 • • • кп / ' ’ Очевидно, что Яц(х, у) = HSy^ х). Последнее равенство, как и в примере 8.1, опять на- талкивает нас на мысль об использовании теоремы 7.5. Не умаляя общности, можно считать, что kt > к2 > ... • ••>кп. Рассмотрим антагонистическую игру, определяе-
248 ЧАСТЬ IV. БЕСКОАЛИЦИОННЫЕ ИГРЫ муи> матрицей Н = А. Эта игра нам уже встречалась (пример 2.3, случай 2). Оптимальная стратегия второго игрока в этой игре равна Y* = (тц, т)2» • • •>!!*)» где (р •. \ / ,р \-i , - п₽и кю. i=l 1 / \ 1=1 */ О при J > р. Число р определяется как в примере 2.3. Для 1 = 1, 2, ..., р (см. (2.23)) справедливы равенства H(t,Y*) = v. - Таким образом, к jirpe Г применима теорема 7.5. Сле- довательно, ситуация^ (У*, У*) является ситуацией рав- новесия игры Г. Так какгсс: х, у с.у, эта ситуация равг новесия будет также некоторой ситуацией в -игре Г. Докажем, что она является ситуацией равновесия этой игры. - .' . . Действительно, - Hi (У*, У*) ₽= Н (У*, У*) > Н (ж, У*) = Hi (ж, У*), • х е х0. • (8.3) Как уже замечалось (пример 2:3), функция Hi выпукла по яь Поэтому-неравенства (8.3), выполняющиеся во всех вершинах симплекса х, выполняются также на всем симплексе, т. е. Я1(У*,У*)>Я1(х,У»), • х<=х. (8.4) В силу равенства Hi(x, у)=Нц(у, х) верны также нера- венства Ha(Y*, Y*)>Ha(Y*, y). (8.5) Пэ -(8.4), (8.5). видно, что ситуация (У*, У*) является ситуацией равновесия игры Г. Пример 8.3 (теоретико-игровая модель встречного боя). Авианосное ударное соединение (АУС) «зеленых» планирует нанесение ударов по авиа- носному ударному соединению (АУС) «синих*» в период Т,
ГЛАВА 8. ПРИЛОЖЕНИЯ 249 - ' / А " * который состоит из $ единиц времени. Удары, начиная с момента г, наносятся в каждую последующую единицу времени i+1, i + 2, ..s. В свою очередь АУС синих предполагает в тот же период Т, начиная с момента /, и -в каждый последующий момент времени / + 1, 7+ 2, ..., s нанесение ударов по АУС зеленых. Кроме того, оба соединения совместно с нанесением' ударов предполагают использовать для защиты своих ко- раблей средства радиоэлектронного . противодействия" (РЭП), эффективность которых зависит от упреждения атакующих действий противоположной стороны, а их раз- дельное использование с ударами ввиду нарушения в этом случае скрытности исключается. Пусть оба соединения обладают одинаковыми боевыми возможностями, которые с учетом* принятых допущений в примере 2.11 характеризуются математическим ожида- . нием числа уничтоженных кораблей противника в еди- ницу времени, равным с (при нанесении ударов без про- тиводействия средств РЭП), с/2 (при нанесении ударов одновременно с использованием^ противником средств РЭП) и 0у (в условиях противодействия средств. РЭП). _ Тогда, если Л <j (зеленые наносят удары без противо- действия средств РЭП синих в течение j — i единиц времени и только через f— i единиц времени средства/ РЭП синих сведут эффективность' последующих ударов к нулю, синие начинают нанесение ударов после исполь- зования зелеными средств. РЭП, и поэтому эффективность последних равна нулю), то математическое ожидание уничтоженных кораблей синих за-период Т будет а# = = с(/ — Z), а математическое ожидание числа уничтожен- ных кораблей зеленых, = с($ — / + 1). Если i>j (синие начинают нанесение ударов до использования зелеными средств РЭП, зеленые начинают нанесение ударов после использования синими средств РЭП), то ац = с(8 — £ + 1) и Ъь = с(Л — ]}. Если же зеленые и синие начнут нанесе- ние ударов одновременно ' (т. е. / = /), то == c(s~ i +1)/2. Зеленые выбирают f-ю единицу времени начала ударов и использования средств РЭП, стремясь максимизировать математическое ожидание числа унич-' тоженных кораблей синих за период Т, а синие выбира- ют J-ю единицу времени начала ударов по АУС зеленых и использования для защиты своих кораблей средств
250 _ ЧАСТЬ IV. БЕСКОАЛИЦИОННЫЕ ИГРЫ РЭП, стремясь максимизировать математическое ожида- ние.числа уничтоженных кораблей зеленых за период Т. Далее будем называть АУС зеленых игроком I, АУС синих — игроком II, их чистые стратегии.— моментами времени 1, 2, ..$, а полезностями игроков — математи- ческое ожидание числа уничтоженных кораблей против- ника. Тогда функции выигрыша Ят и Ни игроков I, II на основании принятых допущений о боевых возможнох- стях (см. пример 2.11) определены равенствами с (/ — i) для t < j, Их (»,/) = |c(s- i 4-1) для i — j, (8.6) c_(s — i 4- 1) для c (s — 7 4- 1) для'/ Яп («,;) = 4л для i = ], (8.7) для i>j. , Как легко видеть, {5 — i + 1 для i 7, .Т , ' $ — 7 + 1 Для i>7, т. е сумма функций выигрыша игроков зависит от их стратегий. Следовательно, конфликт неантагонистичен, и поэтому моделируется биматричной игрой Г = Ни Ни), ,где х = у == {1, 2, — множества чистых стратегий, а Нт и Ни — функции выигрыша игроков I и II. Игра Г записывается в матричной форме следую- щим образом:* . * 1 “X s 1 2 ... s — 2s — 1 1 5 — 1 — 1) 1 ... 5 — 3 5 — 2 2 2 2 ... 1 1 1 1 1 ... 1 I
ГЛАВА 8. ПРИЛОЖЕНИЯ 251 и В = с 1 “2 s $— 1 ... 2 1 1 4(s— 1) ... 2 1 21 ...21 s-2 s — 3 ... 1 1 $ — 1 s — 2 ... 1 у Анализ биматричной игры Г с целью нахождения си- туаций равновесия довольно труден. Оказывается проще (как это уже делалось в примерах 2.5, 2.11 и 4.1) рас- смотреть случай, когда игроки имеют бесконечные мно- жества стратегий. Поэтому будем считать, что промежуток времени Т есть сегмент [0, 1]. Тогда если АУС зеленых начнет на- несение ударов и постановку средств РЭП в момент вре- мени rr s[0, l], а АУС синих — в .момент времени у^ е [0, 11, то выигрыши игроков I и II задаются соответст- венно формулами (8.1) и (8.2). В результате имеем не- прерывный аналог теоретико-игровой модели встречного боя — неантагонистическую бесконечную игру, решение которой получено в примере 8.1. Пример 8.4 (т е о р е т и к о - и г р о ва я модель боевых действий на коммуникациях). Обыч- но на коммуникациях противника развертываются под- водные лодки с задачей обнаружения и уничтожения транспортов. В свою очередь другая сторона осуществля- ет поиск и уничтожение подводных лодок силами проти- володочной авиации и кораблей. Допустим, что в неко- тором районе подводные лодки и противолодочные силы могут быть использованье по одному из двух возможных вариантов. Пусть эффективность действий подводных ло- док определяется математическим ожидание»! числа унич- тоженных транспортов ац и задана матрицей Л, а эффек- тивность действий противолодочных сил — математиче- ским ожиданием числа уничтоженных' подводных лодок Ъц и задана матрицей В. В данном случае очень полезно указать на то, что биматричные игры >по сравнению с матричными более адекватно отражают военные конфликты оперативно-так-
252 ЧАСТЬ IV. ЁЕСКОАЛИЦИОННЫЕ ИГРЫ V t тического плана,-для которых характерно наличие не ме- нее чем двух иерархически связанных звеньев «нападе- ние — оборона». Действительно, в качестве модели рас- сматриваемых действий на коммуникациях можно было принять матричную игру, полагая, что критерием эффек- тивности сторон является математическое ожидание чис- ла уничтоженных транспортов. Однако такая модель бы- ла бы более грубым приближением к действительности по сравнению с бимахричной игрой, так как очевидно,, что математическое ожидание числа уничтоженных транспортов определяется не только эффективностью под- водных лодок и противолодочных сил, но и уязвимостью самих транспортов, включая их непосредственное' охра- нение. Последнее скорее оказывает влияние на эффек- тивность подводных лодок, чем на эффективность проти- володочных сил, не входящих в состав непосредственного охранения транспортов. Кроме того, более реальным яв- ляется^ предположение о том, что критерии эффективно- сти сторон в общем случае не совпадают. Итак, если'5ту стратегическую ситуацию рассматривать как неантагони- стический конфликт, то -она моделируется биматричной игрой, которая в общем виде задается матрицами А = (й11 и В = Р11 ' \й21 Л22/ W21 ^22/ Смешанными стратегиями игроков I и II в данной игре являются соответственно векторы X = (£, 1 — £) и Y = (т), Г— ц), а каждая ситуация однозначно описыва- ется- . некоторой точкой (£, т]) единичного квадрата 10, И X [0, 1]. Соответственно этому выигрыши игроков в этой ситуации будем обозначать через Я^, ,т]) и Я^,_ц). . . Очевидно, Ях (5, ц) == ХАYT == (^11 — ^12 — azi + а22) + + (Д12 — ^22) £ + (а21 — а22) т] + а22; (8.8) Ни Т1) = XBYT = (Ьи - 6М - Ь214- Ь22)Лт1 + 4- (^12 — ^22) £ 4“ (^21 — ^2г) И 4- ^22* (8-9) Теперь, прежде чем определить ситуации равновесия,
ГЛАВА 8, ПРИЛОЖЕНИЯ 253 опишем в единичном квадрате ситуаций «геометрические места точек», которые удовлетворяют неравенству (7.2) для игроков I и. II отдельно. Такие ситуации будем назы- . вать приемлемыми соответственно для. игроков I и II. Для того чтобы ситуация (|, тр была приемлемой для игрока I, необходимо и достаточно выполнение следую- щих неравенств: (8.10) . . (8.11) или с учетом (8.8), равносильных неравенствам (8.10), (8.11), неравенств’ (8.12) (8.13) 4(1-|)-а(1-|)^0, - 4gn-^>0, . где 4 — йц — 0512 — 0521 4" 0522 и и —• 0522 0512. Легко установить, что множество всех решений си- стемы (842)^(8.13), лежащих в полосе [0, 11 X (— °°, °°), состоит из - всех ситуаций вида (0, ц), где Ап — а^О; всех ситуаций - вида (§, тр, где g<=(0, 1), а 4п-а=Д; / - всех ситуаций вида (1, т]), где А^ — а > 0. Описанное множество в зависимости от значений А и а имеет следующую форму.. Если А = а = 0, то множество решений , системы (8.12), (8.13) составляет всю полосу [0, 1] X (—<», °°), а множество приемлемых для первого' игрока ситуаций покрывает весь единичный квадрат. При 4=0 и а #= 0 множество решений системы (8.12), (8.13) есть либо прямая £ = 0, либо прямая § = 1~ (в зависимости от знака а). В том случае, когда 4^0, для всех решений систе- мы (8.12); (8.13) вида (б, •»]) должно быть Я "Г == а» если 4 >» О, = а, если 4<0. .Другими словами, множество значений т] есть либо полу-
254 ' ЧАСТЬ IV.' БЕСКОАЛИЦИОННЫЕ ИГРЫ прямаяа], либо полупрямая [а, «>). Соответствен- но для решений (8.12), (8.13) вида (1, тр должно быть ц > О, если А > О, ц С 0, если А < О, т. е. ц^[а, .°°) или т] а]. Наконец/для решений (8.12), (8.13) вида (£, тр, где 0 < | < 1, должно быть а «=Т=а’_ т. е. множество таких решений образует отрезок, соедиг няющий точки (0, а) и (1, а). Таким образом, множество всех решений (8.12), (8.13) при А ¥=0 образует трехзвенный зигзаг, а множест- во всех приемлемых для игрока I ситуаций ^является пе- ресечением этого зигзага с единичным квадратом ?А О) А>0,а<0 б)А>0^0 в)А>О,О<а<7 1 г Рис. 8.1. (рис. 8.1). При а<0 множество приемлемых ситуаций есть одна из вертикальных сторон квадрата (рис. 8.1а),
ГЛАВА 8. ПРИЛОЖЕНИЯ 255 при а == 0 две его стороны, составляющие угол (рис. 8.16), при 0<а<1 — трехзвенный зигзаг (рис. 8.1в), при а = = 1 —снова угол (рис. 8.1г), при а >1 —снова одна из вертикальных сторон квадрата (рис. _8.1д). Сходным об- разом геометрически интерпретируются приемлемые си- туации для игрока I в случае А < 0 (рис. 8.1е). Аналогично в зависимости7от В -- Ъц — Ъ{2 — &21 "Ь &22 и Ъ == &22 — &21 Л t определяются приемлемые ситуации для игрока II. При В = Ъ = 0 всякая ситуация будет приемлема для игрока II. Если В = 0, но b=^0, то множество всех при- емлемых ситуаций для игрока II будет либо нижней, либо верхней стороной квадрата. Наконец, при В О множество приемлемых ситуаций будет трехзвенным зиг- загом, вид которого в зависимости от Р = Ъ/В показан на рис. 8.2. ч a)S>0,0<fi<7 Рис. 8.2? Рис. 8.3. Множество всех ситуаций равновесия описывается путем фактической фиксации множеств приемлемых си- туаций для каждого из двух игроков. Если при этом А =£ 0 и В =/= О, то игра имеет ситуацию равновесия во вполне смешанных (т. е*. отличающихся хот чистых) стра- тегиях, а именно (рис. 8.3) / X* = (|*, 1 ^ |*), У* = (ц*, 1-ц*);
256 ЧАСТЬ IV. БЕСКОАЛИЦИОННЫЕ7ИГРЫ (8.14) (8.15) Где t* = — ==_____________________&22 ~ &21 в &и — &12 — &21 + &22 ’ = 2L _= а22~~Д12 А а11 а12 ““ а21 + Л22 Из сравнений выражений (8.14) и (8.15) соответствен- но с формулами (1.76) и (1.78) из главы I видно, что если биматричная игра имеет ситуацию равновесия во вполне смешанных стратегиях, то поведение игрока II совпадает с поведением игрока II в матричной игре с матрицей выигрышей Л, а поведение игрока Г—с по- ведением игрока I в матричной игре с матрицей выиг- рышей В. Таким образом,' равновесное поведение игроков в би- матричной игре ориентировано на минимизацию выигры- ша противника, что можно трактовать как. «антагонизм' поведения» в условиях отсутствия «антагонизма инте- ресов». " • - Решим теперь численный пример, приняв Найдем Л = 3, а = 2, а = 2/3, В = —5, Ь = —3, (3 = 3/5. Тогда X* = (3/5, 2/5), У* = (2/3, 1/3), ЯД*, Ц*) = 5/3, Лп(|*, ц*) - 11/5. , Следовательно, подводным лодкам с вероятностями ' 3/5 и 2/5, а противолодочным силам с вероятностями 2/3 и 1/3 целесообразно действовать соответственно по пер- вому и второму вариантам. В этом случае математическое ожидание числа уничтоженных транспортов и подводных лодок будет соответственно равно 5/3 и 11/5. Пример 8.5 (планирование выпуска по- бочной1 продукции, неантагонистич^е ский случай). Предположим/что два предприятия могут вы- пускать побочную продукцию в те.х же производственных условиях, что и в примере 2.4, но возможности сбыта этой продукции изменились. Теперь, согласно прогнозу социологов, если первое предприятие (игрок I) будет вы-
.. , ' - ГЛАВА 8. ПРИЛОЖЕНИЯ 257 пускать продукцию типа Д* (К i т), а второе (игрок II) — продукцию типа то в городе найдет, сбыт ац товаров типа Д,- й товаров типа Mf. Поскольку сбыт продукции любого предприятия зависит от того, * какую продукцию выпускает другое предприятие, а каж- дое предприятие стремится максимизировать объем реа- лизованной продукции, налицо производственно-торговый конфликт! Этот конфликт моделируется игрой тех же игроков I и II с теми4 же соответственно т иг п страте- гиями у каждого, что и в игре из примера 2.4. Однако данная игра является неантагонистической, так "как сум-, ма реализованной продукции будет зависеть теперь от складывающейся ситуации. Принимая доход от продажи единиц товара равным единице, а полезности игроков I и II равными их до- ' ходам, правомерно моделировать рассматриваемый .конф- - ликт биматричной игрой, задаваемой парой ' тХп- матриц А — |ау| и В = где ац и Ъц — выигрыши соответственно игроков I и II в ситуации ($, J). Покажем решение этой игры на конкретном числовом примере, приняв, что предприятия I и II планируют выпускать побочную продукцию типов соответственно Д1 (i = l, 2) и Mj (j — 1, 2), а ожидаемые доходы от реализации этой продукции заданы следующими матрицами: Требуется определить тип продукции, который целесооб- разно выпускать каждому предприятию. Очевидно, что. следует решить биматричную игру, за- данную матрицами Ан В. Для этого вычислим значения величин А = 900, а — 600, В — —2500 и 6 = —1500. Затем найдем величины а = 2/3 и р = 3/5., Следовательно, си- туацию равновесия образуют векторы (3/5, . 2/5) и Y* = (2/3, 1/3), а математическое ожидание выигрышей игроков I и II в ситуации равновесия окажутся соответ- ственно равными Vi == 500 и Ни —1100. Полученное решение в содержательных терминах при- мера означает, что предприятие I выбирает выпуск про- дукции Д1 к Д2 с вероятностями, соответственно равными 3/5 и 2/5, а предприятие II — выпуск продукции Mi и М2 Г. Н. Дюбин, В, Г. Суздаль
258 ЧАСТЬ IV. БЕСКОАЛИЦИОННЫЕ ИГРЫ с вероятностями соответственно равными 2/3 и 1/3. При этом математическое ожидание дохода предприятия будет равно 500 усл. ед., а предприятия II —1100 усл. ед. ' Пример 8.6 (распределение ресурсов) [41]. Рассмотрим следующую экономическую ситуацию. Адми- нистративный центр распределяет' ресурсы между не- сколькими подчиненными ему подразделениями. Условия производства на каждом подразделении предполагаются различными.. Различными являются и полезности адми- нистративного центра А 0, а -также производственных под- разделений В2, ..Вп. На первом шаге игрок А0 вы- бирает систему из п векторов un; uh > 0; e= Rz; n \ Вектор uk будем интерпретировать как набор ресур- сов I наименований, выделяемых центром Ао для fc-ro производственного подразделения. На втором шаге каж- дый из игроков Bh В2, ..., Вп, зная, как поступил игрок А о, выбирает вектор такой, что XiAi^-Ut + ai, ' Вектор Xi интерпретируется как производственная программа f-го производственного подразделения по раз- личным видам продукции, а<—-вектор наличных ресур- сов (а,>0), Аг— производственная или технологиче- ская матрица f-го производственного подразделения. Функция выигрыша игрока Ао полагается равной Яо (и, хх (и), хп (и)) = (“)». i=l ai^O, OjeR1. i = l,2, 5ерез ciiXitu) обозначено скалярное произведение векто- ров at и at — вектор полезности центра 40 от про,-
; ГЛАВА 8. ПРИЛОЖЕНИЯ 259 дукции, выпускаемой i-м производственным подразделе- нием. . Функция выигрыша подразделения Вк полагается равной. ЯА(п, #i(u), ..., хп(иУ) = скхк(и\ где ск — вектор полезностей предприятия Вк от выпускае- мой продукции. Найдем ситуацию равновесия рассматриваемой бескоа- лиционной игры. Очевидно, что каждое из подразделений будет стре- миться максимизировать свою полезность. Пусть хк (и) решение задачи параметрического программирования maxckxk. хкАк^ик + ак> uk^Q, ' av>0, а и = (ui ,^2 ,’... j Wn) — решение задачи п п ' т&ък^акхк(и), ^uk = b, 'ик^0, k = i,2,...rn. h=l Л=1 Покажем, что ситуация (и*, хг (и), ..., Хп (и)) явля- ется ситуацией равновесия. Действительно, Но (и , Х1(и), .. 4 Хп (u)) = 2 Я/Х (“*) > • Й=1 > 2 (и) = Но (и, Х1 (и), ..Хп (и)), л fe=l Таким образом, игроку AQ невыгодно отклоняться от стратегии.»*. Далее, Як (» , Хг (и), • • ч (^)) “ (и ) = Нк(и*, Х1 (и), . . X*k (и), . . Хп (и)). Последние неравенства показывают, что ни одному из игроков Bh невыгодно отклоняться от ситуации (и , xi (и)9 ..., Хп(и)}. Эта ситуация равновесия замечательна тем, что она является «сильно равновесной», т. е. от нее невыгодно, отклоняться любому количеству игроков Я*. Вообще говоря, в бескоалиционных играх это наблюда- ется редко. 17*
260 ЧАСТЬ IV. БЕСКОАЛИЦИОННЫЕ ИГРЫ Пример 8.7 (теоретико-игровая Цодел*ь Эколого-произ.водственного конфликта, не- кобперативный вариант). Допустим, что п пред- : приятии используют воду из некоторого водоема для тех- нических целей, которая после загрязнения сбрасывается : в этот же водоем. Если при этом объем загрязненной воды не превышает определенной величины, то за счет естественного обмена она становится пригодной для даль-/ нейшего использования. В противном случае количество загрязненной воды увеличивается, что приводит к необ- \ ходимости'- перестройки технологического процесса или очистки всего водоема. Поэтому предприятие i (1 = 1, 2, ..., п) до сброса загрязненной воды может пропускать ч * ее через очистные устройства, затрачивая на очистку единицы объема воды средства at. . * - Положим объем воды, потребляемой предприятием i, равным единице. Тогда, обозначив через х( объем неочищаембй воды, а через ct — потери в случае . загряз-/ нения всего водоема, определим естественным . образом суммарные потери предприятия i по следующей фор- муле: п •Д/t-(X}t х%, ..., жп) — а{(Г— Xi) 0Ц (1 — Ж{) 4- Ci при S > «» (8.16) 1 где « — нормированный объем загрязненной воды, при котором весь водоем загрязняется и вода становится не-i пригодной для дальнейшего использования 11). Очевидно, что каждое предприятие заинтересовано в очистке воды и,эта заинтересованность зависит от его потерь, которые определяются выражением (8.16). По- скольку потери различны, различны интересы йорон, и каждая из них для достижения своих целей выбирает 1]. В результате складывается эколого-производ-, ственный конфликт, который при отсутствии коопериро вания моделируется бесконечной бескоалиционной игрой п лиц с функциями выигрыша Н^хи х2, ..., хп) =
ГЛАВА 8. ПРИЛОЖЕНИЯ 261 ₽ — М,(х,, Xi,.Хп), т. е. Hi (a^i» > • •, хп) — —сч (1 — X}) прИ/^ач^л» 4—1 Г» -сц (1 — ац) — С| при 2^>а. (8.17) Множеством чистых стратегий игрока i (i = 1, 2, ... .п) является единичный сегмент, т. в. Xi[0; 1]. Тог- да ситуация равновесия я* — х2» • ••> #п) в чистых стратегиях на основании (7.2) должна удовлетворять следующему неравенству: Н<(х*\\х^Н^х*). (8.18) Если принять во внимание, дто с4 = с2 =... = сп — с и at = <х2 = ... = ап = а, то ситуация равновесия опреде- ляется следующим выражением: (1,1,. ..,1) при а^1------- а выигрыш игрока Г в ситуации равновесия ж* будет равен Я,(х*) = —оц1при a fi- zz п при а(1— Не- (8.20) действительно, если а 1 — - < с, то . ч \- п / HAx*\\xi) = — а (1 — Xi),— С;~Х{ >•
262 ЧАСТЬ IV. БЕСКОАЛИЦИОННЫЕ ИГРЫ Следовательно, Hi (х* || Xi) < -а (1 - = Hi (ж*), 1С i < п. (8.21) Если же а^1— —то . ' Я ^*Ь4 = (-а(1-ж0’ ^ + (п-1)<а, • I— а(1 — — с, #i + (n —1)>а. Следовательно, . ЯД^И^^-с-ЯДж*), (8.22) так как t max Я (я*, х^) = max (—а (п — а), —с) = —с. xi В силу неравенств (8.21) при а^1 — с ситуация (о О О \ с» тт —, —, ..— I является ситуацией равновесия. При а^1 — из неравенств (8.22)‘следует, что —а(п — а) —с,- <х(п — а).>с и ситуация (1, 1, ..1) является ситуацией равновесия. Таким образом, в зависимости от отношения между а и с каждое предприятие должно не очищать загряз- ненную воду или очищать долю потребляемой воды, рав- ную 1 — а/п. \ . ' Очевидно, что наибольшую угрозу для водоема пред- ставляет «хищническая» ситуация равновесия х* = e (1, 1, 1), в которой все предприятия сбрасывают неочищенную воду, а бережной по отношению к приро- де — ситуация равновесия х* = (а/п, а/п, ..., > а/п). Поа- - тому с точки зрения охраны окружающей, среды величи- на штрафа с должна быть, не менее а(1 — а/п). В этом ; случае решением оказывается наиболее выгодная ситуа- ция равновесия, при которой потери' каждого из пред- • приятий равны а(1 — а/п) и окружающая среда не за- ' . грязняется.
ГЛАВА 8. ПРИЛОЖЕНИЯ 263 § 8.2. Примеры приложении неатомических бескоалиционных игр Для ряда социально-экономических систем характерно наличие большого числа объектов-участников с несовпа- дающими интересами и различными способами действий. Каждый из этих участников’ не влияет в отдельности на систему в целом, но их массовое поведение определяет некоторым образом ее функционирование. Так, воспроиз- водство рабочей силы или миграция населения опреде- ляет те или иные черты социальной структуры большого города, хотя влияние отдельного жителя значения не име- ет. Аналогично обстоит вопрос с экономикой региона или избирательной кампанией, на которые не может повлиять ни один отдельный потребитель в экономической системе или избиратель при голосовании. Однако их совокупное поведение без какого-либо соглашения (кооперирования) между собой имеет решающее Значение для окончатель- ных итогов. Подобное положение складывается в различ- ных системах бытового обслуживания больших городов, _ когда при планировании новых объектов службы быта необходимо учесть доли семей, пользующихся данной прачечной или пунктом, химчистки и т. д. Наконец, ана- логичная задача возникает в случае теоретико-игровых оценок.распределения пассажиров по маршрутам город- ского транспорта и т. п. , Математические модели, адекватно отражающие свой- ство массового поведения, удобно представить как бес- коалиционные игры с бесконечным (в том числе конти- нуальным) множеством игроков. . При этом естественно предположить, что на множестве игроков задана неато- мическая мера и только имеющие положительную меру подмножества игроков могут оказать влияние на исход ситуаций. Другими словами, множество игроков состав- ляет неатомйческое пространство, а множества игроков нулевой меры не могут воздействовать на, исход игры. Такие модели называются неатомическими бескоалици- онными играми. Построение неатомических бескоалиционных игр и на- хождение ситуаций равновесия позволяют вскрывать те. или иные характеристики массового поведения и тем са- мым решать важнейшие проблемы управления массовыми
264 ЧАСТЬ IV. БЕСКОАЛИЦИОННЫЕ ИГРЫ социально-экономическими явлениями/ Нижеследующий пример иллюстрирует это обстоятельство. Пример 8.8 (теоретико-игровая модель про- - гноза пассажиропотоков в городской транс- портной сети). Представим транспортную сеть города в виде связного ориентированного графа: его вершины будут узловыми точками реальной сети, а дуги отвечают непосредственным транс- портным связям между ними. Пусть главным фактором, влияющим , на выбор маршрута от- дельным пассажиром, являются затраты времени на поездки. Вви- „ ду того, что число пассажиров города велико, будем считать его континуальным и отождествим с сегментом Т == [0, 1]. Обозначим через Hr интенсивности потока пассажиров, поступающий извне в r-ю вершину и желающих попасть в вершину к. Если множество п п вершин графа равно п, то 22^=1, , причем каждой паре (г, к} hr соответствует подмножество У>* сегмента [0, 1] — множество тех пассажиров, которые желают из вершины г попасть в вершину к. Мера Лебега множества Yrk равна Чистой стратегией иг- рока (пассажира), содержащегося в множестве Уг&, вообще гово- ря, является^ выбор маршрута из вершины г в вершину к, однако мы позволим игрокам выбирать произвольные маршруты л из не- которого допустимого конечного множества маршрутов S. Далее убу- дет построена игра с бесконечным числом игроков, в которой функ- ция выигрыша будет задана таким способом, чтобы игрокам было невыгодно использовать ненужные им пути передвижения. После того, когда , все игроки выберут свои марщруты, для каждой дуги графа можно определить числа —меры множества тех иг- роков, которые стремятся в вершину к и используют при пере- движении дугу (Z, у) • Положим - V. у А Тогда Xij будет равно мере игроков, использующих дугу (i, j). 4 Вследствие ограниченности емкости транспортных единиц время • проезда по дуге ($, у) будет зависеть от доли пассажиров, исполь- зующих эту дугу. Обозначим через время проезда по дуге (г, у) при условии, что доля пассажиров, использующих дугу; (i, Я, равна Будем считать непрерывными функциями. Пусть . У — некоторая ситуация (см. § 7.2). Положим' выигрыш . игрока to е Уг* в этой ситуации равным (-2 тЛ 2. если $0 — путь из г в ft, Z7°(*0)(y)=\ (М)е«о I—У в противном случае, где s0— маршрут игрока to, У1 « J Ya(t)dt — мера множества т - пассажиров, избравших маршрут s; N-—очень большое число,
ГЛАВА 8. ПРИЛОЖЕНИЯ 265 2j tyr 2i Y i — время проезда игроком' f0 по маршруту (M)eso \«3(iJ) ) > Очевидно, что если игроки используют лишь чистые стратегии, то выигрыш игрока будет равен — л 2 (•£«)» если so — пУта из г в ft, (М)е«0 J 3 у - — N в противном случае. Естественно, игроки стремятся максимизировать свои функции выигрыша или, что то же самое, минимизировать вре^я проезда. Функции удовлетворяют условиям (1) ,и (2) § 7.2. Поэтому в этой игре с бесконечным числом игроков имеется ситу- ация равновесия. Функции выигрыша, игроков в построенной мо- дели зависит лишь от поэтому игроки имеют чистые г ' ' '' ~ стратегии (см. [42]). _ f - /
ЧАСТЬ V КООПЕРАТИВНЫЕ ИГРЫ Глава.9 ОСНОВЫ ТЕОРИИ § 9.1. Арбитражные схемы . 1. Природа и структура арбитражных схем. Большин- ство неантагонистических конфликтов в экономике и смежных с ней областях характеризуются тем, что их z участники могут путем кооперирования объединять свои усилия. Сотрудничество между игроками приводит к ка- чественно новому конфликту по сравнению с бескоали- ционным случаем. Как мы видели, в бескоалиционных играх отклонение одного из участников от ситуации равновесия не дает ему никакого преимущества. Однако при отклонении не- скольких игроков эти игроки могут получить больший выигрыш, нежели в ситуации равновесия. Поэтому в ус- ловиях, в которых возможна кооперация между игрока- ми, принцип равновесия не оправдывает себя. Так, на- пример, пусть неантагонистическая игра двух лиц зада- на’ следующими матрицами: \ Б этой игре А = —4, а = 1 и а = —1/4, поэтому ситуация- ми; приемлемыми для игрока I, будут ситуации вида. (О, тр при произвольном т) (см. пример 8.4). Аналогично для игрока II приемлемыми ситуациями будут ситуации вида (|, 0) при произвольном |. Следовательно, здесь единственной ситуацией равновесия оказывается ситуа- ция (0, 0), в которой каждый из игроков выбирает свою 2-ю чистую стратегию и выигрывает единицу. Вместе с тем очевидно, что если игроки договариваются и вы- бирают свои первые чистые стратегии, то в ситуации ,(1, 1) каждый из них выигрывает по пять единиц. Од- нако ясно, что ситуация (1, 1), которая может сложиться
ГЛАВА 9. ОСНОВЫ ТЕОРИИ 267 при возможности кооперирования, является весьма неус- тойчивой, так как каждый игрок, изменяя в ней произ- вольным образом свою стратегию, увеличивает свой вы- игрыш. Итак, при возможности кооперирования возникает противоречие между устойчивостью ситуации, выражае- мой, в виде равновесности, и ее целесообразностью—~ стремлением ~ игроков к большим выигрышам. Это противоречие может разрешаться путем расширения мно- жеств уже имеющихся стратегий на основе тех или иных соглашений между игроками. В частности, игроки могут выбирать свои стратегии совместно, договариваясь между собой. В результате множество ситуаций в смешанных стратегиях будет множеством всех’ вероятностных мер на множестве, всех ситуаций в чистых стратегиях. Напом- ним, что при отсутствии соглашений между игроками множество ситуаций в смешанных стратегиях являлось произведением вероятностных мер, заданных на чистых стратегиях каждого из игроков. Обозначим через U множество всевозможных векторов выигрышей игроков в игре п лиц при применении ими всех смешанных стратегий, заданных на множестве всех ситуаций в чистых стратегиях. Множество U содержится в евклидовом пространстве Rnfn является выпуклым, так как в рассматриваемом случае функция выигрыша каж- дого из игроков является линейной функцией относи- тельно совместной стратегии игроков; а множество их стратегий является выпуклым. Если предположить не- прерывность функции выигрыша на. множестве всех ситуаций в чистых стратегиях и компактность этого мно- жества, то множество всех выигрышей будет также, замк- нуто и ограничено, а поэтому компактно. Таким образом, при возможности кооперирования и некоторых предполо- жениях о первоначальйой бескоалиционной игре, игроки ; имеют перед собой некоторое замкнутое ограниченное й выпуклое подмножество U <= Rn. Это множество называ- ется допустимым множеством. Действуя совместно, игро- ки могут получить в качестве вектора выигрышей любой вектор и е U. . * ' • Пусть Щ, —/Значение антагонистической игры, в кото- рой все игроки играют против игрока &, т. е. стараются минимизировать его выигрыш, не обращая внимание на
(“1, «2» • • •> «п) €= u*i можно интёр- том случае, когда и* называют точ- множества игро- 268 ЧАСТЬ V. КООПЕРАТИВНЫЕ 1 свои интересы. Обозначим через и* = е Rn вектор, компоненты которого претировать как выигрыши игроков в они не придут к соглашению. Вектор кой status quo. Тройку Г = </, U* и*>, где U<= Rn, <=Rn, / = {1, 2, ..., п} ков, будем называть арбитражной схем Очевидно, игроки (или арбитр) да ваться некоторыми объективными представлениями о «справедливости» (принципом оптимальности). 2,Принцип оптимальности Нэша для общих арбит- ражных схем. Сформулируем для арбитражных схем а к- сиомы, которым. должно удовлетворять правило <р, со- поставляющее каждому выпуклому замкнутому подмно- жеству U и точке и* точку и е U. 1. Реализуемость: . и^и. / , - 2. Индивидуальная рациональность: и^и*. 3. Оптимальность по Нарето: если u^U и и^ и* то и = и. 4 4. Независимость от посторонних альтернатив: если u^V^U и п = ф(С7, и*), то и = ф(У, и*). 5. Линейность: если множество U' = dU + £> получа- ется из U с помощью линейного преобразования* т. е. и' = а^+^ (l^f .< n), а ф(С7, u*)=u, то ф(С7', + + р) = аи + р. ' 6. Симметрия: пусть л — произвольная перестановка игроков*, для которой из u^U следует nu^JJ. Пусть также ли* = п*, ф(С7, w*k=u. Тогда ли = и." Первые три аксиомы несомненно разумны, и коммен- тарии излишни. Аксиомад4 означает, что, имея большие возможности для выбора и* игроки согласятся на этот же. вектор выигрышей при меньших возможностях, если: этот вектор допустий. Аксиома линейности утверждает, что в разных шкалах измерения полезностей игроки ру-
ГЛАВА 9. ОСНОВЫ ТЕОРИИ 269 ководствуются одинаковым принципом оптимальности при выборе и. Шестая аксиома * (иногда называемая ак- сиомой анонимности) постулирует равноправие игроков^ Далее для простоты будем считать, что в множестве U существует, вектор и, каждая i-я координата которого строго больше и с. Противный случай тривиален. Оказы- вается, имеет место следующая замечательная теорема. Теорема 9.1, Существует единственная функция ф([7, и*) = и, определенная для всех арбитражных схем <7, U\ и*> и удовлетворяющая аксиомам 1—6. Эта функ- ция определяемся следующий образом: Ф (£7, и*) = {и | max g (и, U, и*) = g (u, U, w*)}, (9.1) и>и* UGU где 4 * _п_ ' ё(и,и,и^ = Л(щ-и:). (9.2) 1=1 Доказательство. Докажем существование функ- ции ф(?7, и*). Покажем, что определение корректно. Дей- ' ствительно, максимум ф(С7, it*) на множестве U достига- ется в тех и только в тех точках, в которых достигается максимум функции lng(u, U, и*), так как функция 1пх монотонно. возрастает (прй наших предположениях мак- симум положителен, и максимизировать lng(u, С7, и*) можно лишь по тем точкам, где она определена). Кроме того, функция lng(w_, U, й*) строго вогнута в силу стро- гой вогнутости функции ln(u{ — Uf). Но, как известно, максимум строго вогнутой функции на выпуклом множе- стве достигается не более чем в одной точке. С другой стороны, он достигается, так как функция g(u, U, и*) непрерывна й определена на ограниченном замкнутом' подмножестве К”. Очевидно, чточфункция ф(С/, и*) удовлетворяет аксио- мам 1 и 2 по построению. Справедливость аксиомы 3 еле-, /^ует из того; что функция g(u, U, и*) возрастает при возрастании каждого из сомножителей щ —, Аксио- ма 4 следует вз' того' очевидного факта, что максимум функции по объемлющему множеству не превосходит ее
270 ЧАСТЬ V. КООПЕРАТИВНЫЕ ИГРЫ максимума по объемлемому. Далее, если U' — aU + то g {и', U’, аи* 4- Р) = g (аи + Р — au* — р, U, и*) = п = g(u, и, в*)П«ь 1=1 В силу последних равенств справедлива аксиома 5. Наконец, аксиома 6 следует из инвариантности функции g(u, £7, и*) относительно перестановки сомножителей. Та- ким образом, существование функции ср доказано. Докажем единственность. Положим П h (и) = 2 * ~г» « = <р (U, и*). ui~ui ' . . Докажем, что для всех и е U имеет место неравенство , fe(u) Ми), и е= U. ' (9.3) Предположим противное, т. е. предположим, что Ми) > >Ми) для некоторого и е £7. Пусть 0 < s < 1. Тогда в силу выпуклости U точка ‘ и' = 8U-р (1 — в)и = U + 8(и — и) принадлежит U, Так как h(u) >h(u), вследствие линей- ности функции Л получим h(.u — и) > 0. Но ' п g (и', и, и*) = П — и* + 8 (и{ — й,))= 1=1 = g(u) + 8Й (U — U) g (U)-j-О (8), где через о(вУ обозначена величина, быстрее стремящая7 ся к нулю, чем 8. Первые, два‘слагаемых положительны. Следовательно, при достаточно малом 8 справедливо не7 равенство g(u', U, и*) >g(u, U, и*). Последнее неравен- ство противоречит определению точки и^фСС/, и*). Это противоречие доказывает справедливость неравенств (9.3).' Положим L = {u|Mu) Ми)}. Из неравенств^ (9.3) следует включение U с L. Пусть
ГЛАВА 9. ОСНОВЫ ТЕОРИИ , 2/1 множество Т получается из. множества L путем линейно- го преобразования . ч * t и> — и. щ = г = 1,2, (9.4> ui “ ui Очевидно, что Т = \и‘ п 1 а, кроме того, точка и* при преобразовании (9.4) перехо- дит в 0. Множество Т симметрично, поэтому вследствие ак- сиомы 6 вектор ф(Т, 0) должен - лежать на л прямой щ = и{ U = 1, 2, ..п). Из аксиомы 3 получим ф(7\ 0)= = (1, 1, ..., 1). Применяя преобразование (9.4), в силу аксиомы 5 получим ' Ф(L, и*) = и. ~ • Наконец, так как и е U\ из аксиомы 4 следует, что ф(С7, и*) = и. Теорема доказана. > Распределение выигрышей, согласно функции ф((7, и* У имеет ряд существенных недостатков/ Основной из них состоит в следующем. Пусть имеется некоторое конечное множество игроков I == (1, 2, ..., п). Любое его подмножество S 1, вклю- чая само множество I и одноэлементные подмножества Ш, а также пустое множество 0 называется коалицией. Может сложиться такое положение дел, когда некоторая коалиция S I обеспечивает для всех игроков выигрыши строго большие, чем'ф/5, и*). В этом случае игроки коо- перативной игры, вступая в соглашения друг с другом, не будут согласны с распределением выигрышей ф (5, и*). Поэтому решение о распределении согласно вектору ф(5, и*) может быть лишь принято некоторым третьим лицом — арбитром. Это решение оптимально, в* смысле аксиом 1—6 и носит обязательный характер. Отсюда бе- рул свое название «арбитражные схемы».
272 ЧАСТЬ V, КООПЕРАТИВНЫЕ ИГРЫ § 9.2. Классические кооперативные игры 1. Природа и структура кооперативных игр п лиц. Пусть условия неантагонистического конфликта таковы, что допускается заключение взаимообязывающих согла- шений о стратегиях, а выигрыши могут перераспреде- ляться между игроками. Тогда достаточно рассматри- вать только суммарный выигрыш игроков, образующих коалицию, причем масштабы функций полезностей игро- ков могут быть выбраны так, чтоПюлезности для любых двух игроков передаются без их численного изменения. В этом случае силу коалиции S полностью характеризует число v(S'), которое определим следующим образом. Объединение игроков из S означает превращение их в единого игрока, I, стратегией которого являются всевоз- можные совместные действия составляющих его игроков из S', а выигрышем — сумма выигрышей ^игроков i^S. В худшем для объединенного игрока I случае игреки из l\S могут также объединиться в некоторого коллектив- ного игрока II с интересами, диаметрально противопо- ложными интересами игрока I. В результате коалиция S (как игрок I) может себе гарантировать выигрыш p(S), равный значению возникающей антагонистической игры. Иными словами v(S) — гарантированное математическое ожидание выигрыша игроков коалиции S, действующих совместно против объединенных игроков коалиции I\S. Мы будем предполагать, что значение v(S) существует для любой коалиции S I, Определение 9.1. Кооперативной игрой п лиц называется пара (7, р), где 7 = {1, 2, ..., n}, a .vW) = 0)— функция, определенная на всех подмножествах S <= czZ* Функция v называется характеристической функ- цией. Таким образом, v кооперативную игру п лиц можно анализировать с помощью характеристической функции, область определения которой состоит из 2п возможных подмножеств мнджества I. Если для всех непересекаю- щихся подмножеств S и Т (S,.T <=: I и S'П Т ~= 0) выпол- няется неравенство v(S) + р(П < v(S U Т), (9.5);
ГЛАВА 9. ОСНОВЫ ТЕОРИИ 273 то характеристическая функция называется суперадди- щвной. Это свойство содержательно выражает то обстоя- тельство, что объединение игроков в коалиции является целесообразным с точки зрения увеличения выигрыша, т. е. условие (9.5) отражает разумность коллективист- ской точки зрения. Далее будем рассматривать игры, для которых выполняется условие (9.5). Методом математической индукции из неравенства (9.5) нетрудно получить следующее неравенство: ь " / ь \ 2р(5ч)<р U Si , ’ i==l \ i=l • / где Si — непересекающиеся коалиции. Следовательно, 2v({0)<p(i). (9.6) iei В дальнейшем величина v({i)) будет обозначаться че- рез v(i). ' Определение 9.2. Игра (7, v) называется суще- ственной, если _ • (9.7) iel В противном случае игра (7, v) называется несущест- венной. ’ ’ Обозначим через х* сумму, ' которую получит игрок i^I при распределении полезности, имеющейся в рас- поряжении множества игроков 7, и дадим следующее определение. Определение 9.3. Дележом называется вектор х = (xi, х2, ..., хп), удовлетворяющий условиям Xi > v(i) для всех ъ е= 7, 4 (9.8) 2^i = i>(/). (9.9>. Условие (9.8) называется условием индивидуальной рациональности и характеризует предположение, что, участвуя в коалиции, каждый игрок получает по мень- шей мере столько, сколько он мог бы' получить, действуя самостоятельно и не заботясь о согласии каких-либо дру- гих игроков. В противном случае он в распределении х будет получать меньше, чем p(i), и тем самым это рас- Г. Д. Дюбиц, р. Г. Суздале _
274 . ЧАСТЬ V. КООПЕРАТИВНЫЕ ИГРЫ пределение не будет реализовано. Вполне обосновано также условие (9.9), так как в случае 3 a?i<v(Z) ' * - существует распределение х\ при котором каждый игрок 1^1 получит больше, чем его доля х»-. Если же >?(/). iGl то игроку из I делят между собой нереализуемую полез- ность, и поэтому вектор х неосуществим. Следовательно, вектор х может считаться допустимым только при вы- полнении условия (9.9), которое -называется условием коллективной Хшт групповой) рациональности. ' На основании условий (9.8), (9.9) для того чтобы вектор х = (xi, х2, ..., хп) был дележом в кооперативной игре (7, v)i необходимо и достаточно выполнение равен- ства Xi = v{i) Z, причем " \ S at = p(Z) — S v(0- isi 1 tex " В дальнейшем для любого дележа х через x(S) мы будем обозначать величину 2 >,а множество всех де- ies ' лежей через Н. Таким образом, исходом кооперативной игры являет- ся дележ, который возникает в результате соглашений игроков. Поэтому в кооперативных играх сравниваются по предпочтительности нс ситуации, а делёжи и это срав- нение, имея сложный характер, исходят из различных представлений об оптимальности для этих классов игр. В результате принципы оптимальности для кооператив- ных игр оказываются весьма разнообразными. 2. Доминирование дележей. Проблема анализа коопе- ративной игры состоит в том, чтобы определить дележ, который является результатом игры. Она тривиально разрешима для несущественной игры, так как в этом
ГЛАВА 9. ОСНОВЫ ТЕОРИИ * 275 случае f <GI и условия (9.8), (9.9) выполняются только при x< = v(i). Следовательно; несущественная игра имеет единственный дележ (9.10) х = (р(1), v(2), .. .,>v(n)). Во всякой существенной игре с более чем одним иг- роком множество дележей бесконечно. Поэтому будем анализировать такие игры при помощи отношения доми-, пирования. Определение 9.4. Дележ х доминирует дележ у по коалиции S (обозначается х>-у\ если я Xi> уi для всех i е 5, f x(S)<v(S). Первое условие определения (9.10) означает, что де- леж х лучше делеща у для всех членов коалиции S, а вто- рое отражает реализуемость дележа коалицией S (т. е. коалиция S на самом' деле может предложить каждому из игроков i е I величину #$). Определение 9.5. Дележ х доминирует дележ у, если существует коалиция S, для которой х у. 8 Доминирование дележа у. дележом х обозначается как х>у. ' ’ 7 Доминирование невозможно по одноэлементной коали- ции и множеству всех игроков I. Действительно, из х>~ у следовало бы у{ < Xi v(0, что противоречит условию (9.8). • А из х> уz следовало бы для всех i Z, и.по- t ; тому 2 xi >2 Vi = СО, что противоречит условию i&I iGl _ - ' (9.9). ' . 3. Эквивалентность кооперативных игр. Объединение -Кооперативных, игр в те или иные классы существенно упрощает их последующее рассмотрение. В качестве та- ких классов можно взять классы эквивалентных игр. 18* • -
276 часть v. ноойеиатйвйые игры Определение 9.6. Кооперативная игра (Z, v) на- зывается эквивалентной игре (Z, и'), если существуют по- ложительное число к и п таких произвольных веществен- ных чисел Ci что для любой коалиции S^I вы- полняется равенство v,(S) = kv(S)+ 2 ci. , (9.11) iGS - Интересно сравнить ото определение с определением стратегической эквивалентности бескоалиционных игр. В последнем случае было больше произвольных парамет- ров. Это связано с тем, что в теории бескоалиционных игр полезности игроков могут иметь разные шкалы, а в кооперативных играх все игроки измеряют полезности в одной шкале. Эквивалентность игры (Z, v) и (Z, v') будем обозна- чать как (Z, р) ~ (Z, v') или v ~ v'. Очевидно, что v ~ v. Чтобы убедиться в этом, доста- точно положить в формуле (9.11) с$ = 0, к = 1, v' = v. Только что доказанное свойство называется рефлексивно- стью. Докажем симметрию отношения, т. е. что из усло- вия v ~ vf следует v' ~ и. Действительно, полагая к' = 1/кп с',= с ilk, получим i(=S т. е. v' v. Наконец, если и ~ v' и v'~v", то v ~ и". Это свойство называется транзитивностью. Оно проверя- ется последовательным применением формулы (9.11). В силу того, что отношение эквивалентности рефлексив- но, симметрично и транзитивно, оно разбивает множество всех игр на классы эквивалентных игр. Теорема 9.2. Если две игры v и v' эквивалентны, то отображение х -*• х', где \ Xi = kxi + Ci, is I, устанавливает такое взаимно однозначное отображение
fftifeA 9. ОСЙОВЫ ТЕОРИЙ 1 277 множества всех дележей игры v на множество дележей игры v\ что из х^у следует х9 >у'. s s Доказательство. Проверим, что х' является де- лежом. Действительно, х\ == кх\ -|- c^kv{Q + с^ v9{Q, 2®i = S (A«i + ci) = b(/) + 2 Ci = i>'CO- i€=I id Следовательно, для дележа x’ условия определения (9.4) выполнены. Далее, если х у, то ' s xl>yi, it=S, . • S *«<?(£)• i^S Поэтому = kXi + Ci > kyt 4- Ci = y\ (k > 0!), 2 x'. — к 2 + 2 ct kv (5) + 2 Ci — V (5), isS iel tel isl т. e. - 8 . . 1 Взаимная однозначность отображения легко следует из существования обратного отображения. Это отображе- ние уже нами использовалось при доказательстве сим- метрии отношения эквивалентности. Теорема доказана. 4. Нормализация игр (0 — 1-редуцированная форма). После разбиения множества кооперативных ^irp на по- парно непересекающиеся классы эквивалентности возни-' кает задача выбора по одному представителю от каждо- го класса. С этой целью дадим следующее определение и затем докажем соответствующую теорему. Определение 9.7. Игра и называется игрой в 0—[-редуцированной форме, если v{i) = 0 для всех i е Z, р(7) = 1. Теорема 9.3. Каждая существенная кооперативная игра эквивалентна некоторой игре в 0—[-редуцирован- ной форме. ' .
278 ' Часть v. кооперативные игры Доказательство. Пусть . к =------1—------->0, р (?) _ 2 f (о ' i<=l ~ ' ________у (i)_____ 1 v(I) — V (i)\ . a I ’ Г v' (S) = kv (5) + 5 Ci. iSS Тогда .. .. v' (i) = 0, IT. 1,(0 ' v' (I) =-----ЯНЬ-----------1SL—---------- 1. » w — 2v co j> (/) — 2p (o • iei ie/ Теорема доказана.. Замечание. Из теорем 9.2. и 9.3 следует, что все явления, описываемые в терминах доминирования, для существенных игр можно изучать на играх в 0—1-реду- цированной форме. Нетрудно Показать, что если v — ха- рактеристическая функция произвольной существенной игры, то • »(•$)- 2р<о Г / г\ Т'н ' <9Л2) • - • v (/) — 2 pJ») ч iei есть 0—1-нормализация, соответствующая функции V. При это.м дележом оказывается любой вектор х = (х4, ^2, ..^п), компоненты которого удовлетворяют усло- виям *. ’ = (9.13) iei т. e. дележи можно рассматривать как точки (п —D-мер- ного симплекса, (см. рис. 1.1), описываемые их барицен- трическими координатами. " ' '
ГЛАВА 9. ОСНОВЫ ТЕОРИИ 279 5. с-ядро. Очевидно, что если игроки коооперативной игры (Z, г) придут к такому -соглашению о ~ распределе- нии выигрыша всей коалиции S (дележу я*), при кото- ром ни один из дележей не доминирует дележ х*, то такое распределение будет устойчивым (ни одной из коа- лиций S будет невыгодно отделиться от другдх игроков и распределять между членами S выигрыш v(S)). Это за- мечание наводит на мысль о важности множества недо- минируемых дележей. ’ Определение 9.8. Множество недоминируемых дележей кооперативной игры называется ее с-ядром^ с-ядра кооперативной игры полностью описываются следующей теоремой. Теорема 9?4. Для того чтобы дележ х принадле* жал с-ядру, необходимо и достаточно выполнение не- равенств . * v(S) x(S) для любого S cz I, (9.14) Доказате льство. Для несущественных игр теоре^ ма очевидна, а в силу замечания к теореме 9.3 достаточ- но ее доказать для игр в 0—1-редуцированной форме. Пусть у > х. Тогда в силу определения 9.4 справедли- S ' " вы неравенства x(SXy(SXv(S), \ - которые противоречат неравенствам (9.14). Достаточ- ность условий (9.14) доказана. Далее для любого дележа х, лежащего вне с-ядра, су- ществует коалиция 5, для которой x(S) < v(5). Положим ieS, yi=* И-LSI’ . Легко видеть, что у(Г) = 1, yf > 0 и у>-«. Из этого сле- 8 дует необходимость. • , . , Jia теоремы 9.4 следует, что с-ядро является замкну- тым выпуклым (возможно пустым) подмножеством мно- жества всех дележей.
280 ЧАСТЬ V. КООПЕРАТИВНЫЕ ИГРЫ 6. Решение по Нейману — Моргенштерну (Н — М-ре- шение). Было бы идеальным найти такое распределение выигрышей между игроками, которое бы находилось в с-ядре и доминировало все остальные дележи. Однако это возможно только для несущественных игр, в которых множество дележрй одноэлементно. Нейман и Морген- штерн предложили искать решения в виде подмно- жеств множества дележей, которые в некотором смысле выполняют роль этого идеального дележа, о котором только что говорилось. А именно, элементы искомого подмножества должны доминировать любые дележи, ле- жащие вне него (внешняя устойчивость), и не доминиро- вать друг друга (внутренняя устойчивость). Формально это приводит к следующему определению. Определение 9.9. Подмножество дележей R коо- перативной игры (Z, и) называется Н-М-рещением, если 1) изх>^ следует, что либо либо у ФR\ 2) для любого x&R существует такой y^R, что у>я. ' Мы не видим прямых возможностей применения по- нятия Н — М-решения на практике. Оно несет скорее философский, нежели практический смысл. Например^ Н. Н. Воробьев интерпретирует понятие Н — М-решёния как «представление о такой системе норм поведения, что последствия двух допустимых этими нормами поведений не могут быт? противопоставлены какой-либо обществен- ной силой (коалицией) друг- другу, а каково бы ни было отклонение от допустимых поведений, в обществе (т. е. в множестве всех игроков I) найдутся такие силы (т. е. некоторая коалиция), которые будут стремиться к вос- V становлению нормы» [17]. Между с-ядродо кооперативной игры и ее Н — М-решением имеется известная связь. Например, если с-ядро непусто и Н — M-решение сущест- вует, то оно содеря^ит с-ядро. Теорема 9.5. Если для характеристической функ- ции игры в (0, \.)-редуциррванной форме (I, р), IZI = п выполняются неравенства п__|5| + 1» где ISI — число игроков в коалиции S, то с-ядро этой игры непусто и является ее Н — М-решением.
ГЛАВА 9, ОСНОВЫ (ГЙОРЙГГ ‘ 281 Доказательство. Возьмем произвольный дележ, лежащий вне с-ядра. Пусть {<$} — множество коалиций, по которым можно доминировать ж, т. е. это те и только те коалиции 5, для которых x(S) < v(S). Множество {5} частично упорядочено по включению, т. е. St^So, если St 8г. Возьмем в нем какой-нибудь минимальный Эле- мент SB, который очевидно существует. Пусть к — число игроков в коалиции So. Очевидно, 2 к < п — 1. Постро- им дележ следующим образом: + 0\ при i <= So, I nD„ £et с п-к Лри 1^до- , . Как легко видеть, у(.За) = v(50), yi>xt (i^iSo). Поэтому у доминирует х по коалиций So. Докажем, что у содер- жится в с-ядре. Для этого достаточно показать, что •> y(St) > vG$) при произвольном S. Пусть сначала ,|S| к. Заметим теперь, что у не доминируется по Sa,< так как у(Sa) — v(So) и не может доминироваться ни по какой коалиции S<=S0, так как (1е<90), a So — мини- мальная коалиция, по которой можно доминировать х. Если же хоть один игрок из S не содержался в So, то п°) > п_А+1 > п_|5| + 1 >^(<5)- Таким образом, у не доминируется. ни по какой коали- ции, содержащей не болёе к игроков. Пусть теперь |5| > к. Если S > 50, то Если же S не Содержит So, то число игроков, не содер жаГцихся в So, не меньше |5| — к + 1, а поэтому '----7Г=Гк------"> и-Г+_1->
282 ЧАСТЬ V, КООПЕРАТИВНЫЕ ИГРЫ f Таким образом, мы убедились, что у не доминирует- ся"ни по какой коалиции^. Следовательно, у содержится в с-ядре, так как у доминирует х, теорема доказана. Заметим теперь, что если . . г(|5|)>-----1 , . при |5| = тп, М I/ п — т 1 I J ’ О при |.5|^пг, х = , 1 . 1 . то легко видеть, что дележ х = (-------, ...,--------г-г, in — т -j- 1 7 n *— тп -j- 1 О, 1. .,0 , лежащий вне с-ядра, не может доминировать- / ся никаким дележом у из с-ядра. Этот пример показы- вает, что если v(S) оценивать некоторой функцией г(|5|), то нельзя усилить ли одно из неравенств, приведенных в теореме, чтобы утверждение теоремы оказалось верным. • 7. Вектор Шепли. В предыдущем пункте мы рассмат- ривали решения (с-ядро, Н — М-решение), которые связа- ны с устойчивостью поведения, игроков. Здесь мы займем- ся нахождением таких решений/ которые, вообще говоря/ определяются некоторым третьим лицом — арбитром— согласно определенным понятиям «разумностц» или «спра- ведливости». С аналогичным подходом мы уже сталкива- лись при рассмотрении арбитражных схем. Теперь опре- делим один из «справедливых» дележей. Поставим в соответствие каждой кооперативной игре (7, и) вектор Ф(р) = (Ф4(v), <.., Фп(у)), компоненты кото- рого будем интерпретировать как полезности, получаемые игроками в результате соглашения или решения ар- битра. Будем считать, что наши соображения о справедли- вом дележе воплощены в следующих четырех аксиомах, впервые в несколько иной, но равносильной форме сфор- мулированных Шепли в 1953 г. 1. Симметрия: пусть л — произвольная перестановка игроков, причем v(S) = р(л(5)). Тогда ~ ' Фг(^) = ФЯ(4)(Р), где через л(0 обозначен образ игрока i при переста- новке л.
ГЛАВА 9. ОСНОВЫ ТЕОРИИ 283 2. Оптимальность по Парето: 2ф<(р) = р(/). iei . * 3. Эффективность: если для любой коалиции S cz I выполняется равенство v(S U Ы) = р(5), то ' ФДР) = о. 4. Агрегация: если характеристическая функция w игры (Z, ш) равна сумме характеристических функций и и и соответственно игр (Z, v) и (Z, и)_, т.- е. для любой I коалиции S cz I справедливо равенство = vCS) + uCS), I то * • , ’ х . j Ф<(ш) = Ф»(р + и) = Ф,( р) + Ф/и), 1^1. Первые три аксиомы не вызывают возражений и, по- видимому, должны выполняться при любом определении «справедливого» дележа. Последняя аксиома ~ не совсем естественна, так как предполагается, что при участии иг- - роков в двух играх (сложение характеристических функ- ций можно понимать как участие игроков I в двух иг- рах) их выигрыши в отдельных играх должны склады- ваться. В реаультате вектор Ф(р) для некоторых игр ' приобретает ряд нежелательных свойств. Например, он ' не всегда содержится в с-ядре, даже когда оно непусто. Однако довольно часто дележ согласно вектору Ф(р) вполне удовлетворителен. Система, состоящая из акси- ом,!—4, является непротиворечивой и полной. О п р.е д е л е н-и ё 9.10. Пусть Ф — функция, ставя- щая в соответствие согласно аксиомам 1—4 каждой игре (Z, v) вектор Ф(р). Тогда Ф(р) называется вектором Шеп- ли игры (Z, v). Оказывается функция, для которой выполняются ак- сиомы 1-^4, существует и единственна. Для каждой ха- рактеристической функции v вектор Ф(ц) является деле- жом. Но прежде чем это доказывать, выясним, что нам дают три первые аксиомы. Определение 9.11. Характеристическая функция Vs кооперативной игры называется простейшей, если она >Для любого Т определяется равенством {1< если Т о S, , Я5’
284 ЧАСТЬ V< КООПЕРАТИВНЫЕ ИГРЫ Легко проверить, что функция ря(Г), как и функция cvs(T) (с>0) действительно является характеристиче- ской, т. е. для нее выполняются неравенства (9.5). Из аксиомы 3 следует, что Ф<(с1>я) = 0 (i&S). Функ- ция cv8 симметрична относительно всех перестановок иг- роков, входящих в коалицию 5. Поэтому согласно первой аксиоме все компоненты вектора Шепли, соответствую- щие' игрокам коалиции S, равны между собой. Наконец,’ применяя аксиому 2, получим фг М-уур i^S. (9.16) Следовательно, первые три аксиомы определяют вектор Шепли для простейших характеристических функций. Л^рбая характеристическая функция является элемен- том (2П — 1)-мерного пространства: каждой непустой коа- лиции Т <= S соответствует координатная ось, а координата вектора на этой оси равна v(T). Эти векторы мы будем обозначать, как и функции, через v. Очевидно, простей- шим характеристическим функциям соответствуют век- торы, координаты которых равны либо нулю, либо еди- нице. . Докажем, что простейшие ’ характеристические функ- ции (или, что тоже самое, векторы им соответствующие) линейно независимы. Действительно, если S ^svs (Т) = h'svs (Т) для всех Тс/, SCI то для Т = {i) будем иметь (0 = (О- Так в этом случае/Ря(г) = 0, при S {0. Поэтому = Далее будем доказывать методом индукции. Пусть для всех R<=S (R^S) имеем = Хд. Тогда для I’ = S все слагаемые, соответствующие R^T (R^ S) по предположению будут равны между собой, все ела-, гаемые, соответствующие R<£S, будут равны нулю. Сле- довательно, %aVs(S) = V^sCS), откуда’ Таким образом, мы имеем 2П —4 независимых векто- ров в (2П — D-мерном пространстве. Поэтому любой век- тор, а значит, и любая характеристическая функция,
ГЛАВА 9. ОСНОВЫ ТЕОРИИ 285 выражаются через линейную комбинацию этих векторов: y = 2w (9.17) SCI Откуда у = V* + V", где через У обозначена сумма по тем S, для которых с8 < 0. Заметим, что v+ является характеристической функцией как сумма характеристических функций. Это - -нетрудно проверить. Аналогично является характе- ристической функцией. Поэтому, если функция Ф удов- летворяет аксиоме *4, то ф.(у+) = ф.(у+ + (-у-)) = ф.(у) + фД-v-), iej, или ФДР) = Ф;(1?+) ~ Ф4(-Р-),. I €= I. Снова используя аксиому 4, из предыдущего равен- ства получим Ф,- (у) = 3 (i>s), I- (9.18) SCI В CHjjy независимости v8 представление (9.17) единствен- но и, следовательно, однозначно определено представле- ние (9.18). Таким образом, мы показали, что если функ- ция Шепли существует, то она единственна. Теорема 9.6. Существует единственная функция Ф., удовлетворяющая аксиомам 1—4. При каждой v образ Ф(р) является дележом кооперативной игры (J, v). Доказательство. Принимая во внимание /изло- - женное, для доказательства теоремы достаточно доказать существование функции Ф. Пусть Ф(р) определяется равенствами = (9.19). л < где $&<>₽= {*!«(*)< «О»» а суммирование производится .по всем перестановкам л множества игроков. Номер л(г) мо^но интерпретировать как. порядок при- . соединения игрока i к коалиции при порядку юпределяе*
286 , ЧАСТЬ V. КООПЕРАТИВНЫЕ ИГРЫ — ✓ мом перестановкой л. Коалиция считается‘сформирован- ной после того, как.к ней присоединяется, игрок i. Вели- чина V — V (<S«(i)\{0) . равна дополнительной по- лезности, которую привносит игрок I. Если считать, что все перестановки игроков, равновероятны, то _ФДь>) можно интерпретировать как априорную среднюю полез- ность игрока i. Функция Ф(р) по своему построению удовлетворяет аксиоме симметрии. ‘Покажем, что она удовлетворяет также второй аксиоме. Действительно, ес- ли коалиция S образовалась в результате присоединения игрока i, то л(0 = 151, а число перестановок, удовлетво- ряющих . условию л(0 = 151, равно (151 — 1)! (п — |5|)!. Поэтому v(S) ровно (5 —1)!(п —5)! раз входит в выра- жение (9.19) сд' знаком плюс. Это верно для каждого игрока i ^S. Отсюда в сумме" . 2 ф* (”) - ТГ 2 5 (v - v to)M0)) (9-20) iel in с положительным знаком <v(S) участвует ровно |5|!(п — — 151)! раз. С другой стороны; р(5) входит в выражение (9.19) с отрицательным знаком только тогда, когда л(0 = |5| + l.z Число таких перестановок равно 151 !(тг — 151 — 1)!. Так как число игроков, не содержащихся в 5, равно п— 151, то в выражение (9.20) число р(5) входит^ровно |5|!(п — — 151)! раз с отрицательным знаком. Таким образом, при врех 5 (151 ¥»п) коэффициент при v(5) в выражении (9.20) равен нулю. Знак при v{I) в выражении 49.20), очевид- но, всегда положительный, а число слагаемых равно (пре- дыдущее рассуждение проводилось для произвольного 5) ~л!. Поэтому 2ф«(0=у(/). 4 . {=i . • Следовательно, аксиома 2 .выполняется. Аксиома 3 оче- видна. Наконец, аксиома , 4 является следствием линейно- сти’функции ф/. Нам осталось “Показать, что .вектор. Ф(р) является .дележом. Это сразу следует. Пз, супераддитивно- стц функции п: каждое слагаемое* cToWtee. в скобках, в
ГЛАВА 9. ОСНОВЫ ТЕОРИИ 287 выражении (9.19), не меньше 1>{й, а таких слагаемых ров- но п!. Следовательно, Ф<(i?) > v({j}). Теорема доказана. Следствие; Компоненты* вектора Ф(р) определяют- ся равенствами ... ф< (р)=1/(| *1 ~ i)l^ ~15k (5) ~v (5МО)К i&T- «S3. (9.21) Доказательство. Действительно, как мы. видели при доказательстве теоремы, любая коалиция 5 ti^S) ровно (|5| — l)!(n — |5|)! раз входит с положительным знаком в выражение (9.19). Поэтдму коэффициент при v(5) равен (1ALzl12L^=1AI2!. Очевидно, что коэффици- ент при 1>(5\{Д) рйвен ——^р|”~ * так как каждому 5д(1) соответствует одно и только,одно 5"(i)\i- Из этого следует справедливость утверждения. 8. n-ядро. В .1969 г. Шмайдле'р определил понятие n-ядра. По его мнению распределение выигрыша х — — (xi, Хг, .... Хп) между игроками надо считать справед- ливым, если ж(5) «мало» отличается от у(5) для любой коалиции 5 с I = {1, 2, ..., п) в том случае, когда v(5) > x(S)t - _ О п р_е д е л ё н и е 9.12. Величина е(5, х) = у(5) - ®(5) ' . " (9.22) называется эксцессом. . Содержательно эксцесс можно трактовать как меру , неудовлетворенности игроков, входящих в коалицию 5, дележом, а:. - , ... Эксцесс определен -для любой непустой коалиции 5. Набор из 2” — 1 эксцессов-являе'тся мерой близости деле- жа х к характеристической функции v: каждому дележу х ставится в соответствие. (2” —"1)-мерный вектор е(а;) = (е(51, a:),....,e(52n._i, ®))= , < и' -••• 13m(•£))* т~2 —I, где 51 — коалиция, для. которой эксцесс максимален, Sz — коалиция, имеющая следующий по - величине
288 часть v. кооперативные игры эксцесс и т. д. Для вектора е выполняются неравенства, a (*5^, л?) а (*$2» 3'") • • • ^5* a (S2n_ц ж). На множестве всех дележей введем следующее отно- шение предпочтения. Пусть к — номер первой из координат вектора а(ж), которая отличается от соответствующей координаты век- тора е(у), т. е. е,(ж) = et(y), ..., ек-Дх) = eft_l(y), ек(х) ¥= ¥= ек(.у). Тогда ж>у, если ек(х) < ек(у). е Определение 9.13. Максимальный элемент отно- сительно предпочтения > называется п-ядром. — , е * Теорема 9.7. Для каждой кооперативной игры (I, v) существует единственное п-ядро. Доказательство. Нетрудно проверить, что каж- дая из функций е/ж), ег(х), ..., ет(ж) (т» = 2п —1) непре- рывна. Положим тп f (®) = 2 ak^k (®)» к=1 где положительные числа ак удовлетворяют неравенствам , m ' 2, 3, ..., k=i ’ Легко убедиться, что множество делещей, на которых достигается минимум функции Дж), совпадает с множест- вом максимальных элементов относительно упорядочива- ния >. Так как функция /(ж) непрерывна, а множество е дележей компактно, w-ядро существует. Докажем единственность. Предположим противное. Пусть ж и у — два максимальных элемента. Тогда, оче- видно, е(ж) — е{у). Пусть еДж) = е2(ж) = ... = еДж), е*+1(ж) < еДж), еДж) = vkSJ — ж^), ..., еА(ж) = v(Sk) — — ж(5А). Так как координаты векторов е(ж) и е(у) не воз- растают, а а(ж) е(у), выполняются неравенства р(5,) - уОД v(S4) - ж(54), / = 1, 2, ..., к. (9.23) Если для некоторого у» выполняется строгое неравенство, то при достаточно малом s выполняется соотношение z = (l — г)х + еу>х. (9.24)
. глава 9. обйовы Теорий 289 Действительно, в этом случае ' ’ v б^о) — z 04).< v (4) х •. Выбирая е достаточно малым, можно добиться того, что- бы ei(z) (Z>A) были меньше, чем у(4) —z(4). Это является следствием непрерывности функций ez(z). Таким образом, выполняется (9.24), что противоречит макси- мальности х. Следовательно, все неравенства (9.23) на самом деле являются равенствами. ‘ Мы доказали, что для коалиций S с максимальным для х эксцессом y(S)=x(S). • (9.25) / к Проведя аналогичное рассуждение для коалиций S со следующим по величине эксцессом, мы. убедимся в спра- ведливости равенства (9.25) также и для них. Продолжая по индукции, получим, что равенство (9.25) справедливо для всех коалиций S. Это означает, что х = у. Теорема доказана. Из определения n-ядра следует, что его можно найти последовательно, решая задачи линейного программиро- вания. На первом этапе будем искать минимум при yi — x(S), S<= I, 2 = v (/), i=l i = i, 2, n. Если {5{, —множество коалиций, для кото- рых первые ид неравенств являются равенствами при всех решениях предыдущей задачи линеййого прбграмми- рования, а значение минимума равно Ун то на втором этапе решаем задачу минимизации у2 при условиях У2^ и (^) — (^)» $ ^2» • • •» &ki Р x^Sj) = Уц / — 1, 2Х ..Л, 2 (-0» Xi > y(i), I = 1, 2, ..n. ~ ; 19 г. H. Дюбин, В, Г. Суздаль
290 Часть v. кооперативные игры На Л-м этапе решаем задачу'минимизации ук при усло- виях рл>р(5).— ж (5), »'($) — х ($) = У*ч t = 1» 2, ..., к — 1, S Xi = v(I), i=l i — 1,2, где — коалиции, на которых, достигается минимум, при всех решениях задачи линейного программирования, на этапе t, a yt —значение минимума. Как следует из теоремы 9.7, через конечное число шагов мы придем к задаче, которая имеет единственное решение, равное п-ядру. - _ ’ . - Предположим теперь, что с-ядро кооперативной игры (7, и) не пусто. Если у Не содержится, а х содержится в с-ядре, то очевидно, х > у, так как все координаты век- е тора е(х) неположительны, а вектор е(у) имеет по край- ней мере одну положительную координату. Поэтому тг- ядро всегда содержится в с-ядре, если последнее не пу- сто. В этом отношении п2ядро предпочтительнее вектора Шепли, который вообще говоря не содержится в с-ядре. § 9.3. Кооперативные игры с бесконечным числом игроков 1. Природа и структура кооперативных игр с беско- нечным числом игроков. Кооперативные игры с неболь- шим количеством игроков не могут служить адекватными моделями целого ряда экономических конфликтов, в ко- торых отдельный участник не влияет (или почти не вли- яет) на выигрыши других игроков, а значит, и на выиг- рыши соответствующих коалиций. Анализ таких кон- фликтов путем построения кооперативных игр с очень большим числом игроков часто затемняет их смысл, бла- годаря наличию несущественных . мелких, подробностей, мешающих видеть конфликт'в «чистом виде». Поэтому, как и в бескоалиционных играх^ часто за множество иг- роков принимают единичный интервал с заданной на нем мерой Лебега. •
ГЛАВА 9. ОСНОВЫ ТЕОРИИ «291 Определение 9.14. Кооперативной игрой с конти- нуумом игроков называется о-алгебра 0 Хмы будем счи- тать ее сигма-алгеброй борелевских подмножеств) сег- мента I = [0, 1] с заданной на ней мерой Лебега и ве- щественной функцией v, удовлетворяющей условиям v(A) + и(ВУ< v(A U В), А, В е= 0, А Л В = 0, v(0)=O. (9.26) 4 Для игр с континуумов игроков можно определить понятия дележа, доминирования, с-ядра, n-ядра, Н — М- решения и дележа Шепли. Например, дележом коопера- тивной игры с континуумом игроков будет счетно-адди- • тивная мера х (иногда допускаются конечно-аддитивные меры) на 0, для которой vXZ) = х(Г) и выполняются усло- вия индивидуальной рацйональности. Эти условия в этом случае не столь просты, как в конечных играх. Все эти множества не всегда существуют, а в тех случаях, когда они непусты, доказательства их существования гораздо сложнее, чем для конечных игр. Можно определить аналоги аксиом Шепли (см*. аксио- мы 1—4 из § 9.2) для игр'с бесконечным числом игро- ков. 'Например, аксиома симметрии будет иметь следую- щий вид: если Т, сохраняющее меру Лебега измери- мое преобразование отрезка [0, 1], a v(S) = v(T(SY) для. S <= [0, 1], то x*(S) = x*(T(SY), где мера х* соответствует понятию вектора Шепли для конечных игр. В бесконечных играх функция Шепли не всегда су- ществует. Мы ограничимся доказательством ее существо- вания для игр со счетным числом игроков, отослав заин- тересованного читателя к книге Аумана и Шепли [1], в которой проблема существования функции Шепли освя- щается во всей ее полноте. 2. Кооперативные игры со счетным числом игроков (дележ . Шепли). Обозначим через I — {1, 2, ..., п, ...} множество всех игроков и дадим следующие определения.* Определенна 9.15. Пара (Z, v) называете^ кооперативной игрой со счетным числом игроков, если и — функция, заданная на множестве S = 21 всех подмножеств 7и удовлетворяющая усло- виям ’ - и (Si) 4-р(^г) [J uS^), £], S2 €= = 0, ” 0(0) -0. , (9.27) Функция v называется характеристической, ' Л , 19* ..............
292 ЧАСТЬ V. КООПЕРАТИВНЫЕ ИГРЫ Определение 9.16. Дележом игры (Z, v) называется счет- . но-аддитивная мера х, заданная на or-алгебре всех подмножеств Z, для которой \r(Z) = p(Z)1 *({*}) = Xi > ^(Ю) = ”i- Таким образом, дележ представляется набором ч^сел Xi (i е Z, оо ' 2 Xi = U(TY)* i=-l Отождествим множество S =^2* с тихоновским произведением счетного числа компактов с дискретной топологией {0, 1} следую- щим образом: игрок i содержится в коалиции 5 G 5 в том и толь- ко в том случае, когда i-я координата S равна единице. Множество S является компактом. Каждый дележ х определя- ет функцию x(S) на 8. Легко проверить^ что эта функция непре- рывна, так как тихоновская топология на 5является топологией покоординатной сходимости и, следовательно, Iimz($n)= 2 xi = *(.S), Sn^S. if=S Далее мы будем рассматривать только непрерывные на. 5 ха- рактеристические функции. . “ Как и в конечном случае, для игр ср счетным множеством иг- роков стоит задача определения «справедливого» вектора выигры- шей игроков Ф(у) = (Ф^у), Ф2(р), ..., Фп(г^), ...). Аналоги ак- сиом Шепли для игр со счетным числом игроков будут иметь сле- дующий вид. 1. Симметрия-, если для любой перестановки л некоторого ко- нечного множества игроков £0 cz Z »($) = р (л (S)V S<=I, ТО ф{(у) j, 7’eSo.‘ 2. Оптимальность по Парето*. 3. Эффективность*, если для любой коалиции S справед- ливо равенство p(5u{0)==^(^+0 = ^W, то ' Ф<(г>) = 0. 4. Агрегация: если ю = г?+ и, то / Ф»(ю) «а ФДгл) + Ф»*(м), i е Z, где v и и— характеристические функции, a w(S) = v (S) + u(S) ДИЯ лрбой ъ/,
ГЛАВА 9. ОСНОВЫ ТЕОРИИ 293 5. Непрерывность-, пусть последовательность vn непрерывных характеристических функций равномерно на S сходится к харак- теристической функции v. Тогда Oi(i>n)ie7. Первые четыре аксиомы не требуют комментария, так как они мало чем отличаются от соответствующих аксиом для конечных игр. Пятая аксиома фактически означает, что если для любой коа- лиции характеристическая функция малга, то и выигрыш каждого игрока должен быть мал. Например, если характеристическая функция стремится к нулю, то и выигрыши игроков должны стре- миться к нулю. Это требование нам представляется естественным. Определение 9.17. Пусть Ф — функция, ставящая в соот- ветствие согласно аксиомам 1—5 каждой игре (7, v)’ вектор Ф(р). Тогда Ф(р) называется вектором Шепли кооперативной игры (7, v). On ределение 9.18. Игра (7, vs), где z ч fl, если Т зэ S, ° [0 в противном случае, называется простейшей, если S — конечное множество. Легко проверяется, что функция vs действительно является ха- рактеристической. Кроме того как нетрудно видеть она непрерыв- на на S. Эти утверждения верны также для функций cvB (с>0). Как и в конечном случае, на основании аксиом 1—3 легко убе- диться, что вектор Шепли Ф(су5) игры (7, cv8) будет определяться равенствами с ®i(cvs) = 151 ’ .0 если i е= 5, в противном случае. (9.28) Оказывается, в играх со счетным числом игроков значения векто- ра Шепли для функций v8 полностью определяют его значения для игр с непрерывными характеристическими функциями. Лемма 9.1. Пусть (7, v) — игра со счетным множеством иг- роков и непрерывной на S характеристической функцией v, а Im = {1? 2, ..., ш}. Тогда последовательность функций v m, где v w (S) = v (5 fi lm), равномерно на S сходится к .характеристи- ческой функции v. Функции v m являются непрерывными харак- теристическими функциями. ’ Доказательство. Последнее утверждение леммы прове- ряется непосредственно. Докажем равномерную сходимость. Пусть —- окрестность точки S, которая определяется тем, что первые к координат точек этой окрестности совпадают с соответствующими координатами точки S. Тогда в силу непрерыв- ности функции v и определения топологии тихоновского произве- дения для любой точки S е S существует такое к (S), что S'.y&Qlw (9-ЗЯ)
294 ЧАСТЬ Vt КООПЕРАТИВНЫЕ ИГРЫ . где в — любое наперед заданное положительное число/ Вследствие компактности множества S существует конечное покрытие S мно- жествами • • •» ^k(Si)* Очевидно, что для любой точки 5г- (f = 1, 2, ..I) выполняются неравенства (9.29) при S = Si. Положим к = max{fc(Si), к (St)}. Тогда из определения и неравенств (9.29) следует; что max|pIjv(S) — i>(S)|<8 для N>k. • Лемма доказана. v Пусть — тихоновское произведение счетного числа двоето- чий {0, 1}, соответствующих всем игрокам, кроме f, а Г —конечное подмножество Для каждого S cz Т определим множество это в точности те точки 5г, для, которых координаты, соответст- , вующие игрокам k^.S, равны единице, координаты, соответству- ющие игрокам / с: Г\5, равны нулю, а остальные принимают про- извольные значения. Такие множества «будем называть цилиндра- ми. Очевидно, U <$> = <$*. $$ = 0> S<ZT. Положим меру р? цилиндра S& равной ' Нетрудно убедиться, что таким образом* заданная на цилиндрах мера согласована. Для этого достаточно проверить, что / И+$) + н{ (5»+G}) = |Х* (sf), J * i, А Последнее равенство проверяется простым подсчетом. Кроме того, 8СГ Действительно, 2 I Л» (|Н-|5|)! V ^.|g|!(ir|-|g|)l (I т 1 + 1)1 . - Чт| (1П + 1)! SCT |8|=0 Г1 + 1 t • < - “ И14-1 ~1в , Таким, образом, для меры |л* выполнены все условия теоремы Колмогорова о продолжении вероятностной меры. Следовательно, существует единственное продолжение меры р/ на о-алгебру, по-
ГЛАВА 9. ОСНОВЫ ТЕОРИЙ 295 рождаемую конечными цилиндрами. Эту вероятностную меру мы _ будем также обозначать через рА ; Теорема 9.8. Если существует функция Ф, ставящая в соот- ветствие согласно аксиомам 1—5 каждой непрерывной функции v на S вектор Шепли Ф(г), то координаты Ф{ (и) однозначно опре- деляются равенствами ч Ф4 (”) = J (» (S 4- О - v (s)) (9.30) gi Доказательство. Пусть , ug — характеристические функции конечной игры тп лиц, образующих коалицию Ап, кото- рые определены следующим образом: pZ«»(r) = p(T), Tcla, . , v (77 I1’ еСЛИ TClm' SC=T’ 8 (О в противном случае. Тогда, как мы уже видели при доказательстве единственности век- тора Шепли для конечных игр, функция v m однозначным образом представляется в виде линейной комбинации функций va (Sczlm)- vIm = ^c8vs, . s<zln. . , ' (9.31) Из определения функции равенства (9.31) сл^Зует, что . Sclm. ' (9.32) Причем из единственности представления (9.31) следует единст- венность представления (9.32). ' _ Далее, из формулы (9.28) следует, что Фл(^в) = Фл(М> & е An,„ S cz Im. Следовательно, вследствие аксиомы 4 (доказательство аналогично доказательству для конечных игр) и представлений (9.31), (9.32) а(^)*ф*(М. ле./т. . (9.33) Но для конечной игры (см. формулу (9.21)) фк = 5 (pT« (s+к) - ($))• 8СГт k(£S ' ' . ‘ - (9.34) Правая часть равенства-(9.34), очевидно, равна J (S + к) - vm (S)) dg1, . - (9.35) .
296 ' ЧАСТЬ V. К00ПЕ1>АТЙЬЙЫЕ игры так кад по определению функций v т для Т с: Im справедливы равенства vIm (Т) = vm (Т), а на цилиндре ^fTO\как следствие определения функции vIm, справедливо соотношение к) _ /»• (5) =й (S П /т+1) - v (S П Теперь утверждение теоремы следует из аксиомы 5, включения к с при достаточно большом ш и равномерной сходимости функции v m к функции v (лемма 9.1). Теорема доказана. Заметим теперь, что J i>($ + »)d|? = j «’(S + W’, Uesc/n. (9:36) Действительно, при преобразовании л^ цилиндра» в ЦИ-. линдр которое меняет местами игроков i и /, оставляя ос- тальных игроков на своих местах, мера любого подмножества ци- линдра будет равна мере его образа при преобразовании ли, а значения подынтегральной функции не изменяются. Из этого следует, равенство (9.36). Подобные соображения приводят к ра- ,венству • j J v(S)d^, i, i \ j e In. (9.37) В силу формул (9.36) и (9.37) корректно определены следую- щие функции: ’>®“ ish<»-%’-17 J "'s‘1 *5’1 s Эти функции являются средними значениями функции v (S + i) п. v (5) на соответствующих цилиндрах и не зависят от i и /. Г
ГЛАВА 9, ОСНОВЫ ТЕОРИИ 297 Теорема 9.9. Для того чтобы игра (Z, у) с непрерывной ха- рактеристической функцией имела вектор Шепли, необходимо и достаточно выполнение следующего условия: Scin при п — со (S пробегает собственные подмножества множества Im). Это условие должно выполняться при любом упорядочении иг- роков» Доказательство. В силу теоремы 9.8 достаточно дока- зать, что вектор Ф(у), определенный согласно формулам (9.30), удовлетворяет аксиомам 1—5. Легко проверяется справедливость аксиом 1, 3—5. Проверим аксиому 2. Для этого рассмотрим сумму ф (п) = 2 Ф{ (г) - 2 [ (г ($ + i) - т ($)) dpi = 2 f V (S + i—1 »=1 _гп\{ + 0Ф*+2_\2 ' J vts + ijdp1- i=1S'Cln\i S' -2 2 f {=1scrn\i s Здесь коалиции S пробегают все подмножества множества In\i, a S' — только собственные подмножества. Используя формулы (9.36) и (9.37), получим где ig. с S, jg е S, a S пробегает все собственные подмножества 7п, или фО») - n J v (S 4-1) Ц(5)- f8(s)). 1ГП\1 s
I 298 ЧАСТЬ V« КООПЕРАТИВНЫЕ ИГРЫ Поскольку функция v непрерывна, а мера цилиндра равна 1/п, первое слагаемое стремится к р(7). Таким образом, Ф(п) ->i?(Z), причем ряд 2Фг(р) абсолютно сходится. Это является следствием того, что условие (9.38) спра- ведливо при любом упорядочении игроков. Следовательно, аксио- ма 2 выполняется. Из супераддитивности характеристической функ- ции й формул (9.30) следует справедливость неравенств ’»({0>. Таким образом, вектор Шепли является дележом. Теорема дока- зана. Гл.ава 10 - . 5 ПРИЛОЖЕНИЯ Кооперативные игры как модели неантагонистических конфликтов строятся в тех случаях, когда игрокам раз- решается образовывать коалиции. Кооперирование игро- ков обычно предполагает выбор совместной стратегии и Обмен информацией, а также включение всех соглашений в правила игры при условии, что переговоры не изменя- ют оценок игроками исходов игры. При возможности кооперирования участников неанта- гонистического конфликта теоретико-игровые принципы оптимальности в зависимости от конкретных условий связываются с устойчивостью поведения (с-ядро и Н — М- решение) или носят нормативный характер (арбитражные схемы, вектор Шепли и n-ядро). Поэтому выбор принци- па оптимальности при построении кооперативной игры определяется сущностью конфликта, причем следует учи- тывать такую отличительную особенность конфликта, как побочные платежи, если они допускаются. _________ Для кооперативных игр без побочных платежей- име- ют практическую значимость арбитражные схемы, кото- рые позволяют, анализировать задачи многокритериаль- ной оптимизации и находить так называемые векторные критерии. В этом случае кооперативная игра задается тройкой . . Г « </, U, ы*>, . у * * 1 где I — множество игроков, U — множество всевозмож- ных векторов выигрышей игроков, и* — вектор выигры- шей игроков, если игроки не вступили в соглашение»
ГЛАВА 10, ПРИЛОЖЕНИЯ * 7 299 Если природой конфликта допускаются побочные пла- тежи (в этом случае иногда говорят о трансферабельной . полезности), то полезности могут передаваться, например, продукты или деньги (или сырье), а игроки образовыва- ют коалиции с учетом трансферабельной полезности. Воз- можность побочных -платежей приводит к представлению кооперативной игры в виде тройки Г=</, г, Я>, где I — множество игроков, Н — множество дележей, v — характеристическая- функция, которая указывает, ка- - кой ч максимальный выигрыш может гарантировать себе каждая из 2п—1 коалиции. Для нахождения устойчивых решений кооперативных *игр с побочными платежами, к • которым приводят моделируемые конфликты, использу- ются с-ядра и Н - М-решения: В общем случае с-ядро состоит^ из большого (даже бесконечного) числа дележей, каждый из которых, буду- чи устойчивым в отдельности, может, быть выбран с уче^ том конкретных обстоятельств конфликта. Можно счи- тать, что с-ядро обладает «множественной» устойчиво- стью — оно устойчиво целиком. Обычно с-ядро и Н — М-рёшение содержат одновремен- но много различных и не равноценных для отдельных игроков дележей, а Н — М-решения, кроме того определя- ны неоднозначно. Поэтому более применимыми являются такие принципы оптимальности, как вектор Шепли и n-ядро, которые дают решение, состоящее из одного дележа. z Вектор Шепли* нормативно распределяет выигрыш между игроками в зависимости от .«силы» каждого из них, которая определяется, исходя из значения дополни- тельного выигрыша, получаемого коалицией при усло- вии, что данный игрок войдет, в нее. Если вектор Шепли содержится в с-ядре, то такой дележ помимо того, что он «справедлив», еще и устойчив, и поэтому, может быть ре- зультатом соглашения игроков. В отличие от вектора Шецли n-ядро всегда содержится в с-ядре, если послед^ нее не, пустоПоэтому n-ядро целесообразно испбльзовать как решение кооперативной игры, с-ядру которой не при- надлежит вектор Шепли. Если с-ядро кооперативной
ЗАО ^ас$ь v. коойЕ^АФй^йЫЕ ч игры пусто, то n-ядро, по-видимому, более «справедливо» по сравнению с вектором Шепли распределяет выигрыши мёжду игроками. § 10.1. Примеры приложении арбитражных схем Пример 10.1 (планирование выпуска по- бочной продукции, кооперативный вари* антк, Предположим, что два предприятия могут выпус- кать побочную продукцию в производственных условиях, принятых в примере 2.4, но с учетом возможностей сбыта этой продукции, как в примере 8.5. Тогда, как было установлено в примере 8.5, такой конфликт модели- руется конечной игрой двух лиц с ненулевой суммой, заданной парой тпХп-матриц 4 = 11а^11 и В = 11 ЬцII, где ai} и — выигрыши' (в единицах полезности) соответст- венно игроков I и II при условии выбора ими соответст- венно своих i-й и j-йгчйстых стратегий. Пусть теперь в этой игре, исходя из природы конфликта, допускается кооперирование без передачи полезности от одного игро- ка к другому, т. е. игроки могут заключить соглашение и выбрать совместную ( стратегию z. Очевидно, что z (Т11> • • •» Tin • • •> Tmn)» Ту>0, = • !10Л) М где Ту — вероятность выбора игроками I и II соответст- венно совместной стратегии (£, /). Математическое ожидание выигрыша и и2 соответ- . ственно игрокор I и II при условии применения ими стратегии z естественным образом определяется по следу- ющим формулам: = 2 aijYih (10.2) ' X W2=2^ijTir (10.3) М Точки (ub u2) образуют допустимое множество U (см. § 9.1), из которого нужно выбрать точку (ut, и2). Исполь- зуем для этой цели арбитражную схему. Очевидно, что при совместных действиях игроки I и II по крайней мере должны получить не меньше, чем значе-
ГЛЛЙА 10, ПЙИЛОЖеПЙЙ 301 нйё антагонистической игры для каждого из них. Поэто- му компонентами ' вектора status quo ' и* = (и*, и^) будут m п и* = max min 2 X Y i=l J=l^ (10.4) . m n ul = max min 2 2 &<Л<Т1л (10.5) ' x Y 1=1 J=1 где X = (gx, Ц ..., gw) (=X и Y == (px, p2, ..., Пп)^ Y. Функция <p(CZ, u*) строится следующим образом. 1. Начало координат переносится в точку (и*, и2), т. е. точка (и£7 и2) преобразовывается в точку (0, 0\ при этом множество U преобразуется в множество U'. 2. Находится единственная^ точка (ux, u2) е U' та- кая, что их>0 и_и2>0, a wxu2 есть максимум всех про- изведений uxu2, где (ux, u2) е U', т. е. uxu2^uxu2 для • всех#(их, u2) е U' и таких, что их^0 и и2\> 0- При этом прямая, которая проходит через точку и угловой коэффициент* которой равен взятому со знаком минус угловому коэффициенту прямой, соединяющей точки (их, u2) и (0, 0), является опорной для Z7', т. е. U' лежит ниже этой прямой или на ней. 3. Арбитражное решение находится^ путём _обратного преобразования полезностей относительно (wj, u2). Найдем арбитражное решение- для конкретных дан- ных примера 8.5, т. е. пусть кооперативная игра двух* лиц без побочных платежей задана следующими матри- цами: _ /600 300\ __ / 500 1500\ А = ^300 900/ . и В== \2000 500Г В бескоалиционном случае (см. пример 8.5) это би- матричная игра, ситуацией равновесия которой являются векторы X* = (3/5, 2/5) и У* = (2/37 1/3). Как следует из примера 8.5, в условиях некооперативного варианта биматричной игры, когда сотрудничество исключается й игроки выбирают свои стратегии независимо друг от дру- га, математическое ожидание выигрыша игрока Д равно == 500, а игрока II vn = 1100.
302 ЧАСТЬ V.- КООПЕРАТИВНЫЕ ИГРЫ Допустим -теперь-, что игроки могут кооперироваться и выбирать- совместную смешанную стратегию без пере- дачи полезностей друг другу. Найдем «х = 500 и и2 = 1100, а затем, преобразовав координаты путем переноса нача- ' ла’ координат в точку’ (500, 1100) по формулам - — 500, (10.6) ’ щ = и2 - 1100, (10,7) построим область ЕЛ (рйс.10.1). Найдем точку («х, и2), которая максимизирует функ- цию : g {и', U'f и*) = и[и2 ; ' (10.8) на подмножестве U', для которого Ui > О и и2 > 0. Уравнение прямой, проходящей через точки (—200, 900) 'и <400, —600), имеет следующий вид: <=-4- «1 + 400. (16.9) Подставим (10.9) в (10.8), продифференцируем получен- ное выражение, приравняем производную нулю, 'разре- шим полученное уравнение относительно «х и найдем Ux = 4/5j_a затем-из (10.9) получим и2 = 200. В_ резуль- тате получим точку (их = 4/5, и2 = 200). Далее путем об- ратного^ преобразования най- дем арбитражное - решение для исходной кооперативной, игры, а, именно nt = 2900/5 и и2 = 1300. _ (щ = 2900/5, иг = 1300) мож- Рис. 10.1. Арбитражное решение но реализовать, посредством применения совместной сме- шанной стратегии z — (0, 0, 721/Y22). Компоненты страте- гии z легко, найти из (10.2), (10.3) путем, подстановки'
ГЛАВА 10. ПРИЛОЖЕНИЯ 303 Ui = Uj и u2 = и2. В частности, найдем ^21 — 8/15 и у22 — 7/15. Следовательно, игроки должны, договориться (или третье лицо — арбитр должно установить) и применить совместную смешанную стратегию Z=(0, 0r 8/15, 7/15), согласно которой игрок I использует только вторую стра- тегию, а, игрок II применяет первую и вторую, соответ- ственно с вероятностями 8/15 и 7/15. В этом случае со- глашение между игроками (или циркуляр арбитра) при- водит к тому, что математическое ожидание* выигрыша игроков I. и II будет соответственно равно 580 усл/ ед. (500 усл. ед.—в некооперативном варианте) л 1300 усл. ед. (1100— в некооперативном варианте). Таким образом, кооперирование в неантагонистиче- ском конфликте приводит к увеличению математическо- го ожидания выигрыша (в смысле полезности) каждого из игроков. _ Пример 10.2 , (те оф е т и к о - и г р о в о и подход к многокритериальной оптимизации). Как известно, любая задача математического программирова- ния состоит в выборе из заданного допустимого множе- ства таких значений переменных, при которых дости- гается максимум или. минимум целевой функции (од- нокритериальная оптимизация). Вместе с тем на прак- тике часто встречается случай, когда существует много- образие целей, степень достижения, которых выражается рядом критериев, т. е., векторам. Так; при оценке дея- тельности промышленного предприятия необходимо учи- тывать прибыль, полный объем продукции, себестоимость и т. д. Эффективность боевого действия, очевидно, опре- деляется не только математическим ожиданием причи- ненного противнику ущерба, но и собственными потеря- ми, а также рядом временных показателей и расходом ресурсов. А если требуется вйбрать оптимальный варит ант самолета гражданской авиации, то его качество мож- но оценить векторным критерием е2, е3, е4), где — вес-нагрузки, е2 дальность полета без дозаправки, е3 — скорость полета, е4 — суммарные затрать на проек- тирование, разработку, изготовление^ и эксплуатацию са- молета. . В результате возникает задача многокритериаль- ной (или векторной) оптимизации, которая формулиру- ется следующим образом.
304 ЧАСТЬ V* КООПЕРАТИВНЫЕ ИГРЫ Пусть имеется управляемое мероприятие (операция), исход которого зависит от выбранной стороной А страте- гии Хе X сR™. Эффективность действия стороны А оценивается векторным критерием е = (е1? е2, ..., еп), ло- кальный критерий ё{ (1 i п) которого связан со* стра- тегией X некоторым соотношением е< = е4(Х), 1 = 1, ..., п. (10.10) Допустйм, что цель состоит в максимизации всех локальных критериев путем выбора стратегии X е X (задача минимизации некоторых локальных критериев легко превращается в задачу их максимизации путем изменения знака этих критериев). Однако в задачах векторной оптимизации имеется неантагонистическое противоречие между локальными критериями: улучшение качества решения по одним критериям может ухудшать качество решения по другим. Если при этом локальным критериям нельзя придавать содтветствующие веса, т. е. согласовать локальные критерии, то для решения nb- ставленной задачи можно использовать арбитражную схему. - , Переход к арбитражной схеме сводит векторную за- дачу принятия решений к эквивалентной (в смысле принципа оптимальности Нэша , для общих арбитражных схем) скалярной задаче, которая имеет единственное ре- шение. Для этого удобно перейти от пространства R™ множества стратегий X к пространству Rn векторов кри- териев е = (еъ е2, ..., еп), по координатным осям которо- го откладываются значения локальных критериев. Обозначим через U образ множества всех допустимых стратегий X, при отображении, определяемом соотноше- нием (10.10). Теперь для сведения .задачи многокрите- риальной оптимизации к арбитражной схеме Г = =* </, U, и*>, где / = {1, 2, ..., п} — множество локаль- ных критериев, необходимо определить точку и*. Эту точку можно определить, исходя из содержания самой задачи многокритериальной оптимизации или здравого смысла, а также привлекая опыт и интуицию. Кроме то- го, за точку status quo часто принимают и* 17, компонен- ты щ которой равны гарантированному значению локаль- ного критерия et при любых значениях всех ос- тальных критериев. Тогда рещенце лдебой многокритери-
ГЛАВА 10. ПРИЛОЖЕНИЯ 305 альной задачи можно Получить, использовав оптимиза- ционную вычислительную схему 1—3, применявшуюся в примере 10.1. Разумеется, что в этом случае решение бу- дет оптимальным согласно аксиомам 1—6 из § 9.1. Ре- шим теперь численный пример. Предположим, что требует- ся распределить 400 усл. ед. некоторого ресурса между дву- мя предприятиями по вектор- ному критерию и =(ult w2) = (1 — foo* 1бо”)’ . (10.11) где х е [0, 1001 — количество Рис. 10.2. ресурса, выделенного второму предприятию. Используем арбитражную схему XZ, J7, &*>, где /== =={1, 2) и и* = (0, 0), так как из (10.11) видно, что рели х = 100, то = 0 и и2 = 1/10, а если х = 0, то щ = 1 и й2 = 0. Выразим локальный критерий и* через и2, т. е. найдем у , иг —'1 — 100и| л (10.12) ’ и определим множество C7 = {u|ui, u2e[0, 11} (см. рис. 10.2). Затем найдем арбитражное решение и == (uh и2), которое на основании (9.1), (9.2) максимизирует g (и, U, и*) = ^1^2 == (1 lOOug) и2. ' (10.13) Продифференцировав^ (10.13) ^приравняв kJ нулю про-- изводную, получим и2 = (10 V З)-1, а затем найдем щ = = 2/3. Следовательно, Т. ' ( 2 , 1 \ __ (л _ х \3\1оУз/ А 100’ 100/’ откуда х = 100/3. Таким образам, согласно принципу оптимальности Нэша для общих 'арбитражных схем первому предприя- тию следуё! /выделить 200/3 усл. ед., а второму 100/3 усл. ед. ресурса. 20 Г- Н, Дюбин, В. Г. Суздаль
306 ЧАСТЬ V. КООПЕРАТИВНЫЕ ИГРЫ § 10.2. Примеры приложений кооперативных игр п лиц . Пример 10.3 (планирование выпуска по-; б очной продукции, кооперативный с л у-; чай). В примере 10.1 был разобран кооперативный слу- 1 чай планирования выпуска побочной продукции при условии, что игроки не получают каких-либо компенса- ций убытков от соблюдения договора об объеме выпуска- емой продукции каждым предприятием или от решения вышестоящей организации. Предположим теперь, что то- вары типа Д и М могут выпускать три предприятия: предприятие- 1 — товары. типов Д и в объеме 900 единиц, предприятие 2 — товары типов" и,Д2 в объеме 700 единиц, предприятие 3—товары и ЛГ2 в объеме 1000 единиц. Кроме того, пусть товары и Mi уже вышли из моды и не пользуются спросом, а товары ти- пов Д2 и Мг покупаются- только комплектами: одна еди- ница товара Дг и одна единица товара М2, причем прог- нозируется спрос на 1000 таких комплектов. Следовательно, общие возможности предприятий превосходят прогнозируемый спрос, и поскольку каждое предприятие заинтересовано в сбыте возможно большего количества продукции, налицо экономико-производствен- ный конфликт. Если допустить, что предприятия' могут заключать между собой соглашения и выплачивать друг другу компенсации в широко понимаемых единицах по- лезности, то данный конфликт моделируется кооператив- ной игрой (Z, й) трех лиц с побочными платежами, где / = {1, 2, 3).- Для вычисления значений характеристиче- ской функций v будем измерять выигрыш' числом реали- зованных единиц продукции, выпускаемых коалицией 8<=1. Так как один из игроков и коалиция 8 = {1,- 2) не могут производить комплексы, их продукция реализо- ваться не будет, и поэтому v(l)s= v(2) = i>(3) = v(l, 2) = 0. Напротив,4 коалиции 8 =44, 3) и 8 = {2, 3) выпустят соответственно 900 и 700 комплектов, т. е. будет реализо- вано (выиграно) соответственно р(1,3) = 1800 единиц и р(2,3) = 1400 единиц, а коалиция из всех трех предприя- тий выиграет р(1, 2, 3) = 2000 единиц. Следовательно',' характеристическая функция кооперативной игры (Z, v)
ГЛАВА. 10. ПРИЛОЖЕНЙН ч 30? записывается следующим образом: f О для S ={{!}, {2}, {3}, {1,2}}, 1800 для .5 = {1,3}, 1400 для S = {2,3}, (10Л4> 2000 для S ={1,2,3}, или в 0—1-редуцированной форме (см. определение 0.7 и формулу (9.13)) • 0 9/10 v (S) = (7/ю и для всех S = {i}-, i ^1, S — {1,2}, Для S = {1,3}, для S = {2,3}, для S = {1, 2,3}. (10.15) Найдем с-ядро. На основании (9.8), (9.9) и (9.15) имеем 1800 xa, 1400^ж4-|-а:з, (10.16) 2000 xt + x2 -J- xa, (0,0,2000) 1000,0,0) или для игры в 0—1-редуцированной форме, принимая во внимание (9.14), получим 9/10 Xi + х3, - 7/10Сж2 + ж3, (10.17) 1 = Xi + «2 + Хз. Дележ х*=(х[, х*а, х*а), удов- летворяющий системе (10.16) или (10.17), принадлежит с-ядру. • _ Геометрическая интерпре- тация дележей как точек дву- мерного симплекса дана на рис. 10.3, где точки х* со- > , ответствуют точкам заштри- - Рис. 10.3. • хованного параллелограмма. Выбор одной из этих точек можно понимать как ре- шение данной игры. Так; например, дележ х* — (600, 200, 1200) принадлежит с-ядру. Согласно дележу х* до- 20*
308. ЧАСТЬ V4 КООПЕРАТИВНЫЕ ИГРЫ ли, .которые должны получить предприятия 1, 2 и 3, £ соответственно равны 600, 200 и 1200. » Пример 10.4 (теоретико-игровая модель i распределения расходов между членами 3 кооператива). Предположим, что п различных по- требителей должны построить хранилища для жидкого топлива. Пусть затраты на строительство являются не- * которой возрастающей функцией от объема хранилищ, а в моменты времени £2, .заданы потребности каж- дого потребителя в топливе функцией /»(^), где i = 1,2,... ..., п. При этом допустим, что принимать топливо в 4 хранилища можно в промежутках между потреблением. 3- Тогда, очевидно, объем • хранилищ, который удовлетворя- 1 ет /г потребителей, равен тах2/$(0- Каждый йотре- t i=i битель топлива может объединиться с лцобым другим для'постройки общего хранилища. Такое объединение по .. вполне понятным причинам можно называть, коалицией * 8. Очевидно, что, если образуется коалиция S, то объём хранилища, которое надо построить этой коалиции, дол- жен быть1 равен max 2 /г(£), а затраты на его стро- t' i^S _ ительство будут составлять Fl max 2 fi (0’Ь \ t i^S I Требуется определить число хранилищ и коалиции, которые их будут строить, а также распределить расхо- ды. на постройку хранилищ между членами’ коалиции. Эту задачу можно интерпретировать как кооперативную | игру п лиц, характеристическая функция которой задана д следующим образом: Й . - " ' v(‘S) = F(max 2(10.18) I \ t i(=:S / Легко убедиться, что для данной игры вполне естест- f веннь/аксиомы 1—4 из п. 7 § 9.2. Поэтому для распре- , деления расходов между игроками воспользуемся векто- } ром Шепли. После вычисления компонент Фг(ь?) для у каждой коалиции необходимо проверить выполнение ра- венства АоЫ <4DM (10.19) Л где <Ds(f) — компонента вектора Шепли игры |5| лиц, ха- I
ГЛАВА 10. ПРИЛОЖЕНИЯ 309 рактернстйческая функция которой является сужением функции v на множество S. Коалиция S, для которой выполняется- неравенство , (10.19), должна строить свое хранилище, а игроки, не вхо- дящие в коалицию S,—свое хранилище. Если\такой коа- лиции нет, то все игроки строят общее хранилище, а рас- ходы распределяются согласно вектору Шепли. Пусть теперь затраты на строительство хранилищ* за- даны такой возрастающей функцией, что характеристи- ческая функция принимает следующие значения Коалиция S {2} {З}/ {1,2} {3,4} {2,3} {1, 2, 3} Характеристичес- кая функция 2 з 4 2,5 4 3,9 5 , 6 Для коалиций 11, 2, 3), И, 2), {2, 3), {1, 3} по формуле (9.21) найдем Ф, И = it (6 - 5)4- (4 - 3) + (3, 9 - 2, 5) + ' - +^(2-°)=4’ ф2 {V) = (6 -.3, 9) 4- (4 - 2) + ^.(5 - 2, 5) + ’• . +°-^(3-0)=g; Фз (v) = (6 - 4) + (3, 9-2)4- (5 - 3) + \ * 1 о12! /су г 43 + —(2,5-0) = ^. Аналогично для коалиций {1, 2), {2, 3) и {1, 3) получим Фц1)(р) = 3/2, Ф1(2)(у) = 7/4, Фг(1)(у) = 5/2, Ф2(2>(р) = 11/4, ®3(i)((f) = 11/5, ®3t2)(i>) =9/4., Из сравнения фДг), .Фзц/р) и Фз(2)(р) видно, что нера- венство (10.1Ц) не выполняется. Следовательно, игрокам целесообразно строить одно хранилище, а расходы рас- пределить следующим образом: игрок 1 — 7/5 усл. ед., игрок 2 — 49/20-усл. ед. и игрок 3 — 43/20 усл. ед.'
310 ЗАСТЬ V. КООПЕРАТИВНЫЕ ИГРЫ . j Пример 10.5 (распределение доходов в J не а нтагонистических конфликтах). Пусть * i-й участник некоторого предприятия может вложить в него капитал Xi (i=s 1, ..., п). Пусть также доход от это- ; го предприятия выражается функцией f(xh ..хп\ удов-, летворяющей условиям: (а) / — линейный по каждой переменной полин’ом*); j (б) f(x) = 0, если х = 0; < (в) /(х)=/(лж), где л — произвольная перестановка; . игроков. " Пусть распределение доходов между участниками задано вектором: Ф — (Фь Ф2, ..., ФД где Ф»- —доля ре- сурса игрока i. Потребуем, чтобы вектор Ф удовлетво- рял следующим аксиомам: 1) Если X} =* 0, то Ф«(я) = 0: 2) Если л — произвольная перестановка игроков, то Ф<Сг) = Фя(г)(л(х)). . 3) На рему. z . v Теорема 10.1. Существует лишь один набор линей- ных по каждой переменной полиномов Ф4, Ф2,. ..., Фя, ? который удовлетворяет аксиомам 1—3. /Этот набор явля- х ется вектором Шепли для игры с характеристической функцией v(S) — fix8). edexf—O при i&S, xf— Х{ при < Доказательство. В силу (а) —(в) полином /, k имеет вид ' . п . - - .' i «1 S + а2 2 хгхз + аз 2 XiXjXk + ... + otn^A • • • хп, I i==l г<з у 1<з<к ~ ' $ где а, — некотррый коэффициент. В силу аксиом 1 и 3 полином Фг(я) имеет вид _ . ? Ра 4" $2xi S хз 4" 2 хзхк 4“ • : • 4“ Рп^А • • ХП* • -_____;______ ' £- ♦) Т. е. при каждом i он имеет вид а<«<+Ьг, где сц и не J зависякот^г. ' 2 ф4 (х) = /(«). J i=*l J основании этих .аксиом докажем следующую тео-
ГЛАВА 10. ПРИЛОЖЕНИЯ 311 По аксиоме 2 . * • Ф< («) = . ' п = ₽А 4- Mi 5 .+ Mi S xjxh + ... 4- М? П xh- . зфг ' j<k h^i По аксиоме 3 , ' - / n n " n n . n n 5 Ф« (я) = Pi 2 xi + P2 2 Xi S x3 + • • • + Pn JS &i П xh, i=l *• г—1 , 1 i=l tefii nn f = <h. Sxi + a2 ^jXiXj +•...+ anX^z ... Xn. i—1 i<3 Отсюда получим г . Pi^an Р2 = ^,..., РЙ = ^, ...,Pn = ^. ’ Следовательно, единственность набора Полиномов Ф£, Фг, .. , Фп доказана. Запишем теперь вектор Шепли для игры с характеристической функцией v(s) = f(x8), т. е. Ф{(Ж)= 2 —1~1)1^~|г’1)1(/(^)-/(^М0))- (Ю-20) TCN х • i(=r Х Легко видеть, что; полиномы Ф<(я) удовлетворяют аксио- мам 1—3, и в силу единственности получаем ФДя) = Ф| (ж). Рассмотрим теперь конкретный случай, когда п пред- приятий последовательно производят некоторый продукт в следующем порядке: 1-е предприятие поставляет сырьё, цена единицы х(например, 1 кг) которого равна единице (например, 1 руб.), 2-е предприятие из единицы этого сырья производит единицу 2-го продукта, 3-е предприя- тие из единицы 2-го продукта производит единицу 3-го продукта и т. д. Тогда цена единицы сырья, требующего для производства i-ro продукта, будет равна 1. Допустим, что цена сырья возросла на a?i, а г^му пред- приятию для производства своего продукта требуется не одна единица предыдущего продукта, а 1 + х{ (i>D. Очевидно, что в новых условиях цена^сырья для про- п изводства n-го продукта будет равна Ц (1 + Xi), а . 4=1
/ - . . ;| 1 х Л 312 ЧАСТЬ V. КООПЕРАТИВНЫЕ ИГРЫ .Ж * & убыток составит • z > / (®1, ®2, • • • ,®п) = П (1 + — 1- i=l Требуется определить распределение убытка между предприятиями, т. е. определить п-мерцый.вектор Ф(я) = = (Ф1Сг), Ф2(я), ...» Фп(я)), i-я. компонента которого со- ставляет убыток f-го предприятия. Как легко видеть, функция f(xt, я?2,..яп) удовлетво- ряет условиям (а)—(в), т. е. г - /(«) = S®i+ ••• + 5 Xix}xk + ... +Пxi. i=l i<j i<j<k 1=1 Следовательно, на основании формулы (10.20) получим Ф* (х) = Xi + у Xi У xh -4- 4 xt У xkxt + ... 4- 4 П xi- * 6 fe<l n i=l Теперь - решим ' численный пример, приняв п = 3. Тогда ж z - f (*) 3=2 *1 "Ь *2 “Ь *3 “Ь *1*2 “Ь *1*3 “Ь *2*3 “Ь *1*2*3» ' Ф* (х) = Xi 4- 4 Xi У xk 4- 4 «1*2а;з- Примем Xi= 1, х2 == 2 и х2 = 3. В результате получим ф;(ж) = 5,5, Ф2(*) = 8, ф;(я) = 9,5 и /(гг) = 23. Таким образом, общий убыток составляет-23 единицы, из которых на долю 1-го предприятия приходится 5,5 z единиц, 2-го — 8 единиц и 3-го — 9,5 единиц. Пример 10.6 (распределение до хо д al. Пусть объединение из предприятий, имеет некоторое количество ресурса L, причем предприятию 2, ..., п} для функционирования производства необходимо 1{ ресурса. В этом случае оно получает доход сЛ. Мы будем пред- д полагать, что все предприятия рентабельны, т. е. для i е I величина — с, где с — цена единицы ресурса, положительна.. . Требуется распределить доход между членами объеди- " нения. Для решения поставленной задачи представим ее в виде кооперативной игры, допускающей побочные пла- тежи.
ГЛАВА 10. ПРИЛОЖЕНИЯ 313 1. Положим 1 у v (S) = max 2 (ci — с) lixi> х tes Xi e {0,1}, i e I, xi = 0, i ф. S\ n L» i=l Число v(S) — это доход, который может получить коа- лиция, если ей дается приоритетное право использования ресурса* Для нахождения v(S) необходимо решить зада- чу дискретного программирования. Эта- задача называет- ся задачей о ранце, и имеются достаточно хорошие мето- ды ее решения (см. [30]). Рассмотрим сначала случай, когда имеется изоыток п ресурса, т. е. когда 2 к Тогда i=i v(S) = 2 (cf-^c)Zf. . ' les Заметим, что ж этом случае игра является несущест- венной, так как * v(5)=2v({0). и поэтому каждый игрок i^I естественно получает П ' ‘ При 2 ^>Ь. игра становится более .сложной и, i=i , ’ если с-ядро не пусто, естественно в качестве распределе- ния доходов взять деле_ж из с-ядра. Когда ядро пусто, нам представляется естественным считать решением' n-ядро, при котором в меньшей степени нарушается не- справедливость. ' . • 2. Предположим теперь, что партия товара продается7 оптом любому йзчпредприятий 1^=1 или их коалициям. Тогда v(S) = max 2 CiliXi —L, \ X ' Xi e {0,1}, ieZJ . г{ = 0, , i^Z, ’ • ' - \ n i ' 2 ci%i 1=1 .
314 ЧАСТЬ V, КООПЕРАТИВНЫЕ ИГРЫ При избытке товара v (5) = 2 cih — - les Положим - . * \ iGES / Тогда игра с характеристической функцией v'(S) экви- валентна игре с функцией v, причем . v'A{i}) = 0. Игра v' задана в 0—1-редуцированной форме. Заметим, что полученная игра симметрична, поэтому вектор Шеп- ли этой игры равен (1/и, 1/га, ..., 1/га). Так как для лю- бой коалиции S имеем v'(S) = |5|/га> (|5| — 1)/(га—1)= = v(.S), этот вектор принадлежит с-ядру. Поэтому в дан- ном случае вектор Шепли является достаточно хорошим решением задачи о распределении дохбда. Кроме' того, для га <4, |S| = 1, |5| =4 справедливы неравенства Из этих неравенств в силу теоремы 9.4 следует,- что. при f -га ^4 ядро игры является ее Н — М-решением. В силу теоремы 9.5 вектор ‘ cL (п 1) । у 1 cL Xi = —..|- Cili cL — C{li -r-r- •• будет вектором Шепли первоначальной игры. Аналогично преобразуется с-ядро в том случае, когда оно существует. > 3. Предположим теперь, что некоторая сторона Хили - • - сообщество сторон) имеет достаточно сырья (например, нефти) для продажи другим сторонам/ которые объеди- . йены в сообщество и предполагаются в нем равноправ- ' ч ными. Требуется определить, по какой цене следует про- / давать сырье. Эта ситуация моделируется кооперативной игрой п +1 лиц. ‘.д Множество игроков обозначим через,7 = {0, .1, .../га}, ? где 0 —сторона экспортирующая сырье, i, i ¥• 0— потре- < бители сырья. /
ГЛАВА 10. ПРИЛОЖЕНИЯ 315 Расходы игрока 0 по добыче единицы сырья положим равным с, а доход игрока i 0 от использования единицы' сырья примем равным сг- (с,>с). Пусть -ч v(0) = 0, О, 3 (Ci-с) если 0 S, если где U г- количество сырья, необходимого стороне г (i >0). Как и ранее, цисло v\S\ — доход коалиции S. Так как стороны равноправны, в: качестве вектора ^справедливого распределения доходов можно взять вектор Шепли. Для вычисления компонент вектора Шепли используем фор- мулу (9.21) и получим фо*(0=2 051 "Ж)?' g 1)!-Р(^\0) = leSci \ ~ « »+1 . /. п \ - v («.—)!. - Isii -<" + «)! у Д J. п 2 & п п ~ = re(n-71) 2 (Ci — с) li =i ~2~ 2 (С» “ с) п+1 - ».й- 2 _ 4- (е, - е) и ^151+2 , ” 7 Сравнивая с задачей 1, мы придем к выводу, что сто- роны-импортеры должны отдавать ровно половину своих доходов от переработки нефти. Докажем, что вектор Шепли Ф(г) принадлежит с-яд- ру игры. Действительно, х* (S) = ^2 cdi > 0 = v(5), . is s если 0 ё S. В противном случае п - (5) =-12+42 CjZi -v +4 2 i=i - ies\o ies\o Следовательно, вектор Ф*(у) принадлежит с-ядру. ,4. Задачи 1 и 2 можно переформулировать, для слу- чая, когда Zf являются верхними границами ресурса, необ- ходимого для предприятия г. Например, характеристиче-
. • ’t 316 ЧАСТЬ V. КООПЕРАТИВНЫЕ ИГРЫ ; ? . ' — ’ - ' ’ i ская функция для задачи 1 в этом случае будет. иметь вид v (S) = max %ciXi, j х ieS j / x^ L, x2 iSS 1 > - .Если игроки ii, i2, <..,18, входящие в коалицию 5, упорядочены так, что i. I. /. * _ > Ч Ч г8 ТО . • д / ь д . (£) = JS + I L — 2 к; 1 . ♦ j=l \ j=l / | где число к определяется из неравенств ; + h2 + • • • + hk Д . Zil +Zi2 + • • • + ^ Справедливость этого легко проверить. Дальнейшие рас- * смотрения таковы же, что и для дискретного случая. , Пример 10.7 (теоретико-игровая модель систе- мы водоснабжения) [70]. Пусть предполагается строитель- J ство плотин для накопления воды в районе, в котором имеется тп, | промышленных и п — т сельскохозяйственных объединений. Бу- _ дем считать, что промышленное объединение i е А = {1, 2, ..., тп} нуждается в годовом объеме воды 6»-, а ни одно из сельскохозяйст- венных объединений j е В = {т + 1, т + 2, ..., п} недостатка в воде не испытывает. Каждая коалиция предприятий S А\}В j может удовлетворить/потребности в воде своих'членом двумя пу- тями: либо построить дамбу, либо тем или другим способом транс- портировать воду из источников, которые находятся на территории функционирования сельскохозяйственных предприятий, входящих в коалицию 5. Возможно также сочетание этих двух способов. Пусть и' (5) — затраты коалиции S на удовлетворение потреб- ности в воде своих членов. Примем, что эти затраты складываются из затрат на строительство плотин, если она строится, затрат на. транспортировку воды (например, строительство водопровода) и за- трат на возмещение убытка сельскохозяйственных, предприятий, j если им не будет хватать воды для своих нужд. Для простоты мы J не будем включать в модель убытки сельскохозяйственных пред- приятий от порчи их угодий, хотя это сделать нетрудно. Нахожде- ние функции у (5).— довольно трудоемкая задача. Упрощая модель, будем считать, что затраты на строительство плотины пропорцио- j I
ГЛАВА 10. ПРИЛОЖЕНИЯ ’ * 347 нальны объему водохранилища, затраты на транспортировку про- порциональны Объему транспортируемой воды, убытки от недо- статка Боды пропорциональны недостатку. Тогда затраты на строительство дамбы кралицией 5 будут рав- - ныа5 2 У»» где .уi — годовое количество воды, используемое 1 iesnA ' .. предприятием i из водохранилища, as — стоимость единицы воды, потребляемой за год, из водохранилища, если плотину строит коа- лиция 5. Затраты коалиций S на транспортировку воды будут равны - tesnA 2 S ^1зх1з9 где xij — готовое количество воды, потребляемое предприятием^ из сельскохозяйственного района /, 1ц— годовая стоимость транс-, портировки воды из. j в i. Наконец, потери предприятия / от транс- портировки единицы объема воды в год будут равны сз( 2 при 2 isSHA teSnA О . и противном случае, где — необходимое количество воды для предприятия у, с/— це- на потерянной сельскохозяйственной продукции в результате не- хватки воды. Если считать, что все предприятия имеют' возмож- ность удовлетворить свои потребности в воде и имеют такую цель, то, очевидно, они будут минимизировать затраты. Следовательно, ; в этом случае нахождение v' (5) сведется к решению задачи ма- тематического программирования: найти минимум величины as 3 у,+ 2- ,2 *«*«+.2 рз( 2 ieSnA iesnAjsSQA JeSQB \teSCIA 7 при ограничениях У}+. 2 х1з>Ь is 5(14,, У<>0, ' is 5(14, х.г>0, is 5(14, /е5ПВ. Таким образом, V (5) равно минимуму целевой функции дан- ной задачи математического программирования. Полагая v(S) = —1/(5), мы придем к кооперативной игре п лиц, допускающей побочные платежи. Эта игра моделирует рас- сматриваемый конфликт предприятий. И задача состоит в том, что- бы определить, сколько средств каждое предприятие должно вло- жить на удовлетворение их общих нужд, т. е. надо найти такой дележ я* что 4 _ • 2'** == ” СО» i=l
318 . ЧАСТЬ V, КООПЕРАТИВНЫЕ ИГРЫ Таблица 10.1. Параметры . сои 4 ' Ь. м’/год Игрок 1 Игрок 2 Игрок 3 Игрок 4 Игрок 5 ~ 1,67X10» / 1,28Х108 0 0 - 0 0 . 0 1,48X108 2,28X108 1,94X108 . который был бы -.справедливым распределением платежей. Допу- стим сначала, что с-ядро не пусто. Тогда любой дележ из п-ядра будет хорош. Ни одна коалиция не захочет отделиться, так как для любого я* е с выполняются неравенства 5сЛ 4 \ (10-22) Из этого неравенства следует,'что расходы v'(S) любой коалиции S согласно дележу х* будут не болыйе, чем при ее обособлении. В качестве х* можно" взять вектор Шепли, если он содержатся в Таблица 10.2. Коэффициенты стоимости ао иен/м’/год о < lis иен/м»/год ’ 3 , 330,9 4з =297,3 Z|3 =328,3 4 327,9 Zf4 =299,7 • - . Z|4.=17O,6 5 . 386,5 Zf5 =353,1 Z|5 =200,9 • ST СО 294,3 Z^'=225,7 =257,5 =328,3 ’• . 1Ц =170.6 Z?5 =227,4 Z|| =304,4 3,5 324,1 - . Z|, =328,3 1Ц =200,9 4, 5 • 286,5 Z4tt =202,8 ‘ Z|| =170,6- - Z|f =?232,7 . Z4! =200,9 3, 4, 5 272,8 • . Z?4i =215,8 Z«« =224,7 ' J345 =1948 . Z|i5 =328,3 *Z345 =170l6 . iff =200,9
ГЛАВА 10. .ПРИЛОЖЕНИЯ 319 с-ядре, или использовать n-ядро. Это зависит от принципов, кото- рыми руководствуется арбитр или игроки, принимающие реше- ние совместно. Если же неравенства (10.22)' для некоторого S нарушаются, то ситуация становится сложной. В этом случае, коалиция 5, для ко- Таблица 10.3. Характеристическая функция и распределение водных ресурсов — Коали- ции S v(S) хЮ* иен Х..Г у. гз з Я101 м’/год *’• I *23 j х14 1Х24 У к «и Х25 , Vs ' 1, 0- 2 0 - 3 489,7 1,48 4 747,6 2,28 5 749,8 1,94 12 0 13 440,0 1,48 0 14 700,5 1,67 0,61 15- 694,0 - ‘ • 1,67 0,27 23. 486,4 1,28 0,20 24/ 546,3. 1,28. 1,00 25 512,2 в 4,28 0,66 34 1106,5 1,48' 2,28 35 -4408,3 1,48 - 1,94 45 1209,0 2,28 1,94 123 440,0 1,48 0 О' г 124 518,1 1,67 6,61 0 125 490,2 о> 1,28 0 134 998,0 1,48 0 0,19 2,09 135 961,5Ч 1,48 0 0,19 1,75 145 1069,2 1,67 0,61 0 1,94 234 948,2 0 1,48 1,28 1,00 235 950,7 0 1,48 1,28 0,66 245 1069,2 - 1,28 1,00 9 1,94 345 1554,3 1Х 2,28 1,94 1234 865,4 0,67 0 0,81 1,00 1,28 0' 1235 803,8 1,48 0 ' 0 0,19 i;28 0,47 1245 940,9 1,00 1,28 0 0,67 0' 1,27 1345 1424,6 0 1,48 1,67 0,61 0 1,94 2345 1424,3 — 0 ’ 1,48 1,28 1,00 0 1,94 12345 1307,9 0,67 0 0,81 1,00 1,28 0 0 / 0 1,94 - - торой нарушаются неравенства (10.22), несомненно захочет отде- литься. Ей это обойдется дешевле. Если это возможно, то она так и поступит. Однако возможно, что ни одна из коалиций не имеет права отделиться. Такая ситуация возникает тогда, когда арбитр (например, государство) хочет поддержать одни предприятия за
320 ЧАСТЬ V. КООПЕРАТИВНЫЕ ИГРЫ счет других; Тогда естественно это делать с наименьшей «обидой» (потерями), т. е. таким образом, чтобы максимальный из эксцес- сов v (S) — х (S) (S е Z) был минимальным. В качестве численного примера рассмотрим реальную ситу- ацию, где в качестве игроков выступают три японских города и два сельскохозяйственных объединения. Множество игроков равно I =. {1, 2, 3 4, 5}, где игрок 1 — сельскохозяйственное объединение на реке Сакава, игрок 2 — сельскохозяйственное объединение на реке Сагами, игрок 3 — город Какагава, игрок 4 — город Иокогама, игрок 5 — город Кавасаки. Постулируется, что дамба будет пост- роена на реке Сакава, а вода будет перевозиться из рек Сагами и Сакава. Параметры игры заданы в табл^ 10.1—10.3. Для этого при- мера n-ядро равно вектору х* = я*, .х* == 70,9; х* == = 71,2; х* = — 412,4; ж* = — 549,6; х* — — 488,0. Числа xj (J 1, 2) можно трактовать как сумму плат за убыт- ки от уменьшения сельскохозяйственной продукции и дивидентов. Величину i/(S) — x*(i) (L= 3, 4, 5) можно трактовать как выгоду 'города i от объединения с остальными участниками конфликта.
ДОПОЛНЕНИЕ Д.1, Множества и отображения 1. Множества. Множество — это любая совокупность объектов, называемых элементами множества. Если, множество А состоит из элементов а^ а2 и а^ то это записывается следующим образом; А .= {fli, а%) аз}, причем порядок, в котором записаны элементы, не имеет значения. Множество можно определить, указав свойство, которым обладают все его элементы. Так, множество . » л А.=:{а\Р(а)} состоит из всех элементов, которые обладают свойством Р(а). Конечное множество содержит конечное число элементов, а бес- конечное состоит из бесконечного числа элементов. Счетным множеством называется всякое множество, между элементами которого и натуральными числами можно установить взаимно однозначное соответствие, т. е. элементы которого можно занумеровать в бесконечную последовательность: а2, ..., ап, ... Множество. А является подмножеством множества В (обозна- чается А с. В) в том, и только в том случае, если любой элемент . множества А принадлежит также и В. Л ~ _ Множество, не содержащее элементов, называется пустым (обо- значается символом 0). Любое множество содержит 0 в качестве подмножества. < / Объединением множеств А и В называется множество С, эле- менты которого принадлежат по крайней мере одному из мно- жества 4 или В*. " C = 4(JB={c|ce4 или се5}. . Пересечением множеств Аи В называется множество С, эле- менты которого принадлежат как 4, таки В; С ~ А [}В = {с\с А и се В}. у Разностью множеств А л В называется множество С, состоя- щее из элементов множества 4, не принадлежащих, множеству В: С =±= 4\В = {с|с е 4 и с В}. Множества 4<, такие, что^ П 4j = 0 для всех i ф } hU^= = 4, образуют разбиение множества А (каждый элемент из 4 принадлежиТ-ОДному 4<). 21 Г. Н. Дюбин, В. Г. Суздаль ।
322 • . . ДОПОЛНЕНИЕ . Пусть XczR1— множество всех вещественных чисел (геомет- рически—это множество всех точек вещественной оси). Число а называется верхней/границей множества X, если для .любого .х^Х справедливо х а. Аналогично число Ъ — нижняя граница мно- жества А, если для любого х е X справедливо х Ь. Число а — точная верхняя граница множества X е R1, если для любого а', такого7 что а' < а, а' не является верхней границей (обозначается а = sup X). / Число Ь — точная* нижняя граница множества X е R1, если для любого д', такого, что Ь' > Ь, Ь' не является нижней границей (обозначается Ь = inf X). Декартовым произведением А)(В множеств А п В называется множество упорядоченных пар *) элементов А и В: , А^В= {(а, &)|ае=А, &€=£}. Декартово произведение множества А самого на себя —это А X А = А2. Так, если R1 — множество всех вещественных чисел, то R2 —множество всех упорядоченных пар вещественных чисел (геометрически — это множество всех точек на плоскости). . Декартовым произведением множеств Aj, Аг, ..., Ап называет- ся множество упорядоченных n-ок, первый элемент которых при- надлежит А/, второй А2, ..., n-й принадлежит Ап: AiXA2X ... Х^п = ' _‘== {(ei, л2, _..., ап) |€= Ai, л2 €= А2, ..ап еАп}. В частности, Rn — множество всех упорядоченных наборов из п вещественных чисел: Rn i==f {х|х ® (х\, х%, ..з?п)) €= R}. , 2. Отображения. Пусть X и У —два произвольных множества, ~ и пусть имеется правило /, по которому всякому элементу хеХ ставится в соответствие некоторый элемент у е У. Тогда гово- рят, что на множестве X задано отображение f в множестве У (обозначается /: Х->У). Элемент у&Х, который соответствует элементу х е X, называют образом элемента х (обозначается у = ~ =?/(*)). Совокупность всех элементов х е X, образом которых являет- ся данный элемент у е У, называется прообразом элемента у (обо- значается /~*(у)). Пусть АсУ. Тогда множество всех хеХ, для которых f (x) е Л, называют прообразом. • множества А (обозна- чается J"1 (А)). ч Пусть У^ П1 — множество всех вещественных чисел. Тогда - отображение принято называть функцией, X — областью опре- деления данной функции. Если рассматриваются некоторые специ- альные множества X и У, то возникают специальные типы отобра- жений, которые носят особые'названия (мера, функционал, опера- тор и т. д.). ' *) Совокупность элементов (а, Ъ) является упорядоченной па- рой тогда и только тогда, когда из соотношения (а, Ъ) = (а', Ь') следует, что а == а', b = Ъ\
ДОПОЛНЕНИЕ ,323 Пусть функция / задана на * множестве X. Точной верхней гранью функции / на ^множестве X называется наименьшее из всех чисел Л, для которых f(x) А при любом х&Х (обознача- ется sup f(x) или просто sup/(ж)). Аналогично точной нижней л х^Х . г • гранью функции f на X называется наибольшее из чисел А, для которых А f(x) (обозначается inf/(я) или просто inf/(я)). Если точная верхняя грань функции f на X достигается, т. е. существует такое х*еХ, что f(x*) = sup f(x), то она называется максимумом (обозначается max f (х)); Если достигается точная ниж- няя грань, то он называется минимумом (обозначается min/(#)). Д.2. Метрические и топологические пространства /1. Метрическое пространство. Пусть X —некоторое множество, , и пусть на XXX задана функция р(я:, у) (я, у еХ), удовлетво- ряющая следующим условиям: - 1) р(*> У) >0 Va;, у<=Х; ; 2) р(х, у) = р(у, х); ’ ; 3) р (ж, у) = 0 тогда и только тогда, когда х = *у; ' А) ^р(я, У) < р(*, *) + Р(*» У) У> > €= X. . Функция р(а;, у) называется метрикой множества X, а множе- ство X с введенной в нем метрикой, т. е. пара (X, р), называется метрическим пространством (обозначается чаще всего тем же сим- волом, что и само исходное множество). Величина р(а;, у) называ- ется расстоянием между я и у. Множество действительных чисел с расстоянием р(®. у) —I * — у| образует метрическое пространство R1, а множество наборов из п действительных чисел х — (®ь ж2, ...,хп) с расстоянием называется п-мерным арифметическим евклидовым пространст- вом Rn. " > ‘ Другим примером является, дискретная метрика, по которой р(я, У) в 1, если х у, и р(х, у) == 0 при х » у. Пусть X й У — два. метрических пространства и /: X -> У. Тог- да отображение f называется непрерывным в точке, хо е X, если для любого 8 >• 0 существует такое б > 0, что для всех х е X, таких, что , - . р(я, #о) < б, . выполнено неравенство , . _ ' ? Pi(/W, /(^о)) <-е, .. ч . где р — расстояние в X, a pi — расстояние в У. Отображение f, непрерывное во всех -точках пространства X, называется непрерывным на X. . 21*
324 ДОПОЛНЕНИЕ Открытым шаром Кт(х$) радиусаг с центром в точке xQ е е (X, р) называется множество ' < ' Kr(xQ) = е X, р(я, х0) С г}. Замкнутым шаром Хг[яо] радиуса г с центром в точке яое е (X, р) называется множество Xr[z0] = {#|s е X, р(я, Xq) г}.' Открытый шар радиуса 8 с центром в точке xQ называют ^ок- рестностью точки xQ (обозначается 08(#o)). Например, в простран- стве R2 окрестность представляет собой внутреннюю часть круга, рьфруса. 8 с центром в точке , Пусть {яп}^=1 —последовательность точек в метрическом пространстве (X, р) и пусть существует такой элемент х§ е X, что для любого 8 > 0 найдется целое число X, такое, что, если п > N, то р(хп, х0) < 8. Тогда элемент х0 называют пределом последова- тельности {хп} (обозначается 1ппяп = яо). Другими словами, по- П-»ОО следовательностъ {яп} сходится к х0, если lim р(хп, Яо) = 0.’ х П->ОО Множество A cz (X, р) называется компактным, (или компак- том), если из всякой последовательности (хпеХ) можно извлечь такую подпоследовательность что существует предел lim хп == х, причем х е А. fe->OO Ь Пусть (X, р) — метрическое пространство, и пусть A cz X. Точка аеЛ называется внутренней точкой.множества Л, если найдется такое число 8 > 0, что О*(а) <zM, т. е. если существует 8-окрестность точки а, содержащая только точки из Л. Множество, состоящее только из внутренних точек Л, называ- ется открытым. В частности, все 8-окрестности — открытые множе- ства. Открытым множеством является также открытый сегмент (интервал) (а, Ь) вещественной прямой, т. е. множество {aJ^eR1, a <Z х <zb}. . Точка ае Л называется предельной точкой множества Л, если существует такая последовательность (хп (Е Л), что lim хп = а. п->со , , Другими словами, точка й пространства (X, р) называется пре- дельной точкой множества ЛсХ, если для всякого положительного 8 существует точка х е Л, отличная от а и такая, что р(а, х) •< 8. Очевидно, что. конечное множество точек не имеет предельных точек. * • Пусть Л cz (X, р). Замыканием множества А (обозначается [Л]) называется множество, состоящее из всех элементов данного множества и всех его предельных точек. Конечное множество сов- падает со своим замыканием.
ДОПОЛНЕНИЕ 325 t 1 Замкнутым множеством называется множество; совпадающее со своим замыканием: А = [Л]. Следовательно, всякое конечное мно- , жество замкнуто. Примером замкнутого множества служит замкну- тый сегмент (отрезок) [а, &] вещественной прямой, т. е. множество * {х\х е R1 и а х.2^ Ь}\ Множество A cz (X, р) называется ограниченным, если суще- ствует такой элемент xq и такое число г > О, что р(я, я0) для всех х е А. Из этого определения следует, в частности, что замкнутый щар является ограниченным множеством. . Пусть А л В — два множества в метрическом пространстве (X, р). Если [Л] =В, то множество Л называется плотным в В. Множество Л называется всюду плотным, если его замыкание [Л] совпадает со всем пространством X. Функция / называется равномерно непрерывной на X, если для •* любого е > 0 найдется такое 6>0, что из неравенства р(х, x'y<Z б для любых х, х' е X следует неравенство р(/(ж), /(*')) <8. Пространства, в которых имеется счетное всюду плотное мно- жество, называют сепарабельными. . 2.' Топологическое пространство. Пусть X — некоторое множест- во, и пусть т — набор подмножеств X, такой, что: 1) X, 0ет;: - 2) для любых бгЬ (гг е т справедливо Gi П С2 е т; 3) для любых бга е т справедливо (J G„ е т,где у — произ- ае? вольный набор индексов. Тогда говорят, что в X задана топология т, а множество X с заданной в нем топологией т, т. е. пару Т = (X, т), называют то- пологическим пространством. Множества G е т называют открытыми, а множества Т \ G, дополнительные к открытым, называются замкнутыми множества- ми топологического пространства. Множество, которое может быть получено в результате не - более чем счетной совокупности операций объединения и пересе- чения открытых и замкнутых множеств топологического простран- ства, называют борелевским множеством (В-множёство, В-измери- мое множество — множество, измеримое цо Борелю)., Пусть (X, %х) hl (Y, топологических пространства и / :Х->У; тогда / непрерывно в X, если прообраз открытого мно- жества есть открытое множество. Пусть (X, т) — топологическое пространство, {6?v}v ст и Л с с: U Gv. Тогда говорят, что {Grv}v— покрытие А. v Множество A cz (X, т) называется компактом, если из всякого покрытия {6rv}v можно извлечь'конечное подпокрытие. Топологические пространства со счётным всюду плотным мно- жеством, как и метрические, называются сепарабельными.
326 ДОПОЛНЕНИЕ Ответим, что для открытых множеств метрического простран- ства свойства 1) —3) выполняется, т. е. если задана метрика, то за- дана и топология.. Обратно, если в топологическом пространстве X < задать метрику (это не всегда возможно), открытые множества ко- торой совпадают с открытыми множествами топологического про- странства, то говорят,-что X метргЬзуемо. Дг 3. Линейные пространства и выпуклые множества 1. Линейное пространство. .Пусть X — непустое множество эле- ментов х, у, z, ..., называемых векторами, для которых определены операции сложения векторов и умножения вектора на число (или элемент поля К), такие,.что 1) х + у = у + х Ух, у е X (коммутативность); 2) х + (у 4~ z) = (x-J-у) + 2 Ух, y,z^X (ассоциативность); 3) в X существует такой элемент 0, что х + 0 « х Vх<='Х(су- ч ществование нуля); 4) х + (—я) =0 VssX (существование противоположного элемента); * 5) сх(Раг) == (a0)s Ух е X, a, р-е X; 6) 1 — х = х Ух е X, 1 е К; • , - 7) (а 4- Р) гс = ах 4- рх Ух е X, а, р е К; 8) а(х + у) ах 4- ау Ух, у ^Х,а^К. Тогда множество X называется линейным (или векторным) про- странством. Векторы xi, х2, Хъ линейного пространства X называются линейно независимыми, ест лз tow,.что a^xi + 0&2Х2 + ... ,4"C&nXn = 0, - следует, что «1 /= «2 = . —ап = 0. В противном случае векторы линейно зависимы. Если векторы х\, х%, ..хп линейно независимы и любой .век- тор хеХ может быть представлен*в виде линейной комбинации п векторов . X = «1X1 4; a2^2 4" • • • 4” то векторы xf, Х2, ..., хп являются базисом пространства X, а раз- мерность X равна п. _ > Непустое подмножество X' линейного пространства X называет- ся подпространством, если оно само образует линейное пространство по отношению к определенным в X операциям сложения и умно- жения на число. > Пусть Rn — множество всех наборов (x^xz, ...,хп),, и пусть 1) р(я/ у) = VGn —У1)24- (^2 — У2)2+ ... + (Хп — Уп)2, где X = (Х1, Х2, ..^ Хп)9 у == (Уь У2, ...» Уп); 2) х+у. = ((xi-RyO, (х24-У2)г .(яп4-Уп)); 3) ах == (axi, axz, ..., ахп), а е R1. . Тогда Rn называется евклидовым пространством. 2. Выпуклые множества. Пусть X — линейное пространство и . • А с: X. Тогда А называется выпуклым множеством, если для •
ДОПОЛНЕНИЕ 327 любых я, у е А и произвольного числа X е [0, 1] < справедливо Ъх +:(1 — К)у еЛ. Выпуклой оболочкой множества АсХ (обозначается со А) на- зывается множество всех векторов вида х — aia?i+<x2ir2+ ... +апя«, п . где а< > 0 (1 i #), S = 1» е А(1 < i <га). Вектор х на- 1=1 • зывается выпуклой комбинацией векторов Xi, я2, .. •, хп. Линейной оболочкой множества А с X (обозначается £(А)) называется множество всех элементов вида ai#i + оэдг + • • • +an#n, «1, я2, ..хп е A, ar, a2,-..an — произвольные числа. Пусть X —линейное пространство и А — подпространство X, _ • причем существует элемент я0?=А, но L(A, х$) = X* Тог- да А называется гиперплоскостью пространства X. Гиперплоскостью в Rn называется множество ( ' ". ' ( п 1 И = <=1 где ai, а2, .ап, Ь — действительные числа, а == (а1э а2, •••, 0. Гиперплоскость Н порождает два полупространства Н~ и Н+ пространства Rn: н~ н+ Очевидно, что . , Н+ПН- = Н, Н+и Н~ = Н”. ' Точка х называется крайней точкой выпуклого множества А, если х е А и не найдется* таких двух различных точек х\ х" е А и a #=0, что х = ах' + (1 — а)х". Если А — выпуклое ограниченное непустое множество, имею- щее конёчное число крайних точек, то каждая его точка предста- вима в виде выпуклой комбинации крайних точек. -. Пересечение выпуклых множеств А и В выпукло, а объедине- ние может быть кщс выпуклым, так и невыпуклым. Пересечение конечного числа замкнутых полупространств есть выпуклое мно- жество, называемое многогранным выпуклым множеством (мно- гогранником). Вещественная функция /(ж), определенная на выпуклом мно- жестве X, называется выпуклой^ если при любых двух различных точках х\ и xi из X справедливо неравенство ‘ /(a^i + (1 — а)«з) <a/(*i) + (1 — <х)/(^)» где 0 < a < 1,
328 ДОПОЛНЕНИЕ Функция f(x) называется вогнутой, если функция —f(x) вы- пуклая. Функция f(x, у) называется вогнутой похеХ при всех г/е е Y, если для любых xh х2 е X и для любого а е [0, 1], при всех у е Y справедливо неравенство /(axj + (1 — а)я2, у) > а/(а?1, у) + (1 — a)f(x2, у). Функция f(x, у) называется выпуклой по у е У при всех х е X, если для любых у\, y2^Y и для любого а е [0, 1] при всех х е X справедливо неравенство /(х, ayi+ (1 —а)у2) ^а/(ж, lh) + (1.— <х)/(я, у2)« Вогнутую функцию часто называют выпуклой вверх, а выпук- лую — выпуклой вниз. Пусть X, У —линейные вещественные пространства, и пусть функция f(x, у), определенная для любых х, xh х2 е X и у, у\, у2 @ е У, обладаем следующими свойствами: 1) f(axi + $х2, у) = df(xi, у) + р/(х2, у); 2) f(x, ayi + 0у2) = af(x, yi) + $f(x, у2); (а и £ — произвольные вещественные числа). Тогда f —билиней- ная функция tl&XXY. Пусть X = Rn, y = Rm, f(x, у)—линейная функция на Rn+m., Тогда f(x, у) — билинейная функция на Rn X Rm. > * ДЖ Мера ‘ Пусть имеется множество X, и пусть 2 —некоторая система подмножеств X со следующими -свойствами: для каждого Л. gQ (Л=(1, 2, ...) - f • 1) U Ае=Й; ь=1 ' А 2) П Лей; fe=i - < 3) 4\ВеЙ V4, B^Q. Тогда Q называется а-алгеброй на множестве X. Пусть X — множество, 2 — о-алгебра на нем, р — функция, за- данная на 2 со следующими свойствами: ' ' 1) ц(А)^0У^еЙ; 2) для любой последовательности {-4n}n=i>. А П л, = 0, k^i, Тогда ц-называют мерой.
ДОПОЛНЕНИЕ Говорят, что. А имеет нулевую меру^ если ц(Л) = 0. Пусть ц — неотрицательная функция подмножеств топологи- ческого пространства Т, определенная на а-алгебре В-борелевских множеств и такая, что 'сю = 2 Iх (5i)’ если Bi П = & при i =# j. Тогда р называют мерой Вореля. Если мера, определенная на бо- релевских множествах пространства R1, такова, что ее значение на произвольном сегменте равно длине этого сегмента, то ее называют мерой Бореля на прямой. ♦
ЛИТЕРАТУРА 1. Ауман Р., Шепли Л. Значения для неатомических игр.— М.: Мир, 1977. 2. А б ч у В.. А., С у з д а л ь В. Г. Поиск объектов.— Мл Совет- ское радио, 1977. . ' 3. Бак Р. К. Предпочтительные оптимальные стратегии.— В кн.: * Бесконечные антагонистические игры. М.: Физматгиз, 1963. 4. Беляев Н: М.,Сопротивление материалов.—М.: Наука, 1976^ 5. Б л е к у э’л л Д., Гиршик М. А. Теория игр й статистических - решений.—М.: ИЛ, 1958. ч *6. Бондарева О. Н. О теоретико-игровых моделях в экономи- ке.—Л.: ЛГУ им. А. А. Жданова, 1974. 7. Вальд А. Статистические решающие функции.—В кн.: По- зиционные игры/Под ред. Н. Н. Вбробьева. М.: Наука, 1967. 8. Вине p H. Кибернетика и общество.— М.: ИЛ, 1958. 9. Вильямс Дж. Совершенный стратег, или букварь по тео- рии стратегических игр.—М.: Советское^радио, 1960. 10. Воробьев Н. Н. Игра «нападение — защита».—Литовский математический сборник, 1968, №8. И. Воробьев Н. Н. Математическая теория игр.—Л.; Знание, 1963. 12. Воробьев Н. Н. Методологические вопросы теории игр.—«' Вопросы философии, 1966, № 1. 13. Воробьев Н. Н. Об одном классе, игр на единичном квадра- те с разрывной функцией выигрыша.— В кн.; Теория игр. Ере- ван: Изд-во АН Арм. ССР, 1973. 14. Воробьев . Н. Н. Принцип оптимальности Нэша для общих арбитражных схем.— В кн.: Теоретико-игровые вопросы приня- тия решений. Л.: Наука, 1978. 15. Воробьев Н. Н. Об одной. теоретико-игровой модели опти- мального распределения ограниченных ресурсов.— В. кн,:4 При- v менение математики в экономике. Л., 1975. 16. Воробьев Н. Н. Применение теории игр в технических нау- ках.—In: IV Internationaler Kongress liber Anwendungen det Mathematik in .den Ingeneurwissenschaften. Weimar, 1967, Bdl, Berlin, 1968. / 17. Воробьев H. H. Теория игр: Лекции для экономистов-ки- бернетиков.—Л.: ЛГУ, 1974. 18. Воробьёв Н. Н. Теория игр.— М.: Знание, 1976. 19. Воробьев Н. Н. Современное состояние теории игр.— В. кн.: Теория игр. Ереван, 1973, 20. Воробьев Н. Н. Расчлененные стратегии в позиционных ш> Вах.— Проблемы кибернетики, выл. 7, 1962. оробьёв Н. Н. Бескоалиционные игры.—Проблемы кибер- нетики, выл. 33j 1978. 22. Г л и к с б е р г И. Л. Дальнейшее обобщение теоремы Какута- ни о неподвижной точке с приложением, к ситуациям равно-
’ ЛИТЕРАТУРА х 331 весия*в смысле Нэша.— В кн.: Бесконечные антагонистические игры/Под ред. Н. Н. Воробьева. М.: Физматгиз, 1963. 23. Д р е ш е р М. Стратегические игры.— М.: Советское радио, 1964. 24. Дю бин Г. Н. Об играх на единичном квадрате с функцией выигрыша типа «крыша».—Теория вероятностей и ее приме- нения, 1968, т. 13, выл. 1. 25. Дю б ин Г. Недостаточное условие, совпадения ядра коопера- тивной игры с ее решением.— В кн.: Теория игр. Ереван, 1973.' 26. Дюбин Г. Н. О функции Шепли для игр с бесконечным чис- лом игроков.— В кн.: Теоретико-игровые вопросы принятия ре- шении. Л.: Наука, 1978. 27. Д ю б и н Г. Н. Об одном классе игр на единичном квадрате.— Доклады АН СССР, 1968, т. 181?№ 1. 28. Иосида К. Функциональный анализ.—М.: Мир, 1967. 29. Карлин С. Математические методы в теории игр, программи- рование и экономике.— М.: Мир, 1964. 30. Корбут А. А., Финкельштейн Ю. Ю. Дискретнре прог-, раммирование.—М.: Наука, 1969. 31. Кун ЛГ. У. Позиционные игры и проблема информаций.— В кн.: Позиционные игры. М.: Наука, 1967. > z 32. Л о э в М. Теория вероятностей.— М.: ИЛ, 1962. ' ' _ 33. Луценко М. М. Задачам встрече на компакте.—В кн.: Тео- рртиксг-игровые вопросы принятия решений. Л.: Наука, 1978. > 34. Лью с Р. Д., Райфа^Х. Игры и решения.—М.: ИЛ, 1975. 35. Мак-Кинси Д. Введение в теорию игр.—М.: Физматгиз, 1960. \ 36. Нейман Дж. фон., Моргенштерн О. Теория игр' и экономическое поведение.— М.: Наука, 1970. 37. Нейман Дж. фон. К теории стратегических игр.—В кн.: Матричные игры. М.: Физматгиз, 1961. 38. Нэш Дж. Бескоалиционные игры.—В кн.: Матричные игры. / М.:.Физматгиз, 1961. 39. Оуэн Г. Теория игр.—М.: Мир,*1971. 40. П а р т х,а с а р а т х и Т., Р а г х а в а н Т. Некоторые вопросы теории игр двух- лиц. — М.: Мир, 1974. 41. Петросян Л. А., Тышко Н. М. Об одном приложении тео- рии игр п лиц к экономике;—В кн.:'Математические методы в социальных науках, вып. 8. Вильнюс, 1976. 42. П и т т е л ь Б. Гл, Ф е д о<р о в В. П; Математическая, модель про- -гноза пассажиропотоков в городской транспортной сети.—Эко- номика и тематические методы, 1969, т. V, № 5. 43. Р а м м В. Г. Свойства равновесия в интегральных играх.— В кн.: Научные труды (III Всесоюзная конференция по теории игр). Одесса, 1974. * А _____а 44. Розенмюллер И. Кооперативные игры и рынки.—М.: Мир, 1974. 45. Романовский И. В. О сведении игры с полной памятью к матричной игре.—Доклады АН СССР, т. 144, z1962, № 1. - 46. С аят и Т. Л. Математические модели конфликтных ситуа- ций,— М.: Советское радио, 1977. 47. Суздаль В. Г. Теория игр для флота.—М.: Воениздат, 1976. 4& Суздаль В. Г. К вопросу адекватности отображения теоре- тико-игровыми моделями конфликтных ситуаций в теории при-
332 ЛИТЕРАТУРА нятия решений.—В кн.: Труды VI симпозиума по кибернети- ке. Ин-т кибернетики АН СССР, 1972. 49. Суздаль В. Г. Теоретико-игровая модель волейбола и ее ис- пользование для выбора оптимальной тактики' доигровок.— ч В кн.: Успехи теории игр. Вильнюс: Минтае, 1973. 50? Теория прогнозирования и принятия решений/Под ред. ' С. А. Саркисяна.— М.: Высшая школа, 1977. - '51. Тимошенко С. П., Гудьер Дж. Теория упругости.—М.: Наука, 1975. 52. Хай Г. А. Теория игр в хирургии.— Л.: Медицина, 1978* 53. Яновская Е. Б. Антагонистические игры,— Проблемы ки- бернетики, вып. 34. М.: Наука, 1978. 54. A u шапп R. J. Integrals of set-valued function.— Journal of Mathematical analysis and application. New York, London: Acade- mic Press, 1965, 12, № 1. ' 55. Borel E. La theorie du jeu ea les equations integrates a noyan symetrique.— Comptes Rendus de L’Academic des Sciences, 1921, 173.' The theory of play and integral equations With skew symmetric v • Kernels.—Econometrica, 1953, 21, № 1. ( 56. Everett H. Recursive games.—Contributions to the Theory of z Games, 1957, 3. - 57. F a n K. Fixed point and minimax theorems in locally convex to- pological linear spaces.—Proc. Nat. Acad. Sci. USA., 1952, 38, f p. 121—126. ' . * Amer. Math. Soc., 1952, 3. 58? H ansell R. L, Marchi E. Aspects of evolutionary theory and t the theory of games.— tect. Notes Biomath. 1974, v. 2, p. 66—72. 59. H о d g e s J. L., Lehmann E. L. Some problems in minimax point estimation,— Annals of Mathem. Statistics, 1950, v. 21. . , 60. Hill W.xA. A Military Application of Game Theory 1— Math/Mo- dell. London, 1976, p. 183—198. 61. M a r c h i E., T a r a z a d a P. The minimax theorem for continu- ous games using an elimination procedure.— International Jour- nal of Game Theory. Vienna, 4977, 6. - 62. M о g 1 e w e г S. A Game theory model for agricultural crop se- lection.— Econometrica, 1962, 30, № *2. 63. N a s h J. The bargaining problem.— Econometrica, 1950, 18, № 2, ' p. 155—162. Л 64. i Or kin M. Recursive matrix games.—S. Appl. Probab., 1972,-9, № 4, p. 813—820. > 65. S h a p 1 e у L. S.*A value for n-person games.— In: Contributions to the theory of games, v. 2/H. W. Kuhn and A. W. Tucker, eds. Princeton, Princeton univ press.,4 1953.— (Annals of mathematics studies; № 28). 66. S hap ley L. S. Stochastic games.—Proc. Nat. Acad. Sci. USA, 1953,39. • , - '67. Schmeidler D. Equilibrium points of non-atomic games.— Discussion paper № 7022, 1970.— International center for Mana- gement sciences affiliated with the Center for operations Research and Econometrics^ 68. Schmeidler D. The nucleons of a characteristic function ga- me.- SIAM J. Appl. Math., 1959, v. 17, № 6, p. 1163—1470. J
ЛИТЕРАТУРА 333 69. Smith I. M. The theory of . games and evolutions of animal con- - flict.— J. Theor. Biol., 1974, v. 47, № 1, p. 209—221. 70. Suzu'kiMitsuo, N a к a g a m a Mikio. The cost assignment of the cooperative water resource development. A game thepreti- . cal approach.— Leet. Notes Econ. and Math. Syst., 1977, 141, p. 615-625. 71. Thomas M. U. and N i s g a v I. An infiltration game with time dependent payoff.— Nav. Res. Log. Quart.; 1976, 32, № 2, p. 297— 302. 72. V i 11 e J. Sur la theorie generale, des jeux ou intervient I’habi- lite des joueiirs.— In: Traite du calcul des probability et de ses^ applications. Applications des jeux de hasard/E. Borel et collab. . Paris: Gauthier-Villars, 1Q38. ' - - 73. Zermelo E. Uber eine Anwendung der Mengenlehre auf die Theorie des Schachsyiels.—Pfoc. of tne fifth International Con- gress of Mathematicians (Cambridge^ 1912). Cambridge Univer- sity Press, 1913, p. 501—504., ДОПОЛНИТЕЛЬНАЯ ЛИТЕРАТУРА 1. Бесконечные антагонистические игры: Сб. под ред. Н. Н. Во- робьева.—М.: Физматгиз, 1963. / < г./Беленький В. 3., Волконский В. А., Иванков С. А. е и др. Итеративные методы в теории игр и программирова- нии.—М.: Наука, 1974. . . 3. В ат е л ь И. Д., Ерешко Ф. И. Математика конфликта и со- трудничества.— М.: Знание, 1973. . 4. Вате ль И. А., Ерешко Ф. И., Кононенко А. Ф. Игры с фиксированной последовательность^) ходов и иерархические системы управления в экономике.— В кн.: Методы оптимизации и их приложение. Иркутск: Изд-во СЭИ, 1974. 5. В е н т ц е л ь Е. С. Элементы теории игр.— М.: Физматгиз, 1961. - 6. В е н т ц е л ь Е. С. Задачи и основные принципы теории игр.— Математика в школе, 1962, № 4. , 7. В и лк ас Э. И. Аксиоматическое определение значения мат- ричнрй игры.— Тёория вероятностей и ее применение, 1963, т. 8, 8. В и л к а с Э. И. Ситуации равновесия в бескоалиционных, играх многих лиц.—Лит. мат. сб., 1967 (1968), т. 7, № 4. 9. Гермейер Ю. Б. Игры с непротивоположными интереса- ми.— М.: Наука, 1976. 10. Гермейер К). Б., Кононенко А. Ф. Игры со вспомога- тельными критериями эффективности.— Изв* АН СССР.” Техни- ческая кибернетика, 1, 1973. И. Гермейер Ю. Б., Ерешко Ф. И. Побочные платежи в иг- рах с фиксированной последовательностью ходов.— ЖВМ и МФ, 14; № 6, 1974. 12. Г е р м е й е р Ю. Б., В а т е л 6 И. А. Игры с иерархическим век- тором интересов.—Изв. АН СССР. Техническая кибернетика, 3, 1974. \ ' • 13. Г о р е л и к В. А. Приближенное нахождение максимина с огра- ничениями,-связывающими переменные.— ЖВМ и МФ, 12, № 2, 1972.
334 ЛИТЕРАТУРА 14. Давыдов Э. Г. Методы и модели теории антагонистических игр,— М.: Изд-во МГУ, 1978. 1 15. Демьянов В. Ф., М алоз ем о в В. Н. Введение в мини- макс.—М.: Наука, 1972. 16. Кононенко А. Ф., Кукушкин Н. С. Смешанные страте- . гии в играх с фиксированной последовательностью ходов,— , ДАН СССР, 209, № 6, 1973. 17. Матричные игры: Сб. под ред. Н. Н. Воробьева.—М.: Физмат- * гиз, 1961. 18. Моисеев Н. Н. Элементы теории оптимальных систем.— М.: ; Наука, 1975. ' / . . 19. М о ло д ц о в Д. А. Модель Гросса в случае непротивоположных интересов.— ЖВМ и МФ, 12, № 2, 1972. 20. Морозов В. В. Об одном способе, образования коалиций.— ЖВМ и МФ, 11, № 3, 1971. 21. Позиционные игры: Сб. под ред. Н. Н. Воробьева.— М.: .Наука, 1967. * ... 22. Применение теории игр в военном деле: Сб. под ред. В. О. Аш- кеназы.— М.: Советское радио, 1961. . 23. Теория игр: Аннотированный указатель - публикаций, под ред. Н. Н. Воробьева.— М.: Наука, 1976. 24. Теория игр. Сб.— Ереван: Йзд-во АН Арм. ССР,'1973. 25. Теоретико-игровые вопросы принятия решений: Сб. под ред. Н. Н. Воробьева.—Л.: Наука,, 1978. 26. Федоров В. В. О методе штрафных функций в задаче опре- деления максимина.—ЖВМ и МФ, 9, № 3, 1969. 27. L u с a s' W. F. Some recent ~ developments in А-person game theory.— SIAM Rev., 1971, 13, № 4, "28 . Lucas W. F. An-overview of the mathematical theory of games.— Manag. Sci., 1972, 18, № 5.
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Аксиомы Нэша 268 — Шепли 282, 283, 292 Альтернатива 165 Арбитражная схема 268. Вектор Шепли 282, 283 Выигрыш 13 Дележ 273 ' Дерево игры 164, 1-65 Диаграмма игры 165 Дисконтирующий множитель 178 * Доминирование 275 . Допустимое множество 267 Значение игры 17, 23 —.— верхнее 15, 22 — нижнее 14, 22 Игра 8 — антагонистическая 13 — бескоалиционная п лиц 232 с бесконечным . числом игро- - ков 240—243 — бесконечная, 105 — биматричная .233 — в 0—1-редуцированной форме 277 — детерминированная 175, 176 — конечная 13 — кооперативная п лиц 272 — — С бесконечным числом игро- ков 290—298 — матричная 14 — нестратегичебкая И — несущественная 273 ' — позиционная 168 s — против природы 57 — рекурсивная 482—188 — с нулевой суммой 239 — с полной информацией 169 — — — памятью 173 — с постоянной, суммой 239 — стохастическая 176—182' — стратегическая И — существенная 273 Игрок 8 Исход 9 Матрица выигрышей 14 Множество очередности 166 — информационное 166 * •' Нормальная форма 169 — ПодыгЬа 39 Позиционная структура 167 Позиция 165 Принцип максимина 15 — оптимальности 14 ---по Нэшу 268 — — по Парето 268 — равновесия 16. 234 Решение игры 35, 108 — —.по Нейману — Моргенштерну 280 • Седловая точка 17 Ситуация равновесия. 16, 33. 108, 234 — е-равновесия 112 Смешанное расширение игры 21, 106, 234 Спектр смешанной стратегии 37, 38, Стратегия 13 — максиминная 14, 22, 107 — минимаксная 15, 22, 107 „ - ' — оптимальная 33, 108 — поведения 174 — . смешанная 19, 106 — стационарная 179 — строго доминируемая 37. 113 — чистая 13 Теорема о минимаксе 22, 27, ЭД —>о неподвижной точке 235 — о разделяющей , гиперплоскости Усечение игры 170, Функция выигрыша 13, 169 — характеристическая 272 Коалиция 272 Конфликт 7 Математическое ожидание выигры- ша 21 Эквивалентность стратегическая 238, 239 Эксцесс дележа 287 ' 71-ядро 287, 288 с-ядро 279 .
УКАЗАТЕЛЬ ОБОЗНАЧЕНИЙ А = |]%‘[Г— матрица выигрышей игрока I в биматричной игре В = || 6 -1 — матрица2 выигрышей игрока II в биматричной игре Г — игра I — множество игроков " ч Rn — гагмёрное; евклидово пространство Я —функциж вьшгрыша игрока . Я (я, у) — выигрыш (математическое ожидание ^выигрыша) пг- рока-в ситуации (х, у) 2 Я — матриц выигрышей игрока I в матричной игреч р(Г)— верхнее значение-игры z v[T) — верхнеезначениеигры • • v — значенияигры val Г — значения-игры Г х листая стратегия' игрока I в антагонистической (биматрич- ной) игре (я, у) — ситуация в чистых стратегиях бесконечной антагони- стической (биматричной) игры Xi — чистая стратегия игрока i в игре га, лиц х = (xi, ..хп) — ситуация в чистых стратегиях игры п лиц х — множество чистых стратегий игрока I в антагонистиче- ской (биматрйчной). игре п ' Х\=1 Sixмножество ситуаций в чистых стратегиях игры п лиц X— смешанная стратегия игрока I в антагонистической (бимат- ричной) игре (X, У) —ситуация в смешанных стратегиях антагонистической (биматричной) игры , - Xi — смешанная стратегия игрока i в .игре га лиц Х|— множество смешанных стратегий игрока I в игре га лиц ' X , • • •» —ситуация в смешанных стратегиях игры га лиц П . ' X = IIv।—мнбжество ситуаций в смешанных стратегиях и 1=1 ры га лиц g — вероятность выбора игроком I чистой стратегии в матрич- ной (биматричной) игре р — вероятность выбора игроком II чистой- стратегии в мат- ричной (биматричной) игре