Автор: Шикин Е.В.  

Теги: математика   теория игр  

ISBN: 5-354-00324-5

Год: 2003

Текст
                    Ц Е.В.Шикин
E*4i
~-*"


Ε. Β· Шикин От ИГР к ИГРАМ Математическое введение Издание второе, исправленное УРСС Москва· 2003
ББК 22.18 Шикин Евгений Викторович От игр к играм. Математическое введение. Изд. 2-е, исправл. — М.: Едито- риал УРСС, 2003. — 112 с. ISBN 5-354-00324-5 Цель этой книги — в сравнительно доступной и живой форме познакомить читателя с современной математической теорией игр. На большом количестве конкретных примеров в ней рассматриваются и подробно решаются простейшие матричные, биматричные и позиционные игры двух лиц, приводится постановка типичных задач для некоторых других классов игр. От читателя требуются минимальные представления о некоторых первоначальных понятиях, фактах и элементарных методах из аналитической геометрии, линейной алгебры и теории вероятностей. Для школьников старших классов школ и лицеев с математических специализацией, студентов младших курсов и для всех, кто интересуется современным состоянием математики и ее приложениями к практическим задачам. Издательство «Едиторяал УРСС». 117312, г. Москва, пр-т 60-летия Октября, 9. Лицензия ИД №05175 от 25.06.2001 г. Подписано к печати 20.03.2003 г. Формат 60x90/16. Тираж 960 экз. Печ. л. 7. Зак. № 2-936/141. Отпечатано в типографии ООО «Рохос». 117312, г. Москва, пр-т 60-летия Октября, 9. ИЗДАТЕЛЬСТВО УРСС НАУЧНОЙ И УЧЕБНОЙ ЛИТЕРАТУРЫ E-mail: URSS@URSS.ai Каталог изданий в Internet http://URSS.ru Тел./факс: 7 (095) 135-44-23 Тел./факс: 7 (095) 135^*2-46 ISBN 5-354-00324-5 Ε. В. Шикин, 1998,2003 ι Едиториал УРСС, 2003
...Игра — не философия и не религия, это особая дисциплина, по своему характеру она родственна больше всего искусству... Г.Гессе «Игра в бисер» Побудительным мотивом для написания этой книжки было намерение рассказать о простейших задачах, имеющих игровую природу, о том, какими могут быть типичные решения подобных задач и какой именно должна быть вязь шагов для того, чтобы научиться находить эти решения в описываемых и в схожих с ними ситуациях. Предложенные рекомендации имеют наглядный графический характер и могут быть освоены читателем, не слишком загруженным математическими познаниями, но готовым затратить некоторые усилия. Мне кажется вполне уместным начать рассказ с одной обширной цитаты, в которой довольно ясно обозначены трудности, встающие перед задумавшим поговорить сколь-либо содержательно обо всех играх сразу. Я имею в виду игры на доске, карточные игры, игры в мяч, спортивные игры и т.д. Что свойственно им всем? — Не говори: «Должно быть нечто общее, иначе бы они не назывались «играми», — но посмотри, есть ли что-нибудь общее для них всех. — Ведь когда ты смотришь на них, ты видишь не что-то общее им всем, а подобия, сходства, причем целый ряд. Как уже было сказано: не думай, а
4 смотри! Погляди, например, на игры на доске с их многообразными сходствами. Затем перейди к карточным играм: здесь ты найдешь множество соответствий с первой группой, но много общих терт исчезнет, зато появятся другие. Если мы далее обратимся к играм в мяч, кое-что общее сохранится, но многое утратится. — Все ли они «развлекательны»? Сравни шахматы и «крестики-нолики». Или: всегда ли есть победа и поражение или соперничество между игроками? Подумай о пасьянсах. В играх с мячом есть победа и поражение; но если ребенок бросает мяч в стену и ловит его, то этот признак исчезает. Посмотри, какую роль играют ловкость и удача. И сколь различны ловкость в шахматах и ловкость в теннисе. Теперь подумай о хороводах: здесь есть элемент развлечения, но как много других черт исчезло! И таким образом мы можем пройти через многие и многие группы игр. И увидеть, как сходства то появляются, то снова исчезают. Результат этого рассмотрения звучит так: мы видим сложную сеть сходств, переплетающихся и пересекающихся. Сходств больших и малых. Я не могу придумать лучшего выражения для характеристики этого сходства, чем «семейное сходство»; ибо именно так переплетаются и пересекаются различные линии сходства, существующие между членами семьи: рост, черты лица, цвет глаз, походка, темперамент и т. д. и т. п. И я буду говорить: «игры» образуют «семью». L. Wittgenstein "Philosophical investigations" Цель этой небольшой книжки — в сравнительно доступной форме рассказать об играх двух лиц. Накладывая такое ограничение, мы вполне сознательно резко сужаем класс рассматриваемых задач. Но даже и в этом случае затрагиваемую тему никак нельзя назвать простой. Поэтому, несмотря на в целом вводящий характер книжки, она имеет ряд особенностей, не совсем обычных у изданий, предназначенных для первого знакомства. В частности, желательно, чтобы читатель имел определенные представления (не слишком, впрочем, обременительные) о некоторых первоначальных понятиях, фактах и простейших методах из аналитической геометрии, линейной алгебры и теории вероятностей. Мы выделяем из необъятной области игр только самую малую часть и пытаемся рассуждать о них формально упрощенно, в частности, для того, чтобы читатель мог поразмышлять над некоторыми полученными выводами и, если захочет, сам цройти по
5 путям, к этим выводам приводящим. Те ограничения, которые мы буцем вводить в наши рассмотрения, диктуются лишь желанием размеренной постепенности знакомства с этой действительно разнообразной и непростой областью. Автор очень стремился к тому, чтобы изложение было, по возможности, доступным. Несколько серьезных вкраплений в виде теорем следует воспринимать скорее как дополнительные указания для той части читателей, чей интерес к играм не ограничится чтением только данной книжки. Однако, если вы желаете знать мое мнение, я бы предложила посвятить самые жаркие часы не игре, потому что от нее неминуемо портится расположение духа у одних участников, а другим, равно как и зрителям, она тоже особого удовольствия не доставляет... Дж. Боккаччо «Декамерон»
Издательство УРСС Представляет Вам свои лучшие книги: Краснов М. Л., Киселев А. И., Макаренко Г. И., Шикин Е. В., Заляпин В. И., Соболев С. К. Вся высшая математика. В шести томах. Предлагаемый учебник впервые вышел в свет з виде двухтомника сначала на английском и испанском языках в 1990 году, а затем на французском. Он пользуется большим спросом за рубежом. В 1999 году книга в дополненном и обновленном варианте стала лауреатом конкурса по созданию новых учебников Министерства образования России. Этот учебник адресован студентам высших учебных заведений (в первую очередь будущим инженерам и экономистам) и охватывает практически все разделы математики, но при этом представляет собой не набор разрозненных глав, а единое целое. Первый том включает в себя материал по аналитической геометрии, линейной алгебре, некоторым разделам математического анализа (введение в анализ, дифференциальное исчисление функций одной переменной). Второй том включает в себя материал по некоторым разделам математического анализа (неопределенный и определенный интегралы, функции нескольких переменных) и дифференциальной геометрии. Третий том включает в себя материал по некоторым разделам математического анализа (числовые, степенные, функциональные ряды, ряды Фурье) и обыкновенным дифференциальным уравнениям. Четвертый том включает в себя материал по векторному анализу, теории функций комплексного переменного, дифференциальным уравнениям с частными производными и некоторым разделам математического анализа (кратные и криволинейные интегралы, интегралы, зависящие от параметра). Пятый том включает в себя материал по теории вероятностей, математичесхой статистике и теории игр. Шестой том включает в себя материал по вариационному исчислению, линейному программированию, дифференциальным уравнениям, сплайнам. Арнольд В. И. Математические методы классической механики. Арнольд В. И., Козлов В. Я, Нейштадт А. И. Математические аспекты классической и небесной механики. Лионе Ж.-Л. Некоторые методы решения нелинейных краевых задач. Магарил-Илъяев Г. Г., Тихомиров В.М. Выпуклый анализ и его приложения. Галеее Э. М. Оптимизация: теория, примеры, задачи. Драгапин А. Г., Колмогоров А. Н. Избранные труды по логике и философии математики. Петкевич В. В. Основы механики сплошных сред. Эльсголъц Л. Э. Дифференциальные уравнения и вариационное исчисление. Ш^^^УШ^жх-г ^* *жз 4^
Введение Однажды играли в карты у конногвардейца Нарумова. А. С. Пушкин «Пиковая дама» В практической деятельности весьма часто приходится рассматривать явления и ситуации, в которых участвуют две (или более) стороны, имеющие различные интересы и обладающие возможностями применять для достижения своих целей разнообразные действия. Подобные явления и ситуации принято называть конфликтными, или просто конфликтами. Студент приходит на экзамен, тянет билет и... возникает конфликтная ситуация. Действия сторон — студента и преподавателя — различны, да и их интересы не во всем совпадают. Разбойники делят добычу — снова конфликт. Конфликтна и ситуация, в которую волею сочинителя оказываются вовлеченными три девицы, что «...под окном Пряли поздно вечерком». Типичный конфликт характеризуется тремя основными составляющими: ' 1) заинтересованными сторонами, 2) интересами этих сторон и 3) их возможными действиями.
8 Введение Любая конфликтная ситуация, взятая из реальной жизни, как правило, довольно сложна. Ее изучение, к тому же, затруднено наличием многих и очень разных обстоятельств, часть из которых ни на развитие конфликта, ни на его исход сколь-либо существенного влияния не оказывает. Поэтому для того, чтобы анализ конфликтной ситуации оказался возможным, необходимо от этих второстепенных факторов отвлечься, что при удачном стечении обстоятельств позволяет построить упрощенную формализованную модель конфликта, которую принято называть игрой и которая отличается от реальной конфликтной ситуации еще и тем, что ведется по вполне определенным правилам. Попробуем разобраться, почему для обозначения конфликтных ситуаций было выбрано именно это слово. Берем «Толковый словарь живого великорусскаго языка Владимира Даля» (в последние годы подобное обращение считается правилом хорошего тона и носит почти ритуальный характер) и на седьмой странице 2-го тома третьего издания (издание т-ва М. О. Вольфъ, С. Петербург — Москва, 1905) читаем, что игра — это «забава, установленная по правилам». Именно то, что забавы многообразны — от народных и биржевых до карточных и военных — и весьма часто протекают по установленным правилам, и явилось, по-видимому, основной причиной превращения в XX веке привычного каждому с детства слова игра в математический термин. Необходимость изучения и анализа конфликтов, представляемых в виде упрощенных математических моделей (игр), вызвала к жизни специальный математический аппарат — теорию игр. Опишем некоторые основные понятия, используемые в этой теории. Заинтересованные стороны называются игроками. Любое возможное для игрока действие (в рамках заданных правил игры) называется его стратегией. В условиях конфликта каждый игрок выбирает свою стратегию, в результате чего складывается набор стратегий, называемый ситуацией. Заинтересованность игроков в ситуации проявляется в том, что каждому игроку в каждой ситуации приписывается число, выражающее степень удовлетворения его интересов в этой ситуации и называемое его выигрышем в ней.
Введение 9 Протекание конфликта состоит в выборе каждым игроком своей стратегии и в получении им в сложившейся ситуации выигрыша из некоторого источника. На этом пути создается теория игр с выигрышами. В спортивных карах выигрыш выражается в очках, в азартных — в денежных призах, в народных меряется удовольствием. Однако оценка игроком ситуации путем указания его выигрыша, вообще говоря, не всегда возможна практически и даже не всегда имеет смысл. В подобных случаях иногда удается вместо прямых численных оценок ситуаций указывать на их сравнительную предпочтительность для отдельных игроков. На этом пути создается теория игр с предпочтениями, включающая в себя теорию игр с выигрышами как частный случай. «На леву ехати — богатому быть, На праву ехати — женату быть, Как прямо ехати — живу не бывати, — Нет пути ни прохожему, ни проезжему, ни пролетному». И раздумался старый Илья Муромец, Илья Муромец, сын Иванович: Да в которую дороженьку буде ехати? В дальнейшем мы ограничимся рассмотрением только игр с выигрышами. Изучение игр можно проводить с различных точек зрения. Мы будем стремиться к — выработке принципов оптимальности, то есть того, какое поведение игроков следует считать разумным, или целесообразным, — выяснению реализуемости этих принципов, то есть установлению существования оптимальных в выработанном смысле ситуаций и — отысканию этих реализаций. Одной из плодотворных форм воплощения представлений об оптимальности можно считать; понятие равновесия, при котором складывается такая (равновесная) ситуация, в нарушении которой не заинтересован ни один из игроков. Именно ситуации равновесия могут быть предметом устойчивых договоров между игроками (ни у одного из игроков не будет
10 Введение мотивов к нарушению договора). Кроме того, такие ситуации являются выгодными для каждого игрока: в равновесной ситуации каждый игрок получает наибольший выигрыш (разумеется, в той мере, в какой это от него зависит). Если в игре ситуации равновесия (в пределах отпущенных возможностей) нет, то, оставаясь в условиях стратегий, имеющихся у игроков, мы сталкиваемся с неразрешимой задачей. При возникновении подобных случаев естественно ставить вопрос о таком расширении первоначального понятия стратегии, чтобы среди ситуаций, составленных из новых, в том или ином смысле обобщенных стратегий, заведомо нашлись бы равновесные. Если такие обобщенные стратегии существуют, то обычно они представляются некоторыми комбинациями исходных стратегий (при этом, естественно, предполагается, что игра повторяется многократно). Для того, чтобы отличать прежние стратегии от новых, первые называют чистыми, а вторые — смешанными стратегиями0. Сказанное мы проиллюстрируем на примере одного из самых простых, но одновременно и наиболее изученных и продвинутых классов игр, на так называемых матричных играх. Исследование матричных игр интересно еще и потому, что многие игры более общего вида могут быть сведены к ним приближенно. Затем мы рассмотрим еще два вида конечных игр — позиционные игры и би- матричные игры. У математиков Игра достигла большой подвижности и способности к совершенствованию, как бы уже осознав себя самое и свои возможности... Г.Гессе «Игра в бисер» *' Весьма плодотворным является представление смешанной стратегии как случайного выбора игроками их чистых стратегий, при котором случайные выборы различных игроков независимы в совокупности, а выигрыш каждого из них определяется как (математическое) ожидание случайного выигрыша. Игра, преобразованная таким образом, обычно называется смешанным расширением исходной игры.
Матричные игры ...в картах важна взнузданность чувств... В. В. Иванов «У* Рассмотрим игру, в которой участвуют два игрока, причем каждый из игроков имеет конечное число стратегий. Обозначим для удобства одного из игроков через А, в другого — через В. Предположим, что игрок А имеет т стратегий — Аи А2)..., Ат, а игрок В имеет η стратегий Ви В2,..., Вп. Пусть игрок А выбрал стратегию Ai9 а игрок В — стратегию Вк. Будем считать, что выбор игроками стратегий А{ и Вк однозначно определяет исход игры — выигрыш aik игрока А и выигрыш bik игрока В, причем эти выигрыши связаны равенством bik = ~aik (отрицательный выигрыш на бытовом языке обычно называют проигрышем). Последнее условие показывает, что в рассматриваемых обстоятельствах выигрыш одного из игроков равен выигрышу другого, взятому с противоположным знаком. Поэтому при анализе такой игры можно рассматривать выигрыши только одного из игроков. Пусть это будут, например, выигрыши игрока А. Значения aik выигрыша при каждой паре стратегий (в каждой ситуации) {Ai, Вк}9 г = 1,2,..., ш, к = 1,2,..., η (если они, ко-
12 Матричные игры нечно, нам известны), удобно записывать или в виде прямоугольной таблицы, строки которой соответствуют стратегиям игрока А, а столбцы — стратегиям игрока В: А1 А2 Ат в, ап <*2\ «ml в2 . а12 . а22 · «т2 · ·. В η .. аХп . · я2„ &тп или в виде матрицы / ап аи ... ain \ Λ — Ι α21 α22 · · · а2п Ι V «ml am2 · · · amn J Полученная матрица имеет размер га χ η и называется матрицей игры, или платежной матрицей (отсюда и название игры — матричная). Рассматриваемую игру часто называют игрой тхп или тхп игрой. Замечание. Матричные игры относятся к разряду так называемых антагонистических игр, то есть игр, в которых интересы игроков прямо противоположны. Пример 1. Каждый из двух игроков А и В одновременно и независимо друг от друга записывает на листе бумаги любое целое число. Если выписанные числа имеют одинаковую четность, то игрок А получает у игрока В 1 рубль, а если разную, то наоборот — игрок А платит 1 рубль игроку В. У игрока А две стратегии: Αχ — «записать четное число» и А2 — «записать нечетное число». У игрока В такие же две стратегии: В\ — «записать четное число» и В2 — «записать нечетное число». Выбор игроками соответственно стратегий А{ и Вк однозначно определяет исход игры — выигрыш игрока А. Матрица этой 2x2 игры имеет следующий вид (-: 1) (здесь строки соответствуют стратегиям игрока А, а столбцы — стратегиям игрока В).
§ 1. Равновесная ситуация 13 §1. Равновесная ситуация ...ведь игра соблазнительная вещь. К В. Гоголь «Игроки» Рассмотрим следующий пример. Пример 2. Два игрока А и В, не глядя друг на друга, кладут на стол по картонному кружку красного (г), зеленого (g) или синего (Ь) цветов, сравнивают цвета кружков и расплачиваются друг с другом так, как показано в матрице игры (1J :) (напомним, что у этой 3 χ 3-матрицы строки соответствуют стратегиям игрока А, а столбцы — стратегиям игрока В). Считая, что эта 3 х 3 игра повторяется многократно, попробуем определить оптимальные стратегии каждого из игроков. Начнем с последовательного анализа стратегий игрока А, не забывая о том, что, выбирая стратегию игрока А, должно принимать в расчет ответную стратегию игрока В, которую он может выбрать так, чтобы свести выигрыш игрока А к минимуму. Так, на стратегию At он может ответить стратегией Bt (минимальный выигрыш равен -2, что на самом деле означает проигрыш игрока А, равный 2), на стратегию Ag —- стратегией Bg или Въ (минимальный выигрыш игрока А равен 1), а на стратегию Аъ — стратегией Вг (минимальный выигрыш игрока А равен -3). Запишем эти минимальные выигрыши в правом столбце таблицы Л Л Ль в, -2 , 2 3 *g 2 1 -3 д> -1 1 1 -2 1 -3 шахшш. Неудивительно, что игрок А останавливает свой выбор на стратегии Ag, при которой его минимальный выигрыш максимален (из трех чисел —2, 1 и —3 максимальным является 1): Аг Ag Аь Bt Bg Въ -2 2 -1 2 11 3 -3 1 -2 И -3 maxmin= 1.
14 Матричные игры Если игрок А будет придерживаться этой стратегии, то ему гарантирован выигрыш, не меньший 1, при любом поведении противника в игре. Аналогичные рассуждения можно провести и за игрока В. Так как игрок В заинтересован в том, чтобы обратить выигрыш игрока А в минимум, то ему нужно проанализировать каждую свою стратегию с точки зрения максимального выигрыша игрока А. Выбирая свою стратегию, игрок В должен учитывать, что при этом стратегией его противника А может оказаться та, при которой выигрыш игрока А будет максимальным. Так, на стратегию Вх он может ответить стратегией Аь (максимальный выигрыш игрока А равен 3), на стратегию Bg — стратегией Ат (максимальный выигрыш игрока А равен 2), а на стратегию Вь — стратегией Ag или Аъ (максимальный выигрыш игрока А равен 1). Эти максимальные выигрыши записаны в нижней строке таблицы Ль вх въ вь -2 2 -1 2 1 1 3 -3 1 3 2 1 -2 1 -3 гашпшх. Неудивительно, если игрок В остановит свой выбор на стратегии Вь, при которой максимальный выигрыш игрока А минимален (из трех чисел 3, 2 и 1 минимальным является 1): Ag Ль Bt Bg Вь -2 2 -1 2 1 1 3 -3 1 3 2 [Τ] -2 1 -3 minmax = 1. Если игрок В будет придерживаться этой стратегии, то при любом поведении противника он проиграет не больше 1. В рассматриваемой игре числа maxmin и minmax совпали: maxmin = minmax = 1 (соответствующие элементы в таблице А* *г Ль Bt -2 2 3 *ш 2 1 -3 Вь -1 Θ 1 выделены жирным шрифтом).
§1. Равновесная ситуация 15 Выделенные стратегии А^ и Вь являются оптимальными стратегиями игроков А и В Ag = Лоре* i?b = -Oopt в следующем смысле: при многократном повторении игры отказ от выбранной стратегии любым из игроков уменьшает его шансы на выигрыш (увеличивает шансы на проигрыш). В самом деле, если игрок А будет придерживаться не стратегии Aopt, а выберет иную стратегию, например, At, то вряд ли стоит рассчитывать на то, что игрок В этого не заметит. Конечно, заметит и не преминет воспользоваться своим наблюдением. Ясно, что в этом случае он отдаст предпочтение стратегии Бг. А на выбор Аъ игрок В ответит, например, так — Въ. В результате отказа от стратегии Ag выигрыш игрока А уменьшится. Если же от стратегии Bopt отказывается игрок В, выбирая, например, стратегию Bti то игрок А может ответить на это стратегией Аъ и, тем самым, увеличить свой выигрыш. В случае стратегии Вг ответ игрока А — At. Тем самым, ситуация {А%, Въ} оказывается равновесной. Еще раз подчеркнем, что элементами матрицы игры являются числа, описывающие выигрыш игрока А. Более точно, выигрыш соответствует положительному элементу платежной матрицы, а отрицательный указывает на проигрыш игрока А. Матрица выплат игроку В получается из матрицы игры заменой каждого ее элемента на противоположный. Рассмотрим теперь произвольную матричную игру / ап ап ... α1η \ I а2\ а22 ... а>2п I \ Ami ат2 · · · (строки заданной т χ η-матрицы соответствуют стратегиям игрока А, а столбцы — стратегиям игрока jB) и опишем общий алгоритм, посредством которого можно определить, есть ли в этой игре ситуация равновесия или ее нет. В теории игр предполагается, что оба игрока действуют разумно, то есть стремятся к получению максимального выигрыша, считая, что соперник действует наилучшим (для себя) образом.
16 Матричные игры 1.1. Действия игрока А. 1 -и шаг. В каждой строке матрицы А находится минимальный элемент а,- = min α,-jb, г = 1,2,..., т. Полученные числа аиа2,...,ат приписываются к заданной таблице в виде правого добавочного столбца ап ап ... α,χη а2\ а>22 ... а>гп ат\ ат2 · · · атпп <*1 Пояснение. Выбирая стратегию А{, игрок Л вправе рассчитывать на то, что в результате любых действий противника (игрока Б) в рамках правил игры он выиграет не меньше, чем а*. 2-й шаг. Среди чисел аи а2,..., ат выбирается максимальное число или, подробнее, а = maxat a = max mm a;*. Специально отметим, что выбранное число а является одним из элементов заданной матрицы А. Пояснение. Действуя наиболее осторожно и рассчитывая на наиболее разумное поведение противника, игрок А должен остановиться на той стратегии А{, для которой число а,· является максимальным. Если игрок А будет придерживаться стратегии, выбранной описанным выше способом, то при любом поведении игрока В игроку А гарантирован выигрыш, не меньший а. Число а называется нижней ценой игры. Принцип построения стратегии игрока А, основанный на максимизации минимальных выигрышей, называется принципом мак- симина, а выбираемая в соответствии с этим принципом стратегия ^о — максиминной стратегией игрока А.
§ 1. Равновесная ситуация 17 1.2. Действия игрока В. 1 -й шаг. В каждом столбце матрицы А ищется максимальный элемент А = max α,·*, fc = 1,2,..., η. i Полученные числа А, А,--., А приписываются к заданной таблице в качестве нижней добавочной строки «11 «21 «ml А «12 · «22 · «т2 · А · .. α1η .. α2„ «mn ·· /з» «1 <*2 <*m Пояснение. Выбирая стратегию Вк, игрок 5 должен рассчитывать на то, что в результате любых действий противника (игрока А) в рамках правил игры он проиграет не больше, чем Д. 2-й шаг. Среди чисел А, А,···, А выбирается минимальное число /3 = minA или, подробнее, β = min max α,·*. к i Выбранное число β также является одним из элементов заданной матрицы А. Пояснение. Действуя наиболее осторожно и рассчитывая на наиболее разумное поведение противника, игрок В должен остановиться на той стратегии Вк, для которой число Д является минимальным. Если игрок В будет придерживаться стратегии, выбранной описанным выше способом, то при любом поведении игрока А игроку В гарантирован проигрыш, не превышающий /3. Число β называется верхней ценой игры.
18 Матричные игры Принцип построения стратегии игрока Б, основанный на минимизации максимальных потерь, называется принципом минимак- са, а выбираемая в соответствии с этим принципом стратегия Вко — минимаксной стратегией игрока В. Нижняя цена игры α и ее верхняя цена β всегда связаны неравенством Замечание. Реализация описанного алгоритма требует 2тп - 1 сравнений элементов матрицы А: (п - 1)т + т — 1 = тп - 1 сравнений для определения а, (п — 1)т + т — 1 = тп - 1 сравнений для определения β и одно сравнение полученных чисел α и β. Если <* = /?, или, подробнее, шах min dik = CLfikQ = min шах α^, i к к i то ситуация {До, J3fco} оказывается равновесной, и ни один из игроков не заинтересован в том, чтобы ее нарушить (в этом нетрудно убедиться путем рассуждений, подобных проведенным при анализе игры в примере 2). В том случае, когда нижняя цена игры равна верхней цене игры, их общее значение называется просто ценой игры и обозначается через v. Цена игры совпадает с элементом а$ко матрицы игры А, расположенным на пересечении г°-й строки (стратегия Ар игрока А) и fe°-ro столбца (стратегия Вко игрока В) — минимальным в своей строке и максимальным в своем столбце. Этот элемент называют седловой точкой матрицы А, или точкой равновесия, а про игру говорят, что она имеет седловую точку. Стратегии Ар и Вко, соответствующие седловой точке, называются оптимальными, а совокупность пары оптимальных стратегий и цены игры — решением матричной игры с седловой точкой.
§ 1. Равновесная ситуация 19 Замечание. Седловых точек (и значит, пар оптимальных стратегий) в матричной игре может быть несколько, но все они имеют одно и то же значение. Матричные игры с седловой точкой привлекают своей простотой, однако более типичным является случай, когда применение описанного алгоритма приводит к неравенству α<β. Как показывает следующий пример, в этом случае предложенный выбор стратегий к равновесной ситуации уже не приводит, и при многократном повторении игры у игроков вполне могут возникнуть мотивы к нарушению рекомендаций, основанных на описанном алгоритме действий игроков А и В. Пример 3. Рассмотрим 3x3 игру, заданную матрицей / 4 -1 -3\ А = -2 1 3 . V 0 2 -3 J Применив предложенный алгоритм 4 1 -3 Ξ Λ 3 о |Τ| -з 4 2 3 -3 -2 -3 находим нижнюю цену игры а = -2 и соответствующую ей стратегию А2, и верхнюю цену игры β = 2 и соответствующую ей стратегию Б2. Нетрудно убедиться в том, что пока игроки придерживаются этих стратегий, средний выигрыш при многократном повторении игры будет равен 1. Он больше нижней цены игры, но меньше верхней цены. Однако если игроку В станет известно, что игрок А придерживается стратегии А2, он немедленно ответит стратегией Βι и сведет его выигрыш к проигрышу -2. В свою очередь, на стратегию Βι у игрока А имеется ответная стратегия Аь дающая ему выигрыш 4. Тем самым, ситуация {Α2ιΒ2} равновесной не является.
20 Матричные игры §2. Смешанные стратегии Была только одна страсть, которой он не таил: страсть к игре. М. Ю. Лермонтов «Герой нашего времени» В случае, когда нижняя цена игры а и верхняя цена игры β не совпадают, игрок А может обеспечить себе выигрыш, не меньший α, а игрок В имеет возможность не дать ему больше, чем β. Возникает вопрос — а как разделить между игроками разность β-αΊ Предыдущие построения на этот вопрос огвета не дают — тесны рамки возможных действий игроков. Поэтому довольно ясно, что механизм, обеспечивающий получение каждым из игроков как можно большей доли этой разности, следует искать в определенном расширении стратегических возможностей, имеющихся у игроков изначально. Оказывается, что компромиссного распределения разности β-~ а между игроками и уверенного получения каждым игроком своей доли при многократном повторении игры можно достичь путем случайного чередования ими своих первоначальных, чистых стратегий. При таких действиях — во-первых, обеспечивается наибольшая скрытность выбора стратегии (результат выбора не может стать известным противнику, поскольку он неизвестен самому игроку), — во-вторых, при разумном построении механизма случайного выбора стратегий, последние оказываются оптимальными. Случайная величина**, значениями которой являются стратегии игрока, называется его смешанной стратегией. ** Здесь случайная величина — математический объект, используемый в качестве модели таких величин, конкретное значение которых, вообще говоря, не может быть предсказано заранее.
§ 2. Смешанные стратегии 21 Тем самым, задание смешанной стратегии игрока состоит в указании тех вероятностей, с которыми выбираются его первоначальные стратегии. Основные определения. Рассмотрим произвольную тхп игру, заданную т χ η-матрицей / ап аи ... αίη \ __ J α2ι α22 ... а2п \ Так как игрок А имеет m чистых стратегий, то его смешанная стратегия может быть описана набором т неотрицательных чисел Pi > 0, р2 ^ 0, ..., рт ^ О, сумма которых равна 1, гп i=l Смешанная стратегия второго игрока В, имеющего η чистых стратегий, описывается набором η неотрицательных чисел ϊι > 0, д2 ^ 0, ..., д„ ^ О, сумма которых равна 1, fe=l Замечание. Каждая чистая стратегия является частным случаем смешанной стратегии; в частности, чистая стратегия А* является смешанной стратегией, описываемой набором чисел рх, р2,..., рт > в котором Pi = 1? Pj = 0 О" Φ О- Подчеркнем, что для соблюдения секретности каждый из игроков применяет свои стратегии, не обращая внимания на выбор другого игрока. Таким образом, задав два набора р = {РьРг,... ,i>m}, Q = {9ь 92,..,9η},
22 Матричные игры мы оказываемся в ситуации в смешанных стратегиях. В этих условиях каждая обычная ситуация (в чистых стратегиях) {^·, Вк} по определению является случайным событием и, ввиду независимости наборов Ρ я Q, реализуется с вероятностью piqk. В этой ситуации {Ai, Вк} игрок А получает выигрыш aik. Тем самым, математическое ожидание выигрыша игрока А в условиях ситуации в смешанных стратегиях (Р, Q) равно т n Это число и принимается за средний выигрыш игрока А при смешанных стратегиях Ρ = iPuP2, - . . ,Pmh Q = {?b ?2, · · · , ?»}· Определение. Стратегии называются оптимальными смешанными стратегиями игроков А и В соответственно, если выполнено следующее соотношение ИА(Р, <?°) < НА{Р\ Q0) < ЯА(Р°, <?). Пояснение. Выписанные неравенства означают следующее: левое неравенство — отклонение игрока А от оптимальной стратегии Р° при условии, что игрок В придерживается стратегии Q0, приводит к тому, что выигрыш отклонившегося игрока А может только уменьшиться, правое неравенство — отклонение игрока В от оптимальной стратегии Q0 при условии, что игрок А придерживается стратегии Р°, приводит к тому, что выигрыш игрока А может только возрасти, и значит, выигрыш игрока В — только уменьшиться. Приведенное условие оптимальности равносильно тому, что*} max min HA(P, Q) = НА(Р°7 Q°) = min max HA(P, Q). Ρ Q Q Ρ *' Экстремальные величины max min HA(P> Q) и min max HA(P, Q) всегда существуют вследствие того, что функция HA(P, Q) является непрерывной на замкнутом множестве я» η *=1 *=1
§ 2. Смешанные стратегии 23 Величина */ = #А(Р°,<Д определяемая последней формулой, называется ценой игры. Набор (Р°, Q°31/)9 состоящий из оптимальных смешанных стратегий игроков А и В и цены игры, называется решением матричной игры. Пример 4. Рассмотрим 2x2 матричную игру из примера 1. Матрица этой игры имеет следующий вид (-: -»■ Как нетрудно убедиться, седловой точки у нее нет. Смешанные стратегии игроков А и В могут быть описаны парами чисел Р = {р,1-Р) и Q = {q,l-q} соответственно. Средний выигрыш игрока А вычисляется так: НА(Р,д)=1.р.д + (-1).р.(1-ч) + (-1)р.(1-р).Ч + 2-(1-р)(1-Я), откуда легко следует, что НА(Р,Q) = Apq-2p-2q + 1 = (2р- 1)(2д - 1). Последнее удобно записать так Полученная формула показывает, что если игрок А в половине случаев записывает на листе бумаге четное (нечетное) число (выбирает ρ = \), то независимо от того, что делает игрок Б, ожидаемый (средний) выигрыш игрока А в итоге будет нулевым. Если же игрок А выберет р>\ (так что разность ρ- \ будет положительной), то, узнав об этом, игрок Б может выбрать q < \ (так что разность q - \ будет отрицательной) и тем самым сделать средний выигрыш игрока А отрицательным, то есть заставит его проиграть. Если же игрок А выберет ρ < \ (так что разность ρ — \ будет отрицательной) и игрок В узнает об этом, то он может выбрать q > \ (так что разность q — \ будет положительной) и вновь сделать средний выигрыш игрока А отрицательным, то есть опять заставит его проиграть. Исследуем формулу с точки зрения игрока В. Если игрок А выбирает ρ — \, то ожидаемый (средний) выигрыш игрока В независимо от его действий будет нулевым в каждой партии. Но если игрок В выберет q > \ (так что разность q - \ будет положительной), то, узнав об
24, . Матричные игры этом, игрок А может выбрать ρ < \ (так что разность ρ- \ будет отрицательной), и тогда игрок В будет в итоге проигрывать. Если же игрок В выберет q < \ (так что разность q— \ будет отрицательной) и игрок А узнает об этом, то он может выбрать ρ > \ (так что разность ρ - | будет положительной) и вновь заставит игрока В проиграть. Тем самым, наборы Ρ = \2> 2/ > V = \2> 2 J являются оптимальными, а исход игры — ничейным: ι/ = 0. Замечание. На рисунке 1 показано, как устроена поверхность, описываемая функцией Точка h(p,q) = 4pg -2p- lq + 1 = (2р- 1)(2? - 1). (ϊ.3ι°) является седловой точкой (точкой перевала) этой поверхности. Именно эта точка и дает решение рассматриваемой матричной игры. Естественно возникают два ключевых вопроса'. 1-й — какие матричные игры имеют решение в смешанных стратегиях? 2-й — как найти решение матричной игры, если оно существует? Ответы на эти вопросы дают следующие две теоремы. Основная теорема теории матричных игр. Теорема 1 (Дзк.фон Нейман). Для матричной игры с любой матрицей А величины max nun HA(P, Q), гшп max HA(P, Q) Рис. 1
§ 2. Смешанные стратегии 25 равны между собой, max min НА(Р, Q) = min max НА(Р, Q). Более того, существует по крайней мере одна ситуация в смешанных стратегиях (Р°, Q0), для которой выполняется соотношение ДдОР°> Q°) = max min НА(РУ Q) = min max HA(P, Q). Ρ Q Q Ρ Иными словами, любая матричная игра имеет решение в смешанных стратегиях. Поиск этого решения опирается на следующие установленные факты. Основные свойства оптимальных смешанных стратегий. Теорема 2. Пусть — оптимальные смешанные стратегии и ν — цена игры. Оптимальная смешанная стратегия Р° игрока А смешивается только из тех чистых стратегий А+, г = 1,2,..., га {то есть отличными от нуля могут быть вероятности pi только с теми номерами г = 1,2,..., га), для которых выполнены равенства Σ од£ = v. *=1 Это означает, что смешиваются не все чистые стратегии. Аналогично, в оптимальной смешанной стратегии Q0 игрока В отличными от нуля могут быть только те вероятности qk, для номеров fe=l, 2,..., η, которых выполнены равенства т J2 aikp°i = v.
26 Матричные игры Кроме того, имеют место соотношения т т v = да Σ) α*ρ°=««χ ,5В Σ) a*pi = »=l t=l η η = min max У4 aikqk = max У^ а,*д2 = v. В этом последнем скоплении равенств, по существу, и лежат истоки, питающие методы построения решений матричных игр. Опишем простейшие из них. Замечание. Пар оптимальных стратегий в матричной игре может быть несколько. §3. Методы решения матричных игр Я, конечно, живу в постоянной тревоге, играю по самой маленькой и чего-то жду, рассчитываю, стою по целым дням у игорного стола и наблюдаю игру. Φ. Μ. Достоевский «Игрок» Наши рассмотрения мы начнем с матричных игр, число стратегий хотя бы одного из игроков в которых равно двум. Для построения решений 2 χ η и τη χ 2 игр существует эффективный метод, основанный на простых геометрических соображениях. Этот метод называют графическим. 2 Χ η игры. Пуоть Дц й\2 ... flin k а>г\ Q>22 · · · <hn t — платежная матрица 2 χ η игры. Согласно теореме о двойном описании игры (теорема 2) нахождение цены игры и оптимального значения р° для игрока А равносильно разрешению уравнения ν = min (alkpQ + Д2*(1 - /)) = max ngn (alkp + a2k(l - ρ)). с 1<*<ηχ ' а^р^\\4Ь^пу
§3. Методы решения матричных игр 27 Опишем общую схему, приводящую к искомому результату. Максимум функции проще всего найти, построив ее график. Для этого поступают следующим образом. Предположим, что игрок А выбрал смешанную стратегию Ρ = {jp, 1 — ρ}, а игрок В — &-ю чистую стратегию, к = 1,2,..., п. Тогда средний выигрыш игрока А в ситуации {Р, к} оказывается равным (&): w = alkp + a2k(l-p). Замечание. На плоскости (р, w) уравнение (к) описывает прямую. Тем самым, каждой чистой стратегии игрока В на этой плоскости соответствует своя прямая. Рис. 2 Рис. 3 Рис. 4 Поэтому сначала на плоскости (w,p) последовательно и аккуратно рисуются все прямые (к): w = aikp + αΆ(1 - ρ), ft =1,2, ...,η (рис.2). Затем для каждого значения р, 0 < ρ < 1, путем визуального сравнения соответствующих ему значений w на каждой из построенных прямых определяется и отмечается минимальное из них (рис. 3). В результате описанной поцедуры получается ломаная, которая и является графиком функции (*) (выделена жирным на рис. 4). Эта ломаная как бы огибает снизу все семейство построенных прямых, и по этой причине ее принято называть нижней огибающей этого семейства. Верхняя точка построенной нижней
28. . Матричные игры огибающей определяет и цену игры — ν и оптимальную стратегию Р° = {р°, 1 -/} игрока А (рис.5). Замечание. Описанная процедура может рассматриваться как некоторый аналог максиминного подхода при отсутствии седловой точки. Опробуем описанную схему решения 2 χ η игры на конкретном примере. Пример 5. Рассмотрим игру, заданную 2 х 6 матрицей wk -1 0\ 5 4) Ύ 1 ρ 6 4 3 1-1 -2-110 Рис.5 Решение. 1-й шаг. Анализ игры на наличие седловой точки. Нижняя цена игры равна -1, верхняя цена игры равна 1. Седловой точки нет. Решение игры нужно искать в смешанных стратегиях. 2-й шаг. Вычисление средних выигрышей игрока А (проводится при условии, что игрок В выбирает только чистые стратегии). Из таблицы W 1 \ 0 / i // \ V" /(2) -(4) 1 „ 4 D Л6)р Х(5) Ρ 1-р 6 4 3 1-10 -2-110 5 4 легко получаем: (1) (2) (3) (4) (5) (6) : «;= 6р-2(1-р), : w= 4р- (1-р), «;= Зр + (1-р), : w=z ρ, : w= -p + 5(l-p), w = 4(1-ρ). Рис.6 3-й шаг. Построение нижней огибающей. Аккуратно строим на координатной плоскости (р, w) все шесть прямых, уравнения которых получены на 2-м шаге (рис. 6), и находим их нижнюю огибающую. 4-й шаг. Отыскание цены игры и оптимальной смешанной стратегии игрока А. При аккуратном построении нижней огибающей нетрудно определить, какие две из построенных шести прямых пересекаются в ее наивысшей точке. В данном случае это прямые (4) и (5), заданные уравнениями w = ρ и w = -ρ + 5(1 — ρ) соответственно. Решая систему уравнений «;= р, ю = -р+5(1-р),
. Методы решения матричных игр. получаем .о _ 5 .29 Ρ - «о = 1 W к W0 0 у^-К Г #\ 1 Ρ Рис.7 (рис.7). Тем самым, цена игры ν и оптимальная стратегия Р° игрока А соответственно равны ι/=5 ро= is гЛ U 7» "Г \7» 7 J * Собственно, этим и заканчивается решение игры для игрока А, поскольку его в первую очередь интересует отыскание собственной оптимальной стратегии и ожидаемого наилучшего гарантированного результата. Замечание. Решающий матричную игру обычно отождествляет себя с одним из игроков (как правило, это игрок А), считая другого своим противником. Это связано еще и с тем, что в некоторых случаях основное внимание уделяется поиску огггимальных стратегий только игрока А9 а стратегии противника могут вообще не интересовать исследователя. Однако в целом ряде случаев оказывается важным знать оптимальные смешанные стратегии обоих игроков. Как ищется оптимальная смешанная стратегия игрока А, мы уже описали. Покажем теперь, как отыскать оптимальную смешанную стратегию игрока В. Здесь, в зависимости от формы нижней огибающей, может представиться несколько случаев. А. Нижняя огибающая имеет ровно одну наивысшую точку (р°, w°): 1. Если р° = 0 (оптимальная стратегия игрока А — чистая стратегия А2), то игроку В выгодно применять чистую стратегию, соответствующую номеру прямой, проходящей через точку (0, w°) и имеющей" наибольший отрицательный наклон (рис. 8). vfi 0 к - —<*°) 1 Ρ Рис.8
30. . Матричные игры 2. Если р° = 1 (оптимальная стратегия игрока А — чистая стратегия Αχ), то оптимальной для игрока В является чистая стратегия, соответствующая номеру прямой, проходящей через точку (1, w°) и имеющей наименьший положительный наклон (рис. 9). Wi \ ^-—· /q i . У ^ J <"<£> ^ ^\ 1 Ρ •шк , л Α Ά (*°> 1 Ρ Рис. 9 Рис. 10 Рис.11 3. Если 0 < р° < 1, то в наивысшей точке нижней огибающей пересекаются, по меньшей мере, две прямые, одна из которых (к-я) имеет положительный наклон, а другая (1-я) — отрицательный (рис. 10), и оптимальная смешанная стратегия игрока В получается, если положить Чк = ?, « = 1 - ?, ?у = 0, j φ k,l, где g — решение уравнения <ч*д + ап(1 - g) = я2*д + «2/(1 - д). Б. Нижняя огибающая содержит горизонтальный участок, соответствующий чистой стратегии &° игрока jB, которая и является оптимальной для него (рис. 11). Пример 5 (продолжение). Покажем теперь, как найти полное решение игры, то есть еще и оптимальную смешанную стратегию игрока В. Для этого поступают так: 1) полагают «? = 0, flj = 0, gj = 0, gj = g, g? = 1 - g, g? = 0 (выделяя тем самым из шести чистых стратегий игрока В стратегии £4 и ΰ5. которым соответствуют прямые (4) и (5), определяющие наивысшую точку нижней огибающей),
§3. Методы решения матричных игр 31 2) приравнивают любой из двух средних выигрышей игрока В (игрок А выбирает только чистые стратегии), отвечающих предложенной смешанной стратегии О О О q 1-g О 6 4 3 1-10 -2-110 5 4 к цене игры *-(l-?)=f, 5<l-g)=f и 3) получают один и тот же результат Я =7> 9=7· Полное решение игры имеет следующий вид р° = {М}, <г° = {0,0,0,1,1,о}, 5 7* Замечание. Ситуацию с наличием лишь двух конкурирующих стратегий игрока А нельзя считать надуманной, поскольку на практике она возникает сравнительно часто; например, если нужно сравнить два образца некоторого изделия (скажем, старого и модернизированного) с целью выяснения возможности замены, это весьма удобно сделать при помощи платежной матрицы 2 х п. т X 2 игры. Пусть теперь в матричной игре две чистые стратегии имеет игрок 2?, а число чистых стратегий у игрока А произвольно (равно т). Это означает, что платежная матрица такой игры имеет вид а2\ «22 - ат\ ат2 < Анализ такой игры во многом напоминает рассуждения, описанные для игры 2 χ п. Пусть Q = {д, 1 - q} — произвольная смешанная стратегия игрока Б. Если игрок А выбирает г'-ю чистую стратегию, г = 1,2,..., т, то средний выигрыш игрока В в ситуации {i, Q} будет равным (г): w = aixq + αί2(1 - g), i = 1,2,..., m. (*)
. Матричные игры Зависимость этого выигрыша от переменной q описывается прямой. Графиком функции ■я)) max (aaq + ai2(l Рис. 12 является верхняя огибающая семейства прямых (*), соответствующих чистым стратегиям игрока А (рис. 12). Абсцисса д° нижней точки полученной ломаной определяет оптимальную смешанную стратегию игрока В, а ордината w° — цену игры. Замечание. Отыскание оптимальной смешанной стратегии игрока А проводится по той же схеме, которая позволяет найти оптимальную смешанную стратегию игрока В в игре 2 х п. Рассмотрим конкретный пример. Пример 6. 3 х 2 игра задана матрицей 3 -1 -1 3 1 О Решение. 1-й шаг. Анализ игры на наличие седловой течки. Нижняя цена игры равна 0, верхняя цена игры равна 3. Седловой точки нет. Решение игры нужно искать в смешанных стратегиях. 2-й шаг. Вычисление средних выигрышей игрока В (проводится при условии, что игрок А выбирает только чистые стратегии). Из таблицы Я 1-Я \ / > / < \ 1 Ч получаем: (1): (2): (3): 3 -1 1 w = w = w = -1 3 0 3g- (l-g), -? + 3(l-g), я- Рис.13 3-й шаг. Построение верхней огибающей. Построим на координатной плоскости (g, w) все три прямых, а затем и их верхнюю огибающую (рис. 13).
§ 3. Методы решения матричных игр 33 4-й шаг. Отыскание цены игры и оптимальной смешанной стратегии игрока В. Нижняя точка верхней огибающей является точкой пересечения прямых (1) и (2). Решая систему уравнений «/= 3q- (1-g), «/= -g + 3(l-g), получаем g0 = i, «· = ι. 5-й шаг. Отыскание оптимальной смешанной стратегии игрока А, Полагая О Οι 0 л Pi=Py P2=l-P, Рз = 0, приравниваем средние выигрыши игрока At соответствующие чистым стратегиям игрока В, Зр-(1-р) = -р + 3(1-р), и находим р° = |. Таким образом, цена игры и оптимальные смешанные стратегии игроков А и В соответственно равны u=l, J* = {M,0}, *-{Ы}. πι χ η игры. В принципе решение любой матричной игры может быть найдено методами линейного программирования. При этом требуемый объем вычислений напрямую зависит от числа чистых стратегий игроков (растет с его увеличением, и, значит, с увеличением размеров матрицы игры). Поэтому любые приемы предварительного анализа игры, позволяющие уменьшать размеры ее платежной матрицы или еще как-то упрощать эту матрицу, не нанося ущерба решению, играют на практике весьма важную роль. Правило доминирования. В целом ряде случаев анализ платежной матрицы обнаруживает, что некоторые чистые стратегии не могут внести никакого вклада в искомые оптимальные смешанные стратегии. Отбрасывание подобных стратегий позволяет заменить первоначальную матрицу на матрицу выигрышей меньших размеров. Опишем одну из таких возможностей более подробно.
34 Матричные игры Пусть (ап а12 ... а1п \ а21 αχ ... а2п \ ат\ &т2 * · · в>тп ) — произвольная т χ η-матрица. Будем говорить, что г-я строка матрицы А Оц ai2 ... ain не больше j-й строки этой матрицы CLji Uj2 . . . Gjm если одновременно выполнены следующие η неравенств an < aju ai2 < aj2j ..., ain < ain. При этом говорят также, что j-я строка доминирует г-ю строку, или что стратегия Aj игрока А доминирует стратегию -А*. Замечание. Игрок А поступит разумно, если будет избегать стратегий, которым в матрице игры отвечают доминируемые строки. Если в матрице А одна из строк (j-я) доминирует другую строку (г-ю), то число строк в матрице А можно уменьшить путем отбрасывания доминируемой строки (i-й). Далее, будем говорить, что fc-й столбец матрицы А <*>2к <*>тк не меньше l-το столбца этой матрицы аи если одновременно выполнены следующие га неравенств 0>\к ^ ЯН> а2к i£ a>21, · · · ι &тк ^ Am/·
§3. Методы решения матричных игр _ При этом говорят также, что J-й столбец доминирует fc-й столбец, или что стратегия В% игрока В доминирует стратегию Вк (обращаем внимание читателя на различие в знаках неравенств при определении домиюфуемых строк и доминируемых столбцов). Замечание. Игрок В поступит разумно, если будет избегать стратегий, которым в матрице игры отвечают доминируемые столбцы. Если в матрице А один из столбцов (ί-й) доминирует другой столбец (fe-й), то число столбцов в матрице А можно уменьшить путем отбрасывания доминируемого столбца (&-го). Важное замечание. Оптимальные смешанные стратегии в игре с матрицей, полученной усечением исходной за счет доминируемых строк и столбцов, дадут оптимальное решение в исходной игре: доминируемые чистые стратегии игроков в смешении не участвуют — соответствующие им вероятности следует взять равными нулю. Пример 7. Рассмотрим игру с матрицей /-1 0 2 1\ -2010 2 1-1-2 V-1 0 2 1/ Сравнивая строки матрицы, видим, что 1-я строка совпадает с 4-й строкой, или, что то же, стратегия А4 дублирует стратегию А{. Тем самым, одну из этих строк можно вычеркнуть, не нанося ущерба решению /-10 2 1\ -2 0 1 0 . V 2 1 -1 -2/ Поэлементно сравнивая 1-ю и 2-ю строки, замечаем, что 1-я строка доминирует 2-ю строку, или, что то же, стратегия Αι доминирует стратегию Αχ. Это вновь позволяет уменьшить число строк матрицы /-1 0 2 14 V 2 1 -1 -2J* Замечая, что 4-й столбец полученной матрицы доминирует ее 3-й столбец, и вычеркивая этот последний, приходим к игре с 2 χ 3-матрицей (21-2)· Решая эту 2 χ 3 игру графическим методом, находим ее решение — цену игры и оптимальные смешанные стратегии игроков А и В:
36 Матричные игры Возвращаясь к исходной 4x4 игре, получаем окончательный ответ: * = 0, {|,0, |э0} э {|,0,0,|}. Замечание. При отбрасывании доминируемых строк и столбцов некоторые из оптимальных стратегий могут быть потеряны. Однако цена игры не изменится, и по усеченной матрице может быть найдена хотя бы одна пара оптимальных смешанных стратегий. Аффинное правило. При поиске решения матричных игр часто оказывается полезным следующее свойство. Допустимые преобразования матрицы игры и ее цена. Оптимальные стратегии у матричных игр, элементы матриц А и С которых связаны равенствами Cik = Aaifc + μ, i = 1,2,..., m; k = 1,2,..., η, где λ > 0, α μ — произвольно, имеют одинаковые равновесные ситуации (либо в чистых, либо в смешанных стратегиях), а их цены удовлетворяют следующему условию "с = λί/Α + μ. Пример 8. Элементы матриц /-1 0 1\ п /2 5 8\ А=Ч 2 1 -2 J И C=U 8 -lj связаны равенством C* = 3-a,* + 5, f = l,2; fe = 1,2,3. Поэтому цена игры с матрицей С легко вычисляется i/c = 3 ·ι/Α + 5 = 3-0 + 5 = 5 (см. пример 7). Основные этапы поиска решения матричной игры. 1 -и этап — проверка наличия (или отсутствия) равновесия в чистых стратегиях (при наличии равновесной ситуации указываются соответствующие оптимальные стратегии игроков и цена игры). 2-й этап — поиск доминирующих стратегий (в случае успеха этого поиска — отбрасывание доминируемых строк и столбцов в исходной матрице игры). 3 -и этап — замена игры на ее смешанное расширение и отыскание оптимальных смешанных стратегий и цены игры.
§3. Методы решения матричных игр 37 Итерационный метод решения матричных игр. Опишем метод отыскания решения матричной игры (цены игры и оптимальных смешанных стратегий), в известной степени верно отражающий некоторую реальную ситуацию накопления опыта постепенной выработки игроками хороших стратегий в результате многих повторений конфликтных ситуаций. Основная идея метода заключается в том, чтобы мысленно как бы смоделировать реальное практическое «обучение» игроков в ходе самой игры, когда каждый из игроков на собственном опыте прощупывает способ поведения противника и старается отвечать на него наиболее выгодным для себя образом. Иными словами, всякий раз при возобновлении игры игрок выбирает наиболее выгодную для себя стратегию, опираясь на предыдущий выбор противника. Проиллюстрируем этот метод на примере игры, заданной матрицей /2 0 3\ u з -з; (здесь maxmin = 0, шшпах = 2и, следовательно, седловой точки нет). Опишем правила выбора ходов игроками, предположив, для определенности, что начинает игрок А: ход игрока А — стратегия Αχ — (2 0 3); игрок В выбирает свою стратегию так, чтобы выигрыш игрока А был минимален (отмечен полужирным шрифтом): ход игрока В — стратегия В2 — ( з ) * игрок А выбирает свою стратегию так, чтобы его выигрыш при стратегии В2 игрока В был максимален (отмечен полужирным шрифтом): ход игрока А — стратегия А2 — (1 3 - 3); игрок В выбирает свою стратегию так, чтобы «накопленный» выигрыш игрока А при стратегиях А\ и А2, (2 0 3) + (1 3 -3) = (3 3 0), был минимален: ход игрока В — стратегия Въ — ( _з )» игрок А выбирает свою стратегию так, чтобы его «накопленный» выигрыш при стратегиях В2 и Б3 игрока Б, GH-0-G)· был максимален: ход игрока А — стратегия А\ — (2 0 3);
Матричные игры игрок В выбирает свою стратегию так, чтобы «накопленный» выигрыш игрока А при стратегиях Αι, А2 и Αχ, (3 3 0) + (2 0 3) = (5 3 3), был минимален: и т.д. ход игрока В — стратегия В2 — ( з )» Разобьем последовательные ходы игроков А и В на пары (ход игрока Ау ход игрока В) и запишем результаты в таблице η 1 2 3 ί 4 ! 5 6 7 8 9 10 11 12 t 1 2 1 1 2 1 1 2 1 1 2 1 ^! 2 3 5 7 8 10 12 13 15 17 18 20 в2 0 3 3 3 6 б б 9 9 9 12 12 3 0 3 6 3 6 9 1 б 9 1 12 9 12 z/,(n) 0,00 0,00 1,00 0,75 0,60 1,00 0,86 0,75 1,00 0,90 0,82 1,00 \k 2 3 2 2 3 2 2 3 2 2 3 2 Αι 0 3 3 3 б 6 6 9 9 9 12 12 ' Α2Ί 3 0 3 б 3 6 9 6 9 12 9 12 ρ;(η)Ί 3,00 1,50 1,00 1,50 1,20 1,00 1,44 1ДЗ 1,00 1,20 1,09 Ι ι,οο Гию! 1,50 0,75 1,00 1Д2 0,90 1,00 1,15 0,93 1,00 1,05 0,96 1,00 требующей некоторых пояснений. Описание таблицы. 1-й столбец — номер η шага (пары последовательных ходов игроков А и В), номер i стратегии, выбранной игроком А, 2-й столбец 3-й столбец «накопленный» суммарный выигрыш игрока А за первые η шагов при выборе игроком В стратегии Βχ, 4-й столбец — «накопленный» суммарный выигрыш игрока А за первые η шагов при выборе игроком В стратегии В2, 5-й столбец — «накопленный» суммарный выигрыш игрока А за первые η шагов при выборе игроком В стратегии В3» минимальный из этих выигрышей > выделяется полужирным шрифтом,
. Методы решения матричных игр. 6-й столбец — минимальный средний выигрыш игрока А, равный минимальному накопленному им выигрышу за первые η шагов, деленному на число этих шагов, 7-й столбец — номер к стратегии, выбранной игроком В, 8-й столбец —- «накопленный» суммарный выигрыш ^ игрока А за первые η шагов при выборе им стратегии Аи максимальный из этих выигрышей } выделяется полужирным шрифтом, 9-й столбец — «накопленный» суммарный выигрыш игрока А за первые η шагов при выборе им стратегии А2, 10-й столбец — максимальный средний выигрыш игрока А, равный максимальному накопленному им выигрышу за первые я шагоз, деленному на число этих шагов, 11-й столбец — среднее арифметическое минимального среднего выигрыша и максимального среднего выигрыша игрока А. Решение игры определяется приближенно по окончании любого из шагов. Например, за приближенную цену игры можно взять среднее арифметическое ζ/(η), полученное на n-м шаге. Смешанные стратегии противников определяются частотами появления чистых стратегий. После 9-го шага имеем ζ/(9) = 1,00. При этом игрок А 6 раз использовал стратегию Αχ и 3 раза стратегию А2. В свою очередь игрок В 6 раз применял стратегию В2, 3 раза стратегию 2?3, а стратегией Βχ не пользовался вообще. Отсюда получаем, что р> = {1.1} * (О.*?;0,33}, Яэ = {О, |, |} « {0; 0,67; 0,33}. Соответственно, после 10-го шага получаем — 1/(10) = 1,05, Р10 = {£·,£}« {0,7; 0,3}, QlQ = {θ, £, £} = {0; 0,7; 0,3}. Данная игра легко решается графически. Вот точный ответ: ν = ι, р = {|,|}, <? = {о,М}. Сравнивая результаты, полученные на 9-м, 10-м, а также 11-м и 12-м шагах: ι/(11) = 0,96, ι/(12) = 1,00, рп = {π> π} я {0,64;0,36}, Рп = {§, £} « {0,67;0,33}, Qn = {θ, £, £} и {0; 0,64; 0,36}, Qu = {θ, §, £} * {0; 0,67; 0,33},
40 Матричные игры замечаем, что по мере увеличения числа шагов приближенные значения все меньше отличаются от точных. Сделаем несколько замечаний. Замечание 1. При увеличении числа шагов все три величины ν*{η), ν* (ή) и ι/(η) будут приближаться к цене игры и, но среднее арифметическое ν(ή) будет приближаться к ν сравнительно быстрее. Замечание 2. Хотя сходимость итераций весьма медленна, тем не менее даже такой небольшой расчет всегда дает возможность находить ориентировочное значение цены игры и доли чистых стратегий. Замечание 3. Сравнительно медленную скорость сходимости можно объяснить целым рядом причин. Укажем одну из них, психологически наиболее интересную. Если, к примеру, игрок А уже получил оптимальную смешанную стратегию, то он не склонен останавливаться на ней. Отнюдь нет — он продолжит попытки выиграть у противника В побольше, особенно если последний еще не достиг оптимальной смешанной стратегии. Таким поведением игрок А может невольно ухудшить свое положение. Замечание 4. Отметим два основных преимущества описанного метода: 1) итерационный метод прост и одновременно универсален (при его помощи можно легко найти приближенное решение любой матричной игры); 2) объем и сложность вычислений сравнительно слабо растут по мере увеличения числа стратегий игроков (размеров матрицы игры). Сведение матричной игры к задаче линейного программирования. Рассмотрим тхп игру с платежной матрицей А = (aik). Без ограничения общности будем считать, что все элементы матрицы А положительны (этого всегда можно добиться, пользуясь аффинным правилом, преобразующим заданную матрицу игры, но не изменяющим оптимальных смешанных стратегий игроков). Тогда искомая цена игры и — положительное число. Интересы игрока А. Из теоремы о свойствах оптимальных смешанных стратегий игроков вытекает, что при любой чистой стратегии Вк игрока В, к = 1, 2,..., п, оптимальная смешанная стратегия Ρ = {ри р2,... ,рт} игрока А обеспечивает его средний выигрыш, не меньший ι/. Иными словами, выполняются соотношения m ΣαχΡί^ι/, fc = l,2,...,n, t=l
Методы решения матричных игр 41 т ]£ft = l, Pi>b i = l,2,...,m, которые с учетом обозначений з,= —, i = 1,2,. . .,т, можно записать так У] fl»agt· > 1, fe = 1,2,..., η, 5^»г=-, ж,·^ 0, г = 1,2, ,.»,т. Поскольку игрок А стремится максимально увеличить свой гарантированный выигрыш, то задача отыскания решения матричной игры сводится к следующей задаче: найти неотрицательные величины хи %2, · · · > Ът> удовлетворяющие неравенствам т s) ОчъЯх > I? k = 1,2,..., η, и такие, что их сумма минимальна т У^ Xi -» min. t=l Интересы игрока В. Аналогичным образом заключаем, что рйтимальная смешанная стратегия Q = {qu q2l..., qn} игрока В при любой чистой стратегии Ai игрока А, г = 1,2, ...,?п, обеспечивает его средний проигрыш, не больший и. Иными словами, выполняются соотношения η ]Cat*?*<i/, i=l,2,...,m, *=ι η Σ)& = 1, Як^О, ft = 1,2,...,η, *=ι которые с учетом обозначений Qk Ук~ —, * = 1,2,...,п,
42 Матричные игры можно записать так η Σ) ЪкУк < 1, i = 1,2,..., т, Σ)ΐί* = -ι Уа>0, ft = 1,2,...,п. 1 Поскольку игрок 2? стремится сделать свой гарантированный проигрыш минимально возможным, то задача отыскания решения матричной игры сводится к следующей задаче: найти неотрицательные величины ух^уъ...^уп> удовлетворяющие неравенствам η У^ <kkVk < 1> i = 1,2,..., m, г/ такие, что их сумма максимальна η Y^yk-^ max. Тем самым, мы получаем следующий важный результат. Теорема 3. Решение матричной игры с положительной платежной матрицей (aik) равносильно решению двойственных задач линейного программирования т У^ Xi —► min, (А) (В) m Y^aikXi ^ 1, к = 1,2,..., η, 3?j ^ 0, t = 1,2,... ,m, η Y^.yk -> max, η 5^0i*y* < 1, i = l,2, ...,m, у*>0, & = l,2,...,n.
§ 3. Методы решения матричных игр 43 При этом цена игры 1 где Θ — величина, обратная общему значению оптимальных сумм, m n а оптимальные значения jp° и ql связаны с оптимальными ж? и yl посредством равенств Pi = ^-> *' = l,2,...,m, ί*~^> к = 1,2,..., η. Алгоритм решения матричной ифы. 1-й шаг. Ко всем элементам исходной матрицы игры прибавляется одно и то же положительное число η так, чтобы все элементы новой матрицы были строго положительны. 2-й шаг. Решаются двойственные задачи линейного программирования (А) и (В) (например, симплекс-методом, или как-нибудь иначе). Находятся наборы ж?, yl и число Θ. 3-й шаг. Строятся оптимальные смешанные стратегии игроков А и В соответственно о *? о У1 4-й шаг. Вычисляется цена игры Θ Пример 9. Рассмотрим 2x2 игру с матрицей ». = ъ-1- αο· Соответствующие ей задачи линейного программирования имеют вид Χι + «2 —* min ία?ι 4- Зж2 ^ 1, Х\ + 4х2 ^ 1, *ι2>0, ж2 ^ 0, yi+ у2->тах 5yi+ ffe^l, 3yi + 4y2^l, У1^0, 2/2^0.
44 Матричные игры Решение. 1-й шаг. Все элементы платежной матрицы положительны. 2-Й шаг. Строим решения обеих задач линейного программирования, пользуясь графическим методом. В результате получаем, что <*0 — l J* — 4 4*0 — 3 «0 — 2 Ω — 5 «1 — Ту? Ж2 — и» У\ ~ 17) Ife ~ Ту» ** — Π· 3-й шаг. „О _ 1 „О _ 4 „О _ 3 Л0 _ 2 Р\ - 5» #2 ~ 5» ?1 ~ 5> & — Г 4-й шаг. *>л - у - 3?. §4. Примеры задач, сводимых к матричным играм Все на свете начинается грошовым делом, а смотришь, маленькая игра как раз кончилась большой. Н. А Гоголь «Игроки» В чистом виде антагонистические конфликты встречаются редко (разве только в боевых действиях и в спортивных состязаниях). Однако довольно часто конфликтные ситуации, в которых интересы сторон противоположны, а множество способов действия сторон конечно, можно моделировать матричными играми. Рассмотрим несколько конкретных ситуаций. Примерю. «Планированиепосева». Сельскохозяйственное предприятие имеет возможность выращивать две культуры — Ах и А2. Необходимо определить, как сеять эти культуры, если при прочих равных условиях их урожаи зависят от погоды, а план посева должен обеспечить наибольший доход (прибыль от реализации определяется полученным объемом выращенной культуры). В зоне рискованного земледелия (а таковой является большая часть России) планирование посева должно осуществляться с учетом наименее благоприятного состояния погоды. Таким образом, одной из сторон выступает сельскохозяйственное предприятие, заинтересованное в том, чтобы получить наибольший доход (игрок А), а другой стороной — природа, способная навредить сельскохозяйственному предприятию в максимальной степени (от нее зависят погод-
§4. Примеры задач, сводимых к матричным играм . 45 ные условия) и преследующая тем самым прямо противоположные цели (игрок В)*\ Налицо антагонистический конфликт, в котором у игрока А две стратегии — Αι и А2, а у игрока В три — В\ (засушливое лето), В2 (нормальное лето) и Б3 (дождливое лето). В качестве выигрыша игрока А возьмем прибыль от реализации и будем считать, что расчеты прибыли сельскохозяйственного предприятия (в млн. руб.) в зависимости от состояний погоды сведены в следующую матрицу /8 5 3\ \2 3 6) Нетрудно заметить, что седловой точки у этой матрицы нет. Поэтому оптимальная стратегия игрока А будет смешанной. Применяя графический метод, получаем * = {!.?}> "=«*. Замечание. Здесь мы столкнулись со сравнительно редкой ситуацией, когда оптимальная смешанная стратегия одного из игроков допускает так называемую «физическую» реализацию. Полученное решение сельскохозяйственное 1федприятие может использовать так на | всех площадей выращивать культуру Aiy на \ всех площадей выращивать культуру А2 и получать прибыль в размере, не меньшем 4j млн. руб. Пример 11. «Переговоры о заключении контракта между профсоюзом и администрацией». Рассмотрим фирму, администрация которой ведет переговоры с профсоюзом рабочих и служащих о заключении контракта. Предположим, что платежная матрица, отражающая интересы договаривающихся сторон, имеет следующий вид /75 105 65 45 > 70 60 55 40 80 90 35 50 V95 100 50 55, Выплаты указаны в центах в час и представляют собой среднюю зарплату служащего фирмы вместе со всеми добавками. Тем самым, заданная матрица описывает прибыль профсоюза (игрок А) и затраты администрации фирмы (игрок В). ** Конечно, природа не столь зловредна, однако рассматривая ее как игрока в антагонистической игре, мы учитываем наихудший вариант развития событий — «хуже уже не будет». Принятие природы за противника в рассматриваемом примере равносильно планированию посева с учетом наиболее неблагоприятных условий; если же погодные условия окажутся благоприятными, то выбранный план даст возможность увеличить доход.
Матричные игры Ясно, что профсоюз стремится максимизировать доходы рабочих и служащих, в то время как администрации хотелось бы минимизировать собственные потери. Нетрудно заметить, что седловой точки у платежной матрицы нет. Кроме того, для дальнейшего анализа существенными являются лишь стратегии Αι и Л4 игрока А и стратегии Б3 и ВА игрока В (в этом легко убедиться, воспользовавшись правилом доминирования стратегий). В результате соответствующего усечения получим матрицу /65 45\ V50 55,Г Элементы матрицы α о· связаны с элементами предыдущей матрицы соотношениями 65 = 5-4 + 45, 45 = 5-0 + 45, 50 = 5-1 + 45, 55 = 5-2 + 45. Воспользовавшись графическим методом, в итоге получим Р = {!>°>М}> <? = {0,0,f,f}, z/ = 53. Тем самым, профсоюзу следует выбирать стратегию А\ в 20% случаев и стратегию А4 в 80%. Что касается администрации, то ей следует выбирать стратегию Б3 с вероятностью 0,4 и стратегию ВА с вероятностью 0,6. При этом ожидаемая цена игры равна 53. Замечание. Следует отметить, что если процесс иеретворов будет повторяться много раз, то среднему должно сходиться к ожидаемому значению 53. Если же переговоры пройдут лишь единожды, то реальный результат получится при выборе каждым игроком некоторой своей чистой стратегии. Поэтому один из игроков, профсоюз или администрация, будет неудовлетворен. Пример 12. «Локальный конфликт». Рассмотрим войну между двумя небольшими государствами А и В, которая ведется в течение 30 дней. Для бомбардировки небольшого моста — важного военного объекта страны В — страна А использует оба им веющихся у нее самолета. Разрушенный мост восстанавливается в течение суток, а каждый самолет совершает один полет в день по одному из двух воздушных маршрутов, соединяющих эти страны. У страны В есть два зенитных орудия, при помощи которых можно сбивать самолеты страны А. Если самолет собьют, то некая третья страна в течение суток поставит стране А новый самолет. Страна А может послать самолеты либо по одному маршруту, либо по разным. Страна В может поместить либо обе зенитки на одном маршруте, либо по одной зенитке на каждый маршрут.
§4. Примеры задач, сводимых к матричным играм 47 Если один самолет летит по маршруту, на котором расположена одна зенитка, то этот самолет будет сбит. Если два самолета летят по маршруту, на котором расположены две зенитки, то оба самолета будут сбиты. Если два самолета летят по маршруту, на котором расположена одна зенитка, то сбит будет только один самолет. Если самолет доберется до цели, то мост будет уничтожен. У страны А есть две стратегии: «послать самолеты по разным маршрутам» — At, «послать самолеты по одному маршруту» — А2. У страны В — также две стратегии: «поместить зенитки на разных маршрутах» — В\, «поместить зенитки на одном маршруте» — Б2. Если страна А выберет стратегию Αχ, а страна В ■— стратегию Βγ, то страна А получит нулевой выигрыш, так как ни один из самолетов не достигнет цели. Если страна А выберет стратегию Аг, а страна В — стратегию Вх, то хотя бы один самолет достигнет цели и вероятность разрушения моста будет равна 1. Если страна А выберет стратегию А\, а страна В — стратегию Б2, то вновь хотя бы один самолет достигнет цели и вероятность разрушения моста будет равна 1. Если страна А выберет стратегию Αι, а страна В — стратегию Б2, то страна А с вероятностью \ выберет маршрут, на котором установлены зенитки, и, следовательно, цель будет уничтожена с вероятностью \. Оформим результаты проведенного анализа в стандартной игровой фор- При помощи графического метода получаем оптимальные смешанные стратегии игроков и цену игры *-{*»§}. 9-{Ы}. *-!· Это означает, что если страна А будет посылать самолеты по разным маршрутам в течение десяти дней из тридцати, отпущенных на войну (и, значит, по одному маршруту в течение двадцати дней), то в среднем страна А будет иметь 66,7% удачных случаев (мост будем находиться в нерабочем состоянии). Воспользовавшись для своих зениток предложенным выбором, страна В не позволит бомбить мост чаще, чем в 66,7% случаев.
48 Матричные игры Несколько слов в заключение Давеча я кушал в ресторане и после того заглянул в бильярдную. Хотелось посмотреть, как там, как говорится, шарики катают. Μ. Μ. Зощенко «Веселая игра» Матричные игры моделируют конфликтные ситуации, в которых каждая из сторон-участниц делает свой ход одновременно со второй стороной. Наибольший интерес представляет случай, когда игра не заканчивается сразу же после совершения игроками одной такой пары одновременных ходов, а повторяется многократно, причем считается, что перед каждым возобновлением игры игроки не получают никаких новых сведений ни о конфликте, ни о возможных действиях противной стороны. Иными словами, при многократном повторении матричной игры каждая из сторон всякий раз оказывается перед выбором некоторой стратегии из одного и того же множества стратегий, неизменного у каждого из игроков. Тем не менее, в таких многократно повторяющихся обстоятельствах большую роль играет анализ игры, как предварительный, так и промежуточный: в результате разумно проведенного предварительного анализа матричной игры заинтересованная в анализе сторона может определить свою линию поведения (правило выбора стратегий) на всю серию игр. Разумеется, описанный нами выше максиминный подход является далеко не единственным средством. Однако не следует забывать, что принципиальной особенностью этого подхода является то обстоятельство, что игрок, придерживающийся выводимого на его основе правила выбора стратегий, заранее может довольно точно оценить нетривиальные размеры своего гарантированного выигрыша. Кроме того, максиминный подход позволяет сводить задачу поиска решения игры к рассмотрению сравнительно несложных задач линейного программирования и, тем самым, получать эффективные рекомендации по наилучшему выбору стратегии в конкретной игре при многократном ее повторении. Если игра повторяется много раз, то некоторые дополнительные сведения — какие именно стратегии выбирает противная сторона и какими правилами выбора стратегий она руководствуется —
Задании 49 Задания 1. Найдите нижнюю цену игры, верхнюю цену игры, определите седловые точки, оптимальные чистые стратегии и цену игры (если они существуют): 2 1 3 7' -5 -1 6 -2 2 14 2 7 -2 -3 4, 2. Найдите решения следующих матричных игр: (~5 Μ h (-1 l -1 2\ г ( 4 2 3 "Μ V 4 -7/' °· V 0 -1 2 ~2У' c" V-4 0 -2 2) rA е. I 4 .4 3. Найдите точные и приближенные решения следующих матричных игр: (I -·)■ а. / 4 -2 0\ /1 О -1\ О 1 2 , Ь. ( 1 -1 2 ) . \-3 3 -1/ \0 2 -4/ К игре относились серьезно. Карты давно уже потеряли в их глазах значение бездушной материи, и каждая масть, а в масти каждая карта в отдельности, была строго индивидуальна и жила своей обособленной жизнью. Масти были любимые и нелюбимые, счастливые и несчастливые. Карты комбинировались бесконечно разнообразно, и разнообразие это не поддавалось ни анализу, ни правилам, но было в то же время закономерно. И в закономерности этой заключалась жизнь карт, особая от жизни игравших в них людей. Л. Н.Андреев «Большой шлем»
Издательство УРСС Представляет Вам свои лучшие книги: Серия «Вся высшая математика в задачах» Краснов М. Л., Макаренко Г. К, Киселев А. И. Вариационное исчисление. Задачи и примеры с подробными решениями. В настоящем учебном пособии авторы предлагают задачи по основным разделам классического вариационного исчисления. В начале каждого раздела приводится сводка основных теоретических положений, определений и формул, а также дается подробное решение свыше 100 примеров. В книге содержится около 230 задач для самостоятельного решения. Все они снабжены ответами или указаниями к решению. Краснов М.Л, Киселев А. К, Макаренко L К Обыкновенные дифференциальные уравнения. Задачи и примеры с подробными решениями. В предлагаемом сборнике задач особое внимание уделено тем вопросам, которые недостаточно подробно освещены в имеющихся пособиях и которые, как показывает опыт, слабо усваиваются студентами. Детально разобраны метод изоклин для уравнений первого и второго порядков, задачи нахождения ортогональных траекторий, линейная зависимость и независимость систем функций. В задачник включено большое число задач на решение линейных уравнений с постоянными и переменными коэффициентами, задачи на устойчивость по Ляпунову, на применение операционного метода к решению дифференциальных уравнений и систем. Представлены, также метод последовательных приближений, особые решения дифференциальных уравнений, уравнения с малым параметром при производной. Приводится более 100 примеров с подробными решениями. Поппер К. Р. Объективное знание. Эволюционный подход. Нейгебауер О. Точные науки в древности. Архимеду Гюйгенс, Лежандр, Ламберт. О квадратуре круга. А. А Самарский, П. Н. Вабищевич'. Численные методы решения задач конвекции—диффузии. Численные методы решения обратных задач математической физики. Вычислительная теплопередача. Задачи и упражнения по численным методам (с Е. А. Самарской).
Позиционные игры Расставив на отеле черные и белые костяшки, Шмакин сел у круглого стола и стал играть сам с собой. Партнерами были правая и левая руки. А #. Чехов «Безнадежный» Во многих практически важных конфликтных ситуациях стороны- участницы, располагая той или иной информацией о прошлом развитии конфликта, совершают свой выбор не раз и навсегда, а последовательно во времени, шаг за шагом. Тем самым, они используют стратегии, отражающие как динамику конфликта, так и степень собственной информированности о фактически складывающейся обстановке в развитии этого конфликта. §5. Структура позиционной игры Мы сыграли с Талем десять партий В преферанс, в очко и на бильярде... А С. Высоцкий «Честь шахматной короны» Одним из классов игр, описывающих конфликты, динамика которых оказывает влияние на поведение участников, являются так называемые позиционные игры.
52 Позиционные игры Позиционная игра — это бескоалиционная игра, моделирующая процессы последовательного принятия решений игроками в условиях меняющейся во времени и, вообще говоря, неполной информации. Процесс самой игры состоит в последовательном переходе от одного состояния игры к другому состоянию, который осуществляется либо путем выбора игроками одного из возможных действий в соответствии с правилами игры, либо случайным образом {случайный ход). В качестве примеров позиционных игр можно привести крестики-нолики, шашки, шахматы, карточные игры, домино и др. Интересно, что право выбора первого хода в этих играх часто определяется случайным образом. Состояния игры принято называть позициями (отсюда и название — позиционные игры), а возможные выборы в каждой позиции — альтернативами. Характерной особенностью позиционной игры является возможность представления множества позиций в виде древовидного упорядоченного множества, которое называется деревом игры (рис. 14). Для определенности мы будем рассматривать позиционные игры, в каждой позиции которых, кроме окончательных, ровно две альтернативы — первая и вторая. Замечание. Символ О, А или В в кружке указывает, кто из игроков (О, А или В) делает очередной ход в данной позиции. При этом символом О обычно обозначается ход в игре, осуществляемый не игроком, а каким- нибудь случайным механизмом (иногда его называют природой). Например, в позиционной игре, представленной на рисунке 14 своим деревом, первый ход производится случайно. Пользуясь графическим описанием игры в виде дерева, можно заметить, что процесс игры состоит в переходе от начальной позиции к окончательной через непосредственно следующие одна за другой промежуточные позиции. Рис.14
§5. Структура позиционной игры 53 Рис.15 Каждая окончательная вершина определяет единственную цепь (последовательность идущих друг за другом звеньев), свя- зьгеающую начальную вершину с данной (см. рис. 15). Такая цепь называется партией. На рис. 15 одна из партий выделена жирными линиями. Число различных партий равно числу окончательных вершин (позиций). В каждой окончательной позиции задан числовой выигрыш игрока А. Замечание. Мы будем рассматривать здесь только антагонистические позиционные игры. В шахматах функция выигрышей игрока А (белых) определяется так: +1 на выигрываемых партиях, О на ничейных партиях, -1 на проигрываемых партиях. Фукшщя выигрышей игрока В (черных) отличается σι1 функции выигрышей белых только знаком. Различают позиционные игры с полной информацией и позиционные игры с неполной информацией. В позиционных играх с полной информацией (пример — шаш- кн, шахматы) каждый игрок при своем ходе знает ту позицию дереза игры, в которой он находится. В позиционных играх с неполной информацией (пример — домино) игрок, делающий ход, не знает точно, в какой именно позиции дерева игры он фактически находится. Этому игроку известно лишь некоторое множество позиций, включающее в себя
54 Позиционные игры его фактическую позицию. Такое множество позиций называется информационным множеством. Позиции, принадлежащие одному и тому же информационному множеству, объединяются пунктирными линиями. Рассмотрим примеры двух игр, состоящих из двух ходов, которые последовательно делают участвующие в ней игроки А и В. Начинает игрок А: он выбирает одну из двух возможных альтернатив — число ж, равное либо 1 (первая альтернатива), либо 2 (вторая альтернатива). На ход игрока А игрок В отвечает своим ходом, выбирая одну из двух возможных альтернатив — число у, равное либо 1 (первая альтернатива), либо 2 (вторая альтернатива). В результате игрок А получает вознаграждение или вынужден платить штраф. Пример 13. 1-й ход. Игрок А выбирает число χ из множества двух чисел {1,2}. 2-й ход. Игрок В выбирает число у из множества двух чисел {1,2}, зная выбор числа χ игроком А. Функция W(x, у) выплат игроку А за счет игрока В задается так Щ1,1)= 1, Щ2,1) = -2, Щ1,2) = -1, Щ2,2)= 2. На рисунке 16 показаны дерево игры и информационные множества. Пример 14. В случае, когда выполнены все условия предыдущего примера, кро- Рис. 16 Рис. 17 ме одного — игрок В на 2-м ходе выбирает число у из множества двух чисел {1,2}, не зная выбора числа χ игроком А, — информационные множества выглядят так, как показано на рисунке 17. Это игра с неполной информацией: игрок В при своем ходе знает, в каком информационном множестве он находится, но ему неизвестно, в какой именно позиции этого множества — левой или правой.
§6. Нормализация позиционной игры 55 §6. Нормализация позиционной игры На доске тем временем происходило смятение. Совершенно расстроенный король в белой мантии топтался на месте, в отчаянии вздымая руки. Три белые пешки- ландскнехты с алебардами растерянно глядели на офицера, размахивающего шпагой и указывающего вперед, где в смежных клетках, белой и черной, виднелись черные всадники Воланда на двух горячих, роющих копытами клетки, конях. М. А. Булгаков «Мастер и Маргарита» Заранее определенную последовательность ходов игрока, выбранную им в зависимости от информации о ходах другого игрока и ходах игрока О (природы), будем называть чистой стратегией этого игрока. В том случае, если в игре нет случайных ходов (игрок О в игре не участвует), выбор игроком А и игроком В чистых стратегий однозначно определяет исход игры — приводит к окончательной позиции, где игрок А и получает свой выигрыш, Это обстоятельство позволяет сводить позиционную игру к матричной игре. Процесс сведения позиционной игры к матричной называется нормализацией позиционной игры. Покажем на нескольких примерах, как это делается. Пример 13 (продолжение). Опишем стратегии игроков. Стратегию игрока А можно задать одним числом х, показывающим, какую альтернативу, первую или вторую, выбрал игрок. Тем самым, у игрока А две чистых стратегии: Αχ — «выбрать χ = 1», __2 — «выбрать χ = 2». Стратегию игрока В (принимая во внимание, что выбор игрока А на 1-м ходе ему известен) удобно описывать упорядоченной парой [УьУг)· Здесь yi (yi = 1,2) — альтернатива, выбираемая игроком В при условии, что игрок А выбрал первую альтернативу, χ = 1, а уг (jfe = 1>2) — альтернатива, выбираемая игроком В при условии, что игрок А выбрал вторую альтернативу, χ = 2.
56 Позиционные игры Например, выбор игроком В стратегии [2,1] означает, что если на 1-м ходе игрок А выбрал χ = 1, то игрок В на своем ходе должен выбрать у = 2. Если же на 1-м ходе игрок А выбрал χ = 2, то согласно этой стратегии игрок В на своем ходе должен выбрать у = 1. Таким образом, у игрока В четыре чистых стратегии: Bt — [1,1] («у = 1 при любом выборе ж»); J52 — [1,2J («у = χ при любом выборе х»)\ Бз — [2,1] («у Φ χ при любом выборе а?»); Ва — [2,2] («у = 2 при любом выборе ж»). Покажем теперь, как рассчитываются выигрыши игрока А в зависимости от примененных стратегий. Пусть, например, игрок А выбрал стратегию А\ — (1), а игрок В — стратегию В2 — [1,2]. Тогда χ = 1, а из стратегии [1,2] вытекает, что у = 1. Отсюда Щ*,у) = Щ1,1) = 1. Остальные выигрыши рассчитываются совершенно аналогично. Результаты расчетов записываются обычно или в виде таблицы выигрышей игрока А А1 А2 г = 1 х = 2 Βχ П,1] Щ1,1) Щ2,1) Вг [1,2] WU 1) W(2,2) Вг [2.U Щ1.2) Щ2,1) В4 [2,2] Щ1,2) Щ2,2) или в виде матрицы игры /11-1 -η (-2 2 -2 Ι)" где, как обычно, строки соответствуют стратегиям игрока А, а столбцы — стратегиям игрока В. Полученная матрица имеет седловую точку. Оптимальные стратегии игроков: Αι — (1) и Б3 — [2,1]. Тем самым, игрок А на 1-м ходе выбирает χ = 1, а игрок В на 2-м ходе выбирает у = 2. Цена игры и = -1. Пример 14 (продолжение). Опишем стратегии игроков. У игрока А они те же, что и в предыдущем примере: Αγ — «выбрать χ = 1», А2 — «выбрать χ = 2». Так как игроку В выбор игрока А неизвестен, то есть игрок В не знает, в какой именно из двух позиций он находится (см. рис. 17), то у него те же две стратегии: Βι — «выбрать у = 1», В2 — «выбрать у = 2».
§б. Нормализация позиционной игры. — 57 Соответствующие таблица выигрышей игрока А и матрица игры имеют следующий вид l·1' \А2 х = 1 х = 2 Bt 0=1 Щ1,1) Щ2,1) В2 j «, = 2 | Щ1,2)| Щ2,2) (-5 "О- Полученная матрица седловой точки не имеет. Оптимальные смешанные стратегии игроков: Р = {§,|}и(? = {|,|}. Цена игры ζ/ = 0. Замечание 1. На этих двух примерах хорошо видно, что результат сведения позиционной игры к матричной напрямую зависит от степени информированности игроков. В частности, отсутствие у игрока В сведений о выборе, сделанном игроком А, приводит к уменьшению количества его возможных 'стратегий. Сравнивая ответы, полученные в примерах 13 и 14, замечаем, что снижение уровня информированности игрока (в данном случае — игрока Б) делает для него исход игры менее благоприятным. Заметим, что это легко следует и из общих соображений. Замечание 2. Приведенные выше примеры не исчерпывают всех возможных вариантов даже в этом, самомпростом, случае двухходовых позиционных игр. Рассмотрим теперь несколько примеров сведения к матричным играм позиционных игр, состоящих из трех ходов, сосредоточив при этом основное внимание на одном из наиболее ответственных шагов нормализации — описании стратегий игроков. Пример 15. 1-й ход делает игрок А: он выбирает число χ из множества двух чисел {1,2}· 2-й ход делает игрок В: зная выбранное игроком А число х, он выбирает число у из множества двух чисел {1,2}. 3-й ход делает игрок А: не зная о выбранном игроке В числе у на 2-м ходе и забыв выбранное им самим на 1-м ходе число х, он выбирает число ζ из множества двух чисел {1,2}. После этого игрок А получает вознаграждение W(x, у, ζ) за счет игрока В, например такое: ИЧ1,1,1) = -2, Щ2,1,1)= 3, Щ1,1,2)= 4, Щ2,1,2)= 0, Щ1,2,1)= 1, ИЧ2,2,1) = -3, Щ1,2,2) = ~4, ИЧ2,2,2)= 5. Рис.18 На рисунке 18 показаны дерево игры и информационные множества.
58 Позиционные нгры Нормализуем эту игру. Поскольку игроку В выбор игрока А на 1-м ходе известен, то у игрока В те же четыре стратегии, что и в примере 13: Вх -[1,Ц, ft-[1,2], В3-[2,1], Б4-[2,2]. Игрок А на 3-м ходе не знает предыдущих выборов — ни значения ж, ни значения у. Поэтому каждая его стратегия состоит просто из пары чисел (χ, ζ), где χ (х = 1,2} — альтернатива, выбираемая игроком А на 1-м ходе, а ζ {ζ = 1,2) — альтернатива, выбираемая игроком А на 3-м ходе. Например, выбор игроком А стратегии (2,1) означает, что на 1-м ходе он выбирает χ = 2, а на 3-м ходе — ζ = 1. Таким образом, у игрока А четыре стратегии: А, -(1,1), А2 -(1,2), ^з-(2,1), А*-(2,2). Покажем теперь, как рассчитываются выигрыши игрока А в зависимости от стратегий, применяемых игроками в данной игре. Пусть, например, игрок А зыбрал стратегию А2 — (1,2), а игрок В — стратегию Въ — [2,1]. Тогда χ — 1, откуда вытекает, что у = 2. Значение ζ — 2 выбрано игроком А независимо от выбора игрока В. Вычисляя значение функции выигрышей для этого набора, получаем Щ*,у,*) = Щ1,2,2) = -4. В результате подобных рассуждений получаются и остальные пятнадцать выигрышей. Это позволяет построить таблицу выигрышей игрока А. Имеем Αι \М \а3 А (1,1) (1,2) (2,1) (2,2) Βι [1,1] Щ1.1.1) Щ1.1.2) Щ2,1,1) ИГ<2,1,2) В2 [1,2] ТГ(1,1,1) ИЧ1.1.2) Щ2,2,1) ИЧ2.2.2) в3 [2,1] Щ1.2.1) ΪΓ(1,2,2) Щ2,1,1) ИЧ2.1.2) В* [2,2} Щ1.2.1) IF(1,2,2) Щ2.2.1) Щ2,2,2) 4 4-4-4 3-3 3-3 V 0 5 0 5/ Пример 16. 1-й ход делает игрок А: он выбирает число χ из множества двух чисел {1,2}. 2-й ход делает игрок В: не зная о выборе игрока А на 1-м ходе, он выбирает число у из множества двух чисел {1,2}.
§6. Нормализация позиционной игры. 3-й ход делает игрок А: он выбирает число ζ из множества двух чисел {1,2}, не зная ни значения х, ни значения у. После этого игроки расплачиваются по правилу, указанному в примере 15. Графическое представление этой игры показано на рисунке 19. Ясно, что у игрока А те же четыре стратегии, что и в примере 15: ^-(1,1), А2-(1,2), Л3-(2,1), А*-(2,2). У игрока В всего две стратегии: В{ — «выбрать у = 1», В2 — «выбрать у = 2». В этом случае (весьма слабой информированности игроков) таблица выигрышей игрока А и соответствующая матрица строятся совсем просто. Имеем Рис.19 Аг Аг Αι А* (1,1) (1,2) (2,1) (2,2) Βι У = 1 Щ1.1.1) Щ1.1.2) Щ2,1,1) Щ2.1.2) в2 У = 2 441,2,1) Щ1,2,2) Щ2,2,1) Щ2,2,2) (~2 4 3 V о 1\ -4 -3 5/ Оптимальные смешанные стратегии игроков и цена игры соответственно равны: р={о,£,о,£}, Q = {£,£}, " = !· В следующем примере информационые множества выглядят немного иначе. Пример 17. 1 -й ход делает игрок А: он выбирает число χ из множества двух чисел {1,2}. 2-й ход делает игрок В: не зная о выборе игрока А на 1-м ходе, он выбирает число у из множества двух чисел {1,2}. 3-й ход делает игрок А: он выбирает число ζ из множества двух чисел {1,2}, зная выбор у игрока В на 2-м ходе, но не помня собственного выбора χ на 1-м ходе.
Позиционные игры После этого игроки расплачиваются по правилу, указанному в примере 15. Графическое представление этой игры показано на рисунке 20. Поскольку игроку В неизвестен выбор игрока А на 1-м ходе, то, выполняя свой ход, он не знает, в какой именно из двух возможных позиций он находится. Поэтому у игрока В всего две стратегии: Вх — «выбрать у = 1», В2 — «выбрать у = 2». При описании стратегий игрока А нужно исходить из того, что к 3-му ходу игрок А утратил сведения о собственном выборе на 1-м ходе, но ему известен выбор игрока В на 2-м ходе. Поэтому выбор числа ζ игроку А следует связать с известным ему к 3-му ходу значением у. Удобнее всего это сделать по аналогии с расчетом стратегий игрока В в примерах 13 и 15, т.е. при помощи упорядоченной пары [Ζι,Ζι]. у Здесь ζγ (ζχ = 1,2) — альтернатива, выбираемая игроком А при условии, что игрок В выбрал первую альтернативу, у = 1, а *2 (*2 = 1,2) — альтернатива, выбираемая игроком А при условии, что игрок В выбрал вторую альтернативу, у = 2. Чистую стратегию игрока А в данной игре можно записать так (ж, Ι*ι, *2]). Здесь χ (х = 1,2) — альтернатива, которую игрок А выбирает на 1-м ходе, *ι (*ι = 1,2) — альтернатива, которую игрок А выбирает на 3-м ходе, если на 2-м ходе игрок В выбрал выбрал первую альтернативу (у = 1),и22 (ζ2 = 1,2) — альтернатива, которую игрок А выбирает на 3-м ходе, если на 2-м ходе игрок В выбрал вторую альтернативу (у = 2). Например, выбор игроком А стратегии (2, [2,1]) означает, что на 1-м ходе игрок А выбирает χ = 2, а на 3-м 2 = 2, если игрок В выбрал у — 1, и ζ = 1, если игрок В выбрал у = 2. Тем самым, у игрока А восемь чистых стратегий: ^ — (1, [1, Ц), ^2 — (1, [1,2]), Лэ-(1,[2,Ф, А-(1,[2,2]), ^5-(2, [1,1]), А6 -(2, [1,2]), А7-(2,[2,1]), А, - (2, [2,2]). Покажем теперь, как в зависимости от применяемых стратегий определяются элементы таблицы выигрышей игрока А.
. Нормализация позиционной игры. .61 Пусть, например, игрок А выбрал стратегию А3 — (1, [2,1J), а игрок В — стратегию В2 — (2). Тогда χ = 1, у = 2, а из [2,1] вытекает, что ζ — 1. Отсюда Щ*,у,г) = Щ1,2,1) = 1. По этой же схеме вычисляются и остальные элементы таблицы. В результате получаем ^1 А2 А3 ^4 \а5 Мб \а7 А, (1,(1, П) α,[ΐ,2]) (1,[2,U) (1,[2,21) (2, [1, 11) (2, [1,2]) (2, [2,1]) (2, [2,2]) Bi (1) W(l, 1,1) wa,i,D W(l,l,2) Щ1Д.2) Щ2,1,1) Щ2.1.1) Щ2,1,2) Щ2.1.2) B2 (2) Щ1,2,1) W(l,2,2) Щ1,2,1) ^(1,2,2) Щ2,2,1) Щ2,2,2) Щ2.2.1) Щ2.2.2) Г2 -2 4 4 3 3 0 V о 1\ -4 1 -4 -3 5 -3 5/ Оптимальные смешанные стратегии игроков и цена игры соответственно равны: р = {од|до,|до}, Q = {|,i}, *=f Рассмотрим позиционную игру со случайным ходом. Пример 18. 1-й ход производится случайно: игрок О выбирает число ж, равное 1, с вероятностью 0,5, и равное 2 — с такой же вероятностью**. 2-й ход делает игрок А: он выбирает число у из множества двух чисел {1,2}, не зная результатов случайного выбора на 1-м ходе. 3-й ход делает игрок В: он выбирает число ζ из множества двух чисел {1,2}, зная о том, какое именно число χ случайно выбрано игроком О на 1-м ходе и не зная выбора у игрока А на 2-м ходе. После этого игроки расплачиваются, используя функцию Щж,у,г). ту же, что и в предыдущих примерах. *' Это формальное описание часто встречающейся ситуации разыгрывания между двумя игроками права 1-го хода (например, при помощи подбрасывания монеты).
Позиционные игры Графическое представление этой игры показано на рисунке 21. Опишем стратегии игроков Поскольку игроку А исход случайного испытания неизвестен, то он имеет всего две стратегии: -Αι —(1), Л2-(2). При построении своих стратегий игроку В естественно воспользоваться имеющейся у него информацией о результате 1-го хода. Это позволит ему описать свою стратегию упорядоченной парой Рис. 21 Здесь ζι (ζχ = 1,2) — альтернатива, выбираемая игроком В при условии, что ж = 1,аг2 (ζ2 — 1,2) — альтернатива, выбираемая игроком В при условии, что χ = 2. Тем самым, у игрока В четыре стратегии: ft-IMJ. ft-[1,2], ft-[2,1], ft-[2,2]. Покажем теперь, как определяются элементы таблицы выигрышей игрока А. Пусть, например, игрок А выбрал стратегию Αι — (1), а игрок В — стратегию Б3 — [2,1]. Различаются два случая: 1) ж = 1 и 2) χ = 2. Если χ = 1, то стратегия Б3 указывает игроку В его выбор ζ = 2. А так как у = 1, то в результате имеем ТГ(а,у,г) = Щ1,1,2) = 4. Если χ = 2, то стратегия .ft указывает игроку Б его выбор ζ = 1. А так как у = 1, то в результате имеем Щж,у,*) = Щ2,1,1) = 3. Поскольку первая и вторая альтернативы на 1-м ходе выбираются с вероятностями 0,5 и 0,5, то и вышеуказанные выигрыши появляются с теми же вероятностями и, следовательно, средний выигрыш игрока А при этих стратегиях определяется так 4.0,5 + 3.0,5 = 3,5. Аналогичным образом рассчитывая остальные средние выигрыши, получаем:
. Нормализация позиционной игры _ при χ = 1 _63 Αι \А2 (1) (2) Βι [1,1] Щ1,1,1) Щ1,2,1) В2 [1,2] Щ1,1,1) Щ1.2.1) в3 [2,1] Щ1.1.2) 1Г<1,2,2) ^ [2,2] Щ1.1.2) Щ1.2.2) ИЛИ /-2-2 4 4\ \ 1 1-4 -А)> при ж = 2 4, 1-Аа (1) (2) Βι [1,1] Щ2,1,1) Щ2Д1) Вг [1,2] Щ2,1,2) Щ2.2.2) Вг [2,11 Щ2,1,1) Щ2,2,1) в4 [2,2] РГ(2,1,2) ^(2,2,2) или 3 О -3 5 3 (Г -3 5, Искомая матрица игры имеет следующий вид (-г 5 -1 3,5 О 3 -3,5 0: 50·- Рассмотрим еще один пример позиционной игры со случайным разыгрыванием права первого хода. Рис.22 Пример 19. 1-й ход делает игрок О, выбирая число х, равное 1 с вероятностью § и равное 2 с вероятностью |. Если χ = 1, то на 2-м ходе игрок А выбирает число у из множества двух чисел {1,2}, зная результат случайного выбора на 1-м ходе, а на 3-м ходе игрок В выбирает число ζ из множества двух чисел {1,2}, зная χ, но не зная у. Если χ = 2, то на 2-мходе игрок В выбирает число у из множества двух чисел {1,2}, зная результат случайного выбора на 1 -м ходе, а на 3 -мходе игрок А выбирает число ζ из множества двух чисел {1,2}, зная χ, но не зная у. После этого игроки расплачиваются, используя функцию W(x,y,2), ту же. что и в предыдущих примерах. Графическое представление этой игры показано на рисунке 22.
64 Позиционные игры Чистую стратегию игрока А в данной игре можно описать упорядоченной парой |у>*1> где у {у = 1,2) — выбор игрока А на 2-м ходе, если на 14-м ходе выбрано χ = 1, а ζ (ζ = 1,2) — выбор игрока А на 3-м ходе, если на 1-м ходе выбрано х = 2. Например, стратегия |1,2| означает, что на 2-м ходе игрок А выбирает у = 1, а на 3-м ходе — 2 = 2. Тем самым, у игрока А четыре стратегии: А!-|1,1|, А2 -11,21, Аз-|2,1|, 44-|2,2|. У игрока В те же четыре стратегии: Bi-|1,1|. ifc-MI, Вз-|2,1|, JB4 — |2,2|. Покажем теперь, как находятся элементы матрицы выигрышей игрока А. Пусть, например, игрок А применяет стратегию А2 — |1,2|, а игрок В — стратегию Б3 — |2,1|. Различаются два случая 1) χ = 1 и 2) χ = 2. По условию при х = 1 игрок А имеет возможность сделать только 2-й ход (выбрать у), а игрок В — только 3-й (выбрать ζ). При χ = 2 их вохможности меняются местами: игроку В предоставлено право 2-го хода (выбрать у), а игроку -4 — 3-го.(выбрать ζ). Если ж = 1, то стратегия А2 указывает игроку А при 2-м ходе взять у= 1, а стратегия В3 указывает игроку В при 3-м ходе взять ζ = 1. В результате Щ*,У,*) = Щ1,1,1) = -2. Если χ = 2, то стратегия Б3 указывает игроку В при 2-м ходе взять у = 2, а стратегия А2 указывает игроку А при 3-м ходе взять ζ = 2. В результате ИЧ*,У,*) = Щ2,2,2) = 5. Поскольку первая и вторая альтернативы на 1-м ходе выбираются соответственно с вероятностями § и |, то и найденные выигрыши появляются с теми же вероятностями. Следовательно, математическое ожидание выигрыша игрока А при таких стратегиях рассчитывается так Ζ 3 ^Л 3 3' Итак, при χ = 1 Ul г* \Аз \Л4 И, И И, 2| 12, Ц |2,2| В| И, И Щ1,1,1) Щ1.1.1) Щ1,2,1) ИЧ1.2,1) в2 |1,2| Щ1.1.2) WQ-,1,2) Щ1.2.2) Щ1.2.2) в3 12, И Щ1,1,1) Щ1,1,1) Щ1.2.1) 1Г<1,2,1) В* |2,2| Щ1.1.2) Иг<1,1,2) ТР(1,2,2) Щ1.2.2)
§6. Нормализация позиционной игры_ или при χ = 2 f~2 -2 1 V 1 А 4 -4 -4 -2 -2 1 1 4 4 -4 -4 1 -^ 1^2 \ъ \_А* U, И И, 2| 12,11 12,2| в, И, И Щ2,1,1) Щ2.1.2) Щ2.1.1) Щ2,1,2) Вг |1,2| Щ2,1,1) Щ2,1,2) W(2,1,1) N42,1,2) Вз |2,1| Щ2,2,1) Щ2.2.2) Щ2,2,1) Щ2,2,2) в4 |2,2| Щ2,2,1) Щ2,2,2) ^(2,2,1) Щ2.2.2) '3 3 -3 -3\ 0 0 5 5 3 3-3-3 ,0 0 5 5/ Отсюда получаем искомую матрицу игры /-1 11-7 5\ -4 8 1 11 5 -5 -1 -И V 2 -8 7 -5 / Рис.23 Замечание. Графическое представление и функция выигрышей полностью определяют позиционную игру. В рассмотренных выше примерах 16-19 мы пользовались одной и той же функцией и одним и тем же деревом. Отличие было только в маркировке вершин дерева и информационных множествах. При построении последних необходимо соблюдать два правила: 1) в одно информационное множество могут входить позиции только одного игрока, 2) цепь, определяющая партию игры, может иметь с информационным множеством не более одной общей позиции (то есть при разыгрывании партии игрок не может дважды попасть в одно и то же информационное множество). Как показывает рисунок 23, и при таких ограничениях информационные множества могут выглядеть довольно причудливо.
66 Позиционные игры §7. Позиционные игры с полной информацией ...он брал шашку за шашкой и лез ухе в дамки, но соображать и вникать в игру мешала ему одна неотступная мысль... А. П. Чехов «Безнадежный* Позиционная игра называется игрой с полной информацией, если в каждой позиции любой ее партии игрок, делающий ход, знает, какие альтернативы были выбраны на предыдущих ходах. В графическом описании каждая вершина дерева такой игры представляет собой отдельное информационное множество. Примерами позиционных игр с полной информацией могут служить крестики-нолики, шашки и шахматы. Основная особенность позиционной игры с полной информацией состоит в том, что соответствующая ей матрица выигрышей всегда имеет седловую точку, то есть в игре с полной информацией существуют оптимальные чистые стратегии и, значит, равновесная ситуация. Сказанное означает, что в шахматах (крестиках-ноликах, шашках) уже в начальной позиции либо имеется способ выигрыша за белых, либо способ выигрьппа за черных, либо как та, так и другая сторона способна форсировать ничью. Однако известное доказательство существования равновесной ситуации неконструктивно и не дает эффективных приемов фактического нахождения решения игры. И такие способы (стратегии) в шахматах не найдены до сих пор; неизвестно даже, какая из перечисленных возможностей имеет место на самом деле. Иное дело с игрой крестики-нолики: стратегий в ней немного и она разобрана до самого конца — существуют оптимальные чистые стратегии, ведущие игроков к ничьей. Рассмотрим несколько примеров. 1. Как нетрудно заметить, двухходовая игра из примера 11 является игрой с полной информацией. Ее нормализация приводит к матрице с седловой точкой (см. пример 13). 2. «Выкладывание монет на стол». Два игрока поочередно кладут монеты одинаковых размеров на обыкновенный стол, всякий раз выбирая произвольное доступное место для монеты (взаимное накрывание монет не допускается). Тот
§7. Позиционные игры с полной информацией 67 из игроков, кто положит монету, не оставляющую места для новых монет, выигрывает. Это игра с полной информацией. Существует вполне определенная стратегия, обеспечивающая выигрыш тому из игроков, кто начинает игру: начинающий игру должен положить первую монету точно в центр стола и на каждый ход противника отвечать симметричным ходом. Исход игры от стратегии второго игрока не зависит. 3. «Переговоры». В переговорах участвуют две стороны А и В. В слегка идеализированном варианте это может выглядеть, например, так. Сначала сторона А высказывает одно из нескольких предложений, способных заинтересовать сторону В. Затем сторона В, ознакомившись с предложением стороны А, высказывает одно из нескольких встречных предложений, способных, по ее мнению, заинтересовать сторону А. В свою очередь, сторона А, ознакомившись с реакцией стороны В на сделанные предложения, высказывает ей новое предложение, внеся одну из нескольких возможных корректировок в свое первоначальное предложение с учетом мнения стороны В и т. д. Если предмет переговоров сложен, то подобный обмен ходов может затянуться. Однако любые переговоры непременно заканчиваются. И там, на финише, ждет функция выигрышей. Попробуем смоделировать короткий переговорный процесс при помощи трехходовой позиционной игры. Предположим, что переговоры заканчиваются через три хода, на каждом из которых соответствующая сторона имеет возможность выбора из двух альтернатив, и опишем соответствующую позиционную игру. 1-й ход делает сторона А: она выбирает одно из двух возможных предложений — число χ из множества двух чисел {1,2}. 2-й ход делает сторона В: она выбирает число у из множества двух чисел {1,2}, зная число х, предложенное стороной А. 3-й ход делает сторона А: она выбирает число ζ из множества двух чисел {1,2}, зная о предложении стороны В на 2-м ходе и помня собственное предожение на 1-м ходе. После этого сторона А либо получает вознаграждение (например, в виде кредита от стороны В), либо выплачивает стороне В штраф. Все эти возможности описываются функцией выигрышей W(x, у, ζ), заданной следующей таблицей Щ1,1,1) = а, Щ2,1,1) = е, Щ1,1,2) = д, Щ2,1,2) = /. ИЧ1,2,1) = с, ИЧ2,2,1) = я, Щ1,2,2) = <1, Щ2,2,2) = Л. Графическое представление этой игры показано на рисунке 24. Ясно, что описанная позиционная игра является игрой с полной информацией.
Позиционные игры Сначала опишем возможные стратегии игрока В. Поскольку игроку В выбор игрока А на 1-м ходе известен, то у игрока Б те же четыре стратегии, что и в примере 13: Si-[1,1]. В2-[1,2], Я3-[2,1], В4-[2,2]. С описания возможных стратегий игрока А дело обстоит немного посложнее — их восемь. Чистая стратегия игрока А в данной игре описывается упорядоченной тройкой (Ж, [ZU Z2]). Здесь χ {х = 1,2) — альтернатива, которую игрок А выбирает на 1-м ходе, *ι (*ι = 1,2) — альтернатива, которую игрок А выбирает на 3-м ходе, если на 2-м ходе игрок В выбрал выбрал первую альтернативу (у = 1), иг2(22 = 1,2) — альтернатива, которую игрок А выбирает на 3-м ходе, если на 2-м ходе игрок В выбрал вторую альтернативу (у = 2). Например, выбор игроком А стратегии (1, [2,1]) означает, что на 1-м ходе игрок А выбирает χ = 1, а на 3-м ζ = 2, если игрок В выбрал # = !, и ζ = 1, если игрок В выбрал у = 2. Тем самым, у игрока А восемь чистых стратегий: 4ι-(Μ1,4>· Μ -d, [1,2]), Аз — (1,12,1]), Α4-(1,[2,2]), A5-(2,[l,l]), А*-(2, [1,2]), A7-(2,[2,l]), Аг - (2, [2,2]). Покажем теперь, как в зависимости от применяемых стратегий определяются элементы таблицы выигрышей игрока А. Пусть, например, игрок А выбрал стратегию As — (2, [1,2J), а игрок В — стратегию Б3 — [2,1]. Тогда χ = 2. Из [2,1] вытекает, что у = 1, а из (2, [1,2]), что ζ = 1. Отсюда Щя, у,*) = ^(2,1,1) = е. Рассчитывая по этой же схеме все остальные элементы таблицы выигры- Рис.24
§7. Позиционные игры с полной информацией шей, в итоге получим \A1 \*i \Аз |^4 \А5 \А6 \А7 1* (1,[1,Щ (1,[1,2]) (1,(2,4) (1,12,2]) (2, [1,1]) (2, [1,2]) (2, [2, Ц) (2, [2,2]) в, U,i] Щ1, ι, 1) Щ1,1,1) W(l,l,2) Щ1.1.2) Щ2,1,1) W(2,1,1) Щ2,1,2) Щ2,1,2) В2 [1,2] W(l,l,l) Щ1,1,1) Щ1,1,2) Щ1.1.2) Щ2.2.1) ίΓ(2,2,2) РГ(2,2,1) Щ2,2,2) Вз [2,1] W(l,2,l) Щ1,2,2) Щ1.2.1) Щ1.2.2) Щ2,1,1) Щ2,1,1) ΪΓ(2,1,2) Щ2Д.2) * [2,2] IF(1,2,1) Щ1.2.2) Щ1.2.1) Щ1.2.2) Щ2,2,1) Щ2,2,2) Щ2,2,1)| Щ2.2.2) /а а с с\ [ α α d d J 6 & с с \ b b d d \ \ e g e g \' I e Л e ft I / Ρ / 9] \f h f h/ Вследствие того, что рассматриваемая позиционная игра является игрой с полной информацией, полученная матрица имеет седловую точку при любой функции выигрышей. В этом легко убедиться, произвольно выбирая значения параметров а, 6, с, d, е, /, д и Λ. При увеличении числа ходов стратегии в позиционной игре с полной информацией строятся по аналогичной схеме. Рассмотрим, например, четырехходовую позиционную игру. 1-й ход делает игрок А: он выбирает число χ из множества двух чисел {1,2}. 2-й ход делает игрок В: он выбирает число у из множества двух чисел {1,2}, зная число х, выбранное игроком А на 1-м ходе. 3-й ход делает игрок А: он выбирает число ζ из множества двух чисел {1,2}, зная число у, выбранное игроком В на 2-м ходе, и помня свой выбор числа χ на 1-м ходе. 4-й ход делает игрок В: он выбирает число и из множества двух чисел {1,2}, зная число ζ, выбранное игроком А на 3-м ходе, помня свой выбор числа у на 2-м ходе и зная выбор игрока А на 1-м ходе — число х. После этого игроки А и В расплачиваются в соответствии с заданной функцией выигрышей W(x, у, ζ,«).
70 Позиционные игры В этой игре стратегии у игрока А те же, что и в задаче, рассмотренной выше: каждая из них задается тройкой вида (*, [*ь *2J), и общее их число равно восьми. Что касается стратегий игрока Б, то в этой игре их шестнадцать и каждая из них задается четверкой вида ([УЫЬМ«ь«2])· Матрица выигрышей игрока А в данной игре имеет размер 8 χ 16. Покажем, как определяются ее элементы в зависимости от применяемых стратегий игроков. Пусть, например, игрок А выбрал стратегию А* — (2, [2,1]), а игрок В стратегию В* — ([2,1], [1,2]). Тогда χ = 1, у = 2, а ζ = 1. Из того, что [иьи2] = [1,2], получаем, что и = 1. Отсюда следует, что искомый элемент матрицы выплат равен Щ1,2,1,1). Остальные элементы матрицы вычисляются аналогично. Так как эта позиционная игра также является игрой с полной информацией, то получаемая матрица будет иметь седловую точку. Несколько слов в заключение После этого роли вновь переменились, и самка мчалась за самцом, возглавлявшим дикую гонку то вверх, то вниз, за насыпь и обратно; в конце концов оба волка потеряли равновесие и, сцепившись, покатились по крутому склону. ф.Моуэт «Не кричи: "Волки!"» В рассмотренных примерах основное внимание было уделено описанию процесса нормализации позиционной игры — построению дерева игры и информационных множеств, выработке стратегий игроков и вычислению элементов платежной матрицы. Следующий естественный шаг — отыскание цены игры и оптимальных стратегий игроков — проводится методами, о которых рассказывалось в разделе, посвященном матричным играм. Мы достаточно подробно остановились на позиционных играх двух лиц, где были явно выражены интересы одного из игроков (игрока А). Следует, однако, иметь в виду, что в одних случаях
§7. Позиционные игры с полной информацией 71 интересы игрока В могут быть полностью противоположными интересам игрока А, в то время как в других вполне может оказаться, что то, что хорошо для одного игрока, не обязательно плохо для другого. Приведем два простых примера. Пример А. 1-й ход. Игрок А выбирает число χ из множества двух чисел {1,2}. 2-й ход. Игрок В выбирает число у из множества двух чисел {1,2}, зная выбор числа χ игроком А. Функции выплат игрокам А и В — WA(x, у) и WB(x, у) соответственно — задаются так: WA(L, 1) = 1, WAtt, 2) = -1, WA(2,1) = -2, WA{2> 2) = 2, WB(L, 1) = 2, WB(h 2) = 1, WB(2,1) = 1, WB(2,2) = 2. Дерево игры показано на рис. 25. Исход игры зависит от того, каковы намерения игрока В — максимизировать свой выигрыш: WB(xt у) -> max, или максимизировать свой относительный выигрыш: WB(x, у) - WA(x, у) -> max. В первом случае это достигается так: приж=1 у = 1иИЪ(1,1) = 2(И^(1,1) = 1); при χ = 2 у = 2 и WB(2,2) = 2 {WA(292) = 2). Во втором случае: при χ = I у = 2 и WB(1,2) - WA(1,2) = 1 - (-1) = 2); прия = 2 у = 1и^в(2,1)-1^(2,1) = 1~(--2) = 3). Пример Б. Игра задается деревом (см. рис. 26). (1,2) (-1,1) (-2,1) (2,2) Рис.25 (1И) 0,3) Рис.26 1-й ход. Игрок А выбирает число χ из множества двух чисел {1,2}. Если χ = 1, то каждый из игроков получает свой выигрыш, равный 2. Если χ = 2, то право 2-го хода получает игрок В, где он и выбирает выбирает число у из множества двух чисел {1,2}.
72 Позиционные игры При у = 1 выигрыш игрока А равен 1, а игрока В — 4. При у = 2 оба игрока получают поровну — по 3. В случае, когда каждый из игроков стремится к получению максимального выигрыша и любые виды кооперации запрещены, исход игры ясен — игрок Л выбирает χ = 1, и игра заканчивается. Но при χ — 2 и у = 2 каждый из игроков получает по 3 (такой исход предпочтительнее простейшего (1,1)), и, если допустить соглашение между игроками, это обстоятельство вполне может изменить исход игры. Задания Дайте графическое представление, приведите к нормальной форме и найдите точное решение позиционной игры со следующей функцией выигрышей W(xy #, ζ): Щ1,1,1)= 2, Щ2,1,1) = -1, Щ1,1,2)=-2, Щ2,1,2)= 3, РГ(1,2,1)= 1, Щ2,2,1)= О, Щ1,2,2)= О, Щ2,2,2) = -3. a. 1-й ход делает игрок А: он выбирает число χ из множества двух чисел {1,2}. 2-й ход делает игрок В: не зная о выборе игрока А на 1-м ходе, он выбирает число у из множества двух чисел {1,2}. 3-й ход делает игрок А: он выбирает число ζ из множества двух чисел {1,2}, зная значение у, выбранное игроком В на 2-м ходе, но не помня собственною выбора ж на 1-м ходе. b. 1-й ход делает игрок 4: он выбирает число χ из множества двух чисел {1,2}; 2-й ход делает игрок В: зная выбор игрока А на 1-м ходе, он выбирает число у из множества двух чисел {1,2}; 3 -й ход делает игрок А: он выбирает число ζ из множества двух чисел {1,2}, не зная значения у, выбранного игроком Б на 2-м ходе, но помня собственный выбор χ на 1-м ходе. c. 1-й ход производится случайно: игрок О выбирает число ж, равное 1 с вероятностью 0,3 и равное 2 с вероятностью 0,7; 2-й ход делает игрок А: он выбирает число у из множества двух чисел {1,2}, зная результат случайного выбора на 1-м ходе; 3-й ход делает игрок В: он выбирает число ζ из множества двух чисел {1,2}, зная выбор у игрока А на 2-м ходе, но не зная случайного выбора χ на 1-м ходе, ...если игрок объявляет шах королю, а короля между тем уже и в помине нет на доске, шах признается недействительным. М.А.Булгаков «Мастер и Маргарита*
Биматричные игры Вы садитесь за зеленый стол... Туг новая серия наслаждений... Проходит полчаса — и желтая бумажка, которую вы в начале игры положили перед собой, обращается в гору банковых билетов, акций, векселей... А. П. Чехов «Идиллии» Предыдущие рассмотрения касались игр двух лиц, в которых интересы игроков были прямо противоположны (антагонистические, или матричные игры), а также позиционных игр, сводимых к матричным. Однако ситуации, в которых интересы игроков хотя и не совпадают, но уже не обязательно являются противоположными, встречаются значительно чаще. Рассмотрим, например, конфликтную ситуацию, в которой каждый из двух участников имеет следующие возможности для выбора своей линии поведения: игрок А — может выбрать любую из стратегий Аь..., Ат, игрок В — любур из стратегий Ви ..., Вп. При этом всякий раз их совместный выбор оценивается вполне определенно: если игрок А выбрал i-ю стратегию Ai9 а игрок В — &-ю стратегию Вк9 то в итоге выигрыш игрока А будет равен некоторому числу aik, а выигрыш игрока В некоторому, вообще говоря, другому числу bik. Иными словами, всякий раз каждый из игроков получает свой приз.
74 Биматричные щи Последовательно перебирая все стратегии игрока А и все стратегии игрока В, мы сможем заполнить их выигрышами две таблицы Лу Ai &т Вг ап aix 0>ml >.. вк . • · <*1* · • . 0>ik « -. «rofc · -. вп .. ain .. ain ·· «mn At Ai Am Вг . 6„ . bn ■ bmi ■ ■ ■ вк ■ ■ ьт ■■ bik ·· Ьт* .. д, ·· bin ·· bin ■ ■ bmn Первая из таблиц описывает выигрыши игрока А, а вторая ~ выигрыши игрока В. Обычно эти таблицы записывают в виде матриц (ап ... ахк ... а1п\ (Ъп ... bih ... Ьы \ А = ап В = Ьц bih bin bmn/ Ьтк платежная ма~ \ami . ..„ атк ... атп/ \bmi · Здесь А — платежная матрица игрока А, а В трица игрока В. При выборе игроком А i-й стратегии, а игроком В — й~й стратегии их выигрыши находятся в матрицах выплат на Пересе· чении <-х строк и Л-х столбцов: в матрице А это элемент о,·*, а в матрице В — элемент bik. Таким образом, в случае, когда интересы игроков различены (но не обязательно противоположны), получаются две платежные матрицы: одна — матрица выплат игроку А, другая — матрица выплат игроку В. Поэтому совершенно естественно звучит название, которое обычно присваивается подобной игре — биматричная. Замечание. Рассматриваемые ранее матричные игры, разумеется, можно рассматривать и как биматричные, где матрица выплат игроку В противоположна матрице выплат игроку А: или
§8. Примеры биматричных игр 75 Тем не менее, в общем случае биматричная игра — это игра с ненулевой суммой. Нам кажется вполне естественным время от времени сопоставлять наши рассмотрения с рассуждениями, гфоведенными ранее для матричных игр (особенно при попытках разрешения схожих проблем). Подобные сопоставления часто оказываются одновременно и удобными и полезными. Конечно, класс биматричных игр значительно шире класса матричных (разнообразие новых моделируемых конфликтных ситуаций весьма заметно), а, значит, неизбежно увеличиваются и трудности, встающие на пути их успешного разрешения. Впрочем, мы надеемся, что часть из этих трудностей мы сумеем преодолеть уже в настоящем издании. §8. Примеры биматричных игр И карты, как глянешь с холодным вниманьем вокруг — Такая пустая и глупая шутка. Н.А.Некрасов «И скучно и грустно» Примеры этого раздела описывают некоторые типичные конфликтные ситуации, приводящие к биматричным играм. Сначала мы обсудим вопросы, связанные с формализацией рассматриваемых конфликтов (построение платежных матриц), а затем рассмотрим рекомендации по их разрешению. Пример 20. «Борьба за рынки». Небольшая фирма (игрок А) намерена сбыть партию товара на одном из двух рынков, контролируемых другой, более крупной фирмой (игрок В). Для этого фирма А готова предпринять на одном из рынков соответствующие приготовления (например, развернуть рекламную компанию}. Господствующая на рынках фирма В может попытаться воспрепятствовать этому, приняв на одном из рынков предупредительные меры (разумеется, в рамках закона). Не встречая противодействия на рынке, фирма А захватывает его; при наличии препятствий — терпит поражение, Будем считать для определенности, что проникновение фирмы А на первый рынок более выгодно для нее, нежели проникновение на второй. Естественно также считать, что и борьба за первый рынок потребует вложения больших средств. Например, победа фирмы А на первом рынке принесет ей вдвое больший выигрыш, чем победа на втором, но зато и поражение при
76 Биматричные игры попытке освоиться на первом рынке полностью разорит ее, избавив фирму В от конкурента. Что же касается второго рынка, то при поражении фирмы Л ее потери будут не столь разорительны, но и победа принесет немного. Таким образом, у фирмы А две стратегии: Αχ — «выбор первого рынка», Αι — «выбор второго рынка». Такие же стратегии и у фирмы В: Βχ — «выбор первого рынка», Въ — «выбор второго рынка». Для того, чтобы составить платежные матрицы игроков, нужны расчетные количественные показатели, которые мы приведем здесь в условных единицах: *-(-?.?). -(-ι-?)· Взглянем на выписанные матрицы выплат. Из сказанного выше ясно, что если оба игрока выберут один и тот же рынок, то победа останется за более сильной фирмой В. То, что в ситуации (Αχ,Βχ) выигрыш игрока В равен 5, а в ситуации (Αί,Βϊ) — 1, подчеркивает, что первый рынок более выгоден (удобно расположен, хорошо посещаем и т.п.), чем второй. Выигрыш (-10) игрока А в ситуации (Αχ,Βχ) (а точнее, проигрыш) в сопоставлении с его выигрышем (— 1) в ситуации (Аг^В^ выглядит, разумеется, вполне сокрушительно. Что же касается ситуации, когда фирмы уделяют основное внимание разным рынкам (Аи В2) и (А2> Βχ), то здесь фирму А ждет настоящий выигрыш, больший на более выгодном рынке. Потери, которые при этом несет фирма В, оказываются прямо противоположными. Замечание. Ясно, что точно рассчитать выгоду и ущерб сторон в этом конфликте заранее довольно трудно. А вот в следующей конфликтной ситуации размеры выигрышей игроков известны со всей определенностью. Пример 21. «Дилемма узников». Игроками являются два узника, находящихся в предварительном заключении по подозрению в совершении преступления. При отсутствии прямых улик возможность их осуждения в большой степени зависит оттого, заговорят они или будут молчать. Если оба будут молчать, то наказанием будет лишь срок предварительного заключения (потери каждого из узников составят (-1)). Если сознаются, то получат срок, учитывающий признание как смягчающее обстоятельство (потери каждого из узников составят в этом случае (-6)). Если же заговорит только один из узников, а другой будет молчать, то в этом случае заговоривший будет выпущен на свободу (его потери равны 0), а сохраняющий молчание получит максимально возможное наказание (его потери будут равны (-9)).
§8. Примеры биматричных игр 77 Эта конфликтная ситуация приводит к биматричной игре, в которой каждый из игроков имеет по две стратегии — молчать (М) или говорить (Г). Выигрыши игроков А и В соответственно описываются так: (М) (Г) (М) (Г) -1 О -9 -6 (М) (Г) (М) (Г) -1 -9 О -6 Пример 22. «Удаление клещей». Представим себе некоторый вид птиц, на котором паразитирует вредный клещ, служащий переносчиком опасной болезни. Этих клещей следует удалять, причем как можно скорее. Обычно каждая птица сама обирает с себя клещей, когда чистит перья. Но одна часть тела недоступна ее клюву — макушка головы, и птице нужно, чтобы это за нее сделал кто-то другой. Допустим, что у птицы А на макушке сидит паразит, который птица В может удалить. Птица В либо удаляет, либо отказывается. В случае, когда клещ докучает птице В, положение меняется. Естественно предполагая, что подобное повторяется многократно, опишем возможные исходы путем составления платежной матрицы птицы А: 3 S Соглашается Отказывается Птица В Соглашается У меня вытаскивают клещей и я несу расходы связанные с вытаскиванием клещей у вас. У меня вытаскивают клещей и я не несу расходов, связанных с вытаскиванием клещей у вас. Отказывается Я остаюсь при своих клещах и при этом я несу расходы, связанные с вытаскиванием клещей у вас. Я остаюсь при своих клещах, утешаясь тем, что не вытаскивал клещей у вас. Построенная таблица описывает выплаты птице А при различных исходах игры. При этом в качестве партнера в этой игре (при многократном ее повторении) могут выступать разные птицы данного вида.
78. Полученную таблицу можно записать проще — например, так: . Биматричнме юры 1 Хорошо 1 Очень хорошо Очень плохо Плохо и даже так: 3 О 5 1 Тем самым, поведение каждой пары птиц описывается парой матриц вида (ι »■ α ί)· Пример 23. «Семейный спор». Два партнера договариваются о совместном проведении одного из двух действий, (1) и (2), каждое из которых требует их совместного участия. В случае осуществления первого из этих двух действий выигрыш первого партнера (игрок А) будет вдвое выше выигрыша второго партнера (игрок В). Напротив, в случае осуществления второго из этих двух действий выигрыш игрока А будет вдвое меньше выигрыша игрока В. Если же партнеры выполнят различные действия, то выигрыш каждого из них будет равен нулю. Эта конфликтная ситуация приводит к биматричной игре, в которой каждый из игроков имеет по две стратегии. Выигрыши игроков А и В соответственно описываются таблицами следующего вида: (1) (2) (1) 2 0 (2) 0 1 (1) (2) (1) (2) 1 0 0 2 Пояснение. Довольно понятно, что различные конфликтные ситуации могут иметь одну и ту же формализацию. В частности, рассмотренная бима- тричная игра часто интерпретируется как одновременный выбор супругами совместного развлечения: посещение оперного спектакля или хоккейного матча. При этом в посещении оперного театра жена заинтересована в большей степени, чем муж, а при посещении стадиона наблюдается обратная картина. В случае же непреодоления разногласий, возникших при выборе, день оказывается вообще испорченным. Отсюда и название, вынесенное в заголовок. Пример 24. «Студент—Преподаватель». Рассмотрим следующую ситуацию. Студент (игрок А) готовится к зачету, который принимает Преподаватель (игрок В). Можно считать, что у Студента две стратегии — подготовиться к сдаче зачета (+) и не подготовиться (-). У Преподавателя также две стратегии — поставить зачет [+] и не поставить зачета [—].
9. Смешанные стратегии _ .79 В основу значений функций выигрыша игроков положим следующие соображения: Выигрыш Студента [+] Η (+) (-) (+) (-) оценка заслужена очень обидно удалось обмануть оценка заслужена Выигрыш Преподавателя Μ Η все нормально дал себя обмануть был неправ опять придет Количественно это можно выразить, например, так <+) <-> [+] Η (+) (-> [+1 Η ι -з -2 -1 §9. Смешанные стратегии Еще более таинственности придавала им их игра. АЛ. Чехов «Винт» В приведенных примерах (позже мы вернемся к подробному рассмотрению каждого) описаны ситуации, в которых интересы игроков не совпадают. Естественно встает вопрос о том, какие рекомендации необходимо дать игрокам для того, чтобы моделируемая конфликтная ситуация разрешилась. Иными словами, что мы будем понимать под решением биматричной игры? , Попробуем ответить на это вопрос так: вследствие того, что интересы игроков не совпадают, нам нужно построить такое {компромиссное) решение, которое бы в том или ином, но в одинаковом смысле удовлетворяло обоих игроков.
80 Биматричныа кзгры Не пытаясь сразу выражать эту мысль совсем точно, сначала попробуем найти некую равновесную ситуацию, явное отклонение от которой одного из игроков уменьшало бы его выигрыш. Подобный вопрос мы ставили и при рассмотрении матричных игр. Напомним, что возникающее при разработке минимаксного подхода понятие равновесной ситуации приводило нас к поиску седловой точки, которая, как оказалось, существует далеко не всегда — конечно, если ограничиваться только чистыми стратегиями игроков А и В, т. е. стратегиями ^Ь · · · ?Лта>-0Ъ · · · j Д»· Естественно ожидать, что в более сложном случае биматрич- ной игры дело вряд ли обстоит проще. Однако при расширении матричной игры путем перехода к смешанным стратегиям, т. е. к такому поведению игроков, при котором они чередуют (чистые) стратегии с определенными часто* тами: игрок А — стратегии Аь ..., Л,с частотами рь ..., рт$ где т 1=1 а игрок В — стратегии Βϊ9 ..., Вп с частотами qu ..., gn, где η ίι > о, · - -, ?η > ο, Σ g* = ι, выяснилось, что в смешанных стратегиях равновесная ситуация всегда существует. Иными словами, любая матричная игра в смешанных стратегиях разрешима. Поэтому, рассматривая здесь биматричные игры, разумно попробовать сразу же перейти к смешанным стратегиям игроков (тем самым мы предполагаем, что каждая игра может быть многократно повторена в неизменных обстоятельствах). В матричном случае смешивание стратегий приводило к расширению возможности выплат в том смысле, что расчет строился из вычисления средних выигрышей игроков А и В, которые определялись по элементам платежной матрицы А и вероятностям рг Да = X) bikPib, Ηβ^-Σ ЯхкРхЧк- t,K i,Jfe
§ 10. 2 Χ 2 биматричные игры. Ситуация равновесия 81 При смешанных стратегиях в биматричных играх также естественно возникают средние выигрыши игроков А и В, определяемые по правилам, в которых уже нет никакой дискриминации игрока В: ΗΑ = Σ aikPiQk, Дв = X) bikpiqk. §10. 2x2 биматричные игры. Ситуация равновесия Впрочем, до двух часов — условного срока — он играл еще довольно сносно. Но все же он проигрывал все партии, под этим предлогом прикинулся рассерженным, начал горячиться и, как всегда бывает в подобных ситуациях, делал промах за промахом. АДюма «Двадцать лет спустя» Мы предполагаем уделить основное внимание случаю, когда у каждого из игроков имеется ровно две стратегии, т. е. случаю т = η = 2. Поэтому нам кажется уместным выписать приведенные выше формулы именно для такого случая. В 2 χ 2 биматричной игре платежные матрицы игроков имеют следующий вид А=(*п а12\ /Ъп Ь12\ \а21 а22/' \b2i Ьгг)' вероятности a средние выигрыши вычисляются по формулам ВЛ(Р, Ч) = апР9 + βΐ2ί>(1 - ?) + «2ΐ(1 - ί>)? + «22(1 - ί>)(1 - ?), Ив(Р, Я) = bltpq + bl2p(l -q) + b2l(l - p)q + Ml - P)U - «)> где
82 __ Биматрнчные игры Сформулируем основное определение. Определение. Будем говорить, что пара чисел определяет равновесную ситуацию, если для любых рид, подчиненных условиям 0<р<1,0<д<1, одновременно вьшолнены следующие неравенства НА(р, ?*) < НА(р\ ?*), Нв(р\ q) < Нз(р\ q*). (*) Пояснение. Выписанные неравенства (•) означают следующее: ситуация, определяемая смешанной стратегией (р*, q*), является равновесной, если отклонение от нее одного из игроков при условии, что другой сохраняет свой выбор, приводит к тому, что выигрыш отклонившегося игрока может только уменьшиться. Тем самым, получается, что если равновесная ситуация существует, то отклонение от нее невыгодно самому игроку. Но может ли быть подобная ситуация равновесия в биматричней игре? Ответ на поставленный вопрос дает следующее утверждение- Теорема 4 (Дж. Кэш). Всякая биматричная игра имеет хотя бы одну равновесную ситуацию {точку равновесия) в смешанных стратегиях. Заметим, что весьма похожее утверждение мы уже встречали при изучении вопроса разрешимости матричных игр. Напомним такта, что в соответствующем разделе после формулировки аналогичного утверждения о существовании равновесной ситуаКии описывался и способ отыскания точки равновесия. Та же проблема встает перед нами и здесь: равновесная ситуация существует, но как ее найти? Если некоторая пара чисел Q>*,?*) претендует на то, чтобы определять ситуацию равновесия, то для того, чтобы убедиться в обоснованности этих претензий (или, наоборот, доказать их необоснованность), необходимо проверить справедливость неравенств (*) для любого ρ в пределах от 0 до 1 и для любого q в пределах от 0 до 1. В общем случае число таких проверок бесконечно, и, следовательно, действенный способ определения равновесной ситуации нужно искать где-то в ином месте. Для этого мы обопремся на следующий теоретический результат.
§ 10. 2 Χ 2 биматричные игры. Ситуация равновесия 83 Теорема 5. Выполнение неравенств НА(р, д*) < НА(р\ ?*), Нв(р\ д) ζ Нв(р\ q*). равносильно выполнению неравенств #л(0, д*) < НА(р% д*), Пв(р% 0) < Нв(р% д*), HA(h 9*) < ИА(р\ g*), Нв(р% 1) ^ Нв(р\ q*). Иными словами, для того, чтобы убедиться в обоснованности претензий пары (р*, q*) на то, чтобы определять равновесную ситуацию, достаточно проверить справедливость неравенства HA(p,q*)^HA(p\q*y только для двух чистых стратегий игрока А(р = 0кр=1)п неравенства HB(p\q)^HB(p\q*) только для двух чистых стратегий игрока В (q = 0 и q = 1). Четыре неравенства (**) позволяют провести поиск точки равновесия уже вполне конструктивно. Запишем средние выигрыши игроков А и В в более удобной форме. Имеем #д(Р> q) - (αιι ~ αΐ2 - α2ι + a22)pq + (ai2 - θ22)ρ + (α2ι - a22)g + α^, #в(Р,д) = (bu-bi2-b2i + b22)jpg+ №η-*22)Ρ+ (&2ΐ-*22)ϊ + 622· Обратимся к первой из полученных формул. Полагая в ней сначала ρ = 1, а потом ρ = 0, получаем, что ЯЛ(1, q) = (au ~ a12 - 021 + «22)? + an + (a2i - a22)g, Да(0, q) = (α21 - an)q + a». Рассмотрим разности #a(P, ?) - Да(1, д) = (аи - а12 - а21 + а22)рд + (а12 - а22)р - - (аП - а12 — «21 + а22)? + А22 — а12> #а(Р, д) - Да(0, д) = (an - а12 - а21 + a22)jpg + (а12 - а22)р. Полагая С = an- ai2 — a21 + a^, a = a22 - a12, (*) (**)
84 : ι__ Биматричные игры получим для них следующие выражения Ил(р, q) - Ях(1, q) = Cpq -ap-Cq + a = = Cg(p-l)-a(p-l) = = (p-l)(Cq-a), Да(Р. q) ~ НАФ, q) - Cpq -ap = = p(Cq - a). В случае, если пара (р, q) определяет точку равновесия, эти разности неотрицательны: HA(p,q)-HA(l,q)>0, HA(p, q) - НАф, q) > 0, поэтому окончательно получаем (р-1)(Сд-а)>0, p{Cq - а) > 0. Из формул для функции Нв(р, q) при q = 1 и q = 0 соответственно имеем Дв(Р, 1) = (Ьц - &12 - *>21 + Ъъ)р + (Ъ12 - б22)р + Ь2и Ив(Р, 0) = (δη - ЫР + &22- Разности HB(p,q)-HB(p,l) и Яв(р,«)-Яв(р,0) с учетом обозначений D = 6ц - &12 - &21 + &22> /? = &22 ~ &21 приводятся к виду Яв(р, ?) = Нв(р, 1) = (? - 1)фр - /?), Нв(р, q) = #в(р, 0) = q(Dq - β) совершенно также, как соответствующие разности для функции НА Если пара (р, q) определяет точку равновесия, то эти разности неотрицательны: Нв(р, q) - Нв(р, 1) > 0, Нв(р, q) - Ив(р, 0) > 0, поэтому (д-1)(£>р-/3)>0, q(Dp-fi)>0.
§11. Поиск равновесных ситуаций. Прежде чем приступать к последующим шагам, подведем некоторые итощ. Для того, чтобы в биматричной игре пара (ρ, q) определяла равновесную ситуацию, необходимо и достаточно одновременное выполнение следующих неравенств (р-1)(Сд-а)^0, (*) р(Сд-а)>0, (g-l)(I>p-/J)>0, где С = аП — аП ~~ а21 + «22) Л = Д22 — «12, D = bn- Ь12 - &21 + &22, β = Ь22 - *21· §11. Поиск равновесных ситуаций Если кто, сидя к месяцу спиной, играет в карты, то непременно проиграет. А. Е. Бурцев «Обзор русского народного быта Северного края» Геометрический смысл условий (*) рассмотрим на примерах описанных выше биматричных игр. Пример 20. «Борьба за рынки» (продолжение). Напомним, что ситуация, сложившаяся в этой задаче, задается платежными матрицами следующего вида Заменяя в неравенстве (*) величины С, a, D и β их конкретными значениями С = -10 - 2 - 1 - 1 = -14, α = -1 - 2 = -3, D= 5 + 2 + 1 + 1= 9, Д= 1 + 1= 2,
86 _. __ _! = , Биматричные кгры получаем <p-l)(-14g-(-3))>0, (?-l)(9p-2)^0, U p(-14g-(-3))^0, W g(9p-2)£0. Рассмотрим сначала левую пару неравенств (I) <р-1Х-14д + 3)>0, p(-14g + 3)£0. Возможны следующие три случая 1)р=1, 2)р = 0, 3) 0<jp< 1. Разберем каждый из этих случаев подробно. 1. Полагая ρ = 1, получаем 0^0, -14д + 3^0, откуда 14д - 3 < 0 и, значит, 2. Полагая ρ = 0, получаем 0^0, ~(-14д + 3)>0, 0^0, откуда и, значит, 3. Наконец, 14д - 3 ^ 0 положив 0 < ρ < 1, получим -14д + 3>0, -14д + 3^0, что возможно лишь в случае, если т.е. Сформулируем результат 1°. 2°. 3°. -14д + 3 = 0, наших рассмотрений: Ρ=1ι Ч^ р = 0, д£ 0<р<1, д = 3 14» 3 14» 3 14*
§11. Псисх равновесных ситуаций. .87 Перенесем теперь полученные сведения на чертеж. Введем на плоскости прямоугольную систему координат (p>q) и выделим на ней единичный квадрат, соответствующий неравенствам (рис.27). 0<р<1, O^g^l Рис.27 Рис. 28 Нанесем на этот чертеж то множество точек, которое описывается условиями Г, 2° и 3°. Это множество (на рисунке 28 его точки выделены жирной линией) состоит из трех прямолинейных участков — двух вертикальных лучей и одного горизонтального отрезка — и представляет собой «зигзаг». Нас будет интересовать только та его часть, которая попала в заштрихованный на рисунке 28 единичный квадрат. Оставив на время полученные результаты в покое, обратимся к правой части неравенств (г): (g-l)(9p- q(9p- Три интересных для нас случая 1)5=1, 2)5 = 0, приводят нас к следующему результату 1°· 9=1, Т. 9 = 0, 2)>0, 2)^0. 3) 0 < q < 1. Р>\, Р^Ь Перенося его на чертеж, получим второй «зигзаг», но уже горизонтальный (рис. 29).
88. . Биматричные игры ηΛ 1 3Л4 0 %Щ ирЯ % ' 1 Р Рис.29 1 Рис.30 Теперь остается только объединить полученное на рисунке 30. Общая точка построенных зигзагов — точка равновесия — имеет координаты (9» μ J · Соответствующие смешанные стратегии игроков имеют следующий вид -^ == \ 9» 9 J » ν=\Ϊ4>Ϊ4/> а средние выигрыши игроков таковы Н* \h h) = "Ь Нв (§> Ti) = £· Замечание. Попробуем разбить рассмотренную биматричную игру на две матричные игры с нулевой суммой. 1. Игра с матрицей А. *■(-? -?)■ Решая эту игру графическим методом, найдем 011тимальную смешанную стратегию для игрока А цену этой игры 0 4 VA- -7» а затем и онгимальную смешанную стратегию для игрока В \14» 14 J ' 2. Игра с матрицей В. -(-ί D- Решая эту игру графическим методом, найдем оптимальную смешанную стратегию для игрока В \з>з)>
§11. Поиск равновесных ситуаций цену этой игры а затем и оптимальную смешанную стратегию для игрока А „о _ ι \9>9Г Сравнивая полученные результаты с решением биматричной игры, можно заметить следующее: если каждый игрок будет применять свои стратегии е этой игре, исходя только из матрицы своих выигрышей, то его оптимальный средний выигрыш совпадет с его выигрышем при равновесной ситуации. Кстати, по своей матрице игрок может найти и оптимальную смешанную стратегию другого игрока (но не свою!). Пример 21. «Дилемма узников» (продолжение). Выигрыши игроков А и В описываются соответствующими матрицами выплат: Проведем необходимые вычисления. Имеем С = -1 - (-9) - 0 + (-6) = 2, а = -6 - (-9) = 3, D = -1 - 0 - (-9) + (-6) = 2, β = -6 - (-9) = 3. Отсюда (О (р-1)(2я-3):*0, р(29-3)^0, (г) (*- и в результате получаем, что 1°. р=1, q>- 2°. ρ = 0, q < 2» -1)(2р-3)^0, g(2p-3)£0, 3°. 0<p<l,g=§. 3°. 0<*< !,!>=§. 1°. *=1,pH 2°- * = °>1><!> Полученные зигзаги изображены на рис. 31. Единственная равновесная ситуация — (0,0). Это ситуация, в которой каждый из игроков выбивает вторую чистую стратегию — «сознаться» — и теряет 6. Как мы уже отмечали ранее, отклонение от ситуации равновесия одного из игроков не дает ему никаких преимуществ. Однако при одновременном отклонении обоих каждый из них может получить больший выигрыш, нежели в равновесной ситуации. Например, в ситуации (1,1), когда оба игрока выбирают первую чистую страте- Рис. 31 гию — «молчать», каждый из них теряет лишь 1. Напомним однако, что по условию задачи сговор (создание коалиции) между игроками недопустим.
90. . Бкматричкые игры Совершенно ясно, что в рассматриваемых обстоятельствах ситуация (0,0) неустойчива — любой из узников, изменяя свою стратегию, увеличивает свой выигрыш (избегает наказания). Пример 23. «Семейный спор» (продолжение). Выигрыши игроков А и В в этой би- матричной игре задаются так: *-G!) °-α°) Проводя необходимые вычисления С = 2-0-0+1 = 3, Я = 1-0-0 + 2 = 3, и рассуждения (р-1)(Зд-1):*0, получаем, что 1°. р=1, Of» 9 = 1, Ρ >h (О (г) a = 1-0=1, 0 := 2 - 0 = 2, (g-i)(3j>-2);*o, g(3p-2)^0, 2°. p=0, g^I, 3°. 0<ρ<1, д=|. 2°. g = 0,p^f, 3°. 0<g<l,p=f, Геометрически полученный результат выглядит так (рис. 32). Данная игра имеет три точки равновесия. Две из них отвечают чистым стратегиям игроков, р=1,*=1: Д4(1>1) = 2>ЯВ(1,1)=1, р = 0,д = 0: #А(0,0) = 1,ЯВ(0,0) = 2, одна — смешанная, Ρ = h Я = 1 : &А (§, i) = |, #в (f, |) = Признаться, полученные результаты ставят больше вопросов, чем дают ответов. Ситуации (1,1) и (0} 0) соответствуют одновременному выбору игроками своих первых или, соответственно, вторых стратегий, то есть определеной договоренности о совместных действиях. Ко в данном случае есть еще одна ситуация равновесия, состоящая в выборе игроками вполне определенных смешанных стратегий. В ней оба игрока получают одинаковые выигрыши, правда, меньшие тех, которые давали две другие равновесные ситуации. Какой же из этих трех ситуаций равновесия следует отдать предпочтение? Какую выбрать игрокам? Если бы игроки договорились оба играть, скажем, первую чистую стратегию, причем игрок А за получение большего выигрыша, чем игрок Б, заплатил бы ему \, то выигрыш каждым полутора единиц можно было бы считать
§ 11. Помех равновесных ситуаций 91 κ выгодным и справедливым. Однако в рамках теории бескоалиционных игр такого рода сделки не рассматриваются. Вполне ясно, что для выбора каждым из игроков своей линии поведения (напомним, что подобная ситуация может повторяться, и повторяется, многократно) необходимы либо расширение возможностей, имеющихся у игроков, либо иные, измененные критерии. Наконец, обратимся к последнему из приведенных выше примеров биматричных игр — «Студент—Преподаватель». Пример 24. «Студент—Преподаватель» (продолжение). Впечатления у каждого из них относительно результатов общения в матричном виде выглядят следующим образом 4?-i)· "(-S -1)· Проводя необходимые вычисления С = 2 +1-1+0 = 2, . а = # = 1 + 3 + 2-1 = 5, £ = - и рассуждения (0 Ий-1» α, (r) получаем, что 1°. P=h Ч>\* 2d. p = 0,q<l 1°. g=l, jp>|, 2°. g = 0, j> < i, (рис. 33). Число точек пересечения у зигзагов (равновесных ситуаций) равно трем. Две из них отвечают чистым стратегиям игроков, 04-1 = = 1| -1 + 2=1, ~1)(5р-1)>0, ί(5ρ-1)>0, з°. o<jxi, ff=|, 3°. 0<*<l,j>=| Я' 1 ι ρ=1, $=1: #Α(1,1) = 2, tf*(l,D = 1, ρ = 0, q = 0 : ΗΑφ, 0) = 0, #Β(0,0) = -1, одна — смешанная, Р=Ъ> Я- ι . 2 * Да (i I) = 5» Я* (з> 1) = "I- В данной задаче, в отличие от предыдущей, все довольно ясно: наилучшим является выбор Рис. 33 каждым из игроков первой чистой стратегии — хорошо подготовиться к зачету и поставить зачет. Как нетрудно заметить, тем самым в этой задаче реализуется весьма редкая возможность, когда функции выигрыша каждого из игроков достигают своих максимумов одновременно. Выгодность такой ситуации совершенно ясна.
92 Биматричные игры Ее устойчивость также вполне очевидна: любое отклонение от ситуации (1,1) одним из игроков или обоими игроками может привести разве что к уменьшению их выигрышей. Знакомство с играми мы завершим рассмотрением гипотетического примера, показывающего, сколь велико многообразие ситуаций, изучение которых описанными выше методами и интересно и эффективно. Пример 25. «Ястреб—Голубь». Предположим, что в некоторой популяции соперничающие индивидуумы в общении между собой применяют только две стратегии — стратегию Ястреба и стратегию Голубя (эти названия используются здесь в том смысле, в каком их обычно применяют к людям, и, вообще говоря, никак не связаны с особенностями биологии соответствующих птиц: в действительности голуби — довольно агрессивные птицы). Ястребы всегда дерутся неистово и безудержно, отступая лишь при серьезных ранениях. Голуби же ограничиваются угрозами, с достоинством соблюдая все условности, и никогда не наносят противнику повреждений. Если Ястреб сталкивается с Голубем, то Голубь быстро убегает, оставаясь таким образом невредимым. Если Ястреб дерется с Ястребом, то драка продолжается до тех пор, пока один из соперников не получит серьезных повреждений или не будет убит. Если же Голубь встречается с Голубем, то ни один из них не страдает. Голуби долго выступают друг перед другом, принимая разные позы, пока один из них не устанет или не решит, что ему не стоит продолжать противостояние, а лучше отступить. Будем исходить из предположения, что индивидуум не может заранее узнать, с кем ему предстоит драться (с Ястребом или с Голубем), и решить, какую стратегию из двух указанных (стратегию Ястреба или стратегию Голубя) он выберет для себя. Индивидуум обнаруживает это только в момент начала поединка и, следовательно, опытом прошлых встреч с определенными индивидуумами воспользоваться не может, так как попросту не помнит о них. Попробуем провести количественную оценку результатов конфликта, считая, что выигрыш приносит 50 очков (+50), проигрыш — 0 очков (0), серьезная рана приносит потерю 100 очков (-100), а затраты времени в поединке штрафуются 10 очками (-10) (точные величины выигрышей не имеют для нашего анализа особенно большого значения, но помогают дельному размышлению над поставленной проблемой). Вычислим теперь средние выигрыши индивидуумов. Предположим сначала, что рассматриваемая популяция состоит из одних Голубей. В их поединках пострадавших не бывает. Состязания представляют собой длительные парные турниры, которые заканчиваются только тогда, когда один из противников отступает. Победитель получает 50 очков — цена ресурса, явившегося причиной поединка, но он платит и штраф, равный 10 очкам, за потерю времени на длительный турнир, так что его выигрыш в конечном счете равен 40 очкам: 50 - 10 = 40.
$11. Поиск равновесных ситуаций 93 Побежденный также платит штраф — 10 очков — за потерянное время. Естественно ожидать, что каждый отдельный Голубь в среднем в половине турниров победит, а в половине проиграет. Тем самым, его средний выигрыш за один турнир равен среднему арифметическому между +40 и -10, i(40 - 10) = 15, то есть +15. Допустим теперь, что в популяции появился Ястреб. Так как Ястребы всегда побеждают Голубей, то он будет получать 50 очков за каждый поединок и, тем самым, его средний выигрыш равен +50. При драке Ястреба с Ястребом один из них получает тяжкие повреждения, оцениваемые как -100, тогда как выигрыш победителя составляет +50. Каждый Ястреб в популяции Ястребов может рассчитывать на выигрыш в половине сражений, а в половине проиграть. Поэтому его ожидаемая средняя сценка за одну драку равна среднему арифметическому между +50 и -100, ^(50-100) = -25, то есть -25. Если в популяции Ястребов появился один Голубь, то он окажется побежденным во всех турнирах, но при этом будет оставаться невредимым. Тем самым, его средний выигрыш в популяции Ястребов равен 0. Приведенные расчеты позволяют составить платежные матрицы участников А и В любого парного турнира, которые придерживаются в нем одной из двух выделенных стратегий — стратегии Ястреба или стратегии Голубя Я Г Я Г -25 50 0 15 Я Г Я Г -25 0 50 15 (-25 0\ V 50 IS,/' (деления всех элементов обеих матриц V о з;» ν ι° зу· Проведем необходимые вычисления: С = -5-10- 0 + 3 = -12, а = 3-10=-7, Х) = -5- 0-10 + 3 = -12, 0 = 3-1О=~7. Отсюда (р - 1)(-12д + 7) ^ 0, (q - 1)(-12р + 7) > 0, () р(-12д + 7)£0, {Г) я(-12р + 7)>0. или /-25 50 \ V 0 15 J» После аффинных преобразований на 5) они примут вид
Биматричные игры несложных расчетов получаем, что 1°. 2\ 3°. 1°. 2°. 3°. р=1, р = о, 0<р<1, ί=1, g = 0, 0<g<l, β< έ» я> h я = ъ'> Р< h Р> L· Р=й- Геометрически полученный результат показан на рис.34. Данная игра имеет три точки равновесия, две из которых отвечают чистым стратегиям игроков. Нас же в данном случае интересует смешанная стратегия, характеризующаяся следующими величинами Ρ=έ» 0=П> я^(Й»б) -я«(г2>и) =6ϊ· (*) Полученные результаты допускают разные интерпретации. Рассмотрим две из них. 1. При многократном участии индивидуума в турнире (с заданной системой оценки выигрышей) наиболее разумной линией его поведения следует признать смешивание стратегии Ястреба и стратегии Голубя в отношении 7 к 5. При этом всякий раз выбор конкретной стратегии должен носить случайный характер, чтобы у противника не было возможности угадать, как он собирается вести себя в каждом конкретном состязании. Так, например, неразумно выступать в роли Ястреба семь раз подряд, а затем пять раз подряд в роли Голубя и так далее. Если какой-нибудь индивидуум примет такую простую последовательность, то противники быстро разберутся в его намерениях и несомненно воспользуются этим (например, разыгрывая роль Ястреба в тех случаях, когда индивидуум решил выступать в роли Голубя). При случайном выборе стратегии Ястреба с вероятностью ^ и стратегии Голубя с вероятностью -^ индивидуум может рассчитывать на средний выигрыш в турнире, равный 6,25. Изменение пропорции 7 : 5 может этот выигрыш только уменьшить. 2. Рассматривая популяцию, в которой каждый из индивидуумов выбрал одну из двух этих стратегий в качестве единственно допустимой для себя, и, тем самым, состоящую из Ястребов и Голубей, найденные числа (*) можно объяснить еще и так. Для используемой нами системы очков стабильное соотношение между Ястребами и Голубями в популяции составляет 7 : 5, и при этом средний выигрыш Ястреба оказывается в точности равным среднему выигрышу Голубя 4-6,25. Если число Ястребов в популяции начнет возрастать так, что их доля станет выше j2, то у Голубей начнет возникать дополнительное преимущество и соотношение вернется к стабильному состоянию. Если же начнет изменяться
§11. Поиск равновесных ситуаций 95 доля Голубей, то и у Ястребов найдутся способы вновь вернуть соотношение к стабильному. Но 6,25 гораздо меньше среднего выигрыша для Голубя в популяции из одних Голубей {+15). Если бы все согласились быть Голубями, то каждому отдельному индивидууму это пошло бы только на пользу. Беда, однако, в том, что любой сговор, даже тот, который в конечном счете выгоден всем, не защищен от злоупотреблений — оказаться в группе из Голубей единственным Ястребом настолько хорошо (всегда 4-50), что появление Ястребов ничем не остановить. Найденная стабильная стратегия устойчива не тем, что она так уж хороша для участвующих в ней индивидуумов, а просто потому, что она гарантирует от измены в своих рядах. Приведенный пример — это всего лишь простая модель, помогающая как- то понять реальные события и факты. Ее можно, разумеется, и совершенствовать и усложнять. При удачном развитии сходство модели с реальным миром по мере ее усложения возрастает. Один из возможных путей разработки модели Ястреб—Голубь состоит в расширении множества стратегий путем введения в него новых — стратегии Отпор щи ка, стратегии Задиры и т. д. Несколько слов в заключение ...голые атлеты, умастясь, Друг против друга кружат по арене, Чтобы потом схватиться, изловчасъ... А.Данте «Божественная комедия» На анализе полученных результатов стоит остановиться чуть подробнее. ψ Из приведенных примеров видно, что числа С и D могут быть как положительными, так и отрицательными. Они могут, в частности, даже обращаться в нуль. , Рассмотрим, однако, наиболее интересный в приложениях случай, когда ни С, ни D нулю не равны, т. е. Тогда, как нетрудно видеть, точка равновесия определяется парой β а Эти формулы являются весьма примечательными: в равновесной ситуации выбор игрока А полностью определяется элементами
96 Биматричные игры платежной матрицы игрока В, Ь22 - &2i Р = Ьц - Ь12 - Ь2\ + Ь22 (и не зависит от элементов его собственной платежной матрицы), а выбор игрока В в равновесной ситуации полностью определяется элементами платежной матрицы игрока А, а22 "~ а12 q=z ali ~* а\2 ~~ а21 + Л22 (и не зависит от элементов его собственной платежной матрицы). Иными словами, равновесная ситуация обоих игроков определяется не столько стремлением увеличить собственный выигрыш, сколько желанием держать под контролем выигрыш другого игрока (минимизировать этот выигрыш). И если, например, заменить в биматричной игре матрицу выплат игроку А9 а матрицу выплат игроку В оставить прежней, то игрок А никак не изменит своего «равновесного» поведения (просто не обратит внимания на эту замену), в то время как игрок В изменит свою стратегию на новую, равновесную. Таким образом, в биматричной (неантагонистической) игре мы вновь встречаемся с антагонизмом. Правда, теперь это уже не антагонизм интересов (как это было в антагонистической, матричной игре), а антагонизм поведения. Отметим, что в биматричных играх (в отличие от матричных) при наличии нескольких ситуаций равновесия средний выигрыш игрока в разных равновесных ситуациях различен (напомним, что в матричной игре выигрыш игрока один и тот же вне зависимости от количества точек равновесия). Но если средние выигрыши разнятся, то какую равновесную ситуацию следует считать оптимальной? Наконец, еще одно, не менее интересное. Вспомним, с какими трудностями мы столкнулись, пытаясь перевести эмоциональные оценки результатов общения студент—преподаватель в количественные показатели. В целом сохраняя основные соотношения, эти количественные оценки могут, конечно, изменяться как от студента к студенту, так и от преподавателя к преподавателю. Однако, если эти изменения будут не слишком значительными — элементы
Задания 97 платежной матрицы пошевельнутся «слегка», — то слегка пошевелятся и зигзаги, не изменяя ни своей общей формы, ни взаимного расположения, а, значит, число равновесных ситуаций не изменится. Впрочем, сказанное относится лишь к случаю, когда множество ситуаций равновесия конечно и состоит из нечетного числа точек (одной или трех). Как принято говорить в подобных случаях, это число устойчиво относительно малых шевелений. Конечно, в некоторых биматричных играх равновесные ситуации случаются и в чистых стратегиях (в последнем из разобранных примеров таких ситуаций даже две). И (в принципе это совсем нетрудно) можно дать определение ситуации равновесия в чистых стратегиях. Найти ее (если она, конечно, существует) — дело довольно простое. Но, как показывают приведенные примеры, во- первых, чистой ситуации равновесия может вовсе не быть, а, во- вторых, даже при ее наличии не исключено существование равновесных ситуаций в смешанных стратегиях. И желая найти их все, неизбежно приходится обращаться к описанному выше подходу. Задания Найдите решения следующих биматричных игр: - '-а?)· *=(;:)■ '■ '-(J ?)■ s = (o Τ)· * -(τ·)· -СП)- Найдите ситуации равновесия в каждом из двух случаев: 1) а > Ь, 2) а < Ь. И вот, с оскалом вепря на устах И с пеною на искаженных лицах, Сбегаются — и прянуло копье, Но в тот же миг щиты обоих скрыли, И даром медь по глади их скользит... Еврипид «Финикиянки»
rtFVh^mmma**i^mFHttssBmi Издательство УРСС Представляет Вам свои лучшие книги: Серия «Вся высшая математика в задачах» Краснов М. Л. у Киселев А. И., Макаренко Г. И. Векторный анализ. Задачи и примеры с подробными решениями. Предлагаемый сборник задач можно рассматривать как краткий курс векторного анализа, в котором сообщаются без доказательства основные факты с иллюстрацией их на конкретных примерах. Поэтому предлагаемый задачник может быть использован, с одной стороны, для повторения основ векторного анализа, а с другой — как учебное пособие для лиц, которые, не вдаваясь в доказательства тех или иных предложений и теорем, хотят овладеть техникой операций векторного анализа. При составлении задачника авторы использовали материал, содержащийся в имеющихся курсах векторного исчисления и сборниках задач. Значительная часть задач составлена самими авторами. В начале каждого параграфа приводится сводка основных теоретических положений, определений и формул, а также дается подробное решение 100 примеров. В книге содержится более 300 задач и примеров для самостоятельного решения. Все они снабжены ответами или указаниями к решению. Имеется некоторое количество задач прикладного характера, которые выбраны так, чтобы их разбор не требовал от читателя дополнительных сведений из специальных дисциплин. Материал шестой главы, посвященной криволинейным координатам и основным операциям векторного анализа в криволинейных координатах, внесен в книгу из тех соображений, чтобы дать читателю хотя бы минимальное количество задач для приобретения необходимых навыков. Другие книги этой серии: Функции комплексного переменного. Интегральные уравнения. Операционное исчисление. Теория устойчивости. Серия «Синергетика: от прошлого к будущему» Малинецкий Г. Г., Потапов А. Б. Современные проблемы нелинейной динамики. Капица С.П., Курдюмов С. #., Малинецкий Г, Г. Синергетика и прогнозы будущего. Баранцев Р. Г. Методология современного естествознания. Чернавский Д. С. Синергетика и информация (динамическая теория информации). ТрубецковД. Л. Колебания и волны для гуманитариев. Пригожий И., Стенгерс И. Время. Хаос. Квант. К решению парадокса времени. Пригожий И. у Стенгерс И. Порядок из хаоса. Новый диалог человека с природой. Пригожий И. у Николис Г. Познание сложного. Введение. Пригожий И. у Гленсдорф П. Термодинамическая теория структуры, устойчивости и флуктуации.
О некоторых других видах игр I Денежныя игры, достойный к повышению: 1. Банк. ; 2. Реет. 3. Квинтич. 4. Веньт-Эн. 5. Кучки. 6. Юрдон. 7. Гора. 8. Макао, которое некоторым образом крайне разобижено неупотреблением. II Нововыезжия игры, который достойно принять в службу и ввести в общее употребление: 1. Штосе. 2. Три и три. 3. Рокамболь. III Игры, подавшия просьбы о помещении их в службу степенных солидных людей: 1. Ломбер. 2. Вист. 3. Пикет. 4. Тентере. 5. А л'а муш. IV Игры, подавшия просьбу о увольнении их в уезды и деревни: 1. Панфил.
100 О некоторых других видах игр 2. Тресет. 3. Басет. 4. Шнип-пшап-шнур. 5. Марьяж. 6. Дурачки с пар. 7. Дурачки в навалку. 8. Дурачки во все карты. 9. Брошки или хрюшки. 10. Три листка. 11. Семь листов. 12. Никитишны и 13. В носки — в чужую отставку. И. Страхов «Переписка Моды...» Реальные конфликтные ситуации приводят к разным видам игр. Различны и способы их анализа и разрешения. Мы остановились лишь на трех видах игр — матричных, позиционных и биматричных. Сделанный выбор обусловлен тем, что уже здесь можно наглядно показать, какой смысл вкладывается в термин игра и чем именно занимается теория игр, а также познакомить с относительно несложным математическим инструментарием, опирающимся на ключевые понятия вероятности, матрицы и координаты и позволяющим разрешать простейшие из этих видов игр. Вместе с тем, нам не хотелось бы, чтобы у читателя сложилось впечатление, что доступными анализу могут быть только игры, описанные выше. Существует обширный, содержательный и интересный, привлекающий неослабевающее внимание исследователей класс игр, в которых хотя бы один из игроков имеет бесконечное множество возможных стратегий — бесконечные игры. В этом — заключительном — разделе мы приведем три примера бесконечных игр: непрерывной игры на единичном квадрате (непрерывными называются бесконечные игры, в которых функции выигрышей непрерывно зависят от стратегий, выбираемых игроками), дуэли (играми с выбором момента времени, или играми типа дуэли, называются игры, характеризующиеся моментом выбора хода и вероятностями получения выигрыша в зависимости от времени, прошедшего от начала игры до момента выбора) и дифференциальной игры поиска (в дифференциальных играх допускается
Q некоторых других видах игр 101 делагь ходы непрерывно и связывать поведение игроков условия- ? г· :■» сьюаемыми дифференциальными уравнениями). При этом Khi ограничимся, как и ранее, играми двух лиц и проведем лишь постановку задач (описание возможностей в поведении игроков и построение функций выигрышей), хотя для каждой из приводимых игр разработаны достаточно эффективные подходы к построению их решения. Борьба за рынки (игра на единичном квадрате) Рабочий день бушевал все яростнее. На бирже топтали и раздирали на части с полдюжины акций разных наименований, в которых клиенты Максуэла вложили крупные деньга. Приказы на продажу и покупку летали взад и вперед, как ласточки. О Генри «Роман биржевого маклера» Одна из конкурирующих фирм (игрок А) пытается вытеснить другую фирму (игрока В) с одного из двух рынков сбыта. Предположим, что общая сумма средств, выделенная на это игроком А, равна 1. Типичной стратегией игрока А является разделение выделенной суммы на две части: χ (0 < χ < 1) для первого рынка и 1 - χ для второго. Подобным образом выглядят и стратегии игрока В: выделение им части у (0 < у < 1) своей суммы на первый рынок и 1 — у на второй. Будем считать, что если игрок А добился превосходства на одном из рынков (на другом превосходства автоматически добивается игрок В), то он вытесняет противника с этого рынка и получает выигрыш, пропорциональный избытку вложенных средств с коэффициентом, характеризующим важность рынка (этот коэффициент равен hi для первого рынка и fc2 для второго). Тогда функция выигрыша 2Г(ж, у) игрока А определяется формулой {*i(s - У)? если 0 < у < χ < 1, 0, если ж = у, Ьг(У — #)? если 0 < χ < у < 1. Ясно, что функция выигрыша игрока В равна — £Г(ж, у).
102 О некоторых других видах игр Дуэль Мы близились с двадцати шагов, я шел твердо, но без всякой мысли, без всякого намерения: скрытые в глубине чувства совсем омрачили мой разум. На шести шагах, не знаю отчего, не знаю как, давнул я роковой шнщлер — и выстрел раздался в моем сердце!.. А. А. Бестужев (Марлинский) «Роман в семи письмах» Два дуэлянта (игроки А и В) начинают сходиться в момент времени t = 0. У каждого пистолет заряжен одной пулей. Они встретятся в момент времени t = 1 (если только ни один из них не застрелит другого раньше). Каждый из дуэлянтов может выстрелить, когда пожелает. Если при этом одному из них удастся поразить противника, а самому остаться невредимым, то он становится победителем (его выигрыш равен 1) и дуэль тут же прекращается. Если оба промахнутся, дуэль закончится вничью (выигрыш каждого из игроков равен 0). Если оба выстрелят одновременно и каждый поразит противника, то дуэль также считается окончившейся вничью. Если игрок А произведет выстрел в момент времени χ (0 < χ < 1), то его выстрел будет успешным с вероятностью р(х). Подобным же образом, выстрел игрока В в момент времени у (0 ^ у < 1) будет успешным с вероятностью q(y). При условии χ < у игрок А выиграет с вероятностью р(х), а пр^лграет с вероятностью (1 - p(x))q(y). Тем самым, его средний выигрыш при χ < у будет равен #(ж, у) = 1 · р{х) + (-1) · (1 - p{x))q(y) = р(х) - q(y) + p(x)q{y). С другой стороны, если х>у, его средний выигрыш будет равен Я(ж, у) = 1 · (1 - p{x))q(y) + (-1) · р(х) = р(х) - q(y) - p{x)q{yY При χ = у средний выигрыш Щх, х) = 1 · р(х) + (-1) · q(y) = р(х) - q(x). Таким образом, функция выигрыша Н(х, у) игрока А имеет вид (P(s) - q(y) + P(x)q(y), если 0 < & < у < 1, p(x)-q(x), если х = у, Р(х) - 9(У) - P(x)Q(y), если 0 ^ у < χ ^ 1,
О некоторых других ведах игр . 103 и антагонистическая игра задана. В частности, если игроки стреляют без промаха, р(х) = q(y) = 1, {1, если 0 < χ < у < 1, 0, если х = у, —1, если 0 < у < χ < 1. Дифференциальная игра поиска Я забегал по всему вагону в поисках чемоданчика — чемоданчика нигде не было, ни слева, ни справа. Где мой чемоданчик?! «Ну, ладно, Веня, успокойся. Пусть. Чемоданчик — вздор, чемоданчик потом отыщется. Сначала разреши свою мысль: куца ты едешь? А уж потом ищи свой чемоданчик. Сначала отточи свою мысль — а уж потом чемоданчик. Мысль разрешить или миллион? Конечно, сначала мысль, а уж потом миллион. И чемоданчик.» В. В. Ерофеев «Москва—Петушки» Ищущий (игрок А) стремится обнаружить уклоняющегося (игрока В). Оба игрока перемещаются с постоянными скалярными скоростями (а и β соответственно) по плоскости внутри некоторой поисковой области Ω. В любой момент времени каждый из игроков управляет своим перемещением, задавая направление вектора скорости. Пусть (хА, у а) и (хВу Ув) ~~ координаты игроков. Тогда имеем dxA dxB - -^ = всов^ -«-=*«»* dyA . dyB — = ашкр, — =/3sm^. Игра поиска заканчивается в тот момент, когда игроки сблизятся на расстояние I > 0, иными словами, когда будет выполнено неравенство (хА - хв)2 + (уА - yBf < I2. В случае успешного обнаружения выигрыш игрока А считается равным 1.
104 О некоторых других видах игр Построение решения в этой игре существенно зависит от характера и степени информированности игроков. Все это — примеры бескоалиционных игр, когда любые соглашет ния, обмен информацией, побочные платежи, совместный выбор стратегий запрещены. Другой важный класс составляют кооперативные игры, в которых разрешены самые разнообразные формы сотрудничества. Возможность соглашений между игроками оказывает существенное влияние на исход игры. Если допустить, например, в игре «Дилемма узников» совместный выбор стратегий, то исход игры может оказаться совсем иным. При наличии побочных платежей по-иному окончится и «Семейный спор». Вне поля наших рассмотрений остались игры с одним участником, а также игры с участием трех и более игроков; последние особенно интересны, но они и трудны. А уже соколы, и кречеты, и белозерские ястребы рвутся с золотых колодок из каменного города Москвы, обрывают шелковые путы, взвиваясь под синие небеса, звоня золоченными колокольчиками на быстром Дону, хотят ударить на несчетные стада гусиные и лебединые, — то богатыри и удальцы русские хотят ударить на великие силы поганого царя Мамая. «Задонщина»
Ответы к заданиям К разделу «Матричные игры» 1. а. а = -2, β = 2; b. v=l, {АиВ3}и{А3,В3}. 2.·.ρ={»,Μ}.β-{|,|},ν=-*; b.P={L§}.$={j.M,$b „ = -§; **={π.π}.« = {π.Μ,δ},ΐ'=Α; d.P = {i,i,0},Q = {|,J},i.= J; e.P={0,0,|,§,0},i?={O>0)0jJ)O},I/=^ 3. a. P » {0,14; 0,86; 0}, Q и {0,43; 0,57; 0}, ν » 0,46. b. Ρ и {0,05; 0,62; 0,33}, Q « {0; 0,67; 0,33}, ι/ я 1,00. К разделу «Биматричные игры» « „_ 3 „_ 1. ег /3 1\ 10 π- /3 1\ 22 b. ρ = 1, q = 1: HA(l, 1) = 4, ЯБ(1,1) = 1; ρ = 0, g = 0: HA(0Q) = 1, Яв(0,0) = 4; Р=з> 9=з:-й^(з.з) = 3» ЯвСз.з) = -з· c. ρ = 0, q = 0: #χ(0,0) = 1, Яв(0,0) = 1. d. 1) о>6:р= 1, д= 1, 2)о<Ь:р=1, g = 0;p = 0, g=l;i>=f,,g=f. Играли в карты у коногона Наумова. В.Т.Шаммов «На представку»
Литература ...если уж краб станет сражаться с обезьяной, то единственный непреложный факт — это что он неизбежно будет убит во имя родины. Обращаюсь к вам, мои читатели! Ведь и вы в большинстве своем крабы! Р.Акутагава «Сражение обезьяны с крабом» Список использованных книг Акутагава Рюноскэ. Избранное в 2-х томах. Том II. М.: Художественная литература, 1971. Андреев Л. Н. Рассказы. М.: Советская Россия, 1977. Берн Э. Игры, в которые играют люди. Психология человеческих взаимоотношений. Люди, которые играют в игры. Психология судьбы. М.: Прогресс, 1988. Бестужев (Марлинский) А. А, Ночь на корабле. Повести и рассказы. М.: Художественная литература, 1988. Боккаччо Дж. Декамерон. В 2-х книгах. Книга I. M.: Художественная литература, 1988. Булгаков М.А. Избранное. М.: Художественная литература, 1980. Бурцев А. Е. Образ русского народного быта Северного края. Т. II. Санкт- Петербург, 1902. Вентцель Е. С. Элементы теории игр. М.: Физматгиз, 1961. Wittgenstein L. Philosophical investigations. X. Oxford, 1953.
Литература li 107 Воробьев Η. К Теория игр для экономистов-кибернетиков. М.: Наука, 1985. Высоцкий В. С. Собрание сочинений в 5-ти томах. Том П. Стихи и песни. J 968-1972 гг. Тула: Тулица, 1994. Гессе Г Собрание сочинений. В 4-х томах. Т. 4. СПб.: Северо-Запад, 1994. Гоголь К А Собрание сочинений. В 9-ти томах. Т. 3-4. М.: Русская книга, 1994. Гуреич В. Α., Меньшиков К С. Институты согласия. Математика, кибернетика, №6, 1989. Данте Алигьери. Божественная комедия. М.: Московский рабочий, 1986. Докинз Р. Эгоистичный ген. М.: Мир, 1993. Достоевский Ф. М. Полное собрание сочинений. В 30-ти томах. Т. 5. Л.: Наука, 1973. Дюма А, Двадцать лет спустя. М.: Художественная литература, 1976. Еврипид. Трагедии. Т. 2. М.: Искусство, 1980. Ерофеев В. В. Оставьте мою душу в покое. М.: АО «Х.Г.С.», 1995. Зощенко,Μ. Μ. Рассказы и повести. Л.: Советский писатель, 1959. Иванов В. В. Возвращение Будды. Чудестные похождения портного Фокина. У. М.: Правда, 1991. Исследование операций. В 2-х томах. Т. 1. М.: Мир, 1981. Лермонтов М. Ю. Собрание сочинений. В 4-х томах. Т. 4. М.: Художественная литература, 1965. Лотман Ю. М. Беседы о русской культуре: Быт и традиции русского дворянства (XVIII — начало XIX века). СПб.: Искусство-СПБ, 1994. Математика: Школьная энциклопедия. М.: Научное издательство «Большая Российская Энциклопедия», 1996. Моуэт Ф. Не кричи: «Волки!». М.: Тропа, 1992. Некрасов И. А. Полное собрание стихотворений. Л.: ОГИЗ, 1934. О Генри. Короли и капуста. М.: Голос, Глагол, 1993. Памятники литературы Древней Руси. XIV — середина XV века. М.: Художественная литература, 1987. Пушкин А С. Собрание сочинений. В 10-ти томах. Т. 5. М.: Художественная литература, 1975. Слойер К Математические фантазии. М.: Мир, 1993. Страхов К Переписка Моды, содержащая письма безруких Мод, размышления неодушевленных нарядов, разговоры бессловесных чепцов, чувствования мебелей, карет, записных книжек, пуговиц и старозаветных манек, кунташей, шлафоров, телогрей и пр. Нравственное и критическое
108 Литература сочинение, в коем с истинной стороны открыты нравы, образ жизни и разный смешныя и важныя сцены модного века. Москва, 1791. Чехов А П. Полное собрание сочинений и писем. В 30-ти томах. Т. 3. М.: Наука, 1975. Шаламов В. Г. Несколько моих жизней. М.: Республика, 1996. Список книг для дальнейшего чтения Айзеке Р. Дифференциальные игры. М.: Мир, 1967. Воробьев Н.Н Основы теории игр. Бескоалиционные игры. М.: Наука, 1984. Гермейер Ю.Б. Игры с непротивоположными интересами. М.: Наука, 1976. Дюбин Г. К, Суздаль В. Г. Введение в прикладную теорию игр. М.: Наука, 1981. Игры: Энциклопедический сборник. Челябинск: Южно-Уральское кн. изд-во, 1995. Кукушкин Я. С, Меньшикова О. Р., Меньшиков И. С. Конфликты и компромиссы. Математика, кибернетика. № 9, 1986. Льюс Р. Д., Райф X. Игры и решения. М.: ИЛ, 1961. Мулен Э. Теория игр с примерами из математической экономики. М.: Наука, 1985. Нейман Дж., Моргенштерн О. Теория игр и экономическое поведение. М.: Наука, 1970. Оуэн Г. Теория игр. М.: Мир, 1971. **# В заключающих строчках хочется выразить признательность руководителю издательства Доминго Марин Рикой за любезное предложение опубликовать книжку по играм и благодарность В. Э. Подобеду, заинтересованное вмешательство в рукопись которого сделало представляемые материалы более доступными для первого чтения. Что же касается погрешностей и недостатков, то своим появлением в книжке они обязаны только автору. 19 января 1998 года Шикин Е. В.
Оглавление Введение 7 Матричные игры 11 § 1. Равновесная ситуация 13 § 2. Смешанные стратегии 20 § 3. Методы решения матричных игр 26 §4. Примеры задач, сводимых к матричным играм 44 Несколько слов ъ заключение 48 Задания 49 Позиционные игры 51 § 5> Структура позиционной игры 51 § 6. Нормализация позиционной игры 55 § 7. Позиционные игры с полной информацией 66 Несколько слов в заключение 70 Задания 72 Биматричные игры 73 § 8. Примеры биматричных игр 75 § 9. Смешанные стратегии 79
110 Оглавление § 10. 2x2 биматричные игры. Ситуация равновесия 81 § 11. Поиск равновесных ситуаций 85 Несколько слов в заключение 95 Задания 97 О некоторых других видах игр 99 Борьба за рынки (игра на единичном квадрате) 101 Дуэль 102 Дифференциальная игра поиска 103 Ответы к заданиям 105 Литература 106 Список использованных книг 106 Список книг для дальнейшего чтения 108 Что остается сказать в самом конце? ...отказ от игр тоже может быть игрой. Э.Берн «Игры, в которые играют люди»
VMATPU4HblEJl!Pblw ^ П03иЦ110Й|Ь1Е%РГЫШ- '-p BuMAfPUHHbiiurpbi • Борьба з?а pbijiku * Дцфференциа^ная МШ поиска .Цель этой книги"—"в;сравнительно доступной и живой форме :« ? познакомить^читателя с современной Математической] теорией \ £шр1 Небольшом количестве конкретных примеров в ней рассматриваются и подробно решаются простейшиеГматричные,"бимат- ричные и позиционные чиры двух лиц, приводится постановка- ^типйчньк задач для некоторых друг^1слассЪв""и1рлОт^тателя ; к требуются; минимальные представления о некоторых* первона- ■■< ^чальных понятиях, фактах и элементарных методах из аналити- ^ ческой геометрии,^ линейной алгебры итеории вероятностей. 1744 ID 13555 h- i 785354"003242">