Текст
                    Дж.Кемени, Дж. Сн ела , Дж. Томпсон
Введение в КОНЕЧНУЮ MATEMATH КУ
ИЗДАТЕЛЬСТВО
«М И Р»
INTRODUCTION TO FINITE
MATHEMATICS
J. G. KEMENY,
J. L. SNELL, G. L. THOMPSON
Department of Mathematics, Dartmouth College
ENGLEWOOD CLIFFS, N. Y„ PRENTICE-HALL
1057
Дж. КЕМЕНИ.
Дж. СНЕЛЛ. Дж. ТОМПСОН
ВВЕДЕНИЕ
В КОНЕЧНУЮ МАТЕМАТИКУ
Перевод с английского
М. Г. Зайцевой Под редакцией И. М. Я г лама
Издание 2-е, стереотипное
ИЗДАТЕЛЬСТВО «МИР»
Москва 1965
АННОТАЦИЯ
В связи с широким развитием «машинной математики» математиков все больше начинают интересовать вопросы дискретной математики, т. е. математики, не связанной с понятием предельного перехода. В книге дается элементарное введение в эту область, вполне доступное студентам младших курсов как математических, так и технических или гуманитарных специальностей. В ней излагаются некоторые вопросы математической логики, «дискретной» теории вероятностей, матричного исчисления, теории игр, математической экономики и др. Изложение сопровождается большим числом примеров и задач для упражнений.
Книга написана оч^нь живо и увлекательно и с успехом может быть использована лицами различных специальностей, желающими ознакомиться с этим важным разделом современной математики. Немало новых и интересных постановок задач, нового освещения известных и малоизвестных вопросов найдут в ней и специалисты-математики.
Редакция литературы по математическим наукам
ОТ РЕДАКТОРА РУССКОГО ИЗДАН ИЯ
Возникшие в последние два десятилетия новые пути приложения математики, связанные с комплексом идей и методов, ныне объединяемых собирательным термином «кибернетика», повлекли за собой глубокие изменения в самой математической науке. Они не только вызвали к жизни новые большие направления теоретической математики (из которых иные, такие, как теория игр или теория информации, заняли уже положение самостоятельных математических наук), но и способствовали изменению установившихся взглядов на ранее сложившиеся разделы. Наиболее существенным здесь является, по-видимому, то, что разделы математики, не связанные с представлением о бесконечных множествах, пределах и непрерывности, представляются нам теперь гораздо более содержательными и важными, чем это думали математики XIX века или первой половины XX века. Если, начиная с XVII века, главенствующее положение в математике занимало изучение (гладких) функций непрерывно меняющегося аргумента, являющееся основой всех приложений математики к физике и к технике, то сегодня можно говорить о возрождении интереса к так сказать «до-ньютоновской» или «конечной» математике, оперирующей лишь с конечными множествами; при этом возникли новые подходы к этой ветви математики, идущие в основном от математической логики.
Этот поворот в науке связан в первую очередь с появлением универсальных электронных цифровых вычислительных машин, уже сегодня играющих колоссальную роль и в науке, и в народном хозяйстве. Прилагательное «цифровая» в названии этих машин подчеркивает принципиально дискретный, «конечный» их характер, связанный со специфическими особенностями используемых в них электронных устройств. В свою очередь именно эти особенности машин обеспечивают и их «универсальность», родственную универсальности любой числовой системы,
6
От редактора русского издания
позволяющей записывать на условном языке цифр информацию самого различного характера; эта универсальность, наряду с быстродействием, составляет основное преимущество цифровых машин перед более старыми аналоговыми машинами непрерывного действия, казавшимися вначале серьезными конкурентами цифровых машин. Появление универсальных цифровых машин вызвало в свою очередь необычайное расширение областей применения математики, «математизацию» целого ряда дисциплин, ранее далеких от всякого влияния математических методов — лингвистики и экономики, медицины и педагогики, психологии и теории искусства.
Не во всех этих дисциплинах (и других, также явившихся объектом «математической экспансии» последних лет) математика уже сейчас играет достаточно значительную роль. Однако нет ни малейшего сомнения, что роль эта будет в последующие годы все увеличиваться и что наметившееся сотрудничество математики, техники, естественных и гуманитарных наук приведет еще ко многим триумфам вроде расшифровки древних письменностей с помощью электронных счетных машин. И сейчас можно наблюдать, как с напряженным интересом штудируют математику пожилые лингвисты или врачи, долгие годы полагавшие, что им математика «ни к чему», и как в программы экономических или филологических факультетов университетов включаются курсы математики, по объему большие, чем те, которые проходятся в высших технических учебных заведениях.
При этом математика, которая нужна представителям гуманитарных специальностей, как правило, оказывается совсем иной, чем та, которую изучают инженеры При рассмотрении явлений, имеющих сугубо дискретную природу, не связанных с непрерывно меняющимися величинами — скажем, письменной речи, представляющей собой последовательность отдельных букв, каждая из которых может иметь (если речь идет о русском языке) одно из 32 возможных «значений», или высшей нервной деятельности человека, складывающейся из дискретных изменений в огромном числе нервных клеток (нейронов), составляющих головной мозг, нам надо использовать специфические методы «конечной» математики, отличной от традиционной математики Ньютона. И учебные планы возникающих в последние годы «математических отделений» гуманитарных факультетов пестрят названиями, которые явятся новинкой для большинства выпускников втузов: линейное программирование и теория игр, исследование операций и теория информации, оптимальное планирование и методы Монте-Карло.
Новые взгляды на математику повлекли за собой, естественно, и новые подходы к вопросам преподавания математики. При
От редактора русского издания	7
этом следует заметить, что очерченный выше поворот в науке явился весьма благодарным для целей преподавания, поскольку «новая» математика, именно в силу своего «конечного» характера, гораздо более доступна для начинающих, чем классический математический анализ; она скорее может заинтересовать учащегося и вызовет меньше трудностей и поэтому больше подходит для преподавания на ранних стадиях обучения. Это обстоятельство наряду с глубокой убежденностью многих математиков и педагогов в жизненности и важности новых направлений математики придало большой размах международному движению за модернизацию преподавания математики в средней и высшей школе. И одним из лидеров этого широкого движения бесспорно является профессор Дартмутского колледжа в г. Ганновере (США) Джон Г. Кемени.
Ученик выдающегося американского математика Джона фон Неймана, одного из создателей и современных электронных счетных машин и некоторых крупных разделов «конечной математики» (таких, как теория игр или теория автоматов), Дж. Кемени является видным математиком и организатором, а также темпераментным и умелым педагогом. Он и его коллеги и единомышленники Дж. Л. Снелл, Дж. Л. Томпсон и X. Миркель превратили Дартмутский колледж в один из оплотов нового движения. Плодом их коллективной работы явилось и настоящее учебное руководство, предлагаемое ныне вниманию русского читателя.
Эта книга представляет собой учебник нового типа, рассчитанный скорее на ознакомление читателей с определенными идеями, с духом «новой» математики, чем на сообщение большого количества конкретных фактов. Несмотря на это, содержание книги оказалось довольно богатым: оно включает элементы математической логики и теории вероятностей — этих двух краеугольных камней «новой» математики, а также некоторые сведения из более специальных дисциплин (вроде линейного программирования или теории игр). Однако многие сообщаемые здесь результаты не претендуют на серьезное самостоятельное значение, а носят скорее иллюстративный характер. По идее авторов настоящая книга призвана служить учебником в высшем учебном заведении по курсу, который читается параллельно с традиционным курсом математического анализа с тем, чтобы студенты могли по своему выбору начать с одного или с другого из этих курсов; при этом предполагается, что окончательно они прослушают оба курса. Эта программа довольно близка к тем, которые приняты у нас в настоящее время, скажем, на «математических отделениях» филологических факультетов.
8
От редактора русского издания
Современная зарубежная математическая литература не так уж бедна книгами сходной тематики. Однако настоящая книга, бесспорно, является в этом ряду одной из самых удачных. Авторы уделили большое внимание подбору примеров и упражнений, несложных, но ярких и занимательных, способных заинтересовать читателя. Удачей авторов представляется нам последняя глава книги, убедительно иллюстрирующая некоторые из новых применений математики. Надо только иметь в виду, что эта последняя глава также имеет своей целью лишь пропаганду новых идей, и выводы ее не должны восприниматься как имеющие непосредственное прикладное значение.
Редакционная работа над книгой носила двоякий характер. Во-первых, вскоре после выхода в свет английского оригинала книги те же авторы (при участии X. Миркеля) выпустили в свет второй, больший по объему вариант своей книги, названный ими «Конечные математические структуры». В то время как первую книгу авторы рассматривают как учебник «конечной математики» для студентов нематематических специальностей, вторая книга рассчитана уже на студентов-математиков; в соответствии с этим в ней несколько урезана «нематематическая» часть (сосредоточенная в последней главе книги), но зато значительно расширена математическая часть, как за счет более полного изложения доказательств теорем, так и за счет частичного отказа от обязательного требования «конечности» рассматриваемых объектов. В русском переводе за основу принят первый вариант книги; однако он пополнен довольно обширными вставками1) из второго ее варианта. Вставки эти не меняют характера книги, однако пополняют ее некоторыми существенными моментами, быть может просто упущенными из виду авторами в первоначальном варианте их книги. К числу таких моментов относится включение в книгу фундаментального понятия функции, вовсе не требующего для своего определения чуждого «конечной математике» понятия математического континуума, а также существенные дополнения в главе о теории вероятностей, явно более удачной во втором варианте книги
Другое обстоятельство, которое необходимо было учесть при подготовке русского издания, заключается в следующем. При подборе примеров и упражнений авторы «стремились выбирать темы, с которыми студенты знакомы из своего жизненного опыта». Однако жизненный опыт наших студентов во многом не совпадает с жизненным опытом студентов в США, и поэтому редакции пришлось пойти на немногочисленные замены (производимые каждый раз таким образом, чтобы математическое со
*) Эти вставки переведены с английского Э. Л, Наппельбаумом,
От редактора русского издания	9
держание примера оставалось в точности тем же, что и раньше): так нами были заменены все примеры, связанные с игрой на бирже, и некоторые другие примеры, непонятные нашему читателю. В совсем редких случаях пришлось даже пойти на полное исключение задач, содержание которых (достаточно близкое, по-видимому, американским студентам) не смогли понять ни редактор, ни переводчики книги (речь в этих задачах шла о мало известных в нашей стране правилах игры в бейсбол). Заново составлены списки «литературы для дополнительного чтения», содержащие указания и на более элементарную литературу, которая может служить для первоначального ознакомления с предметом. Наконец, редактору принадлежат все (довольно немногочисленные) подстрочные примечания в русском переводе книги.
И. М. Яглом
ПРЕДИСЛОВ И Е
Обычные программы по математике для студентов предусматривают изучение на первом и втором курсах лишь дифференциального и интегрального исчисления и примыкающих дисциплин. Несколько лет назад отделение математики Дартмутского колледжа решило ввести для первокурсников новый курс, который студенты могли бы выбирать наряду с более традиционными курсами. Этот курс предназначался для того, чтобы ознакомить студента с некоторыми понятиями современной.математики уже в начале пребывания его в колледже Хотя курс мыслился прежде всего как математический, он должен был включать приложения к биологическим и социальным наукам и тем самым освещать точку зрения на математику «потребителей», отличную от точки зрения физиков.
При планировании намеченного курса выяснилось, что не существует никакого учебника, отвечающего нашим целям, ввиду чего нам пришлось самим написать такую книгу. Мы стремились выбирать темы, с которыми студенты знакомы из своего жизненного опыта, а также темы, важные для современной математики и ведущие к интересным и важным приложениям. Чтобы лучше ориентироваться в последнем пункте, мы попросили нескольких ученых-бихевиористов1) сообщить свое мнение о том, с какого рода математическими вопросами придется иметь дело будущему бихевиористу. Основные темы книги взяты из этого перечня.
*) Бихевиоризм (от английского слова behaviour — поведение) — модный на Западе термин для направления науки (в первую очередь — психологии), ставящего во главу угла те факты поведения человека и животных, которые поддаются непосредственному наблюдению. Бихевиористы считают, например, что действующие в человеческом обществе законы могут быть выведены из наблюдений над поведением людей в различных ситуациях.

Предисловие
При написании книги мы ставили себе целью изложить различные темы с единой точки зрения. Чтобы достигнуть этого на элементарном уровне, мы ограничились рассмотрением «конечных» проблем, т. е. таких проблем, в которых не используются понятия бесконечного множества, предельного перехода, непрерывности и т. д. Такое ограничение позволило углубиться в намеченные темы в большей степени, чем это было бы возможно без него. Мы находим, что основные идеи конечной математики излагаются легче их «Непрерывных» аналогов, а теоремы доказываются значительно проще.
Первые пять глав образуют единое целое. Изучение множества логических возможностей (гл. I) приводит к идее о множестве истинности, соответствующем тому или иному высказыванию; это в свою очередь дает естественный способ определения вероятности того, что заданное высказывание истинно (гл. IV). Соответствие между логическими операциями (гл. I), операциями над множествами (гл II) и операциями над вероятностями (гл. IV) становится особенно прозрачным в конечном случае. Для иллюстрации и облегчения понимания идей в этих и дальнейших главах книги используется очень удобный педагогический прием, состоящий в построении «дерева» (диаграммы специального типа). Это позволяет, в частности, обойтись элементарными средствами при изложении начал теории стохастических процессов. Относящееся сюда понятие цепи Маркова подготавливает читателя к овладению теорией векторов и матриц, излагаемых в гл. V.
Глава VI вводит студента в две новые области математики, оказавшиеся полезными для приложений, — линейное программирование и теорию игр. Основные идеи обеих теорий удается изложить сравнительно быстро за счет того, что необходимые математические средства подготовлены в предыдущих главах.
В заключительной гл. VII обсуждаются некоторые важные применения математики к бихевиористским наукам. Отбор их производился с таким расчетом, чтобы они представляли интерес как для математиков, так и для бихевиористов. В каждой из пяти наук — социологии, генетике, психологии, антропологии и экономике — было выбрано по одной теме. Чтение разделов этой главы может показаться читателю более трудным, чем чтение предыдущих глав, но здесь никак нельзя было обойтись более простым материалом: чтобы оценить роль математики в смежных дисциплинах, надо рассмотреть нетривиальные приложения и продвинуться в их изучении достаточно далеко. Мы не ожидаем, что при чтении курса по нашей книге будут использованы все темы этой главы. Однако мы надеемся, что гл. VII
tl редисловие
13
будут пользоваться для справок и в качестве материала для самостоятельного изучения более инициативные студенты.
Комиссия по составлению программ для студентов при Американской математической ассоциации планировала новую программу по математике для первокурсников в то самое время, когда мы писали эту книгу. Она уже выпустила первую часть «Общей математики», представляющей собой введение в аналитическую геометрию и дифференциальное и интегральное исчисление, и составила план второй части. Когда председателю этой комиссии стало известно о сходстве плана нашей книги с планом второй части «Общей математики», он предложил одному из нас войти в комиссию. Мы думаем, что наша книга соответствует духу рекомендаций этой комиссии, и благодарны ей за разрешение использовать некоторые из подобранных членами комиссии иллюстраций, главным образом — приложения к проблемам голосования.
Доклад комиссии по вопросам преподавания математики социологам при Исследовательском совете социальных наук появился уже после того, как наши планы были завершены. К нашему удовольствию оказалось, что по многим вопросам мы пришли к тем же заключениям, чго и эта комиссия. Она рекомендует двухлетнее обучение, при котором около половины времени учащихся обучают дифференциальному и интегральному исчислению и около половины — тому, что мы называем «конечной математикой». Годовой курс на базе нашей книги и годовой курс дифференциального и интегрального исчисления — таково распределение учебного времени студента в пропорции, рекомендованной этой комиссией.
Ядро книги составляют не отмеченные звездочкой разделы гл. I -V. Этот материал должен охватываться любым курсом. Для удобства преподавателей мы включили также дополнительный материал — необязательные (отмеченные звездочкой) разделы гл. I—V, а также гл. VI и VII. Курс в объеме первых пяти глав должен быть основным математическим курсом. Этот курс может выполнять роль курса математики для бихеовиористов при ориентировке на гл. VII и на разбор нескольких входящих в нее приложений. Гл. VI содержит подходящий дополнительный материал для курсов каждого из этих типов. В конце каждой главы мы поместили библиографию в помощь тем. кто интересуется дальнейшим чтением.
Математическая подготовка, необходимая для чтения этой книги, ограничивается тем, что проходится в средней школе. Книга прошла успешную проверку на первом курсе Дартмутского колледжа и использовалась в дополнительных лекциях на дру
14
НредисЛовиё
гих курсах. Она также была использована в курсе математики для преподавателей бихевиористских наук.
Мы хотим выразить благодарность Дартмутскому колледжу, снявшему с нас часть преподавательских обязанностей для того, чтобы мы смогли подготовить эту книгу. Мы благодарны также А. В. Таккеру за его ценные советы и нашим коллегам по Дартмутскому отделению математики за их многочисленные полезные предложения. Мы признательны Джемсу К. Шиллеру, прочитавшему рукопись и сообщившему свои впечатления читателя-студента. Наконец, мы хотим поблагодарить Джоан Снелл, Маргарет П. Эндрью и Стефана Рассела за их неоценимую помощь в подготовке рукописи.
Дж. Г. К.
Дж. Л. С.
Дж. Л. Т,
Глава I
СОСТАВНЫЕ ВЫСКАЗЫВАНИЯ
§ 1.	ЦЕЛЬ ТЕОРИИ
В первой главе мы собираемся изучить, как различными способами из отдельных высказываний можно построить новое высказывание. Например, из высказывания «У меня два туза» и высказывания «У вас на руках флеш-рояль» ’) можно образовать более сложное высказывание: «Либо у меня два туза, либо у вас нет флеш-рояля». Это новое высказывание называется составным, в то время как высказывания, из которых оно было образовано, называются его простыми составляющими. Любое высказывание (даже такое, которое на самом деле является сложным) может быть использовано в качестве одного из простых составляющих какого-то другого составного высказывания.
Может показаться, что естественно прежде всего изучать сами высказывания, а затем уже приступить к изучению того, как из них образуются более сложные высказывания. Но мы решили не исследовать здесь внутреннюю структуру высказываний потому, что: (1) такое исследование оказывается достаточно трудным и относится скорее к лингвистике, чем к математике; (2) для того чтобы понимать законы- различных способов сочетания высказываний, вовсе не необходимо хорошо знать их природу. Ввиду бесконечного разнообразия простых высказываний теория таких высказываний весьма сложна. Опыт математики показывает, что часто бывает выгодно предполагать, что та или иная трудная задача уже решена, и переходить к последующей задаче. Поэтому мы будем поступать так, как если бы мы знали все о простых высказываниях, и будем изучать лишь их сочетания. Последнее представляет собой относительно легкую задачу.
) Флеш-рояль (пять карт одной масти, следующих одна за другой) — одна из старших комбинаций карточной игры покер,
16
Гл. I. Составные высказывания
Первое систематическое рассмотрение этих вопросов можно найти уже в сочинениях Аристотеля, однако математические подходы к этим вопросам впервые были указаны Джорджем Булем около ста лет тому назад1). Современные более тонкие методы выработаны совместными усилиями многочисленных специалистов по математической логике в XX веке.
Основное свойство каждого высказывания заключается в том, что оно либо истинно, либо ложно (и что оно не может быть истинным и ложным одновременно). Естественно, что нас интересует, какой из этих случаев в действительности имеет место. При этом приходится учитывать тот факт, что высказывание вроде следующего «У меня на руках два туза», — может быть иногда истинным, а иногда ложным, в зависимости от того, какие я в настоящем случае имею карты. Пять карт, которые сдаются игроку в покер и которые я имею сейчас (а в следующей главе мы увидим, что возможны 2 598 960 различных комбинаций из пяти карт), это есть одна из так называемых логических возможностей — понятие, с которым мы ближе познакомимся в § 5 настоящей главы. Прежде чем рассматривать любое высказывание, мы будем заранее определять множество логических возможностей, с которым оно связано. Для каждой из этих возможностей можно вполне определенно утверждать, что высказывание либо истинно, либо ложно. Обычно высказывание оказывается ложным в некоторых случаях и истинным в других, хотя, впрочем, существуют и такие высказывания, которые оказываются истинными (или ложными) в любом случае.
Для составного высказывания достаточно знать, какие из его компонент истинны, ибо «значения истинности» (т. е. истинность или ложность) этих компонент определяют (как именно — мы укажем ниже) значение истинности всего сочетания. Наша задача распадается, таким образом, на две части —нам надо выяснить: (1) Какими способами могут быть составлены (составные) высказывания? (2) Как определить значение истинности составного высказывания по данным значениям истинности его компонент?
Подготовим нужные нам для дальнейшего математические средства. В математических формулах встречаются символы трех сортов: константы, переменные, вспомогательные символы. Е апример, в формуле (х + у)2 константами являются знаки сложения и возведения в степень, переменными — буквы х и у, а вспомогательным символами — скобки. Константы — это сим-
9 См. George Boole, Investigation of the laws of thought (Дж. Буль, Исследование законов мысли), London, 1854 (основополагающий труд Буля многократно переиздавался).
§ J. Цель теории
17
волы, смысл которых неизменен в данном контексте. Так, в предыдущей формуле знак плюс указывает, что следует образе вать сумму чисел х и у, а показатель 2 указывает, что выражение х + у следует умножить само на себя. Переменные символы всегда обозначают объекты определенного рода, но использование этих символов оставляет открытым вопрос о том, какие именно индивидуальные объекты имеются в виду. В предыдущем примере буквы х и у обозначают неопределенные числа. Назначение вспомогательных символов сходно с ролью знаков препинания. Так, если в предыдущей формуле опустить скобки, то получится формула х + у2, имеющая совсем другой смысл, нежели формула (х + у)2.
В этой главе мы намерены пользоваться переменными лишь одного рода. Эти переменные, которые мы обозначим буквами у, у, г и т. д., будут служить символами неопределенных высказываний. Эти высказывания часто будут простыми высказываниями, но могут также быть и составными. В любом случае мы знаем, что поскольку каждая переменная обозначает высказывание, она имеет некоторое, заранее неизвестное, «значение истинности» (т. е. она или истинна, или ложна).
Константы, которыми мы собираемся пользоваться, будут обозначать некоторые связки, применяемые для сочетания высказываний. У нас будет один символ для образования отрицания высказывания и несколько символов для определенных комбинаций двух высказываний. Во введении символов, позволяющих сочетать три или более высказывания, необходимости нет, ибо можно показать, что любая такая комбинация может быть образована сочетанием высказываний по два. На практике пользуются лишь небольшим числом основных констант, определяя с их помощью другие. Можно даже обойтись одной-един-ственной связкой! (См. § 4, упр. 10 и 11.)
Наши вспомогательные символы будут большей частью теми же, какими пользуется элементарная алгебра; во всех остальных случаях будут даны разъяснения.
Примеры. В качестве примеров простых высказываний возьмем высказывания «Погода хороша» и «Очень жарко». Обозначим первое из них через р и второе через q
Допустим, что мы хотим образовать составное высказывание, утверждающее правильность обоих предыдущих высказываний: «Погода хороша и очень жарко». Мы записываем это составное высказывание с помощью выражения р /\q. Символ А, читаемый как «и», будет нашей первой связкой.
Вместо предыдущего сильного утверждения мы могли бы пожелать сделать более осторожное утверждение о том, что истинно хотя бы одно из этих двух высказываний: «Погода
2 Зак. 994,
18
Гл. I. Составные высказывания
хороша или очень жарко». Это утверждение записывается как р\/ q. Символ V читаемый как «или» — это и есть вторая связка, которой мы будем пользоваться.
Допустим, что мы считаем ложным одно из предыдущих высказываний. Например, мы считаем, что «Не очень жарко». Запишем это символически как —q. Итак, — является нашей третьей связкой, которая может быть прочитана, как «не».
Теперь можно образовывать более сложные составные высказывания. Например, р Л —q обозначает высказывание «Погода хороша и не очень жарко».
Упражнения
1.	Следующие утверждения являются составными высказываниями или могут быть так интерпретированы. Найдите нх простые компоненты.
(а)	Жарко и идет дождь.
(Ь)	Жарко, но не очень сыро.	[Отв.: «Жарко»; «Очень сыро».]
(с)	Идет дождь или очень сыро.
(d)	Джек и Джил взобрались на холм.
(е)	Убийцей является Джонс или Смит.
(f)	Это ни необходимо, ни желательно.
(g)	Или эту книгу напнсал Джонс, или Смит‘не знает, кто ее автор.
2.	В упр. 1 обозначьте буквами различные простые высказывания и запишите сложные высказывания (а) — (f) в символической форме.
[Отв.: (Ь) р Л ~ ?.]
3.	Пусть р и q означают соответственно «Фрэд умен» и «Джордж умен».
Запишите в символической форме следующие высказывания:
(а)	Фред умен и Джордж глуп.
(Ь)	Джордж умен и Фрэд глуп.
(с)	Фрэд и Джордж оба глупы.
(d)	Или Фрэд умен, или Джордж глуп.
(е)' Ни Фрэд, ни Джордж не умны.
(f)	Фрэд не умен, а Джордж глуп.
(g)	Неверно, что Фрэд и Джордж оба глупы.
4.	Предположим, что Фрэд и Джордж оба умны Какие из семи составных высказываний упр. 3 тогда будут истинны?
5.	Запишите в символической форме следующие высказывания:
(а)	Фрэд любит Джорджа. (Высказывание р.)
(Ь)	Джордж любит Фрэда. (Высказывание q.)
(с)	Фрэд и Джордж любят друг друга.
(d)	Фрэд и Джордж друг друга не любят.
(е)	Фрэд любнт Джорджа, но Джордж не отвечает ему тем же.
(f)	Джордж любим Фрэдом, ио Фрэд не любим Джорджем.
(d)	Ни Фрэд не любит Джорджа, ии Джордж не любнт Фрэда.
(h)	Неверно, что Фрэд н Джордж друг друга не любят.
6.	Предположим, что Фрэд любит Джорджа, а Джордж не любит Фрэда Какие из восьми высказываний упр, 5 истинны?
$ 2. Простейшие связки
19
7.	Для каждого высказывания упр. 5 укажите одно из условий, при котором оно ложно.	[Отв.: (с) Фрэд не любит Джорджа.]
8.	Пусть р означает «Сейчас жарко», a q означает «Температура поднимается». Сформулируйте словесно каждое из следующих высказываний:
(a)	pKq\
(b)	p/~q:
(с) ~p/\~q',
(d) p\J~q\
(е) ~[pl\q)\
(f) ~(PV9);
(g)
9. Используя ответы n. (e), (f), (g) ynp. 8, найдите более простые символические высказывания, имеющие то же содержание.
10. Пусть р и q соответственно означают «У меня есть собака» и «У меня есть кошка». Переведите на разговорный язык н упростите:
§ 2. ПРОСТЕЙШИЕ СВЯЗКИ
Значение истинности составного высказывания определяется значениями истинности его компонент. При рассмотрении той или иной связки мы хотим знать, каким именно образом истинность составного высказывания, порожденного этой связкой, зависит от истинности его компонент. Очень удобно изображать эту зависимость, пользуясь таблицей истинности.
Рассмотрим составное высказывание р Л q. Высказывание р может быть либо истинным, либо ложным, и то же самое можно сказать о высказывании q. Следовательно, возможны четыре пары значений истинности для этих высказываний, и мы хотим знать в каждом случае, истинно ли высказывание р Л q. Ответ получается сразу: если р и q оба истинны, то р Л q истинно, в противном случае р /\q ложно. Это выглядит разумно, поскольку утверждение р /\q выражает в точности то обстоятельство, что р и q оба истинны.
Фиг. 1 дает таблицу истинности для р Л q, конъюнкции р и q. Таблица -истинности содержит всю нужную информацию о связке Л, а именно сообщает нам значение истинности конъюнкции двух высказываний в зависимости от значений истинности каждого из них.
Обратимся теперь к составному высказыванию р V q, дизъюнкции р и q. Здесь утверждение состоит в том, что то или другое из высказываний р и q истинно. Ясно, что если одно из
2*
20
Гл. I. Составные высказывания
высказываний истинно, а другое ложно, то дизъюнкция истинна, тогда как если оба высказывания ложны, то дизъюнкция заведомо ложна. Следовательно, мы можем заполнить три нижние строки таблицы истинности для дизъюнкции (см. фиг. 2).
Заметим, что одна возможность осталась неразобранной. Именно, что будет в случае истинности обеих компонент? Надо сказать, что обиходное употребление связки «или» двусмысленно. Должно «или» пониматься в смысле «одно или другое или оба» или же в смысле «одно или другое, но не оба»?
р	9	РЛС
и	и	И
и	л	л
л	и	л
л	л	л 1
Фиг 1
р	а	PV?
и	и	?
и	л	И
л	и	и
л	л	л
Фиг. 2
Для того чтобы правильно ответить на этот вопрос, уместно обратиться к примерам. Предложение «В этом сезоне я хочу пойти на „Кармен” или на „Аиду”» допускает возможность двукратного посещения оперы. Однако в предложении «Я намерен учиться в Дартмуте или в Принстоне» подразумевается, что будет выбрано только одно из этих высших учебных заведений. Фраза «В будущем году я куплю телевизор или проигрыватель» может иметь оба смысла: говорящий может иметь в виду, что он остановит свой выбор на чем-нибудь одном, но может также иметь в виду, что он^сделает по крайней мере одну из этих покупок, но, возможно, и обе. Мы видим, что иногда здравый смысл позволяет установить точное содержание фразы, но так бывает не всегда.
Математик не станет тратить время на спор о том, что именно «должно» быть названо дизъюнкцией двух высказываний. Он предпочтет различать эти два вполне корректные употребления связки «или», называя одно из них дизъюнкцией в неисключающем смысле (одно пли другое или оба), а другое — дизъюнкцией в исключающем смысле (одно или другое, но не оба). Символ V будет служить для обозначения дизъюнкции в неисключающем смысле, а для дизъюнкции в исключающем смысле будет использоваться символ \_ . На фиг. За и фиг. 36 приведены соответствующие таблицы истинности. Всюду в дальнейшем, если только не оговорено противное, мы будем пользоваться дизъюнкцией в неисключающем смысле.
§ 2. Простейшие связки
21
Перейдем к последней из рассматриваемых в этом разделе связок — отрицанию. Если р — некоторое высказывание, то символ ~р, называемый отрицанием р, утверждает, что р ложно. Таблица истинности для отрицания указана на фиг. 4.
р		Р\Ч
и	и	И
и	л	и
л	и	и
л	л	л
р	ч	рУ«
и	И	Л
и	л	и
л	и	и
л	л	л
Ф и г. За	Фи г. 36
р	^р
и л	л и
Для образования составных высказываний наряду с единичным использованием каждой основной связки можно пользоваться основными связками многократно, получая более сложные составные высказывания — аналогично тому, как с помощью основных арифметических операций образуются сложные алгебраические выражения. Например, составными высказываниями будут —(р f\q), р/\'^р и (р V q) V—Р- Их следует читать «изнутри наружу», подобно __________________
алгебраическим выражениям, в которых сначала группируются величины, заключенные в	р	~р
самые внутренние скобки, затем эти скобки в ---------------
свою очередь группируются и т. д. Каждое со-	и	л
ставное высказывание имеет свою таблицу	л	и
истинности, которая может быть построена стандартным методом. Следующие примеры —————— показывают, как нужно строить таблицы ис- Фиг. 4 тинности.
Пример 1. Рассмотрим составное высказывание р V —q-Построение таблицы истинности начинаем с того, что выписываем в первых двух столбцах четыре возможные пары значений истинности для высказываний р и q. После этого записываем наше составное высказывание, оставляя место м'ежду символами с тем, чтобы можно было заполнять столбцы под ними. Затем воспроизводим значения истинности для р и q в столбцах под выражениями этих символов в нашем составном высказывании. Этим завершается первый шаг построения (см. фиг. 5).
Затем мы рассматриваем самое внутреннее сочетание — отрицание переменной q, завершая второй шаг (см. фиг. 6).
Фиг. 4
22
Гл. /. Составные высказывания
Наконец, заполнив столбец под символом дизъюнкции, мы получаем значения истинности нашего составного вы-
сказывания для различных значений истинности входяших
р	9	Р v	
и	И	И	и
и	л	и	л
л	и	л	и
л	л	л	л
Шаг №		1	1
р	9	Р V		ч
и	И	и	л	И
и	л	и	и	Л
л	и	л	л	и
л	л	л	и	л
Шаг №		1	2	1
Ф и г. 5	Ф и г. 6
в него переменных. Чтобы отметить это обстоятельство, мы проводим две вертикальные черты по обе стороны от окончательного столбца, завершая третий шаг (фиг. 7).
р	о	р	V		ч
И	И	и	И	л	И
и	Л	и	и	И	л
л	И	л	л	л	и
л	л	л	и	И	л
Шаг №		1	3	2	1
Фиг. 7
В следующих двух примерах показаны составленные таким же способом таблицы истинности для более сложных сочетаний. Имеются два основных правила, которые следует помнить при составлении таблиц: во-первых, двигаться «изнутри наружу»; во-вторых, значения истинности сложного высказывания смотреть в последнем столбце, заполненном в итоге всей процедуры.
Пример 2. Таблица истинности высказывания (р V—q} Л ~Р вместе с номерами, указывающими порядок, в котором заполняются столбцы, показана на фиг. 8.
§ 2. Простейшие связки
23
р	Ч	(р	V		9)			р
И	И	и	и	л	И	л	л	и
и	Л	и	и	и	Л	л	л	и
л	и	л	л	л	и	л	и	л
л	л	л	и	и	л	и	и	л
Шаг №		I	3	2	1	4	2	1
Ф н г. 8
Пример 3. Таблица истинности сложного высказывания — [(Р Л?) V (~/> Л —<?)] вместе с номерами, указывающими порядок заполнения столбцов, показана на фиг. 9.
р	ч		[(р	А	ч)	V		р	л		ч)
и	И	л	И	и	и	и	л	и	Л	л	И
и	Л	и	и	л	л	л	л	и	л	и	Л
л	и	и	л	л	и	л	и	л	л	л	и
л	л	л	л	л	л	и	и	л	и	и	л
Шаг №		5	1	3	1	4	2	1	3	2	1
Ф и г. 9
Упражнения
1.	Укажите составное высказывание, имеющее смысл «р или q, но не оба», применяя к простым высказываниям р и q связки ~, V и Д.
[Отв.: (p/\~<7)V(~p/9).]
2	Постройте таблицу истинности для составного высказывания, фигурирующего в упр. 1, и сравните ее с фиг. 36.
3.	Постройте таблицу истинности для символической формы каждого высказывания, фигурирующего в упр. 3 из § 1. Какова связь этой таблицы с упр. 4 из § 1?
4.	Постройте таблицу истинности для каждого из следующих высказываний:
(а)	~(р/?);	[Отв.:	ЛИНИ.]
(Ь)	рК~Р",	[Отв.:	ЛЛ.]
(с)	(PV?)V~P;	[Отв.:	ИИИИ.]
(d)	~[(P v?)/\(~pV~ <7)]-	[Отв.:	ИЛЛИ.]
24
Гл. I. Составные высказывания
5. Пусть р и q означают соответственно «Джонс выдержал экзамен» и «Смит выдержал экзамен». Выразите в символической форме высказывание «Неверно, что Джонс и Смит оба не выдержали экзамена». Постройте таблицу истинности для этого составного высказывания. Выра-
зите словесно условия, при которых это высказывание истинно.
6.	Придумайте более простое высказывание о Джонсе и Смите, имеющее ту же таблицу истинности, что и высказывание упр. 5.
7.	Пусть p\q выражает, что «р и q не могут быть оба истинными». Напишите символическое выражение для p/q, пользуясь связками ~ и А.
8.	Составьте таблицу истинности для pig.
9.	Составьте таблицу истинности для р|р. [Отв.: Та же, что- и на фиг. 4.]
р	а	Га)	(Ь)	(pl?)l(plg). [Отв : Та же, что и на фиг. 1.] 11. Составьте таблицу истинности для
				каждого из следующих высказыва-
И	И	и	И	ний:
и	л	л	л	
л	и	и	л	(a) ~(pvg) ^(gvp); [Отв.: ЛЛЛИ.]
л	л	и	и	(b) ~(pvg)Ap;	[Отв., лллл.]
	—			(с) ~ (р у q)\	[Отв.: ИЛЛИ.]
	ФИГ. 1U			(d) ~ (р | д).	[Отв.: ИЛЛЛ.]
12. Используя только связки зывания, которые имеют (а) и (Ь) (фиг 10).
~, v и Л, постройте два символических выска-в качестве таблиц истинности соответственно
§ 3. ДРУГИЕ СВЯЗКИ
Предположим, что мы хотим сделать не категорическое утверждение, а утверждение, содержащее некоторое условие. В качестве примеров рассмотрим следующие предложения: «Если будет хорошая погода, то я пойду гулять», «Если следующее утверждение истинно, то я могу доказать эту теорему», «Если успеваемость будет продолжать падать, то декан примет решительные меры». Каждое из этих высказываний имеет форму: «если р, то q». Таким образом, мы имеем дело с новой связкой, которую назовем импликацией и будем обозначать стрелкой —>.
Разумеется, для точного определения этой новой связки надо задать ее таблицу истинности. Если как р, так и q истинно, то, конечно, р -> q истинно, если же р истинно, a q ложно, то, конечно, p-+q ложно. Итак, первые две строки таблицы истинности могут быть заполнены без труда (фиг. 11а).
Предположим теперь, что р ложно. Что тогда следует вписать в последние две строки таблицы истинности на фиг. На?' Может показаться, что всего лучше сохранить здесь полную неопределенность. Но в таком случае был бы нарушен наш основной принцип, согласно которому каждое высказывание должно быть либо истинным, либо ложным-
§ 3. Другие связки
25
Поэтому мы совершенно произвольно решаем, что импликация p-+q истинна всякий раз, когда р ложно, независимо от значения истинности q. Это решение позволяет нам закончить построение таблицы истинности для импликации (фиг. 116). Из этой таблицы сразу видно, что импликация р-> q считается ложной только в случае, когда р истинно, a q ложно. Можно, если угодно, рационализировать упомянутое произвольное решение, считая, что, когда высказывание р ложно, мы оправдываем импликацию p->q «за недостаточностью улик» и рассматриваем ее как истинную (см. упр. 1).
р		р-»в		г	Q	/>->?
и	И	и		и	и	И
и	л	л		и	л	л
л	и	?		л	и	и
л	л			л	л	и
Фиг. 11		а			Фиг. 116	
В повседневной речи простые высказывания обычно комбинируются лишь в тех случаях, когда между ними существует какая-то связь. Мы можем сказать «Сегодня идет дождь, и я возьму зонт», но мы не станем говорить «Я читаю хорошую книгу и я возьму зонт». Однако не вполне ясное требование внутренней связи трудно соблюсти. Понятия, связанные между собой с точки зрения одного лица, не обязательно связаны с точки зрения другого. В наших рассмотрениях не будет предполагаться существования внутренней связи между двумя составными высказываниями, сочетаемыми посредством той или иной связки. Это свободное употребление импликации приводит иногда к результатам, которые могут показаться странными. Например, в соответствии с таблицей истинности на фиг. 116 высказывание «Если 2x2 = 5, то существуют ведьмы» истинно, тогда как высказывание «Если 2 X 2 = 4, то коровы суть обезьяны», — ложно.
Поскольку обычно мы употребляем форму «если..., то...» лишь в случае, когда между двумя высказываниями имеется причинная связь, может возникнуть побуждение отнести оба приведенные высказывания к разряду бессмысленных. Здесь важно усвоить, что связка -> не означает никакой причинной связи; смысл импликации полностью определен изображенной > на фиг. 11 б таблицей и ничего другого импликация не подразумевает. В § 7 мы еще вернемся к этому вопросу в связи с отношением следствия.
26
Гл. I. Составные высказывания
р	Q		
и и л л	и л и л		и л л и
Фиг. 12
С импликацией тесно связана так называемая «двойная импликация» p+->q, которая может быть прочитана так: «р, если и только если q». Двойная импликация P+-*q означает, что если р истинно, то q истинно, а если р ложно, то q ложно. Поэтому двойная импликация истинна в этих случаях и ложна в остальных, так что соответствующая таблица истинности должна быть заполнена, как на фиг. 12.
Двойная импликация — последняя из тех пяти связок, которыми мы будем пользоваться в этой главе. В сле
дующей таблице перечислены все эти связки и номера тех фигур, на которых.изображены их таблицы истинности.
Название	Символ	Истолкование	Таблица истинности
Конъюнкция Дизъюнкция в пейс-	А	«И»	Фиг. 1
ключающем смысле	V	«или»	Фиг. 3
Отрицание		«не»	Фиг. 4
Импликация	—>	«если ..., то ... »	Фиг. 116
Двойная импликация	<—>	«если и только если»	Фиг. 12
Напоминаем, что каждая из этих связок полностью определяется своей таблицей истинности. Следующие примеры показывают употребление двух новых связок.
Примеры. На фиг. 13 и 14 таблицы истинности двух высказываний составлены с помощью процесса, описанного в §2.
р	ч	р		(р	ч)
и	И	И	и	и и	И
и	Л	и	и	и и	Л
л	и	л	и	л и	И
л	л	л	и	л л	л
Шаг №		1	3 __	1	2	1
Фиг. 13
§ 3. Другие связки
27
р		—	р		<-->	(р		->	f-J	?)
и	И	л	И	и	И	л	л	И
и	л	л	И	л	И	и	и	Л
л	и	И	Л	и	Л	и	л	и
л	л	и	л	и	л	и	и	л
Шаг №		2	1	4	1	3	2	1
Фиг. 14
Можно образовать и составные высказывания из трех или более простых высказываний. Последующий пример — составное высказывание, образованное из трех простых высказываний р, q и г. Здесь имеется восемь возможных
р	Q '	г	[р ->	(9	г)]	А	~ [Р <“> ~ И
и	И	и	и и и и и	и	и и -л л и
и	И	л	и и и и л	л	л и и и л
и	Л	и	и и л и и	и	и и л л и
и	л	л	и л л л л	л	л и и и л
л	и	и	линии	л	л л и л и
л	и	л	л и и и л	и	и л л и л
л	л	и	лилии	л	л л и л и
л	л	л	л и л л л	и	и л л и л
Шаг №			13	12	1	5	4 13 2 1
Фиг. 15
троек значений истинности, и таблица истинности рассматриваемого составного высказывания будет иметь восемь строк (фиг. 15).
Упражнения
I-	Один способ заполнения, отмеченных вопросительными знаками мест изображенный на фиг. Па таблицы, дай в табл. фиг. 116. Возможны еще три способа.
(а)	Выпишите соответствующие три таблицы истинности.
28
Гл. I. Составные высказывания
(b)	Покажите, что каждую нз этих таблиц истинности можно интерпретировать в терминах уже известных нам связок.
2.	Выпишите таблицы истинности для qi\ р, q V Р, q ->Р, q<~^P- Сравните их с таблицами истинности, изображенными на фиг. 1, За, 116 и 12.
3.	Постройте таблицы истинности следующих высказываний:
(а)	г);
(b)	(Р у г) (р-> q);
(с)	(р q) *-» {q\Jр)\
(d)	pP~p-,
(р) (р -»р)\'(р > ~р);
(f) (p\!~q)br,
(g) [р-> (q -> <)] -* Кг ->?)-> (а О].
[Отв.: ИИИЛИИИИ.] [Отв.: И ИЛЛИ ЛИ Л.] [Отв.: ИИИИ.)
[Отв.: ЛЛ.]
[Отв.: ИИ.]
[Отв.: ИЛИЛЛЛИЛ.] [Отв.: ИИИИИИИИ.]
4.	Для каждого из следующих высказываний (1) найдите символическую форму; (2) постройте таблицу истинности. Воспользуйтесь буквенными обозначениями: р для «Джо умен», q для «Джим глуп», г для «Джо получит приз»
(а)	Если Джо умен, а Джим глуп, то Джо получит приз.
[Отв.: ИЛИИИИИИ.]
(Ь)	Джо получит приз в том и только том случае, если он умен или если Джим глуп.	[Отв.: ИЛИЛИЛЛИ.]
(с)	Если Джим глуп, а Джо не удастся получить приз, то Джо неумен.
[Отв.: Так же, как и для (а).]
5.	Постройте таблицы истинности н объясните смысл следующих высказываний:
(a)	(p^q)M.q-*P)\	(Ср. с фиг. 12.)
(b)	(ppq)->p\
(с) q^-(P\Jq)-,
(d) (р	(~р q).
6.	Таблица истинности высказывания, составленного из двух простых высказываний, состоит из четырех строк, а таблица истинности высказывания, составленного из трех простых высказываний, — из восьми строк. Сколько строк должна иметь таблица истинности высказывания, состав-вленного из четырех простых высказываний? Сколько — из пяти? Сколько — из п? Укажите способ систематической записи таблиц истинности для произвольного п?
7.	Пусть р означает «Идет дождь», a q означает «Дует ветер». Запишите в символической форме следующие высказывания:
(а)	Если идет дождь, то дует ветер.
(Ь)	Если дует ветер, то идет дождь.
(с)	Ветер дует тогда и только тогда, когда идет дождь.
(d)	Если дует ветер, то дождя нет.
(е)	Неверно, что ветер дует тогда и только тогда, когда нет дождя
8.	Постройте таблицы истинности для высказываний упр. -7.
[Отв.: ИЛИИ, ИИЛИ, ИЛЛИ, ЛИИИ, ИЛЛИ ] 9. Постройте таблицу истинности для
(a)	(pv<7)*->(~r'~s);
(b)	(/5A?)->^HpA(/-Vs)1-
§ 4 *. Высказывания с заданными таблицами истинности 29
10. Постройте таблицу истинности для
г)}. [Отв.: ИИИИИИЛИ.]
11. Найдите белее простое высказывание, имеющее ту же таблицу истинности, что и высказывание упр. 10,
§ 4*. ВЫСКАЗЫВАНИЯ С ЗАДАННЫМИ ТАБЛИЦАМИ ИСТИННОСТИ
В двух предыдущих параграфах было показано, как строить таблицу истинности любого составного высказывания. Интерес представляет и обратная задача: по заданной таблице истинности найти одно или несколько высказываний с этой таблицей истинности. Обратная задача всегда имеет решение, причем решение, использующее лишь связки л V и —'. Мы проведем рассуждение для таблицы истинности с тремя переменными, но его легко перенести на случай п переменных.
В предыдущем параграфе отмечалось, что таблица истинности с тремя переменными имеет восемь строк, соответствующих восьми возможным тройкам значений истинности. Предположим, что последний столбец заданной таблицы истинности состоит из одних Л. Легко видеть, что точно таким же будет и последний столбец таблицы истинности высказывания р /\~р.
даче Нам остается рассмотреть лишь такие таблицы истинности, в последнем столбце которых стоит по меньшей мере одно И. Наш метод будет состоять в построении высказываний,
30
Гл. I. Составные высказывания
истинных только в одном случае, с последующим построением искомого высказывания в виде их дизъюнкции.
Построение высказываний, истинных лишь в одном случае, не составляет труда. На фиг. 16 записаны восемь" высказываний, каждое из которых истинно ровно в одном случае. Назовем их основными конъюнкциями. Такая конъюнкция содержит каждую переменную или ее отрицание — соответственно тому, стоит ли под этой переменной в той строке фиг. 16, на которой записана эта конъюнкция, И или Л.
Заметим теперь, что дизъюнкция двух основных конъюнкций будет истинной ровно в двух случаях, дизъюнкция трех конъюнкций — ровно в трех случаях, и т. д. Итак, чтобы найти высказывание с заданной таблицей истинности, надо просто взять дизъюнкцию основных конъюнкций из тех строк фиг. 16, которым в заданной таблице истинности соответствует значение И.
Пример 1. Найти высказывание, таблица истинности которого имеет в первой, второй и последней строке И, а во всех остальных строках Л.
Искомое высказывание будет дизъюнкцией первой, второй и 'ВОСЬМОЙ основных конъюнкций, т. е.
(р/\ q /\г)\/ (р /\ q Л ~r)\f(~p f\~qf\ ~г).
Проделав упр. 2, читатель убедится, что это высказывание имеет требуемую таблицу истинности.
Пример 2. Один логик попал в плен к дикарям и был заключен в темницу, имеющую два выхода. Вождь дикарей предложил пленнику следующий шанс на спасенье: «Один выход ведет на верную смерть, другой — на свободу. Ты можешь избрать любой. Сделать выбор тебе помогут два моих воина. Они останутся здесь, чтобы ответить на один твой вопрос — любой, какой ты пожелаешь им задать. Но я предупреждаю тебя, что один из моих воинов всегда говорит правду, а другой — всегда лжет». И вождь ушел, думая, что дал своему пленнику лишь надежду на случайное спасенье.
После минутного размышления сообразительный логик задал один вопрос, после чего безошибочно выбрал тот выход, который вел на свободу. Что это был за вопрос?
Пусть р означает высказывание «Первый выход ведет на свободу», a q означает «Ты правдив». Ясно, что сами по себе р и q бесполезны как вопросы, поэтому испробуем составные высказывания. Мы хотим задать единственный вопрос, ответ «да» на который означал бы, что р истинно, а ответ «нет» — что р ложно, независимо от того, к какому
§4*. Высказывания с заданными таблицами истинности
31
воину этот вопрос обращен. Желаемые ответы на эти вопросы выписаны на фиг. 17.
Дальше следует рассмотреть, какой должна быть таблица истинности вопроса с желаемыми ответами. Если воин отвечает «да» и если он правдив, т. е. если q истинно, то значением истинности будет И. Но если он отвечает «да» и если он лжец, т. е. если q ложно, то значением истинности будет Л. Аналогичный анализ проводится и для ответа «нет». Значения истинности искомого вопроса даны на фиг. 17.
р	я	Желаемые ответы	Таблица истинности вопроса
и	И	да	и
и	л	да	л
л	и	нет	л
л	л	нет	и
Ф и г. 17
Следовательно, мы свели рассматриваемую задачу к задаче о нахождении высказывания, имеющего своей таблицей истинности таблицу фиг. 17. Следуя общему методу, развитому выше, мы найдем, что такую таблицу истинности имеет высказывание
(/’A?)V(~' Р A— q).
Итак, наш логик задает вопрос: «Верно ли, что или первый выход ведет на свободу и ты правдив, или второй выход ведет на свободу и ты лжец?» Читатель может проверить (упр. 3), что также и высказывание p-^-q имеет своей таблицей истинности изображенную на фиг. 17 таблицу. Поэтому более коротким был бы следующий, как оказывается, эквивалентный первому, вопрос: «Ведет ли первый выход на свободу в том и только том случае, если ты правдив?»
Как можно видеть из примера 2, наш метод не обязательно приводит к простейшему из возможных составных высказываний. Однако он имеет два несомненных достоинства: (1) Он дает механический прием нахождения высказывания, решающего данную задачу; (2) Высказывание получается в стандартной форме. Последнее будет использовано при конструировании переключательных схем (см § 12),
32
Гл. I. Составные высказывания
Упражнения
1.	Покажите, что таблица истинности основной конъюнкции, стоящей на фиг. 16 в fe-й строке (где k=\, 2, 3, ..., 8), имеет И в Л-й строке и Л в остальных семи строках.
2.	Найдите таблицу истинности составного высказывания, построенного в примере 1.
3.	Покажите, что высказывание p<-+q имеет своей таблицей истинности таблицу, изображенную на фиг. 17.
4.	Постройте одно или большее число составных высказываний, имеющих каждую из следующих таблиц истинности (а), (Ь) и (с).
с	Q	г	(а)	(Ы	(С)
и	и	и	и	л	и
и	и	л	л	л	и
и	л	и	и	л	и
и	л	л	л	и	л
л	и	и	л	л	и
л	и	л	л	л	и
л	л	и	и	л	л
л	л	л	ч	л	и
5.	Используя только связки v , и ~, напишите высказывание, эквивалентное каждому из следующих.
(a)
(b)
(с)	9)-
6.	Используя только связки V и ~, напишите высказывание, эквивалентное р Р q. Опираясь на этот результат, докажите, что любая таблица истинности может быть реализована составным высказыванием, использующим только две связки и ~.
В упр. 7—10 мы будем изучать новую связку ф . где р ф q выражает «ни р, ни q».
7.	Постройте таблицу истинности для р ф Ч-
8.	Постройте таблицу истинности для р фр- Какое Другое составное высказывание имеет ту же таблицу истинности?
[Отв.: То же,, что и в случае фиг. *]
9.	Постройте таблицу истинности для (р ф ч) J' (PIЧ)- Какое другое Составное высказывание имеет эту же таблицу истинности?
[Отв.: То же, что и в случае фиг. 4.]
10.	Используя результаты упр. 6, 8 и 9, покажите, что любая таблица истинности может быть реализована посредством составного высказывания, в котором используется единственная связка ф.
11.	Используя результаты упр. 9, 10 из § 2, покажите, что любая таблица истинности может быть реализована посредством вставного высказывания, в котором используется единственная связка | .
§ 5. Логические возможности
33
12.	Из простых высказываний р, q и г постройте составное высказывание, которое было бы истинно тогда и только тогда, когда истинна только одна (безразлично какая!) из компонент.
13.	Для высказываний с единственной переменной р «основными конъюнкциями» являются р и "ч- р. Исследуйте различные составные высказывания, которые могут быть из них построены посредством дизъюнкции. Как связаны р и ~р с возможными таблицами истинности для высказываний с одной переменной? Что можно утверждать о произвольном составном высказывании, безразлично какой длины, содержащем только одну переменную р? [Оте.: Возможных таблиц истинности четыре.]
14.	В примере 2 логик может задать другой вопрос, таблица истинности которого отлична от таблицы, изображенной на фиг. 17. Что это за вопрос?
15.	На экзамене преподаватель предлагает студенту пять утверждений, относительно которых надо ответить, истины эти утверждения или ложны. Студент знает, что преподаватель всегда дает истинных утверждений больше, чем ложных, и никогда не задает три вопроса подряд, требующие одинакового ответа. Из содержания первого и последнего утверждений ему ясно, что ответы на них должны быть противоположны. Единственный вопрос, ответ на который ему известен, — второй. Это уже гарантирует ему правильные ответы на все вопросы. Что знает он о втором вопросе? Какими должны быть ответы на эти пять вопросов?
[Отв.: ИЛИИЛ.]
§ 5. ЛОГИЧЕСКИЕ ВОЗМОЖНОСТИ
Одним из наиболее важных примеров пользы, которую приносит математика при решении той или иной научной проблемы, является способность математики обеспечить для этой проблемы исчерпывающий анализ логических возможностей. Роль науки заключается тогда в открытии фактов, которые исключат все возможности, кроме одной.
В повседневной практике мы многократно пишем или произносим одно и то же предложение, используя его в различных ситуациях. Для того чтобы решить, является ли истинным или ложным утверждение «У меня на руках имеется флеш-рояль», нужно знать, какие карты вам сдали. Поэтому мы, естественно, попытаемся включить это свойство нашего языка в структуру элементарной логики. Для этого свяжем каждое высказывание с определенными логическими возможностями. Эти последние предполагаются фиксированными и известными заранее, и мы условимся считать предложение бессодержательным и не рассматривать его как высказывание до тех пор, пока не определены связанные с этим высказыванием логические возможности. Когда мы одновременно рассматриваем несколько высказываний (а мы, как правило, так и поступаем, поскольку основная задача этой главы состоит в изучении составных высказываний), то мы будем требовать, чтобы каждое из этих высказываний было связано с одним и тем же множеством логических 3
3 Зак. Р94,
34
Гл. I. Составные высказывания
возможностей. При решении научных задач обычно прежде всего составляется полный список всех логических возможностей, а уж затем рассматриваются различные высказывания, относящиеся к этим возможностям.
После того как анализ логических возможностей произведен, мы можем для каждого утверждения, касающегося какой-то проблемы, и для каждой логической возможности спросить, истинно ли наше утверждение в данном случае. Как правило, заданное высказывание во многих случаях окажется истинным и во многих случаях ложным, и единственное, что здесь может сделать логика, — это указать случаи, когда оно будет истинным. Однако существуют два важных исключения: во-первых, высказывание может быть истинно в каждом логически возможном случае; во-вторых, оно может быть во всех случаях ложно. В этих двух случаях одной логики достаточно для полного определения значения истинности.
Если высказывание истинно в каждом логически возможном случае, то его называют логически истинным Истинность такого высказывания вытекает из смысла слов и формы высказывания и контекста проблемы, с которой это высказывание свя-вано. Ниже мы встретимся с рядом примеров логически истинных высказываний. Высказывание, ложное в каждом логически возможном случае, называется логически ложным, или противоречивым. Например, конъюнкция любого высказывания и его отрицания всегда будет противоречивым высказыванием, так как она не может быть истинной ни при каких условиях.
Пример 1. В теории вероятностей часто имеют дело с задачами такого типа: «Имеются две урны, первая из которых содержит два черных и один белый шар, а вторая — один черный и два белых шара. Выберем наудачу одну-урну и вынем из нее последовательно два шара. Какова вероятность того, что...?» Не затрагивая здесь вопроса о вероятности, исследуем, какие возможности могут иметь место. На фиг. 18 и 19 даны два способа анализа логических возможностей.
На фиг. 18 произведен анализ возможностей лишь постольку, поскольку нас интересует цвет вынутых шаров. Такой анализ может быть достаточным для многих целей. На фиг. 19 дан более тонкий анализ, в котором принято во внимание различие между шарами из одной урны, имеющими одинаковый цвет. Для некоторых целей может оказаться необходимым этот более тонкий анализ. Важно понимать, что логические возможности для данной проблемы можно анализировать многими различными способами, от совсем грубого подразделения возможностей до
§ 5. Логические возможности
35
весьма тонкого. К анализу логических возможностей предъявляется только два требования: (1) в любых мыслимых условиях должна осуществляться одна и только одна из этих возможностей и (2) анализ должен быть настолько
Случай	Уриа	Первый шар	Второй шар
1	1	черный	черный
2	1	черный	белый
3	1	белый	черный
4	2	черный	белый
5	2	белый	черный
6	2	белый	белый
Фиг. 18
тонким, чтобы значение истинности каждого высказывания, рассматриваемого в связи с данной проблемой, могло быть определено в каждом случае.
Случай	Урна	Первый шар	Второй шар
1'	1	первый черный	второй черный
2'	1	второй черный	первый черный
3'	1	первый черный	белый
4'	1	второй черный	белый
5'	1	белый	первый черный
&	1	белый	второй черный
7'	2	черный	первый белый
8'	2	черный	второй белый
9'	2	первый белый	черный
10'	2	второй белый	черный
11'	2	первый белый	второй белый
12'	2	второй белый	первый белый
Фиг. 19
Легко убедиться в том, что оба данных нами анализа (фиг. 18 и 19) удовлетворяют первому требованию. Удовлетворяют ли они также и второму требованию — это зависит от природы задачи. Если нас интересует следующее
36
Гл. 1. Составные высказывания
высказывание: «Из первой урны вынуты два черных шара», то оба анализа достаточны (см. фиг. 20 и 21).
Возможности	Значение истинности высказывания «Из первой урны вынуты лва черных шара»
1 2 3 4 5 6	и л л л л л
Фиг. 20
Но если мы хотим рассмотреть высказывание «Из первой урны вынут сначала второй черный шар, а затем первый черный шар», то потребуется более тонкий из наших двух анализов.
Возможности	Значение истинности высказывания «Из первой урны вынуты два черных шара»
1' 2' У 4' 5' 6' 7' У 9' 10' 11' 12'	и и л л л л л л л л л л
Фиг. 21
Рассмотрим высказывание «Вынут один белый и один черный шар». При анализе логических возможностей, даваемом таблицей, изображенной на фиг. 18, это высказывание истинно в случаях 2, 3, 4 и 5 и ложно в случаях 1
§ 5. Логические возможности
37
и 6. Высказывания, с которыми мы будем иметь дело, как правило, будут в некотором числе случаев истинными и в некотором числе случаев ложными. Исключение составляют такие высказывания/как «Вынуто не более чем два черных шара»; это высказывание истинно в каждом случае (при обоих анализах): из самих условий задачи следует, что мы не можем вынуть более двух шаров; следовательно, это вы-сказывание логически истинно. По аналогичной причине высказывание «Вынуто три белых шара» логически ложно. Какие логические возможности имеют место для данной системы высказываний, это зависит от контекста, т. е. от рассматриваемой проблемы. Если эти возможности не известны, то это означает, что мы не разобрались в стоящей перед нами задаче. Это не исключает возможности того, что анализ этих логических возможностей может быть проведен несколькими способами. Так, в примере 1 даны два различных анализа, но могли быть еще и другие. Вообще, ответ на вопрос «Для скольких случаев р истинно?» зависит от анализа возможностей. (Это будет играть для нас важную роль при изучении теории вероятностей.) Однако логически истинные и логически ложные высказывания являются в этом отношении исключениями. Высказывание, логически истинное (ложное) при одном анализе, будет логически истинным (ложным) и при всяком другом анализе данной проблемы.
Для анализа логических возможностей в начале настоящей главы были использованы таблицы истинности; они доставляют хотя и очень грубый, зато удобный метод. Допустим, что мы имеем высказывание, составленное из трех простых высказываний р, q и г. В соответствии с каким-нибудь тонким анализом здесь может представиться сотня возможных случаев, но ряд из них можно объединить, так как нам необходимо различать лишь те случаи, когда значения истинности трех компонент оказываются различными. Тогда мы можем получить самое большее восемь случаев, соответствующих восьми строкам таблицы истинности. Например, если s есть составное высказывание /’->(—q V г), то изображенная на фиг. 22 таблица представляет собой просто-напросто модификацию таблицы истинности для высказывания р -> (— q \/ г).
Однако нет никаких оснований предполагать, что всегда может иметь место любая комбинация значений истинности высказываний р, q и г. Предположим, например, что в задаче об Урнах и шарах из примера 1 при грубом анализе возможностей, задаваемом изображенной на фиг. 18 таблицей, рассматриваются следующие три высказывания р, q и г: р — «выбирается урна 1»; Ч — «первый вынутый шар — белый» и Г — «второй вынутый
38
Гл. 1. Составные высказывания
шар — черный». На фиг. 23 приведены значения истинности для р, q и г в каждом из шести возможных случаев примера 1.
Возможности	Значение истинности s
и и и	И
и и л	Л
или	и
ИЛЛ	и
ЛИИ	и
лил	и
ЛЛИ	и
л л л	и
Возможности	р		г
1	и	л	и
2	и	л	л
3	и	и	и
4	л	л	л
5	л	и	И
6	л	и	л
Ф и г. 22	Ф и г 23
Из этой таблицы видно, что события, описываемые строками ИИЛ и ЛЛИ таблицы истинности, никогда не могут иметь места. Отсюда для данных конкретных высказываний р, q, г мы должны исключить возможности ИИЛ и ЛЛИ из таблицы фиг. 22, после чего в ней останется только шесть строк, изображенных на фиг. 24. Но теперь мы видим, что сложное высказывание s является логически истинным, поскольку оно оказывалось ложным только в том случае, который не соответствует никакой реальной логической возможности.
Возможности	Значения истинности s
и и и	и
или	и
ИЛЛ	и
ЛИИ	и
лил	и
л л л	и
Фиг. 24
Если три высказывания р, q, г таковы, что логически возможными оказываются все восемь строк таблицы истинности, мы говорим, что эти высказывания (логически) независимы. Это свойство высказываний более подробно изучается в § 8.
<J 5. Логические возможности
39
В тех случаях когда характер взаимосвязи между высказываниями р, q, г заранее нам не известен, при анализе таблиц истинности составных высказываний, образованных из них, обычно предполагают, что р, q и г независимы. Ведь если составное высказывание, образованное каким-то способом из высказываний р, q, г, оказывается логически истинным хотя бы при одном выборе независимых простых высказываний р, q и г, то оно логически истинно по своей форме и будет логически истинным при любом другом выборе высказываний р, q и г как независимых, так и связанных между собой. Например, составное высказывание вида р-> (р V q) должно быть истинным в каждом мыслимом случае. Можно рассмотреть сто случаев, в которых значения истинности р и q варьируются какими-то способами, но поскольку речь идет о рассматриваемом составном высказывании, каждый из этих ста случаев будет соответствовать одной из четырех строк таблицы истинности. В каждом из этих четырех случаев наше составное высказывание истинно и, следовательно, оно будет логически истинным. Примером может служить «Если Джонс умен, то он умен или счастлив» или «Если у меня два туза, а у вас флеш-рояль, то у меня два туза»; при этом нас совершенно не интересует, какая связь существует между простыми высказываниями «У меня два туза» и «У вас флеш-рояль».
Мы, однако, уже видели, что если между компонентами составного высказывания существует логическая связь, то один анализ таблицы истинности может нас подвести. Вот еще один пример того же рода. Обозначим через р высказывание «Джим ростом выше Билла», а через q высказывание «Билл ростом выше Джима» и рассмотрим высказывание «Или Джим ростом не выше Билла, или Билл ростом не выше Джима», т. е. — Р V ~q- Построив таблицу истинности этого составного высказывания, мы найдем, что оно ложно в первом случае. Но этот случай логически невозможен, так как ни в каком случае высказывания р и q не могут быть истинными одновременно! И хотя наше составное высказывание логически истинно, из таблицы истинности этого не видно; здесь необходим более тша-тельный анализ возможностей для роста двух людей (ср., например, упр. 11 из § 8).
Пример 2. В качестве более сложного примера возьмем произведенную на фиг. 25 классификацию людей по росту, цвету волос и полу. Достаточно ли такого анализа, включающего в себя 24 случая, — это будет зависеть от поставленной задачи. Например, если мы хотим учесть случай седых волос или отсутствия волос, то нам следует рассмотреть большее число случаев.
40
Гл. I. Составные высказывания
Высказывание «Он —- мужчина высокого роста» истинно в случаях 1,3, 5, 7 и ложно в остальных. Высказывание «Она — женщина не низкого роста и не рыжеволосая» истинно в случаях 2, 4, 6, 10, 12 и 14 С другой стороны, высказывание «Этот человек высокого, среднего или низкого
Случай	Рост	Цвет волос	Пол
1	высокий	блондин	мужской
2	высокий	блондин	женский
3	высокий	шатен	мужской
4	высокий	шатеи	женский
5	высокий	брюнет	мужской
6	высокий	брюнет	женский
7	высокий	рыжий	мужской
8	высокий	рыжий	женский
9	средний	блондин	мужской
10	средний	блондин	женский
11	средний	шатеи	мужской
12	средний	шатен	женский
13	средний	брюнет	мужской
14	средний	брюнет	женский
15	средний	рыжий	мужской
16	средний	рыжий	женский
17	НИЗКИЙ	блондин	мужской
18	низкий	блондин	женский
19	низкий	шатен	мужской
20	низкий	шатен	женский
21	низкий	брюнет	мужской
22	низкий	брюнет	женский
23	низкий	рыжий	мужской
24	низкий	рыжий	женский
Фиг. 25
роста» не доставляет нам никакой информации — оно истинно в каждом случае и, следовательно, логически истинно. Наконец, высказывание «Этот человек имеет рост ниже среднего, не блондин, не шатен и не рыжий и не является брюнетом низкого роста» логически ложно или противоречиво.
Из всех этих логических возможностей одна и только одна соответствует фактам, т. е. для каждого человека
§ 5. Логические возможности
41
один и только один из 24 случаев дает описание реальной ситуации. Чтобы определить этот случай, необходимо иметь фактическую информацию. Когда мы говорим, что некоторое высказывание «истинно», не анализируя его, то мы подразумеваем, что оно истинно в этом реальном случае. Но, как было сказано ранее, вопрос о том, какой случай имеет место на самом деле, лежит вне сферы логики. Логика может лишь указать, при каких условиях (логических возможностях) то или иное высказывание истинно.
Упражнения
1.	Покажите, что высказывание, являющееся отрицанием логически истинного высказывания, будет логически ложным, а высказывание, являющееся отрицанием логически ложного высказывания, будет логически истинным.
2.	Определите для каждого из следующих высказываний, будет ли оно (ij логически истинным, (п) противоречивым, (iii) ии тем, ни другим.
(а)	р -«—> р\	[Отв.: Логически истинное.]
(Ь)	р->~р;
(с)	(PV?) «->(/’А 9);	[Отв.: Ни то, ии другое.]
(d) (/>-» — q) '''РУ,
(е) (р->?)/\(9->г)/\~(р->г); [Отв.: Противоречиво.]
(О (р-*9)->/>;
(g) [(p-+q)->p]^p-
3.	На фиг. 25 указаны логические возможности классификации людей по росту, цвету волос и полу, относящиеся к одному человеку. Сколько будет случаев, если классифицировать по этим признакам совместно двух человек?	[Отв.: 576.]
4.	Для каждого из 24 случаев фиг. 25 определите, будет ли истинным следующее высказывание: «Данный человек имеет рыжие волосы и если он женщина, то низкого роста».
5.	Укажите те из перечисленных на фиг. 18 случаев (относящихся к примеру 1), в которых истинны следующие высказывания:
(а)	выбрана первая урна;
(Ь)	вынут по меньшей мере один белый шар;
(с)	вынуто ие более одного белого шара;
(d)	если первым вынут белый шар, то вторым вынут черный;
(е)	два шара различного цвета вынуты в том и только в том случае, если выбрана первая уриа.
6.	В примере 1 укажите два логически истинных и два логически ложных высказывания (отличные от приведенных в тексте).
7.	В сессию студент сдает четыре предмета, по каждому из которых он может получить одну из четырех отметок. Сколько логических возможностей может иметь место, если нас интересует содержание соответствующей страницы зачетной книжки студента (неудовлетворительная оценка также фиксируется — хотя бы тем, что в соответствующей графе оценка оказывается не проставленной).	[Отв.: 256.]
42
Гл. I. Составные высказывания
8.	Некто имеет пять монет общим достоинством в 78 центов*). Каковы логические возможности распределения монет?
[Указание: Имеются три возможности ]
9.	В условиях упр. 8 определите, какие из следующих высказываний логически истинны и какие логически ложны:
(а)	Некто имеет по меньшей мере одно пенни.
[Отв.: Логически истинно.]
(Ь)	Он имеет по меньшей мере один никель.
[Отв.: Ни то, ни другое.]
(с)	Он имеет в точности 2 никеля.	[Отв..- Логически ложно.]
(d)	Он имеет в точности 3 никеля в том и только в том случае, если он имеет в точности один дайм.	[Отв.: Логически истинно.]
10.	Пусть в условиях упр. 8 некто ие имеет никелей. Что из этого можно заключить?
11.	Бросаются две игральные кости. Какой из следующих анализов логических возможностей удовлетворяет указанному на стр. 35 первому требованию, предъявляемому к таким анализам? Что неправильно в других анализах?
Сумма появившихся очков:
(а): (1) 6, (2) не 6;
(b): (1) четное число, (2)' менее 6, (3) более 6;
(с): (1) 2, (2) 3, (3) 4, (4) более 4;
(d): (1) 7 или 11, (2) 2, 3 или 12, (3) 4, 5, 6, 8, 9 или 10;
(е): (1) 2, 4 или 6, (2) нечетное число, (3) 10 или 12;
(f) : (1) менее 5 или более 8, (2) 5 или 6, (3)' 7, (4) 8;
(g): (1) более 5 или менее 10, (2) самое большее 4, (3) 7, (4) II или 12. [Отв.: (а), (с), (d), (f) удовлетворяют требованию.]
12.	Пусть р и q связаны между собой таким образом, что их значения истинности всегда одинаковы. Исследуйте вновь составные высказывания упр. 2 (с) и 2 (f) при этом предположении
13.	Обозначим через р высказывание «Джим выше 5 футов», через q— «Джим ниже 6 футов» и через г — «Рост Джима равен 5 футам 10 дюймам». Выпишите все восемь возможных комбинаций значений истинности высказываний р, д, г и исключите из них противоречивые. Сколько комбинаций при этом останется?
14.	Дайте словесное описание высказывания s, таблица истинности которого приведена на фиг. 24. По этому описанию докажите, что s логически истинно.
§ 6. ДЕРЕВЬЯ ЛОГИЧЕСКИХ ВОЗМОЖНОСТЕЙ
Очень удобным средством анализа логических возможностей является вычерчивание «дерева». Этот способ будет проиллюстрирован несколькими примерами.
Пример 1. Рассмотрим снова тот же пример, что и в случае фиг. 25. Предположим, что классификация людей производится следующим образом: сначала, до классифи
*) Для решения этой и последующих задач следует иметь в виду, что в США имеются следующие виды разменной монеты: 50 центов ('/2 доллара), 25 центов («квотер»), 10 центов («дайм»), 5 центов («никель») и 1 цент («пенни»).
# 6. Деревья логических возможностей
43
кации, все люди рассматриваются как образующие одну группу; затем эту большую группу людей разбивают на три подгруппы, объединив в одну группу людей низкого роста, в другую — людей среднего роста и в третью — высоких людей; затем каждую из этих подгрупп разбивают на четыре меньшие группы (всего таких подгрупп получится двенадцать) соответственно цвету волос; наконец, каждую из этих подгрупп разбивают на две части, относя к одной из них мужчин, а ко второй — женщин. Тогда в результате последней классификации группа всех людей
(Конец) мжмжмжмжмжмжмжмжмжмжмжмж АА\\\\\1\1 \\\1\/1///// БЛ ШТ БР РЖ БЛ ШТ БР РЖ БЛ ШТ БР РЖ w Высоте Средние Низкие
Все люди ( Начало)
Ф и г. 26
разобьется на 24 подгруппы. Графическое изображение описанного процесса дано на фиг. 26. По очевидным соображениям подобную фигуру, начинающуюся из одной точки, а ^алее разветвляющуюся, мы будем называть деревом.
Заметим, что подобное дерево содержит всю информацию, относящуюся к данной классификационной проблеме. Каждый путь вдоль дерева, ведущий от его начала к концу (от основания к вершине), соответствует некоторой логической возможности. Всех путей 24, по числу концевых точек дерева, и столько же случаев содержит таблица фиг. 25. Последовательность отдельных стадий такой классификации может быть любой: с равным успехом мы могли бы классифицировать людей сначала по цвету волос, затем по полу и наконец по росту. При этом число логических возможностей остается равным 24, но получающееся дерево отличается от дерева, изображенного на фиг. 26 (см. упр. 1).
44
Гл. I. Составные высказывания
Пример 2. Рассмотрим далее пример, к которому относится фиг. 18. Ему отвечает процесс, включающий три стадии: сначала мы выбираем урну, затем вынимаем шар и затем вынимаем второй шар. Дерево логических возможностей изображено на фиг. 27. Отметим, что полное число логических возможностей здесь равно шести. В самом деле, если выбрать первую урну (содержащую два черных шара и один белый) и вынуть из нее черный шар, то второй вынутый шар может быть любого цвета; если же сначала вынуть белый шар, то второй вынутый шар — непременно черный. Аналогично обстоит дело и в том случае, если выбрана была вторая урна.
Обращаем внимание читателя на то, что в случае изображенного на фиг. 26 дерева, от всех точек, лежащих на одном и том же уровне (например, от точек «второго этажа» диаграммы), отходит одинаковое число ветвей, тогда как в случае дерева, изображенного на фиг. 27, дело обстоит не так.
Пример 3. В качестве последнего примера рассмотрим дерево логических возможностей для исходов первенства США по бейсболу, в котором принимают участие Доджерс и Янки1). На фиг. 28 изображена половина этого дерева, соответствующая тому случаю, когда первую игру выигры-
*) Популярные в Соединенных Штатах Америки бейсбольные команды. Правила розыгрыша первенства страны по бейсболу предусматривают серию встреч между одними и теми же командами; выигравшей считается та команда, которая первой выигрывает у противника четыре игры (не обязательно подряд),
§ 6. Деревья логических возможностей
45
вает Доджерс (пунктирная линия у основания ведет к другой половине дерева). На этой фигуре «Д» означает выигрыш Доджерс, а «Я» — выигрыш Янки. На показанной половине дерева имеется 35 возможных исходов (им соответствуют буквы, обведенные кружочком), так что первенство по бейсболу может завершиться 70 способами.
Этот пример отличается от двух предыдущих тем, что пути вдоль дерева оканчиваются на разных уровнях. Это соответствует тому, что встречи Доджерс и Янки могут закончиться после разного числа игр — надо только, чтобы одна из команд выиграла четыре игры.
Фиг. 28
Не всегда требуется такой детальный анализ, как в предыдущих примерах. Если в примере 2 допустить, что мы хотим знать лишь цвет шаров и последовательность, в какой они были вынуты, но нас не интересует, из какой их взяли урны, то вместо шести логических возможностей мы будем иметь только четыре. В таком случае второй и четвертый пути на фиг. 27 (считая слева) представляют один и тот же исход «за черным шаром следует белый шар». Точно так же третий и пятый пути представляют один и тот же исход. Наконец, если бы мы хотели знать лишь цвет вынутых шаров, не интересуясь тем, в какой последовательности их вынимали из урны, то имелось бы только три логические возможности: или два черных шара, или два белых шара, или один белый и один черный шар.
Для первенства США по бейсболу также возможен менее детальный анализ возможностей. Например, эти возможности можно анализировать таким образом: Доджерс побеждает после 4 игр; или после 5 игр; или после 6 игр; или после 7 игр. Новая классификация уменьшает число возможностей с 70 до 8. Другие возможности при этом не ликвидируются, а просто
46
Гл. I. Составные высказывания
некоторые из них объединяются. Так, «Доджерс побеждает после 4 игр» может осуществиться только одним путем, тогда как «Доджерс побеждает после 7 игр» может осуществиться 20 путями (см. фиг. 28). Еще менее детальным анализом была бы классификация по числу игр в сериях. Здесь имеются только четыре логические возможности.
Читатель убедится в том, что часто требуется произвести несколько проб, прежде чем удается найти «наилучший» способ классификации логических возможностей для данной проблемы.
Упражнения
родителей имеет гены АА, а гой Аа? Если оба имеют Аа?
Фиг. 29
1.	Постройте дерево для примера 1, если классификация производится в следующем порядке: цвет волос, пол и рост. Сделайте то же самое при таком порядке классификации: пол, рост и цвет волос. Имеются ли другие пути проведения этой классификации?
2.	В 1955 году Доджерс проиграла первые две игры первенства по бейсболу, но окончательно выиграла во всей серии нгр. Сколькими способами может проходить серия игр, если проигрывающая команда выигрывает первые две игры?	[Отв.: 10.]
3.	В генетике типичен следующий процесс: каждый родитель имеет два гена, ответственных за данный признак: АА, Аа или аа. Ребенок наследует по одному гену от каждого родителя. Каковы возможности наследования для ребенка, если оба родителя имеют гены АА? Если один из другой аа? Если один имеет АА, а дру-Постройте дерево процессов наследования.
[Пусть первой стадией будет выбор гена, наследуемого от первого родителя, а второй стадией — выбор гена, \	наследуемого от второго родителя.
)	Сколько различных генетических тн-
/	пов будет в результате представлено
посредством ветвей?]
4.	Часто случается, что генетические типы Аа и АА (см. упр. 3) внешне легко отличимы от типа аа. Какие логические возможности имеются в том случае, когда оба родителя принадлежат к заметно разным типам?
5.	Некий психолог учит крысу пробегать через лабиринт, форма которого показана на фиг. 29. Допустим, что если крыса попадает в тупик, она воз-
вращается к последнему встреченному ею перекрестку и пробует ход, отличный от тех, которым она следовала раньше, но всегда в направлении стрелок. Сколько имеется возможных путей? Сколько их имеется при условии, что крысу останавливают после того, как оиа ошиблась дважды?	[Отв.: 20; 12.]
6.	Произведем эксперимент, подобный схематизированному на фиг. 18. Допустим, что в первой урне имеется два черных и два белых шара, а во второй урне имеется один белый и четыре черных шара. Выбираем одну урну и вынимаем из нее трц шара. Постройте дерево логических возможностей. Сколько здесь имеется случаев?	[Отв.: 10]
§ 6. Деревья логических возможностей
47
7.	Пользуясь деревом, построенным в упр. 6, ответьте на следующие вопросы.
(а)	Во скольких случаях мы вынем три черных шара?
(Ь)	Во скольких случаях мы вынем два черных и один белый шар?
(с)	Во скольких случаях мы вынем три белых шара?
(d)	Сколько случаев остается? Какие это случаи?	[Отв.: 3.]
8.	Сколькими способами могут окончиться встречи между Доджерс и Янки в первенстве по бейсболу (см. фиг. 28), если Доджерс выигрывает первую игру и
(а)	никакая команда не выигрывает две игры подряд;	[Отв.: 1.]
(Ь)	Доджерс выигрывает во всяком случае все игры с нечетными номе-
рами;	[Отв.: 5.]
(с)	команда-победитель выигрывает четыре игры подряд; [Отв.: 4.] (d) команда, потерпевшая поражение, выигрывает четыре игры.
[Отв.: 0.]
9.	Некто предполагает поехать в отпуск в одно из четырех мест. После его приезда погода в каждом из этих мест может улучшиться, ухудшиться
или остаться прежней. Начертите дерево логических возможностей.
10.	Для дерева, построенного в упр. 9, приведите высказывание, которое было бы:
(а)	истинно в половине случаев;
(Ь)	ложно во всех случаях, кроме одного;
(с)	истинно во всех случаях, кроме одного;
(d)	логически истинно;
(е)	логически ложно.
11.	Пусть в упр. 6 мы хотим произвести более грубую классификацию логических возможностей. Какие ветви дерева, построенного в этом упражнении, сольются, если
(а)	нас не интересует, в какой последовательности вынуты шары;
(Ь)	нас не интересует ни последовательность шаров, ни номер выбранной урны;
(с)	нас интересует лишь, какая выбрана урна н одинакового ли цвета вынутые шары.
12.	Решить упр. 7 предыдущего параграфа, пользуясь деревом логических возможностей.
13.	В меню входят: овощной суп или бульон на первое, бифштекс, цыпленок или рыба на второе и компот или мороженое на третье. Полный обед состоит из одного блюда на первое, одного блюда на второе и одного блюда на третье. Нарисовать дерево возможных полных обедов.
(а)	Сколько может быть различных полных обедов?	[Отв.: 12 ]
(Ь)	Сколько может быть полных обедов с бифштексом в качестве вто-
рого?	[Отв.: 4.]
(с)	Сколько может быть полных обедов для человека, который ест мороженое только в том случае, если на второе у него был бифштекс?
[Отв.: 8.]
14.	Пусть С, К и D — три арифметические операции. Операция С заключается в прибавлении 2 к заданному числу. Операция К заключается в возведении данного числа в квадрат, а операция D — есть операция деления на 2. Нарисуйте дерево, показывающее, в каком различном порядке можно выполнять эти операции (каждая операция используется только один раз). Укажите число возможных различных порядков действий,	[Отв : 6.]
48
Гл. I. Составные высказывания
15.	Используйте дерево, построенное в упр. 14, для того, чтобы получить все результаты выполнения трех операций (во всевозможных порядках) над числом 0.
16.	Используя дерево, построенное в упр. 14, покажите, что произойдет при выполнении трех операций в различном порядке над произвольным числом х. Для каждого из 6 случаев выясните, не совпадает ли результат сложной операции с исходным числом х.
§ 7. ЛОГИЧЕСКИЕ ОТНОШЕНИЯ
До сих пор мы рассматривали изолированные высказывания. Но иногда бывает желательно рассмотреть взаимоотношение двух высказываний. Наиболее интересное из таких отношений имет место, когда из одного высказывания (логически) следует другое. Если из р следует q, мы говорим также, что q является следствием р, или что q (логически) выводимо из р. Например, во всякой математической теореме из условий теоремы следует ее заключение.
Исходя из анализа логических возможностей для пары высказываний р и q, отношение следствия можно охарактеризовать таким образом: из р следует q, если q истинно всякий раз, когда истинно р, т. е. если q истинно во всех логически возможных случаях, в которых р истинно.
В случае составных высказываний, имеющих одни и те же компоненты, таблицы истинности дают удобный метод для проверки того, имеет ли место отношение следствия. Фиг. 30 иллюстрирует этот метод.
р	9		Р->9	Р V Q
и	и	и	И	И
и	л	л	Л	и
л	и	л	и	и
л	л	И	И	л
Фиг. 30
Возьмем в качестве посылки р<-> q. Так как это высказывание истинно только в первом и четвертом случаях, и в обоих этих случаях истинно также высказывание р-> q, то мы видим, что из р * -> q следует р -* q. С другой стороны, высказывание р V q в четвертом случае ложно, так что из р <-> q не следует р V q. Аналогично сравнение двух последних столбцов фиг. 30 показы
§ 7. Логические отношения
49
вает, что из высказывания р —» q не следует р V q, из р \/ q не следует p->q.
Между отношением следствия и импликацией имеется тесная связь, но важно не путать эти два понятия. Импликация — это новое высказывание, составленное из двух данных, а следствие— отношение между двумя высказываниями Связь между ними такова: из р следует q тогда и только тогда, когда импликация р -+q логически истинна.
Что это действительно так, доказывается весьма просто. Из высказывания р следует высказывание q, если q истинно всякий раз, когда истинно р. Это означает, что невозможен случай, когда р истинно, a q ложно, т. е. ни в каком случае p->q не будет ложным. Но это в свою очередь означает, что p->q логически истинно. В упр. 1 наш результат будет применен к фиг. 30.
Займемся теперь «парадоксами» импликации. Высказывание с импликацией при отсутствии смысловой связи между его компонентами звучит парадоксально. Например, странно слышать, что высказывание «Если погода ясная, то мел сделан из дерева» истинно в дождливую погоду. Необходимо вспомнить, что приведенная импликация — не более и не менее, как выражение одного из следующих обстоятельств: (1) Погода ясная и мел сделан из дерева или (2) Погода не ясная и мел сделан из дерева, или (3) Погода не ясная и мел не сделан из дерева. [См. фиг. 116.] И в дождливую погоду оказывается верным (3).
Но отнюдь не верно, что из «Погода ясная» следует «Мел сделан из дерева». Логически возможен случай, когда первое из этих высказываний истинно, а второе ложно (в самом деле, так будет при ясной погоде и обычном способе изготовления мела); поэтому отношение следствия не имеет места. Таким образом, хотя цитированная в предыдущем абзаце импликация истинна в определенную погоду, она не является логически истинной. В обычном разговоре утверждение «если..., то...» чаще всего имеет логическую основу. Поэтому всякий раз, когда подобное утверждение оказывается истинным, не будучи логически истинным, оно звучит парадоксально. То же самое можно сказать и о разговорном употреблении «тогда и только тогда».
Если двойная импликация <-> не только истинна, но и логически истинна, то это устанавливает некоторое отношение между Р и q. Поскольку р <-> q истинно в каждом логически возможном случае, значения истинности высказываний р и q одинаковы. При этих обстоятельствах мы говорим, что р и q (логически) эквивалентны. Проверку эквивалентности двух составных высказываний, имеющих одни и те же компоненты, удобно осуществлять при помощи таблиц истинности. Для этого
4 Зак. 994.
50
Гл. /. Составные высказывания
достаточно лишь посмотреть, одинаковы ли таблицы истинности у этих составных высказываний. Из фиг. 31 видно, что p->q эквивалентно ~р V q-
Два высказывания р и q называются несовместимыми, если из истинности одного из них необходимо следует ложность другого. Другими словами, несовместимость высказываний р и q означает, что они никогда не могут оказаться одновременно истинными. Это понятие легко распространить на любое число высказываний: высказывания рх, ръ , рп называются несов-
р	Q		Р V q	местимыми, если не может оказаться, что все они являются одновременно истинными. В частно-сти, одно высказывание (п = 1)
				
и	и	И	и	несовместимо, если оно заклю-
и	л	л	л	чает внутреннее противоречие.
л	и	и	и	Если несколько составных вы-
л	л	и	и	сказываний построены из одних и тех же простых составляющих,
	Фиг. 31			то можно предложить простой ме-
тод проверки их совместимости. Этот метод заключается в том, что нужно построить таблицы истинности для каждого из высказываний и исследовать совокупность одинаковых строк во всех таблицах. Если среди всех строк найдется по крайней мере одна, в которой все составные высказывания истинны (одни только И в левых частях строки), то составные высказывания совместимы. В противном случае они оказываются несовместимыми. Иллюстрация этого метода доставляет фиг. 30. Здесь исследуются три таблицы истинности, и поскольку мы видим, что в первом случае (ему отвечает первая строка таблицы) все составные высказывания истинны, то высказывания р*~> q, p->q и. р\/ q совместимы. Но если мы добавим к этим трем высказываниям еЩе одно, ложное в первом случае (например, ~ р), то эти четыре высказывания уже будут не
совместимыми.
Упражнения
1.	Покажите, что высказывание (/>«—> ?) -»(Р -> q) логически истинно, а (р q) -» (р Vq) — нет.
2.	Докажите, что р эквивалентно q тогда и только тогда, когда из р следует q и из q следует р.
3.	Постройте таблицы истинности следующих составных высказываний:
(а)	Р/ q;
(b)	р-> ~ q;
(с)	~p\l~q\
(d) ~'P\!q-,
(е) рЛ~9
§ 7. Логические отношения
51
Для каких пар имеет место отношение следствия или эквивалентности? [Отв.: (Ь) эквив. (с); из (а) следует (d); из (е) следует (Ь), (с).] 4 Постройте таблицы истинности следующих составных высказываний и расположите их в таком порядке, чтобы из каждого высказывания следовали все стоящие после него:
(а)
(Ь) />->(~р->9);
(С) ~[р-»(?->р)];
(d)	PW,
(е)	^p/\q-,	[Отв.: (с), (е), (a), (d), (b).]
Б. Постройте	составное	высказывание,	эквивалентное р Л q,	используя
только связки и У-
6.	Постройте	составное	высказывание,	эквивалентное р q,	используя
только связки ->и Л । (Ср. с упр. 2.)
7.	Постройте	составное	высказывание,	эквивалентное р\/ q,	используя
только связки и Л ,
8.	Каково наибольшее число утверждений из числа приведенных ниже, в которые может, не впадая в противоречие, поверить один человек? (а) Джо ловкач.
(Ь)	Джо не везет.
(с)	Джо везет, но он не ловкач.
(d)	Если Джо ловкач, то ему не везет.
(е)	Джо является ловкачем в том и только в том случае, если ему везет.
(f)	Либо Джо ловкач, либо ему везет, но не то и другое одновременно. [Отв.: 4.]
9.	Покажите, что пять высказываний, собранных в упр. 3, несовместимы. Можно ли найти среди них четыре совместимых высказывания?
10.	Докажите, что 9 сложных высказываний, составленных из двух одних и тех же простых высказываний р и q, могут быть совместимыми только в том случае, когда среди ннх имеется по крайней мере два эквивалентных высказывания.
11.	Доказать, что если р логически истинно, то
(а)	р \/ q	логически истинно;
(b)	р ! q логически ложно;
(с)	p[\q эквивалентно q-,
(d)	—p\jq эквивалентно q.
12.	Если р и q логически истинны, а г логически ложно, то что можно сказать о высказывании (p\J q)K^rf
[Отв.:. Логически истинно.]
13.	Докажите, что конъюнкция и дизъюнкция высказывания с самим собой эквивалентны самому этому высказыванию.
14.	Докажите, что двойное отрицание высказывания эквивалентно самому высказыванию.
15.	Докажите, что высказывание, из которого следует его отрицание, противоречиво.
*6. Что можно сказать о высказывании, эквивалентном своему отрицанию?
*'• Какое отношение имеет место между двумя логически истинными высказываниями? Между двумя противоречивыми высказываниями?
52
Гл. 1. Составные высказывания
18. Докажите, что логически истинное высказывание следует из любого высказывания и что из противоречивого высказывания следует любое.
19. Воспользовавшись результатами упр. 10 и 11 нз § 4 докажите, что для любого составного высказывания существует эквивалентное ему составное высказывание:
(а) использующее единственную связку I, (Ь) использующее единственную связку ) ,
§ 8*. СИСТЕМАТИЧЕСКИЙ АНАЛИЗ ЛОГИЧЕСКИХ ОТНОШЕНИЙ
Отношение следствия характеризуется невозможностью истинной посылки и ложного заключения; если два высказывания эквивалентны, то невозможно, чтобы одно из них было истинным, а другое ложным. Таким образом, чтобы следствие имело место, должен быть исключен один случай в таблице
р		Случай №
и	и	1
и	л	2
л	и	3
л	л	4
Фиг. 32
истинности для пары высказываний, а для эквивалентности таких исключенных случаев должно быть два (из четырех возможных). Отсутствие одного или более случаев в таблице истинности является характерной чертой логических отношений В этом разделе мы исследуем все отношения между двумя высказываниями, какие только возможны.
Назовем два высказывания несвязанными, если может иметь место каждый из четырех табличных случаев (см. фиг. 26). Два высказывания на
зываются связанными, есЛи из четырех случаев, указанных на фиг. 32, один или более не может иметь место. [Ср. с § 5.]
Если высказывания р и q таковы, что из случаев, представленных на фиг. 32, исключается в точности один, то мы скажем, что эти высказывания связаны простым отношением. Оче-
видно, возможны следующие четыре простых отношения: (а) если исключен случай 1, то высказывания не могут быть истинными одновременно — в этом случае р и q называются несовместимыми, или противоречивыми-, (Ь) если исключен случай 2, то из р следует q (ср. § 7); (с) если исключен случай 3, т. е. случай, когда q истинно, а р ложно, то из q следует р; (d) если исключен случай 4, и, следовательно, высказывания не могут быть ложными одновременно, т. е. одно из них наверное истинно, то высказывания назовем Л-несовместимыми.
Если высказывания р и q таковы, что из представленных на фиг. 26 случаев исключены ровно два, то мы будем говорить, что эти высказывания связаны 2-отношением. Два случая из
§8*. Систематический анализ логических отношений
53
четырех могут быть выбраны шестью способами, но некоторые из них не дают интересных отношений. Например, пусть исключены случаи 1 и 2; тогда р не может быть истинным, т. е. является логически ложным. Аналогично, если исключены случаи 1 и 3, то q логически ложно. С другой стороны, если исключены случаи 3 и 4, то р логически истинно; и если исключены случаи 2 и 4, то q логически истинно. Итак, мы видим, что эти четыре способа выбора двух из четырех случаев не дают нам новых отношений; они означают только, что одно из этих высказываний логически истинно или ложно. Теперь остаются только две возможности: (А) исключены случаи 2 и 3, что означает эквивалентность наших двух высказываний; (В) исключены случаи 1 и 4, что означает невозможность для этих высказываний быть одновременно истинными или ложными — одно из высказываний должно быть истинным, а другое ложным. Тогда мы говорим, что высказывания р и q противоположны.
Легко видеть, что не существует «3-отношений», так как если на фиг. 32 исключить три случая, то для каждого из двух высказываний останется только одна возможность; следовательно, каждое из них должно быть логически истинным или логически ложным.
Мы уже изучили отношения следствия и эквивалентности и отметили их аналогию с импликацией и двойной импликацией. То же самое можно сделать и для трех оставшихся отношений. Если р и q Л-несовместимы, то они не могут быть ложными одновременно; а так как дизъюнкция их была бы ложной только в этом случае, то мы видим, что р и q Л-несов-местимы тогда и только тогда, когда р V q логически истинно. Если р и q несовместимы, то они не могут быть истинными одновременно; так как конъюнкция их истинна только в этом случае, то мы видим, что р и q несовместимы тогда и только тогда, когда р f\q логически ложно. Наконец, если р и q противоположны, то исключены случаи 1 и 4 на фиг. 32; поэтому р *-> q логически ложно. (Заметим также, что если р и q противоположны, то логически истинно p\/q.) Изображенная на фиг. 33 таблица резюмирует наше исследование этих шести отношений.
Л-несовместимость не имеет большого теоретического значения, но несовместимость и противоположность очень важны. Каждое из этих отношений можно обобщить на случай более чем двух высказываний. Мы уже определили выше несовместимость п различных высказываний: она означает, что все эти высказывания не могут быть истинными одновременно, т. е. что конъюнкция этих высказываний представляет собой логически ложное высказывание. С другой стороны, если имеется п
54
Гл. Г Составные высказывания
различных высказываний, из числа которых может быть истинным одно и только одно, то говорят, что эти высказывания образуют полную систему альтернатив. Частными случаями полной системы альтернатив будут: при п — 1 — одно логически истинное высказывание, при п — 2 — пара противоположных высказываний.
Исключенные 1	случаи	Отношения	Другое определение
и—и л—л и—л л—и И—Л и Л—И И—И и Л—Л	Несовместимость Л-несовместимость Из первого следует второе Из второго следует первое Эквивалентность Противоположность	р A q логически ложно р V q логически истинно p->q логически истинно q -> р логически истинно р <—> q логически истинно p^-^q логически ложно
Фиг. 33
Таблицы истинности снова дают нам метод для распознавания отношений между высказываниями. Следующие примеры показывают, как действует этот метод.
Примеры. Рассмотрим представленные на фиг. 34 пять составных высказываний, имеющих одинаковые компоненты. Найдем все отношения, существующие между парами этих высказываний.
р	Q	Р Л9	~Р V !•			р	
и	И	и	л		И	л	И
и	л	л	и		л	л	л
л	и	л	и		и	и	и
л	л	л	и		и	и	и
Номер высказывания		1	2		3	4	5
Ф и г. 34
Прежде всего мы замечаем, что высказывания 3 и 5 имеют одинаковые таблицы истинности, поэтому они эквивалентны. В силу этого достаточно рассматривать только одно из них, скажем, высказывание 3. Высказыва
§8*. Систематический анализ логических отношений
55
ния 1 и 2 имеют прямо противоположные таблицы истинности, поэтому они противоположны. При сравнении высказываний 1 и 3 мы не находим случая И—Л, так что из 1 следует 3. Поскольку 1 и 4 никогда не истинны оба, они несовместимы, тогда как высказывания 2 и 3 не могут быть ложны оба и потому они Л-несовместимы. Наконец, при сравнении высказываний 2 или 3 с высказыванием 4 мы не находим случая Л—И и, таким образом, 2 и 3 следуют из 4. Итак, на фиг. 34 имеются примеры всех шести найденных нами отношений. Заметим еще, что высказывания р и q дают пример пары несвязанных высказываний. [Ср. § 5.]
Упражнения
1. Постройте таблицы истинности следующих четырех высказываний и определите, как связаны между собой высказывания шести образуемых ими пар:
(а)
(Ь)
(с) pf\~q-,
(d) ~(~,р\]д).
[Отв.: (а) и (Ь) независимы; (а) несовместимо с (с), (d); из (с), (d) следует (Ь); (с) эквивалентно (d).]
2. Постройте таблицы истинности для каждого из следующих шести высказываний. С помощью этих таблиц укажите пример пары несвязанных высказываний и пример каждого из шести возможных отношений между высказываниями:
(а)	р <-> q;
(b)	Р q\
(с)
(d) (Рhq)\JРq)-,
(е)
(f) ph~q.
3.	Докажите следующие утверждения.
(а)	Дизъюнкция двух противоположных высказываний логически истинна.
(Ь)	Два высказывания эквивалентны тогда и только тогда, когда из каждого из них следует другое.
(с)	Если два высказывания несовместимы, то противоположные им высказывания Л-несовместимы.
4.	Каким отношением связаны между собой следующие два высказывания:
(a)	p->[pA~(?vr)];
(b)
[Оте.: Эквивалентны.]
56
Гл. 1. Составные высказывания
5.	Пусть любые два из высказываний р, q и г являются несвязанными; кроме того, известно, что для этих трех высказываний таблицы истинности содержат только четыре строки. Докажите, что г эквивалентно либо р <—> q, либо pVq.
6.	Докажите следующие утверждения.
(а)	Если два высказывания эквивалентны, то эквивалентны и противоположные им высказывания.
(Ь)	В полной системе альтернатив любые два высказывания несовместимы.
(с)	Если р и q Л-иесовместимы и если каждое из них влечет г, то г логически истинно.
7.	Выберите полную систему четырех альтернатив из следующих высказываний:
(а)	идет дождь, но нет ветра;
(Ь)	дождь идет тогда и только тогда, когда дует ветер;
(с)	неверно, что идет дождь и дует ветер;
(d)	идет дождь и дует ветер;
(е)	нет дождя и нет ветра;
(f)	неверно, что идет дождь или нет ветра. [Отв.: (a), (d)\ (е)', (f).J
8.	Как связаны высказывание	(? VH V(/’/.s)] и высказывание
~'(рА?ЛгЛ«)?	[Отв.: Л-несовместимы.]
9.	Предположим, что р и q несовместимы. Как тогда связаны
(а)	р и ~
(Ь)	~р и q;
(с)	~р и ~q;
(d)	р и ~р!
10.	Пусть р, q и г — три высказывания, каждые два из которых несвязанные. Исследуйте возможные отношения между этими тремя высказываниями. [Указание. Если не учитывать порядка расположения этих высказываний, таких отношений существует 14. Эти отношения будут самое большее 4-отношениями. Имеются два 4-отношения, а остальные отношения могут быть получены из них путем исключения каких-то недопустимых случаев.]
11.	В § 5 был рассмотрен пример на сравнение двух человек по росту. Допустим, что мы учитываем такие возможности: ниже 5 футов 9 дюймов, 5 футов 9 дюймов, 5 футов 10 дюймов, 5 футов 11 дюймов, 6 футов, выше 6 футов. Мы будем считать, что два человека имеют одинаковый рост, если они при таком анализе попадают в одну и ту же категорию.
(а)	Постройте систему всех возможностей для двух человек, Джима и Билла.
(Ь)	Определите, в каких случаях истинно «Билл выше Джима».
(с)	Определите, в каких случаях истинно «Джим выше Билла».
(d)	Все ли четыре табличные случая для высказываний (Ь) и (с) могут иметь место?
(е)	Как связаны эти два высказывания?
12.	Постройте систему логических возможностей для классификации людей по семейному положению и полу.
(а)	Покажите, что высказывание «если данный субъект холост, то он не женат» логически истинно.
§ 9. Варианты импликации
57
(b)	Покажите, что высказывание «если субъект является старой девой, то этот субъект — мужчина» логически ложно.
(с)	Найдите отношение между высказываниями «данный субъект есть мужчина» и «данный субъект холост».
(d)	Найдите простое высказывание, которое Л-несовместимо с высказыванием «данный субъект есть мужчина», но не образует с ним пару противоречивых высказываний.
§ 9. ВАРИАНТЫ ИМПЛИКАЦИИ
Импликация двух высказываний отличается от их двойной импликации, а также от их дизъюнкции и конъюнкции тем, что она несимметрична. Так, р V q эквивалентно q \/р; p/\q эквивалентно q/\p и p-^->q эквивалентно q-*->p-, но p->q не эквивалентно q->o Последнее высказывание, q р, называется конверсией высказывания р ->q. Многие из наиболее распространенных ошибок в рассуждениях происходят от смешения какого-либо высказывания с его конверсией.
	Импликация	Конверсия импликации	Конверсия контрапозиции	Контрапозиция
р q	P->Q	q->P		
и и	И	И	и	и
и л	Л	И	и	л
л и	И	Л	л	и
л л	и	И	и	и
Фиг. 35
Интересно поэтому рассмотреть те импликации, которые могут быть образованы из высказываний р и q. Таблицы истинности этих четырех импликаций и названия их даны на фиг. 35. Мы замечаем, что p->q эквивалентно •—q->~p. Последнее называется контрапозицией первого. Контрапозиция является очень удобной формой импликации во многих рассуждениях. Аналогично высказывание ~ q представляет собой конверсию контрапозиции. Так как контрапозиция эквивалентна p~>q, то конверсия этой контрапозиции эквивалентна конверсии этой импликации, что можно видеть на фиг. 35.
Если обращение с импликацией усваивается с большим трудом, чем обращение с прочими связками, это вызвано, быть может, отсутствием симметрии, а возможно также и тем, что
58
Гл. I. Составные высказывания
способы для выражения импликации очень разнообразны. Во многих случаях только тщательный анализ условного высказывания в состоянии решить, имеет ли в виду субъект, делающий такое утверждение, данную импликацию или ее конверсию. Конечно, иногда он имеет в виду и то, и другое, т. е. двойную импликацию. (См. упр. 5.)
Высказывание «Я пойду гулять только в том случае, если будет солнечный день», является вариантом условного высказывания с импликацией. Высказывание, имеющее форму «р, только если q» тесно связано с высказыванием «Если р, то q», но как именно? Фактически оба выражают одну и ту же мысль. Высказывание «р, если только q» констатирует, что «Если ~ q, то ~ р», поэтому оно эквивалентно «Если р, то q». Таким образом, высказывание, приведенное в начале этого абзаца, эквивалентно высказыванию «Если я пойду гулять, то будет солнечный день»
Другими примерами фраз, означающих условное высказывание, могут служить постоянно упоминаемые математиками «необходимое условие» и «достаточное условие». Сказать, что р является достаточным условием для q, означает то же самое, что сказать: если имеет место р, то q также будет иметь место. Таким образом, предложение «р является достаточным условием для 9» эквивалентно предложению «Если р, то q».
Подобным же образом предложение «р является необходимым условием для q» эквивалентно «q, только если р» Так как нам известно, что последнее эквивалентно «Если q, то р», мы приходим к заключению, что утверждение необходимого условия является конверсией утверждения достаточного условия.
Наконец, если сделано как условное высказывание, так и его конверсия, то тем самым сделано высказывание двойной импликации. Итак, утверждение «р является необходимым и достаточным условием для q» эквивалентно утверждению «р, если и только если q».
Упражнения
1.	Пусть р означает «Я сдам этот экзамен», a q означает «Я буду регулярно выполнять домашние задания». Запишите в символической форме следующие высказывания.
(а)	Я сдам этот экзамен только в том случае, если буду регулярно выполнять домашние задания.
(Ь)	Регулярное выполнение домашних заданий является необходимым условием того, что я сдам этот экзамен.
(с)	Сдача этого экзамена является достаточным условием того, что я регулярно выполнял домашние задания.
(d)	Я сдам этот экзамен в том и только том случае, если я буду регулярно выполнять домашние задания.
§ 9. Варианты импликации
59
(е)	Регулярное выполнение домашних заданий есть необходимое и достаточное условие для того, чтобы я сдал этот экзамен.
2.	Взяв высказывание п. (а) предыдущего упражнения, образуйте его конверсию, контрапозицию и конверсию этой контрапозиции. Выразите каждое из них как в словесной, так и в символической форме.
3.	Пусть р означает «Идет снег», a q означает «Поезд опаздывает». Выразите следующие высказывания в символической форме.
(а)	Выпадение снега является достаточным условием для опоздания поезда.
(Ь)	Выпадение снега является необходимым и достаточным условием для опоздания поезда.
(с)	Поезд опаздывает только в случае, когда идет снег.
4.	Взяв высказывание п. (а) предыдущего упражнения, образуйте его конверсию, контрапозицию и конверсию его контрапозиции. Выразите каждое из них в словесной форме.
Б. Докажите, что конъюнкция импликации и ее конверсии эквивалентна двойной импликации.
6.	Чему эквивалентна конъюнкция контрапозиции и ее конверсии?
7.	Докажите, что
(а)	~ -V- р эквивалентно р;
(Ь)	контрапозиция контрапозиции эквивалентна первоначальной импликации. -
8.	«Для того чтобы матрица имела обратную матрицу, необходимо, чтобы ее определитель был отличен от нуля». Какие из приведенных ниже высказываний следуют из этого? [Никакого знания теории матриц здесь не требуется.]
(а)	Для того чтобы матрица имела обратную, достаточно, чтобы ее определитель был равен нулю.
(Ь)	Для того чтобы определитель матрицы был отличен от нуля, достаточно, чтобВ! эта матрица имела обратную.
(с)	Для того чтобы определитель матрицы был равен нулю, необходимо, чтобы эта матрица не имела обратной.
(d)	Матрица имеет обратную тогда и только тогда, когда определитель ее не равен нулю.
(е)	Определитель матрицы равен нулю тогда только, когда эта матрица ие имеет обратной.
[Отв.: (Ъ), (с), (е).]
9.	«Дифференцируемая функция непрерывна». Это высказывание истинно для всех функций, но конверсия его не всегда истинна. Какое нз следующих высказываний будет истинным для всех функций? [Никакого знания теории функций здесь не требуется.]
'(а) Функция дифференцируема только в случае ее непрерывности.
(Ь)	Функция непрерывна только в случае ее дифференцируемости.
(с)	Дифференцируемость функции есть необходимое условие ее непрерывности.
(d)	Дифференцируемость функции есть достаточное условие ее непрерывности.
(е)	Дифференцируемость функции есть необходимое и достаточное условие ее дифференцируемости.
[Отв.: (a), (d), (е).]
10.	Доказать, что отрицание высказывания «р есть необходимое и достаточное условие для д» эквивалентно высказыванию «р есть необходимое и достаточное условие для ~ д».
60
Гл. I. Составные высказывания
§ 10. ПРАВИЛЬНЫЕ АРГУМЕНТЫ
Одной из важнейших задач логика является проверка аргументов. Под аргументом мы будем понимать утверждение того, что некоторое высказывание (заключение) следует из других высказываний -(посылок). Аргумент будет называться правильным тогда и только тогда, когда из конъюнкции посылок следует заключение, т. е. всякий раз, когда все посылки истинны, заключение также является истинным.
Важно иметь в виду, что постольку, поскольку речь идет лишь о проверке правильности аргумента, истинность самого заключения для нас не существенна. Истинность заключения не является ни необходимым, ни достаточным условием правильности аргумента. Это видно из следующих двух примеров, которые также показывают форму записи аргументов, используемую нами в дальнейшем: сначала мы выписываем посылки, затем под ними проводим черту и пишем заключение.
Пример 1.
Если Шекспир — великий драматург, то его произведения ставятся в театрах.
Но произведения Шекспира ставятся в театрах.
Следовательно, Шекспир — великий драматург.
Конечно, это заключение истинно. Однако этот аргумент неправилен, потому что заключение не следует из этих двух посылок.
Пример 2.
Хорошие стихи обладают рифмами
Уолт Уитмен писал стихи.
В стихах Уитмена рифмы отсутствуют.
Следовательно, стихи Уитмена не хороши.
Здесь заключение ложно, но аргумент правилен, ибо заключение следует из посылок. Парадокс исчезает, если мы заметим, что первая посылка ложна. Не удивительно, что из ложных посылок корректным путем выводится ложное заключение.
Если аргумент правилен, то из конъюнкции посылок следует заключение. Таким образом, если все посылки истинны, то заключение также будет истинным Но если одна или более из посылок окажется ложной, так что конъюнкция всех этих посылок ложна, то заключение может быть либо истинным, либо ложным. Может быть и так, что все посылки ложны, заключение истинно и аргумент правилен, как показывает следующий пример.
§ 10. Правильные аргументы
61
Пример 3.
Все собаки имеют по две ноги.
Все двуногие животные плотоядны.
Следовательно, все собаки плотоядны.
Здесь аргумент правилен и заключение истинно, но обе посылки ложны!
Каждый из этих примеров подчеркивает тот факт, что ни значения истинности, ни содержание высказываний, встречающихся в аргументе, не влияют на его правильность.
Вот две формы правильных аргументов:
p-*q р
Символ . . означает «следовательно». Таблицы истинности для этих форм аргументации представлены на фиг. 36.
р	«	р->ч	р	я	Р ->9	~9	р
и	и	и	и	и	и	л	л
и	л	л	и	л	л	и	л
л	и	и	л	и	и	л	и
л	л	и	л	л	и	и	и
Фиг. 36
Для первого из наших двух аргументов мы видим и из таблицы, что обе посылки истинны только в одном случае, а именно в первом, и в этом случае заключение истинно, так что этот аргумент правилен. Подобным же образом во втором аргументе обе посылки истинны в одном лишь четвертом случае, и в этом случае заключение также истинно, так что и этот аргумент правилен.
Аргумент, не являющийся правильным, называется ложным выводом. Примерами ложных выводов могут служить следующие две (достаточно распространенные!) формы аргументации:
p-+q q
62
Гл. I. Составные высказывания
В первом ложном выводе обе посылки истинны в первом и третьем случае изображенной на фиг. 36 таблицы, однако в третьем случае заключение ложно, так что этот аргумент неправилен (именно эта форма была рассмотрена в примере 1). Подобным же образом, во втором ложном выводе обе посылки истинны в двух последних случаях, однако в третьем случае заключение ложно.
Правильность аргумента не зависит от того, что представляют собой его компоненты, и, таким образом, определяется только его формой. Таблицы истинности, собранные на фиг. 36, показывают, что при истинности обеих посылок заключения наших первых двух аргументов также истинны. Для случая приведенных выше ложных выводов таблицы истинности показывают, что можно сделать обе посылки истинными, не делая при этом истинным заключение, а именно, взяв р ложным, a q истинным.
Пример 4. Рассмотрим следующий аргумент:
Р~*Я
На первой, пятой, седьмой и восьмой строках этой таблицы обе посылки истинны. Так как в каждом из этих случаев заключение также истинно, то этот аргумент правилен. (Пример 3 может быть записан в такой форме.)
§ 10. Правильные аргументы
63
Упражнения
1.	Проверьте правильность следующих аргументов:
(a) p^q Р
• '• q
(b) p\/q ~Р
,‘.q
.'.~q
[Отв.: (а), (Ь) правильны.]
2.	Проверьте правильность следующих аргументов:
(a) p->q	(b) p->q
^q->^r	~Г->~д
.'.Г-+Р	'-,.-^r-+~p
[Отв.: (b) правилен.]
3.	Проверьте правильность аргумента
P+-*q qVr г
. •. ~ р	[Отв.: Неправилен.]
4.	Проверьте правильность аргумента
Р lq ~q-+r ~p\J~r
5.	Проверьте правильность аргумента
P->q
p,\~r s
6-	Даны посылки р ->q и г q. Мы хотим найти правильное за-ключение, содержащее в себе риг (если такое найдется).
(а)	Постройте таблицы истинности обеих посылок.
(Ь)	Отметьте случаи, в которых заключение должно быть истинным.
(с)	Постройте таблицу истинности комбинации, состоящей только из р и г, ставя И там, где это необходимо.
(d)	Заполните оставшуюся часть этой таблицы истинности буквой Л.
(е)	Какая комбинация из р и г имеет такую таблицу истинности? (Это будет некоторое правильное заключение.)	[Отв.: pVr.j
7.	Покажите, что метод, предложенный в упр. 6, всегда годится для того, чтобы получить заключение о связи между двумя данными переменными. Докажите, что этот метод позволяет получить самое сильное из всех возможных утверждений (в том смысле, что из него следует каждое другое подобное утверждение).
64
Гл. I. Составные высказывания
8.	С помощью метода, описанного в упр. 6, получите заключение о связи между р и q из следующего аргумента:
Р~+г
~Г \f 8
? ? ?
9.	С помощью метода, описанного в упр. 6, получите заключение о связи между р и q из следующего аргумента:
Q->r
г	)
~	S)
р \/~и
? ? ?
10.	С помощью метода, описанного в упр. 6, найдите наиболее сильное заключение о связи между высказываниями «Я сдам этот экзамен» и «Я буду заниматься», исходя из следующей аргументации:
Если мне повезет, то я сдам этот экзамен.
Либо я буду заниматься, либо мне повезет (но не то и другое одновременно).
11.	Представьте в символической форме следующий аргумент и проверьте его правильность:
Если этот курс хорош, то он полезен.
Или экзаменатор снисходителен, или этот курс бесполезен.
Но экзаменатор не снисходителен.
Следовательно, этот курс плох.
[Отв.: Правильный.]
12.	Представьте в символической форме следующий аргумент и проверьте его правильность:
«Для того чтобы перейти на следующий курс, достаточно сдать этот предмет по крайней мере иа «удовлетворительно». Я сдам этот предмет лишь в том случае, если разберусь в доказательстве теоремы о зависимости решения дифференциального уравнения от параметра. [Разумеется, для понимания аргументации совершенно не нужно знать, про какую теорему идет здесь речь.] Но я не в состоянии разобрать доказательство этой теоремы. Следовательно, я перейду на следующий курс.
13,	Представьте в символической форме следующий аргумент и проверьте его правильность:
«Отец хвалит меня только тогда, когда я сам могу быть доволен собой. Или я успешно занимаюсь спортом, или я ие могу быть собой доволен. Если я плохо учусь, то я не могу успешно заниматься спортом. Следовательно, если отец меня хвалит, то я учусь неплохо».
14.	Следующее рассуждение дополните заключением, которое превратило бы его в правильный аргумент. [Адаптировано по Льюису Кэрролу1)-]
*) К- Л. Д о д ж с о и (литературный псевдоним Льюис Кэррол) — известный деятель математического просвещения в Англии и популяризатор математической логики, одновременно — автор очень популярных во всем мире (в первую очередь—в странах английского языка) сказок «Алиса в стране чудес», «Алиса в Зазеркальи».
§11. Косвенный метод доказательства
65
«Если он пойдет в гости, го он должен не забыть причесаться. Для того чтобы элегантно выглядеть, необходимо быть опрятным. Если он курит опиум, то он не может владеть собой.
Если он причешется, то будет выглядеть элегантно.
Он наденет белые лайковые перчатки только в том случае, если он пойдет в гости.
Если он не владеет собой, то этого достаточно для того, чтобы выглядеть неопрятно.
Поэтому...»
§ II». КОСВЕННЫЙ МЕТОД ДОКАЗАТЕЛЬСТВА
Доказательство — это аргумент, показывающий, что условное высказывание вида p->q логически истинно. (Именно, р есть конъюнкция посылок, a q—заключение аргумента.) Иногда удобнее бывает показать, что логически истинно некоторое эквивалентное исходному условное высказывание.
Пример 1. Пусть х и у — целые положительные числа.
Теоре'м а. Если ху — нечетное число, то х и у оба не-четные.
Доказательство. Предположим противное, т. е. что х и у не оба нечетные. Тогда одно из них должно быть четным, скажем х = 2z. Тогда ху — 2zy будет четным, вопреки предположению. Тем самым наша теорема доказана.
Пример 2. «Он не знает прозвища декана факультета; следовательно, он не может быть студентом этого факультета. Почему? Потому чтох все студенты этого факультета называют декана (за его спиной) его прозвищем. Следовательно, если бы он действительно был студентом факультета, то он наверное знал бы прозвище декана».
Можно дать простые примеры одной весьма общей формы аргументации, часто используемой как в математических, так и в повседневных рассуждениях. Попробуем раскрыть эту форму. Дано: ху — нечетное число.	Он не знает прозвища декана [р].
Доказать: х и у оба нечетные числа. Он не является студентом факультета [^].
Предположим: х и у не оба нечет- Он является студентом факультета ные числа.	[~ д].
Тогда: ху четное число.	Он должен знать прозвище декана
[~Д].
Таким образом, мы делаем предположение, противоречащее заключению, и получаем посредством правильного ’ аргумента результат, противоречащий предположению. Это и есть одна из форм косвенного метода доказательства.
5 Зак. 994.
66
Гл. I. Составные высказывания
Резюмируем: мы хотим показать, что импликация p->q логически истинна; в действительности мы показываем, что логически истинна контрапозиция ~ q —>—р. Поскольку эти два высказывания эквивалентны, то наша процедура правильна.
Существуют некоторые другие важные варианты этого метода доказательства. Легко проверить, что следующие высказывания имеют ту же таблицу истинности, что и импликация p-^-q (т. е. эквивалентны ей):
(1)
(2)	(P/\~q)-*q,
(3)	(рЛ~?)-*(гЛ~г).
Первое из них показывает, что при косвенном методе доказательства можно вместе с противоречащим допущением ~ q пользоваться первоначальной гипотезой. Второе показывает, что можно также использовать это двойное предположение в прямом доказательстве заключения q. Третье показывает, что если это двойное предположение р и ~ q ведет к противоречию вида г Л — Л то доказательство первоначального высказывания выполнено. Эту последнюю форму косвенного доказательства часто называют приведением к абсурду (reductio ad absurdum).
Эти последние формы весьма полезны по следующим причинам. Во-первых, мы видим, что в качестве гипотезы в дополнение к р всегда можно брать и ~ q. Во-вторых, мы видим, что, кроме q, имеются два других заключения (~ р или некоторое противоречие), которыми мы имеем право заменить заключение q.
Упражнения
1.	Постройте косвенные доказательства следующих утверждений:
(а) Если № нечетно, то х нечетно (х— целое число).
(Ь), Чтобы сдать этот экзамен, я должен регулярно выполнять домашние задания.
(с) Если он хорошо знает математику, то он не преподает в нашей школе.
2.	Произведите символический анализ следующего аргумента: «Если он хочет достигнуть цели, он должен много знать и быть удачливым. Ибо если он не обладает обширными знаниями, то он ие сможет достигнуть цели; если же он не удачлив, то он обязательно где-нибудь сорвется».
3.	Постройте косвенные доказательства следующих утверждений:
(а)	если p\/q и ~ q, то р;
(Ь)	если и q->~r и г, то р.
4.	Произведите символический анализ следующего аргумента:
«Если Джонс — убийца, то ему точно известны время смерти Смита и чем он был убит. Поэтому, если он не знает, когда умер Смит нли не знает, чем он был убит, то он не является убийцей».
g 12*. Применения к переключательным схемам
67
5.	Убедитесь, что приведенные выше формы (1), (2) и (3) эквивалентны p~>q.
6.	Дайте пример косвенного доказательства какого-нибудь высказывания, где бы из р и выводилось некоторое противоречие.
7.	Напишите высказывание, эквивалентное	и выраженное в тер-
минах ~р, и ~г. Укажите, как оно может быть использовано в доказательствах с двумя посылками,
§ 12*. ПРИМЕНЕНИЯ К ПЕРЕКЛЮЧАТЕЛЬНЫМ СХЕМАМ
Теория составных высказываний имеет много применений вне чистой математики. В качестве примера мы изложим теорию простых переключательных схем.
Переключательная сеть представляет собой устройство из проводов и переключателей, связывающих полюсы Л и Т2. Каждый переключатель может быть «разомкнут» илй «замкнут». Разомкнутый переключатель препятствует прохождению
Т,*--------0--------_Тг
{<0----=®7г
Фиг. 38
Фиг. 39
электрического тока, а замкнутый пропускает ток. Мы хотим решить следующую задачу: зная, какие переключатели в данной сети замкнуты, определить, будет ли проходить ток от Tt к Т2.
На фиг. 38 изображена простейшая сеть, в которой зажимы связаны единственным проводом, содержащим переключатель Р. Если Р замкнут, то между зажимами будет протекать ток; в противном случае тока не будет. Сеть на фиг. 39 имеет два переключателя Р и Q, соединенных «последовательно». В этом случае ток протекает лишь тогда, когда замкнуты как Р, так и Q.
Чтобы показать, каким образом сформулированная выше задача может быть решена с помощью нашего логического анализа, сопоставим с каждым переключателем некоторое высказывание. Пусть р означает «переключатель Р замкнут» и q означает «переключатель Q замкнут». Тогда сеть на фиг. 38 будет пропускать ток в том и только том случае, если р истинно. Аналогично сеть на фиг. 39 будет пропускать ток в том и только том случае, если истинно как р, так и q, т. е. истинно р /\q. Таким образом, первая схема представлена посредством р, а вторая — посредством р /\ q.
На фиг. 40 изображена сеть с «параллельным» соединением переключателей Р и Q. В этом случае ток будет проходить, если
5*
68
Гл. I. Составные высказывания
замкнут один или другой из переключателей Р и Q, и данная схема может быть представлена высказыванием р V q-
Изображенная на фиг. 41 сеть представляет собой комбинацию последовательного и параллельного типов соединения переключателей. Верхняя ветвь этой сети представлена высказыванием р /\q, а нижняя — высказыванием г Л s; следовательно, всю схему представляет (р Л ?) V (г As). Так как всех переключателей четыре и каждый может быть либо разомкнут, либо замкнут, то имеется 24 = 16 возможных установок переключателей. Подобным же образом высказывание (р Д q) \/ (г Д s) зависит от четырех переменных, так что его таблица истинности
Фиг 40
Ф н г. 41
содержит 16 строк. Установки переключателей, при которых имеет место прохождение тока, соответствуют тем строкам этой таблицы истинности, при которых наше составное высказывание истинно.
Переключатели не всегда действуют независимо друг от друга. Два или более из них можно связать таким образом, чтобы они размыкались и замыкались одновременно. Чтобы показать это на чертеже, условимся обозначать все идентичные (т. е. замкнутые или разомкнутые одновременно) переключатели одной и той же буквой. Два переключателя можно спарить, причем таким образом, что, когда один из них замкнут, другой будет разомкнут. На чертеже будем обозначать первый из них через Р, второй через Р'. Тогда высказывание «Р замкнут» истинно тогда и только тогда, когда высказывание «Р' замкнут» ложно. Следовательно, если р означает высказывание «Р замкнут», то ~р означает высказывание «Р' замкнут».
Пример такой схемы дает фиг. 42. Соответствующее составное высказывание имеет вид [/» V (~р Л ~ <?)] V [р Л q] Так как это высказывание ложно, только если р ложно и q истинно, ток не будет проходить только тогда, когда Р разомкнут и Q замкнут. Можно проверить это и непосредственно. Если Р замкнут, ток пойдет через верхнюю ветвь независимо от установки Q. Если разомкнуты оба переключателя, то Р' и Q' будут замкнуты и ток пойдет через среднюю ветвь. Но если Р разомкнут и Q замкнут, то никакая ветвь не будет пропускать ток.
Отметим, что мы ни разу не приняли во внимание прохождение тока через нижнюю ветвь Логическим выражением этого
§ 12*. Применения к переключательным схемам
69
обстоятельства является то, что высказывание, соответствующее этой сети, эквивалентно высказыванию [р V (—Р Л—^)],
которому в свою очередь соответствуют две верхние ветви на фиг. 42. Таким образом, электрические свойства схемы, изображенной на фиг. 42, останутся прежними, если нижнюю ветвь убрать.
Рассмотрим, наконец, задачу построения переключательной схемы с наперед указанными свойствами. Эквивалентная проблема, которая была решена в § 4, состоит в построении со-
ставного высказывания с заданной таблицей истинности. Как и в том разделе, мы ограничимся высказываниями с тремя переменными, хотя наши методы легко перенести и на общий случай.
В § 4 мы развили общий ме
Ф и г. 42
тод нахождения высказывания
с заданной таблицей истинности, не состоящей целиком из Л. (Схема, соответствующая высказыванию с таблицей истинности,
состоящей из одних Л, вообще не проводит тока и потому не представляет интереса.) Каждое такое высказывание может быть построено в виде дизъюнкции основных конъюнкций. Так
как основные конъюнкции имеют форму р /\q /\ г, р /\q Д .— г и т. д., то каждая из них будет представлена посредством схемы, состоящей из трех последовательно соединенных переключателей, и будет называться основной последовательно соединенной схемой. Дизъюнкция некоторых таких основных конъюнкций будет тогда представлена посредством схемы, полученной парал-
лельным соединением основных последовательно соединенных схем. Полученная в результате сеть не будет, вообще говоря, самой простой из всех сетей, удовлетворяющих данным требованиям, но этот метод всегда достаточен для нахождения одной такой сети.
Пример. Комитет из трех человек хочет применить электрическую схему для регистрации тайного голосования простым большинством голосов. Построим такую схему, чтобы каждый член, голосующий «за», нажимал кнопку и не нажимал ее, если он голосует против, и чтобы в случае, если большинство членов комитета проголосует
«за», загоралась сигнальная лампочка.
Пусть р означает высказывание «Первый член комитета голосует „за”», q означает высказывание «Второй член комитета голосует „за”» и г означает высказывание «Третий член комитета голосует „за”». Таблица истинности
70
Гл. I. Составные высказывания
высказывания «Большинство членов комитета голосует „за”» приведена на фиг. 43. Пользуясь этой таблицей,
р	Q	т	Желаемое значение истинности	Соответствующая основная конъюнкция
И	и	и	и	р Л q Л Г
И	и	л	и	рЛ qЛ ~г
и	л	и	и	р /\~q Л г
и	л	л	л	p/\~q К~г
л	и	и	и	~РЛ qЛ г
л	и	л	л	~Р Г q Г\~Г
л	л	и	л	~Р /\^q Л Г
л	л	л	л	
Фиг. 43
можно следующим образом записать искомое составное высказывание:
(р /\q Л г) V (Р f\q Л ~г) V (р Л г) V (~РЛ </Лг).
Фиг. 44
Схема, требуемая для реализации этой процедуры голосования, изображена на фиг. 44.
Упражнения
1 Какой схеме соответствует логически истинное высказывание? Приведите пример.
§ 12*. Применения к переключательным схемам
71
2.	Постройте сеть, соответствующую высказыванию
[(PA~9)V(~PA9)]V(~PA~9).
3.	Посредством какого составного высказывания может быть представлена схема, изображенная на фиг. 45?
Ф и г. 45
4.	Постройте таблицу истинности для высказывания из упр. 3. Что она говорит нам об этой схеме?
5.	Придумайте схему с теми же свойствами, что и схема упр. 3, но более простую.
6.	Постройте сеть, соответствующую высказыванию
[(А V 9) Л ~ г] V [(~ Р Л г) V ?].
7.	Постройте простейшую сеть, эквивалентную изображенной на фиг. 42.
8	Постройте цепь для «электрифицированной версии» известной игры с монетами: «По установленному сигналу каждый игрок замыкает или размыкает переключатель, находящийся под его управлением. Если оба делают одно и то же, то выигрывает игрок А; если же они делают противоположное, то выигрывает В». Постройте такую схему, чтобы, в случае, когда выигрывает А, зажигался свет.
9.	Требуется, чтобы в большом зале можно было включать и выключать свет при помощи любого из четырех переключателей, расположенных на четырех стенах. Это осуществимо путем конструирования схемы, в которой свет включается, когда замкнуто четное число выключателей, и выключается, когда замкнуто нечетное число переключателей. (Почему это решает задачу?) Придумайте такую схему.
10.	Комитет состоит из пяти членов. Решения выносятся большинством голосов; однако, если председатель голосует «против», решение не может быть принято (т. е. для того чтобы решение было принято, необходимо, чтобы председатель голосовал «за»). Постройте такую схему, чтобы голосование каждого члена комитета за принятие решения производилось путем нажатия кнопки и чтобы свет загорался в том и только том случае, если решение принято.
И. Группа кандидатов держит экзамен, состоящий из четырех вопросов, требующих установить истинность или ложность определенных утверждений. Постройте такую схему, чтобы кандидат мог отвечать, нажимая кнопки, соответствующие тем вопросам, на которые он хочет дать ответ «истинно», и чтобы эта схема показывала число правильных ответов.
[Указание. Взять пять лампочек соответственно числам 0, 1, 2, 3, 4 правильных ответов.]
12. Разработать способ составления таблиц истинности с помощью переключательных схем.
п
Гл. I. Составные высказывания
ЛИТЕРАТУРА ДЛЯ ДОПОЛНИТЕЛЬНОГО ЧТЕНИЯ
Тарский А., Введение в логику и методологию дедуктивных наук, М., ИЛ, 1948, гл. I и II.
Гильберт Д. и Аккерман В., Основы теоретической логики, М., ИЛ, 1947, гл. I.
Новиков П, С., Элементы математической логики, М., Физматгиз, 1959, гл. I.
Кальбертсон Дж. Т., Математика и логика цифровых устройств, М., Учпедгиз (в печати), гл. V, VII, VIII.
Беркли Э., Символическая логика и разумные машины, М.. ИЛ, 1961, гл. 1—6.
Шестаков В. И., Математическая логика н автоматика, Математика в школе, № 6, 1958; № 1, 1959.
Глава II
МНОЖЕСТВА И ПОДМНОЖЕСТВА
§ 1. ВВЕДЕНИЕ
Множеством принято называть вполне определенную совокупность объектов. Рассматриваемое во всей своей общности, это понятие исключительно важно для математики, ибо всю математику можно построить на его основе.
Различные предметы меблировки данной комнаты образуют некоторое множество. То же самое можно сказать про книги данной библиотеки или про целые числа Между 1 и 1 000 000, или про всевозможные идеи, которые имело человечество, или про людей, которые жили, живут и будут жить между одним миллиардом лет до нашей эры и десятью миллиардами лет нашей эры. Все эти примеры служат примерами конечных множеств, т. е. множеств, имеющих конечное число элементов. Множества, рассматриваемые в этой книге, как правило, будут конечными множествами.
Имеется два существенно различных способа задания множеств. Можно либо указать правило для определения того, принадлежит или не принадлежит рассматриваемому множеству любой данный объект, либо дать полный перечень элементов этого множества. Первый способ мы назовем описанием множества, а второй способ — перечислением множества. Например, одно и то же множество из четырех человек мы можем определить или как (а) участников музыкального квартета, выступавшего накануне вечером в городе, или как (Ь) людей по фамилиям Джонс, Смит, Браун и Грин. Элементы перечисляемого множества принято заключать в скобки; соответственно этому только что определенное множество запишется так: {Джонс, Смит, Браун, Грин}.
Нас часто будут интересовать множества логических возможностей, потому что анализ таких множеств может сыграть основ
74
Гл. II. Множества и подмножества
ную роль при решении той или иной проблемы. Предположим, например, что нас интересуют результаты трех участников математической олимпиады (назовем их А, В и С). Пусть на олимпиаде были предложены задачи по арифметике, по алгебре, по геометрии и логическая задача; при этом по условиям соревнования учитывается лишь результат участника, решившего данную задачу первым. Предположим еще, что участник В не пытался решить задачу по арифметике, которой он владеет сравнительно слабо, а участник С не решил геометрическую задачу. Перечень всех логических возможностей собран в таблице, изображенной на фиг. 46. Так как арифметическую и геометрическую задачу могут решить один из двух участников, а алгебраическую и логическую — три (мы считаем, что соревнование продолжается до тех пор, пока все задачи не будут решены), то всего имеется 2-2-3*3 = 36 различных логических возможностей.
Множество, состоящее из некоторых элементов другого множества, называется подмножеством этого последнего множества. Например, множество тех логических возможностей на фиг. 46, для которых истинно высказывание «участник А решил первым по меньшей мере три задачи», является подмножеством множества всех логических возможностей. Это подмножество можно также задать путем перечисления его элементов: {В 1, В2, ВЗ, В4, В7, В13, В19}.
С целью изучения всех подмножеств данного множества введем следующую терминологию. Исходное множество мы будем называть универсальным множеством; подмножества, содержащие один элемент, будут называться единичными множествами; множество, вовсе не содержащее никаких элементов, будет называться пустым множеством. В качестве примера возьмем универсальное множество 21, состоящее из трех элементов {а, Ь, с}. Собственные подмножества И суть те множества, которые содержат некоторые, но не все элементы 21. Этими собственными подмножествами являются три множества из двух элементов {a, ty, £«, с} и {Ь, с} и три единичных множества {а}, {&} И'{^}. Для полноты картины мы рассматриваем универсальное множество как подмножество (но не собственное!) самого себя и также считаем подмножеством множества U пустое множество О, не содержащее .никаких элементов U. С первого взгляда может показаться странным, .что мы включаем в число подмножеств 21 множества 21 ,и О.. Основания для .такого включения станут ясными впоследствии.
Мы видим, что рассмотренное .нами множество 22 из трех элементов имеет 8 = 23 подмножеств. Вообще множество из п элементов имеет 2" подмножеств, что можно показать следующим
Участник соревнования» первым решивший
Номер возможности	арифметическую задачу	алгебраическую задачу	геометрическую задачу	логическую задачу
В1	А	А	А
В2	А	А	А
ВЗ	А	А	А
В4	А	А	В
В5	А	А	В
В6	А	А	В
В7	А	В	А
В8	А	В	А
В9	А	В	А
В10	А	в	В
В11	А	в	В
В12	А	в	В
В13	А	с	А
В14	А	с	А
В15	А	с	А
В16	А	с	В
В17	А	с	В
В18	А	с	В
В19	С	А	А
В20	С	А	А
В21	С	А	А
В22	С	А	В
В23	С	А	В
В24	С	А	в
В25	С	в	А
В26	С	В	А
В27	С	в	А
В28	С	в	В
В29	С	в	В
ВЗО	с	в	В
В31	с	с	А
В32	с	с	А
ВЗЗ	с	с	А
В34	с	с	В
В35	с	с	В
В36	с	с	В
Фиг. 46
ow>oeo>nto>r>tn>r>n3>oto>ow>r>co>ote>oco>nto>oco>
76
Гл. 11. Множества и подмножества
образом. Будем строить подмножества Р множества 21, рассматривая по очереди каждый элемент 21 и решая, включать ли его в это подмножество. Если мы решим включить в Р каждый элемент из 21, то получим универсальное множество, а если мы решим не включать в Р никакого элемента, то получим пустое множество О. Большей частью включенными в Р окажутся некоторые, но не все элементы, и тогда будут получены собственные подмножества множества 21. Мы должны принять п решений, по одному для каждого элемента множества, и для каждого решения должны сделать выбор из двух альтернатив. Имеется 2 • 2 • • • 2 = 2" способов принятия таких решений — это и есть число тех различных подмножеств множества 21, которые могут быть построены. Отметим, что наша формула не была бы столь простой, если бы в число подмножеств 21 мы не включили универсальное множество и пустое множество
В рассмотренном примере исходов математической олимпиады имеется 236, или около 70 миллиардов, подмножеств. Разумеется, в практической задаче мы не можем справиться с таким большим числом подмножеств. К счастью, нас обычно интересуют лишь немногие подмножества. Наиболее интересными подмножествами являются те, которые можно задать с помощью простого правила, вроде «Множество всех тех логических возможностей, при которых участник С не решил (первым) по меньшей мере две задачи». Дать простое описание подмножества {Bl, В4, В14, ВЗО, В34} было бы трудно. С другой стороны, в следующем параграфе мы увидим, как можно определить новые подмножества, исходя из определенных ранее подмножеств.
Примеры. Проиллюстрируем два различных способа задания множеств, используя пример с тремя участниками олимпиады. Пусть универсальное множество 21 состоит из логических возможностей, перечисленных в таблице на фиг. 46.
1.	Указать подмножество, характеризуемое тем, что участник В решил (первым) большее число задач, чем каждый из его соперников. Ответ: {В 11, В12, В17, В23, В26, В28, В29}.
2.	Указать подмножество, характеризуемое тем, что две задачи решил один участник и две другой. Ответ: {В5, В8, В10, В15, В21, ВЗО, В31, В35}.
3.	Описать множество {Bl, В4, В19, В22}. Ответ: Множество тех возможностей, при которых А решил алгебраическую и логическую задачи.
§ 1. Введение
77
4.	Каким образом можно описать множество {В 18, В24. В27}? Ответ: Множество тех возможностей, при которых С решил логическую задачу, а три остальных задачи решили разные участники соревнования.
У пражнения
1.	В примере с тремя участниками олимпиады перечислите элементы каждого из следующих множеств:
(а)	множество, для которого С решил по меньшей мере две задачи;
(Ь)	множество, для которого первые три задачи решил один и тот же участник олимпиады;
(с)	множество, для которого все четыре задачи решил В.
2.	Один из участников олимпиады объявляется победителем, если он решил первым либо три задачи из четырех, либо две задачи, включая сюда и логическую задачу. Перечислите множество логических возможностей, в которых имеется победитель олимпиады.
3.	Дать простые описания следующих множеств (исходя из того же примера с участниками олимпиады):
(а)	{ВЗЗ, В36};
(b)	{BIO, В11, В12, В28, В29, ВЗО};
(с)	(Вб, В20, В22}.
4.	Джо, Джим, Пит, Мэри и Анна должны сфотографироваться. Они хотят стать в ряд таким образом, чтобы юноши и девушки чередовались. Дайте перечень множества всех возможностей.
Б. В условиях упр. 4 перечислите следующие подмножества:
(а)	множество, для которого Пит и Мэри находятся рядом;
(Ь)	множество, для которого Анна находится между Джо и Джимом}
(с)	множество, для которого Джим находится в центре;
(d)	множество, для которого Мэри находится в центре;
(е)	множество, для которого юноши находятся с краю.
6.	В упр. 5 укажите все такие пары множеств, для которых одно множество является подмножеством другого.
7.	Режиссер телевизионной студии составляет программу получасовой передачи. Он хочет, чтобы в ней сочетались художественное чтение, легкая музыка и объявления. В предположении, что на каждую из этих частей программы отводится время, кратное пяти минутам, постройте множество возможных распределений времени. (Рассматривать только суммарное время, отводимое на каждую часть.)
8.	В упр. 7 перечислите следующие подмножества:
(а)	множество, для которого на художественное чтение отводится больше времени, чем на легкую музыку;
(Ь)	множество, для которого на объявления отводится больше времени, чем на музыку или чем на художественное чтение;
(с)	множество, для которого на музыку отводится ровно пять минут;
(d)	множество, для которого выполнены условия всех трех п. (а)—(с),
9.	В условиях упр. 8 найдите два множества, каждое из которых есть собственное подмножество множества п.(а), а также множества п.(с).
78
Гл. II. Множества и подмножества
§ 2.	ОПЕРАЦИИ НАД ПОДМНОЖЕСТВАМИ
В гл. I нами были рассмотрены способы, которыми из данных высказываний могут быть образованы новые высказывания. Теперь мы будем рассматривать аналогичный процесс — образование новых множеств из данных множеств. Мы будем предполагать, что каждое из множеств, которое мы используем в этом процессе, является подмножеством некоторого универсального множества, и будем требовать, чтобы вновь образованное множество было подмножеством того же самого универсального множества. Как и всегда, мы можем задавать вновь образованное множество или путем описания, или путем перечисления.
По заданным множествам Р и Q мы определим новое множество Р П Q, называемое пересечением Р и Q, следующим образом: РП Q есть множество тех и только тех элементов, которые принадлежат и Р и Q. В качестве примера рассмотрим логические возможности, перечисленные на фиг. 46. Пусть Р означает подмножество, для которого участник А решил первым по меньшей мере три задачи, т. е. множество {Bl, В2, ВЗ, В4, В7, В13, В19}, и пусть Q — подмножество, для которого А решил (первым) первые две задачи, т. е. множество {В 1, В2, ВЗ, В4, В5, В6}. Тогда пересечением Р П Q будет множество, для которого имеют место оба указанные события, т. е. А решил первые две задачи и решил по меньшей мере три задачи. Таким образом, Р П Q есть множество {В 1, В2, ВЗ, В4}.
По заданным множествам Р и Q следующим образом определим теперь новое множество Р U Q, называемое объединением Р и Q; Р U Q есть множество тех и только тех элементов, которые принадлежат или Р, или Q (или обоим). В примере из предыду-щего абзаца объединение Р U Q представляет собой множество логических возможностей, при которых А или решил первые две задачи, или решил по меньшей мере три задачи, т. е. множество
{Bl, В2, ВЗ, В4, В5, В6, В7, В13, В19}.
Чтобы помочь наглядному представлению этих операций, будем изображать их на специального рода диаграмме, называемой диаграммой Венна1). Пусть прямоугольник обозначает универсальное множество, а круги внутри прямоугольника — подмножества. На фиг. 47 показаны два множества Р и Q в виде заштрихованных кругов. Тогда область, заштрихованная дважды,
) В русской литературе чаще употребляется (более обоснованное) название круги Эйлера. (Диаграммами Венна иногда называют аналогичные иллюстрации, где отдельные множества изображаются не обязательно кругами.)
§ 2. Операции над подмножествами
79
представляет пересечение Р П Q, а вся заштрихованная область — объединение РU Q.
Если Р — данное подмножество универсального множества М, то новое множество Р, называемое дополнением Р, мы определим следующим образом: Р есть множество всех тех элементов U, которые не содержатся в Р. Например, если, как и
Фиг. 47
прежде, через Q обозначено множество, для которого участник А решил первые две задачи, то Q есть множество {В7, В8, ..В36}. На фиг. 48 заштрихованная область означает дополнение множества Р. Отметим, что дополнением пустого
Фиг. 48
множества О служит универсальное множество U и дополнением универсального множества служит пустое множество.
Иногда нас будет интересовать только часть дополнения множества. Например, мы можем интересоваться той частью дополнения множества Q, которая содержится в Р, т. е. множеством Р Г) Q • Область Р A Q заштрихована на фиг. 49.
Несколько более выразительное определение этого множества может быть дано следующим образом: пусть Р — Q есть
80
Гл. II. Множества и подмножества
разность Р и Q, т. е. множество тех элементов Р, которые не принадлежат Q. Фиг. 49 показывает, что PflQ и Р — Q — одно и то же множество. В примере с участниками олимпиады множеством Р — Q будет {В7, В13, В19).
Дополнение подмножества представляет собой частный случай разности множеств, так как можно написать Q= И—Q. Если Р и Q — непустые подмножества, пересечение которых пусто, т. е. Р Л Q = О, то их называют непересекающимися подмножествами.
Примеры. Пусть в примере с участниками олимпиады R означает множество, для которого А решил первые три задачи, т. е. множество {Bl, В2, ВЗ}, и пусть S означает множество, для которого А решил последние две задачи, т. е. множество {Bl, В7, В13, В19, В25, В31}. Тогда PnS = {Bl} есть множество, для которого А решил первые три задачи, а также последние две задачи, т. е. первым решил все четыре задачи. Мы имеем также
/?US={B1, В2, ВЗ, В7, В13, В19, В25, В31}.
Это множество можно описать как такое, для которого А решил либо арифметическую, алгебраическую и геометрическую задачу, или же геометрическую и логическую задачи. Множество, для которого А не сумел первым решить три первые задачи, есть R — {В4, В5, ..., В36}. Наконец мы видим, что разность R — S представляет собой множество, для которого А решил первые три задачи, но не обе последние. Это множество может быть получено путем удаления из R элемента {В 1} — общего для R и S. так что R—S = {B2, ВЗ}.
Упражнения
1. Нарисуйте диаграммы Венна для множеств Pf)Q> Р П Q< PflQ. PflQ-2. Осуществите шаг за шагом построение диаграммы Венна для множества (Р~ Q)U(EnQ).
3.	Диаграммы Венна полезны и тогда, когда даны три подмножества. Постройте такую диаграмму с тремя (пересекающимися) подмножествами Р, Q и R. Для каждой из восьми получившихся областей объясните, как она составлена из множеств Р, Q и R.
4.	Для точек гладкой кривой проводится классификация по следующим признакам: а) по знаку первой производной в этой точке (характеризующему возрастание или убывание соответствующей функции) и Ь) по знаку второй производной (характеризующему выпуклость или вогнутость кривой). Постройте диаграмму Венна, на которой были бы видны все четыре возможности.
5.	В качестве иллюстрации к упражнению 4 для всех четырех классов точек кривой приведите примеры кривых, у которых все точки принадлежат данному классу.
§ 2. Операции над множествами
81
6.	Выполните классификацию множества целых положительных чисел (скажем, не превосходящих 1000000) по следующим признакам, а) по четности, Ь) по тому, является ли число полным квадратом или нет, с) по тому, является ли последняя цифра числа (в десятичном его представлении) пятеркой или нет. Постройте диаграмму Венна. Приведите, если можно, примеры для каждого из возможных восьми случаев.
7.	На изображенной на фнг. 50 таблице показана реакция некоторого числа зрителей на одну телевизионную передачу. Все фигурирующие в таблице категории можно выразить в терминах следующих четырех: М (мужского пола), В (взрослый), П (понравилось), О (очень).
	Очень понравилось	Понравилось, но не очень	Не понравилось, но не очень	Очень не понравилось
Мужчины	1	3	5	10
Женщины	6	8	3	1
Мальчики	5	5	3	2
Девочки	8	5	1	1
Фиг. 50
Сколько человек попадает в каждую из следующих категорий:
(а)	М;	[Отв.: 34.]
(Ь)	П;
(с)	О;
(d)	Mf]В ППЛО;	[Отв.: 2.]
(е)	МПВ ПП;
(1) (ЛЦ]В)и(ППО);
(g)	(МПВ);	[Отв.: 48.]
(h)	(M(JB);
(i)	(М-В);
(j)	[М — (В П П П О)]-
8.	Обследование 100 студентов дало следующие результаты о количестве студентов, изучающих различные иностранные языки: испанский 28; немецкий 30; французский 42; испанский и немецкий 8; испанский и французский 10; немецкий и французский 5; все три языка 3.
(а)	Сколько студентов не изучает ни одного языка?	[Отв.: 20.]
(Ь)	Сколько студентов изучает одни французский язык?	[Отв.: 30.]
'(с) Сколько студентов изучает немецкий язык в том и только том случае, если они изучают французский язык?	[Отв.: 38.]
[Указание. Нарисуйте диаграмму Вениа в виде трех кругов, обозначающих множества студентов, изучающих соответственно французский, немецкий н испанский языки. В каждую из восьми областей впишите Данные, используя приведенные цифры. Начните с конца списка и двигайтесь к началу.]
6 Зак. 994.
82
Гл. II. Множества и подмножества
9.	При более позднем обследовании 100 студентов (см. упр. 8) были найдены следующие данные о числе студентов, изучающих различные иностранные языки: только немецкий 18; немецкий, но не испанский 23; немецкий и французский 8; немецкий 26; французский 48; французский и испанский 8; никакого языка 24.
(а)	Сколько студентов изучают испанский язык?	[Отв.: 18]
(Ь)	Сколько студентов изучают немецкий и испанский языки, но не французский?	[Отв.: Ни одного.]
(с)	Сколько студентов изучают французский язык, в том и только том случае, если они не изучают испанский?	[Отв.: 50.]
10.	В отчете Об обследовании 100 студентов (см. упр. 8) сообщалось, что количество студентов, изучающих различные языки, таково: все три языка 5; немецкий и испанский 10; французский и испанский 8; немецкий и французский 20; испанский 30; немецкий 23; французский 50. Инспектор, представивший этот отчет, был уволен. Почему?
11.	Произведенным недавно обследованием 100 студентов Дартмутского колледжа получены данные о девушках, с которыми они знакомы. Эти данные приведены в таблице фиг. 51.
	Красивая и умная	Некрасивая и умная	Красивая и глупая	Некрасивая и глупая
Блондинка	6	9	10	20
Брюнетка	7	11	15	9
Рыжая	2	3	8	0
Фиг. 51
Пусть БД — блондинки, БР — брюнетки, РЖ — рыжие, КР — красивые, ГЛ — глупые. Определите, сколько человек содержит каждый из следующих классов:
(а)	БЛПКРЛГЛ;
(Ь)	БР;
(с)	ржпгл;
(d)	(БРЦРЖ)П(КРЦГЛ );
(е) БЛи(КРПГЛ).
[Отв.: 10.]
[Отв.: 46.]
12. В условиях упр. 11 определите для каждой из следующих пар множеств, какое множество содержит больше лнц (в качестве элементов множества):
(а)	(БЛОБР) или РЖ;
(Ь)	ГЛПКР или БЛ — (ГЛПКР);
(с)	о или РЖПКРПГЛ.
§ 3. Множества и составные высказывания
83
§ 3. СООТНОШЕНИЕ МЕЖДУ МНОЖЕСТВАМИ И СОСТАВНЫМИ ВЫСКАЗЫВАНИЯМИ
В предыдущих разделах читатель несколько раз мог заметить, что существует тесная связь между множествами, с одной стороны, и высказываниями — с другой, а также между операциями над множествами, с одной стороны, и операциями образования составных высказываний — с другой. В настоящем разделе мы эти связи формализуем.
Если рассматривается несколько высказываний, то имеется естественный способ сопоставления с каждым из этих высказываний некоторого множества. Сначала мы образуем множество всех логических возможностей для рассматриваемых высказываний и называем его универсальным множеством. Затем каждому высказыванию мы ставим в соответствие подмножество тех логических возможностей универсального множества, для которых это высказывание истинно. Эта идея столь важна, что она бесспорно заслуживает и формального определения.
Определение. Пусть р, q, г,... означают некоторые высказывания и пусть U — их множество логических возможностей. Пусть Р, Q, R, ... означают подмножества 21, для которых истинны соответственно высказывания р, q, г, ... . Тогда Р, Q, R, ... называются множествами истинности высказываний р, q, г, ... .
Если р и q — высказывания, то р V q и р /\q — также высказывания, и, следовательно, они должны иметь множества истинности. Чтобы найти множество истинности высказывания р V q, заметим, что это высказывание истинно, когда истинно р или истинно q (или оба). Таким образом, высказыванию р V <1 мы должны поставить в соответствие те логические возможности, которые лежат в Р или в Q (или в них обоих); иначе говоря, мы должны поставить в соответствие р V q множество Р U Q. С другой стороны, высказывание р /\ q истинно, только когда истинно и р, и q, так что высказыванию р Л q мы должны поставить в соответствие множество Р П Q-
Итак, мы видим, что существует тесная связь между логической операцией дизъюнкции и операцией объединения множеств, а также между конъюнкцией и пересечением. Внимательный анализ определений объединения и пересечения показывает, что в определении объединения встречается слово «или», а в определении пересечения встречается слово «и». Поэтому не удивительно, что между этими двумя теориями имеется связь.
Ввиду того что в определении дополнения множества встречается связка «не», не удивительно, что множеством истинности для ~р будет Р, Это вытекает из того, что —р истинно тогда,
6*
84
Гл. II. Множества и подмножества
когда р ложно, так что множество истинности для ~р содержит те логические возможности, для которых р ложно, т. е. множеством истинности для ~р будет Р.
Множества истинности двух предложений р и q показаны на фиг. 52. На диаграмме отмечены также различные логические возможности для этих двух высказываний. Читатель отыщет на этой диаграмме множества истинности высказываний р V q, Pi\q, ~ Р п ~q.
Связь между высказыванием и его множеством истинности создает возможность «перевода» любой задачи, относящейся к составным высказываниям, в задачу теории множеств. Возможно также и обратное: если поставлена какая-то задача, касающаяся множеств, то универсальное множество можно себе представлять как некоторое множество логических возможностей, подмножества которого являются множествами истинности некоторых высказываний. Следовательно, задачу, относящуюся к множествам, можно также «перевести» на язык составных высказываний.
До сих пор нами изучались лишь такие множества истинности составных высказываний, которые образованы посредством связок V. Л и ~. Все остальные связки можно определить через эти три основные и тем самым вывести, какие множества истинности им соответствуют. Например, мы знаем, что p->q эквивалентно ~p\/q (см. фиг. 34 гл. I). Поэтому множество истинности для р -* q будет тем же, что и множество истинности для ~p\Jq, т. е. оно будет иметь вид PUQ. Соответствующая диаграмма Венна изображена на фиг. 53; здесь заштрихованная область означает множество истинности этого высказывания. Отметим, что незаштрихованная область на фиг. 53 изображает множество Р—Q — P(}Q, представляющее
§ 3. Множества и составные высказывания	85
собой множество истинности высказывания р /\~ q. Поэтому заштрихованная область будет множеством(Р—Q)—P[\Q, которое является множеством истинности высказывания'—(р Таким образом, мы установили, что {P~+q)t (—Р\/ q) и —'(Р Л — ^эквивалентны. Вообще, два высказывания эквивалентны тогда и только тогда, когда они имеют одни и те же множества истинности. Мы также видим, что диаграммы Венна помогают обнаруживать отношения между высказываниями.
Предположим теперь, что р — логически истинное высказывание. Что представляет собой его множество истинности? Поскольку р логически истинно тогда и только тогда, когда оно истинно в каждом логически возможном случае, множеством истинности р должно быть 21. Подобным же образом, еслир логически ложно, то оно ложно в каждом логически возможном случае, и поэтому его множеством истинности будет пустое множество О.
Рассмотрим, наконец, отношение следствия. Напоминаем, что из р следует q тогда и только тогда, когда импликация р ->q логически истинна. Но высказывание р -> q тогда и только тогда логически истинно, когда его множество истинности совпадает с 22, т. е. (Р—Q) — 22, или (Р — Q) = О. Из фиг. 49 мы видим, что если Р — Q пусто, то Q включает в себя Р. Отношение включения мы будем обозначать следующим символом: «Р есть подмножество Q» записывается как Р cz Q. Таким образом, p->q логически истинно тогда и только тогда, когда Р с Q.
Подведем краткий итог. Каждому высказыванию соответствует его множество истинности. Каждой логической связке соответствует операция над множествами. Каждому отношению между высказываниями соответствует отношение между множествами истинности. Множествами истинности высказываний
PV q, Р /\ q, —Р и p->q служат PU Q, РП Q, Р и Р — Q. Высказывание р логически истинно, если Р — 21, и логически ложно, если Р = О. Высказывания р и q эквивалентны тогда и только тогда, когда Р = Q; из р следует q тогда и только тогда, когда Pc Q.
Пример 1. Докажем, пользуясь диаграммой Венна, что высказывание [р V (— Р V <?)] логически истинно. Этому высказыванию соответствует множество [PU(PUQ)1; отвечающая ему диаграмма Венна изображена на фнг. 54. Множество Р заштриховано на этой фигуре вертикальными черточками, а множество Р U Q — горизонтальными. Вся заштрихованная область является их объединением и совпадает с множеством 21, так что наше составное высказывание логически истинно.
86
Гл. II. Множества и подмножества
Пример 2. Докажем, пользуясь диаграммой Венна, что р V (<7 Л г) эквивалентно (р V q} Л (Р V г). Множество истинности высказывания р V (<?Аг) совпадает со всей заштрихованной областью на фиг. 55, а множество истинности высказывания (р V ?) Л (Р V г) совпадает с дважды заштрихованной областью на фиг. 56. Так как эти множества совпадают, то мы видим, что наши два высказывания эквивалентны.
Пример 3. Покажем, пользуясь диаграммой Венна, что из q
следует p-+q. Множество истинности высказывания p~>q совпадает с заштрихованной областью на фиг. 53.
Фиг. 56
Так как эта заштрихованная область включает в себя множество Q, то мы видим, что из q следует p—>q.
Упражнения
Замечание. В упр. 1, 2 и 3 сначала найдите множество истинности жаждого высказывания.
I Воспользовавшись диаграммой Венна, определите, какие из следующих высказываний логически истинны или логически ложны:
(а)	р\~р\
(b)	рК~р\
(с) p\/(~pKq)-,
(d) Г->(?-> р);
(е) рЛ~(9->/>)
[Отв.: (а) и (d) логически истинны; (Ь) и (е) логически ложны.]
§ 3. Множества и составные высказывания
87
2. Воспользовавшись диаграммой Венна, определите, какие из следующих высказываний эквивалентны:
(a)
(b)	~(р/\?);
(с) ~(qh~py,
(d) p-+~q-,
(е) ~p\!~q.
[Отв.: (а) и (с) эквивалентны; (b), (d) и (e) эквивалентны.]
3 Воспользовавшись диаграммой Венна, определите, какие из выписанных ниже пар высказываний состоят из высказываний, одно из которых является следствием другого:
(а)	Р\ PKq\
(b)	pf\~q-, ~p->~q;
(с)	р->?; q->p;
(d)	pPq; pf\~q.
4.	Два высказывания называются несовместимыми, если они не могут быть истинными оба сразу. Придумайте систему вопросов, положительные или отрицательные ответы на которые определяют, являются данные два высказывания несовместимыми или нет.
5.	Три или более высказывания называются несовместимыми, если они не могут быть истинными все сразу. Что можно сказать о множествах истинности таких высказываний?
6.	Для следующих трех составных высказываний (а) введите буквенные обозначения для компонент, (Ь) дайте символическое выражение, (с) найдите множества истинности и (d) проверьте их совместимость.
Если этот курс интересен, то я буду упорно над ним работать.
Если этот курс не интересен, то я получу по нему плохую отметку.
Я не буду упорно работать, но получу по этому курсу хорошую отметку.
[Отв.: Несовместимы.]
Замечание. В упр. 7—9 каждому множеству поставьте в соответствие высказывание, имеющее это множество своим множеством истинности.
7.	Воспользовавшись таблицами истинности, определите, какие из следующих множеств пусты:
(a)	(PUQ)H(PUQ);
(Ь)	(РП<2)П(<?ПЯ);
(с) (РПР)-Л
(d) (Р U Я) П (Р U 0).	[Отв.: (Ь) и (с).]
8.	Воспользовавшись таблицами истинности, определите, являются ли попарно различными следующие множества:
(a)	Pfl(QU«);
(b)	(/?-Q) и (£-/?);
(С) (/?UQ)n(«UQ);
(d) (РП Q)U(POP);
(е) (PnQnP)U(PflQnP)U(PnQnP)lJ(PJlQnP).
88
Гл. II. Множества и подмножества
9.	Воспользовавшись таблицами истинности, определите, в каких из следующих пар множеств одно из множеств является подмножеством другого:
(а) Р; РЛО;
(b)POQ; QflA
(с) P — Q; Q — P; (d)POQ; /’UQ-
10.	Докажите как с помощью таблиц истинности, так и с помощью диаграмм Венна, что высказывание Д А (9 V г) эквивалентно высказыванию (pA9)V(pA'')-
11.	В § 2 были построены различные подмножества множества 36 логических исходов математической олимпиады. Постройте высказывания, для которых эти подмножества являются множествами истинности.
12.	Постройте множества истинности следующих высказываний:
(а)	А решил первым все задачи;	[Отв.: B1.J
(Ь)	А и В решили по две задачи;
(с)	С решил две задачи;
[Отв.: В15, В18, В21, В24, В27, ВЗО, В31, В32, В34, В35.]
(d)	С решил все задачи.
§ 4*. АБСТРАКТНЫЕ ЗАКОНЫ ОПЕРАЦИЙ НАД МНОЖЕСТВАМИ
Введенные нами операции над множествами подчинены некоторым очень простым абстрактным законам, которые будут перечислены в этом разделе. Эти законы могут быть доказаны либо с помощью диаграмм Венна, либо путем их перевода в высказывания и проверки с помощью таблиц истинности.
Приводимые ниже абстрактные законы очень напоминают элементарные законы алгебры, хорошо известные каждому. Это сходство можно еще усилить, заменив U на + и П на X. По этой причине говорят, что множество, его подмножества и законы сочетания подмножеств образуют алгебраическую систему, называемую булевой алгеброй — по имени английского математика Джорджа Буля, который впервые изучил эти системы с алгебраической точки зрения. Любая другая система, подчиняющаяся этим законам, например система составных высказываний, изученная в гл. I, также называется булевой алгеброй. Любую из этих систем можно изучать или с алгебраической, или с логической точки зрения.
Ниже перечислены основные законы, действующие в булевых алгебрах. Доказательство этих законов переносится в упражнения.
§4*. Абстрактные законы операций над множествами
89
Законы для объединения и пересечения.
Al. AUA = A.
А2. А П А = А.
АЗ. А и В = В U А.
А4 А П В = В П А.
А5. A (J (fi U С) —(A U A) U С.
А6. Ап(£ПС) = (Ап£)ПС.
А7. An(£UC) = (AnB)U(AnC).
А8. Ди(^ПС) = (Ли5)ПИиС).
А9. A U И = Т1.
А10.	=
АП. Ап# = А.
А12. AUO = A.
Законы для дополнений.
В1	А = А.
В2.	AllA = 2Z.
ВЗ.	АпА=0.
В4	(Дц"в) = ДпВ.
В5.	(дКе) = Аия.
В6.	й=о.
Законы для разностей множеств.
С1. А — В = А[\В.
С2. U — А = А.
СЗ. А — и — О.
С4. A — 0 — A.
С5. О — А =
С6. А—А —О.
С7. (А — В)-С = А — (В\]С).
С8. А — (Я-С) = (А —B)U(AflC).
С9. AU(B-C) = (AUB) —(С-А).
СЮ АП(В-С) = (АЛВ)-(АПС).
Упражнения
1.	Проверьте законы группы Al — А12 с помощью диаграмм Венна.
2.	«Переведите» все A-законы в законы для составных высказываний. Проверьте их с помощью таблиц истинности
90
Гл. II. Множества и подмножества
3.	Проверьте законы групп В и С с помощью диаграмм Венна.
4.	«Переведите» В- и С-законы в законы для составных высказываний. Проверьте их с помощью таблиц истинности.
5.	Из 28 основных законов получите следующие результаты:
(а)	А = (ЛПВ)ЩЛП£);
(Ь)	лив = (ЛлВ)и(ЛПВ)и(^ПВ);
(с)	лп(Лив) = Л
(d)	ли(ЛЛВ) = лив.
6.	Из А- и В-законов и из С1 получите С2 — С6.
7.	Воспользовавшись Al—А12 и С2—СЮ, получите Bl, В2, ВЗ и В6.
§ 5. ПРЕДИКАТЫ
Высказывания, в которых одно или несколько переменных являются свободными (т. е. заранее не уточняются), называются предикатами. В дальнейшем мы будем рассматривать только такие предикаты, в которых свободным является лишь одно переменное, которое мы будем обозначать через х.
С предикатами очень часто приходится сталкиваться в алгебре. Типичный пример доставляет, скажем, уравнение х2 — Зх + 2 = 0. Свободное переменное х может принимать здесь любое числовое значение. Для некоторых чисел х (а именно, х = 1 и х = 2) утверждение, содержащееся в этом уравнении, истинно; в остальных случаях оно ложно. В подобных случаях, когда истинность или ложность предиката зависит только от значения, принимаемого свободным переменным х, множество всех допустимых значений х можно рассматривать как множество логических возможностей а множество всех значений этого переменного, при которых наше высказывание истинно,— как его множество истинности. В приведенном выше примере множество И состоит из всех вещественных чисел (или из всех целых чисел, или из всех целых чисел, не превосходящих по абсолютной величине 1 0'00 000, — в зависимости от того, в какой области мы ищем решение нашего уравнения), а множеством истинности является множество [1, 2}.
В результате введения понятия множеств истинности для предикатов мы сможем распространить на них ранее полученные результаты. Например, нам известно, что множество истинности конъюнкции двух высказываний есть пересечение множеств истинности каждого из них. Решить уравнение — это значит найти один элемент (или все элементы) его множества истинности. При решении же системы двух уравнений у нас практически имеется предикат, представляющий собой конъюнк
§ 5. Предикаты
91
цию двух уравнений. Поэтому мы ищем элементы пересечения двух множеств истинности. Если это пересечение пусто, то система уравнений не имеет решений. Такие уравнения называются несовместными, поскольку их множества истинности не имеют общих элементов х.
Пример 1. Решить систему уравнений
х2— Зх 4-2 = 0 и х2=1.
За U примем множество всех действительных чисел1)- Мы уже видели, что множество истинности первого уравнения— это множество {1, 2}. Множество истинности второго уравнения есть {1,—1). Пересечением этих двух множеств является множество {1}, содержащее только один элемент. Поэтому система уравнений имеет единственное решение. Пример 2. Пусть U есть множество всех жителей Соединенных Штатов Америки. Рассмотрим предикаты р: «х выше 1 м 60 см», q'. «х больше 30 лет от роду», и г: «х моложе 10 лет». Множества истинности Р, Q, Р суть множества жителей США — выше 1 м 60 см, старше 30 лет и моложе 10 лет. Множеством истинности р A q является Р П Q, т. е. множество всех лиц выше 1 м 60 см и старше 30 лет. Поскольку не существует людей, которые удовлетворяли бы первому и третьему условиям одновременно, множество истинности для р Д г пусто. Поэтому высказывания р и г оказываются несовместимыми.
Понятие множества истинности удобно не только в вопросах, связанных с решением уравнений, но и при рассмотрении неравенств. Если U состоит из всех вещественных чисел, то множество истинности неравенства х < 0 состоит из всех отрицательных вещественных чисел. Множество же истинности неравенства х > —3 состоит из всех вещественных чисел, больших чем —3. Если мы потребуем теперь, чтобы оба эти неравенства выполнялись одновременно, то в качестве множества истинности нового высказывания мы получим пересечение двух исходных множеств истинности, содержащее все числа, лежащие между —з и о.	“
Пример 3. Пусть снова U есть множество всех вещественных чисел. Рассмотрим два предиката
р: х3 — х — 0 и q: х2<1/4.
’) Если стремиться к тому, чтобы во всех случаях не выходить за рамки конечных множеств, то можно, разумеется, и здесь ограничиться, скажем, целыми решениями уравнений, не слишком большими по модулю; например, такими, что |х| < 1010. Так как, однако, условие конечности рассматриваемых множеств здесь и в других случаях не является существенным, то оно иногда будет игнорироваться.
92
Гл. 11. Множества и подмножества
Соответствующими множествами истинности являются Р = {—1, 0, 1}, множество Q, содержащее все числа, лежащие между —*/2 и Ч-’/г Поскольку Pf|Q — {0), то оба условия вместе определяют единственное число 0.
Понятие множества истинности предиката позволяет выяснить, чем разнятся между собой уравнения и тождества. Когда мы предлагаем кому-либо решить уравнение, мы тем самым просим его найти один из элементов множества истинности этого уравнения или все такие элементы (это уже отмечалось ранее). Если же мы утверждаем, что (х—1) (х + 1) тождественно равно х2—1 (в математике это записывается так: (х-1) (х+1) s х2—1), то тем самым мы утверждаем, что это уравнение справедливо для всех х. Таким образом, тождество представляет собой уравнение, множество истинности которого совпадает с универсальным множеством И\ оно является примером логически истинного высказывания.
Теперь полезно будет проследить за правильным и неправильным методами решения кубического уравнения, фигурирующего в примере 3. Сначала решим его правильно. Пусть дано
х3 — х — 0,
тогда
(1)	х(х — 1)(х-|-1) = 0,
(2)	х = 0, или х—1=0, или х4-1=0;
(3)	х — 0, или х=1	или х = —1,
(4)	х = 0, или 1, или —1.
На первом этапе исходное уравнение приводится к эквивалентной ему форме. Такая операция правомощна, поскольку эквивалентные высказывания имеют одинаковые множества истинности. На втором этапе мы записали исходное уравнение в виде дизъюнкции трех уравнений. Это возможно потому, что произведение равно нулю тогда и только тогда, когда один из множителей равен нулю. Так как мы знаем, что указанная дизъюнкция эквивалентна исходному уравнению, мы и на Этом этапе не изменили множества истинности. На третьем этапе мы переписываем каждое из трех уравнений в эквивалентной ему форме. Наконец, мы замечаем, что множество истинности для дизъюнкции есть объединение множеств истинности каждого высказывания. Из (3) ясно, что множество истинности для каждого из трех уравнений состоит из единственного элемента, так что
5. Предикаты
93
в конце концов мы получаем, что множество истинности исходного уравнения содержит три элемента
Рассмотрим теперь неправильный путь решения. Пусть дано
х3 — х — 0.
тогда, сократив на х, получим
отсюда
(5)	х2 —1=0,
(6)	х2=1,
(7)	х=1.
Нам удалось найти один элемент множества истинности исходного уравнения, но мы не получили всех его элементов. Это объясняется тем, что дважды, при переходе к уравнениям (5) и (7), мы получали новые уравнения, не эквивалентные предшествующим. Совершенно справедливо, что из (5) следует исходное уравнение, но оно не эквивалентно исходному. Это значит, что множество истинности уравнения (5) меньше, чем множество истинности исходного уравнения. Для каждого х, удовлетворяющего уравнению (б), удовлетворяется и исходное уравнение, но обратное несправедливо для х = 0. (Вспомним, что мы можем умножать обе части уравнения на 0, но не можем делить на 0.) Таким образом, мы «потеряли» элемент 0 нашего множества истинности.
Точно так же справедливо, что если х = 1, то обязательно и х2= 1; поэтому из (7) следует (6). Но обратное несправедливо, поскольку множество истинности уравнения (7) меньше множества истинности уравнения (6). В самом деле, на этом этапе мы потеряли один элемент нашего множества истинности — элемент х = — 1.
При решении уравнений для того, чтобы быть уверенным в правильности решения, имеет смысл на каждом этапе переходить от заданного уравнения к эквивалентному. Это обеспечивает нам неизменность исходного множества истинности. Если же мы перейдем к уравнению, из которого следует исходное, но которое не эквивалентно ему, то тем самым мы сократим число элементов множества истинности исходного уравнения. В то же время, если мы перейдем к уравнению, которое является следствием исходного, но не эквивалентно ему, то мы увеличим число элементов множества истинности. В первом случае мы «теряем некоторые корни уравнения», а во втором — «получаем посторонние корни».
94
Гл. II. Множества « подмножества
Упражнения
1.	Пусть U есть множество всех вещественных чисел. Постройте множество истинности для каждого из следующих предикатов:
(а)	х2 — 4 = 0;	[Отв.: Множество истинности {2, —2}.]
(Ь)	х2 -|-4 = 0;	[Отв.: Множество ист. О.]
(с)	х3 — 4х -|- 3 = 0;
(d)	х2— 4х-|-4 = 0;
(е)	х2 — 4х 5 = 0.
2.	Что происходит с множеством истинности уравнения, обе части которого умножаются иа k, если
(а)	А#=0?
(b)	k = 0?
3.	Что происходит с множеством истинности иеравеиства, х2 < 2х — 1, если обе его стороны умножить на k, где
(а)	£>0?
(Ь)	А=£0?
(с)	k < О?
4.	Найдите множество истинности конъюнкции следующих предикатов (2/ есть множество всех действительных чисел):
(а)	х2 4- х — 2 = 0, х2 = 4;	[Отв.: {—2}.]
(Ь)	х2 — 4 = 0,	х2 — 4л 4~ 4 = 0;
(с) х3-}-6х24- Их—6 = 0,
х2 —4x4-3 = 0;	[Отв.: {1,3}.]
(d) х3 = 1, х2 — 4х 4- 4 = 0.
5.	Найдите множества истинности конъюнкций следующих пар неравенств (2/ есть множество всех целых чисел):
(а)	х >3, х< 10;	[Отв.: {3, 4, 5, 6, 7, 8, 9, 10}.]
(Ь)	х2 < 4, х — 1 > 1;
(с)	х <0, х2 — 2х-<0.
6.	Пусть U есть множество Всех действительных чисел х, таких, что 0 -С х < 2л. Найдите множество истинности для каждого из следующих тригонометрических уравнений
(a)	sinx=cosx;	^O«e.:	J.J
(b)	sin х = sin 2х;
(с)	tgx=l;
(d)	sin х = 3 4- sin x;
(e)	sin2 x = 1 — cos2 x.
§ 6. Функции
S5
7.	Исследуйте следующие аргументы:
Дано	х = 5;
тогда
х2 = 25,
х2 — 5х = 25 — 5х,
х (х — 5) = — 5 (х — 5);
отсюда
х =— 5
и
5	= —5.
8.	Исследуйте следующие аргументы: Необходимо решить х — 1 =0.
Прибавим к каждой части по —1: х— 2 = —1.
Возведем в квадрат: х2 — 4х + 4 = 1.
Вычтем 1: х2 — 4х + 3 = 0.
Разделим на х — 1: х — 3 = 0.
Прибавим 3: х — 3.
9.	Приведите пример внутренне противоречивого предиката (такого, что его множество истинности пусто).
10.	Докажите, что если из системы уравнений можно получить противоречие, то эта система не имеет решений.
11	Докажите, что если система уравнений не имеет решений, то из конъюнкции уравнений этой системы следует любое уравнение.
12.	Используйте результаты упражнений 10 и 11 для того, чтобы показать, что система уравнений не имеет решений тогда и только тогда, когда из нее можно вывести равенство 1 = 0.
13.	Для следующих двух уравнений покажите, (а) что у них нет общих решений и (Ь) что из них можно вывести 1 = 0:
2x4-1=0;
3x4-2 = 0.
14.	Используйте метод упр. 10, для того чтобы показать, что уравнения х2 — Зх + 1 = 0 и 2х2 — 6х + 1 = 0 не имеют общих решений.
15.	Используйте метод упр. 10, для того чтобы показать, что неравенства х> 1 и х2 + 2х + 1 < 3 несовместны.
§	6. ФУНКЦИИ
Правило, по которому каждому элементу данного множества ставится в соответствие некоторый объект, называется функ-цией. Понятия функции и множества лежат в основании всех разделов математики.
Рассмотрим понятие функции в более конкретной форме. Пусть дано множество D, которое называется областью определения функции, и правило f, которое каждому элементу множества D ставит в соответствие некоторый объект. (Функции мы всегда будем обозначать буквами, набранными жирным шрифтом.) Тогда f называется функцией, определенной на множестве D. Если х — любой элемент из D, то мы будем обозначать
96
Гл. II Множества и подмножества
объект, поставленный в соответствие х, через f {х), и называть его значением функции f в точке х. Этот объект может оказаться, вообще говоря, в свою очередь элементом множества D, но так будет не всегда. Может случиться, что каждый объект, поставленный в соответствие определенному элементу множества D, будет отличаться от всех остальных значений функции, либо что все значения функции будут одними и теми же, либо что имеет место промежуточный случай. Множество R всех объектов/(х), которые ставятся в соответствие элементам множества D, называется областью изменения f. Все эти понятия проиллюстрированы на фиг. 57.
Пример 1. Пусть D есть множество людей, скажем, множество жителей, проживающих в настоящее время в США. Через / (х) обозначим возраст х, округленный до ближайшего целого числа лет. Область изменения f представляет собой множество целых чисел, начиная с 0, и наверное включающее все целые числа вплоть до 100 и даже несколько чисел, больших 100.
Пример 2. Пусть опять элементами D являются все жители США и пусть/(х) есть имя жителя х. Тогда область значений этой функции есть множество, состоящее из очень большого (но, разумеется, конечного!) числа различных имен.
Пример 3. Пусть D есть множество всех взрослых жителей штата Нью-Йорк и пусть / (х) есть рост жителя х, выраженный в дюймах. Тогда область изменения / состоит из действительных чисел, заключенных, надо думать, между 30 и 100, что позволит учесть рост как карликов, так и великанов *).
Пример 4. Пусть D = {0, 1,2, 3, 4}, далее положим, /(0) = 2, /(1) = 2, /(2) =17, /(3) = 0, /(4) =17.
•) 30 дюймов — это (с большой степенью точности) 75 см, 100 дюймов — 2,5 л.
§ 6. Функции
97
Тогда область /? изменения f состоит из трех элементов {О, 2, 17} (см. фиг. 58).
Пример 5. Пусть D есть множество всех действительных чисел и пусть/ (х) = х2 — 3. Область изменения этой функции также есть множество действительных чисел, но на этот раз уже не множество всех действительных чисел (см. упр. 1).	>
Пример 6. Пусть D — любое множество и пусть f (х) = х для любого х из D. Тогда область R изменения функции совпадает с ее областью определения D. Такая функция называется тождественной функцией, определенной на множестве D.
Пример 7. Пусть D — любое множество и пусть f (х) =а для любого х из D; здесь а есть некоторый определенный объект. Тогда область R изменения функции f состоит всего из одного элемента {а}. В этом случае функция f называется постоянной на множестве D.
Эти несколько примеров должны показать, сколь разнообразными могут быть функции, их области определения и области изменения их значений. Область определения функции может быть конечным множеством, как в примерах 1—4, или бесконечным множеством, как в примере 5. Функцию можно описать словами, как в примерах 1—3, или выписать в явном виде все ее значения, как в примере 4, или задать с помощью какой-то формулы, как в примере 5. [Конечно, выписать все значения функции можно только в том случае, если D конечно, а практически это возможно только в том случае, когда число элементов D к тому же и не слишком велико.]
Область изменения функции R может совпадать с областью определения D, как в примере 6, либо быть подмножеством множества D, как в примере 5, или пересекаться с D, как в примере 4; R может также содержать элементы совершенно другой
7 Зак. 994
98
Гл. fl. Множества и подмножества
природы, чем D, как в примерах 1—3. Область R может содержать такое же число элементов, как и D (именно так будет обстоять дело, например, для тождественных функций), либо меньшее число элементов, как в примерах 1—4. Может даже оказаться, что множество D бесконечно, а множество R — конечно, например R содержит единственный элемент (если функция постоянна). Однако R не может содержать больше элементов, чем D, так как каждому элементу из D отвечает по крайней мере один элемент из R.
Короче говоря, и D и R могут быть вполне произвольными множествами. Единственное ограничение, которое накладывается на них, заключается в том, что/ должно ставить в соответствие каждому элементу D единственный элемент R и что при этом должен быть использован каждый элемент R.
Теперь мы можем определить понятие равенства двух функций.
Определение. Функции fug называются равными (что записывается, как f=g>, если их области определения совпадают и если для каждого элемента х из D совпадают элементы /О) и g-(x).
Естественно, что равные функции имеют одинаковые области изменения (см. упр. 2). Равные функции должны рассматриваться, как «одна и та же функция» Так, например, х2— 1 и (х—1) (х+1) есть два выражения для одной и той же функции.
В качестве более сложного примера заметим, что на множестве D = {0, 1} функции, описываемые выражениями х2 + 1 и 2х2— х + 1, равны. Конечно, если изменить область определения указанных выше функций, то они могут оказаться уже не равными. Однако это не может нас интересовать, поскольку мы рассматриваем функции, определенные на указанном множестве D.
Пример 8. Пусть D — произвольное множество, А — подмножество D. Определим функцию f следующим образом:
f (х) — 1, если х принадлежит A; f (х) =0, если х принадлежит А. Такая функция называется характеристической функцией подмножества А. Областью изменения характеристической функции обычно является множество {0, 1} (см. упр. 3—6). Эту функцию можно использовать для описания подмножества А.
Если/ — любая функция, определенная на множестве D, а а — элемент области ее изменения, то / (х) = а является предикатом с множеством D в качестве множества логических возможностей. Множество истинности такого высказывания состоит из всех элементов D, которым / ставит в соответствие объект а.
§ 6. Функции
99
Подобные множества истинности играют основную роль в теории вероятностей. Например, если D состоит из всевозможных результатов эксперимента, то множество истинности для /(х) = а представляет собой множество всевозможных экспериментов, в результате которых была получена величина а. Для того чтобы подсчитать вероятность того, что в результате эксперимента мы получим именно это значение а, мы обязательно должны знать, каково соответствующее множество истинности. (Ср. ниже гл. IV.)
Используя понятие множества истинности, мы можем лучше уяснить себе смысл понятия равенства двух функций. Пусть f и g— две функции, определенные на одном и том же множестве D. Предикат f(x) = g(x) имеет определенное множество истинности, состоящее из точек х, для которых эти две функции имеют одинаковое значение. Естественно, что это множество истинности может оказаться и пустым, если эти две функции не имеют совпадающих значений в одинаковых точках. Однако может оказаться, что множество истинности рассматриваемого предиката совпадает с D, и в этом случае мы говорим, что f—g. Другими словами, две функции называются равными, если f (х) = g (х) оказывается тождеством, или если это высказывание логически истинно, или если множество истинности этого высказывания совпадает со всей областью определения функций / и g.
В § 3 мы строили множества истинности для высказываний, не являющихся предикатами. Однако в каждом подобном случае легко найти простой метод построения эквивалентного предиката, т. е. предиката с тем же множеством истинности. Поэтому при желании мы всегда можем рассматривать множество истинности как нечто связанное с понятием предиката Мы можем даже ограничиться использованием предикатов вида f(x) — a.
Пример 9. В задаче о сравнении результатов трех участников математической олимпиады, которой мы занимались в § 1, рассмотрим множество истинности высказывания «А первым решил логическую задачу». При желании мы можем определить функцию / на множестве из 36 вероятных исходов, значением которой в каждом случае окажется фамилия участника состязания, решившего первым рассматриваемую задачу. Тогда высказывание «А решил логическую задачу» эквивалентно высказыванию «/(х) = = А», и, следовательно, интересующее нас множество истинности можно рассматривать, как множество истинности этого предиката.
7*
100
Гл. 11. Множества и подмножества
1
Метод, использованный в этом примере, в большинстве случаев приводит к цели. Однако существует другой, более простой, хотя и менее естественный метод, который позволяет решить задачу наверняка. Пусть р — любое высказывание, определенное на множестве логических возможностей И, f — характеристическая функция его множества истинности Тогда/(х) = 1, если р истинно в случае x,fn (х) = 0, если р в этом случае ложно. Такая функция также называется характеристической функцией высказывания р. Совершенно очевидно, что высказывание р эквивалентно предикату «/(х) = 1».
Упражнения
1.	Найдите область изменения функции, рассмотренной в примере 5.
2.	Выведите из определения равенства двух функций доказательство совпадения областей изменения этих функций.
3.	В примере 8 утверждалось, что область значений характеристической функции подмножества А «вообще говоря» состоит из двух элементов. Какие два подмножества А являются исключением из этого правила?
4.	Пусть А и В — два подмножества В,/и g — их характеристические функции. Пусть далее h (х) для каждого х из D есть меньшее из двух чисел f (х) и g (х). Докажите, что h есть характеристическая функция множества А Л В.
5.	Как построить характеристическую функцию множества A (J/3, зная характеристические функции множеств Л и В (ср. с упр. 4)?
в. Как построить характеристическую функцию множества А, зная характеристическую функцию множества А (ср. с упр. 4)?
7. Пусть множество D состоит из всех жителей США. Какие из следующих «величин» можно считать функциями (с областью определения £>):
(а) /(х) —отец х;	[Отв.: Функция.]
(Ь)/(х) —сын х;	[Отв.: Не функция.]
(с)	/(х) —дедушка х;
(d)	/(х)— дедушка х со стороны матери;
(е)	/(х) — старшая дочь х.
8.	Для функций из упр. 7, определенных на множестве D, найдите области их изменения.
9.	Опишите какую-либо функцию с областью определения О и с областью изменения R, где
(a)	D = {1, 2,3}, a R = {3, 5};
(b)	D есть множество всех целых чисел, a R есть множество всех нечетных чисел;
(с)	D есть множество всех целых чисел, a R = {0, 1, 2};
(d)	D есть множество всех действительных чисел, a R = (5).
§ 7. Числовые функции
101
10.	Пусть f определяется таблицами, изображенными на фиг. 5&—61. Укажите для каждого случая область определения и область изменения функции /.
И. Определите непустое множество D, на котором функции /(х) = 2х2—1 Bg’(x) = l—Зх равны. Постройте другую область D', в которой они не равны.
12.	Пусть D — произвольное множество,/—определенная на D тождественная функция, a g—постоянная функция, единственным значением которой является элемент d области D. Каково множество истинности предиката f(x)=g (х)?
13.	Пусть / и g — постоянные функции, определенные на D. Докажите, что множество истинности предиката / (х) = g (х) есть либо D, либо О
14.	В примере об участниках математической олимпиады из § 1 D есть множество 36 возможных исходов, а / определяет число задач, которые решил С. Каково множество истинности предиката /(х) = 2?
15.	Мы подбрасываем монету дважды. Пусть 2/ = {ГГ, ГЦ, ЦГ, ЦЦ), где Г и Ц означают выпадение (в первом и во втором случаях) герба или цифры. Постройте два различных предиката, эквивалентных высказыванию «Оба раза выпадает герб».
§ 7. ЧИСЛОВЫЕ ФУНКЦИИ
Особое значение имеют специальные функции, область изменения значений которых состоит из чисел. Такие функции называются числовыми функциями. Во многих случаях не так уже важно точно знать, что представляет собой область изменения функции, однако весьма ценной является информация о совпадении этой области с некоторым подмножеством множества всех чисел; поэтому о подобных функциях кратко говорят, что это суть числовые функции, определенные на каком-либо множестве D. При этом множество D вовсе не обязательно должно быть множеством чисел.
Для числовых функций, определенных на одном и том же множестве, можно ввести операции сложения и умножения.
102
Гл. И. Множества и подмножества
Если f и g суть числовые функции на множестве D, то суммой h^f^rg этих функций мы назовем функцию Л, удовлетворяющую равенству h (х) — f (х) + g{x) при любом х из D. [Поскольку f (х) и g (х) — числа, то все значения суммы функций могут быть определены.] Таким образом, сумма функций определяется как функция, значения которой равны сумме значений слагаемых. Аналогичным же образом можно ввести и операцию умножения функций: произведение k —fg функций f и g определяется как функция, удовлетворяющая равенству k(x)~ =/£т) S’ (•*) при любом х из D
Пример 1. Пусть D есть множество [a, b, с, d\ и пусть значения функций f и g собраны во втором и третьем столбцах изображенной на фиг. 62 таблицы. Тогда значения суммы Л и произведения k функций f и g совпадают с теми, которые приведены на той же таблице.
X	/(•*)	gix)		tw
а	1	2	3	2
ь	2	0	2	0
с	*/2	4	9/2	2
d	5	—2	3	—10
Фиг. 62
Пример 2. Пусть D есть множество вещественных чисел.
Пусть f(x) = х2, a g есть постоянная функция, всегда равная 3, gr = 3. Тогда сумма h этих функций определяется выражением Л(х) = х2 + 3, а их произведение k — выражением k(x) — 3>x2.
Для числовых функций обычно широко используют и другие операции Так, например, через f2 обозначают произведение функции/на себя, т. е. ff\ через 3/—произведение постоянной функции со значением 3 на функцию /; через—/ обозначают функцию, значения которой для любого х из D равны —/ (х). Точно так же мы можем ввести операции/—g.flg и т. д.
Если fug заданы с помощью формул того типа, которые используются в элементарной алгебре, то формулы результата определенных операций над этими функциями можно получить, выполнив эти же операции над соответствующими формулами.
Пример 3. Пусть f(x) — x — 3 и g(x)~x2— 2х-|-5, где за область определения этих функций принято множество всех действительных чисел. Тогда f+g = х2—
§ 7. Числовые функции
103
— *4-2; произведение/g- = (x — 3)(x2 —2x4-5) или проще fg—x3 — 5х2Их—15; разность g—f=xl— 3x4-8, а частные flg=	и gif = ~-~-2х + 5 ,
•"° л2— 2х + 5	х— 3
Из самого определения частного двух функций следует, что в этом случае нужно принять определенные меры предосторожности. Значение этой функции определено только тогда, когда знаменатель не обращается в нуль. Поэтому, если в некоторых точках знаменатель / функции gif обращается в 0, то в этих точках функция gif не определена. В связи с этим очень часто в качестве области определения функции gif выбирается не вся область D, а только ее подмножество, для которого /(х)40. Так в примере 3 функция gif определена на множестве всех действительных чисел, за исключением числа 3. С другой стороны,//^ определена на множестве всех действительных чисел, так как на этом множестве х2—2х + 5 не может обратиться в нуль.
Если исходные функции заданы с помощью таблиц, т. е. прямым указанием всех значений функции, то, вычисляя последовательно значения новой функции для каждого х, мы легко определим любую комбинацию исходных функций.
К	т (л1	л(х)	р (jrt
а	—3	—37	4
ь	2	6	0
с	-16/2	_037/2	32
d	9	55	4/6
Фиг. 63
Пример 4. Пусть функции f и определяются первым и вторым столбцами изображенной на фиг. 62 таблицы. Тогда функции т = f— 2g, n = 3f— 5g3 и p — g2/f определяются таблицей, изображенной на фиг. 63.
Упражнения
1.	Пусть fug—характеристические функции двух подмножеств D. Докажите, что fg есть характеристическая функция пересечения этих подмножеств.
2.	Пусть f — характеристическая функция подмножества А множества D, а / — постоянная функция, определенная на D и равная единице. Дока-
104
Гл. II. Множества и подмножества
жите, что J—f есть характеристическая функция подмножества Л. Какое подмножество имеет своей характеристической функцией функцию/?
3. Проверьте значения функций, указанные на фиг. 63.
X	fix)	кМ	4. Пусть f и g определяются из таблиц, при-веденных на фиг. 64. Составьте таблицы для следующих функций:
а	1	5	(a) Z+ff!	[Отв.: 6, —1, —5.]
ь	0	—1	(b) fg,
с	—2	3	(с) f—g;
			(d) fl£T,	[Отв.: 4t>, 0. 2/з-1
	Фиг	64	(е) f2~fg + ?-
5. Пусть D = {0, 1}. Для приведенных ниже пар функций определите, равны эти функции или нет:
(а)/(х) = х и ff(x) = %2;
(b)/(*) = 2^4-1 и g (х) = 2х3 4-1;
(с)/(х) = х и g(x)= — x\
(d)/(%)=! и g-(x) = 2x2 —*4-1.
§ 8*. БАЗИС ПРОСТРАНСТВА ЛОГИЧЕСКИХ ВОЗМОЖНОСТЕЙ
Пусть flt f2>	— функции, определенные на множе-
стве 21, и пусть х —любая точка этого множества. Тогда значения функций /i(x) — ах, f2(x)~a2, .. ,,fn(x) = an однозначным образом определяются выбором х. Теперь мы хотим узнать, является ли х единственной точкой множества, в которой указанные функции принимают эти значения. Если это так, то мы можем утверждать, что и х также однозначно определяется значениями указанных функций. Если набор функций обладает тем свойством, что их значения однозначно определяют каждый элемент множества, то мы говорим, что эти функции описывают 21.
Пусть в нашем распоряжении имеется серия из п опытов. Естественно избрать пространством логических возможностей множество возможных последовательностей исходов этих опытов, которое графически можно изобразить в виде дерева. Определим теперь п функций исходов j\, f2, ..., fn как функций, областью определения которых является множество всевозможных путей на дереве исходов и таких, что функция fi определяет исход i-ro эксперимента. Функцию можно также рассматривать как определенный ярлык, приписываемый i-й ветви каждого пути на дереве. Совокупность п функций исходов описывает пространство логических возможностей.
§8*. Базис пространства логических возможностей
105
Пример I. Вернемся вновь к примеру, составляющему содержание фиг. 27, из § 6 гл. I (ср. фиг. 27 с фиг. 65). Здесь пространство логических возможностей, как пока-
зано на фиг. 65, состоит из 6 возможностей. = 1 или 2 в зависимости от того, какая					Пусть /1 (х) = из урн была
уУрна1<_ 'Урна2<^_	Ч< ‘Б  Ч	„Ч ^^б 	ч 	б 	ч	бед 1 1 1 2 2 2	fg{X) V ч б ч Б Б	4^) ч в ч Б Ч Б
Ф и г. 65
выбрана, и пусть /2(х) и f3(x) определяют цвет вынутого 1-го шара и 2-го шара. Тогда, как легко видеть на фиг 65, эти три функции исхо-
да полностью определяют
пространство логических возможностей. Дерево для этого примера изображено на той же фиг. 65.
Пример 2. Пусть мы подкидываем монету и бросаем игральную кость. Эту операцию можно рассматривать как последовательность двух экспериментов, где областями-ж>з-можных значений функций исходов /г и /2 соответственно являются /?1 =
№) Гг1х)
Ф и г. 66
= {Г, П} и R2 = {1, 2, 3, 4, 5, 6}. В пространстве логических возможностей имеется 12 точек, каждая из ко-
торых однозначно описывается значениями функций исходов. Дерево для этого примера изображено на фиг. 66.
Если последовательность функций описывает пространство логических возможностей, то мы знаем, что каждая точка этого
пространства И описывается определенной комбинацией значе-
106
Гл. //. Множества и подмножества
ний этих функций. Однако, вообще говоря, отсюда еще не следует, что любая комбинация значений этих функций описывает некоторую точку из 21. Так в примере 1 комбинация /1(л) = 1, /2(х) = Б и/3(х) = Б не может нам встретиться. И действительно, если бы были возможны любые комбинации значений функций, то 21 содержало бы 2 X 2 X 2 = 8 элементов, вместо 6. С другой стороны, в примере 2 возможной является любая комбинация значений функций исходов.
Определение. Если /2> • fn — функции, определенные на заданном множестве 21, и если каждая комбинация значений этих функций является возможной, то мы говорим, что функции f, f2, •  fn логически независимы. Если эти функции логически независимы и, кроме того, описывают пространство 21, то мы говорим, что они образуют базис пространства 21.
Для последовательности опытов функции исхода описывают пространство логических возможностей, но, вообще говоря, не являются логически независимыми. Утверждать, что эти функции логически независимы — значит утверждать, что исход любого подмножества возможных исходов никак не ограничивает множество исходов оставшихся опытов в противоположность тому, что имело место в приведенном выше примере 1. Напротив, функции исхода в примере 2 логически независимы, и, следовательно, образуют базис пространства 21.
Пример 3. Пусть р и q — два независимых высказывания. За пространство логических возможностей мы принимаем в этом случае множество из четырех точек, описывающих различные возможные случаи в таблице истинности: {ИИ, ИЛ, ЛИ и ЛЛ}. Пусть /1 и f2 — характеристические функции этих двух высказываний р и q, т. е. такие функции, которые принимают значение 1, если высказывание истинно, и 0, если оно ложно. Элементы пространства 21 и значения этих функций приведены в таблице на фиг. 67. Из этой таблицы легко видеть, что характеристические функции описывают пространство логических возможностей. Кроме того, мы можем заметить, что возможными оказываются все четыре комбинации значений этих функций, и, следовательно, эти функции логически независимы и образуют базис пространства. Если бы исходные высказывания не были независимыми, то по крайней мере один из случаев оказался неосуществимым; следовательно, характеристические функции не были бы логически независимыми. Таким образом, мы видим, что понятие логической независимости функций является обобщением понятия независимости высказываний.
§ 8 *. Базис пространства логических возможностей
107
На фиг. 67 приведены еще значения функции f3— характеристической функции составного высказывания р /\q-Очевидно, что пара функций J\ и f3 так же, как и пара функций f2 и f3, не является базисом пространства U, так
р	Q	л	л	л
и	и	1	1	1
и	л	1	0	0
л	и	0	1	0
л	л	0	0	0
Фиг. 67
как ни одна из этих пар не описывает пространства логических возможностей.
Пример 4. Пусть fx, f2, ..., /7 — функции исхода встреч между командами Доджерс и Янки в первенстве США по бейсболу (см. пример 3 на стр. 44). Тогда область возможных значений для каждой из первых четырех функций исхода есть {Д, Я}, где буквой обозначено название выигравшей команды. Однако область возможных значений последних трех функций несколько шире, а именно она имеет вид {Д, Я, Н), где буква Н означает, что игра не была сыграна. Пространство логических возможностей для такой ситуации описывается деревом, приведенным на фиг. 28 (стр. 45), в которое надо внести следующие изменения: те пути, которые содержат меньше семи ветвей, надо дополнить добавлением ветвей с ярлыком Н, до тех пор пока все пути не будут иметь ровно семь ветвей. Легко видеть, что функции исхода описывают пространство логических возможностей, но не образуют его базис. На самом деле, если бы они могли служить базисом этого пространства, то в данной ситуации было 2Х2Х2Х2Х X 3 X 3 X 3 = 432 возможных исходов вместо имеющихся в действительности 70. Если нас интересует сейчас только исход первых трех игр, то в качестве пространства логических возможностей мы можем использовать дерево, построенное для первых трех этапов с 8-ю возможными путями. Поскольку первые три функции для такого ограниченного пространства логических возможностей логически независимы, то они образуют базис этого нового пространства. Если нам нужно построить функцию g, которая
108
Гл. II. Множества и подмножества
определяет число побед команды Доджерс в первых трех играх, то нас удовлетворит и это более простое пространство.
Теперь может возникнуть вопрос о том, существует ли базис для любого пространства логических возможностей. Легко показать, что по крайней мере один такой базис наверное существует. Действительно, если f— тождественная функция, заданная на множестве 21, то функция f, взятая сама по себе, образует базис пространства 21 (см. упр. 6). Базис, состоящий из одной функции, мы будем называть тривиальным базисом пространства логических возможностей 21.
Второй интересный вопрос заключается в том, можно ли дополнить базис некоторой функцией с тем, чтобы расширенная система функций по-прежнему являлась базисом. Если функции /р /2, • • •> fn образуют базис 21, то любая комбинация значений этих функций достигается в одной и только в одной точке 21. Предположим теперь, что к этому базису мы добавили еще одну какую-то функцию g. Пусть j\ (х) — а1г ... ...,/„ (х) = есть какая-то комбинация значений функций, достигаемая в единственной точке х. Если g(x)~b, то b есть единственное значение g, которое может встретиться в комбинации с заданными значениями исходных п функций. Поэтому, если функция g на множестве 21 принимает еще какое-нибудь значение, то она не является логически независимой от первых п функций. С другой стороны, если это постоянная функция, то мы построили новый более широкий базис. Таким образом, мы можем дополнить базис сколь угодно большим числом постоянных функций, но не можем добавить к нему ни одной функции, отличной от постоянной. Обычно предполагается, что базис не содержит постоянных функций, так как эти функции являются избыточными, и их всегда можно исключить; при этом условии данный базис никак не может быть расширен.
Поскольку мы отметили, что тождественная функция сама по себе образует базис пространства 21, то возникает вопрос, какие еще функции обладают тем же свойством. Если f есть функция, определенная на множестве 21, и если она сама по себе образует базис этого пространства, то она должна описывать его и должна быть логически независимой от всех остальных функций базиса (последнее условие в данном случае является тривиальным). Для того чтобы/ описывала пространство 21, необходимо, чтобы / принимала различные значения в различных точках 21, Функция, которая не принимает никакого значения дважды, называется взаимно однозначной, поскольку она взаимно однозначным образом связывает каждый элемент области определения с каждым элементом области значений
§8*. Базис пространства логических возможностей
109
функции. Любая взаимно однозначная функция образует тривиальный базис пространства.
Пример 5. Пусть есть множество всех студентов данного высшего учебного заведения и пусть f(x) номер студенческого удостоверения студента х. Тогда f есть взаимно однозначная функция, и следовательно, она образует базис этого множества. Это позволяет различать студентов, указывая номера их студенческих удостоверений.
Упражнения
1.	Подбрасывается монета, а затем случайным образом выбирается одно из чисел от 1 до 4. Опишите.-множество логических возможностей 11 и две функции исхода. Покажите, что функции исхода образуют базис.
2.	Подбрасывается монета. Если выпадает герб, то подбрасывается другая монета; если же выпадает цифра, то бросается игральная кость. Для этой ситуации постройте дерево. Опишите 11 с помощью двух функций исхода (по одной на каждый опыт). Покажите, что функции исхода не образуют базиса.
3.	Пусть /1 и /2 — характеристические функции независимых высказываний р и q. Чему равны характеристические функции следующих высказываний:
(a) phq;
(b) m (с)
4.	Пусть р и q— два таких высказывания, что из р следует q. Образуют ли базис характеристические функции этих высказываний?
5.	Докажите, что если f\, f2 и f3 образуют базис пространства 11 и если области их значений содержат соответственно nt, п2 и п3 элементов, то 11 содержит щ X п2 X «з элементов. Что можно сказать по этому же поводу, если указанные функции описывают 11, но не являются логически независимыми?
6.	Пусть 11—произвольное множество и пусть/—тождественная функция, определенная на этом множестве. Докажите, что функция / сама по себе образует базис 11.
7.	Пусть 11 содержит 7 элементов. Докажите, что если нельзя использовать постоянные функции, то любой базис пространства должен быть тривиальным. (Указание: см. упр. 5.).
8.	Рассмотрим функции, определенные в примере 4. Какое из множеств указанных ниже функций является логически независимым?
(а)	/1, /2;	[Отв.: Независимы.]
(Ь)	/1. /2> /з. /«;
(с)	fi, f2, fa, ft, /6; [Отв.: Не независимы.] (d)/4./s;
(е) /з. /в-
9.	Рассмотрим следующую последовательность из двух опытов. Сначала случайным образом выбирается целое число в пределах от 1 до 5. Если это число равно п, то затем также случайным образом выбирается другое число в пределах от 1 до п. Постройте для этой последовательности
но
Гл. II. Множества и подмножества
дерево и для каждого пути на нем определите значения функций fug, где / определяет сумму двух выбранных чисел, a g— их разность. Описывают ли эти функции дерево? Образуют ли они его базис?
10.	Для функции / из упр. 9 докажите, что ни один базис не может содержать ее.
11.	Множество функций называется разделяющим две точки х и у, если в этом множестве содержится такая функция /, для которой /(х) =/= / (у). Докажите, что множество функций разделяет любую пару точек пространства И в том и только том случае, когда это множество описывает К.
12.	Бросаем три раза игральную кость. В качестве пространства логических возможностей берется 216 возможных последовательностей исходов. Пусть /1, /2, /з — три функции исхода. Какие из нижеследующих множеств функций
(а)	/в /г, /з!
(Ь)	ft + /г> /i —fi, fa,
(c)	fl, fi +/2. fl +/г +/з!
(d)	ft +/2. fi +/s> /2 +/s
описывают пространство? Какие из них образуют базис?
[Отв.: все они описывают пространство; только функции (а) образуют базис.]
§ 9*. КВАНТОРЫ
Высказывание, в котором утверждается, что множеством истинности предиката является все множество 21, называется универсальным. Примерами универсальных высказываний могут служить тождества или утверждения о равенстве двух функций. Столь же важную роль играют и высказывания другого типа, в которых утверждается, что множество истинности некоторого предиката не пусто. Такое высказывание называется экзистенциальным. Универсальное высказывание может иметь следующую форму: «Для всех х из 21...», а экзистенциальное высказывание — следующий вид: «По крайней мере для одного X из 21...»
Выражения «Для всех х из 21 ...» и «По крайней мере для одного х из...» могут служить примерами кванторов. В сочетание с предикатом (с одной свободной переменной) квантор образует новое высказывание, не зависящее от значения свободного переменного предиката. Высказывание «Для всех х из U имеем f (х) = 0» либо истинно, либо ложно в зависимости от того, как определено множество 21 и функция/(х), но не зависит от выбора х. Приведем еще несколько примеров кванторов: «Ровно для трех х из 21 ...» и «Не более чем для десяти х из 21...'».
Рассмотрим теперь отрицание экзистенциального высказывания. Рассмотрим высказывание «по крайней мере для одного х из 21 имеет место равенство f(x) =g(x)». Отрицание этого вы
§9*. Кванторы
111
сказывания состоит в том, что U не содержит такого элементах, который обладал бы этим свойством. Это эквивалентно высказыванию «/(х) + g(x) для любого х из г/». Таким образом, отрицание экзистенциального высказывания есть некоторое универсальное высказывание. И вообще, пусть р(х)—некоторый предикат и Р — его множество истинности. Тогда соответствующее экзистенциальное высказывание «По крайней мере для одного х из р(х)» утверждает, что РфО. Отсюда отрицание этого высказывания утверждает, что Р = О. Множество истинности высказывания —р(х) есть Р. Отрицание экзистенциального высказывания предполагает, что P — U, т. е что «Для любого X ИЗ и, р (х)».
Аналогичным же образом отрицанием универсального высказывания оказывается экзистенциальное высказывание. Высказывание «Для любого х из И, р(х)» предполагает, что P — U. Поэтому его отрицание равносильно утверждению, что Р и. следовательно, Р ФО. Отсюда следует, что это отрицание эквивалентно высказыванию «По крайней мере для одного х из 21, ~ р(х)». Например, утверждать, что /¥= g значит утверждать, что по крайней мере для одного х мы имеем f(x) g(x).
Пример 1. В теории чисел, исследующей свойства целых чисел, очень легко найти простые примеры экзистенциальных и универсальных высказываний. Прежде всего введем понятие простого числа. Целое число называется простым, если оно больше 1 и делится без остатка только на два числа, а именно на 1 и на самое себя. 2, 3, 5, 7, 11 являются примерами простых чисел.
Исследуя простые числа, меньшие 100, мы можем прийти к выводу, что любое множество из 10 последовательных чисел содержит по крайней мере одно простое число. Для большей определенности обозначим через U множество всевозможных комбинаций, содержащих 10 последовательных целых чисел. Множество 21, безусловно, является бесконечным. Тогда наше предположение выглядит следующим образом: для каждого X из U последовательность X содержит простое число. Так как это высказывание является универсальным, то любой пример последовательности X, не содержащей простого числа, опровергает его. Таким опровергающим примером является, например, последовательность целых чисел от 114 до 123 включительно, не содержащая простых чисел.
Рассмотрим также знаменитое еще не доказанное (но и .не опровергнутое) универсальное высказывание, известное под названием проблемы Гольдбаха. Пусть множество
112	Гл. II. Множества и подмножества
логических возможностей состоит из всех четных целых чисел >-4. Проблема Гольдбаха заключается в том, что предполагается, что для любого х из 21 число х можно представить в виде суммы двух простых чисел.
В то же время Л. Г. Шнирельман уже довольно давно доказал следующее универсальное высказывание, представляющее собой первый шаг на пути решения проблемы Гольдбаха: пусть множество логических возможностей 21 для х то же, что и раньше; тогда для любого х из 21 число х можно представить в виде суммы менее чем 300 000 простых чисел *).
Приведем, наконец, пример экзистенциального высказывания, истинность которого читатель легко докажет самостоятельно. Пусть множество логических возможностей 21 состоит из всех простых чисел. Тогда по крайней мере для одного х из U число 2х — 1 не является простым (см УПР- 7).
Рассмотрим теперь методы доказательства и опровержения истинности универсальных высказываний. Доказать истинность экзистенциального высказывания гораздо проще, чем истинность универсального высказывания. В действительности, для того чтобы доказать истинность высказывания «По крайней мере для одного х, р(х)», необходимо только указать единственное значение х, обладающее указанным свойством. Другими словами, доказательство истинности экзистенциального высказывания, как правило, состоит в построении соответствующего примера. Отрицание универсального высказывания есть экзистенциальное высказывание, и, следовательно, оно тоже может быть доказано с помощью единственного примера. Такой опровергающий пример доказывает, что универсальное высказывание общности ложно. Таким образом, для того чтобы доказать, что высказывание «для любого х из 21, р(х)» ложно, необходимо только найти единственное х из 2Z, не обладающее указанным свойством Например, утверждение «Все простые числа нечетны» опровергается указанием не нечетного простого числа — числа 2.
Пример 2. В математике очень часто один математик выдвигает гипотезу, а другой опровергает ее, построив противоречащий пример. Например, выдающийся теоре-тико-числовик П. Ферма выдвинул гипотезу о том, что для любого целого х число 22* + 1 есть простое число. Но
') Л Г. Шнирельман получил свой результат в 1930 г. В настоящее время его методом удалось доказать, что каждое четное число может быть представлено в виде суммы не более чем 20 простых чисел. Другим методом И. М. Виноградов доказал, что каждое четное число, большее некоторого (весьма большого!) числа N, можно представить в виде суммы не более чем 4 простых чисел.
g 9 *. Кванторы
113
Эйлер позднее показал, что при х = 5 это выражение не дает простого числа.
Если множество U бесконечно, то доказать истинность универсального высказывания, перебирая различные значения х, разумеется, нельзя. Необходим более мощный метод доказательства. Таким методом является, например, метод математической индукции. Однако иногда истинность универсального высказывания можно доказать и косвенным путем. Пусть, например, нам нужно доказать истинность высказывания «Для любого х, р(х)». Предположим истинность отрицания этого высказывания: «По крайней мере для одного х, — р(х)>. После этого достаточно рассмотреть объект, удовлетворяющий этому условию и показать, что существование такого объекта ведет к противоречию.
Пример 3. Докажем этим методом истинность высказывания «Любое простое число большее двух — нечетно». Предположим, что это высказывание ложно. Тогда существует по крайней мере одно целое число п, которое является одновременно простым и четным. Но если оно четно, то оно делится на два. По предположению п =А 2, а, следовательно, п не может быть простым, что и приводит нас к противоречию.
Упражнения
1.	Постройте отрицание каждого из следующих высказывании:
(а)	Для любого х из V., х2  4. [Отв.: по крайней мере для одного х из 11, х2 4.]
(Ь)	Для любого х из 11, х 1 = х3 — 2.
(с)	По крайней мере для одного х из К, х2 — 2х -|- 1 = 0.
(d)	По крайней мере для одного х из V., 1 < х < 2.
2.	Пусть 11 есть множество всех жителей США. Укажите, какие из нижеследующих высказываний являются универсальными, а какие экзистенциальными, и постройте их отрицания (как можно более простого вида).
(а)	Все люди смертны.	[Отв.: некоторые люди бессмертны.]
(Ь)	Некоторые люди — дети.
(с)	Все мужчины выше 5 футов.
(d)	Некоторые мужчины ие ниже 7 футов или не выше 4 футов.
3.	Сформулируйте отрицание тождества в виде экзистенциального высказывания. Как может это помочь опровергнуть определенное тождество?
4.	Методом упр. 3 опровергните каждое из предполагаемых тождеств (здесь И — множество всех действительных чисел):
(a)	Vx*Sx;
(b)	sin х cos х = 1;
(с)	а ' + ЬХ = (а+ />)*
8 Зак, 994.
114
Гл. II. Множества и подмножества
5. Пусть 2/ — множество всех действительных чисел. Покажите, что каждое из приведенных ниже высказываний справедливо, по крайней мере для одного значения х, но не справедливо для любого х из 11'.
(а)	х2 > х\
(Ь)	(х 4-1)3 = х3 +1;
(с)	sin х = — cos х.
S. Докажите, что если универсальное высказывание истинно в данном множестве логических возможностей, то оно истинно и в любом подмножестве этого множества. Покажите, что в то же время это не всегда справедливо для экзистенциальных высказываний.
7. Покажите, что 2Р— 1 простое число, если р=2, 3, 5, 7, но не при р = 11.
§ 10. ДВОИЧНЫЕ ЧИСЛОВЫЕ СИСТЕМЫ
О
Фиг. 68
0 0
О 1
1
В десятичной системе счисления любое число может быть записано посредством всего лишь десяти цифр: 0, 1,2, 3, 4, 5, 6, 7, 8, 9. Могут быть построены и другие числовые системы, использующие большее или меньшее число цифр. По-видимому, простейшей числовой системой является двоичная числовая система, использующая только две цифры 0 и 1. Мы рассмотрим все возможные способы построения числовых систем, использующих только две эти цифры.
Основными арифметическими операциями являются сложение и умножение. Чтобы овладеть какой-либо арифметической системой, надо уметь складывать и умножать
любые две цифры. Так, для понимания десятичной системы надо изучить таблицу сложения и таблицу умножения, содержащие по сто элементов (от 0 + 0 = 0 до 9 + 9=18 соответственно от 0-0 = 0 до 9-9 = 81). Для понимания двоичной системы надо изучить таблицы сложения и умножения, содержащие всего лишь по четыре элемента. Эти таблицы изображены на фиг. 68.
Изображенная здесь таблица умножения полностью определяется двумя известными правилами, согласно которым умножение любого числа на нуль дает нуль, а умножение любого числа на единицу оставляет его без изменения. Для сложения у нас имеется только правило, согласно которому прибавление нуля к любому числу не меняет этого числа. Этого правила достаточно для заполнения всех мест изображенной на фиг. 68 таблицы сложения, кроме одного. Нам еще остается решить, чему должна равняться сумма 1 + 1.
Каковы возможные пути заполнения пустого места в таблице сложения? Однозначных чисел имеется только два: 0 и 1,
§ 10. Двоичные числовые системы
115
и каждое из них приводит к интересной системе. Если обратиться к возможным двузначным числам, то мы видим, что 00 и 01 не отличаются соответственно от 0 и 1 и потому не дают ничего нового. Число 11 или любое другое большее число ввело бы в таблицу «скачок», так что в качестве единственной возможности остается 10. Таблицы сложения в этих трех различных числовых системах показаны на фиг. 69; таблица умножения для всех систем та же, что и на фиг. 68. Каждая из этих систем представляет значительный интерес, как покажут дальнейшие интерпретации.
Целое положительное число может быть либо четным, либо нечетным. Условимся называть его числом рода 0 в первом случае и числом рода 1 во втором случае. Рассмотрение таблицы, изображенной на фиг. 69, а вместе с таблицей умножения, убеждает нас в том, что первая из наших числовых систем может служить для определения рода суммы или произведения двух целых положительных чисел в зависимости от
*	о	/
О	О	I
1	I	о
♦	О	Г
О	О	I
I	/	1
б
Фиг. 69
рода каждого числа. Так, 0-1=0 говорит нам, что умножение четного числа на нечетное число дает четное число, тогда как 1 + 1=0 показывает, что сложение двух нечетных чисел дает четное число, и т. д. Таким образом, первая числовая система совпадает с той системой, которая получается из арифметики целых положительных чисел, если мы будем принимать во внимание только четность или нечетность чисел; она называется арифметикой вычетов по модулю два.
Вторая система счисления, таблица сложения которой изображена на фиг. 69, б, интерпретируется на языке множеств. Пусть О соответствует пустому множеству, а 1 соответствует универсальному множеству 21. Грусть сложение чисел соответствует объединению множеств, а умножение чисел соответствует пересечению множеств. Тогда 0-1=0 говорит о том, что O[\U = O, а 1 + 1 = 1, что#и& = &. Интерпретация в терминах множеств других арифметических действий, возможных в этой числовой системе, предоставляется читателю. Эта арифме
8*
116
Гл. II. Множества и подмножества
тическая система представляет собой простейший пример алгебры Буля (см. § 4 этой главы).
Наконец, третья числовая система, таблица сложения которой изображена на фиг. 69, в, представляет собой так называемую двоичную систему счисления. Каждое обычное целое число может быть записано в виде двоичного целого числа. При этом двоичный 0 соответствует обычному нулю, а двоичная 1—обычной единице. Двоичное число 10 означает «единицу более высокого порядка» и соответствует обычному числу два (не десяти!). Двоичное число 100 означает тогда два, взятое дважды, т. е. четыре. Вообще, если двоичное число записано в виде bnbn .J ... Ъ2Ь]Ьй, где каждая цифра есть либо 0, либо 1, то соответствующее обычное целое число I определяется по формуле
/ = Ьп • 2я 4-	•2я 14- ... 4- Ь2 • 22 4~ bv • 2 4- bG.
Таким образом, двоичному числу 11 001 соответствует 24 + 234-+ 1 — 16 + 8 + 1 = 25. В изображенной из фиг. 70 таблице указаны некоторые двоичные числа и их («десятичные») эквиваленты.
Двоичное число	1	10	11	100	101	110	111	1000	1001	1010	1011	1 100	10000	100000
Целое число	1	2	3	4	5	6	7	8	9	10	11	12	16	32
Фиг. 70
Двоичная система обозначений позволяет значительно упростить процедуру выполнения арифметических операций. Для того чтобы выполнять сложение, достаточно пользоваться только двумя правилами: прибавление 0 к числу не изменяет этого числа и 1 + 1 = 10. Используем эти правила для того, чтобы вычислить сумму десяти и одиннадцати (см. таблицу, изображенную на фиг. 70):
10 10
10 11
10 10 1
Характер выполненных операций очевиден, если помнить, что 4 4-1 = 10, и следовательно, мы должны перенести на один
§ 10. Двоичные числовые системы
117
разряд единицы из второго и четвертого столбца. В результате получим
1 - 244-0 - 25-Ы •22+0-21-|-1 •2°=21.
Умножение в двоичной системе оказывается даже еще более простым. Здесь, как и в десятичной системе счисления, мы умножаем последовательно на каждый разряд, а результаты складываем между собой. При этом мы пользуемся двумя чрезвычайно простыми правилами: произведение числа на 0 есть 0, а произведение числа на 1 есть само это число. Умножим, например, 5X5. Так как двоичным эквивалентом числа 5 служит число 101, то умножение производится следующим образом:
101
101
101
ООО
101
11001
В ответе получилось двоичное число 11001, которое, как мы видели выше, эквивалентно числу 25.
Вот несколько более сложный пример: возведем в квадрат число 10 (см. таблицу, изображенную на фиг. 70):
1010
1010
0000
1010
0000
1010
1100100
В результате получаем
1 • 26-1-1 • 25 +1 -22=100.
Такое упрощение арифметических операций при использовании двоичной системы привело к тому, что эта система широко применяется в современных быстродействующих электронных вычислительных машинах. В этих машинах каждый разряд моделируется электронной лампой (или другим аналогичным
118
Гл. II. Множества и подмножества
электронным устройством) и считается, что двоичное число в этом разряде равно 1, если через лампу течет ток, и равно О, если ток не идет. Арифметические операции, описанные выше, выполняются простейшими электрическими цепями.
Упражнения
1.	Завершите интерпретации таблиц сложения и умножения для систем счисления, представляющих: (а) четность или нечетность, (Ь) множества И и О.
2.	(а) Укажите двоичные числа, которые соответствуют числам 11; 20; 52; 75; 80; 128; 144; 200.	[Отв.: 1010000 соответствует 80.]
,	(Ь) Укажите числа, которые соответствуют двоичным числам 1111,
1000000, 1010101, 11011011.	[Отв.: 1010101 соответствует 85.]
3.	Используя результаты упр. 2, выполните в двоичной системе следующие • операции сложения. Проверьте полученные результаты,
(а) 20-4-80;
(Ь) 75 4-80;
(с) 128+128;
(d) 128 4-200;
(е) 80 + 200.
4.	Используя результаты упр. 2, выполните в двоичной системе следующие операции умножения. Проверьте полученные результаты
(а)	20 X 20;
(Ь)	20 X 80;
(с)	128X 128.
5.	Используя результаты упр. 2, выполните в двоичной системе операцию вычитания 200—128.
6.	Как определить, является ли четным или нечетным число, записанное по двоичной системе счисления?
7.	Какие из приведенных ниже законов действуют в каждой из рассмотренных в этом параграфе трех числовых систем?
(а)	* + у = у + -к.
(Ь)	х + л = л.
(с)	х + х + х = х.
8.	Условимся понимать под «суммой» а+b наибольшее из чисел а и b, а под «произведением» а • b — наименьшее из них. Напишите таблицы «сложения» и «умножения» для чисел а и Ь. Сравните результат с тремя выше-, приведенными системами.
[Отв: Те же таблицы, что н в случае 21, б-системы.]
9.	Что говорят о второй рассмотренной нами числовой системе законы А1—А10 из § 4 этой главы?
10.	Первую из рассмотренных нами числовых систем можно представлять себе как систему, в которой производятся действия с остатками от деления
§ 10. Двоичные числовые системы
119
целых чисел на 2. Для четного числа такой остаток равен 0, для нечетного 1. Постройте таблицы сложения и умножения для остатков от деления целых чисел на 3,	[Указание. Это будет 3 X 3-таблицы.]
11.	Мы хотим занумеровать все подмножества четырехэлемеитного множества 2/. С этой целью построим для каждого такого подмножества двоичное число, определенное следующим образом: расположим в определенном порядке элементы данного множества; пусть первой цифрой конструируемого числа будет 1 в том и только том случае, если первый элемент множества V. принадлежит рассматриваемому подмножеству; второй цифрой числа будет 1 в том и только том случае, если второй элемент U содержится в этом подмножестве, и т. д. Докажите, что при этом каждому подмножеству отвечает единственное двоичное число, заключенное между 0 и 15.
12.	Используйте метод упр. 11 для того, чтобы перенумеровать все подмножества множества U — [а, Ь, с].
13.	Используйте метод упр. 11 для того, чтобы доказать, что число собственных н несобственных подмножеств множества из п элементов равно 2".
14.	В тесте многократного выбора1) ответы занумерованы числами 1, 2, 4 и 8. Студентам сказали, что среди этих ответов правильными могут быть один или более и может вообще не быть правильных ответов. Студентов попросили складывать номера правильных ответов или писать О, если никакой ответ не является правильным.
(а)	Используя результаты упр. 11 показать, что результат такого сложения дает преподавателю всю информацию, какая ему требуется.
(Ь)	Для данного вопроса правильная сумма равна 7. Три студента указали соответственно числа 4, 8 и 15. Какой ответ наиболее близок к истине? Какой ответ хуже всех?
[Отв.: 15 — наилучший, 8 — наихудший.]
15.	Объясните смысл числа 2907, записанного в обычной десятичной системе счисления по аналогии с формулой для числа /. записанного в двоичной системе счисления.
16.	В троичной системе счисления числа изображаются цифрами 0, 1 и 2, так что, например, 201 .в этой системе означает 2  З2 + 0 • 3 4- 1 • 1 = 19.
(а)	Запишите в троичной системе все целые числа от 1 до 30.
(Ь)	Постройте таблицу сложения и умножения для цифр 0, 1 и 2.
(с)	Выполните в этой системе умножение 5*5. Проверьте полученный ответ.
17.	Представьте числа 80 и 200 в системе счисления с основанием 8 (восьмеричная система счисления). Сложите получившиеся числа и проверьте результат.
18.	Сравните операцию сложения, составляющую содержание упр. 17, с операцией сложения из упр. 3 (е). Исходя отсюда, определите, как можно использовать восьмеричную систему в качестве сокращенной формы записи действий, производимых в двоичной системе 2).
[Указание. Каждый разряд восьмеричной системы замещает три разряда двоичной системы.]
') Тест многократного выбора заключается в том, что на каждый вопрос дается несколько ответов, из которых испытуемый должен выбрать правильный.
2) Отмеченная в этом упражнении связь между двоичной и восьмеричной системами счисления также нередко используется в современных электронных счетных машинах.
120
Гл. II. Множества а подмножества
§ 11*. ГОЛОСУЮЩИЕ КОАЛИЦИИ
В качестве применения наших понятий, относящихся к множествам, рассмотрим роль коалиций в голосующих группах людей. Универсальным множеством здесь будет некоторое множество людей, которые образуют принимающую решения группу. Примерами такого универсального множества могут служить члены какого-нибудь комитета, городского совета или парламента, участники конференции или собрания и т. д. Каждый член может иметь некоторое количество голосов. Решение о проведении или непроведении какой-то меры может приниматься простым большинством или большинством в 2/з °т общего числа голосов и т. д.
Теперь допустим, что некоторое подмножество членов группы образует коалицию с целью проведения какой-то меры. Весь вопрос в том, располагают ли они достаточным числом голосов, обеспечивающим проведение этой меры. Если они имеют число голосов, достаточное для проведения этой меры, то мы скажем, что они образуют выигрывающую коалицию. Если члены, не входящие в эту коалицию, могут провести свое решение вопреки желанию рассматриваемой группы, то мы скажем, что первоначальная коалиция — проигрывающая. Наконец, если члены этой коалиции ие могут сами по себе провести никакого решения и если члены, не принадлежащие коалиции, также не могут провести никакого решения, то рассматриваемую коалицию назовем блокирующей.
Переведем эти определения на язык теории множеств. Коалиция С называется выигрывающей, если она располагает числом голосов, достаточным для предрешения исхода; коалиция С называется проигрывающей, если коалиция с — выигрывающая; наконец, коалиция С называется блокирующей, если ни С, ни С не есть выигрывающая коалиция.
Следующие факты вытекают непосредственно из этих определений. Дополнением выигрывающей коалиции является проигрывающая коалиция. Дополнением проигрывающей коалиции является выигрывающая коалиция. Дополнением блокирующей коалиции является блокирующая коалиция.
Пример 1. Комитет состоит из шести человек, имеющих по одному голосу каждый. Исход решается простым боль шинством голосов. Тогда любая коалиция из четырех или более членов будет выигрывающей, любая коалиция из одного или двух членов будет проигрывающей и любая коалиция из трех членов — блокирующей.
Пример 2. Допустим, что в примере 1 одному из шести членов (скажем, председателю) дано право решающего
§ 11 *. Голосующие коалиции
121
голоса в случае равного счета голосов в двух группах. Тогда любая коалиция из трех членов, в которой он участвует, будет выигрывающей, в то время как другая коалиция из трех членов будет проигрывающей; следовательно, здесь нет блокирующих коалиций. Другие коалиции будут те же, что и в примере 1.
Пример 3. Пусть универсальным множеством И служит множество {х, у, w, г], где х и у имеют по одному голосу каждый, w имеет два голоса и z имеет три голоса. Допустим, что для проведения данной меры требуется пять голосов. Тогда выигрывающими будут коалиции {z, w}, {г, х, у}, {z, w, х}, {z, w, у} и 21. Проигрывающими коалициями будут дополнения этих множеств. Блокирующими коалициями будут {z}, {z, х}, {г, у}, {u>, х}, {w, у} и {ы, х, у}.
Последний пример показывает, что иногда нет необходимости перечислять все члены выигрывающей коалиции. Например, если коалиция {z, w} выигрывающая, то очевидно, что коалиция {z, w, у} также будет выигрывающей Вообще, если какая-то коалиция С выигрывающая, то всякое другое множество, имеющее С своим подмножеством, также будет выигрывающей коалицией. Таким образом, мы приходим к понятию минимальной выигрывающей коалиции. Минимальная выигрывающая коалиция—это такая выигрывающая коалиция, которая не содержит в качестве своего собственного подмножества никакой другой выигрывающей коалиции. Иначе это можно выразить так: минимальная выигрывающая коалиция — это такая выигрывающая коалиция, которая перестает быть выигрывающей, если она теряет одного своего члена.
Зная минимальные выигрывающие коалиции, мы тем самым знаем о проблеме голосования все, что нам нужно. Выигрывающими коалициями будут все те множества, которые содержат некоторую минимальную выигрывающую коалицию, а проигрывающими коалициями будут дополнения выигрывающих коалиций. Все остальные множества суть блокирующие коалиции.
В примере 1 минимальными выигрывающими коалициями являются множества, состоящие из четырех членов. В примере 2 минимальными выигрывающими коалициями являются все трехчленные коалиции, в которые входит член комитета, имеющий решающий голос, а также коалиции из четырех членов, не содержащие этого члена комитета. Минимальными выигрывающими коалициями в третьем примере являются множества {z, w) и {г, х, у}.
122
Гл. II. Множества и подмножества
В некоторых случаях те или иные члены комитета наделены специальными правами или ограничены в правах. Если какой-нибудь член может единолично провести любую меру, мы назовем его решающим членом комитета. Таким образом, член комитета х будет решающим тогда и только тогда, когда {%} — выигрывающая коалиция.
Несколько более слабым, но все же очень могущественным членом комитета является тот, который может единолично блокировать любую меру. Такого члена комитета х мы назовем блокирующим членом комитета; очевидно, что это будет иметь место тогда и только тогда, когда коалиция {%} — блокирующая. Наконец, если х не является членом ни одной минимальной выигрывающей коалиции, то мы назовем его бесправным членом комитета. Таким образом, х бесправен в том и только в том случае, если любая выигрывающая коалиция, членом которой х является, будет выигрывающей коалицией и без него.
Пример 4. Интересным примером группы, принимающей решения, служит Совет Безопасности Организации Объединенных Наций. Совет Безопасности состоит из одиннадцати членов: пяти постоянных представителей великих держав, называемых Большой пятеркой, и шести представителей малых наций. Для принятия Советом какой-то меры необходимо, чтобы за нее проголосовали семь членов, включая Большую пятерку. Таким образом, семичленные множества, состоящие из Большой пятерки и двух представителей малых наций, образуют минимальные выигрывающие коалиции. Следовательно, проигрывающими коалициями будут те множества, которые состоят из четырех или менее представителей малых наций. Блокирующими коалициями будут те множества, которые не являются ни выигрывающими, ни проигрывающими. В частности, любое единичное множество, состоящее из одного представителя Большой пятерки, является блокирующей коалицией. В этом смысле каждый член Большой пятерни является блокирующим членом Совета Безопасности. Решающих и бесправных членов Совет Безопасности не содержит. [Возможность «воздержания» несущественна в предыдущем рассуждении.]
Упражнения
1 В комитет входят члены w (председатель), х, у и 2. Председатель w имеет два голоса, остальные члены комитета имеют по одному голосу каждый. Перечислите выигрывающие, проигрывающие' и блокирующие коалиции.
§ It *. Голосующие коалиции
123
2.	Комитет состоит из п членов, имеющих по одному голосу каждый. Исход решается большинством голосов. Какими будут выигрывающие, проигрывающие и блокирующие коалиции?
3.	Муниципальный совет, утверждающий нью-йоркский городской бюджет, состоит из восьми членов, голоса которых распределены следующим образом:
Мэр	3	голоса
Инспектор	3	голоса
Председатель совета	3	голоса
Президент района Бруклин 2 голоса
Президент района Манхеттен 2 голоса
Президент района Бронкс 1 голос Президент района Ричмонд 1 голос Президент района Квинсленд 1 голос
Исход решается простым большинством голосов. Перечислите минимальные выигрывающие коалиции. Перечислите блокирующие коалиции. Проделайте то же самое в предположении, что мэр имеет дополнительное право изменять решение в случае равенства голосов.
4.	В референдуме принимают участие 100 000 человек, имеющие по одному голосу каждый. Сколькими голосами должна располагать определенная партия для того, чтобы быть решающим участником референдума и сколькими для того, чтобы быть блокирующим участником?
[Отв.: 50001; 50000.1
5.	Если в условиях упр. 4 решение принимается большинством в 2/з голосов, то сколькими голосами должна располагать определенная партия для того, чтобы являться решающим или блокирующим участником референдума?	[Отв.: 66667; 33334.]
6.	Докажите, что если один из членов какого-нибудь комитета является решающим, то все остальные члены этого комитета бесправны
7.	По аналогии с минимальными выигрывающими коалициями можно определить максимальную проигрывающую коалицию. Каким соотношением связаны максимальные проигрывающие и минимальные выигрывающие коалиции? Дают ли максимальные проигрывающие коалиции всю информацию о возможных исходах голосования?
8.	Докажите, что любые две минимальные выигрывающие коалиции имеют по меньшей мере одного общего члена.
9.	Найдите блокирующие коалиции в примере Совета Безопасности.
10.	Докажите, что если некое лицо является блокирующим членом комитета и если оно совместно с некоторым другим членом может провести угодное им решение, то распределение остальных голосов уже никакой роли не играет.
ЛИТЕРАТУРА ДЛЯ ДОПОЛНИТЕЛЬНОГО ЧТЕНИЯ
Тарский А., Введение в логику и методологию дедуктивных наук, М., ИЛ, 1948, гл. IV.
Кальбертсон Дж. Т,, Математика и логика числовых устройств М.. Учпедгиз (в печати), гл. IV и VI.
Б е р к л и Э., Символическая логика и разумные машины, М., ИЛ, 1961, гл. 5, 6 н 12.
Новиков П. С., Элементы математической логики, М„ Физматгиз, 1959, гл. III.
Я г л о м А. М. и Я г л о м И. М., Вероятность и информация, М., Физматгиз, 1960, § 4 гл. I.
Д ы н к и н Е. Б. и Успенский В. Г., Математические беседы, М,—Л , Гостехиздат, 1952, гл. I раздела 2.
Глава III
РАЗБИЕНИЯ И СОЧЕТАНИЯ
§ 1.	РАЗБИЕНИЯ
Задачу, изучаемую в этой главе, удобнее всего описывать в терминах разбиений множества. Разбиением множества U называется подразделение этого множества на непересекающиеся и исчерпывающие его подмножества, так что каждый элемент И принадлежит одному и только одному из подмножеств. Подмножества А[ в таком разбиении называются ячейками. Итак |Д, А2, ..., Д.] будет разбиением множества U, если выполнены два условия: (1) ДпД = ^ при 14= j (ячейки не пересекаются) и (2) Ди AU - U Ar~U (эти ячейки исчерпывают все множество 11).
Пример 1. Если U— [a, b, с, d, е], то J{a, b}, (е, d, е}|, [{ft, с, е], {а}, {</}] и [{а), {&}, (с), {</}, {<?}] представляют собой три различных разбиения множества U. Последнее из них является разбиением на единичные подмножества.
Переход от детального анализа множества логических возможностей к менее детальному осуществляется фактически посредством некоторого разбиения. Например, рассмотрим логические возможности для исходов первых трех встреч команд Янки и Доджерс в первенстве США по бейсболу. Перечислим все возможности, указывая победителя каждой игры:
{ЯЯЯ, ЯЯД, ЯДЯ, ДЯЯ, ЯДД, ДЯД, ДДЯ, ДДД1.
Отнеся к одной ячейке все исходы с одинаковым числом побед, одержанных Янки, мы получим разбиение
[{ЯЯЯ}> {ЯЯД, ЯДЯ, ДЯЯ}, {ЯДД, ДЯД, ДДЯ], {ДДД}{.
Таким образом, если мы интересуемся числом побед Янки в трех играх, то мы производим менее детальный анализ, полученный из предыдущего путем отождествления возможностей в каждой ячейке нашего разбиения.
§ I. Разбиения
125
Если [Ль А2, .... Аг] и [В], В2, ..., Вг] — два разбиения одного и того же множества то мы получаем новое разбиение, рассматривая систему всех подмножеств 21 вида AL П В (см. упр. 7). Это новое разбиение называется измельчением двух первоначальных разбиений.
Пример 2. Обычно измельчениями разбиений пользуются в проблеме классификации. Например, множество U всех живых форм можно подвергнуть разбиению [Ж, Р], где Ж означает множество всех животных, а Р — множество всех растений. Можно также образовать разбиение [В, С], где В — множество всех вымерших живых форм, а С — множество всех ныне существующих живых форм. Измельчение [Ж Л В, ЖпС, РПВ, Р П С] дает полную классификацию, соответствующую этим двум разным принципам классификации.
Многие из примеров, которые нам встретятся в дальнейшем, связаны с рассмотрением процессов, осуществляемых в несколько этапов. Разбиения и измельчения разбиений служат удобным средством для представления отдельных этапов процесса. Графическим представлением такого процесса служит, естественно, дерево. Например, предположим, что этот процесс состоит в последовательном узнавании значений истинности некоторого ряда высказываний, имеющих отношение к заданной ситуации. Если U—множество логических возможностей для этой ситуации и р — высказывание, относящееся к 22, то знание значения истинности р равносильно знанию того, какая из ячеек разбиения [Р, Р] содержит реализующуюся возможность. Напоминаем, что Р — это множество истинности высказывания р, а Р — множество истинности ~р. Допустим теперь, что мы выяснили значение истинности некоторого второго высказывания q. Эта информация опять-таки может быть описана посредством разбиения, именно [Q, Q]. Вместе эти два высказывания дают нам информацию, которая может быть представлена посредством измельчения этих двух разбиений:
[РПQ, PflQ, PflQ РПО].
Иначе говоря, если мы знаем значения истинности р и q, то мы знаем также, какая из ячеек этого измельчения разбиений содержит ту логическую возможность, которая описывает данную ситуацию. Обратно, если нам известно, какая из ячеек содержит эту возможность, то нам известны и значения истинности высказываний р и q.
Информация, получаемая от дополнительного знания значения истинности некоторого третьего высказывания г, имеющего
126
Гл. 111. Разбиения и сочетания
своим множеством истинности R, может быть представлена посредством измельчения трех разбиений [Р, Р], [Q. Q] и [/?, Р]. Этим измельчением будет
[PnQnP, PflQnP, PHQnP, PflQnP, PnQOP, PnQHP,
PnQOP, PnQOP].
Отметим, что теперь мы ограничили множество возможных вариантов указанием одной из 8 = 23 возможных ячеек Подобным же образом, если известны значения истинности п высказываний, то наше разбиение содержит 2П ячеек.
Если бы множество И содержало 220 (приблизительно один миллион) логических возможностей и если бы мы могли задавать вопросы, требующие ответа «да» или «нет», таким образом, чтобы знание значения истинности для каждого вопроса сокращало бы каждый раз число возможностей вдвое, то посредством двадцати вопросов мы смогли бы определить любую заданную возможность из множества И. Мы можем осуществить такой опрос, например, в случае, когда у нас имеется перечень всех возможностей и нам разрешается спрашивать «Лежит ли реализующаяся возможность в первой половине списка возможностей?», и если ответ утвердительный, то «Лежит ли она в первой четверти?» и т. д. На практике, как правило, у нас не имеется такого перечня, и мы можем осуществить указанную процедуру лишь приближенно.
Пример 3. В известной игре «двадцать вопросов» ’) является весьма обычной ситуация, когда отгадывающий стремится произвести разбиение описанного выше типа. Например, предположим, что задан какой-либо город. Отгадывающий может спросить: «Этот город в Северной Америке?», и если ответ утвердительный, то: «Он в Соединенных Штатах?», и если последует ответ «да», то: «Он лежит к западу от Миссисипи?», и если последует ответ «нет», то: «Он относится к Новой Англии * 2) ?», и т. д. Конечно, на самом деле при такой процедуре не происходит разделения возможностей в точности пополам. Если число всех возможностей не превышает миллиона, то с тем большей уверенностью можно ожидать получения ответа после двадцати вопросов, чем точнее разделение возможностей на две равные части в результате каждого из них
>) Эта игра требует от «водящего» определения заданного объекта с помощью 20 вопросов, на которые ему отвечают лишь «да» или «нет».
2) Так называют густонаселенный район на северо-востоке Соединенных Штатов, включающий в себя 6 штатов; этот район явился первым объектом европейской колонизации на территории США.
§ 1. Разбиения
127
Упражнения
1.	Пусть U — множество целых чисел от 1 до 6. Найдите измельчение следующих пар разбиений:
(а)	[{1, 2, 3}. {4, 5, 6}] и [{1, 4}, {2, 3, 5, 6}];
(b)	[{1, 2, 3, 4, 5), {6}] и [{1, 3, 5}, {2, 6}, {4}].
[Отв.: (а) {1}, {2, 3}, {4}, {5, 6}.]
2.	Монета бросается три раза. Дайте перечень возможностей выпадения монеты гербом или цифрой. Произведите разбиение множества возможностей таким образом, чтобы в одной и той же ячейке находились все те возможности, для которых число выпадений герба является одним и тем же.
3.	Пусть р и q— два высказывания, имеющие соответственно множества истинности Р и Q. Что можно сказать об измельчении подразделений [Я Р] и [Q, Q] в случае, когда	~
(а)	р влечет д)	[Отв.: Pf\Q^= О]
(Ь)	р эквивалентно д?
(с)	р и д несовместимы?
4.	Рассмотрим множество, составленное из восьми штатов США: Иллинойс, Колорадо, Мичиган, Нью-Йорк, Вермонт, Техас, Алабама и Калифорния, (а) Покажите, что путем трех вопросов, иа которые отвечают «да» или «нет», можно определить любой из этих восьми штатов.
(Ь) Придумайте систему из трех вопросов, ответы «да» или «нет» на которые могут быть даны независимо друг от друга и которые достаточны для определения любого из этих штатов.
5.	В некотором весьма подробном словаре на 3000 страницах имеется около 600 000 слов. Если из такого словаря выбирается одно слово, то возможно ли определить его посредством двадцати вопросов, на которые отвечают лишь «да» или «нет»? Если это возможно, то опишите используемую вами процедуру и исследуйте ее выполнимость.
[Отв.: Одно решение будет таково: 12 вопросов испульзуются для фиксации страницы; тогда для нахождения слова на этой странице достаточно 8-ми вопросов.]
6.	Мистер Джонс имеет двух родителей; каждый из его родителей имел двух родителей; каждый из последних также имел двух родителей, и т. д. Построение фамильного дерева иа 40 поколений назад (что составляет около 1000 лет) показывает, что мистер Джонс имеет 240 предков, что превышает численность всех людей, живших на Земле за последние 1000 лет. В чем ошибочность этого рассуждения?
7.	Пусть [Л|, А2, Аз] и [Bi, Вг] — два разбиения. Докажите, что измельчение этих двух разбиений действительно является разбиением, т. е. удовлетворяет требованиям (1) и (2), предъявляемым к разбиениям.
8.	Измельчение разбиений, образованных множествами истинности п высказываний, имеет 2" ячеек. Как мы видели в гл I, таблица истинности высказывания, составленного из п высказываний, имеет 2я строк. Какая имеется связь между этими двумя фактами?
9	Пусть р и q — высказывания с множествами истинности Р и Q; им отвечает разбиение [ДЛФ>	Р П Q> Р’ЛФ]- В каждом из следующих случаев
установите, какие из ячеек должны быть пустыми для того, чтобы данное высказывание было логически истинным:
(а)
(Ь) р++д;
(с) р\~р;
(«О р.
128
Гл. III. Разбиения и сочетания
10.	Разбиение [j4i, .42, ..., А„] называется вписанным в разбиение [Вь В2........Вт], если каждое Aj является подмножеством некоторого
Bj. Покажите, что измельчение двух разбиений вписано в каждое из этих разбиений.
11.	Возьмем разбиение контингента студентов высшего учебного заведения, произведенное в соответствии с делением на курсы. Разделение на учебные группы определяет другое разбиение. Покажите, что оно вписано в первое разбиение. Укажите третье разбиение, отличное от этих двух и не вписанное ни в одно нз них.
12.	Что можно сказать об измельчении двух разбиений, если одно из них вписано в другое?
13.	Имеется девять предметов, о которых известно, что восемь из них имеют одинаковый вес, а девятый несколько тяжелее остальных. Покажите, что более тяжелый предмет может быть отделен от других посредством двух взвешиваний на чашечных весах (без гирь).
14.	Предположим, что имеется тринадцать предметов, из которых двенадцать имеют одинаковый вес, а один предмет тяжелее или легче остальных (тяжелее или легче — неизвестно!). Покажите, что трех взвешиваний на чашечных весах без гирь достаточно для отделения этого предмета от двенадцати других’)•
15.	Полная классификация каких-либо объектов может быть произведена путем введения нескольких простых подразделений и взятия их измельчения. Так, например, университетские курсы могут быть подразделены по содержанию, числу слушающих курс студентов, их успеваемости, количеству часов в неделю и т. д.
Для каждого из следующих объектов определите пять или более разбиений и установите, сколько ячеек будет при полном измельчении всех разбиений в каждом случае-
(а) болезни; (Ь) анекдоты.
§ 2*. ПРИЛОЖЕНИЯ
Мы рассмотрим здесь три примера приложений понятия разбиений для математического описания различных ситуаций. Примеры такого рода получат более полное развитие в дальнейших главах.
1°. Простая игра. Смит и Джонс играют в следующую игру: Джонс прячет в кулаке казначейский билет достоинством либо в один, либо в два доллара. Смит старается угадать достоинство билета, и если это ему удается, он его получает. В одной из следующих глав мы рассмотрим вопрос о том, какую сумму должен внести Смит, чтобы эта игра была безобидной. Но сейчас нас интересует только описание возможностей для этой игры. Игра содержит два этапа: на первом Джонс выбирает билет достоинством в один или в два доллара; на втором Смит называет 1 или 2. Эти варианты можно представить на дереве с четырьмя ветвями (фиг. 71). Четыре возможные варианта игры
’) Ср., например, Ш к ля реки й Д. О., Ченцов Н. Н., Яглом И. М., Избранные задачи и теоремы элементарной математики, ч. I, М., Физматгиз, 1959, решение задачи 6 а).
§ 2 *. Приложения
129
представлены посредством четырех путей на дереве, которые мы обозначили at, а2, аз,
Развитие этой игры можно также представить с помощью последовательности трех разбиений:
начало:	[(йр а2, а3, а4}|;
выбор Джонса: [{«t, а2], [а3, а4}];
выбор Смита: [{flj}, [а2], {а3}, {а4}].
Отметим, что каждому уровню этого дерева соответствует некоторое разбиение. Ячейка этого разбиения, соответствующая
данному уровню, содержит все пути, проходящие через точку
разветвления на этом уровне.
Разбиения можно также использовать для указания возможностей влияния каждого игрока на исход игры. Влияние Джонса
может быть указано посредством разбиения [{«1, й2}, {й3, п4}]. От Джон-
Нет пищи
Пища
Ф н г. 72
са зависит, которая из двух ячеек этого разбиения будет участвовать в игре.
Аналогично этому Смит может предписать, какая из двух ячеек разбиения [{fli, йэ), {й2, й4}] участвует в игре. Конечное разбиение представляет собой измельчение этих двух разбиений.
2°. Пример из психологии. Предположим, что психолог производит следующий эксперимент с группой крыс. Каждой крысе предстоит при каждом испытании пробежать через Т-образный лабиринт (фиг. 72). Если крыса повернет направо, то она получит пищу, а если она повернет налево, то не получит пищи. В других экспериментах могут использоваться иные условия выдачи пищи. Например, пища может быть положена справа в 2/з всех испытаний или в любой другой их доле. Пищу можно даже класть каждый раз в стороне, противоположной той, в которую крыса повернула в предыдущем испытании Психолог интересуется предсказанием поведения группы крыс, подвергнутых последовательности таких испытаний.
9 Зак. 994..
130	Гл. 111. Разбиения и сочетания
Рассмотрим эксперимент описанного типа и обозначим через Л множество всех крыс, используемых в этом эксперименте. После того как все крысы пройдут лабиринт, можно образовать разбиение, отнеся к одной ячейке тех крыс, которые повернули направо, а к другой — тех, которые повернули налево. Таким образом, каждое испытание в этом эксперименте определяет некоторое разбиение множества Л. Разбиение, соответствующее n-му испытанию, обозначим [Пп, Л„], где П„ означает множество крыс, которые при n-м испытании повернули направо, а Лп — множество крыс, которые при этом повернули налево. Психолог хотел бы предсказывать некоторые свойства разбиений после большого числа экспериментов.
Например, он мог бы поставить следующие вопросы:
Если пищу всегда кладут справа, то совпадает ли П„ в конце концов со всем или почти со всем множеством Л ? Другими словами, будут ли крысы «обучены» поворачивать направо и получать пищу?
Что произойдет, если каждой крысе давать пищу лишь в 2/3 случаев, когда она поворачивает направо, и в ’/з случаев, когда она поворачивает налево?
Что произойдет, если экспериментатор при каждом испытании создает условия, противоположные поведению крысы в предыдущем испытании?
3°. Поведение маленькой группы людей. Некоторые социологи занимаются изучением поведения небольших групп лиц, которым поручено совместное решение какой-то задачи. Примером такой группы может служить суд присяжных, который должен вынести приговор заключенному. Прежде чем прийти к решению, члены этой группы посвящают много времени спорам и обсуждению, и эксперименты предназначены для изучения роли каждого субъекта в такой ситуации. В таком эксперименте наблюдатель записывает имя субъекта, делающего каждое замечание, вместе с именем того субъекта, к которому направлено это замечание. Иногда отмечается природа этого замечания, а также время, когда оно было сделано.
Рассмотрим эксперимент такого рода, произведенный над четырьмя лицами a, b, с, d. Пусть Л — множество всех сделанных замечаний. Образуем разбиение [Sc, Sb, Sc, SJ множества Л, где Sa — множество всех замечаний, сделанных a, Sb — множество всех замечаний, сделанных Ь, и т. д. Образуем также разбиение [Та, Ть, Тс, Td] множества Л, где Та — множество всех замечаний, адресованных к с, Ть~ множество всех замечаний, адресованных к Ь, и т. д.
Пусть, например, социолога интересует следующий вопрос. Упорядочим ячейки S-разбиения соответственно числу элемен-
§2*. Приложения
131
тов, имеющихся в каждой ячейке. Сохранится ли тот же порядок следования, если проделать то же самое с ячейками для Г-разбиения? Иначе говоря, справедливо ли следующее: лицу, сделавшему наибольшее число замечаний, адресовано ли также наибольшее число замечаний; лицо, стоящее на втором месте по числу сделанных замечаний, занимает ли второе место также и по числу замечаний, адресованных к нему, и т. д.?
Вторая проблема состоит в следующем. Предположим, что во множестве U произведено разбиение [t7i, th, U3], где U\ — множество замечаний, сделанных в первый промежуток времени, U2 — множество замечаний, сделанных во второй промежуток времени, и U3 — множество замечаний, сделанных в третий и заключительный промежуток времени. Тогда, если мы образуем измельчение этого разбиения и каждого из двух предшествующих, то мы будем иметь более тонкий анализ, который показывает изменение процесса обсуждения во времени. Например, такой анализ может показать, что дискуссия, которая велась в трех направлениях, перешла затем в двухстороннюю дискуссию. Может также обнаружиться, что некое лицо сделало много замечаний, но само вызвало их мало. Природа этих разбиений будет зависеть, конечно, от данной группы лиц и данного эксперимента.
Упражнения
1. У Джонса имеется две монеты, а у Смита — одна монета. Они условились сравнивать зажатые в кулаках монеты три раза, причем если монеты были зажаты у обоих в одной руке, их получает Джонс, а если в разных — Смит; возможно также, что игра кончится ранее трех партий тем, что один из играющих останется без денег. Нарисуйте дерево для представления возможных вариантов в этой игре. Покажите развитие этой игры при помощи последовательности разбиений.
[Отв.: Имеется четыре пути.] 2. Какую информацию дает измельчение разбиений [П1, Л1] и [П2, Л2] в эксперименте с поведением крыс?
3.	Предположим, что в эксперименте с поведением крыс психолог делает следующие допущения относительно результатов эксперимента при данных условиях выдачи пищи. При любом отдельном испытании 80% тех крыс, которые повернули направо при предыдущей попытке добраться до пищи, пойдет направо и при этой попытке, и 60% тех крыс, которые ранее повернули налево, сейчас пойдут направо.
(а) Если при первом испытании направо повернуло 50%, то какой процент можно ожидать во втором испытании? [Отв.: 74%.] (Ь) Если при первом испытании направо повернуло 75%, то какой процент повернувших направо крыс можно ожидать во втором испытании? В третьем? В сотом?
4.	Постройте дерево, представляющее 16 возможностей для четырех пробегов крысы через Т-образный лабиринт. Укажите те возможности, при которых крыса достигает успеха по крайней мере три раза, если:
9*
132
Гл. III. Разбиения и сочетания
(а)	пита кладется всегда справа;
(Ь)	сначала пища кладется справа, затем слева, затем опять справа н затем опять слева;
(с)	пища кладется сначала справа, а затем перекладывается в сторону, противоположную той, в которую крыса повернула в предыдущем испытании	[Отв.: Имеется пять таких путей.]
5.	Пусть в условиях упр. 4 крыса знает, что использован один из трех возможных способов кормления. Каким образом она может обеспечить себя пищей в трех испытаниях из четырех?
[Отв.: Пойти направо, налево, направо, направо.]
6.	Какую информацию может дать измельчение разбиений [5д, Sfc, S£, Srf] и [Та, Ть, Тс,Т^[ в примере, относящемся к поведению маленькой группы лиц?
7.	Предположим, что при изучении поведения небольшой группы лиц произведено разбиение [V, V] множества 11, где V есть множество всех замечаний, имеющих форму вопроса. Какую информацию доставит нам измельчение разбиений [V, V] и [Sfl, Sb, S£, S^]? Какую информацию доставит нам измельчение разбиений [V, V] и [L?i, 14, С?з]?
8.	Будем считать, что каждый житель США — либо республиканец, либо демократ. Начнем с разбиения людей, принадлежащих к данному поколению. Допустим, что подобное разбиение производится для их сыновей, для их внуков и т. д. на протяжении нескольких поколений. Какие вопросы мог бы рассмотреть, используя эти разбиения, ученый, изучающий политическую историю США?
9.	Предположим, что в данном поколении х человек являются республиканцами, а у человек — демократами. Пусть, кроме того, известно, что в каждом поколении среди сыновей республиканцев 20% демократов, а среди сыновей демократов — 30% республиканцев. Каким условиям должны удовлетворять числа х и у, чтобы процент республиканцев был одним и тем же в каждом поколении. Пусть общая численность жителей США в каждом поколении равна 50 миллионам. Имеется ли более чем один выбор чисел х и у, удовлетворяющих нашим условиям? Если нет, то чему должны равняться хну? [Отв.: Должно быть 30 млн. республиканцев.] 10. Предположим, что в стране имеется 30 млн. демократов и 20 млн. республиканцев. Известно, что р% детей демократов являются республиканцами и 9% детей республиканцев являются демократами. Пусть общее число жителей США остается равным 50 млн. Какому условию должны удовлетворять числа р и q, для того чтобы численность каждой партии оставалась неизменной? Имеется ли более одного выбора чисел р и Я, удовлетворяющих нашим условиям?
§ 3. ЧИСЛО ЭЛЕМЕНТОВ МНОЖЕСТВА
Вся оставшаяся часть настоящей главы будет посвящена некоторым задачам на вычисление. Для любого (конечного!) множества X мы будем обозначать через п(Х) число его элементов.
Предположим, что дано несколько множеств, число элементов каждого из которых нам известно, и мы хотим узнать, сколько элементов содержится в двух множествах, связанных с данными посредством операций объединения, пересечения и дополнения. В качестве примера рассмотрим следующую задачу.
£ 3. Число элементов множества
133
Нам сообщили, что 100 студентов изучают математику, а 150 студентов изучают экономику. Можем ли мы тогда сказать, сколько студентов изучают математику или экономику? Ясно, что ответ на этот вопрос будет отрицательным, так как нам, очевидно, надо еще знать, сколько студентов изучают оба эти курса. Если нам известно, что ни один студент не изучает оба курса, т. е. известно, что эти два множества студентов — непересе-кающиеся, то ответом будет служить сумма этих двух чисел, т. е. 250 студентов.
Вообще, если даны непересе-кающиеся множества Л и В, то справедлива формула
п (A U В) ~ п (А) Н- п (В).
Теперь предположим, что А и В пересекаются (фиг. 73). Множе
ство А можно разбить на две непересекающнеся подмножества А П В и А Л В. Аналогично множество В можно разбить на непересекающнеся подмножества АлВ и А Л В. Таким образом,
п (А) = п (А П В) + п (А Л В),
п (В) = п (Ал В) 4- п (А Л В).
Сложив эти два равенства почленно, получим
п (А) -I- п (В) = п (А Л В)4~п (А Л В) 4- 2п (А Л В).
Так как множества А Л В, АлВ и АЛВ попарно не пересекаются и объединением их служит множество A U В, то мы приходим к формуле
п (А) Д- п (В) — п (А и В) + п (А Л В), которая справедлива для любых двух множеств А и В.
Пример 1. Вернемся к нашим студентам, 200 из которых изучают математику, а 150 — экономику. Спрашивается, сколько студентов изучают либо тот, либо другой предмет? Так как
я (A U В) = w (А) + л(В) — п (А Л В),
где А есть множество студентов-математиков, В — множество студентов-экономистов, а число п (А Л В) нам не известно, то ясно, что на поставленный вопрос ответить
134
Гл. HI. Разбиения и сочетания
нельзя. Если же известно, что 20 студентов занимаются и тем и другим предметом, то тогда можно определить и число студентов, занимающихся по крайней мере одним из них; оно равно
200 + 150 — 20 = 330
Если ни один из студентов-математиков не занимается экономикой и ни один из студентов-экономистов — математикой, то, как мы уже отмечали, математиков и экономистов в совокупности будет 350 человек. Наконец, если каждый студент-экономист обязан изучать математику, то число студентов, изучающих хоть один из указанных предметов (быть может, и оба вместе), равно 200.
Пример 2. Пусть р и q — высказывания, относящиеся к множеству U логических возможностей. Обозначим через Р и Q множества истинности этих высказываний. Множеством истинности высказывания р V q служит Р U Q, а множеством истинности высказывания р Л q служит Р П Q. Таким образом, найденная формула дает нам возможность определить число случаев, когда р V q истинно, если известно число случаев, когда истинны р, q и р Л q-
Рассмотрим теперь более чем два множества. Можно вывести общую формулу для числа элементов множества, которое является объединением всех наших множеств (см. упр. 6), но обычно бывает удобней пользоваться диаграммой Венна. Предположим, например, что относительно группы в 30 студентов известно, что1)
19 студентов изучают математику,			
17	»	»	музыку,
И	»	»	историю,
12	»	»	математику и музыку,
7	»	»	историю и математику.
5	»	»	музыку и историю,
2	»	»	математику, историю и музыку.
Нарисуем диаграмму Венна (фиг. 74) и проставим на ней числа, показывающие число элементов каждого подмножества, двигаясь от конца нашего списка к началу. Так как 2 студента изучают все три предмета, а 5 изучают музыку и историю, то 3 изучают историю и музыку, но не математику и т. д. После
’) В США, как и во многих других странах, выбор предметов, изучаемых в высшем учебном заведении (да и в старших классах средней школы), в значительной степени зависит от учащегося.
$ 3. Число элементов множества
135
простановки всех цифр мы можем для любого сочетания пред* метов прочесть на диаграмме, каково число студентов, соответствующих этому сочетанию. Например, число изучающих историю, но не математику, равно 3+1=4.
Пример 3. Исследование рака. Следующее рассуждение часто встречается в статистических исследованиях о влиянии курения на заболевание раком легких. Пусть исследование показало, что доля курильщиков среди тех, кто болен раком легких, больше доли курильщиков среди тех, кто не болен раком легких. Утверждается тогда, что процент курильщиков, болеющих раком легких, больше, чем процент некурящих, больных этой болезнью. Докажем это.
Пусть К означает множество курильщиков, а Р означает множество всех людей, больных раком легких. Пусть далее
а — п(К{\Р), Ь=п(К[\Р}, с = п(К[]Р) и d = n(/((]P), как обозначено на фиг. 75. Интересующие нас проценты равны
_ а	_ с „ _ а	6
Р* а + b ’ Р* с + d ’ Ръ а + с ’ b d ’
vjj,e pi — доля курящих среди больных раком легких, р2 — доля курящих среди не больных раком легких, рз — доля больных раком легких среди курящих и р4 — доля больных раком легких среди некурящих.
Мы утверждаем, что если р\ > р2, то р3 > р4. Предпо-а ~ с ложение -	, > истинно тогда и только тогда, когда
ci —j— и	с —г- а
ас + ad > ас + Ьс, т. е. тогда и только тогда, когда ad > be. Заключение а_[_с > b~\~d истинно тогда и только тогда,
136
Гл. Ш. Разбиения и сочетания
когда ab + ad > ab + Ьс, т. е. тогда и только тогда, когда ad > be. Таким образом, высказывания Р\ > р? и рз > pt эквивалентны, что нам и требовалось доказать.
Упражнения
1	В примере, которому отвечает фиг. 74, найдите:
(а)	число студентов, изучающих математику, но не изучающих историю;
(Ь)	число студентов, изучающих в точности два предмета из трех;
(с)	число студентов, изучающих лишь один из перечисленных предметов или ни одного из них.
2	Лекции по химии посещают 20 студентов, а лекции по психологии — 30 студентов. Найдите число студентов, посещающих лекции по психологии или лекции по химии, если:
(а)	эти лекции происходят в одно время;	[Отв.: 50.]
(Ь)	эти лекции происходят в разные часы, и 10 студентов слушают оба курса.	[Отв.: 40.]
3.	Множество истинности высказывания р состоит из 10 элементов, а множество истинности высказывания q состоит из 20 элементов. Найдите число элементов множества истинности высказывания р\/ q, если
(а)	р и q несовместимы;
(Ь)	р и q совместимы и множество истинности высказывания р f\q состоит из 2 элементов.
4.	Пусть р — высказывание, которое истинно в десяти случаях, a q — высказывание, которое истинно в пяти случаях. Найдите число случаев, в которых истинно как р, так и q, если известно, что р\/ q истинно в десяти случаях. Каким логическим отношением связаны р и у?
5.	Допустим, что имеется 5 больных раком легких на каждые 100 000 человек и что, согласно подсчету, курят 75% всех больных раком легких и 60% из тех, кто не болен этой болезнью. (Эти цифры вымышленные.) Подсчитайте долю больных раком легких среди курильщиков и среди некурящих.	[Отв.: 18,75 и 9,375 на 100 000.]
6.	Пусть А, В н С — любые три подмножества универсального множества 11 Нарисуйте диаграмму Венна и покажите, что
п (Л U В (J С) = п (Л) п (В) + п (С) —
-л(ЛПб)-И(ВЛ0-«(ЛЛС)+л(ЛПВПС).
7.	Проанализируйте следующие данные и нарисуйте диаграмму Венна, аналогичную изображенной на фиг. 74. В предположении, что каждый учащийся в школе изучает хоть один из указанных трех языков, найдите общее число учащихся в школе.
(а)	(Ь)			
28	36 учащихся изучают английский,			
23	23	»	»	французский,
23	13			немецкий.
12	6			английский и французский,
11	11			английский и немецкий,
8	4		»	французский и немецкий,
5	1	»	»	все три языка.
Объясните	результат	в	случае (Ь)<	
§ 4. Перестановки
137
8 Пусть при обследовании читательских вкусов студентов оказалось, что
60%	студентов читает журнал А,
50%	»	» журнал В,
50%	»	» журнал С,
30%	»	» журналы А и В,
20%	»	»	» В и С,
30%	»	»	» А и С,
10%	»	» все три журнала.
(а) Сколько процентов студентов читает в точности два журнала?
[Отв.: 50.]
(Ь) Сколько процентов не читает ии один из этих журналов? [Отв.: 10.]
9.	Если р и ?— эквивалентные высказывания и п (Р) =10, то чему равно n(PUQ)?
10.	Докажите, что если из р следует q, то n(P(]Q) *= п (Р) + п (Q).
11.	В трансконтинентальном самолете находится: 9 мальчиков, 5 американских детей, 9 взрослых мужчин, 7 иностранных мальчиков, 14 американцев, 6 американцев мужского пола и 7 иностранок женского пола. Сколько всего людей было в самолете?	[Отв.: 33]
§ 4. ПЕРЕСТАНОВКИ
Здесь мы хотим рассмотреть вопрос о числе способов расположения п различных объектов какой-то группы. Расположение п различных объектов в заданном порядке называется перестановкой этих п объектов. Сначала рассмотрим случай, когда имеется три объекта а, b и с. Возможные перестановки этих
трех объектов можно представить это показано на фиг. 76. Каждый путь изображает одну возможную перестановку, и всего таких путей шесть. Мы можем также перечислить эти перестановки:
abc, Ьса, acb, cab, bac, с ba.
в виде путей на дереве, как
Построив такое дерево для п	Ф и г. 76
объектов, мы бы нашли, что для получения общего числа путей надо перемножить числа п. п— 1, п — 2 и т. д. до числа 1. Число, получаемое таким образом, встречается столь часто, что заслуживает специального обозначения: его записывают символом и!, который читается «п факториал». Например, 3! = 3 • 2 • 1 =6, 4! = 4 • 3 ‘ 2 • 1 = 24 И т. д. По причинам, которые станут ясны позднее (см, упр. 2 и
138
Гл. III. Разбиения и сочетания
9 из § 5), мы полагаем 0! = 1. Таким образом, имеется п! различных перестановок и отличимых один от другого объектов.
Пример 1. Предположим, что мы имеем семь карточек, на каждой из которых написана одна буква, и мы хотим с их помощью образовать все слова из семи букв. Если эти семь букв все различны, то мы должны рассмотреть 71=5040 разных «слов» (большинство из которых, разумеется, будут бессмысленными).
Пример 2. Вратарь десять раз выбрасывает мяч в игру. Предположим, что тренер рекомендовал ему подавать мяч каждый раз другому игроку своей команды. Сколько возможных вариантов может выбрать вратарь? Поскольку футбольная команда состоит из 11 игроков (т. е., помимо вратаря, имеется еще 10 игроков команды), то вратарь может выбрать любой из 10! = 3 628 800 порядков выбрасывания мяча.
Пример 3. Сколькими способами могут расположиться за круглым столом п человек? При такой постановке вопроса обычно подразумевается, что два расположения считаются различными тогда и только тогда, когда в этих двух случаях хоть один из сидящих за столом людей имеет с какой-либо стороны (например, слева от себя) разных соседей. Зафиксируем положение одного человека. Тогда остальные могут расположиться (л— 1)! способами. Теперь мы учли все расположения, которые считаются различными. Почему?
Общий принцип. Существует много комбинаторных задач, в которых невозможно указать простую формулу для числа допускаемых задачей логических возможностей. Во многих из таких задач единственный способ подсчета числа возможностей состоит в построении соответствующего дерева (см. упр. 4). В некоторых задачах оказывается полезным следующий общий принцип:
Пусть некоторый выбор может быть сделан в точности г различными способами; для каждого из этих способов некоторый второй выбор может быть сделан в точности s различными способами; для каждой пары первых двух выборов некоторый третий выбор может быть сделан в точности t способами и т. д. Тогда число способов для последовательности этих выборов получается перемножением соответствующих чисел, т. е. равно г -s  t....
Справедливость этого общего принципа можно проверить, представив себе дерево всех возможных способов, какими может быть сделана данная последовательность выборов. Из начального положения должно отходить г ветвей. От каждой та-^ой ветви должно отходить s новых ветвей, от каждой из них i
§ 4. Перестановки
13§
ветвей, и т. д. Число путей на этом дереве равно произведению r-s -1....
Пример 4. Число перестановок п различных объектов Может быть получено как частный случай этого принципа. Если требуется перебрать все возможные перестановки, тО для выбора первого объекта имеется п возможностей; для выбора второго объекта в каждом случае остается уже только п — 1 возможностей и т. д. Наконец, мы придем к последнему объекту, для которого имеется только одна возможность. Таким образом, всего имеется п(п — 1)...1 == = п\ возможностей.
Пример 5. Если имеется три дороги, ведущие от городаХ к городу Y, и две дороги, ведущие от города Y к городу Z, то из города X в город Z можно проехать через город Y 3-2 = 6 различными путями.
Пример 6. Предположим, что в соревновании или конкурсе участвуют п человек. Трое судей должны независимо друг от друга перенумеровать эти п лиц в порядке, отражающем их успехи в соревновании (по мнению судьи). Лицо считается победителем, если его назовут первым по крайней мере двое судей из трех. Какая доля всех возможных заключений судей, характеризующаяся тем, что один из участников объявляется победителем? Мы будем вместо этого искать долю тех заключений судей, при которых победителя установить не удается. Искомая доля получится вычитанием найденного числа из 1. Косвенный подход такого рода при решении задач часто бывает эффективнее, нежели прямой подход. Общее число возможных заключений равно (п!)3, так как каждый судья может упорядочить п участников соревнования п\ различными способами. Если какое-то заключение судей не позволяет установить победителя, то это значит, что у всех трех судей первыми в списке указываются разные лица. Согласно нашему общему принципу, такой выбор первых лиц может быть сделан п(п—1)(п — 2) различными способами. Для каждого из возможных выборов трех первых лиц имеется еще [(и—I)!]3 способов перечисления остальных участников. Таким образом, число заключений судей, не ведущих к установлению победителя, равно п(п — 1) (п — 2) [ (п — 1) !]3. Разделив это число на (и!)3, получим число
(п-1)(л-2) л2 ’
показывающее, какая доля заключений судей не дает желательного результата (заключающегося в объявлении
140
Гл. fl/. Разбиения и сочетания
одного из участников соревнования победителем) Доля заключений, при которых один из участников оказывается победителем, может быть найдена вычитанием этого числа из 1, что дает
Зл —2 п2 •
Для случая трех участников мы видим, что 7/s всех возможностей приводят к установлению победителя. В этом случае описанная процедура может быть подвергнута критике на том основании, что если даже судьи совсем некомпетентны или результаты участников практически одинаковы, так что заключения судей имеют чисто случайный характер, то все же имеется весьма много шансов, что на основании их отзывов какой-то участник состязания окажется победителем. Если же п = 10, то доля случаев, при которых обнаруживается победитель, равна только 0,28, так что здесь оценкам судей, из которых следует превосходство одного из участников над другими, можно придать большее значение.
Упражнения
1.	Сколькими различными способами можно поставить в ряд пять человек для выполнения их группового портрета? Сколькими различными способами можно это сделать, если желать поставить трех человек в переднем ряду и двух в заднем?	[Отв.: 120; 120.]
2.	Футбольная команда определяется составом игроков и ролью, которую играет в команде каждый отдельный игрок. Сколько разных футбольных команд можно составить из 13 лиц (общее число игроков в футбольной команде 11 человек), если
а)	каждое из этих лиц может занимать в команде любое место;
Ь)	двое играющих могут служить лишь вратарями.
3.	Четверо студентов получают оценки А, В, С или D.
(а)	Сколькими различными способами можно расставить оценки так, чтобы никакие два студента не получили одну и ту же оценку?
[Отв.: 24.]
(Ь)	Сколькими способами могут быть расставлены оценки так, чтобы никакие два студента не получили одну и ту же оценку и один определенный из наших четырех студентов (назовем его Смит) получил более высокую оценку, чем какой-то другой из них (назовем этого последнего студента Джойс)?	[Отв.: 12.]
(с)	Сколькими способами могут быть расставлены оценки так, чтобы все четверо студентов получили высшие оценки С и D? [Оше.: 16]
§ 4. Перестановки
141
4.	В сборную команду страны вводятся семь новых членов, четверо из которых представляют спортивный клуб А и трое — спортивный клуб В. Эти семь человек включаются в сборную команду по одному, и притом так, чтобы среди новых членов команды представителей клуба А было всегда больше, чем представителей клуба В. Постройте дерево, на котором были бы представлены все возможные способы расширения сборной команды (при этом новые члены ее различаются только по их принадлежности к тому или иному спортивному клубу).
5.	Города А и В соединены один с другим тремя различными дорогами. Сколькими способами можно совершить круговой рейс от А к В и обратно? Сколько будет таких способов, если на обратном пути обязательно избирать новую дорогу?	[Отв.: 9; 6.]
6.	Сколькими различными способами можно ответить на тест многократного выбора1), состоящий из десяти вопросов, если для каждого вопроса имеется три возможных ответа: 1-й, 2-й и 3-й? Сколькими различными способами можно это сделать, если ответы на любые два последовательных вопроса должны занимать в списке возможных ответов разные места?
7.	Изменим условия примера 6 следующим образом: для того, чтобы считаться победителем, участник состязания должен стоять первым в списках двух судей и быть первым или вторым в списке третьего судьи. Какая часть возможных заключений судей позволяет установить победителя в случае трех участников? В случае п участников?
[Отв.: 4/э; 4/п2.]
8.	В институте учатся 1240 студентов. Нужно связаться с каждым из них по телефону, чтобы известить о собрании. Комитетом, состоящим из г студентов, решено, что каждый из этих г лиц позвонит s студентам и попросит каждого навестить t других студентов и рассказать им о собрании. Рели при таком методе ни одно лицо не извещается дважды, то
(а)	сколько человек узнает о собрании по телефону?
(Ь)	Пусть комитет состоит из 40 студентов и намечено известить о собрании всех 1240 студентов. Если s и t должны быть одинаковы, то чему они равны?
9.	Пусть в условиях примера 1 на карточках написаны буквы А, П, П, А, Р, А, Т. Сколько имеется различимых расположений для этих семи букв?
[Отв.: 420.]
10.	Сколько различных ожерелий можно составить
(а)	из семи бусинок разных размеров?	[Отв.: 360.]
(Ь)	из шести одинаковых бусинок и еще одной несколько большей?
[Отв.: 1.]
(с)	из пяти одинаковых бусинок и двух несколько больших? [Отв.: 3.]
11.	Докажите, что в Вашингтоне проживают по крайней мере два человека с одинаковыми инициалами.
12.	Найдите число различимых расположений следующих пяти символов (одни и те же буквы с разными значками означают разные объекты):
(а)	А|, А2, В„ В2, В3;
(Ь)	А, А, Вп В2, В3;
(с)	А, А, В, В, В.
[Отв.: 120.]
[Отв.: 60.]
[Отв.: 10.]
) См. подстрочное примечание на стр 119.
142
Гл. HI. Разбиения и сочетания
13. Покажите, что число различимых расположений п объектов, среди которых имеется «1 (неразличимых) объектов типа 1, «2 объектов типа 2 и т, д., равно
и!
«11п2! ... пг! *
Где г есть общее число типов объектов (и, очевидно, «1 + «2 + • • • ... + пг — п).
§ 5. ЧИСЛО УПОРЯДОЧЕННЫХ РАЗБИЕНИЙ
До сих пор мы не рассматривали разбиения [(1,2), (3,4)] и [(3,4), (1,2)] множества целых чисел 1, 2, 3 и 4 как различные разбиения. Теперь удобно сделать это, и для обозначения этого различия мы введем термин «упорядоченное разбиение». Упорядоченным разбиением с г ячейками назовем разбиение, в котором учитывается распределение объектов по г ячейкам (некоторые из них могут быть пустыми) и порядок, в котором эти ячейки рассматриваются.
Мы хотим сосчитать число возможных упорядоченных разбиений множества, содержащего п объектов, если число ячеек равно г и число элементов в каждой ячейке указано заранее. Для иллюстрации общей процедуры рассмотрим сначала один частный случай.
Предположим, что имеется восемь студентов А, В, С, D, Е, F, G и Н, которых мы хотим расселить в трех комнатах студенческого общежития, две из которых (комната № 1 и комната № 2) являются трехместными, а третья (комната № 3) двухместной. Сколькими различными способами может быть осуществлено такое расселение? Один способ состоит в том, что комнаты даются студентам в том порядке, в каком они прибывают, т. е. первые три студента помещаются в комнату № 1, следующие три — в комнату № 2 и последние два — в комнату № 3. Имеется 8 различных порядков, в которых студенты могут прибыть в институт, но не все они приводят к различным расселениям по комнатам. Расселение, соответствующее одному возможному порядку прибытия студентов, можно представить следующей схемой:
|BCA|DFE|HG|,
которая означает, что студенты В, С и А помещаются в комнату № 1, студенты D, F и Е —в комнату № 2 и студенты Н и G — в комнату № 3. Заметим, что те порядки прибытия студентов, которые просто изменяют порядок мест студентов внутри тех же комнат, приводят к тому же самому расселению Число
§ 5. Число упорядоченных разбиений	143
различных порядков прибытия, приводящих к тому же самому расселению по комнатам, что и выписанное выше, равно числу тех расположений, которые отличаются от данного расположения только порядком мест студентов в группах, заключенных в вертикальные черточки («внутри комнат»). Число таких различных порядков прибытия студентов равно 313121, ибо трех студентов в комнате № 1 можно упорядочить 3! различными способами; для каждого из этих способов трех студентов в комнате № 2 можно упорядочить 3! различными способами; далее, оставшихся двух студентов, попавших в комнату № 3, можно упорядочить 21 различными способами. Таким образом, 8! различных порядков прибытия студентов можно разбить на группы из 31312! элементов в каждой группе, причем порядки прибытия, принадлежащие одной и той же группе, приводят к одному и тому же расселению. Ясно, что общее число различных групп .8!
будет равно -g,g^, ; этому числу будет равно и количество разных возможных способов распределения восьми студентов по трем комнатам.
Аналогичное рассуждение может быть применено и для случая п студентов и k комнат, первая из которых имеет пх мест, вторая п2 мест и т. д. Это приводит к следующему результату. Пусть «J, п2, • • •, пк — целые неотрицательные числа и пх + +«2 + ••• + «* = «. Тогда
Число упорядоченных разбиений [Д, А2, Д, ..., Д] множества из п элементов по k ячейкам, первая из которых содержит пх элементов, вторая — п2 элементов, и т. д., равно
и!
nJ и2!... пь1 '
Это число мы будем обозначать символом
( " ) "2......."л/
Особенно важен тот частный случай, когда числом ячеек равно двум Тогда наша задача становится эквивалентной задаче нахождения числа тех подмножеств из г элементов, которые могут быть выбраны из множества, содержащего п элементов Это видно из того, что каждый выбор определяет некоторое разбиение [ДД, где А есть множество выбранных элементов и А — множество оставшихся элементов. Число таких разбиений равно гцп —^)| ’ и столько же должно быть подмножеств из
144
Гл. III. Разбиения и сочетания
г элементов. Наше обозначение^ удобно записывать coin X1)
кращенно в виде I )
(П X
п__г) есть число подмножеств из п— г элементов, которые могут быть выбраны из множества, содержащего п элементов, и оно же есть число разбиений вида [А, Л]. Ясно, что число этих разбиений будет то же самое, что и число разбиений [Л, Л]. Следовательно,
О=(Л,)
Символ
п
«1, ПЪ .... nk
можно также понимать как выражение числа различных способов, которыми можно распределить k различных ярлыков ah а2, ..ап между п предметами, при условии, что у нас есть «1 ярлыков типа а\, п2 ярлыков типа а2,.... nk ярлыков типа ak. Если п\ + «г + •• +«* не равно п, то подобное распределение ярлыков невозможно, и поэтому мы будем считать, что в этом случае число п ” ^равно нулю. Если сумма/и + «г+... ...~\-nk равна п, то всегда существует по крайней мере один способ распределения ярлыков, и, следовательно,
есть целое положительное число. Повторим, изменив несколько форму, вывод формулы для этого числа.
Пусть, например, у нас имеется 6 предметов и два красных, три синих и один черный ярлык. По определению число различных способов распределения ярлыков равно Q 3 j), Предположим, что затем мы решили использовать ярлыки шести различных цветов по одному на каждый предмет. При этом число способов распределения шести ярлыков будет равно 6! — числу перестановок шести объектов. В таком случае нам придется заменить два красных ярлыка двумя различными ярлыками, скажем, двумя ярлыками с различными оттенками красного цвета. Заменить два красных ярлыка двумя новыми можно 2! различными способами. Аналогично 3 синих ярлыка можно заменить
]) В русской литературе число f J (число сочетаний из п элементов ро г) чаще обозначается символом С'.
§ 5. Число упорядоченных разбиений
145
тремя синими ярлыками различных оттенков 3! способами, а черный 1! способами. На основании этого мы можем написать равенство
L ®	• 2! 3! 1! = 6!,
\ О, 1 /
поскольку нам известно, что ярлыки шести цветов можно распределить 6! способами. Отсюда имеем
(	6 \ _	6!
\ 2, 3, 1) — 2! 3! 1! •
Ясно, что наше рассуждение применимо и к общему случаю. Пусть необходимо распределить среди п предметов ярлыки k различных типов (где ярлык типа at используется раз; tii + п2 + ... + nh — п). Число различных способов, которыми это можно сделать, по определению равно
( " )•
\"i. ",..."к/
Для того чтобы затем перейти к распределению п различных ярлыков, надо заменить ni ярлыков каждой группы at (где i может быть равно 1,2,...,^) на nz различных ярлыков и распределить эти новые ярлыки между теми предметами, которые ранее имели ярлыки группы at. Для i-й группы (группы предметов, имевших ярлыки а() это можно сделать nz! разными способами. Очевидно, что таким образом мы получим всевозможные распределения п различных ярлыков, и поэтому
( „ „ п „ V «1! П2\ .. пк ! = «!;
следовательно,
п \__________ и!
«1, п2;.	п2! ... п*! 
Пример 1. Футбольная команда колледжа должна сыграть за сезон fi игр с командами других колледжей Сколькими различными способами может пройти сезон для этой команды, если в результате она выиграет два матча, три проиграет и один сведет вничью?
В качестве множества предметов мы рассмотрим множество из 6 команд, с которыми играет наша команда, этим командам приписываются ярлыки трех различных типов: победа, ничья, поражение (нашей команды!). Теперь задача сведена к задаче «распределения ярлыков» между 6 командами, где ярлыки могут быть трех различных типов, и ярлыки первого типа используются два раза,
10 Зак. 994.
146
Гл. 111. Разбиения и сочетания
второго — один и третьего — три раза. Отсюда искомый ответ имеет вид:
/ 6 \	6!
\2, 1, з)~ 2! 11 3! ~
Этот же результат мы получим, если для каждого исхода шести встреч образуем разбиение команд, выступающих против команды нашего колледжа. В первую ячейку мы поместим те команды, у которых наша команда выигрывает, во вторую — те команды, с которыми она играет вничью, и в третью ячейку — те команды, которым наша команда проигрывает. (Это описание делает ясным, что схема с разбиением команд по ячейкам ничем не отличается от схемы с распределением ярлыков.) Имеется Q j 3j = 60 таких разбиений, и, следовательно, 60 способов завершения сезона нашей командой.
Пример 2. В игре в бридж 52 карты сдаются четырем игрокам N, Е, S и W по 13 карт каждому. Это определяет разбиение 52 карт на четыре ячейки по 13 элементов в каждой Таким образом, имеется узГ^зИзизТ Различных сдач карт. Это число приблизительно равно 5,3645 • 1028, или около 54 миллиардов миллиардов миллиардов сдач.
Пример 3. Следующий пример будет иметь значение в теории вероятностей, которой мы займемся в главе IV. Если бросать шесть раз монету, то имеется 26 возможностей для исхода этих бросаний, так как каждое бросание может иметь своим результатом выпадение либо герба, либо цифры. Сколько имеется возможных исходов, в результате которых четыре раза выпадает герб и два раза — цифра? Каждая последовательность шести выпадений герба или цифры определяет следующее разбиение чисел от 1 до 6 на две ячейки: в первую ячейку помещаем числа, соответствующие тем бросаниям, в результате которых выпадает герб, а во вторую ячейку — числа, соответствующие тем бросаниям, в результате которых выпадает цифра. Мы требуем, чтобы первая ячейка содержала четыре элемента, а вторая ячейка—два элемента. Следовательно, число тех из 26 возможностей, которые приводят к четырем выпадениям герба и двум выпадениям цифры, равно числу разбиений шести элементов на две ячейки, содержащие соответственно четыре элемента и два элемента. Это число равно15. Подобный же анализ показывает, что в случае и-кратного бросания монеты существует
§ 5. Число упорядоченных разбиений
14?
) различных последовательностей Г и Ц длины п, которые содержат г букв Г (г выпадений гербов) и п — г букв Ц (выпадений цифры).
Упражнения
1.	Найдите следующие числа:
<ь>(П;
<«> (’);
[Отв.: 21.]>
[Оте.: 250.]
[Оте.: 6.]
2.	Какой смысл имеют числа И [ Можно ли из этого извлечь довод в пользу того, чтобы считать 01 = 1?
3.	Сколькими способами можно расселить девять студентов в трех комнатах, рассчитанных на трех человек каждая? Сколькими способами это можно сделать, если какие-либо два из этих студентов отказываются поселиться вместе?	[Отв.: 1680; 1260]
4.	Компания из семи юношей и десяти девушек танцует. Если в каком-то танце участвуют все юноши, то сколько имеется вариантов участия девушек в этом танце? Сколько имеется вариантов, если учитывать лишь те, какие из девушек оказываются неприглашенными? Решить тот же вопрос в условиях, когда относительно трех девушек можно с уверенностью сказать, что они будут приглашены на танец?
5.	Предположим, что по 15 студентов могут явиться на стадион для выполнения обязательного задания в одни из трех указанных им дней.
(а)	Сколькими способами могут студенты распределиться по дням явки на стадион?	[Отв.: 31SJ
(b)	Сколько имеется способов распределения студентов по дням явки на стадион, если в каждый из этих дней выполняют задание одинаковое число студентов?	[Отв.: 756 756.]
6.	Преподаватель рассчитывает читать один и тот же курс в течение 35 лет. Чтобы не наскучить студентам своими шутками, он решил рассказывать каждый год в точности три анекдота и не повторять никакие два года подряд одни и те же три анекдота. Каково минимальное число анекдотов, которые он должен приготовить? Чему равно число анекдотов, если преподаватель решил не повторять ни одного анекдота два года подряд?
7.	Сколькими способами можно ответить на десять вопросов, в которых предлагается установить истинность нли ложность некоторых десяти утверждений, если на половину вопросов отвечать утвердительно и на половину — отрицательно? Сколькими способами можно ответить на эти вопросы, если желать, чтобы никакие два последовательных ответа не были одинаковыми?
8.	Комиссия из 8 человек должна быть разбита иа три подкомитета, состоящих из 3, 2 и 3 человек соответственно, причем никакой из членов
10*
148
Гл. til. Разбиения и сочетания
комиссии не должен одновременно участвовать в двух подкомитетах. Сколькими различными способами можно провести деление комиссии на подкомитеты?
[Отв.: 560.]
9.	Сколькими различными способами можно распределить два красных и два синих ярлыка между четырьмя предметами? Сколькими различными способами между этими же предметами можно распределить красные, синие и зеленые ярлыки при условии, что у нас есть два красных, два синих и ни одного зеленого ярлыка? Используйте полученный ответ для того, чтобы показать разумность соглашения о том, что 0! = 1.
10.	Выведите из полученной в тексте формулы равенство
\nb л2, п3]	\n3,n2,nj
Докажите это же равенство, исходя из смысла символа
11.	Студенту надо выбрать два факультативных курса из шести возможных, (а) Сколькими способами он может сделать выбор?	[Отв.: 15.]
(Ь)	Сколько имеется способов выбора, если чтение каких-то двух курсов совпадает по времени?	[Отв.: 14.]
(с)	Сколько имеется способов для выбора, если чтение двух курсов начинается в 10 часов, чтение двух других — в 12 часов, а в остальном курсы ие пересекаются по времени?	[Отв.: 13]
12.	Покажите, что число способов распределения среди 12 предметов ярлыков трех различных цветов, где ярлык каждого цвета встречается ровно 4 раза, больше числа способов распределения ярлыков тех же трех цветов, где (заданные) количества ярлыков разных цветов не равны между собой,
§ 6. НЕКОТОРЫЕ СВОЙСТВА ЧИСЕЛ

(П\ X
.) будут играть важную роль в последующем изложении. Мы приведем здесь некоторые из наиболее важных свойств этих чисел.
Выше мы уже видели, что / л \_____________/ п \ л! _
это есть число способов, каким можно выбрать из п объектов группу в / объектов. Связь числа более общим символом (	”	) определяется равенством
см,.»-,)-
Пример 1. В колледже имеется 60 играющих в футбол студентов. Из них надо составить три футбольные команды.
§ 6. Некоторые свойства чисел
149
т е. отобрать 3-11 ==33 игроков; остальные 60 — 33 = 27 студентов будут являться кандидатами в состав команд. Отобрать 33 члена команд можно (33) способами; 27 кан-дидатов можно отобрать I 27 I способами. Эти два числа, разумеется, совпадают; они показывают, что выбор футболистов можно произвести более чем миллиардом миллиардов способов.
Пример 2. В примере 2 предыдущего параграфа мы рассмотрели число всевозможных способов распределения карт между данными четырьмя игроками при игре в бридж. Если интересоваться лишь тем, какие карты может получить один из этих игроков, скажем игрок N, то мы будем иметь возможных вариантов. Число превосходит 635 миллиардов; оно все еще очень велико, но несравненно меньше, чем число возможных способов раздачи карт.
Удобный способ для получения чисел ( дает знаменитый треугольник Паскаля, изображенный на фиг. 77. Чтобы получить этот треугольник, напишем по обеим его сторонам единицы. Любое другое число в этом треугольнике обладает тем свойством, что оно является суммой двух чисел, лежащих над данным числом в верхней строке. Таким образом, следующая за выписанными строка этого треугольника будет иметь вид 1, 6,
150
Гл. HI. Разбиения и cb4ettuuiA
15, 20, 15, 6, I. Чтобы найти число мы фиксируем строку, отвечающую числу п, и смотрим, в каком месте пересекает ее диагональная линия, соответствующая числу /. Например, число ^2 j = 6 лежит в строке, отмеченной номером п = 4, и на диагонали, отмеченной номером / = 2.
Построение треугольника Паскаля основано на следующем / п 1.
свойстве чисел ( у J 
(”ГН,->)+С)-
Это равенство может быть проверено непосредственно (см. упр. 6), но более интересно следующее доказательство. Число /п4-1\
у J означает число тех подмножеств из / элементов, которые могут быть выбраны из множества, содержащего п + 1 элементов. Возьмем один из этих п 4- 1 элементов, скажем х. (”^) подмножеств можно разбить на такие подмножества, которые содержат х, и на такие, которые х не содержат. Последние представляют собой подмножества из j элементов, обра-
(п\ зованные из п объектов; следовательно, их число равно . 1.
Всякое же подмножество, содержащее х, получается путем присоединения х к подмножеству из j — 1 элементов, не содержа-тцему х; следовательно, число таких подмножеств равно I y_j )• В результате получаем (” + 1) = (у_21 )^”(/)’
Обратим теперь внимание на то, что числа в каждой строке треугольника Паскаля сначала растут, а потом начинают убывать. Этот факт может быть доказан в общем виде, если рассмотреть отношение двух соседних членов:
(/4-1) _ п1	j!(n—jy_n—£
(и) “ (/4-1)! (л—/—1)! • л! /4-1*
Числа определенной строки треугольника Паскаля растут, пока это отношение остается больше единицы, т. е. пока п — j > j 4- 1 или j<^(n—1). Мы должны различать случаи четного и нечетного п. Например, если п = 10, то / должно быть меньше, чем -^(10— 1) = 4,5. Следовательно, вплоть до j — 4 числа ра
§ 6. Некоторые свойства чисел
151
стут, а начиная с / = 5 убывают. Для п = 11 число / должно быть меньше чем (11 —1) = 5- Для j = 5. (п — j)/(j + 1) = 1. Следовательно, вплоть до / = 5 числа растут, затем мы имеем /11\ /11\ Л
( 5 ) —( 6 )’ после чег0 числа начинают убывать.
Пример 3. В статистической механике существует простая модель, предложенная Эренфестом, о которой мы будем еще говорить в гл. V. В этой модели рассматривается газ, находящийся в объеме, разбитом на две части проницаемой перегородкой Газ состоит из п молекул, и нас интересует, сколько молекул находится в каждой из двух областей. Очевидно, что в каждый момент времени множество молекул распадается на два подмножества. Все молекулы можно разделить на два подмножества таким образом, чтобы в первое попало ровно i молекул, j различными способами. Теперь мы определим энтропию такого распределения молекул с помощью формулы
e"==l°g[(” )]•
В этом случае несущественно, какое число мы возьмем за основание системы логарифмов, так как это изменит лишь единицу, с помощью которой мы измеряем энтропию •)-
Наши сведения о числах^ ^доставляют некоторую информацию об энтропии распределений молекул. Известно, что
(")=(ЛУ
Отсюда следует, что распределение, при котором i молекул попадают в первую область, обладает той же энтропией, что и распределение, при котором i молекул попадают во вторую область. Кроме того, нам известно, что при фикси-рованном п величина I . 1 принимает наибольшее значение при i = п/2 или ближайшем к этой величине целом значении I. Отсюда вытекает, что наиболее равномерное распределение молекул обладает и наибольшей энтропией. Более того, чем больше неравномерность распределения молекул, тем меньше энтропия такого распределения. В предельном
*) Ибо logbW — log/, N- logs а; постоянный множитель log/>a называется модулем перехода от одной системы логарифмов к другой.
152
Гл. III. Разбиения и сочетания
случае, когда все молекулы попадают в одну из областей, получим:
= log [(")] = log 1= °.
Упражнения
1.	Доведите построение треугольника Паскаля до п-=16. (Этот результат будет использован в дальнейшем, поэтому его следует сохранить.)
2.	Найдите число комитетов из трех человек, которые могут быть образованы из трех студентов факультета А и трех студентов факультета В, если
(а)	не накладывать больше никаких органичений на состав комитета;
[Отв.: 20.]
(Ь)	включить в комитет только студентов факультета А; [Отв.: 1.]
(с)	включить в комитет двух студентов факультета А и одного студента факультета В;	[Отв.: 9.]
(d)	включить в комитет одного студента факультета А и двух студентов факультета В;	[Отв.: 9.]
(е)	включить в комитет лишь студентов факультета В. [Отв.: !.]
Каково соотношение между ответом на п. (а) и ответами на четыре остальных пункта?
3.	Упр. 2 наводит на мысль о следующем равенстве:
С)=(.")С)+(?)(л1)+(?)(„"2)+ - +(Ж)-
Докажите его справедливость.
4.	Докажите, что
(;)+(;)+(")+ -'-СИ
воспользовавшись тем, что множество из п элементов содержит 2" под-
множеств.
5. Докажите, что множество из десяти элементов содержит больше подмножеств из пяти элементов, чем подмножеств из любого другого фиксиро-
6.
ванного числа элементов.
Воспользовавшись тем фактом, что
(г+1)
, вычислите
п — г
30 \ s )
при 5 = 1, 2, 3, 4, исходя из того, что
[Отв.: 30, 435, 4060, 27405.]
7
В бридже каждый игрок получает одну из у 13 у возможных комбинаций карт (см. пример 2). Допустим, что составлен список всех этих комбинаций и что в этом списке в каждой комбинации карт вычеркнута первая карта. После этого у нас остается список комбинаций карт, состоящих из двенадцати карт каждая. Докажите, что по меньшей мере две комбинации карт в последнем списке состоят в точности из одних н тех же карт,
§ 6. Некоторые свойства чисел
153
8.
/ « +1\	/ п \ , / п
Докажите, что j	_l)'\j
/ n\____nl
\j)~ Д(п—У)! '
воспользовавшись тем, что
9.	Постройте треугольник, родственный треугольнику Паскаля и отличающийся от него лишь тем, что сложение двух чисел производится в соответствии с таблицей сложения, изображенной на фиг. 69, а (стр. 115). Доведите построение нового треугольника до 16 строк. Что можно вывести из полученного результата о свойствах чисел, составляющих треугольник Паскаля? Используйте полученный «числовой треугольник» для проверки системы чисел, выписанных при решении упр. 1.
10.	Каким общим свойством обладают первая, вторая, четвертая и шестнадцатая строки треугольника из упр. 9? Что это означает для чисел, расположенных в соответствующих строках треугольника Паскаля? Какое можно сделать предсказание относительно элементов тридцать второй строки треугольника Паскаля?
11.	Дана следующая таблица:
1	1	1	1	1	1	1...
1	2	3	4	5	6	7...
1	3	6	10	15	21	28...
1	4	10	20	35	56	84...
1	5	15	35	70	126	210...
1	6	21	56	126	252	462...
1	7	28	84	210	462	924..
Установите, каким образом числа каждой строки этой таблицы получаются из чисел предыдущей строки и укажите, какое отношение имеет эта таблица к треугольнику Паскаля.
12.	В таблице упр. 11 занумеруем столбцы числами 0, 1, 2...а строки —
числами 1, 2, 3,...Пусть / (п, г} означает элемент, стоящий в столбце
с номером п и строке с номером г. Таблица построена по следующему закону:
fin, г) =/(п —1, г)+/(п, г—1)
для п > 0 и г > 1;
/(п, 1)=»/(0, г)=1
для всех п и г. Проверьте, что
(n-4-r—1 \ п )
удовлетворяет этим условиям и что лишь это число / (п, г) удовлетворяет им.
13.	Рассмотрим множество {а, а, а] из трех неотличимых друг от друга объектов. Различными упорядоченными разбиениями на две ячейки в этом случае будут разбиения:
[{а, а, а}, ©];
[{а, а}, {а}];
[{а}, {а, а}];
[О, {а, а, а}].
Перечислите все различные упорядоченные разбиения на три ячейки. Каково их число?	[Отв.: 10.]
154
Гл. III. Разбиения и сочетания
14.	Пусть f(n, г) означает число различных упорядоченных разбиений на г ячеек множества из п неразличимых объектов. Покажите, что f (л, г) удовлетворяет условиям:
/(«. О =/(« — 1> г) + /(«, г— 1)
для п > 0 и г > 1;
/(л, 1) = /(0, г) = 1
для всех лиг.
[Указание. Покажите, что f(n,r— 1) есть число разбиений, у которых (последняя ячейка пуста, и что f (п—1, г) есть число разбиений, имеющих в последней ячейке по крайней мере одни элемент.]
15.	Пользуясь результатами упр. 12 и 14, покажите, что число различимых упорядоченных разбиений на г ячеек множества нз п неразличимых / л -]- г — 1 \
объектов, равно I п ).
16.	Допустим, что почтальон должен опустить семь идентичных писем в три почтовых ящика. Сколькими способами он может это сделать? [Отв.: 36.]
17.	Под упорядоченным разбиением числа п на г слагаемых мы понимаем последовательность неотрицательных чисел (некоторые из них могут быть равны нулю), записанных в определенном порядке и дающих в сумме п. Например, {1, 0, 3} и {3, 0, 1} служат двумя различными упорядоченными разбиениями числа 4 на три слагаемых. Показать, что чис-
ло упорядоченных разбиении числа п на г слагаемых равно I	л I •
18.	В условиях примера 3 определите приращение энтропии при переходе еще одной молекулы в первую область. Другими словами, найдите простое выражение для разности etn+i—е". Используйте этот результат для того, чтобы показать, что энтропия возрастает тогда и только тогда, когда увеличивается равномерность распределения.
§ 7. БИНОМИАЛЬНАЯ И ПОЛИНОМИАЛЬНАЯ ТЕОРЕМЫ
Довольно часто приходится раскрывать скобки в выражениях вида (х + у)3, (x + 2j/ + 11z)5 и т. д. В этом параграфе мы покажем, как это следует делать.
Рассмотрим сначала частный пример выражения (х + у)3. Запишем его в виде
(х+у )3 = (х+у) (х 4- у) (х + у).
Чтобы выполнить умножение справа, мы выбираем в каждом из трех множителей или х, или у и перемножаем эти элементы; так мы поступаем со всеми возможными способами выбора х или у в трех сомножителях и складываем полученные результаты. Каждый из полученных на этом пути одночленов (сумма которых и дает требуемый результат) отвечает определенному разбиению тройки чисел 1, 2, 3 на две ячейки. К первой ячейке мы относим номера тех множителей (х + у), в которых мы выбрали слагаемое х. Например, разбиение [{1, 3), {2}] соответствует вы
§ 7. Биномиальная и полиномиальная теоремы
155
бору х из первого и третьего множителя и выбору у из второго множителя. Полученное таким образом произведение равно хух = х2у. Коэффициентом при х2у в искомом выражении для (х + у)3 будет число тех разбиений, которые приводят к выбору (3 \
2 I — 3, рав-
ное числу разбиений множества трех чисел на две ячейки — с двумя элементами в первой ячейке и одним элементом во второй. Вообще, коэффициент при члене вида лгу3-7 (где / = 0,1,2 или 3) будет равен (у)- Таким образом, искомое выражение
имеет вид
(х+у)3 = (з)х3 + (2)л2у + (^ху2-|-(д')у3 =
= х3 + Зх2у + Злу2 + у3.
Такое же рассуждение в применении к выражению (х + у)п приводит к известной биномиальной теореме (теореме о биноме Ньютона):
Биномиальная теорема. Результат раскрытия скобок в выражении (х + у)п имеет вид
(х+У)п-л" + (п21)^-1У + (п12)х"”2у24- ...
••• 4-(")хул-1 + ул.
Пример 1. Найдем, чему равно (а — 2Ь)3. Чтобы вос-пользоваться биномиальной теоремой, положим а = х и —2b = у. Тогда будем иметь
(а — 2Ь)3 = «3 + За2 (— 2Ь) + За (— 2Ь)2 + (— 2й)3 =
= а3 — 6a2b +12ab2 — 863.
Обратимся теперь к задаче о нахождении куба трехчлена (х + у + z)3. Снова пишем
(х-4-у-Ь2')3 = (х + у -|-z) (x-|-y + z)(x+y 4-z).
На этот раз мы выбираем из каждого множителя или х, или у, или z. Таким образом, мы приходим к разбиению множества чисел {1, 2, 3} на три ячейки: в первую ячейку входят номера тех множителей, из которых мы выбрали х, во вторую ячейку — номера множителей, из которых мы выбрали у, и в третью ячейку — номера множителей, из которых мы выбрали г. Например, разбиение [{1, 3}, О, {2}] соответствует выбору х из первого и третьего множителей и выбору z из второго множителя.
156
Гл. Ш Разбиения и сочетания
Полученный член равен xzx = x2z. Коэффициентом при члене x2z в искомом выражении будет число всех разбиений множества из трех элементов на три ячейки, первая из которых содержит два элемента, вторая — ни одного и третья — один элемент.
(3 \
2 0 1 )= 3- Вообще, коэффициент при члене xaybzc в выражении для (х + у + г)3 будет ра-(3 \	3!
а ь с )~ а! l~d -Найдя этим способом коэффициенты для всех возможных а, b и с, получим
(х Д~у + г)3 = х3 + у3-ф z3+Зх2у -ф- Злу2-ф-Зуг2 -ф-
-ф- 3y2z+Зхг2-ф-3x2z -ф- бху х.
Такой же метод применим и в общем случае для нахождения выражения (Х1 + х2-ф- ••• + хг)". Из каждого множителя мы выбираем или хь или х2, или Хз..., или хг, образуем произведение этих элементов и складываем затем все полученные таким путем произведения Мы получим всего гп произведений, но многие из них будут одинаковыми. Выбор одного слагаемого из каждого множителя определяет разбиение множества чисел от 1 до п на г ячеек. К первой ячейке мы отнесем номера тех множителей, из которых выбран член ко второй ячейке — номера множителей, из которых выбран член х2 и т. д. Каждый отдельный выбор слагаемых дает нам член вида х^х"2 ... х"г, где «1+ «2+ ... -ф-пг = п; этому члену отвечает разбиение, для которого первая ячейка содержит п\ элементов, вторая ячейка п2 элементов и т. д. Для каждого подобного разбиения мы получаем один член -^"‘Хг2 ... х"г. Следовательно, число таких членов равно числу этих разбиений, т. е. равно
/ п \_______________________«1_______
\Л1, п2,.....пг) щ! л2! ... пг\
Окончательно мы приходим к следующей полиномиальной теореме:
Полиномиальная теорема. Выражение (Хх -ф- х2Д-... ... -\-хг)п равно сумме всевозможных членов вида

п пг, .

., пг
где «j -ф- п2 -ф- ... -ф- пг — п.
§ 7 Биномиальная и полиномиальная теоремы
157
Упражнения
1.	Пользуясь биномиальной теоремой, найдите
(а)	(* + у)4;
(Ь)	(1-|-х)3;
(с)	(х-у)3;
(d)	(2х + °)4;
(е)	(2х —Зу)3;
(f)	(100 —I)5.
2.	Пользуясь полиномиальной теоремой, найдите
(а)	(хН-уН-г)4;
(Ь)	(2х-|-у —z)3;
(с)	(2 4-2-|- I)3- (Вычислите двумя способами.)
3. (а) Чему равен коэффициент при члене x2t/3z2 в выражении (х + у + г)7?
[Отв.: 210.J
(Ь) Чему равен коэффициент при члене хъу3г2 в выражении [х—2г/+5г)п?
[Отв.: —924 000.]
4. Используя биномиальную теорему, докажите, что
5. При помощи рассуждения, подобного использованному в § 6, докажите, что
(ЙН(-Г.л»)+(и-м)+и:-.)-
6. Пусть f (п, г) означает число членов в полиномиальном разложении для (X] -|- х2 4- ... 4- хТ)п. Покажите, что
.. ч /«4-Г----
[Указание. Докажите выполнимость условий упр. 12 из § 6, показав, что f(n, г— 1) есть число тех членов, которые не содержат хг, а f(n—1, г) есть число членов, содержащих хг. (Можно также использовать упр 17 из § 6, показав, что каждый член в разложении определяет упорядоченное разбиение числа п на г слагаемых.)
7. Сколько членов имеется в каждом из выражений:
(a)	(x4-y4-z)e?	[Отв.: 28.]
(Ь)	[а 4- 2Ь 4- 5с 4-^)4?	[Отв.: 35.]
(с)	(г s 4-14" и +t')6’	[Отв.: 210.]
(л \
_ _	_ I, где п фикси-
Г1> г2, ..., rk]
ровано и 4- гг 4-	4- rk — п> равна kn.
158
Гл. III. Разбиения и сочетания
§ 8*. ВЕС ПРИ ГОЛОСОВАНИИ
Вернемся к задаче, поставленной в § 11 гл. II. Теперь мы будем интересоваться не только голосующими коалициями, но также и весом отдельных участников голосования. Мы введем числовую меру, оценивающую этот вес, следуя Л. С. Шепли и М. Шубику (L. S. Shapley, М. Shubik) и рассмотрим некоторые относящиеся сюда примеры.
Нетрудно понять, что само по себе число голосов, которым располагает данное лицо, не является хорошей мерой его веса в голосовании. Например, если лицо х имеет три голоса, а лицо у один голос, то из этого вовсе не следует, что х имеет в три раза больший вес, чем у. Так, если комитет состоит из трех членов {х, у, z} и z также имеет только один голос, то голос х является решающим, а у бесправен.
Основная идея Шепли и Шубика заключается в рассмотрении всевозможных позиций членов комитета при отдельных голосованиях. Если расположить п членов комитета по степени их готовности голосовать за данное мероприятие, то получится некоторая позиция Xi, х2 ..., хп — другими словами, мы считаем, что Xi является наиболее убежденным сторонником данного мероприятия, за ним в этом отношении следует х2 и т. д. Чтобы провести мероприятие, надо, чтобы за него проголосовал ряд членов комитета, начиная, разумеется, с xt: члены xz, х2 и т. д. Если коалиция {хх, х2, .... xz} выигрывающая, а коалиция {хь х2 .... х;-1} еще не выигрывающая, то достаточно убедить xt проголосовать за данное мероприятие; при этом члены комитета Xi, х2, ..., Xj-i тем более проголосуют за него. Из числа всех I необходимых членов голосующей коалиции трудней всего будет убедить именно xz, который явится решающим членом коалиции. Мы назовем xz ведущим в данном голосовании.
При чисто математическом подходе к определению веса какого-либо члена комитета мы не рассматриваем конкретных взглядов отдельных членов. Вместо этого мы исследуем все возможные позиции членов комитета при различных голосованиях и посмотрим, как часто оказывается ведущим данное лицо. Для этого требуется рассмотреть все п\ перестановок. В каждой перестановке один член будет ведущим. Частота, с которой данное лицо оказывается при голосовании ведущим, и может служить мерой его веса в голосованиях.
Определение. Весом члена комитета в голосованиях мы назовем число позиций, в которых он оказывается ведущим, деленное на общее число позиций. (При числе членов комитета, равном п, общее число позиций, разумеется, равно п!.)
§8*. Вес при голосований
169
Пример 1. Если все члены комитета имеют по одному голосу- каждый и если мероприятия принимаются простым большинством голосов, то легко видеть (это следует из соображений симметрии), что каждый член оказывается ведущим в 1/л части всех позиций. Следовательно, каждый член имеет вес 1/п. Проиллюстрируем это положение для случая п = 3. Всего имеется 3! = 6 позиций. Чтобы мероприятие было принято, достаточно двух голосов; следовательно, второй член всегда будет ведущим. Возможные позиции суть 123, 132, 213, 231, 312, 321. Ведущие члены обозначены жирными цифрами. Каждый член оказывается ведущим дважды, и, следовательно, имеет вес, равный
S'-
Пример 2. Пересмотрим с этой точки зрения пример 3 из § 11 гл. II Всего имеется 24 перестановки четырех членов. Выпишем их, обозначая ведущий член жирной буквой:
toxyz	•wxzy	чюухг	TDyZX	-wzxy	iSDZyX
xwyz	xwzy	xywz	xyzw	xzwy	xzyw
yxwz	yxzno	y-wxz	ywzx	yzxzu	yzwx
zxyw	zxwy	zyX'W	zywx	zwxy	zwyx.
Мы видим, что вес z равен и/м, вес w равен е/24, а вес каждого из лиц х и у равен 2/24. (Или, проще, их веса равны соответственно 7Л2, 3/i2, V12, ‘/12-) Мы замечаем, что отношения весов расходятся гораздо заметней, чем отношения для числа голосов, которые даются пропорцией 3:2: 1 : 1. Тройной голос стоит столько же, сколько стоят семь единичных голосов, и стоит более чем в два раза больше, чем двойной голос.
Пример 3. В комитете из пяти человек каждый член имеет один голос, причем голос председателя является блокирующим (председатель имеет «право вето»). Следовательно, минимальные выигрывающие коалиции состоят из трех членов, включая председателя. Всего имеется 5! = 120 перестановок. Ведущий член не может предшествовать председателю, потому что коалиция без председателя не может быть выигрывающей. Следовательно, когда председатель занимает место с номером 3, 4 или 5, то он является ведущим. Это имеет место в 3/5 всех перестановок. Когда он находится в положении 1 или 2, то ведущим является член с номером 3. Число тех перестановок, в которых председатель занимает одно из первых двух положений, а данный член занимает третье место, равно 2 • 3! = 12. Следо
160
Гл. III. РазСиения и сочетания
вательно, председатель имеет вес, равный 3/д, а каждый из остальных членов имеет вес, равный */ю-
Упражнения
I.	В комитете, состоящем из трех человек, решения принимаются большинством голосов. Выпишите все позиции и подсчитайте вес в голосованиях каждого из трех членов, если эти члены имеют
г_	1	1	1 1
(а)	по одному голосу каждый;	Отв.: -g-, -д-, -д-.
'	1	1	2 :
(Ь)	двое по одному голосу, а третий два голоса; Отв.: , -g-, g-.
(с)	двое по одному голосу, а третий три голоса;	[Оте.: О, 0,^1.
(d)	один, два и три голоса соответственно;	Отв.: , -g , -g.
Г_ 111'
(е)	двое по два голоса, а третий три голоса.	Vme.: -g-, -g-. -g-.
2.	Докажите, что в любой выигрывающей коалиции сумма весов ее членов равна 1.
3.	Чему равен вес лица, имеющего решающий голос? Чему равен вес бесправного члена комитета?
4.	В референдуме участвуют 100 000 человек. Две большие партии обладают соответственно 50 000 и 49 999 голосов; кроме того, имеется еще 1 независимый. Вычислите веса двух партий и независимого участника ^голосо-вания.	£с*тв.: -g , -д-, -g-.j
5.	Комитет состоит из 100 рядовых членов, имеющих по одному голосу каждый и председателя, голос которого является решающим в случае равенства голосов двух сторон. Подсчитайте распределение весов. (Не пытайтесь выписывать все перестановки!)
6.	В условиях упр. 5 дадим председателю блокирующий голос. Как это повлияет на распределения весов?
[Отв.: Председатель имеет вес, равный so/ioi-]
7.	Как изменятся веса в условиях упр. 1, если комитет станет принимать решения большинством в % голосов?
8.	Если в комитете из пяти человек, принимающем решения большинством голосов, каждый член имеет один голос, то вес каждого равен Vs. Предположим теперь, что два члена объединились и всегда голосуют одинаковым образом. Увеличится ли от этого их вес? Всего лучше эту ситуацию можно представить, допуская только те перестановки, в которых эти два члена стоят рядом.
[Отв.: Да, вес этой пары возрос с 0,4 до 0,5.]
9.	Покажите, что если дано количество голосов, которым располагает каждый член выигрывающей коалиции, то можно определить минимальные выигрывающие коалиции. Покажите, что если известны все минимальные выигрывающие коалиции, то вес каждого члена можно определить, ничего ие зная о числе голосов, которым располагают отдельные члены.
10.	Для комитета, состоящего из трех членов, дайте ответы на следующие вопросы:
(а)	найдите все возможные множества минимальных выигрывающих коалиций;
§8*. Вес при голосовании
161
(Ь)	для каждого множества минимальных выигрывающих коалиций найдите распределение весов в голосованиях;
(с)	проверьте, что различные распределения весов, найденные в упр. 1 и 7, являются единственно возможными.
11.	В упр. 1 пункты (а) и (е) имеют одинаковый ответ; также пункты (Ь) и (d) упр. 1 и упр. 4 имеют одинаковый ответ. Воспользуйтесь результатами упр. 9 для обоснования этого.
ЛИТЕРАТУРА ДЛЯ ДОПОЛНИТЕЛЬНОГО ЧТЕНИЯ
Кальбертсон Дж. Т., Математика и логика цифровых устройств, М., Учпедгиз (в печати), гл. II.
Радемахер Г. и Теплиц О., Числа и фигуры, М„ Физматгиз, 1962, гл. 9,
Я г л о м А. М. и Я г л о м И. М., Неэлементарные задачи в элементарном изложении, М., Гостехиздат, 1954, цикл. 5 раздела I.
11 Зак. 994.
Глава IV
ТЕОРИЯ ВЕРОЯТНОСТЕЙ
§ 1. ВВЕДЕНИЕ
Часто мы слышим высказывания такого типа: «Вероятно, сегодня пойдет дождь», «Я имею все шансы сдать этот предмет», «С равной вероятностью монета может упасть кверху гербом или цифрой» и т. д. В каждом случае наше высказывание относится к событию, в исходе которого мы не уверены, но мы выражаем в той или иной степени веру в исполнение нашего предсказания. Теория вероятностей представляет собой математическую схему для изучения подобных утверждений.
Рассмотрим эксперимент, исход которого неизвестен. Предположим, что делается некоторое утверждение р об исходе этого эксперимента, и мы хотим приписать р определенную вероятность. Когда высказывание рассматривается изолированно, то обычно не напрашивается никакого естественного определения вероятности. Но наша цель другая: мы хотим найти средство приписывать вероятности всем мыслимым высказываниям, касающимся исхода данного эксперимента. С первого взгляда эта задача может показаться безнадежной, потому что нет конца высказываниям, которые можно делать по поводу этого эксперимента. Однако здесь нам помогает следующий фундаментальный принцип.
Основное допущение. Любым двум эквивалентным высказываниям приписывается одна и та же вероятность.
Пока у нас имеется конечное число логических возможностей, множеств истинности будет только конечное число, и, следовательно, процесс приписывания вероятностей конечен. Мы действуем в три приема: (1) сначала определяем множество возможностей И, т. е. множество всех логических возможностей; (2) каждому подмножеству X множества U мы приписываем
§ 1. Введение
163
некоторое число, называемое мерой т(Х); (3) каждому высказыванию р мы приписываем в качестве вероятности этого высказывания числот(Р) — меру множества Р истинности этого высказывания. Вероятность высказывания р обозначается через Р[р]-
Аналогичным образом определяют вероятность предиката У(х) = а. Пусть А есть множество истинности этого высказывания. Тогда
Р [/= а] — т (А).
Вероятность высказывания f (х) = а мы обозначили следующим образом: Р[/— а], что читается как «вероятность того, что f принимает значение а». Этим обозначением мы будем пользоваться в дальнейшем на протяжении всей книги.
Первый шаг — определение множества логических возможностей — мы рассмотрели в предшествующих главах. Важно напомнить, что не существует однозначного метода для анализа логических возможностей. В одной и той же проблеме мы можем производить очень тонкий или очень грубый анализ возможностей, в зависимости от чего U будет иметь большее или меньшее число элементов.
После того как И выбрано, следующий шаг будет заключаться в том, что мы сопоставим каждому подмножеству X множества И некоторое число — его меру, которое в свою очередь будет принято за вероятность любого высказывания, имеющего X своим множеством истинности. Это достигается следующим образом.
Приписывание меры. Поставим в соответствие каждому элементу множества U некоторое положительное число (вес) так, чтобы сумма всех весов равнялась 1. За меру произвольного подмножества множества U примем сумму весов всех его элементов. Меру пустого множества О положим равной 0.
В приложениях теории вероятностей к научным проблемам приписывание мер и анализ логических возможностей зависят от имеющейся у нас фактической информации и, следовательно, наилучшим образом эти операции могут быть произведены специалистом, занимающимся данным вопросом.
После того как каждому элементу приписан определенный вес, для нахождения вероятности отдельного высказывания следует найти его множество истинности и затем подсчитать сумму весов, приписанных всем элементам найденного множества истинности. Эта проблема, которая может показаться легкой, часто заключает в себе большие математические трудности.
11*
164
Гл. IV. Теория вероятностей
Развитие техники решения проблем такого рода составляет главную задачу теории вероятностей.
Пример 1. Брошена обычная игральная кость. Какова вероятность того, что выпавшее количество очков будет меньше 4? Множество логических возможностей здесь будет иметь вид 11 = {1, 2, 3, 4, 5, 6}. Симметрия игральной кости наталкивает на мысль считать, что вероятность выпадения какой-либо грани будет одной и той же для всех граней. В соответствии с этим мы приписываем каждому из шести исходов вес */б- Множеством истинности высказывания «Выпавшее количество очков меньше 4» будет множество (1,2, 3}. Следовательно, вероятность этого высказы-3	1
вания равна ~q~~2 — сумме весов всех элементов его множества истинности.
Пример 2. Некто присутствует на бегах, в которых участвуют три лошади А, В и С. Он чувствует, что А и В имеют примерно одинаковые шансы выиграть и что А (а следовательно, и В) имеет вдвое больше шансов на выигрыш, нежели С. Какова вероятность того, что выиграет А или С? Примем за # множество {А. В. С}. Если исходу С мы припишем вес а, то каждому из исходов А и В мы должны будем приписать вес 2а. Так как сумма этих весов должна равняться 1, то 2а + 2а + а = 1, откуда а = ’/s-Поэтому исходам А, В и С мы приписываем соответственно 2 2	1
веса -с-. и -g-. Множеством истинности высказывания □ О	о
«Выигрывает лошадь А или С» служит множество {А, С}.
2,1
Сумма весов элементов этого множества равна -g—г 5' = з
= -F-. Следовательно, вероятность того, что выиграет А или О
3
С, равна у-
Пример 3. Дважды подбрасывается монета. Тогда множество логических возможностей можно записать так: U = {ГГ, ГЦ, ЦГ, ЦЦ), где Г — выпадение герба, Ц — выпадение цифры. Веса всех элементов множества U (аурры. считать одинаковыми, равными для каждого элемента. Обозначим через f заданную на множестве U функцию, значение которой равно числу выпавших гербов. Тогда множество истинности предиката /(х) = 1 имеет вид {ГЦ. ЦП. Мера этого множества равна '/г и, следовательно Р{/= 1]= */г.
§ 1. Введение
165
Упражнения
1	Предположим, что данный эксперимент может иметь п разных исходов. Каким образом следует приписать веса этим исходам, если у нас нет оснований считать один из исходов более вероятным, чем другой?
2.	Пусть U = {а, Ь, с}. Припишите веса трем элементам этого множества таким образом, чтобы никакие два элемента не имели одинакового веса, н найдите меры всех восьми подмножеств 2/.
3.	Для Джонса вероятность победить в спортивном соревновании равна */г, для Смита — Ч3 и для Блэка — */б-
(а)	Постройте 11.
(Ь)	Припишите веса.
(с)	Найдите меры восьми подмножеств.
(d)	Укажите пару неэквивалентных высказываний, имеющих одинаковые вероятности.
4.	Укажите множество возможностей V. для каждого из следующих экспериментов:
(а)	Играется партия в шахматы с участием шахматистов А и В.
(Ь)	Выбирается наугад одно число, заключенное между 1 и 5.
(с)	Бросается (правильная) монета.
(d)	Студента спрашивают, когда его день рождения.
5.	Для каких экспериментов из числа фигурирующих в упр. 4 естественно всем исходам эксперимента приписать равные веса?
6.	Предположим, что возможным результатам опускания монеты в неисправный автомат для продажи орехов приписаны следующие вероятности: вероятность того, что вы ничего не получите, равна ‘/2; вероятность того, что вы либо получите назад вашу монету, либо получите орехи (но не то и другое вместе) равна */з-
(а)	Какова вероятность того, что вы получите назад вашу монету и, кроме того, получите орехи?	[Отв.: -i-.j
(b)	Можно ли на основании имеющейся информации вычислить вероятность того, что вы получите орехи?	[Отв.: Нет.]
7.	Игральная кость налита свинцом таким образом, что вероятность выпадения каждой грани пропорциональна числу очков на ней. (Например, 6 очков выпадает в три раза чаще, чем 2 очка.) Какова вероятность выпадения при одном бросании четного числа очков?	£Ome.: j
8.	Монета бросается три раза подряд. Перечислите восемь возможностей для исходов этих трех последовательных бросаний. Например, один нз исходов может быть записан в виде ГЦГ, Определите вероятностную меру, приписав каждому исходу один и тот же вес. Найдите вероятности следующих высказываний:
(г) Число выпадений герба больше числа
(з) Выпадает в точности два герба.
(t) Результаты всех бросаний одинаковы,
выпадений цифры.
[Оте.: у]
Гп 3 1 Отв.: -ъ-.
L о J
Г г, 1 1 Отв.: -г.
I 4 4
166
Гл. IV. Теория вероятностей
(а)
(Ь)
9.	Какие из следующих равенств будут справедливы для высказываний г, s, t, фигурирующих в упр. 8?
(а)	Р [г V s] = Р [г] + Р [s];
(b)	P[sV<] = ₽W + ₽P];
(с)	P[rv~d = P[d + P[~d;
(d)p[rvd-=p[d+Pia
10.	Какие из следующих пар высказываний (см. упр. 8) несовместимы (напоминаем, что два высказывания несовместимы, если их множества истинности не имеют общих элементов):
[Отв.: (Ь) и (с).]
11.	Сформулируйте теорему, подсказываемую результатами упр. 9 и 10.
12.	Пусть V есть пространство логических возможностей, а V и w — две весовые функции, задающие веса отдельных элементов в соответствии с нашими требованиями [® и w — функции, заданные на И]. Докажите, что т -|- ю не может быть весовой функцией.
13.	Пусть И и V — две разные весовые функции, определенные на одном пространстве логических возможностей U, Пусть, кроме того, а и Ь — два неотрицательных числа, в сумме равные единице. Докажите, что аи -|- bv также можно принять за весовую функцию.
14.	Монету подбрасывают трижды. Обозначим через И пространство логических возможностей, содержащее восемь возможных исходов эксперимента. Припишем всем элементам этого множества одинаковые веса. Пусть f есть функция с областью определения И, описывающая число выпавших «гербов». Определите множества истинности предикатов f(x) — Q,f(x) = 1, f(x) = 2,/(л) = 3 и вероятности Р [/—0], Р [/= 1], Р[/=2],Р[/=3].
[Частичный отв;. Р [/= 3] = */з> Р [/= 1] = 3/з-1
15.	Игральная кость бросается дважды. Каждому из 36 элементов пространства логических возможностей U приписывается один и тот же вес. Пусть f есть функция с областью определения 2/, равная сумме выпавших чисел. Определите
Р [/= а] для а = 2, 3.12.
[Частичный отв.: Р [/= 11] ='/is. Р [/ — 7] = ’/о-]
§ 2. СВОЙСТВА ВЕРОЯТНОСТНОЙ МЕРЫ
Прежде чем изучать специальные вероятностные меры, мы рассмотрим некоторые общие свойства вероятностных мер, которые будут полезны для вычислений и для общего понимания теории вероятностей.
Три основных свойства вероятностной меры таковы:
(А)	т (X) = 0 тогда и только тогда, когда X — О.
(В)	0 < m (X) < 1 для любого множества X,
(С)	Для двух множеств X и У
m (Xи К) = m (X) -f m (У)
$ 2. Свойства вероятностной меры
167
тогда и только тогда, когда X и У не пересекаются, т. е. не имеют общих элементов.
Доказательство свойств (А) и (В) переносится в упражнения (см. упр. 19). Докажем свойство (С).
Мы видим, что m(X)-\-m(Y) есть сумма весов всех элементов подмножества X, сложенная с суммой весов всех элементов подмножества У. Если X и У не пересекаются, то вес каждого элемента из АиУ фигурирует в сумме /п(Х) + /п(К) один и только один раз, и следовательно, m (X)m (Y) — m (XU Y).
Допустим теперь, что X и У пересекаются. В таком случае вес каждого элемента, содержащегося как в X, так и в У, т. е. в X П У, фигурирует в сумме m(X)~]~m(Y) дважды. Таким образом, эта сумма больше чем т(Х[) У) на величину т (А”Л К). В силу (А) и (В), если X(]Y — непустое множество, то tn (Afn Y) > 0. Следовательно, в этом случае мы имеемтп (АГ)Д--\-m(Y) > m(XU Y). Таким образом, если X и У пересекаются, го равенство (С) не имеет места.
Из нашего доказательства видно, что в общем случае справедливо предложение:
(С') Для любых двух множеств X и У
m(XU Y) = т (X) Д- т (Y) — т (Х(] Y).
Ввиду того что вероятности высказываний получаются непосредственно из вероятностной меры т(Х), всякое свойство вероятностной меры может быть прочтено на языке вероятностей высказываний. Например, рассмотренные выше свойства (А) — (С7) звучат на этом языке так:
(а)	Р[р] —0 тогда и только тогда, когда р логически ложно.
(b)	0<Р[р]< 1 для любого высказывания р.
(с)	Равенство
P[pvd-P[pl+PM
справедливо тогда и только тогда, когда высказывания р и q несовместимы.
(с7) Для любых двух высказываний р и q
P[pvd-P[p]+PM-P|/>Ad-
Еще одно свойство вероятностной меры, часто используемое при вычислениях, состоит в следующем:
(D)	m (X) =1 — m (X),
или, на языке вероятностей высказываний,
(d)	Р[~Р] = 1-РИ.
168
Гл. IV. Теория вероятностей
Доказательство свойств (D) и (d) переносится в упражнения (см. упр. 20).
Важно обратить внимание на то, что наша вероятностная мера приписывает вероятность, равную 0, только логически ложным высказываниям, т. е. таким высказываниям, которые ложны для каждой логической возможности и для которых предсказание истинности высказывания будет заведомо неправильным. Подобным же образом высказыванию приписывается вероятность 1 тогда и только тогда, когда оно истинно во всех случаях, т. е. логически истинно, и предсказание истинности высказывания будет заведомо правильным. (Хотя эти свойства вероятностной меры и кажутся вполне естественными, в тех случаях, когда приходится иметь дело с бесконечными множествами возможностей, их необходимо несколько ослабить. В этой книге мы будем рассматривать только конечные множества возможностей.)
Займемся теперь интерпретацией вероятностей, не равных ни 0, ни 1. Мы остановимся лишь на нескольких интуитивных идеях, которые обычно возникают при рассмотрении вероятностей. Хотя эти идеи могут быть оформлены математически более точным образом, мы приводим их здесь только для ориентировки в интуитивных рассмотрениях.
Предположим, что в связи с данным экспериментом какому-то высказыванию была приписана вероятность р. Из этого часто заключают, что если последовательность таких экспериментов проведена при идентичных условиях, то доля экспериментов, исход которых делает это высказывание истинным, приблизительно равняется р. Математической версией этого служит «закон больших чисел» теории вероятностей (о котором будет идти речь в § 11). В тех случаях, когда не имеется естественного способа введения вероятностной меры, вероятность высказывания оценивается экспериментально. Производится серия экспериментов, и доля тех экспериментов, при которых это высказывание оказывается истинным, принимается за приближенную вероятность этого высказывания.
Вторая, родственная предыдущей интерпретация вероятностей, имеет отношение к пари. Предположим, что некоторому высказыванию приписана вероятность р. Мы хотим предложить пари, что это высказывание окажется в действительности истинным. Мы соглашаемся заплатить г долларов, если это высказывание окажется ложным, при условии, что нам заплатят s долларов, если оно окажется истинным. Какими должны быть г и s, чтобы пари было честным? Если верно, что при большом числе таких пари доля выигрышей в s долларов равна р и доля проигрышей в г долларов равна 1—р, то наш средний
§ 2. Свойства вероятностной меры
169
выигрыш, приходящийся на одно пари, будет равняться
sp — г(1 — р).
Чтобы пари было честным, средняя величина выигрышей должна равняться нулю, что будет иметь место, если sp — г(1 —р) или r/s = р/(1 — р). Заметим, что этим определяется только отношение чисел г и s. Про такое отношение г: s говорят, что оно определяет шансы сторон в данном пари или условия, при которых пари будет честным.
Пример. Допустим, что некоторой лошади приписана вероятность % выиграть на скачках. Тогда шансы сторон 3 . 1 ~
в пари относятся как . Это отношение можно также записать в виде 3: 1, 6:2, 12 : 4, и т. д. Для того чтобы пари было честным, надо условиться платить 3 доллара, если эта лошадь проиграет, и взимать 1 доллар, если она выиграет. При другом варианте честного пари следует платить 6 долларов, если лошадь проиграет, и взимать 2 доллара, если она выиграет.
Упражнения
1.	Пусть р и q— такие два высказывания, что Р[/’Л?] = 4-, ₽[~'/’]=-i 4	о
и Р[?1 = 4-- Чему равна Р [pVg’J?	ГOwe.: -Д-.1
L	J
2.	Используя результат упр. 1, найдите Р[~>рЛ'~'Д.
1	2
3.	Пусть	р и	q	—	такие высказывания, что Р [д] = и Р[?] = -^.	Совме-
Z	и
стимы	ли	р	и	qf	[Отв.:	Да.]
4.	Покажите, что если Р[д]4* ₽ [?] > 1, то р и q совместимы.
5.	Студент озабочен предстоящими экзаменами по английскому языку и по истории искусств. По его мнению, вероятность того, что он сдаст- английский язык, равна 0,4; вероятность того, что он сдаст по крайней мере один предмет, равна 0,6, но вероятность того, что он сдаст оба предмета, равна всего лишь 0,1. Какова вероятность того, что он сдаст экзамен по истории искусств?	[Отв.: 0,3.]
в. Известно, что студент имеет вероятность 0,9 сдать некоторый экзамен и вероятность 0,6 сдать его ниже, чем на «отлично». Какова вероятность того, что студент получит оценку «хорошо» или «удовлетворительно»?
[°'"8" Т-]
7.	Рассмотрим такую игральную кость, у которой вероятность выпадения каждой грани пропорциональна числу точек, выгравированных на этой грани (ср. упр. 7 из § 1). Пусть f есть функция, указывающая исход опыта по бросанию кости; эта функция принимает значения {1, 2, .... 6}.
170
Гл. IV. Теория вероятностей
Вычислите
(a)	P[(/=2)V(/=4)v(/=6)J;	[Оте.: А.]
(b)	P[(/=l)V(/=2)V(/=5)];
(с)	Р[/^2];
(d)	Р[/>2];
(е)	PK/=7)v(/¥=7)];
(f)	Р [(/= 4)у(/> 2)].
8.	Монета подбрасывается дважды. Обозначим через ft и /2 функции, указывающие исходы первого и второго экспериментов. Область возможных значений каждой из этих функций имеет вид {Г, Ц}, а область определения— {ГГ, ГЦ, ЦГ, ЦЦ}. Вычислите
(а)	Р[СЛ = Г]7(Л¥=Г)];
(b)	Р [/, = Ц];
(с)	Р [(/i = Г) V (Л = Г)];
(d)	Р[/2^Ц].
9.	Дважды бросается (правильная) игральная кость. Обозначим через /( и /2 функции, указывающие исходы первого и второго экспериментов. Вычислите
(а)	Р [(/,	= 3) А (/2 < 4)];	[Отв.: .]
(b)	Р [(/>	¥=6)А(/2 > 3)];	[Ome.:	А.]
(О Р [(/,	+ 7) v (/2 < 5)];	[Отв.: 1.]
(d) Р [(/,	= 7) V (Л + 3)].	[ Отв.: А..]
10.	Каковы условия честного пари, в котором некто утверждает, что при бросании игральной кости выпадет шесть очков?
1'1. При каком условии следует соглашаться держать пари, что на бегах, о которых говорится в примере 2 из § 1, первой придет одна из лошадей А или В?
12.	Докажите, что если условия честного пари о том, что данное высказывание истинно, записываются дробью г: з, то вероятность того, что это высказывание окажется истинным, равна г/(г + з).
13.	Используя результат упр. 12 и определение «условий честного пари», покажите, что если г: з — условия честного пари о том, что данное высказывание истинно, то з : г — условия честного пари о том, что это высказывание ложно.
14.	Некто готов держать пари с условиями 5 :4, что в первенстве США по бейсболу выиграет команда Доджерс. Какой должна быть вероятность
5
выигрыша Доджерс для того, чтобы это пари было честным’ [Отв.: у] 15. Некто путем многократных наблюдений заключил, что в 85% тех случаев, когда он моет свой автомобиль, на следующий день идет дождь. На каких условиях он должен держать пари, что это произойдет и в следующий раз?
16.	Некто предлагает пари с условиями 1 :3, что наступит событие А и пари С условием 1 ; 2, что наступит событие В. Он знает, что А и В не могут
§ 3. Симметричная мера
171
иметь место одновременно. На каких условиях он согласится держать пари, что наступит одно из двух событий А или В? [Отв.: 7:5.] 17 Некто предлагает пари с условием 3:1, что наступит событие А и пари с условием 2:1, что наступит событие В. Он знает, что А и В не могут иметь место одновременно. На каком условии он согласится держать пари, что наступит одно из двух событий А или В?
18.	Из определения вероятностной меры вывести, что т(Х) = 1 тогда и только тогда, когда X = U.
19.	Из определения вероятностной меры выведите ее свойства (А) и (В), указанные в тексте.
20.	Выведите указанное в тексте свойство (D)' вероятной меры. Почему свойство (d) вытекает из (D)?
21.	Докажите, что если R, S и Т — три попарно не пересекающиеся множества, то
т(R(JSU Т) = т(R) + т (S) 4- т (Т).
22.	Докажите, что если X и У — такие два множества, что X является подмножеством У, то т(Х)^ m{Y).
23.	Докажите, что если р и q— такие высказывания что из р следует о, то Р[р]<Р[?].
24.	Пусть даны п высказываний и каждому высказыванию приписана вероятность, не превосходящая г. Докажите, что вероятность дизъюнкции этих высказываний не превосходит пг.
25.	Ниже приведено доказательство свойства (С'), отличное от данного в тексте. Обоснуйте каждый шаг.
(а) ХиУ==(*ЛУ)и(*ПГ)и(ГП^),
(b) т (X (J У) = т (Хр У) + т (Хр Г) + т (Яр У), (с) т (X|J У) = т (X) 4- т (У) — т (XП У).
26.	Докажите, что для трех множеств X, У и Z и любой вероятностной меры т (X(J У (J Z) = т (X)	т (У) -j-m(Z) —
- т (ХП У) - т (УЛ Z) - т (Хр Z) 4- т (Хр УП Z).
27.	Переведите результат упр. 26 на язык вероятностей высказываний.
28.	Ставится доллар против цента за то, что некоторое событие произойдет.
В предположении, что пари честное, найдите вероятность наступления ,	Гл 100 1
этого события,	I СМпв.:-дор. I
§ 3. СИММЕТРИЧНАЯ МЕРА
Выше мы уже рассмотрели несколько примеров, в которых при введении вероятностей меры оказалось естественным приписать всем логическим возможностям один и тот же вес. Вероятностную меру, определенную таким образом, назовем симметричной, В случае симметричной меры выражение для меры множеств приобретает очень простую форму. В самом деле, если И содержит п элементов и если вероятностная мера симметричная, то для любого множества X имеем: т(Х) = r/п, где г — число элементов множества X. Это следует из того, что вес каждого элемента множества X равен 1/п, потому сумма весов всех элементов X равна г/п.
172
Гл. IV. Теория вероятностей
Эта простота симметричной меры делает ее особенно удобной при вычислениях. В связи с этим важно отметить, что в одной и той же ситуации один выбор множества возможностей может привести к симметричной мере, в то время как другой выбор к ней не приводит. Например, возьмем случай двукратного бросания обычной монеты. Предположим, что нас интересует высказывание о числе выпадений герба. Если в качестве множества возможностей взять И = {ГГ, ГЦ, ЦГ, ЦЦ}, то будет разумно приписать один и тот же вес каждому исходу, что приведет нас к симметричной мере. Если бы, с другой стороны, в качестве возможных исходов мы взяли множество U = {ни одного Г, один Г, два Г}, то было бы неразумным приписывать всем исходам один и тот же вес, потому что один герб может выпасть двумя различными способами, тогда как каждая из других возможностей может осуществиться только одним способом.
Пример 1. Предположим, что мы бросаем две различные игральные кости. На каждой кости может выпасть некоторое число очков, равное одному из чисел от 1 до 6; следовательно, имеется 6 • 6 = 36 возможностей. Припишем каждой возможности вес -gg-. Тогда всякое предсказание, истинное в / случаях, будет иметь вероятность -gg-. Например, «Сумма очков на обеих костях равна 5» будет истинно, если выпадет 1 + 4, 2 + 3, 3 + 2 или 4 + 1 очков. Следовательно, вероятность того, что сумма очков будет равна 5, равна-gg- — —g—-Сумма очков может равняться 12 только в одном случае, при выпадении 6 + 6 очков. Следовательно, вероятность выпадения 12 очков равна -gg-’
Пример 2. Предположим, что из колоды в 52 игральные карты выбираются последовательно две карты. Какова вероятность, что обе они червонные? Для первой карты имеется 52 возможности и для каждого выбора первой карты для второй карты остается 51 возможность. Следовательно, для выбора двух карт (где мы различаем, какая карта была взята первой, а какая — второй) имеется 52 • 51 возможностей. Мы введем симметричную меру. Высказывание «Обе карты червонной масти» истинно для 13-12 из 52-51 возможностей. Следовательно, вероятность этого высказывания равна (13-12)/(52*51) = -^-.
Пример 3. Допустим, что предлагается метод, позволяющий по некоторым признакам судить о будущих успехах студентов, и что в применении к студентам А, В и С при
§ 3. Симметричная мера
173
поступлении их в колледж этим методом было получено следующее предсказание: после четырех лет учебы при окончании колледжа наибольших успехов достигнет А, за ним будет идти С, а В будет последним из троих. Предположим, что это предсказание в точности сбылось. Если рассматриваемый метод предсказания не имеет никакой ценности и, следовательно, предсказания равнозначны простому угадыванию, то чему равна вероятность того, что такое предсказание окажется правильным? Имеется 3! = 6 возможных порядков распределения студентов в зависимости от их успехов по окончании ими колледжа. Если предсказания в действительности равнозначны угадыванию, то мы можем приписать один и тот же вес каждому из шести исходов. В таком случае вероятность того, что сбудется отдельное предсказание, равна -g~. Поскольку эта вероятность достаточно велика, мы поколебались бы заключить, что данный метод предсказания действительно полезен, на основании единственного эксперимента. Предположим, с другой стороны, что этим методом правильно предсказан порядок шести человек. Тогда аналогичный анализ показал бы, что в случае угадывания вероятность правильного предсказания равна gy = -?2Q. Следовательно, здесь мы можем заключить о наличии сильного довода в пользу того, что предложенный метод не лишен ценности.
Упражнения
1.	Из слова «наугад» выбирается наугад одна буква. Какова вероятность того, что это будет буква у? Какова вероятность, что это будет гласная?
Ome.:-!;
2.	Выбирается наугад одно число между 3 и 12 включительно. Какова вероятность того, что это число будет четным? Что оно будет четным и будет делиться на 3?
3.	Из колоды в 52 карты выбирается наугад одна карта.
(а) Какова вероятность того, что это будет карта трефовый король?
червонной масти или
(b) Какова вероятность того, что «картинка» (т. е. валет, дама,
это будет или червонная дама или
[4 1
Отв:. -уд-.|
4 Из множества слоев U = {поп, лоб, лось, авось, любовь} выбрано наугад одно слово. Пусть р, q и г означают высказывания:
р: Это слово имеет две гласные.
q: Первой буквой этого слова является буква л.
г: Это слово рифмуется со словом морковь.
174
Гл. IV. Теория вероятностей
Найдите вероятности следующих высказываний:
(а) Г',
(Ь) <Г, (с) г, (d) PKq-,
(е) (PV9)A~r;
(f) p-*q-
К Бросается игральная кость. Найдите вероятность того, что
(а)	выпадет нечетное число очков;
(Ь)	выпадет более двух очков;
(с)	выпадет семь очков.
6.	Предположим, что в примере с участниками математической олимпиады (см. § 1 гл. II) все 36 результатов олимпиады одинаково вероятны. Найдите
(а) вероятность того, что участник А решит большее число задач, чем
каждый из его соперников;
Отв.'.
(Ь)
(с)
вероятность того, что все задачи решит первым один и тот же участ-
Гл	1 1
ник соревнования;	Отв., .
L	со J
вероятность того, что различные задачи решат первыми различные участники.	[Отв.: 0.]
7.	Игральная кость бросается дважды. Какое значение суммы очков при двух бросаниях имеет наибольшую вероятность? Найдите значение или значения суммы очков, имеющие самую меньшую вероятность выпадения.
8.	Фотограф располагает одного мальчика и двух девочек в ряд случайным образом. Какова вероятность того, что на фотографии мальчики и девочки будут чередоваться?	[Отв.: —4- .1
L м J
9.	В одном колледже имеется 500 студентов, причем известно, что
300 изучают французский язык,
200 изучают немецкий язык,
50 изучают русский язык,
20 изучают французский и русский языки,
30 изучают немецкий и русский языки,
20 изучают немецкий и французский языки, 10 изучают все три языка.
Из этого колледжа выбирается наугад одни студент. Какова вероятность того, что выбранный студент:
(а)	изучает два и только два языка?
(Ъ)	изучает по крайней мере один из трех языков?
10.	Предположим, что трое лиц садятся за стол, за которым стоят подряд шесть стульев. Если они выбирают свои места наугад, то какова вероятность того, что они рассядутся таким образом, что между ними не будет пустых стульев? Какова вероятность того, что между любыми дву. мя из иих будет находиться по крайней мере один пустой стул?
£ 3. Симметричная мера
175
11.	Найдите вероятность получения следующих карт при игре в покер. (В покере каждый игрок получает пять карт, выбранных наугад из колоды в 52 карты.)
(а)	«Флеш-рояль» (десятка, валет, дама, король, туз одной масти).
4Д 52 j «t 0,0000015. J
(b)	«Стрит-флеш» (пять последовательных карт одной масти, ио не
флеш-рояль).	[отв.: (40—4)/^0,000014.J
(с)	«Каре» (четыре карты одного и того же значения).
[Отв.: 6240,00024.J
(d)	«Фул» (две карты одного	значения и оставшиеся три	карты также
одного и того же значения).	[отв.: 3744/^	0,0014.J
(е)	«Флеш» (пять карт одной	масти,	но не «стрит-флеш»	и	не	«флеш-
рояль») .	[ Отв.: (5148—40) Д 5g2	0,0020. J
(I) «Стрит» (пять последовательных карт, но не все одной масти).
[ Отв.: (10 240—40)/ (	~ 0,0039. ]
(g) «Стрит» или лучше, чем «стрит».	[Отв.: «0,0076]
12.	Пусть десять человек располагаются за круглым столом случайным образом. Какова вероятность того, что два данных человека сядут рядом?
[Отв.:|.]
13.	В комнате находится группа из п человек, каждый из которых имеет значок с номером от 1 до п. Если выбираются наугад два человека, то какова вероятность того, что человек с большим номером имеет номер 3? Решите эту задачу для случаев п — 5. 4. 3, 2. [Отв.: -д-; -д-; -д-; 0.J
14.	В условиях упр. 13 предположим, что мы видели, как два человека покинули комнату, лричем ббльший из номеров их значков был 3. Какие предположения мы можем строить относительно номеров значков людей, оставшихся в комнате?
15.	Найдите вероятность того, что игрок в бридж (см. пример 2 из §5 гл. Ill । получит
(а)	5 карт одной масти, 4 другой, 3 третьей и 1 четвертой.
Г / 13 \ Z 13\ / 13\( 13 \
_	4 \ 5 Д 4 Д 3 Д 1 }
(1з)
(Ь)	6 карт одной масти, 4 второй, 2 третьей и 1 четвертой. [Отв.: « 0.047.) (с) 4 карты одной масти, 4 второй, 3 третьей и 3 четвертой.
[Отв.: « 0,216.)
(d)	4 карты одной масти, 3 второй, 3 третьей и 3 четвертой.
[Отв.: « 0,105.) / 52 \
16.	При сдаче карт в бридже каждый игрок заранее имеет \ 23 ) ~ 6,35 • Юп
176
Гл. IV. Теория вероятностей
возможностей. Найдите вероятность того, что при случайном распределении карт все 13 карт окажутся одной и той же масти. Какой порядок величины должно иметь среднее число сдач карт, приходящееся на каждого из 150 000 (примерно) потенциальных игроков в бридж в Соединенных Штатах Америки, для того, чтобы можно было считать вероятной в течение года сдачу карт, при которой кто-нибудь получит карты одной и той же масти?
17.	Из колоды в 52 карты последовательно извлекаются три карты. Пусть 1 есть функция, определяющая число извлеченных карт черных мастей. Область изменения значений f есть {0, 1, 2, 3}. Определите Р[/= а] для а = 0, 1, 2, 3.
[9 Отв.: Р[/=3] = Р[/=0]=-^,
Р[/= !] = ₽[/= 2] = -§-.]
18.	Пусть f есть функция, определяющая сумму номеров двух выбранных людей, фигурирующих в упр. 13. Тогда областью изменения значений f является {3, 4......2п — 1}. Вычислите Р[/ = 5] для п — 5, 4, 3 и 2.
[Отв.: >/5, >/3, »/3, 0J 19. В кармане одного человека имеются восемь монет: три дайма и пять никелей1). Человек наугад выбирает три из них и записывает величину вынутой суммы (в центах). Обозначим эту сумму через /. Вычислите
Г 2 1
(а)	Р [/> 20];	[Оте.: у-]
(Ь)	Р[/^22];
[2 -1 Отв.: у.1
§ 4«. ДВА ПРИМЕРА, НЕ ПОДКРЕПЛЯЕМЫХ ИНТУИЦИЕЙ
Может оказаться, что ответ на какую-нибудь задачу, полученный с помощью теории вероятностей, совершенно не согласуется с нашей интуицией. Очень поучительна в этом отношении задача о совпадении дней рождения.
Пусть в некоторой комнате, присутствует г человек, и мы держим пари, что из этих г человек по крайней мере двое родились в один и тот же день, т. е. в один и тот же месяц и одного и того же числа. Мы хотим определить значение г,- для которого пари будет честным. Немногие бы согласились заключить это пари на равных условиях, если число людей в комнате меньше 100. Большинство назвало бы в качестве приемлемого количества людей 150. Однако мы увидим, что при г = 150 имеется примерно 45-1014 шансов против одного, что по крайней мере у двоих присутствующих день рождения один и тот же. Мы увидим также, что пари следует держать на равных условиях уже при наличии 23 человек в комнате.
’) См. подстрочное примечание на стр. 42
§ 4*. Два примера, не подкрепляемых интуицией
177
Найдем сначала вероятность того, что никакие два из г человек не имеют одного и того же дня рождения. Для дня рождения каждого человека имеется 365 возможностей (мы пренебрегаем 366-й возможностью, связанной с днем 29 февраля). Тогда для дней рождения г человек имеется 365г возможностей. Мы считаем все эти возможности равновероятными. Для нахождения вероятности того, что никакие двое из присутствующих
Число человек в комнате	Вероятность совпадения дней рождения по крайней мере двух человек	Приблизительное условие честного пари
5	0,027	
10	0,117	
15	0,253	
20	0,411	70:100
21	0,444	80:100
22	0,476	91: 100
23	0,507	103:100
24	0,538	103:100
25	0,569	132:100
30	0,706	242:100
40	0,891	819:100
50	0,970	33:1
60	0,994	169:1
70		1200:1
80		12000:1
90		160000:1
100		33 • 105 :1
125		31 -109 :1
150		45•10й : 1
Фиг. 78
не имеют одного и того же дня рождения, мы должны найти число тех возможностей для дней рождения, в которых никакой день не фигурирует дважды. Первый человек может иметь в качестве своего дня рождения любой из 365 дней. Каждый из них оставляет для второго человека (день рождения которого должен быть другим!) 364 возможности. Для третьего человека имеется 363 возможности, если требовать чтобы его день рождения был отличен от дней рождения двух предыдущих людей и т. д. Таким образом, вероятность того, что в группе из г человек никакие два человека не имеют одного и того же дня
12 Зак- 9J4,
178
Гл. IV. Теория вероятностей
рождения, равна	365 - 364 ... (365 — г -}-1)
q'~	365'
Вероятность того, что по крайней мере два человека имеют один и тот же день рождения, равна pr = 1— qr. На фиг. 78 приведены для ряда значений г величины рг и условия Л/(1 — Рг) честного пари.
Рассмотрим теперь вторую задачу, в которой интуиция также не помогает в получении правильного ответа. Мы видели, что имеется /г! перестановок чисел от 1 до п. Будем рассматривать каждую из этих перестановок как операцию, приписывающую каждому из чисел одну из п возможных позиций (каждое число занимает одну и только одну позицию). Предполагается, что позиции занумерованы последовательными числами от 1 до п. Будем говорить, что i-e число (т. е. число, занимающее i-ю позицию) оставляется на месте данной перестановкой, если эта перестановка приписывает позицию (номер) i числу i. Например, если п — 3, то перестановка 123 оставляет все числа на месте, перестановка 213 оставляет одно число на месте, и перестановки 312 и 231 не оставляют на месте ни одного числа. [Очевидно, что при п = 3 не могут остаться на месте в точности два числа. (Почему?).]
Определение. Перестановка называется полной, если она не оставляет на месте ни одного числа.
Задача, которую теперь мы хотим рассмотреть, формулируется следующим образом. Пусть выбирается наугад перестановка п чисел; какова вероятность того, что эта перестановка окажется полной? Эту задачу можно также представить в следующей наглядной форме. Гардеробщица выдала номерки >п лицам, сдавшим в гардероб п шляп. Выдав все номерки одновременно, она после этого безнадежно перепутала все шляпы и повесила их наугад. Какова вероятность того, что каждому из этих п лиц гардеробщица выдаст чужую шляпу? В этой задаче одним людям интуиция подсказывает, что для большого числа шляп искомая вероятность должна быть очень маленькой, другим — что она должна быть большой. Немногие догадаются, что эта вероятность не мала и не велика и что она почти не зависит от числа фигурирующих шляп.
Чтобы найти эту вероятность, допустим, что все п\ перестановок равновероятны и, следовательно, нам нужно только подсчитать число полных перестановок из п элементов. Пусть w„ означает число таких перестановок. Тогда искомая вероятность равна pn~-wn!n!. Произведя нужные вычисления (см. упр. 10), мы найдем	.
1	1 -4- 1	+ 1
Рп ~ 2!	31	4!	' ’ * ~ п| ’
§4*. Два примера, не подкрепляемых интуицией
179
где последний член берется со знаком плюс при четном л и со знаком минус при нечетном л. На фиг. 79 приведены значения числа р для нескольких значений л.
Число ШЛЯП	Вероятность того, что ни один посетитель не получит своей шляпы
2 3 4 5 6 7 8	0,500000 0,333333 0,375000 0,366667 0,368056 0,367857 0,367882
Ф и г. 79
Можно показать, что с возрастанием числа шляп эти вероятности неограниченно приближаются к числу 1/е = 0,367879..., где е = 2,7182818... есть число, играющее важную роль во многих разделах математики1).
Упражнения
1.	В школе имеется три выпускных класса, в каждом из которых 30 человек. На каком условии согласились бы вы держать пари, что по меньшей мере два выпускника имеют один и тот же день рождения?
[Отв.: 160 000:1.]
2.	Какова вероятность, что по меньшей мере два студента вашей группы имеют один и тот же день рождения?
3.	На каком условии согласились бы вы держать пари, что по меньшей мере два участника сборной команды страны по футболу имеют один и тот же день рождения?
4.	На каком условии согласились бы вы держать пари, что по меньшей мере два академика родились в один и тот же день года?
5.	Четыре человека сдают свои шляпы в гардероб. В предположении, что шляпы возвращаются наугад, найти вероятность того, что все четверо
*) Число е — основание системы натуральных, или неперовых, логарифмов— можно определить как lim
п
| или как lim Л->оо
(т. е, как сумму бесконечного ряда 1 4~ у -f- -Jj- -f-
12*
180
Гл. IV. Теория вероятностей
получат свои собственные шляпы. Какова вероятность того, что свои собственные шляпы получат в точности 3, 2, 1, 0 человека?
Гп	1 . п 1 • 1 . 3 '
\Отв.. 24 , 0, 4 , 3 , 8 .
6.	50 мужчин и их жены начинают танцевать. Партнеры в танце выбираются по жребию. Какова приближенная вероятность того, что ни один мужчина не будет танцевать со своей женой?
7.	Докажите, что вероятность совпадения дней рождения в точности двух человек из общего числа г человек равна
( г \ 365 • 364 ... (365 — г -|- 2)
*т “ 2 )	3657	‘
8.	Покажите, что = ( 2) 36(Г^7 ' где tr опРеделено в УПР- 7> а есть вероятность того, что никакие два человека не имеют одного и того же дня рождения.
9.	Используя результат упр. 8 и результаты, приведенные в таблице на фиг. 78, найдите (для случаев г = 15, 20, 25, 30, 40 и 50) вероятность того, что в группе из г человек имеется в точности два человека с одним н тем же днем рождения.	[Отв.: 0,22; 0,32; 0,38; 0,38; 0,26; 0,12.]
10.	Пусть wn означает число полных перестановок п чисел.
(а)	Покажите, что
= 0, о»2 = 1, ..
®л = (я-1)»я-| + («-1)»я-8.	п = 2, 3....
(Указание. Любая полная перестановка п чисел может быть получена из полной перестановки п—1 чисел, или из такой перестановки п — 1 чисел, которая оставляет на месте ровно одно число. Опишите, каким образом это можно сделать, и покажите, что первый и второй члены правой части нашего равенства равны числу тех полных перестановок, которые можно получить соответственно первым и вторым способом.)
(Ь)	Пусть рп означает вероятность того, что выбранная наугад перестановка п чисел будет полной. Из (а) выведите, что
» 1
А=°, Р2=2-«
И-- 1	,	1	9	.
Рп —	~ Рп-1 + ~Рп-2> п — 3, 4, ... .
(с)	Пусть v„ — Pn—Pn-I лля л = 2, 3, 4 .... Из (Ь) выведите, что
и (рП —Рп-1) ==	(Pn-i Рп-г)> П — 3,...,
и, следовательно, что пи„ = — vn-i, л = 3.......................
(d)	Используя тот факт, что pt = 0 и р2 = найдите v3. Используя результат (с), найдите v3, v4,..., vn.
(е)	Используя результат (d), покажите, что
_ 1 1 , . 1
Рп~ 21	31 + •" п! •
§ 5. Условная вероятность
181
11.	В известной карточной игре «солитер» игрок последовательно по одной открывает карты тщательно перетасованной колоды из 52 карт и одновременно в заранее выбранном порядке перечисляет все карты этой колоды. Его цель заключается в том, чтобы перебрать все карты, ни разу не назвав открывшуюся карту. Какова здесь вероятность выигрыша? Какой будет вероятность выигрыша, если ограничить колоду лишь картами одной н то же масти (например, пик)?
§ 5. УСЛОВНАЯ ВЕРОЯТНОСТЬ
Пусть дано множество И, всем подмножествам которого приписана определенная мера. Если р — некоторое высказывание, то оно имеет вероятность Р |р] = т(Р). Предположим теперь, что мы получаем дополнительную информацию, согласно которой некоторое другое высказывание, скажем q, истинно. Каким образом эта дополнительная информация изменит вероятность высказывания р?
Вероятность высказывания р после получения такой информации о высказывании q называется условной вероятностью и обозначается символом Р9 [р], который следует читать «вероятность р при условии q». В этом разделе будет изложен метод нахождения условной вероятности при помощи меры т.
Если известно, что q истинно, то тем самым первоначальное множество возможностей U сводится к некоторому множеству Q; следовательно, мы должны задать меру на подмножествах Q, а не U. Разумеется, каждое непустое подмножество X множества Q является и подмножеством И, так что мера т(Х) была известна нам еще до появления информации q. Однако, поскольку q сокращает число возможностей, то новая мера т'(Х) множества X должна быть больше его первоначальной меры т(Х).
Основная идея, на которой основано задание меры т', состоит в следующем. Хотя нам известно, что множество возможностей сведено к Q, мы не располагаем никакой новой информацией о подмножествах Q. Поэтому, если X и У, скажем, такие подмножества Q, что m(X) — 2m(Y), то желательно, чтобы было также т' (X) — 2m'(Y). Это будет иметь место, если меры всех подмножеств Q увеличены в одно и то же число раз-т' (X) = km(X). Остается только определить множитель пропорциональности k. Так как известно, что 1 — т' (Q) = k  т (Q), то k=l/m(Q) и наша новая мера на подмножествах И задается формулой
о»
Как это влияет на вероятность высказывания р? Прежде всего множество истинности р стало меньшим. Так как
182
Гл. IV. Теория вероятностей
исключаются все элементы множества Q, то новым множеством истинности высказывания р будет Р Г) Q и, следовательно,
P,|p| = m-(PnQ)=”^nOl = ±^l.	(2)
Отметим, что если первоначальная мера m была симметричной, то новая мера tn' также будет симметричной мерой (на множестве Q).
Мы должны, естественно, потребовать, чтобы знаменатели в (1) и (2) были отличны от нуля. Заметим, что m(Q) = 0 только в том случае, если Q — пустое множество; последнее означает, что высказывание q противоречиво (т. е. ложно во всех мыслимых случаях) и этот случай единственный, для которого Р[#] = 0. По этой причине мы вводим естественное требование, чтобы высказывание q, доставляющее нашу информацию, не было противоречивым (было выполнимо).
Пример 1. Пусть вероятность того, что участник А спортивного состязания займет первое место, равно 0,4, для участника В эта вероятность равна 0,3, для участника С она равна 0,2 и для участника D равна 0,1. Перед самым состязанием выясняется, что С не сможет принять в них участие. Каковы теперь шансы трех других участников? Пусть q есть высказывание, утверждающее, что С не победит, т. е., что победит или А, или В, или D, Поскольку Р[<7] = 0,8, то при условии, что q истинно, все другие вероятности должны возрасти в 1/0,8 = 1,25 раз. Теперь вероятность победить для участника А равна 0,5, для участника В равна 0,375 и для участника D равна 0,125.
Пример 2. Из множества всех семей, имеющих в точности двух детей (не близнецов), выбрана наугад одна семья. Какова вероятность, что в этой семье имеются два мальчика, если известно, что в ней есть один мальчик? Не имея никакой информации, мы должны были бы ввести симметричную меру на множестве И — {ММ, МД, ДМ, ДД), где первая буква пары указывает пол младшего ребенка, а вторая — пол старшего ребенка. Информация о наличии одного мальчика сокращает множество логических возможностей U до множества {ММ, МД, ДМ}. Новая мера остается симметричной и, таким образом, условная вероятность того, что имеется два мальчика при условии, что в семье есть один мальчик, равна */з- Если бы еще было известно, что мальчик — это старший ребенок, то условная вероятность равнялась бы ’/г-
Специальный интерес представляет случай, когда Р9[/)] = = Р[р]. Здесь новая информация q не влияет на вероятность вы
§ 5. Условная вероятность
183
сказывания р, поэтому мы говорим, что высказывание р независимо от q (при заданной вероятностной мере). Если мы в (2) заменим P.lP] на Р[р] и умножим обе части равенства на то получим, что Р[р Л ?] — Р[р] • Р[?]. К тому же самому результату мы придем и в случае, когда q независимо от р. Следовательно, свойство независимости двух высказываний является взаимным, и мы можем сказать, что р и q независимы друг от друга тогда и только тогда, когда выполнено выписанное выше условие.
Определение. Пусть U — множество логических возможностей, на котором определена вероятностная мера пг, и р, q — высказывания, связанные с множеством 21. Эти высказывания р и q называются независимыми высказываниями (относительно меры т), если
Р IP Л <71 == Р [Р1  Р 1^1-	(3)
Хотя мы и обладаем некоторым интуитивным представлением о независимости, может случиться, что какие-нибудь два высказывания, которые не кажутся независимыми, на самом деле являются независимыми. Рассмотрим, например, троекратное подбрасывание монеты, и пусть г означает «Все три раза монета выпадает одной и той же стороной», a s означает «Выпадает, самое большее, один герб». Тогда г и s будут независимыми высказываниями (см. ниже упр. 10).
Пример 3. Монета подбрасывается дважды, и все четыре возможных исхода считаются равновероятными. Обозначим через р высказывание «В первый раз выпадает герб», а через q высказывание «Во второй раз выпадает цифра». Тогда Р [р] — Р |^] = >/г» a PIpAfl'] — 1/^ и, следовательно, высказывания р и q независимы (относительно симметричной меры). Предположим теперь, что характер проведения опыта изменен следующим образом. Первый раз подбрасывается обычная монета; если выпадает герб, то вторично подбрасывается та же монета, если же выпадает цифра, то подбрасывается другая монета, у которой вероятность выпадения цифры в три раза больше вероятности выпадения герба В этом случае вероятности событий ГГ и ГЦ равны между собой и равны ’А; вероятность события ЦГ равна ’/в, а вероятность события ЦЦ — %. Поэтому, если р и q определены как и раньше, то Р [/>]=’А, Р Ы — 5/в’ а Р IP Л q\ — ’Д- так что относительно новой вероятностной меры высказывания р и q не независимы. Это обстоятельство подчеркивает тот факт, что независимость высказываний существенно зависит от способа задания вероятностной меры на пространстве логических возможностей.
184
Гл. IV. Теория вероятностей
Пример 4. Обычную монету подбрасывают трижды. Обозначим через/число выпадений герба. Тогда
р [/= 3] = р [/= 0] = V8 и Р [/=2] = Р [/= 1] = 3/8.
Рассмотрим теперь два высказывания „(/=3) V (/=0)“ и / <О“> или, другими словами, высказывания «Все три раза монета падает одной стороной» и «Выпадает не более одного герба». Относительно симметричной меры эти высказывания, которые с первого взгляда не кажутся независимыми, являются независимыми (об этом мы уже упоминали выше). С другой стороны, нетрудно построить на пространстве логических возможностей такую меру, что эти же два высказывания уже не будут независимыми (см. упр. 22).
От понятия независимости высказываний нетрудно перейти к понятию независимости функций.
Определение. Пусть U есть множество логических возможностей с заданной на нем вероятностной мерой tnngx,g<2,... . gr — функции, определенные на этом множестве й . Эти функции называются независимыми (относительно меры т), если
P[(gri = «i)A(g’2 = «2)A ••• /\(gr = ar)] = = Р [g-i = «zj - Р [gb = л2] ••• P[g’r = ar]
для любых значений Op а2, •••, аг.
В тех случаях когда нам будет необходимо отличить независимость в только что определенном смысле от логической независимости, о которой говорилось в гл. II (или от понятия линейной независимости, фигурирующего в гл. V), мы будем называть эту независимость вероятностной.
Можно показать (ср. упр. 21), что если некоторое множество функций независимо относительно некоторой вероятностной меры «г, то независимым окажется и любое подмножество этого множества функций.
Пример 5. Монету подбрасывают трижды. Пусть U = = {ГГГ, ГГЦ, ГЦГ, ГЦЦ, ЦГГ, ЦГЦ, ЦЦГ, ЦЦЦ}. Обозначим через /Р /2. /3 три функции, определяющие исходы первого, второго и третьего бросаний. Предположим, что на И определена симметричная мера; мы хотим выяснить, являются ли функции /, /2 и /3 независимыми или нет. Для этого нужно проверить, например, справедливо ли равенство
Р[(Л=Г)Л(/2=Ц)Л(/=Г)]=
~Р(Я = П Р1Л = ЦРР1Л = Г|.
§ 5. Условная вероятность
185
Множество истинности высказывания в левой части равенства состоит из единственного элемента {ГЦГ} и, следовательно, вероятность этого высказывания равна l/s- Каждое из трех высказываний в правой части имеет вероятность ’/г и, следовательно, их произведение также равно '/в- Аналогичные вычисления для других возможных наборов значений функций исходов показывают, что функции /1, /2 и /з являются независимыми (относительно симметричной меры). Отсюда следует, что для этой же меры любые две из этих функций, например и /3, являются попарно независимыми.
Выясним теперь, как связаны между собой понятия вероятностной и логической независимости. „Мы будем исследовать только случай двух функций. Пусть / и g—две функции, определенные на множестве U и не являющиеся логически независимыми. Это значит, что для некоторых а и b высказывания f(x) — a и g(x) — b не являются логически ложными, в то время как высказывание (/(х) — а) Д (g’(x) = b) логически ложно. Поскольку вероятность высказывания равна нулю тогда и только тогда, когда оно логически ложно, то независимо от характера выбранной вероятностной меры
Р[/ =л] • Р1^== =# 0, а Р[(/=а) Д (§• = £>)] = 0.
Отсюда следует, что если / и g логически зависимы, они не могут быть и вероятностно независимыми. Таким образом, логическая независимость высказывания является необходимым условием для вероятностной независимости.
Можно даже показать, что логическая независимость функций / и g является необходимым и достаточным условием существования такой вероятностной меры, что / и g оказываются вероятностно независимыми относительно этой меры. Мы уже видели, что логическая независимость является необходимым условием вероятностной независимости. Покажем теперь, что для любой пары логически независимых функций существует по крайней мере одна (а обычно их много) вероятностная мера, относительно которой эти функции становятся вероятностно независимыми. Пусть а2, ..., ат есть множество возможных значений функции/, а Ьх, Ь2, ..., Ьп— множество возможных значений функции g. Введем теперь на множестве логических возможностей такую вероятностную меру, чтобы вес множества истинности высказывания (/(jc) — а}) Д (g(x) = bk) был равен \1тп. Это можно сделать следующим образом: из логической независимости функций fug следует, что рассматриваемое множество истинности непусто; если оно содержит t элементов, то мы припишем каждому элементу этого множества вес \lmnt,
186
Гл. IV. Теория вероятностей
У нас имеется тп множеств истинности указанного вида; эти множества не пересекаются и содержат все элементы И. Вес каждого из множеств истинности выбран равным \frnn и, следовательно, суммарный вес всего множества И равняется тп-(1/тп) — 1. Поэтому построенная таким путем мера является вероятностной. При этом наша мера такова, что
Теперь заметим, что
Р ]/= а]\ = Р ](/ = а}) Л [g = М + Р [(/= а}) Л	ft2)| + . -.
...+Р|а=а,)Л(?=»Л=-^-“
Аналогичным же образом
Р&=&] = 1/л
и, следовательно,
Р [(/= й7) Л (g = ft*)] = l/wn = Р [/= aj] • Р fg= bk\.
Поэтому относительно определенной таким способом вероятностной меры наши функции оказываются вероятностно независимыми.
Пример 5 (продолжение). Обозначим через gx функцию, равную 1, если в первый раз выпадает герб, и 0, если в первый раз выпадает цифра; через g< обозначим функцию, определяющую общее число выпадений герба в трех бросаниях. Тогда g\ может принимать значение 1, a g2— О, но обе функции не могут принимать эти значения одновременно Следовательно, g\ и g2 логически зависимы. Поэтому независимо от выбранной меры эти функции не могут оказаться вероятностно независимыми.
Упражнения
1.	Из колоды в 52 карты выбирается наугад одна карта. Какова вероятность того, что это будет пятерка при условии, что значение карты заключено между 2 и 7?
2.	Игральная кость бросается два раза. Какова вероятность того, что сумма выпавших очков будет больше десяти, при условии, что один раз выпадает шестерка? При условии, что при первом бросании выпадет шестерка?	-jy; -g-.J
3.	Игральная кость сделана таким образом, что вероятность выпадения того или иного числа очков пропорциональна количеству очков.
Упражнения
187
(а)	Какова вероятность выпадения трех очков, если известно, что выпало нечетное число оиков?	Отв.'. I
|_ о J
(Ь)	Какова вероятность выпадения четного числа очков, если известно, [2 1 Отв.: -j-.
4.	Вернемся к упр. 9 из § 3 гл. IV. Какова вероятность того, что выбранный студент изучает немецкий язык, если
(а)	он изучает французский язык?
(Ь)	он изучает французский и русский языки?
(с)	он не изучает ни французского, ии русского языка?
5.	Пусть в примере с участниками математической олимпиады из § 1 гл. II введена симметричная мера. Найдите вероятность того, что А решит первым по меньшей мере две задачи, при условии, что участник В является
слабым геометром.
6.	Если Р	и Рр [д] == ~, то чему равна Р [/? Л д]?
7.	Студент держит экзамен, состоящий в установлении истинности или ложности пяти утверждений. Какова вероятность того, что он правильно ответит на все вопросы, если
[Одгв.: -д . [Отв.:|.
(а)	он просто угадывает?
(Ь)	ему известно, что преподаватель предлагает иа экзамене всегда больше истинных утверждений, чем ложных?
(с)	ему также известно, что преподаватель никогда не задает подряд три вопроса, требующие одинакового ответа?
(d)	ему также известно, что ответы на первый и последний вопросы должны быть противоположными?
(е)	ему также известно, что ответом на второй вопрос должно быть «ложно»?
8.	Три человека А, В и С выстроены цаугад в одну линию. Пусть г означает высказывание «В стоит справа от А» a s — высказывание «С стоит справа от А».
(а)	Чему равна Р[гД$]?
(Ъ)	Независимы лн г и s?	[Отв.: Нет.]
9	Пусть колода карт состоит из валетов и дам, отобранных из полной коло-' ды. Из такой колоды выбираются наугад две карты. Найдите
1 Отв.:
О
(а)
(Ь)
(с)
вероятность того, что обе эти карты — валеты, при условии, что одна из иих — валет;	«^0,27-J
вероятность того, что обе эти карты — валеты, при условии, что
[5	1
Отв.:	^0,3 8.
вероятность того, что обе эти карты — валеты, при условии, что одна ГЗ "1 Отв.: -= ^0,43.
188
Гл. IV. Теория вероятностей
10.	Докажите, что высказывания, фигурирующие в примере 4, независимы (относительно симметричной меры).
11.	Следующий пример показывает, что г может не зависеть от р и q, не будучи независимым от p/\q и р\/ q. Бросаем два раза монету. Пусть р означает «При первом бросании выпадет герб», q означает «При втором бросании выпадет герб» и г означает «При обоих бросаниях монета падает одной и той же стороной». Вычислите
РИ. РрИ. Р?И. РрЛ?И, Ppve[r].
Гл 1 1 1 1 1 1 ]0тв.. 2 ’ 2 ’ 2 ’ 1( 3 ’]
12.	Докажите, что для любых двух высказываний р и q
Р [р] = Р [рл?] + Р [рЛ~q].
13.	Допустим, что р и q— независимые высказывания. Докажите, что высказывания каждой из следующих пар высказываний также независимы:
(а) р и
(Ь) -?ир;
(с) -ри-?.
14.	Докажите, что для любых трех высказываний р, q и г имеет место соотношение
р [рмлН = р [р] • Рр М • ₽р л? ki-
lo. Докажите, что два высказывания вероятностно независимы (относительно некоторой вероятностной меры) тогда и только тогда, когда вероятностно независимы (относительно той же меры) характеристические функции этих высказываний.
16.	Докажите, что для существования вероятностной меры, относительно которой два данных высказывания оказываются вероятностно независимыми, необходимо и достаточно, чтобы эти высказывания были логически независимыми.
17.	Пусть И есть множество из восьми возможных исходов трехкратного бросания монеты. Обозначим через р высказывание «В первый раз выпадает герб» и через q высказывание «Выпадает не меньше двух гербов», (а) Являются ли высказывания р и q логически независимыми. [Отв.: Да.] (Ь) Если все элементы И равновероятны, то являются ли р и q вероятностно независимыми?	[Отв.: Нет.]
(с) Постройте на U такую вероятностную меру, относительно которой р и q вероятностно независимы.
18.	Пусть V. есть множество из 16 возможных исходов четырехкратного бросания монеты. Для каждой из следующих пар функций определите (i) являются ли они логически независимыми и (ii) являются ли они вероятностно независимыми (относительно симметричной меры):
'(а) /(х) = 1, если во второй раз выпадает герб и/(х) = 0 в остальных случаях; g{x) определяет число выпадений герба в третьем и четвертом бросаниях;
(Ъ)	/(х) определяет число выпадений герба в первых трех бросаниях, a ff(x) — число выпадений герба в двух последних бросаниях;
(с)	/(х) — характеристическая функция высказывания «Исход первых двух бросаний одинаков», a ff(x) — характеристическая функция высказывания «По крайней мере два раза выпала цифра».
Упражнения
189
19.	Пусть f,gu h — любые три функции. Докажите, что
Р[(/=я)Л(в- = *)Л(Л = с)] =
= ₽[/=«]• Р/=л [£•=/>]• Р(/=с) д (g.= fc) [ft = С],
где а, Ь и с принадлежат области изменения функций/, g и h соответственно.
20.	Пусть функции f и g вероятностно независимы относительно заданной вероятностной меры, а и Ь какие-то возможные значения этих функций Докажите, что
Р^=6 !/-«] = Р [/=«]-
21.	Пусть fi, /2, /3 независимы относительно заданной вероятностной меры. Докажите, что каждая из перечисленных пар функций относительно той же меры также независима:
(а) /о fit
(b) Л +/2, А
22.	Припишите веса элементам пространства логических возможностей эксперимента нз примера 4 таким образом, чтобы два высказывания, рассматривавшиеся в этом примере, не были независимыми.
(Указание. Используйте идею, родственную реализованной в примере 3.)
23.	Бросаются две кости, описанные в упр. 3, и записывается сумма выпавших очков. Обозначим через f функцию исхода этого опыта; ее область изменения имеет вид {2, 3, ..., 12). Определите Р[/=а], для п = = 2, 3, ..., 12.
[Частичный отв.: Р[/=7] = 8/63, Р [/ = И] = 20/И7.]
24.	Из обычной колоды в 52 карты выбираются 13 карт червонной масти, а из этих 13 карт случайным образом выбираются две карты. Рассмотрим следующие три высказывания:
р — выбираются две «картинки»;
q — первая выбранная карта «картинка»;
г — среди выбранных карт имеется по крайней мере одна «картинка». («Картинка» — это тузы, короли, дамы и валеты.) Вычислите следующие вероятности:
(8) РДр];	[Отв.: >/в.]
(b) Р, [/>]; (с) РгЫ; (d) Рв [г].	[Отв.: (Отв.: •/„.] [Отв.: 1.]
25.	Пусть р и q— такие два высказывания, что из р следует q. Покажите, что р и q могут быть вероятностно независимыми тогда и только тогда, когда либо q логически истинно, либо р логически ложно.
26.	Обозначим через /1,/2 и /3 функции исхода эксперимента, состоящего в трехкратном бросании (правильной монеты. Вычислите вероятности каждого из следующих высказываний;
190
Гл. IV. Теория вероятностей
(а)	₽(Л=Ц) V(/»=r> 1/1 П:	[Отв.: */2.]
(Ь)	Р(/1=ц> v (Л=Г) Г/i — Г];	[Отв.: */з-]
(с)	₽(Z=r)V(/2=r)V(/s=r)[(/l-r)V(/2 = r]. [Отв.: ®/7.]
27.	Обозначим через ft и функции исхода эксперимента, состоящего в двухкратном бросании (правильной) игральной кости. Вычислите вероятности следующих высказываний:
(а) РЛ>г[Л=3];
<Ь) Р(/1¥=2) л (Л> з) 1/1 < 4Ь
W Р/1+Л.=9[/1=5];
(<1)Рл+л=9[/.=2].
§ 6*. МЕРЫ КАК ПЛОЩАДИ
Для многих целей оказывается удобным изображать меры посредством площадей. Универсальное множество И изображается в виде единичного квадрата и каждому элементу И ставится в соответствие площадь, равная весу этого элемента. Будем выбирать эти площади так, чтобы они не налегали друг на друга и, следовательно, покрывали весь квадрат. Если теперь любому множеству поставить в соответствие всю площадь, соответствующую его элементам, то эта площадь будет равна его мере.
Пример 1. Пусть U = {а, Ь, с} Припишем элементам а, b и с соответственно веса */2, */з и */б- На фиг. 80 показаны площади, соответствующие отдельным элементам, а также показана посредством штриховки площадь, соответствующая множеству {а, с). Разумеется, эта площадь равна ‘/2 + 1/б = = 2/з.
Нет необходимости начинать с изображения отдельных весов. Можно наносить на диаграмму подмножества непосредственно. Нужно только следить за тем, чтобы каждому подмножеству, представленному на диаграмме, соответствовала площадь, равная его мере.
Такая геометрическая интерпретация помогает уяснить многие теоретические соображения. В качестве примера рассмотрим вопрос о мере объединения двух множеств. Пусть т (Р) = 0,5 и m(Q) —0,3; чему равна /n(Pl)Q)? Мы ставим в соответствие Р площадь, численно равную 0,5, после чего хотим включить в нашу диаграмму Q. Множество Q имеет меру 0,3, но какая
§6*. Меры как площади
191
часть этой площади должна пересекаться с Р? Если (а) пересечения нет, то общая площадь равна 0,8, тогда как если (b) Q находится внутри Р, то общая площадь равна 0,5; наконец, если
равна 0,6. (Эти три возможности показаны на фиг. 81.) Так как в каждом случае пересечение соответствует множеству P(]Q, то у нас нет выбора: мы обязаны положить площадь пересечения, равной	Формулу
т (Ри Q) = т (P)4m (Q) — т(Рn Q)
хорошо иллюстрирует фиг. 81,6. На фиг. 81,6 показан случай, когда Р и Q не пересекаются.
Если мы имеем дело только с одним подмножеством И, скажем Р, то всегда можно изображать его посредством вертикальной полосы, т. е. прямоугольника
с высотой, равной 1. Но если еще присоединяется подмножество Q, то мы не всегда можем изобразить его посредством полной горизонтальной полосы, что можно видеть на фиг. 81.
Рассмотрим специальный случай, показанный на фиг. 82, когда такое представление возможно. Основание множества Р
Фиг. 82
равно /и(Р), а высота равна 1. Множество Q имеет основание 1
и высоту т (Q). Площадь пересечения Р Л Q равна т (Р) • т (Q). Это значит, что
tn (Р Л Q) — т (Р) • т (Q),
что соответствует тому специальному случаю, когда наши высказывания независимы.
192
Гл. IV. Теория вероятностей
Чтобы изобразить вероятности высказываний, мы должны изобразить меры их множеств истинности. Следовательно, описанный метод с равным успехом может быть применен и для изображения вероятностей. Его можно также использовать для изображения условных вероятностей: поскольку
Р, И = Р Lp Л <z]/P Id = m (Р П Q) m (Q), то условную вероятность можно представлять себе как отношение площади пересечения Р и Q к общей площади Q. Пусть на фиг. 83 т(Р) = х~\-у, m(Q) — x-\-z, m(P(\Q) — x-, тогда Р? И = х/(х+ г) и Рр fd = х/(% + у).
В качестве применения нашей геометрической интерпретации мы выведем теорему Байеса. Простейший случай этой теоремы используется для решения следующего вопроса. Предположим, что известна вероятность осуществления р и позднее мы получаем дополнительную информацию q, также находящуюся в известном отношении к осуществлению или неосуществлению р. Каким образом новая информация изменяет вероятность р? Более точно: сначала нам известны Р[р], P[d и Pp(d, и мы хотим определить Рд[р].
Пример 2. Предположим, что имеются две урны, первая из которых
содержит два черных и один белый шар, а вторая — два белых и один черный шар. Выбирается одна урна посредством некоторой процедуры случайного выбора, делающего вероятность выбора первой урны равной 3Д. Затем из выбранной урны вынимается наугад один шар. Если вынутый шар оказывается черным, то какова вероятность того, что он был вынут из первой урны?
Пусть р означает утверждение, что мы вынимаем шар из первой урны, a q — что мы вынимаем черный шар; Р[р] = 3А, PP[d = 2/з, Ppfd = */з; требуется найти Рд[р]. Эти данные представлены на фиг. 84. Мы видим, что
х14-у1 = -у> х2-^-у2 — -д , xx/(xj +У1)“'з' и х2/(х2-{-у2) = д.
_	3 2	1	111
Отсюда X} — 4*з — 2 И — 3*4	12’
Наконец,
Фиг. 83
§6*. Меры как площади
193
В этом примере мы исходили только из двух альтернатив, р и —р. Но теорема, о которой идет речь, применима к любому числу альтернатив. Рассмотрим ее для случая четырех альтернатив. Про высказывания pi, р2, рз и р^ говорят, что они образуют полную систему альтернатив, если одно и только одно из них является истинным. (См. § 8, гл. I, стр. 54.) В таком случае их множества истинности не пересекаются и объединением этих множеств истинности будет И. Пусть q означает какое-то другое высказывание. Эта ситуация представлена на фиг. 85.
В качестве исходных данных мы имеем вероятности четырех альтернатив и условную вероятность q при условии реализации каждой из альтернатив:
Р [л] — xi р[р2]=^2+У2; Р [Рз1 = *з + Уз; Р|л1=*4+У4;
Ppi I?]—+У1);
Ррг М — Х2/(Л2 + Уг)?
Рр. М=^з/(-*=3-ь у3); Рр4М = х4/(л4 + у4).
Таким образом, нам известны площади четырех вертикальных полос и для каждого случая отношение площади верхней части к площади всей полосы. Отсюда находятся площади четырех верхних частей: перемножением двух вероятностей, стоящих в каждой строке, мы получим хх — р1а!-Рр.М.^=р[а]-рйЫ и т. д. Нас интересует нахождение вероятности одной из этих четырех альтернатив, скажем р2, при условии, что имело место q. Другими словами, мы хотим знать, какую часть площади Q составляет х2. Легко проверить, что искомая вероятность дается следующей формулой:
р [ n 1 — __________Р ' Рр» _____________
9	Р |Л] • Ра 141 + Р р2] • Рра [41 + ₽ w • Pps [41 + Р М7рда •
13 Зак. 994.
194
Гл. IV. Теория вероятностей
Для других альтернатив имеют место аналогичные формулы, и они допускают очевидное обобщение на случай любого числа альтернатив. Эта система формул, выписанных для самого общего случая, и называется теоремой Байеса.
Пример 3. Предположим, что один учащийся должен был выбрать между математикой, физикой, химией и астрономией, предложенными ему в качестве основного курса. Основываясь на данных беседы с этим учащимся, лицо, консультировавшее его при поступлении, склонно было приписать выбору им каждого из этих курсов вероятности 0,4, 0,3, 0,2 и 0,1, Консультант не знал, какой курс был выбран на самом деле, но к концу семестра ему становится известным, что этот учащийся получил по выбранному им курсу высшую оценку а. Учитывая сравнительные трудности изучения этих курсов, консультант считает вероятность получения оценки а по математике равной 0,1, по физике 0,2, по химии 0,3 и по астрономии 0,9. Какую поправку может внести консультант в свою первоначальную оценку вероятностей выбора учащимся различных курсов? Используя теорему Байеса, мы получаем:
Р ...	, [Учащийся выбрал математику] =s
[Учащимся получил оценку a]	J
_____________________(0,4).(0,1)	_____________ - n 1R ~ (0,4) • (0,1) + (0,3) • (0,2) + (0,2) • (0,3) + (0,1) • (0,9) ~ 25 “*
Подобные же вычисления приводят к вероятностям 0,24, 0,24 и 0,36 для трех других курсов. Таким образом, новая информация о получении студентом оценки а мало повлияла на вероятность выбора им физики или химии, но сделала гораздо менее вероятным выбор математики и гораздо более вероятным выбор астрономии.
Важно заметить, что знание условных вероятностей q по отношению к альтернативам pi, р2, ... еще не достаточно. Пока мы не знаем еще и вероятностей исходных альтернатив, мы не можем применять теорему Байеса. Однако иногда бывает разумно допустить, что все альтернативы являются равновероятными. Тогда множители P[pi]....Р[р4] в нашей основной фор-
муле сокращаются, и мы получаем частный случай теоремы Байеса:
Если Р [pi] — Р [р2] = Р [Рз1 ~ Р [Ab mo
pJa] =
рР,м___________
₽Pil41+ PpaM + Pps[4J + Pp<M •
§6*. Меры как площади
195
Пример 4. В одном эксперименте группе лиц вручается четыре конверта, в каждом из которых заключено условие одной задачи. Группе предлагается вскрыть один конверт и постараться решить помещенную в нем задачу в течение 10 минут. На основе предыдущего опыта экспериментатор знает, что вероятность решения за 10 минут самой трудной задачи равна 0,1, а для других задач эти вероятности равны 0,3, 0,5 и 0,8. Допустим, что данная группа справилась с задачей в течение положенного времени. Какова вероятность того, что был вскрыт конверт с самой трудной задачей? Так как экспериментируемые не имели никакой возможности узнать, какая задача находится в том или ином конверте, то они выбирали конверт наугад, и потому мы приписываем выбору различных задач одинаковые вероятности. Следовательно, можно воспользоваться предыдущей простой формулой. Вероятность того, что была выбрана самая трудная задача, равна
0,1	_ 1
0,1+0,3 + 0,54-0,8 — 17 ’
Пример 5. Допустим, что мы сдаем вступительный экзамен и можем выбирать любого из трех экзаменаторов; при этом вероятность сдать экзамен равна для нас 0,1. Пусть один приятель сообщил нам, что один из этих экзаменаторов очень добр и вероятность сдать ему экзамен равна 0,4. Мы выбираем наугад одного из экзаменаторов и экзаменуемся. Какое влияние окажет наш результат на интересующую следующего отвечающего вероятность того, что мы выбрали доброго экзаменатора? Если мы сдадим экзамен, то вероятность того, что мы выбрали доброго экзаменатора, можно приравнять
0,4	2.
0,4 + 0,1+0,1 — 3 ’
если же мы не сдадим экзамен, то эту вероятность следует 0,6	1
считать равной 0>6 + 0)9 + 09
1
Так как первоначальная вероятность была равна у, то мы видим, что сдача экзамена доставляет гораздо больше информации, чем провал. И это естественно, потому что при нашей подготовке провал является весьма вероятным даже в случае доброго экзаменатора,
13*
196
Гл. IV. Теория вероятностей
Упражнения
з.
4.
5.
1.	Изобразите Р и Q в виде площадей внутри квадрата, если:
(a)	wi(P) = m (Q) = 0,5, т(РП<2) = 0,3;
(b)	m (Р) = 0,5, m (Q) = 0,4, tn (P|J Q) = 0,8;
(c)	m (P) = 0,6, m (Q) = 0,4, P и Q не пересекаются.
2.	Пользуясь следующими данными о высказываниях р и 9, изобразите их множества истинности Р и Q в виде площадей:
(а)	Р [р] = Р [9] = 0,4, Р [рЛ9] = 0,2;
(b)	Р [р] = Р [9] = 0,5, Р [р V9] = 0,75;
(с)	Р [р] = Р [9] = Р [рЛ9] = 0,3;
(d)	Р [pj == Р [9] = 0,4, Рр [9] = 0,5.
В мае вероятность дождливого дня равна 0,2. Для команды Янки вероятность выиграть в ясный день равна 0,7, но зато в дождливый день эта вероятность равна лишь 0,4. Если нам известно, что в мае они выиграли некоторую игру, то какова вероятность того, что в тот день шел дождь? [Отв.: 0,125.] Проиллюстрируйте геометрически множества истинности различных высказываний из предшествующего упражнения.
Тест многократного выбора ’) предоставляет для ответа на каждый вопрос четыре возможности. Таким образом, если студент знает правильный ответ, то для него вероятность правильного ответа равна 1; если же он идет по пути угадывания, то вероятность правильного ответа равна 0,25. Предположим, далее, что хороший студент знает 90% ответов, а плохой студент только 50%. Если хороший студент ответил правильно, то какова вероятность того, что он просто угадывал? Решите тот же . 1 . J_ 1 : 37 ’ 5 ’J
вопрос для плохого студента.
6. Некогда были предложены одновременно три экономические теории, которые на основании имевшихся данных представлялись равновероятными. В течение последующего года состояние экономики находилось под наблюдением, и оказалось, что вероятность того развития, какое она получила на самом деле, в соответствии с первой теорией была равна 0,6, а в соответствии с двумя другими — 0,4 и 0,2. Каким образом это изменяет вероятности правильности трех теорий?
Пусть pi, рг, рз и pt образуют полную систему равновероятных альтернатив. Пусть Ppi [9] = а, РЛ [9] = b, Pps [9] = с, Рр< [9] = d. Покажите, что если a-f-t> + c + rf=l, то при осуществлении q пересмотренные вероятности этих альтернатив равны соответственно а, Ь, с и d.
В покере Смит имеет очень сильные карты и делает большую ставку. Вероятность, что его Противник Джонс имеет более сильные карты, равна 0,5. С более сильными картами Джонс повысил бы ставку с вероятностью 0,9, но с худшими картами — только с вероятностью 0,2. Предположим, что Джонс повышает ставку. Какова новая вероятность того, что ои имеет более сильные карты, чем Смит?
Крыса может выбирать наугад один из пяти лабиринтов. Известно, что вероятности ее выхода из различных лабиринтов за три минуты равны
7.
8.
9.
9
47 ’
') См. подстрочное примечание иа стр. 119*
§ 7. Конечные стохастические процессы
197
0,6, 0,3, 0,2, 0,1, 0,1. Пусть оказалось, что крыса вырвалась из лабиринта через три минуты. Какова вероятность того, что она выбрала первый
лабиринт? Второй лабиринт?
[о™.: A,
§ 7. КОНЕЧНЫЕ СТОХАСТИЧЕСКИЕ ПРОЦЕССЫ. ДЕРЕВЬЯ, ВЕСА ПУТЕЙ И ВЕСА ВЕТВЕЙ
В § 5 гл. I мы рассмотрели способы описания такой последовательности опытов, где возможные исходы каждого эксперимента зависят от исходов предыдущих экспериментов. Пространство логических возможностей, относящееся ко всему множеству экспериментов, мы изображали в виде дерева (см. § 6 гл. I), причем каждой отдельной логической возможности соответствовал свой путь на этом дереве. Для каждого из экспериментов мы определили функции исхода и выяснили, что эти функции описывают пространство логических возможно..тей. Сейчас мы сначала более подробно исследуем возникающие на этом пути деревья, а затем покажем, как, используя информацию о функциях исхода, построить вероятностную меру на множестве всевозможных путей соответствующего дерева логических возможностей.
Рассмотрим дерево логических возможностей для последовательности опытов. Каждой конкретной последовательности возможных исходов этих опытов соответствует определенный путь на дереве. Отрезки, составляющие каждый путь, называются ветвями. Дерево начинается из начальной точки, и ветви, выходящие из этой точки, образуют первый ряд дерева. Конец каждой из ветвей отвечает одному из возможных исходов первого эксперимент а Из каждого из этих концов ответвляется новое множество ветвей, концы которых в свою очередь отвечают возможным исходам второго опыта. Эти ветви образуют второй ряд дерева. Таким образом, мы продолжаем строить дерево ряд за рядом до тех пор, пока не будут исчерпаны все эксперименты в рассматриваемой последовательности. Точки, в которых берут начало некоторые ветви, называются точками ветвления. Каждая точка ветвления, в ’-ом ряду дерева соответствует единственной последовательности исходов первых / опытов.
Предположим теперь, что исход каждого отдельного эксперимента зависит от некоторых неконтролируемых факторов, несет элемент 'лучайности. Всякая такая последовательность экспериментов называется стохастическим процессом1). (Греческое слово «стохос» означает «догадка»). Мы будем предполагать, что имеется конечное число экспериментов и что каждый экспе-
’) В русской литературе употребляются также термины «случайный процесс», «вероятностный процесс»,
198
Гл. IV. Теория вероятностей
римент имеет конечное число возможных исходов. Мы предполагаем также, что если известны исходы всех экспериментов, предшествовавших данному,' то для этого последнего эксперимента определятся как возможные исходы, так и вероятности осуществления каждого из этих исходов.
Нашей целью является прогнозирование хода всего процесса в целом. Например, в случае многократного бросания обычной монеты мы исходим из предположений о том, что каждый отдельный эксперимент может иметь два исхода и что вероятность каждого из этих исходов (независимо от исходов всех остальных экспериментов!) равна ‘А; нас интересуют вероятности истинности высказываний следующего типа: «Более чем две трети всех бросаний приводит к выпадению герба» или «Число выпадений герба и цифры одно и то же» и т. д. На подобные вопросы можно ответить только тогда, когда всему процессу в целом приписана некоторая вероятностная мера.
Формализуя те построения, которые играют основную роль в теории стохастических процессов, введем следующее
Определение. Пусть # есть множество всех путей на некотором дереве. Тогда весовая функция (вероятностная мера), определенная на множестве И, называется весовой функцией путей для этого дерева.
Веса ветвей дерева задаются так, что сумма весов всех ветвей, выходящих из любой точки ветвления, равна 1.
В любом дереве ветви, выходящие из точки ветвления в /-ом ряду, описывают возможные исходы /-ого опыта при условии, что исходы первых / — 1 экспериментов уже известны. Веса, которые приписываются этим ветвям, подсказываются рассмотрением опыта, реализующегося после того, как достигнута эта точка ветвления. В случае с бросанием монеты возможные исходы /-опыта, а также их вероятности (веса) не зависят от предшествующих результатов. Однако мы не будем вводить ограничений такого рода, потому что в общем случае они не имеют места.
Пример 1. Вернемся к примеру 1 из § 5 гл. I. У нас имеются две урны; в первой из них лежат два черных и один белый шар, а во второй — два белых и один черный. Наугад выбирается одна из урн и из нее последовательно (без возвращения) вынимаются два шара. Соответствующее дерево изображено на фиг. 86. На этом дереве есть 6 различных путей, которые мы обозначили через хь х2, ... ..., Хб. Итак, на первом этапе эксперимента случайным образом выбирается одна из двух урн. Поэтому каждому из двух возможных исходов первого эксперимента мы приписываем вес (вероятность) */г (см. фиг. 86). Если была выбрана первая урна, го, поскольку она заключает два чер
§ 7. Конечные стохастические процессы
199
ных и один белый шар, то вероятность выбрать черный шар будет равна 2/з, а вероятность вынуть белый шар всего '/з-Если была выбрана вторая урна, то вероятность выбрать черный шар будет равна '/з, а вероятность вынуть белый шар — 2/3. На третьем этапе, если была выбрана 1-я урна и первый шар оказался черным, то вероятности выбрать белый или черный шар будут равны между собой, т. е. равны V2; однако если в первый раз вынут белый шар, то вероятность вынуть черный шар становится равной 1. Аналогичным же образом вычисляются вероятности от остальных ветвей, обозначенные на фиг. 86.
Ф и г. 86
Для дальнейшего будет важно ввести рациональную систему обозначений для весов ветвей. Пусть abc ...st одна из возможных последовательностей исходов первых / экспериментов. Вес исхода t j-го опыта при условии, что исходы первых / — 1 опытов описываются последовательностью abc ... s, мы обозначим через
Рabc ... s, t'
Вес исхода первого опыта естественно обозначить через ра- Например, в примере 1 р1 = ,/г> А, ч==2/3 и А,чч=’/2-
Теперь мы хотим рассмотреть высказывания, связанные со всей последовательностью экспериментов. Для того чтобы определить вероятности этих высказываний, нам нужно построить вероятностную меру на множестве путей данного дерева. Мы будем исходить при этом из весов отдельных ветвей и выберем меру так, чтобы эти веса были равны соответствующим условным вероятностям-
Рассмотрим последовательность из трех экспериментов. Обозначим через х произвольный путь на соответствующем дереве логических возможностей. Нам известно, что функции исхода описывают пространство логических возможностей таким
200
Гл. /V. Теория вероятностей
образом, что х есть единственный элемент, содержащийся во множестве истинности высказывания типа
(Л (*) = «) Л (Л (*) = Ь) Л (Л (х) = с).
Поэтому вес w (х) элемента х равен
P[(/i = a)/ (Л = *)Л(Л = с)].
Но эту последнюю вероятность можно переписать в следующем виде:
Р [/1 = «I • Р/,-a [fl — Ь\  Р(/2=Ь) К (/] =«) |/з = d
(см. упр. 19 из § 5). Из самого определения весов ветвей ясно, что нам следует положить
Р[/1 = а]=рй, Р/j = « [/2 = N = Ра, Ь> Р( /] = «) Л (/2=Ь) [/з = С1 ~ РаЬ, с-
Если мы хотим обеспечить справедливость всех этих равенств, то мы должны положить
™^Г=РаРа,ьРаЬ,с-
Другими словами, каждому пути мы должны приписать вес, равный произведению весов, приписанных ветвям, составляющим этот путь.
Можно доказать, что если веса путей и веса ветвей связаны таким образом, то веса ветвей всегда оказываются равными соответствующим условным вероятностям.
Пример 1 (продолжение). Если веса ветвей выбраны так, как это было указано в примере 1, то произведение весов ветвей, составляющих каждый из путей дерева, оказывается равным 7б (см. фиг. 87).
z w(x)
ft(x)	f2(x)	fs(x)
I 4	4
1-	Ч	Б
1	Б	4
г	v	в
г	б	ч
а	Б	Б
§ 7. Конечные стохастические процессы
201
Всего на дереве имеется 6 путей; следовательно, мы действительно построили вероятностную меру. Вычислим теперь для проверки условные вероятности вдоль пути Xj:
Pi = Р l/i = 1 ] = w (Xi) + w (х2) + w (х3) = »/2;
п _____ р	\ f  Ц]  Р К/г — 4)A(/i = 1)]  
Р1,Ч~ Г/2 = 1И2—	Р[/1 = 1]
—	(х1) + (х2)_ _ 2. .
w (х,) ч- V) (х2) + w (х3) /з ’
Р1,ч ч = Р(/, -1)Л (Г2=Ч)[/3 = Ч] =
_ Р К/з = Ч)Л(/2 = Ч)Л(/, = 1)] _ Р[(Л = Ч)А(/1 = 1)]
_ M*i) _ 1 о» (xj + w (х2)	2 ‘
Вычисляя подобным же образом веса других ветвей, мы убедимся в том, что они совпадают с весами, приписанными ветвям в начале примера 1.
Повторим еще раз нашу конструкцию на более абстрактном примере. Пусть у нас имеется последовательность трех экспериментов, возможные исходы которых указаны на фиг. 88. Совокупность всех исходов, возможных в каком-либо из этих экспериментов, дается множеством {a, b, с, d, е, /}. Если исход первого эксперимента есть Ь, то возможными исходами второго эксперимента являются а, е и (Z; аналогично, если исход первого эксперимента есть Ь, а второго эксперимента — а, то для третьего эксперимента окажутся возможны лишь исходы с и f. Вероятности того, что исход первого эксперимента будет а или b мы в соответствии с принятыми соглашениями обозначим через ра и ръ', аналогично обозначаются и другие вероятности. Мы считаем, что нам известны все эти числа. То обстоятельство, что они представляют собой вероятности исходов, означает, что все они положительны И ЧТО Ра + Рь = 1, ръ, а + Рь, е + Рь, d — 1. Pbd, а + Pbd, с = 1 и т. д., т. е. что сумма чисел, соответствующих ветвям, исходящим из какой-либо точки ветвления, равна 1. Пути, который соответствует исходу b в первом эксперименте, исходу d во втором и исходу с в третьем, мы приписываем вес Рь • Pbd • Ръл, с — это есть произведение вероятностей ассоциированных с каждой ветвью, идущей вдоль рассматриваемого пути. Таким способом мы определим вероятность каждого пути на дереве.
Нетрудно показать, что этот метод всегда определяет вероятностную меру, т. е. что веса всех путей положительны и сумма их равна 1. Они положительны, потому что представляют собой
202
Гл. IV. Теория вероятностей
произведение положительных чисел. Чтобы показать, что сумма их равна 1, найдем сначала сумму весов всех путей, соответствующих определенному исходу первого эксперимента — скажем Ь, и определенному исходу второго эксперимента — скажем d. Мы имеем
Pb ' Pb, d ' Рbd, а~^~Pb ' Pb. d ' Pbd, с	Рb' Pb, d\Pbd, a I Pbd, cl Pb'Pb,d-
Для каждой пары двух первых исходов результат будет аналогичным. Например, сумма весов путей, соответствующих
Ф и г. 88
которые соответствуют исходу b в
исходу а первого эксперимента и исходу с второго эксперимента, равна Ра’Ро'С- Несколько забегая вперед, заметим следующее: величина ра-ра, с есть вероятность того, что исходами первого и второго экспериментов будут соответственно а и с. Но этот факт можно считать доказанным лишь после того, как будет показано, что мы имеем дело с вероятностной мерой.
Далее мы находим сумму весов, приписанных тем путям, первом эксперименте. Для этого
нужно сложить суммы, соответствующие всевозможным исходам второго эксперимента. Но в силу предыдущего вычисления иско-
мая сумма весов равна
Pb ' Pb,a^~Pb  Pb,e~^~Pb ‘ Pb,d — Pb\Pb, а + Pb, еН~ Pb, d\~ Pb-
Подобным же образом сумма весов, приписанных тем путям, которые соответствуют исходу а в первом эксперименте, равна ра. Следовательно, сумма всех весов равна Ра~\~Рь — 1 Итак, мы действительно имеем вероятностную меру. Заметим, что мы доказали также совпадение вероятности, приписанной исходу а в первом эксперименте, с вероятностью ра-
Поскольку составному высказыванию
[(Л (х) = Ь) л (Л (х) = d) Д (/з (х) = с)]
была приписана вероятность Рь' Рь,а' Pbd,c> высказыванию КЛ (х) — Ь) Л (/2 (х) = d\, как мы уже отмечали, приписана веро
§ 7. Конечные Стохастические процессы
203
ятность рв • pb,d, и высказыванию [/,(%) = Ь\ вероятность рь, то
г»	I х , .	1	d Pbd, с
”(/2 (х)=d) л (/, (х)=г>) I/з W — С] —	— Pbd, с>
*D ^bi d
Р/.	I/2 (X) = d\ =	=PD. d
*D
и T. Д.
Таким образом, мы видим, что наши вероятности, заданные заранее в предположении, что известны предыдущие результаты, становятся условными вероятностями при их вычислении с помощью весовой функции путей дерева.
Пример 2. Пусть имеются две урны. Урна 1 содержит два черных и три белых шара. Урна 2 содержит два черных и один белый шар. Выбирается наугад одна урна и из нее выбирается наугад один шар. Какова вероятность того, что будет выбран белый шар?
На первый взгляд может показаться, что поскольку число белых и черных шаров одинаково и все делается случайно, то вероятность выбора белого шара равна ’/г. Этот и аналогичные ему необдуманные ответы указывают на необходимость более тщательного анализа.
Мы рассматриваем два эксперимента, первый из которых состоит в выборе урны, а второй — в выборе шара. Первый эксперимент может иметь два исхода, причем мы приписываем выбору первой и второй урн одинаковые вероятности Pi — Pi — х!г- Если на первом этапе выбрана урна 1, мы приписываем выбору белого шара вероятность р1Ъ — -^', подобным же образом задаются вероятности
_ 5,	1 .	_ 2
”1, Ч 2 ’	^2, Б- 3 ’ Pi, Ч-- 3 •
Эти вероятности указаны на дереве, изображенном на фиг. 89. Вероятность того, что будет вынут белый шар, находится как сумма весов всех п^тей, ведущих к исходу Б второго эксперимента; она равна-j^-4--^- — -^-.
Пример 3. Некто вышел из бара и не может вспомнить, какая улица ведет к его дому. Он знает, что бар, который расположен на перекрестке четырех улиц, отстоит от его дома на один квартал, и пробует поочередно идти наугад по каждой из четырех выходящих к бару улиц, возвращаясь обратно после неудачи и не выбирая одну и ту же улицу
204
Гл. IV. Теория вероятностей
вероятность, вычисленная
дважды. Какие имеются возможности для его поисков дома и какова вероятность каждого из возможных путей?
Обозначим вых’одящие к бару улицы через А, В, С и Дом. Исходы экспериментов и их вероятности (веса ветвей дерева) указаны на фиг. 90. Вероятность каждого отдельного пути находится по-w(x) средством перемножения ве-роятностей составляющих его ветвей.
Предположим теперь, что t мы построили дерево и вероятно ностную меру на нем для последовательности из m экспериментов. Иногда нас интересуют высказывания, значения истин-ности которых зависят от исходов п первых экспериментов, где п < m Исследовать ,fi такие высказывания можно по более простому дереву, состоящему из первых п рядов m-ярусного дерева. Любая по этому дереву, оказывается равной соответствующей вероятности, вычисленной по полному /н-ярусному дереву.
Например, рассмотрим в примере 1 высказывание р: «Первый вынутый шар черный». Множеством истинности этого вы
7. Конечные стохастические процессы
205
сказывания, как видно из фиг. 86, является множество Р = {xi, х2, х4}. Отсюда следует, что Р[р] = m (Р) — */2. Однако это высказывание имеет отношение только к первым двум
этапам эксперимента, и, следовательно, для него можно построить и более простое дерево (см. фиг. 91). Рассматривая наше высказывание уже на этом дереве, мы видим, что мно
жество истинности высказывания р состоит всего из двух элементов {*1, х3}. Мера этого множества равна */г и, следовательно, как и раньше, Р[р] = 1/2.
В рассмотренных выше примерах мы начали с весов
ветвей и определили отсюда веса путей. Иногда, однако, мы можем непосредственно определить веса путей. Отсюда нетрудно единственным образом построить множество весов ветвей так, чтобы это не противоречило известным значениям весов различных путей.
Пример 4. Рассмотрим с новых позиций пример 3 из § 6. Первокурсник выбирает для изучения одну из четырех дисциплин: ма-
Ф и г. 91
тематику, физику, химию или астрономию. Основываясь на своем знании наклонностей студента, его советчики оценивают вероятности выбора каждой из этих дисциплин величинами 0,4, 0,3, 0,2, 0,1. Кроме того, исходя из трудности каждого курса, вероятность получения студентом высшей оценки а по математике оценивается величиной 0,1, по физике — 0,2, по химии — 0,3 и по астрономии — 0,9. В результате можно построить дерево и приписать веса ветвям и путям так, как это сделано на фиг. 92, где буквами М, Ф, X и А обозначен выбор математики, физики, химии или астрономии.
Предположим теперь, что советчик пытается оценить вероятность получения студентом высшей оценки а или любой другой отметки (~а), не зная еще, какой курс выбран студентом. Это равносильно исследованию логических возможностей в обратном порядке, когда сначала
рассматривается полученная отметка, а уже затем — выбранный курс.
Новое дерево логических возможностей построено на фиг. 93. Каждый путь на этом дереве по-прежнему определяет и отметку, и выбранный курс. Возможные исходы обоих
206
Гл. IV. Теория вероятностей
экспериментов здесь обозначены так же, как и на фиг. 92. Вес пути Xi должен, естественно, равняться вероятности
того, что студент получит оценку а и выберет математику.
Но отсюда следует, что этот вес равен весу пути Х] и на дереве фиг. 92. Таким образом, одинаковые пути на этих двух деревьях получают и одинаковые веса.
Таким образом, мы построили дерево логических возможностей и определили весовые функции путей; нам нужно еще определить веса отдельных ветвей. Например, определим веса ветвей, составляющих путь хь т. е. ра и ра,м- Нам известно, что ра = Р [/1 = а] и что множество истинности выска-
зывания/^*) = а имеет вид {xi, х3, х5, х7}. Мера этого множества равна 0,04 + 0,06 + 0,06 + 0,09 = 0,25, так что ра = 0,25.
Фиг. 93
Мы знаем также, что рара, м = 0,04 и, следовательно, Ра,м~0,16. Точно таким же способом определяются и веса других ветвей.
§ 7. Конечные стохастические процессы
2(П
На этом примере видно, как информация о полученной студентом оценке влияет на результат предсказания выбранного им курса. Не принимая во внимание эту информацию, мы полагали, что студент выберет математику с вероятностью 0,4. Однако известие о том, что студент получил по выбранной дисциплине оценку а, заставляет нас понизить эту вероятность до 0,16; наоборот, узнав, что ему не удалось получить высшего балла, мы повышаем вероятность выбора математики до 0,48 (ср. выше, стр. 194).
Упражнения
1.	В группе А имеется 30% студентов, получающих только внешне оценки, 40% успевающих студентов (получающих высшие оценки не по всем предметам) и 30% неуспевающих; в группе В соответственно 40%, 50% и 10%. Выбирается наугад одна из этих двух групп и в этой группе последовательно выбираются наугад два студента. Постройте меру путей дерева и найдите вероятности того, что эти два студента успевают, но получают внешне оценки не по всем предметам. Найдите вероятность того, что второй из этих студентов не успевает. [Отв.: 0,205; 0,2.]
2.	Бросается монета. Если выпадет герб, то бросаю" кость, если же выпадет цифра, то бросают монету второй раз. Постройте меру путей дерева для этой последовательности двух экспериментов. Найдите вероятность того, что будет брошена кость и что на ней выпадет шесть очков.
3.	Для того чтобы выиграть некоторое соревнование, нужно выиграть подряд две игры из трех игр, играющихся поочередно с двумя противниками А и В. А играет сильнее, чем В: вероятность выигрыша у В равна 2/з, а у А—всего лишь Ч3. Постройте на дереве логических возможностей вероятностную меру в предположении, что первой состоится встреча с А. Постройте другую меру для случая, когда первой состоится встреча с В. В каждом из этих случаев определите вероятность выигрыша двух последовательных партий. Что выгоднее: два раза встречаться с более сильным или с более слабым противником?
[Отв.: 10/27, в/гт; лучше играть дважды с более сильным противником]
4.	Постройте вероятностную меру для дерева, описывающего четырехкратное бросание обычной монеты, Прн этом следует предположить, что вероятность выпадения герба при любом бросании равна */2 независимо от исходов других бросаний.
5.	Студент утверждает, что он умеет отличать пиво от эля. Его подвергают трем испытаниям. При каждом испытании ему дают две кружки с пивом и одну с элем и просят указать эль. Если он дает два или более правильных ответа, его утверждение считается доказанным. Нарисуйте дерево возможных исходов для описанного эксперимента (на каждой стадии студент может указать эль либо правильно, либо неправильно). Постройте меру путей на этом дереве, отвечающую случаю простого угадывания. Найдите вероятность того, что утверждение студента будет сочтено доказанным, если при каждом испытании он действует методом простого угадывания.	[Отв.: 7/27.]
6.	Внутри ящика находятся три неисправные электрические лампочки и семь исправных. Вынимаются одна за другой наугад три лампочки (после того, как лампочка вынута, ее уже не возвращают в ящик). Постройте дерево возможных исходов, меру путей на нем и найдите вероятность того, что будет вынута по меньшей мере одна исправная лампочка. Най-
208
Гл. IV. Теория вероятностей
Дите вероятность того, что окажутся исправными все три лампочки, если первая лампочка была исправна.	[Отв.: j^o”’ "12”']
7.	Вычислите вероятность того, что лицо, о котором шла речь в примере 3, найдет свой дом в результате самое большее двух попыток.
8.	Шахматист играет подряд три партии Психологическая особенность его такова,^ что он выигрывает каждую данную партию с вероятностью > где k — число предыдущих выигранных им партий. (Так вероятность выигрыша первой партии равна для него '/г, вероятность того, что он выиграет вторую партию, если он уже выиграл первую, равна ’Л, и т. д.) Какова вероятность того, что из этих трех партий он выиграет по меньшей мере две?
9—13. Решите упр. 3, 5, 6, 8, 9 из § 6, используя построение дерева, отвечающего содержанию соответствующих упражнений.
14.	Имеются две урны А и В. Урна А содержит один черный и один красный шар. Урна В содержит два черных н три красных шара. Вынимается наугад один шар из урны А и этот шар кладется в урну В. Затем вынимается наугад один шар из урны В.
(а)	Какова вероятность того, что вынутые шары будут одного цвета?
[Отв.: 7/12.]
(Ь)	Какова вероятность того, что шар, вынутый первым, был красным при условии, что шар, вынутый вторым, был черным?
[Отв.: 2/6.]
15. Предположим, что в матчах на первенство США по бейсболу вероятность выигрыша каждой встречи каждой командой равна V2 независимо от исходов остальных игр. Постройте меру для соответствующего дерева логических возможностей. (См. дерево из § 6 гл I.) Определите вероятности того, что встреча кончится после 4 игр, после 5, после 6 или после 7 игр.
16. Предположим, что в первенстве США по бейсболу одна команда сильнее другой и в каждой игре вероятность ее выигрыша равна 2/з. Введите меру для путей дерева логических возможностей и найдите следуюшие ве-
роятности:
(а)	Вероятность того, что более сильная команда победит после 4 игр, после 5 игр, после 6 игр нли после 7 игр.
(Ь)	Вероятность того, что более слабая команда победит после 4 игр. после 5 игр, после 6 игр или после 7 игр.
(с)	Вероятность того, что серия нгр окончится после 4, 5, 6 или 7 игр.
[Отв.: О, 21; 0,30; 0,27; 0,22.]
(d)	Вероятность того, что более сильная команда победит. [Отв.: 0,83.] 17. Из множества целых чисел = {1, 2, 3,4, 5} наугад выбирается число.
Если выбрано число п, то второе число выбирается наугад уже из множества и\ = {1, 2...и).
Постройте для этих двух опытов дерево и определите на нем вероятностную меру. Обозначим через f\ и /2 две функции исхода и через /1 +/2 их сумму. Определите
(а)	Р [/, = а],	а= 1,	2,	3,	4,	5;
(b)	Р [/2 = я],	а = 1,	2,	3,	4,	5;
(с)	Р [/, +/2 = а],	а = 1,	2,	3,	4,	5,	6, 7, 8, 9, 10.
18. Численность бактерий растет следующим образом: в каждом поколении каждая бактерия производит с вероятностью */« ии одной, с вероятностью ,/2 — одну и с вероятностью '/< — две новых бактерии и затем гибнет При этом плодовитость каждой бактерии совершенно не влияет на
§8. Три типа стохастических процессов
209
плодовитость остальных. Предположив, что для начала у нас имеется всего одна бактерия, постройте дерево логических возможностей и меру на нем для двух поколений бактерий. В качестве исхода мы будем рассматривать число вновь созданных в каждом поколении бактерий. Обозначив через fi и /2 функции исхода, определите следующие вероятности:
(а)	Р [/, > 0];	[Отпел %]
(b)	Р f/2 > 0];	[Отпел 3’/в4.]
(О Рл=1 [/. = 1].	[Отпел. </5.]
Определите вероятность того, что в третьем поколении не будет ни одной живой бактерии.	г ?О91	т
[Ow.: -^«0.483.]
19. Пусть Л = 1> а Л и Л— функции исхода опытов из упр. 18. (Л описывает первоначальную численность бактерий.) Пусть Wt =fo +Л и — =Л 4" Л +Л- Какой реальный смысл имеют функции w1 и ? Определите область изменения каждой из этих функций и вероятности того, что каждая из этих функций примет каждое из возможных для нее значений.
§ 8. ТРИ ТИПА СТОХАСТИЧЕСКИХ ПРОЦЕССОВ
В предыдущем параграфе мы изложили способ определения вероятностной меры для любой последовательности случайных экспериментов, каждый из которых имеет конечное число возможных исходов. Хотя этот способ дает основу для общего изучения стохастических процессов, он является слишком общим, чтобы его можно было изучить во всех деталях. По этой причине в теории вероятностей делают упрощающие предположения, которые облегчают рассмотрение вероятностной меры. При этом естественно потребовать, чтобы такие предположения выполнялись для достаточно широкого класса экспериментов, которые могут встретиться на практике.
Мы знаем, что конечный стохастический процесс полностью описывается деревом логических возможностей и заданием весов всех его ветвей (или весов путей), как это было описано в предыдущем параграфе. Выделять отдельные типы стохастических процессов можно, накладывая определенные требования на функции исхода этого процесса. Здесь мы дадим определение и приведем примеры стохастических процессов трех важных типов: процессов с независимыми значениями, процессов независимых испытаний и марковских цепей.
Определение. Конечный стохастический процесс с функциями исхода f\, fn, • • • называется процессом с независимыми значениями, если для любого п и произвольных исходов t, s, г,..., а имеет место равенство
P(4-i=4* (4-2=0 л - (Л=а)	= р 1Л = Л-
14 Зак. 994,
210
Гл. IV. Теория вероятностей
Другими словами, для процесса с независимыми значениями вероятность любого исхода n-го опыта (выбранного из множества возможных исходов) не зависит от исходов предшествующих экспериментов.
a ’wix)
Фиг. 94
Для того чтобы выяснить, является ли данный стохастический процесс процессом с независимыми значениями или нет, полезно исследовать пучок ветвей, выходящих из каждой точки ветвления. Так на фиг. 94, б изображены пучки, исходящие из точек ветвления Начало, Г и Ц для дерева, приведенного на фиг. 94, а. Два пучка называются эквивалентными, если они состоят из ветвей, отвечающих одним и тем же исходам, причем в обоих пучках одинаковым исходам отвечают одинаковые вероятности. Процессы с независимыми значениями характеризуются тем, что в каждом ряду дерева все пучки ветвей эквивалентны между собой.
Важное свойство процессов с независимыми значениями заключается в следующем. Рассмотрим процесс с тремя функциями исхода. При этом
Р[(Г1 = Я)Л(/2 = *)Л(/з=^)] =
= Р 1/1 = а1 • РЛ=« If2 = b\  Р(/1=а)Л(Г2=6)[/з = с]. Если наш процесс является процессом с независимыми значениями, то, очевидно,
$i 8. Три типа стохастических процессов
211
р 1(Л = а) Л (Л •=*) Л (Л = £)] = РIZ = а] • Р1/2 = • Р 1/з=4
Это означает, что функции исхода /Р /2 и f3 процесса с независимыми значениями вероятностно независимы (относительно вероятностной меры путей дерева его логических возможностей). И вообще, любое подмножество множества функций исхода процесса с независимыми значениями должно быть независимым (относительно вероятностной меры, определенной для дерева логических возможностей, отвечающего этому процессу).
Пример 1. В качестве примера стохастического процесса с независимыми значениями рассмотрим последовательность из подбрасывания монеты и бросания игральной кости, где в опыте, состоящем в бросании игральной кости, нас интересует лишь, выпали ли 6 очков или не 6 очков. Дерево и соответствующая ему вероятностная мера изображены на фиг. 94, а (Здесь ~6 обозначает, что выпало меньше 6 очков.)
Важным частным случаем процессов с независимыми значениями является процесс независимых испытаний.
Определение. Конечный стохастический процесс называется процессом независимых испытаний, если этот процесс является процессом с независимыми значениями и если
Р[/п = а] = Р[Л = 4
для любых п и m и а.
Из самого определения процесса независимых испытаний ясно, что для дерева этого процесса все пучки ветвей должны быть эквивалентны, в то время как для процесса с независимыми значениями требуется лишь эквивалентность пучков, принадлежащих одному и тому же ряду дерева.
Пример 2. Выберем в качестве эксперимента операцию подбрасывания «неправильной» монеты, для которой вероятность выпадения герба при каждом бросании равна 2/з. Для любого числа бросаний мы можем построить дерево и соответствующую ему вероятностную меру; случаю п = 3 соответствует фиг. 95. Все три функции исхода процесса имеют одинаковую область изменения R = {ГЦ} и для каждой из трех функций исхода Р |/7 = Г] = 2/3; Р [Д = Ц] = ’/3-Для процессов с независимыми значениями веса всех ветвей одного ряда одинаковы, т. е. не зависят от исходов предыдущих опытов. Теперь мы рассмотрим процесс, для которого веса всех ветвей одного ряда зависят лишь от исхода предшествующего опыта. Такой процесс называется марковской цепью.
14*
212
Гл. IV. Теория вероятностей
Определение. Конечный стохастический процесс с функциями исхода Л, fi, ..fn называется марковской цепью, если его исходное состояние j0 фиксировано,
Р(Л»-|=0а(Г„_2=0л - л(71=л)[/я = <| = Р/л_1=5[/л = П и
1Л='1=Р/„_,..1Л=Л
для всех	и любой последовательности исходов,
а, .... s,t.
X w(cc)
X, 8/27
хг 4/27
Х3 4/27
Х4 2/27
XS
Х6 2/27
Xj 2/27
Xs //27
Фиг. 95
Другими словами, исход данного опыта зависит только от исхода предшествующего опыта, и, более того, характер этой зависимости одинаков для всех этапов последовательности опытов.
Если две точки ветвления дерева марковского процесса характеризуются одинаковыми исходами, то независимо от того, принадлежат эти точки одному или разным рядам дерева, выходящие из этих точек пучки ветвей должны быть эквивалентны. В соответствии с этими особыми свойствами марковских цепей мы дадим теперь этим процессам новое определение, эквивалентное предыдущему.
Определение. Пусть {Sp s2, • • - , srj есть множество возможных состояний некоторой системы; система характеризуется одним и только одним из этих состояний в каждый момент времени. С течением времени она переходит последовательно из одного состояния в другое. Каждый такой переход называется шагом процесса. Вероятность того, что система переходит из состояния sf в состояние Sj, зависит только от состояния sz, из которого она исходит в процессе рассматриваемого перехода.
§8. Три типа стохастических процессов
213
Марковская цепь характеризуется тем, что вероятности перехода Рц, задающие вероятность перехода системы из состояния s, в состояние Sj, определяются для всех упорядоченных пар состояний. Кроме того, должно быть задано исходное состояние, в котором, по предположению, находится наша система в начальный момент времени.
На основании этих данных можно построить для любого (конечного) числа шагов марковской цепи дерево логических возможностей и вероятностную меру на нем.
Пример 3. Всем хороша Земля Оз, но только не своим климатом. Здесь никогда не бывает двух ясных дней подряд. Если сегодня ясно, то завтра с одинаковой вероятностью пойдет дождь или снег. Если сегодня снег (или дождь), то с вероятностью */2 погода не изменится. Если же все же она изменяется, то в половине случаев снег заменяется дождем или наоборот, и лишь в половине случаев на следующий день будет ясная погода.
Сегодня на Земле Оз ясный день. Используя всю имеющуюся в нашем распоряжении информацию, займемся построением марковской цепи. В качестве состояний этой цепи мы примем различные виды погоды Д, Я, С. Теперь мы можем подсчитать вероятности перехода из одного состояния в другое. Удобнее всего свести все эти вероятности в квадратную таблицу вида
д я с
Д/’А 74 7Л Я 72 о у2 .
CV/4 74 72)
Числа в первой строке таблицы представляют собой вероятности различной погоды после дождя. Числа во второй строке — вероятности различной погоды после ясного дня, а в третьей строке — после снега. Воспользовавшись этой таблицей, мы можем теперь построить дерево логических возможностей для погоды на три последовательных дня и определить меру на нем. Это дерево изображено на фиг. 96.
Это дерево позволяет сделать прогноз о возможности дождя в каждый из трех следующих дней. А именно мы находим, что
р|л=д]=4,
Р1У2=Д1=4’
214
Гл. IV. Теория вероятностей
Р1Л=Д]=Й-
Фиг. 96
я	w(x)
х,	4/зг
хг	г/зг
х3	г/зг
х4	г/зг
х5	г/зг
х6	1/32
Xj	1/32
хв	г/зг
хд	г/зг
хю	t/зг
хм	1/зг
хтг	г!3^
£j3	г/зг
хм	г/зг
хе	г/зг
х№	4/зг
Более подробно мы займемся марковскими цепями в § 15, а также в гл. V.
Упражнения
1.	Пусть f равно числу выпадений герба в примере 2. Найдите
Р [/= 0], Р [/= 1]. Р [/= 2] и Р [/= 3].
2.	В примере 3 найдите Р [Д = Я], Р [fa = Я], Р [f3 = Я].
3.	В каждом из перечисленных случаев определите: является ли описанный процесс
§ 8. Три типа стохастических процессов
215
(а)	процессом с независимыми значениями,
(Ь)	процессом независимых испытаний,
(с)	марковской цепью,
(d)	ни тем, ни другим и ии третьим.
I.	Несколько раз бросается кость.	[Отв.: (Ь).]
II.	Проводится первенство США по бейсболу; здесь мы предполагаем, что каждая команда имеет одинаковые шансы на выигрыш любой игры.
III.	Проводится серия игр между двумя командами, причем победитель в каждой игре выигрывает следующую игру с вероятностью 2/з-[Отв.: (с).]
IV.	Проводится серия игр между двумя командами, которые по очереди играют то у себя иа поле, то у противника. Вероятность выигрыша на своем поле принимается равной 2/3.
4.	Предположим, что в условиях примера 1 сначала бросают игральную кость Постройте дерево логических возможностей и определите на нем вероятностную меру.
5.	Имеются две монеты: одна — правильная, а у другой вероятность выпадения герба равна 2/3. Если в предыдущий раз выпал герб, то подбрасывают правильную монету; в противном случае бросается вторая монета. Пусть в первый раз выпала цифра. Постройте дерево логических возможностей, охватывающее исходы трех последующих бросаний, и определите на нем вероятностную меру. Какова вероятность того, что по крайней мере два раза выпадет герб?	[Отв.: 2/з.)
6.	Покажите, что процесс, описанный в упр. 5, представляет собой марковскую цепь. Выпишите для нее вероятности перехода,
7.	В играх между командами А и В вероятность победы А равна 0.6, вероятность поражения — 0,3 и ничьей — 0,1, Постройте дерево логических возможностей и определите иа нем меру для последовательности из трех игр.
8.	В упр. 7 предположим, что за победу команде дается 2 очка, за ничью 1 н за поражение 0. Какова вероятность того, что в этом матче каждая команда набирает по 3 очка?	[Отв.: 0,109.]
9.	Известно, что сыновья выпускников Гарвардского университета с вероятностью 0,8 поступают в Гарвардский университет, а остальные идут в Йельский. 40% сыновей выпускников Йельского университета поступают в тот же университет, что и их отцы, а остальные делятся поровну между Гарвардским университетом и Дартмутским колледжем1). 70% сыновей выпускников Дартмутского колледжа поступают в Дартмутский колледж, 20% — в Гарвардский университет и только 10% в Йельский университет.
(а)	Выпишите для этой марковской цепи таблицу вероятностей перехода.
(Ь)	Если в нынешнем поколении рассматривать круг людей, состоящий на 40% из выпускников Гарвардского университета, на 40% — из выпускников Йельского университета и на 20% — из выпускников Дартмутского колледжа, то каково 0удет распределение высших учебных заведений в следующем поколении этих семей?
(с)	Предположим, что сын выпускника Гарвардского университета наверняка поступает в Гарвардский университет. Как изменится при этом таблица вероятностей перехода?
’) Университеты и колледжи в США можно сравнить с университетами и учебными институтами в СССР (в частности, роль наших педагогических институтов в США играют так называемые учительские колледжи).
216
Гл. IV. Теория вероятностей
§ 9. НЕЗАВИСИМЫЕ ИСПЫТАНИЯ С ДВУМЯ ИСХОДАМИ
Выше мы видели, что процесс независимых испытаний описывается следующей схемой. Пусть имеется последовательность случайных экспериментов, состоящих в многократном повторении одного и того же эксперимента, причем результат каждого осуществления нашего эксперимента никаким путем не влияет на результаты всех других его осуществлений. Обозначим возможные исходы отдельного эксперимента через Ci, ..., аг. Допустим также, что заданы вероятности pi, ..., рг каждого исхода нашего эксперимента (остающиеся одними и теми же для всех осуществлений). Дерево возможностей для этой последовательности экспериментов будет в каждой точке ветвления иметь одинаковые (эквивалентные) пучки ветвей.
В этом и следующих параграфах мы специально рассмотрим важный случай двух исходов для каждого эксперимента. Более общий случай будет изучаться в § 13. В случае двух исходов принято один исход называть «успехом», а другой — «неудачей». Например, при многократном бросании монеты можно условиться считать успехом герб, а неудачей — цифру. Вероятность р успеха и вероятность q = 1 — р неудачи мы будем предполагать известными. Введение меры на дереве для последовательности трех таких экспериментов проиллюстрировано на фиг. 97. Веса, приписанные путям, указаны в конце каждого пути.
Теперь мы решим следующий вопрос. Пусть дан процесс независимых испытаний с двумя исходами. Чему равна вероятность ч&(п, х’, р) в точности х успехов при п экспериментах? (Мы обозначили эту вероятность через се>(и, х; р), чтобы показать, что она зависит от п, х и р.)
Допустим, что мы уже построили дерево для этой общей ситуации, аналогичное дереву для трех экспериментов, изображенному на фиг. 97; точки ветвления обозначаются у нас буквами У и Н, символизирующими «успех» и «неудачу». Тогда множество истинности высказывания «Число успехов равно х» будет состоять из всех путей, проходящих через х точек ветвления, обозначенных буквой У, и через п—х точек ветвления, обозначенных буквой Н. Чтобы найти вероятность нашего высказывания, мы должны сложить веса всех таких путей. Здесь мы впервые воспользуемся тем фактом, что введенная на нашем дереве вероятностная мера приписывает каждому такому пути один и тот же вес, а именно pxqn~x. Последнее видно из того, что каждой ветви, ведущей к У, приписана вероятность р, и каждой ветви, ведущей к Н, приписана вероятность q, в результате чего в произведение вероятностей будет входить х раз р и п — х раз q. Для определения искомой вероятности нам остается только
§ 9. Независимые испытания с двумя исходами
217
найти число путей, принадлежащих множеству истинности высказывания «Число успехов равно х» Каждому такому пути можно поставить в соответствие упорядоченное разбиение множества целых чисел от 1 до п на две ячейки, из которых первая
содержит х элементов, а вторая содержит п — х элементов. Мы делаем это, помещая номера экспериментов, приведших к успеху, в первую ячейку, а номера экспериментов, приводящих к неудаче,-— во вторую ячейку. Так как число всех таких разбиений равно ), то столько же будет и путей во множестве истинности рассматриваемого высказывания. Итак, мы доказали следующее утверждение:
Для процесса независимых испытаний с двумя исходами вероятность в точности х успехов при п экспериментах дается формулой
w(n, х-, p) = ("}pxqn~x.
Пример 1. Рассмотрим п бросаний обычной монеты. Назовем выпадение герба «успехом», а выпадение цифры «неудачей», и будем считать, что вероятность успеха равна -у при любом бросании независимо от исхода любого дру-
218
Гл. IV. Теория вероятностей
того бросания. Тогда вероятность того, что герб выпадет в точности х раз, равна
4)=С)(Я-
Например, при 100 бросаниях вероятность того, что герб выпадет в точности 50 раз, равна
ГО(1(Ю, М)=(ЖГ
что приблизительно равно 0,08. Таким образом, мы видим, что выпадение герба ровно в половине бросаний совсем маловероятно. С другой стороны, пусть нас интересует вероятность того, что выпадение герба было результатом примерно половины бросаний Для большей определенности вычислим вероятность того, что число выпадений герба отклоняется от 50 не более чем на 10. Чтобы найти эту вероятность, мы должны сложить числа IV (100, х; у) для х = 40, 41, 42, ..., 60. Проделав это, мы найдем, что искомая вероятность приблизительно равна 0,96. Итак, хотя выпадение в точности 50 гербов и маловероятно, но весьма вероятно, что число выпадений герба будет отклоняться от 50 не более чем на 10.
Пример 2. Пусть у нас есть машина, которая на основе имеющейся информации должна предсказать победу республиканцев или демократов на выборах. Мы предполагаем, что если одинаковую информацию ввести в две идентичные машины, то и ответ их будет одинаков. Однако благодаря возможности неполадок в электрической или механической системах машина с некоторой вероятностью q может изменять свое предсказание. Для того чтобы повысить точность предсказания, имеющаяся информация вводится в г идентичных машин, а в качестве ответа принимается ответ, получившийся наибольшее число раз. Для того чтобы исключить возможность равенства числа разных предсказаний, будем считать г нечетным. Посмотрим теперь, как увеличение числа машин понижает вероятность ошибки предсказания, вызванной неполадками в ее устройстве.
Рассмотрим последовательность из г экспериментов, состоящих в том, что информация задается одной машине. В качестве исходов эксперимента мы рассматриваем ее «успех» и «неудачу», под которыми понимается то, указывает ли машина истинный результат или нет. Вероят
§ 9 Независимые испытания с двумя исходами
219
ность успеха равна р = 1 — q. Предсказание большинства машин будет совпадать с предсказанием безупречно работающей машины, если число успехов превосходит г/2. Предположим, например, что мы имеем 5 машин, для каждой из которых вероятность выдачи искаженного предсказания вследствие ее неисправности равна 0,1. Тогда вероятность успеха равна 0,9. Следовательно, вероятность того, что предсказание большинства машин будет совпадать с пресказанием исправной машины, равна
w(5,3; 0,9)4~w(5,4; 0,9) 4-w (5,5; 0,9),
что приблизительно равно 0,991 (см. упр. 3).
Таким образом, наша процедура уменьшает вероятность ошибки, обусловленной неисправностями, от 0,1 в случае одной машины до 0,009 в случае пяти машин.
Упражнения
1.	Вычислите для п = 4, п = 8, п = 12 и п = 16 вероятность выпадения герба точно в половине из п бросаний обычной монеты.
[Отв.: 0,375; 0,273; 0,226; 0,196.]
2.	Вычислите для п •= 4, п — 8, п = 12, п — 16 вероятность того, что доля гербов, приходящихся на п бросаний, отклоняется от Vs менее чем на Vs.
3.	Проверьте, что вероятность 0,991 в примере 2 указана правильно.
4.	Допустим, что Петр и Павел сравнивают монеты, подбрасывая четыре раза одинаковые монеты. [При игре в сравнение монет (в ней Петр забирает обе монеты, если онн упали одной стороной и теряет свою монету в противном случае) вероятность выиграть монету равна Vs как для Петра, так и для Павла.] Какова вероятность того, что Петр выиграет больше, чем Павел? То же самое для случая пяти бросаний. То же самое для
случая 12 917 бросаний.
Г„ 5 . 1	11
1°тв" -16*, 2-; y.J
5.	Бросается четыре раза обычная игральная кость. Какова вероятность того, что выпадут в точности две шестерки?
6,	Какова вероятность получения 70% или более правильных ответов при простом отгадывании на экзамене, состоящем в определении истинности
или ложности десяти утверждений?
11 1
64 J
Отв.;
7.	Монета бросается восемь раз. Чему равно наиболее вероятное число выпадений герба? Чему равно наиболее вероятное число выпадений герба при условии, что в результате первых четырех бросаний выпадает герб?
8,	На одном маленьком предприятии работает десять служащих. Эти служащие завтракают в одной из двух закусочных, причем выбор ими той или другой закусочной одинаково вероятен. Если владельцы закусочных хотят быть уверенными более чем на 95% в том, что у них найдется достаточно мест, то сколько мест должно быть в каждой закусочной?
[Отв.: Восемь мест ]
220
Гл. IV. Теория вероятностей
9.	Предположйм, что у пяти человек, выбранных наугад, спросили, поддерживают ли они некоторое мероприятие. Если мероприятие поддерживает всего лишь 30% населения, то какова вероятность того, что большинство из пяти выбранных человек ответит положительно?
10.	Пусть в примере 2 вероятность искажения ответа машиной вследствие ее неисправности равна 0,2. Сколько потребовалось бы машин, чтобы сделать большей 0,89 вероятность того, что полученный ответ совпадет с ответом исправной машины?	[Отв.: Три машины.]
11.	Предположим, что согласно произведенному подсчету вероятность попадания торпеды в корабль равна */з- Сколько должно быть выпущено торпед, чтобы вероятность по меньшей мере одного попадания в цель была больше чем 0,9?
12.	Студент считает, что если он возьмется изучать четыре предмета, то вероятность сдачи экзамена по каждому из них равна 0,8. Если он возьмется изучать пять предметов, то вероятность сдать каждый предмет равна 0,7,. а в случае семи предметов вероятность сдачи каждого из них равна 0,5. Его единственная цель — сдать экзамен по меньшей мере по четырем предметам. Сколько предметов должен он выбрать, чтобы иметь наилучшие шансы достигнуть своей цели?	[Отв.: 5.]
§ 10. БИНОМИАЛЬНАЯ МЕРА И ЕЕ ПУАССОНОВСКАЯ АППРОКСИМАЦИЯ
Продолжим рассмотрение процесса независимых испытаний, для которого каждый эксперимент имеет лишь два возможных исхода а и b или У и Н. Теперь нам будет удобнее обозначать исходы каждого эксперимента через 0 и 1. Пусть /2, ..., fn— функции исхода этого процесса. Тогда функция S„=/i4-4-/2+	+/л определяет число повторений исхода 1 (ранее
мы называли его исходом У) в последовательности из п экспериментов. Из § & мы знаем, что
Ркл=/1=(")А"Ч
где р есть вероятность исхода У в одном, отдельно взятом испытании, a q = 1—р есть вероятность исхода Н. Эти вероятности мы обозначали через (и, /; р).
Функция w (п, j; р) (или w (г, п, р)) носит название биномиального распределения вероятностей. На фиг. 98 мы изобразили графически W (у; 8, 3А), а на фиг. 99—w(j; 7,3/4). Легко видеть, что в первом случае функция vo достигает максимума в точке / = 6 и после этого начинает убывать. Во втором случае функция ю растет до j — 5, сохраняет свое значение в точке / = = 6 и затем уже начинает монотонно убывать. Эти два случая являются, вообще говоря, типичными.
Возвращаясь к распределениям общего вида, рассмотрим отношение значений функции «и в двух соседних точках j и
§ 10 Биномиальная мера и ее пуассоновская аппроксимация 221
/ + 1. Очевидно:
w(/+1; и, р) = \j + ir	?__ = и—/ £
™(Б"-Р)	(^р'д"'1	7 + 1
Это отношение больше 1, если (п — /)р> (/ +1)?, или, другими словами, если / < пр — д. Если число пр — д не целое, то
значения чи возрастают до некоторого максимума в точке, в которой целое число / впервые оказывается больше пр — д, и затем убывают. Если же пр — д — целое, то чю, возрастая сначала,
222
Гл. IV. Теория вероятностей
принимает наибольшее значение в двух соседних точках j = пр — q и j = пр — q + 1, и только после этого начинает убы-
вать.
X	«(/; 6, >/в)
0	0,33490
1	0,40180
2	0,20093
3	0,5359
4	0,00804
5	0,00064
6	0,00002
Фиг. 100
Пример 1. Игральная кость бросается шесть раз. Обозначим через s6 число выпавших шестерок. Тогда
Г» Г -1	, • г i, ч / 6 \ / 1 V / 5 \п~1
Значения этой функции приведены на фиг. 100. В этом случае функция «« принимает максимальное значение в единственной точке / = 1.
Заметим теперь, что, рассматривая определенную на множестве И = {0,1,2,... .... п] функцию при фиксированных п и р, мы находим, что она обладает всеми свойствами весовой функции. Такая весо
вая функция пригодна для грубого анализа логических возмож-
ностей, связанных лишь с числом повторения определенного исхода а (или У). Определенная таким образом вероятностная мера обычно называется биномиальной.
Значения функции «и при больших п очень плохо поддаются вычислению. Однако существуют приближенные методы определения этих вероятностей для больших п. Наиболее распространенный из этих методов, связанный с так называемым «распределением Гаусса», существенно не конечен по своему характеру и требует знания интегрального исчисления1). В этом параграфе мы рассмотрим другой метод.
Теорема. Рассмотрим биномиальное распределение вероятностей п, р) и положим, что j остается постоянным, п стремится к бесконечности, ар — к нулю, причем, так, что произведение пр остается постоянным и равным т. Тогда
j ~т
lim w (у; п, р) = —Д—
П->СО
где
(1 \fe
l-t-4) =2,71828...
К/
— основание системы натуральных логарифмов.
') Относительно теоремы Лапласа, устанавливающей связь биномиального распределения с нормальным распределением Гаусса, см., например, указанные в конце этой главы книги Б, В. Гнеденко и В, Феллера.
$ 10. Биномиальная мера и ее пуассоновская аппроксимация 223
Доказательство. Напишем
w(/. п. =
Поскольку р = т/п, то правая часть этого тождества равна п(п — 1)... (л — /4-1) / т V
m\n~i
что можно переписать и так
7-1 п
п
JI
Воспользуемся теперь следующим известным результатом 1): / . т\п _
lim 11 — Л->со '
Так как j и т фиксированы, то
П -»со
п
И
Отсюда
lim w (/; п, р)
Я->со
т1е-т
Значение этой теоремы заключается в том, что вследствие ее для последовательности большого числа п испытаний с малой вероятностью р одного из их исходов биномиальное распределение можно заменить распределением вида
где т - пр.
Пример 2. Предположим, что типографский наборщик делает в среднем одну ошибку на 1000 слов. Пусть он набирает сейчас книгу, каждая страница которой содержит 100 слов. Обозначим через s число ошибок, допущенных при наборе одной страницы. Каждое набранное слово мы
*) См. любой курс математического анализа (или указанную в конце главы книгу А. М. Я г л о м и И. М. Я г л о м, Неэлементарные задачи в элементарном изложении, задача 157).
224
Гл. IV. Теория вероятностей
рассматриваем как отдельный эксперимент и предполагаем, что вероятность ошибки в каждом отдельно взятом слове равна 0,001. Рассматривая теперь набор страницы как процесс независимых испытаний, получим, что Р [«==/] = —IV (] 100; 0,001). Значение этой функции w и ее приближенные значения, полученные при использовании формулы дляи? (/, т), где т = пр — 100-0,001 = 0,1, с точностью до пяти знаков воспроизведены в таблице фиг. 101
о iV0-1
Здесь W (j; 0,1) =	.
I	w(y; 100; 0,001)	w(7; o,i)
0	0,90480	0,90484
1	0,09057	0,09048
2	0,00449	0,00452
3	0,00015	0,00015
4	0,00000	0,00000
Фиг. 101
Рассмотрим теперь гипотетический эксперимент, исходом которого может быть' любое положительное целое число, т. е. U ={1,2, ...}. По аналогии с экспериментами с конечным числом исходов мы можем определить на U такую меру, что сумма всех весов равна 1. На основании теоремы, доказанной ранее в этом параграфе, можно предположить, что вероятность исхода / описывается формулой
,.	. щ1е~т
= J, •
Разложив ет в ряд *), мы убедимся в том, что
v	\ V mle~m -т\> mi ,
2^1V{J\	—	— e 2j7T=1;
I	i	I
поэтому, выбрав таким образом функцию веса iv, мы действительно определили на И вероятностную меру. Эта мера называется пуассоновской мерой; о смысле параметра т мы еше скажем в дальнейшем.
Биномиальное распределение описывает множество весов, определенных на множестве Un= {1, 2,	и}. Пуассоновское
*) См. любой курс математического анализа (или книгу А. М. Я г л о м и И. М. Я г л о м, Неэлементарные задачи в элементарном изложении, задача 168),
§ 10. Биномиальная мера и ее пуассоновская аппроксимация 225
j	Пуассоновская мера т=0,1	Биномиальная мера 71=10 р=0,01	Пуассоновская мера	Биномиальная мера 71=100 р=0,01	Пуассоновская мера 777 = 10	Биномиальная мера «=1000 р=0.01
0	0,9048	0,9044	0,3679	0,3660	0,0000	0,0000
1	0,0905	0,0914	0,3679	0,3697	0,0005	0,0004
2	0,0045	0,0042	0,1839	0,1849	0,0023	0,0022
3	0,0002	0,0001	0,0613	0,0610	0,0076	0,0074
4	0,0000	0,0000	0,0153	0,0149	0,0189	0,0186
5			0,0031	0,0029	0,0378	0,0374
6			0,0005	0,0005	0,0631	0,0627
7			0,0001	0,0001	0,0901	0,0900
8			0.0000	0,0000	0,1126	0,1128
9					0,1251	0,1256
10					0,1251	0,1257
11					0,1137	0,1143
12					0,0948	0,0952
13					0,0729	0,0731
14					0,0521	0,0520
15					0,0347	0,0345
16					0,0217	0,0215
17					0,0128	0,0126
18					0,0071	0,0069
19					0,0037	0,0036
20					0,0019	0,0018
21					0,0009	0,0009
22					0,0004	0,0004
23					0,0002	0,0002
24					0,0001	0,0001
25					0,0000	0,0000
Фиг. 102
же распределение определяет множество весов на множестве #оо= {0, 1, 2, .. , п, ...} всех целых неотрицательных чисел. На* ша теорема устанавливает, что веса, определяющиеся биномиальной мерой с параметрами пир, приближенно совпадают с весами пуассоновской меры для т = пр при условии, что п велико, а р мало. На фиг. 102 приведено несколько случаев аппроксимации биномиальной меры пуассоновской.
Упражнения
Примечание. При решении этих задач следует использовать таблицы функции е~т>
15 Зак. 994,
226
Гл. IV. Теория вероятностей
1.	Пусть для исходов эксперимента определена пуассоновская мера, где т=0,3. Обозначим через f функцию исхода. Определите Р[/= 0], Р[/=1] и
Р[/ > 1].	[Отв.: 0,741; 0,222; 0,037.]
2.	Вероятность того, что на руках одного из четырех игроков в бридж окажутся все червонные карты, равна 6,3 • 10~12. Одному специалисту по теории вероятностей, жившему в городе с населением 50 000 человек, регулярно раз в год (обычно поздно вечером) звонили по телефону и сообщали, что только что один из партнеров получил 13 червонных карт. Следует ли предположить, что некоторые из этих счастливых партнеров являются продуктами мистификации?
[Отв.: Да. Если предположить, что ежедневно каждый житель города получает карты пятьдесят раз, то и тогда вероятность сдачи в одни руки всех червонных карт в течение одного года оказывается меньше 0,01.]
3.	Предположим, что в среднем на каждую тысячу человек только один имеет особенно редкую группу крови.
(а)	Какова вероятность того, что в городе с населением в 10 000 человек не найдется ни одного человека с такой группой крови?
[Отв.: 0,00005.]
(Ь)	У скольких людей надо взять на исследование кровь, чтобы с вероятностью, большей 0,5, обнаружить человека с кровью этой группы?
4.	Надо выпечь 500 штук печений с изюмом. Определите, каким должно быть минимальное число изюминок, для того чтобы вероятность того, что в одном из этих 500 печений не окажется ни одной изюминки, не превышала 0,01.
5.	Один владелец автомашины никогда не платил за стоянку (стоимость стоянки — 5 центов). Он полагал, что вероятность быть пойманным равна 0,05. Известно, что в первый раз вы отделываетесь предупреждением, второй раз с вас берется штраф в 50 центов и в последующие разы штраф размером в одни доллар. Сравните при этих условиях среднюю величину штрафа за 20 стоянок со стоимостью Этих стоянок по счетчику.
6.	Агент по рекламе распространяет в городе 10 000 проспектов. В этом городе имеется 2000 кварталов. Пусть каждый проспект с одинаковой вероятностью может попасть в любой квартал. Какова вероятность того, что хоть один квартал останется без проспектов?	[Отв.: 0,007.]
7.	Пусть для некоторого эксперимента была определена пуассоновская мера С параметром т. Покажите, что наиболее вероятным является такой исход k этого эксперимента, что т — 1 k <^т. При каких условиях наиболее вероятными окажутся два исхода этого эксперимента?
8.	Один человек получал в среднем по десять писем в день. Однажды он не получил ни одного письма и спросил себя, а не закрыта ли сегодня почта. Для того чтобы ответить себе на этот вопрос, он вычислил вероятность того, что за десять лет по крайней мере один раз ему не придет ни одного письма. При этом он предполагал, что число по 1учае-мых писем имеет пуассоновскую меру. Какова подсчитанная им вероятность?
(Указание. Пуассоновскую меру нужно здесь использовать дважды, чтобы определить вероятность того, что в определенный день этот человек не получит ни одного письма, и для того, чтобы вычислить вероятность того, что среди 3000 дней не найдется ни одного, в который он не получил бы ни одного письма; почта доставляется приблизительно 300 дней в году).
[Отв,: 0,13.]
§11. Закон больших чисел
227
§ 11. ЗАКОН БОЛЬШИХ ЧИСЕЛ
В этом параграфе мы изучим некоторые ства процесса независимых испытаний с В § 9 мы видели, что вероятность х успехов дается формулой
f(n, X\ p) = (")pxqn~x.
дальнейшие свой-двумя исходами, при п испытаниях
Отношение вероятности х успехов при п ятности х — 1 успехов при п испытаниях
испытаниях к веро-
п — х р
Т+Т '7
будет, как мы знаем, больше единицы при (и — х) р > (х + 1) q, (т. е. при х<пр — q),„ а затем становится меньше единицы (см. § 10). Таким образом, наибольшая вероятность соответствует числам х, близким к пр. Это не означает, что для отдельного х, близкого к пр, вероятность х успехов велика, а означает лишь то, что она велика по сравнению с вероятностью для чисел х, более удаленных от пр. Например, при 100 бросаниях монеты пр = 100- ’А = 50. Вероятность выпадения в точности 50 гербов равна приблизительно 0,08. Вероятность выпадения в точности 30 гербов равна приблизительно 0,00002.
Более ценную информацию дает изучение вероятности заданного отклонения доли успехов х/n от числа р, т. е. изучение для е, большего нуля, вероятности
Р[р —е<-^</? + е].
При любых фиксированных п, р и е последнюю вероятность можно найти путем сложения всех значений f (п, х; р) для тех значений х, которые удовлетворяют неравенству /’ — £< — < < р + е. Это может оказаться утомительной задачей для конкретного выбора п, р и е. Однако в учебниках по теории вероятностей доказывается, что
р p—e<i<p+e]>1
рд.
nt.2
Каким бы малым ни было е, всегда можно выбором достаточно большого п сделать величину 1 — pq/ntf как угодно близкой к 1. Таким образом, вероятность отклонения доли успехов от р менее чем на е можно сделать как угодно близкой к 1 путем выбора достаточно большого п. Тот факт, что это может
15*
228	Гл. IV. Теория вероятностей
быть сделано, есть частный случай одной весьма общей теоремы теории вероятностей, называемой законом больших чисел.
Положим в предыдущем неравенстве е = k VpQln - Тогда мы будем иметь
?[P — ky — < п	~k2
или
p[np — k Vnpq < х <np-\-k VnpqV> 1------~ ,
что в свою очередь может быть записано в виде
Р[— kVnpq<x — пр < kVnpq] > 1—
Величина пр называется средним значением, или математическим ожиданием числа успехов (см. ниже § 14), а величина Vnpq — дисперсией, или стандартным отклонением числа успехов,
Мы видим, что вероятность отклонения числа успехов от среднего значения на величину, большую k стандартных отклонений, не превосходит 1/k2. Следовательно, для большого k эта вероятность будет мала.
В более подробной теории доказывается, что
Р[—£ Vnpq <х — пр < k Vn-pq\^zk, где zh — число, которое может быть найдено для любого положительного k и не зависит ни от п, ни от р. Символ ~ означает, что указанная вероятность только приближенно равна zh. Это приближение улучшается с увеличением п, но даже для довольно больших п ошибка может быть заметной и потому на практике таким приближением нужно пользоваться с осторожностью.
Заметим, что данное выше приближение можно интерпретировать также следующим образом: вероятность того, что х — пр больше, чем kVnpq, или меньше, чем —kVnpq, приближенно равна 1—zk. Во многих приложениях интересуются лишь ве- । роятностью того, что х — пр больше, чем k Vnpq- Из более подробной теории следует, что эта вероятность приближенно • равна (1—2г*)/2. Следовательно, и вероятность того, что х — пр меньше, чем —kVnpq, приближенно равна (1—zk)!2.	i
Удобно представлять себе стандартное отклонение (дисперсию) как единицу измерения. В таком случае zh означает приближенную вероятность отклонения менее чем на k единиц, или k стандартных отклонений. Значения zh для k = 1,2 и 3 равны

§ Л. Закон больших чисел
229
zj = 0,683 .... z2 = 0,956 .... z3 = 0,997.... Таким образом, мы видим, что при большом числе испытаний очень маловероятно получить отклонение от среднего значения на величину, большую трех стандартных отклонений. С другой стороны, год = 0,080.... Это показывает, что также чрезвычайно маловероятно, что отклонение от среднего значения будет меньше одной десятой стандартного отклонения.
Пример 1. При бросании обычной монеты 10 000 раз среднее значение числа гербов равно 5000. а дисперсия для числа гербов равна |/~ 10000	= 50. Следователь*
но, вероятность того, что число выпадений герба отклонится от 5000 менее чем на одну дисперсию, т. е. менее чем на 50, равна приближенно 0,683. Вероятность отклонения менее чем на две дисперсии, т. е. менее чем на 100, приближенно равна 0,954. Вероятность отклонения менее чем на 0,1 дисперсии, т. е. отклонения менее чем на 5, равна приближенно 0,080. Утверждение, что число сербов отклоняется от 5000 менее чем на 150, эквивалентно утверждению, что доля гербов отклоняется от 0,5 менее чем на 10 000 —0,015.
Пример 2. Предположим, что в одном большом городе выбрали наугад 900 человек и спросили их, поддерживают ли они некоторое мероприятие. Из 900 опрошенных 550 высказались в пользу этого мероприятия, а 350 высказались против. Будет ли маловероятным, что такое убедительное большинство получено в выборке 900 человек, если насе-
ление города разделяется поровну на тех, кто поддерживает мероприятие, и тех, кто его не поддерживает? Если
население разделено поровну, то можно предположить, что
900 опрошенных человек образуют процесс независимых испытаний с вероятностью */2 «за» и */2 «против». Тогда
(дисперсия) для числа ответов 15. Поэто-
стандартное отклонение
«за» в 900 испытаниях равно
му было бы весьма маловероятно, чтобы мы получили отклонение от среднего значения 450 более чем на 45. Тот факт, что в данной выборке отклонение от среднего значения равняется 100, свидетельствует, очевидно, о неправильности гипотезы о разделении мнений поровну. Предположение о том, что фактическая доля тех, кто поддерживает мероприятие, равна некоторому числу, меньшему, чем */2, тем более привело бы к заключению, что в выборке из 900 человек наличие 550 человек, поддерживающих меро
230
I л. IV. Теория вероятностей
приятие, весьма маловероятно. Это заставляет нас думать, что истинная доля больше, чем */2. С другой стороны, если бы из 900 человек число тех, кто «за», равнялось бы 465, то в предположении, что мнения разделены поровну, мы имели бы отклонение лишь на одну дисперсию. Поскольку такое отклонение не является маловероятным, то на основании нашей выборки мы не могли бы исключить возможность разделения мнений поровну.
Упражнения
1.	Если обычную игральную кость бросают 20 раз, то чему равно среднее значение числа выпадений шести очков? Чему равно стандартное отклонение для числа выпадений шести очков?	10 5 1
\°тв" Т’ -з •]
2.	Предположим, что обычная игральная кость бросается 450 раз. Чему равно среднее значение числа бросаний, имеющих результатом 3 или 4 очка? Чему равно стандартное отклонение для числа таких бросаний?
3.	Чему равно среднее значение числа выпадений герба при 16 бросаниях обычной монеты? Чему равно стандартное отклонение для числа выпадений герба?	[Отв: 8; 2.]
4.	Для 16 бросаний монеты найдите точную вероятность того, что число гербов отклоняется от среднего значения числа гербов (а) менее чем на одно стандартное отклонение и (Ь) не более чем на одно стандартное отклонение. То же самое для случая двух стандартных отклонений и для случая трех стандартных отклонений. Покажите, что приближения, указанные для больших п, лежат между полученными значениями, но в нашем случае п = 16 не очень точны.
[Отв: 0,546; 0,790; 0,923; 0,979; 0,996; 0,999.]
5.	Рассмотрим п независимых испытаний с вероятностью успеха р. Пусть г и s — такие числа, что р < г < s. Что говорит закон больших чисел о
пГ	х	1
L	п	J
когда п неограниченно возрастает? Тот же вопрос для случая г < р < s. 6. Известно, что некоторое лекарство эффективно в 20% тех случаев, когда оно применяется. В это лекарство ввели новую составную часть, и из последующих 900 случаев его применения оно оказалось эффективным в 250 случаях. Что можно сказать об эффективности нового лекарства?
7.	Рассмотрим большое число независимых испытаний с вероятностью успеха р. Чему равна приближенная вероятность того, что число успехов отклонится от среднего значения числа успехов более чем на одно стандартное отклонение, но менее чем на два стандартных отклонения?
[Отв: 0,271.]
8.	Чему равна приближенная вероятность того, что при 10 000 бросаниях обычной монеты число выпадений герба будет заключено между 4850 и 5150? Какова приближенная вероятность того, что число гербов лежит в том же интервале, при условии, что в результате первых 1900 бросаний выпадает 1600 гербов?
9.	Допустим, мы хотим сделать равной приближенно 0,95 вероятность того, что доля выпадений шести очков при л-кратном бросании кости не отклонится более чем на 0,01 от значения-д-. Как велико должно быть л?
6
[Отв.: Приблизительно 5555.)
§ t2 *. Проблема выбора решения
231
10.	Две железнодорожные компании конкурируют из-за перевозки 1000 пассажиров, отправляя поезда в одно и то же время. Если каждый пассажир может с одинаковой вероятностью выбрать поезд как одной, так и другой компании, то по скольку мест должны предусмотреть эти компании, если они хотят быть уверенными, что вместительность их поездов окажется достаточной в 99 случаях из 100?	[Отв.: 547.]
11.	Предположим, что в одном городе 10% всего населения болеет раком. Чему равно среднее значение числа больных раком при выборе наугад 900 человек из этого города? Чему равно стандартное отклонение? Чему приблизительно равна вероятность того, что более чем 108 человек из Этих 900 больны раком?	[Отв.: 90; 9; 0,023.]
12.	Предположим, что в условиях упр. 11 900 человек выбраны наугад из куряших жителей города. В предположении, что курение не оказывает никакого влияния на заболеваемость раком, найдите среднее значение числа больных раком среди этих 900 человек. Предположим, что более 120 из 900 выбранных человек больны раком. Что можно тогда сказать относительно гипотезы об отсутствии связи между курением и заболеваемостью раком?
13.	В примере 2 мы предполагали в наших вычислениях, что если фактическая доля населения, поддерживающего мероприятие, равна р, то 900 выбранных наугад человек образует процесс независимых испытаний с вероятностью р ответа «за» и вероятностью 1 — р ответа «против». Укажите способ выбора 900 человек, при котором такое предположение оправдано. В чем состоит неправильность приведенных ниже способов?
(а)	Выбираются первые 900 человек в регистрационном списке республиканцев.
(Ь)	Выбирается наугад 900 фамилий из телефонной книги
(с)	Выбирается наугад 900 домов, и в каждом из них опрашивается один человек, причем дома посещаются в Первой половине дня.
14.	Пусть для п бросаний обычной монеты tn таково, что
где х означает число выпадений герба. Найдите tn для п — 10*, п = 106 и
п = ЮЧ	[Отв.: 0,015; 0,0015; 0,000000000 15.]
15.	Допустим, что при решении некоторой задачи вычислительная машина производит миллион операций. Пусть в каждой операции машина с вероятностью "2“делает погрешность +10~5 и с вероятностью погрешность —IO-5. Предположим, что эти погрешности не зависят друг от друга. Какую точность разумно приписать окончательному ответу? То же самое в предположении, что машина производит 10 операций. [Отв.: ±0,01; ±1.]
§ 12*. ПРОБЛЕМА ВЫБОРА РЕШЕНИЯ
В предыдущих параграфах мы имели дело с проблемой вычисления вероятности тех или иных высказываний в предположении, что вероятностная мера известна. В задачах статистики часто приходится принимать некоторое решение в условиях, когда выбор такого решения был бы довольно прост, если бы мы умели определить вероятности интересующих нас высказываний, чего, однако, на самом деле нет. Например, если пред
232
Гл. /V. Теория вероятностей
ложена вакцина против какой-либо болезни, то предстоит решить, следует ли применять эту вакцину. Мы могли бы принять то или другое решение, если бы можно было сравнить вероятность того, что заболеет человек, которому сделана прививка, этой вакцины, с вероятностью того, что заболеет человек, которому прививка не делалась. Статистическая теория разрабатывает методы получения на основании экспериментов некоторой информации, которая помогает оценить эти вероятности или выбрать нужное решение. Мы проиллюстрируем типичную процедуру такого рода.
Смит утверждает, что он может отличить эль от пива, и по этому поводу предлагает Джонсу пари на доллар. Смит и не претендует на то, что он может отличить эль от пива со стопроцентной уверенностью, но полагает, что может отличить один напиток от другого в такой доле случаев, которая заметно превышает -g--
Пусть можно указать число р, выражающее вероятность того, что когда Смиту предлагается стакан пива и стакан эля, он сумеет выбрать стакан с элем. Будем считать, что если р = = то Смит не обладает никакой способностью различения, если р то он способен к некоторому различению, а если р <у> то он может различать, но имеет ошибочное представление об эле. Если бы мы знали р, то мы должны были бы присудить доллар Джонсу при и Смиту при р > -% • Но пока мы ничего не знаем ори, следовательно, не в состояний судить о том, кто выиграл пари. Мы следующим образом производим эксперимент, позволяющий нам принять решение.
Смиту предлагают два стакана: один с элем, другой с пивом; его просят указать стакан с элем. Эту процедуру повторяют десять раз, замечая число правильных ответов. Если это число равно по меньшей мере восьми, мы присуждаем Смиту доллар, а если оно меньше восьми, то доллар присуждается Джонсу.
Исследуем описанную процедуру. Математическое содержание ее можно описать следующим образом. Рассматриваемое нами пространство логических возможностей задается деревом, отвечающим десятикратному осуществлению определенного эксперимента — ответа Смита на вопрос о том, в каком из стаканов находится эль. Введем функции исхода /,• (где j =* 1,2,... ..., 10), которым мы будем придавать значение 1 в случае правильного ответа, и значение 0 в случае неправильного ответа. Нас интересует сумма «ю =/i+/г+/з + • * • +/ю- Если исход
§ 12 *. Проблема выбора решения
233
х всей процедуры таков, что s10 < 8, то мы присуждаем доллар Джонсу; если s10^>8, то доллар получает Смит. Мы полагаем, что вероятностная мера выбрана так, как полагается в случае процесса независимых испытаний. (Это предположение не будет оправдано, если стаканы достаточно велики.) Ясно, что вероятностная мера зависит от величины вероятности р успеха однократного эксперимента. Мы обозначим через Рр [г] вероятность высказывания г оказаться истинным в предположении, что вероятность успеха в одном эксперименте равна р. Так Ро,з И есть вероятность высказывания г в предположении, что Д = = 0,5 = у т. е. в предположении, что Смит указывает стакан с элем наугад; Рад1г] есть вероятность г в предположении, что способность Смита различать пиво и эль оценивается значением 0,8 вероятности р.
Рассмотрим теперь нашу процедуру как с точки зрения Джонса, так и с точки зрения Смита. Мы можем допустить ошибку двух видов. Мы можем присудить доллар Смиту, когда на самом деле правильное значение р меньше или равно у» или мы можем присудить доллар Джонсу, когда правильное значение р больше, чем у. Не имеется никакого средства, гарантирующего, что мы не совершим одну из этих ошибок. Однако мы надеемся, что наша процедура убедит каждого из участников пари, что если он прав, то, по всей вероятности, он выиграет пари.
Джонс полагает, что истинное значение р есть у- Мы вычислим вероятность того, что Джонс выиграет пари, если это действительно так. Мы исходим из предположения о независимости исходов отдельных испытаний; в таком случае вероятность того, что Джонс выиграет пари, есть вероятность Р0>5 [^ю < 81- Пользуясь таблицей, изображенной на фиг. 103, мы найдем, что
Р(, 5 [S10 = 8] + Ро, 5 [S10 = 91 + Ро, 5 [s10 = 20] = 0,055,
и, следовательно, интересующая нас вероятность приблизительно равна 1—0,055 = 0,945. Итак, Джонс видит, что если он прав, то он по всей видимости выиграет пари.
Смит, с другой стороны, считает, что р значительно больше у Если он полагает, что р есть число порядка 0,9, то вероятность ре менее восьми правильных ответов равна 0,930, как это видно
234
Гл. IV. Теория вероятностей
из таблицы фиг. 103. Таким образом, обе стороны должны быть удовлетворены условием пари.
Предположим, однако, что, по мнению Смита, р равно приблизительно 0,75. Тогда вероятность того, что он даст восемь Или более правильных ответов и, следовательно, выиграет пари, равна всего лишь 0,526. В таком случае имеются лишь примерно равные шансы на то, что эксперимент выявит его способность различать пиво и эль, и он, по-видимому, не будет удовлетворен условиями, определяющими победителя. Если Смит думает, что на самом деле его способность различения характеризуется значением р, близким к то нам следует выбрать другой метод присуждения доллара. Мы можем, например, предложить присудить его Смиту, если тот даст семь или более правильных ответов. Если Смит имеет вероятность -j- дать правильный ответ при одном испытании, то вероятность того, что он выиграет пари, приблизительно равна 0,776. Если же р =	, вероятность
того, что Джонс выиграет пари, при этом новом соглашении приблизительно равна 0,828. Для Джонса, таким образом, шансы уменьшились, но Смит может убедить его, что эта процедура более справедлива, чем первая.
X	р X	0,1	0,25	0,50	0,75	0,90
0	0,349	0,056	0,001	0,000	0,000
1	0,387	0,188	0,010	0,000	0,000
2	0,194	0,282	0,044	0,000	0,000
3	0,057	0,250	0,117	0,003	0,000
4	0,011	0,0146	0,205	0,016	0,000
5	0,001	0,058	0,246	0,058	0,001
6	0,000	0,016	0,205	0,146	0,011
7	0,000	0,003	0,117	0,250	0,057
8	0,000	0,000	0,044	0,282	0,194
9	0,000	0,000	0,010	0,188	0,387
10	0,000	0,000	0,001	0,056	0,349
Таблица значений Рр [s10 = л] Фиг. 103
В разобранном примере можно было допустить ошибки двух родов. Большая или меньшая возможность ошибки зависела от механизма эксперимента и от метода, использованного нами
£ 12 *. Проблема выбора решения
235
для принятия нужного решения В некоторых случаях мы не очень заботимся об ошибках и можем произвести относительно простой эксперимент. В других случаях ошибки очень существенны, и эксперимент должен быть осуществлен с учетом этого факта. Например, возможностью ошибки несомненно нельзя пренебречь в случае, когда против какой-нибудь болезни предложена вакцина, и статистика просят помочь решить, следует или не следует ее применять. В этом случае можно предположить, что имеется некоторая вероятность р того, что человек заболеет, если ему не сделают прививку вакцины, и вероятность г того, что он заболеет, если ему сделают прививку. Если мы имеем некоторое представление о приблизительном значении р, то нам предстоит построить эксперимент, имеющий целью решить, будет ли г больше, чем р, равно р или меньше р. Первый случай должен означать, что вакцина на самом деле благоприятствует данной болезни; второй, что она не производит никакого эффекта; третий, что она предотвращает болезнь. Таким образом, мы можем допустить ошибки трех видов. Мы можем порекомендовать прививку вакцины, когда на самом деле она вредна, можем порекомендовать прививку, когда она не производит никакого эффекта, или, наконец, можем забраковать ее, когда на самом деле она эффективна. Первая и третья ошибки могут привести к потере жизней, вторая — к потере времени и денег тех, кто производит эксперимент. Здесь, конечно, очень важно сделать малой вероятность ошибок первого и третьего типа. Чтобы показать, каким образом можно уменьшить вероятность обеих ошибок, вернемся к случаю Смита и Джонса
Предположим, что требование по меньшей мере восьми правильных ответов мы заменяем требованием, чтобы Смит дал по меньшей мере 60 правильных ответов при 100 испытаниях. (Теперь стаканы должны быть очень маленькими.) Рассмотрим сначала случай р = 0,5. В этом случае среднее значение числа правильных ответов равно 50; стандартное отклонение (дисперсия) будет иметь величину 1^100-0,5-0,5 = 5. Для того чтобы Смит дал 60 или более правильных ответов, надо, чтобы истинное значение s отклонялось от своего среднего значения не менее чем на удвоенное стандартное уклонение; поэтому весьма маловероятно, чтобы мы присудили доллар Смиту, когда на самом деле его должен был получить Джонс. Можно даже вычислить вероятность этого события; она равна 0,023. Поэтому Джонс может быть спокоен относительно исхода пари.
Смит считает, что р = 0,75. В этом случае среднее значение величины «юо равно 75, а стандартное уклонение измеряется величиной У 100 • 0,75 • 0,25 ~ 4,3. Значение 60 меньше среднего
236
Гл. IV. Теория вероятностей
значения на 15, т. е. примерно на 3,5 стандартных уклонения. Вероятность, что истинное значение будет на столько меньше стандартного уклонения, очень мала: она равна 0,0002. Поэтому Смит смело может идти на подобное пари.
Вероятности того, что пари выиграет Смит, вычисленные при разных значениях р, показаны на графике, изображенном на фиг. 104. Пунктирная кривая приведена для сравнения вероятностей с соответствующими вероятностями в случае эксперимента, в котором от Смита требуется восемь правильных ответов из десяти. Заметим, что при 100 испытаниях, если	вероят-
ность того, что Смит выиграет пари, равна почти 1, тогда как
Фиг. 104
в случае десяти испытаний она составляет величину всего лишь порядка-g-- Таким образом, в случае ста испытаний легко убедить как Смита, так и Джонса, что тот, кто прав, имеет очень большие шансы выиграть пари.
Итак, мы видим, что вероятность ошибки каждого рода может быть сделана маленькой за счет увеличения числа экспериментов.
Упражнения
1.	Допустим, что в эксперименте с пивом и элем Джонс согласен уплатить Смиту, если Смит даст по меньшей мере девять правильных ответов из десяти.
(а)	Какова вероятность того, что Джонс уплатит Смиту, хотя Смит и не умеет различать пиво и эль и указывает стакан с элем наугад?
[Отпел 0,11.]
(Ь)	Предположим, что Смит способен различать с вероятностью 0,9. Какова вероятность того, что ои не выиграет пари с Джонсом?
[Отв.: 0,264.]
2.	Пусть в эксперименте с пивом и элем Джонс хочет сделать вероятность того, что Смит случайно выигрывает, хотя он указывает стакан с элем
§12*. Проблема выбора решения
237
наугад, меньшей чем 0,1. Сколько правильных ответов из десяти должен он потребовать от Смита?
3.	При рассмотрении эксперимента е пивом и элем мы предполагали, что различные испытания независимы. Исследуйте несколько вариантов, в которых вследствие зависимости отдельных испытаний друг от друга может быть допущена ошибка, и подумайте о том, как эта ошибка может быть устранена. (Например, стаканы, в которые наливается пиво и эль, могут чем-либо отличаться друг от друга.)
4.	Рассмотрим следующие две процедуры для проверки способности Смита отличать пиво от эля.
(а)	При каждом испытании наливается четыре стакана, три с пивом и один с элем, и Смита просят указать стакан с элем. Эту процедуру повторяют десять раз. Правильных ответов должно быть семь или более.
(Ь)	Смиту наливают десять стаканов и сообщают ему, что пять из них с элем и пять — с пивом. Его просят указать пять стаканов, которые, по его мнению, содержат эль. Все пять стаканов он должен указать правильно.
Найдите в каждом отдельном случае вероятность того, что Смит докажет свою способность путем простого угадывания. Имеются ли основания предпочесть одну из этих процедур другой?
[Отв.: (а) 0,003; (Ь) 0,004.]
Б. Некая организация, занимающаяся разработкой тестов, предлагает метод, который позволяет предсказывать для группы первокурсников порядок их следования по успеваемости по окончании колледжа. Колледж соглашается испытать этот метод на группе из пяти студентов и обещает принять метод, если по отношению к этим пяти студентам предсказание либо полностью подтвердится, либо может быть сделано правильным, если переставить в предсказанном порядке двух студентов, стоящих рядом. Если этот метод равносилен простому угадыванию, то какова вероятность того, что он будет принят?	[Отв.:
6.	Стандартный метод лечения некоторой болезни приводит к излечению в -i- всех случаев. Утверждается, что некоторый новый метод вылечи-
3
вает в -j-всех случаев. Этот новый метод хотят испробовать на десяти больных, страдающих данной болезнью. Если будут вылечены семь больных или более, новый метод будет принят. Если вылечены будут троё или менее больных, метод не будет рассматриваться дальше. Если число вылеченных окажется равным четырем, пяти или шести, результат испытаний будет признан неокончательным и будут производиться дальнейшие исследования. Найдите вероятность каждой из этих альтернатив в предположении, что (а) новый метод имеет ту же эффективность, что и старый; (Ь) предложенный метод лечения — правильный.
7.	Трое студентов обсуждают способности студентов-математиков в области шахматной игры. Один студент утверждает, что большинство математиков (скажем, 90% их общего числа) хорошо играют в шахматы. Второй утверждает, что лишь очень немногие математики (скажем, 10%) хорошо играют в шахматы, а третий студент утверждает, что математик с одинаковой вероятностью может оказаться хорошим шахматистом или не оказаться им. Они решили произвести анализ способностей десяти математиков к шахматной игре, классифицируя их на хороших шахматистов и лиц, не являющихся таковыми. Студенты условились, что пари выигры
238
Гл. IV. Теория вероятностей
вает первый из них, если хорошими шахматистами окажутся восемь или более математиков, второй — если два или менее, и третий — во всех остальных случаях. Для каждого студента найдите вероятность того, что он выиграет пари, если он прав. [Отв.: 0,930; 0,930; 0,890.]
8.	Десять студентов отвечают на десять вопросов. Каждый студент имеет 1
вероятность -g- ответить правильно на каждый вопрос, если ему не подсказывают другие. Преподаватель определяет для каждого вопроса число студентов, которые дали на него правильный ответ. Если он находит, что на четыре или более вопроса было дано менее трех или более семи правильных ответов, он рассматривает это как убедительное доказательство того, что студенты общались друг с другом. Дайте обоснование для этой процедуры. [Указание: Следует использовать приведенную на фиг. 103 таблицу дважды: один раз для нахождения вероятности менее трех или более семи правильных ответов на данный вопрос, и второй раз для нахождения вероятности того, что это произойдет в случае четырех или более вопросов.]
§ 13. ПРОЦЕСС НЕЗАВИСИМЫХ ИСПЫТАНИЙ БОЛЕЕ ЧЕМ С ДВУМЯ ИСХОДАМИ
Рассмотрим теперь процесс независимых испытаний, в котором каждый эксперимент имеет более чем два возможных исхода. Эти исходы мы обозначим через аи а2, , ак> а их вероятности через Др р2..Pk- Пусть функция f(t\, г2, ...» гй;
Pi,p2, . •, рк) означает вероятность того, что при n = Г1 + г2-|- ... ... +rftтаких испытаний исход ai будет иметь место и раз, исход а2 будет иметь место г2 раз, и т. д.; соответствующую величину /(Гр г2; рг, д2) для случая двух исходов мы записывали в § 9 как w (n, Гр Д1), поскольку здесь г2 = п — ц и р2 — — 1 — рх определяются по п, и и pi. Мы покажем общий способ нахождения величины /(гр г2, ..., rft; др р2, ..., ДА); однако для простоты мы ограничимся разбором случая k = 3, п = 5 и найдем /(1, 2, 2; Др р2, р3).
На фиг. 105 представлена та часть дерева этого процесса, которая нужна, чтобы указать вероятности отдельных ветвей, из которых складывается путь, отмеченный жирной линией и соответствующий исходам а2, а3, а\, а2, а3 именно в этом порядке. Согласно введенной на нашем дереве вероятностной мере, этому пути приписан вес Дг • Рз ’ Pi’ Ръ ' Рз — Pi ' Р\‘ Рз-
Существуют, конечно, и другие пути на дереве, соответствующие осуществлению одного исхода аь двух исходов а2 и двух исходов а3. Однако в соответствии с отвечающей дереву мерой им всем должен быть приписан один и тот же вес РхР2р1- Следовательно, чтобы найти /(1, 2, 2; Др д2, Д3), мы должны умножить этот вес на число путей, которым отвечает заданное нами .число осуществлений каждого исхода.
§ 13. Процесс независимых испытаний более чем с двумя исходами 239
Мы замечаем, что наш путь а2, Дз, «ь а2, а3 задается разбиением на три ячейки [{3}, {1, 4}, {2, 5}] системы целых чисел от 1 до 5. Здесь первая ячейка содержит номера экспериментов с исходом ai, вторая ячейка содержит номера экспериментов с исходом а2 и третья — номера экспериментов с исходом «з-Обратно, любое разбиение множества чисел {1, 2, ..5} на три ячейки с одним элементом в первой ячейке, двумя элементами
Фиг. 105
во второй и двумя в третьей соответствует единственному пути интересующего нас вида. Следовательно, число этих путей равно числу таких разбиений, т. е. равно
( 5 1 = — \1, 2, 2/	1! 2! 3!
(см. § 5 гл. III) Итак, вероятность осуществления одного исхода (?1, двух исходов а2 и двух исходов а3 равна
( 1, 2, 2) ’^1 ’^2 ‘ Рз-
Предыдущее рассуждение, проведенное для случая независимых испытаний с исходами а1г а2, ..., ak, имеющими соответственно вероятности pi, р2,..., ръ, позволяет установить следующий результат:
Вероятность гь появлений аъ г2 появлений а2 и т. д. находится по формуле
f(fi> Г2,.. , гк, ри р2,..., pk) = (Г1 Г2п t J Р\Щ . . • P'k* .
Этому утверждению можно придать еще и следующую форму. Рассмотрим процесс независимых испытаний с возможными
240
Гл. IV. Теория вероятностей
исходами а, Ь, ..й; вероятности этих исходов мы по-прежнему обозначим через рг, Ръ .... pk (где Л + А+ • • +А = 1)-Обозначим через ga функцию, определенную на множестве путей соответствующего дерева и равную числу повторений исхода а, через gb функцию, равную числу повторений исхода b и т. д. Тогда
Ркй’а = '-1)Л(& = Г2)/ ••• Л (£„ = >•„)] =
— (г г г }рГ1 ‘РГ.2‘ 'РГ"
(где г2, ..., г„— неотрицательные целые числа, такие, что ri~br2+ ••• +/« —га).
На фиг. 106 изображен случай k = 3, п = 3, на котором читатель легко проверит соответствующую формулу (так, например,
Р l(ga = 1) Л (gb = 2) Д gc = 0)] =
= w (х5) + w (лп) + w (х13)=3papj, а(1.2,о)=тйг = 3)-
Пример 1. Игральная кость бросается 12 раз. Какова вероятность того, что каждое возможное число очков выпадет два раза? Здесь имеется шесть исходов 1, 2, 3, 4, 5,6, соответствующих шести граням кости. Каждому исходу мы приписываем вероятность -g-- Нам нужно определить
f(2, 2, 2, 2, 2, 2;	1. i. 1,	=
7 \	о о 6	6	6	6/
= Р | (g\ = 2) Л (g2 = 2) Л (g3 = 2) Л (g-4 = 2) Л (g5 = 2) Л (g6 = 2)].
Раскрывая это выражение, мы найдем:
Пример 2. Пусть некоторая команда выигрывает каждую игру с вероятностью 0,6, проигрывает ее с вероятностью 0,3 и делает ничью с вероятностью 0,1. Каковы вероятности различных комбинаций числа побед, ничьих и поражений в последовательности из трех игр?
Эту последовательность можно рассматривать как процесс независимых испытаний, состоящий из трех экспериментов с возможными исходами В, П и Н, вероятности которых соответственно равны 0,6; 0,3 и 0,1. Тогда для любых г, s и t имеем
р [(ffB = г) Д (gn = s) Л (gH = /)] = (г> 3 t) • (0,6/ (0,3/ (0,1/.
Фиг, 106
X	W(X)
Х!	Ра
Х2	РаРь
Х3	РаРс
Х4	РаР„
XS	РаРь
Хв	Ра Pb Рс
Х,	г РаРс
х8	Ра Рь Рс
Х9	РаРс
Х1О	PaPb
хп	ЪРь
Х12	РаРьРс
Х13	РаРь
ХМ	Рь
ХК	PbPc
Х1в	РаРьРс
Х17	4Рс
Х18	РьРс
Х1Я	РаРс
хго	РаРьРс
хп	РаРс
хгг	РаРьРс
хгз	РьРс
хгч	РьРс
хгь	РаРс
хгв	РьРс
хгз	Ра
16 Зак. 994.
242
Гл. IV. Теория вероятностей
В таблице приведены вероятности всевозможных комбинаций выигрышей, поражений и ничьих. Из этой таблицы легко определить вероятности и других интересных событий. Например, вероятность того, что команда выиграет ровно две игры, равна 0,324+0,108=0,432.
Г		t	Р[(гвыпгрышей)Л(4Проигрышей)Л{/ ничьих)]
3	0	0	0,216
0	3	0	0,027
0	0	3	0,001
2	1	0	0,324
2	0	1	0,108
1	2	0	0,162
1	1	1	0,108
1	0	2	0,018
0	2	1	0,027
0	1	2	0,009
Пример 3. Рассмотрим процесс независимых испытаний с четырьмя исходами аь аг, аз, а-t, имеющими соответственно вероятности pi, р2, Рз, Pt- Может оказаться, что нас интересуют только вероятность ri-кратного осуществления исхода а\ и Гг-кратного осуществления исхода а2, безотносительно к числу осуществлений каждого из остальных возможных исходов. Чтобы найти эту вероятность, мы просто рассмотрим новый эксперимент с исходами а\, а2, а3, где а3 соответствует появлению в нашем первоначальном эксперименте одного из исходов а3 или а4. Соответствующие вероятности равны
Pi, Рз и Рз> где Р3=Рз+Ра-
Пусть г3 = п—(ri + Гг). Тогда наша задача сводится к нахождению вероятности того, что в новом эксперименте исход ai осуществится Г1_раз, исход а2 осуществится г2 раз и исход а3 осуществится г3 раз. Эта вероятность равна
п
г2, г2.
2 • Dr3 =
*3
•/’?-(/’з+л)Га+Г4-
Аналогично можно рассуждать и в случае эксперимента с любым числом исходов, где нас интересует число появле
§ 13. Процесс независимых испытаний более чем с двумя исходами 243
ний не всех, а лишь отдельных исходов. Например, если бросается 10 раз игральная кость, то вероятность в точности двух выпадений одного очка и в точности трех выпадений трех очков равна
Упражнения
1.	Предположим, что в некотором институте 30% студентов получают только высшие оценки, 60% — просто успевают (не получают высших оценок по всем предметам) и 10% — не успевают. Какова вероятность того, что среди трех выбранных наугад студентов окажется один студент, имеющий только высшие оценки, один просто успевающий студент и одни неуспевающий студент?	[Отв.: 0,108.]
2.	Три лошади А, В и С участвуют в четырех забегах. Допустим, что в каждом забеге все лошади имеют одинаковые шансы. Какова вероятность того, что А выиграет два забега, а В и С выиграют каждая по одному забегу? Какова вероятность того, что одна и та же лошадь выиграет все четыре забега?	г 4 J т
рте.: ; gy.J
3.	Допустим, что в одном большом колледже 40% всех студентов составляют первокурсники, 30% второкурсники, 20% третьекурсники и 10% старшекурсники. Из этих студентов выбирается наугад комиссия из восьми человек. Какова вероятность того, что в комиссию войдет одинаковое число представителей каждого курса?
4.	Предположим, что для отдельной торпеды вероятность потопить корабль равна > вероятность повредить его равна и вероятность пройти мимо корабля равна -у-. Предположим еще, что после двух повреждений корабль идет ко дну. Какова вероятность того, что четыре торпеды потопят корабль?	г 251 1
LOme:-256‘J
Б. В одном доме живут Джонс, Смит и Грин. Почтальон заметил, что Джонс и Смит получают в среднем одинаковое число писем, а Грин получает писем в два раза больше, чем Джонс, и, следовательно, также в 2 раза больше, чем Смит. Если почтальон несет в дом четыре письма, то какова вероятность того, что каждое из названных лиц получит по меньшей мере одно письмо?
6.	Бросаются три кости. Найти вероятность того, что выпадут одна шестерка и две пятерки, при условии, что число очков, выпавших иа каждой кости, больше трех.	Г _	11
Отв.: .
7.	Некто играет в турнире три партии. В каждой ^партии он имеет вероятность выиграть , вероятность проиграть -j- и вероятность сделать
ничью -j- независимо от исходов других игр. Чтобы победить в турнире, он должен иметь больше выигранных игр, чем проигранных. Какова вероятность того, что он победит в турнире?
16*
244
Гл. IV. Теория вероятностей
8.	Пусть вероятность того, что выбранный наудачу студент получит по определенному предмету оценку А, равна 0,1, оценку В — 0,2, оценку С — 0,4, оценку D — 0,2 и оценку Е — 0,1. Какое распределение отметок наиболее вероятно в случае четырех студентов?
[Отв.: Одна оценка В, две оценки С, одна оценка DJ
§ 14. СРЕДНЕЕ ЗНАЧЕНИЕ
В этом разделе мы рассмотрим понятие среднего значения (математического ожидания). Это понятие, возникшее в связи с изучением азартных игр, оказывается существенным почти во всяком теоретико-вероятностном рассуждении.
Определение. Если в каком-нибудь эксперименте возможными исходами являются числа at, аг, ...» ah и вероятности этих исходов соответственно равны рг, р2> • ••> Рь> то среднее значение определяется формулой
М = агрх -|- а2р2 + • • • + akPk-
Не следует представлять себе среднее значение как такую величину, которая обязательно является исходом одного из экспериментов. Например, если кто-нибудь держит пари на 1 доллар, что при бросании монеты выпадет герб, то он может либо выиграть 1 доллар, либо проиграть 1 доллар. Среднее значение (математическое ожидание) в этом случае равно (1) • (§) + -]-(— 1) • (-g-j = 0, что не является одним из возможных исходов.
Термин «среднее значение» обязан своим происхождением следующему факту. Если мы повторяем наш эксперимент большое число раз и если мы ожидаем появления at в доле pt всех случаев, а2 в доле рг всех случаев и т. д., то средняя величина, появления которой мы ожидаем при одном эксперименте, равна М = агРх + а2р2 + ...	Например, в азартной игре М
интерпретируется как средний выигрыш, которого можно ожидать при большом числе игр. Здесь среднее значение выигрыша часто принимается за оценку выгодности игры. Игра с положительным средним значением выигрыша называется выгодной; игра с нулевым средним значением выигрыша называется безобидной; наконец, если среднее значение выигрыша является отрицательным, то игра квалифицируется как невыгодная. Эти названия не следует понимать слишком буквально, так как многие с большим удовольствием играют в игры, которые с точки зрения теории вероятностей являются невыгодными.
Пример 1. В качестве первого примера использования понятия среднего значения рассмотрим игру в рулетку в
§ 14. Среднее значение
245
том виде, как она ведется в Монте-Карло. Имеется несколько видов пари, которые может держать игрок; мы рассмотрим два из них. На колесе отмечены число 0 и числа от 1 до 36, расположенные против прорезей, находящихся на одинаковом расстоянии друг от друга. Колесо приводится во вращение, и бросается шарик, попадающий в одну из прорезей. Если игрок поставил, скажем, 1 доллар на определенное число и шарик попал в соответствующую прорезь, то крупье выплачивает игроку выигрыш в размере 36-кратной ставки, т. е. 36 долларов. Таким образом, при ставке в 1 доллар среднее значение выигрыша равно
= 0,973. Это означает, что при длительной игре игрок должен ожидать потери около 2,7% поставленной им суммы.
Второй способ игры состоит в следующем. Игрок может ставить на «красное» или «черное». Числа от 1 до 36 делятся поровну на «красное» и «черное» (выписанные красной или черной краской). Если игрок ставит на «красное» и результатом является красное число, он получает сумму в размере двойной ставки. Если выпадает черное число, он теряет свою ставку. Если появляется 0, то колесо запускается снова до тех пор, пока оно не остановится на каком-нибудь числе, отличном от 0. Если это число черное, игрок проигрывает, но если оно красное, то он получает уже не двойную, а только свою первоначальную ставку. При таком способе игры при ставке 1 долл, среднее значение выигрыша равно
2(з^)+1(я)=й = 0-9866-
В этом случае при продолжительной игре игрок должен ожидать проигрыша около 1,35% поставленной им суммы. Таким образом, здесь ожидаемый проигрыш составляет только половину ожидаемого проигрыша в предыдущем случае.
Пример 2. Игрок бросает игральную кость и получает число долларов, равное числу выпавших очков Какую сумму игрок должен внести, чтобы сделать эту игру безобидной? Чтобы ответить на этот вопрос, заметим, что игрок может выиграть 1, 2, 3, 4, 5 или 6 долларов, причем вероятность каждого из этих выигрышей равна 7б- Следовательно, среднее значение выигрыша здесь равно
1 ('к)-*-2 (4)+3 (т)+4 (4)+5(i)+6 Gr)=34-
246
Гл. IV. Теория вероятностей
Таким образом, при внесении игроком 3,5 долл, его ожидаемый выигрыш будет равен нулю.
Пример 3. Каково математическое ожидание числа успехов в случае четырех независимых испытаний с вероятностью успеха 1/з?
Мы знаем, что вероятность х успехов равна
( 4 \{1Y \х)\з) \3)
Следовательно,
С)(1)"(4)‘+'-С)(1У(4У+
М = 0
(4\ / 1 \2/ 9 \2
2) (у) (у) + 3'
(W(4)‘+4)(W)°=
, 32,48	24	J__108_£
~	81 ' 81 -I“81 ' 81	81 — 3 •
Пример 4. В игре в «крэпс» один из игроков бросает две кости. Если сумма выпавших очков равна 7 или 11, то он выигрывает. Если она равна 2,3 или 12, то он проигрывает. Если сумма очков равна какому-то другому числу, то этот игрок должен продолжать бросать кости до тех пор, пока не выпадет либо первоначальная сумма очков, либо сумма очков, равная 7. В первом случае он выигрывает, во втором случае проигрывает. Предположим, что он выигрывает или проигрывает 1 доллар. Тогда возможными исходами будут + 1 и — 1. Вычислим среднее значение выигрыша в этой игре. Сначала мы должны найти вероятность выигрыша.
Представим возможности на дереве, имеющем два уровня (фиг. 107). Хотя теоретически не исключена возможность того, что эта игра будет продолжаться бесконечно, мы такую возможность рассматривать не будем. Это значит, что наш анализ применим только к тем играм, которые действительно оканчиваются на некотором шаге.
Для нахождения ветвей на первом уровне мы представляем себе 36 возможностей для бросания двух костей как одинаково вероятные и в качестве вероятности каждой ветви принимаем долю соответствующих этой ветви возможностей. Вероятности ветвей на втором уровне находятся следующим образом Если, например, первым исходом была сумма очков 4, то при окончании игры сумма выпавших очков должна равняться 4 или 7. Соответствующими возможными исходами бросания двух костей будут {(3,1), (1,3), (2,2), (4,3), (3,4), (2,5), (5,2), (1,6), (6,1)}. Мы снова рассматриваем эти возможности как равновероятные и приписываем каждой ветви вероятность, равную доле тех
§ 14. Среднее значение
247
исходов, которые соответствуют этой ветви. Например, ветви, идущей к 4 В, мы приписываем вероятность -|- = -д-. Вероятности других ветвей находятся аналогичным образом. После того как мера дерева введена, для того чтобы найти вероятность выигрыша, мы должны просто сложить веса всех путей, ведущих к выигрышу. Проделав это, мы
244
получим '495'• Таким образом, среднее значение выигрыша игрока, бросающего кости, равно
1 • (®)+<- »	=	0.0141.
Следовательно, можно ожидать, что при длительной игре этот игрок потеряет 1,41% своих ставок Интересно заметить, что игра в «крэпс» невыгодна для него приблизительно в такой же мере, как игра на рулетке при условии, что он все время ставит лишь на «красное» или на «черное».
Пример б. Рассмотрим эксперимент, имеющий бесконечное число возможных исходов, которыми могут служить все (неотрицательные) целые числа 0, 1,2,...; при этом вероятность осуществления исхода, характеризующегося числом /, мы положим равной ру =	, где т— некоторый
248
Гл. IV. Теория вероятностей
параметр (распределение вероятностей Пуассона-, см. § 10). По аналогии с экспериментом с конечным числом исходов определим среднее значение так:
М = О Ро+1 ' А + 2 • р2 + • • • ~ 2 j • Рр
где справа стоит сумма бесконечно большого числа слагаемых (бесконечный ряд). В таком случае имеем
м== 2	= w
/>о	/>о '
— параметр пг распределения Пуассона совпадает со средним значением исхода соответствующего эксперимента.
Определение среднего значения можно сформулировать несколько по-иному. Пусть f — некоторая числовая функция, определенная на пространстве логических возможностей U с вероятностной мерой w(x). В таком случае среднее значение этой функции определяется так:
М1/] = 2/(л).то(л),
х
где суммирование происходит по всему множеству логических возможностей. Эту же формулу можно переписать еще так:
м[/]=2/р [/=/],
где суммирование происходит по множеству значений функции/.
Пример 6. Пусть / есть число дождливых дней среди трех дней, следующих за ясным днем на Земле Оз. Вероятности высказываний f — j могут быть определены из фиг. 96 на стр. 214, они собраны в следующей таблице:
j	р 1/=/]
0 1 2 3	8/з2 *‘/з2 8/з2 V32
Исходя из этих вероятностей, находим среднее значение числа дождливых дней:
»lfl=o-s+i-s+2-®+3-®='s-
§ 14. Среднее значение
249
Пример 7. Рассмотрим процесс независимых испытаний, состоящий из п экспериментов, каждый из которых имеет исход а с вероятностью р и исход b с вероятностью 9=1—р. Пусть fj — функция, значение которой равно 1, если в /-м эксперименте осуществился исход а, и равно О, если осуществился исход Ь. В таком случае, очевидно,
и Р[/у = 0] = 9
и, следовательно,
М[/,] = ! -р + 0-9=Л
Обозначим теперь через з„ функцию /1+/2+ • • • +/п» указывающую число осуществлений исхода а в п экспериментах. В таком случае имеем
м[s„] = М [Л +Л+.. •+/„] - М [Л] + М [/2]+-. .4-М \fn\=pn (здесь мы пользуемся тем, что для любых функций f и g имеет место равенство	— М [/] -ф-M[g], ибо при
любой мере IV (х) на пространстве логических возможностей имеем
М[/4-gl = S (/W4-g(4)V)(х) =«
= 2/(х) w (х) 4- 5 gU) w (х) = М [/] 4- М [g], X	X
Где, разумеется, предположено, что обе функции/и g определены на одном и том Же множестве 21).
Последний результат можно распространить на любой процесс независимых испытаний с произвольным числом исходов. Пусть а есть один из этих исходов и р — его вероятность; под b мы будем понимать событие, заключающееся в том, что исход а Не имел места; вероятность b равна 9=1—р. В таком случае можно применить результат, полученный в примере 6, в силу которого среднее число осуществлений исхода а равно рп.
Упражнения
1.	Допустим, что А бросает две монеты и получает 2 доллара, если выпадут два герба, 1 доллар, если выпадет один герб, и не получает ничего, если не выпадет ни одного герба. Чему равно для него среднее значение выигрыша в этой игре?	[Отв.: 1 доллар]
2.	Смит и Джонс играют в сравнивание монет. Если две подброшенные монеты упадут одной стороной, Смит получает 1 доллар, а если разными, то Джонс получает 1 доллар.
250
Гл. IV. Теория вероятностей
(а)	Чему равно среднее значение выигрыша для Смита, если сравнивание монет происходит дважды?
(Ь)	Допустим, что если первый раз выигрывает Смит, то он прекращает игру, а если он первый раз проигрывает, то играет вторично. Джонсу не позволяется выходить из игры. Чему равно среднее значение вы* игрыша для Смита в этом случае?
3.	Чему равно среднее значение числа выпадений герба при бросании пяти монет?	г 5"|
I Отв.'. . I
4.	Монета бросается до первого выпадения герба, либо до тех пор, пока три раза подряд не выпадет цифра. Найдите среднее значение числа бросаний монеты.
5.	Некто хочет купить газету, которая стоит 5 центов. В его кармане имеется одна десятицентовая монета и пять монет в 1 цент. Газетчик предложил этому покупателю газету в обмен на одну монету, вынутую наугад из его кармана
(а)	Безобидное ли это предложение, и если нет, то кому оно выгодно? [Отв.: Выгодно покупателю.]
(Ь)	Ответьте на те же вопросы, что ив (а), в предположении, что газетчик предложил вынуть наугад из кармана покупателя две монеты. [Отв.: Безобидное предложение,]
6.	А держит с В пари на 50 центов против х центов, что две карты, сданные из перетасованной колоды обычных игральных карт, будут одинакового цвета. Каким должно быть х, чтобы это пари было безобидным?
7.	Докажите, что если в данном эксперименте среднее значение успеха равно М, то после добавления к каждому исходу одного и того же числа k среднее значение успеха в этом новом эксперименте сделается равным М + k.
8.	Докажите, что если в данном эксперименте среднее значение успеха равно М, то после умножения каждого из возможных исходов на одно и то же число k среднее значение успеха в таком новом эксперименте сделается равным k • М.
9.	В примере 3 из § 7 найдите среднее значение числа улиц, испробованных прежде чем будет найден дом.	[Отв.:	• j
10.	В урне лежат два черных и три белых шара. Из этой урны вынимаются друг за другом и без возвращения шары до тех пор, пока не будет вынут черный шар. Найдите среднее значение числа требующихся выниманий.
И. Используя результат упр. 15 и 16 из § 7, найдите среднее значение числа игр в первенстве США по бейсболу (а) в предположении, что обе команды имеют в каждой игре равные шансы на выигрыш; (Ь) в предположении, что в каждой игре вероятность выигрыша более сильной команды 9
равна -к-.	[Отв.: 5,81; 5,50.]
О
12.	Допустим, что мы модифицировали игру в «крэпс» таким образом: при сумме очков 7 или 11 игрок, бросающий кости, выигрывает 2 долл., при сумме 2, 3 нли 12 он проигрывает 3 долл., а во всем остальном игра остается прежней. Найдите среднее значение выигрыша в новой игре и сравните полученный результат с прежним значением.
13.	Предположим, что при игре в рулетку в Монте-Карло мы ставим 50 центов на «красное» и 50 центов на «черное». Чему равно среднее значение выигрыша в этой игре? Лучше это или хуже, чем ставить 1 долл, на «красное»?
§ 15. Марковские цепи
251
14.	Ставку на «красное» в рулетке грубо можно описать следующим образом. Мы выигрываем с вероятностью 0,49, получаем наши деньги назад с вероятностью 0,01 и проигрываем с вероятностью 0,5. Постройте дерево для трех таких игр и вычислите с точностью до трех десятичных знаков вес каждого пути. Какова вероятность того, что мы окажемся в выигрыше в итоге этих трех игр?	[Отв.: 0,485.]
15.	Пусть условием пари, что некоторое высказывание окажется истинным, является г: s. Если А получает s долларов, когда это высказывание окажется истинным, и платит г долларов в противном случае, то чему для него равно среднее значение выигрыша?
16.	В упр. 9 из § 3 найдите среднее значение числа языков, которые изучает выбранный наугад студент.
17.	В упр. 5 из § 4 найдите среднее значение числа посетителей, которые получат свои собственные шляпы.	[Отв.: 1.]
§ 15. МАРКОВСКИЕ ЦЕПИ
В этом разделе мы вернемся к так называемым марковским цепям, кратко охарактеризованным уже в § 8 настоящей главы (стр. 212). Процессы этого типа можно описать следующим образом.
Рассмотрим последовательность экспериментов со следующими свойствами. Исходом каждого эксперимента служит один исход из конечного числа возможных исходов аи а2, ..., аг, причем в каждом эксперименте вероятность исхода а, либо вовсе не зависит от исходов предшествующих экспериментов, либо зависит лишь от исхода единственного эксперимента, непосредственно предшествующего данному. Эта зависимость задается числами Pij, представляющими вероятность исхода aj заданного эксперимента при условии, что предшествующий эксперимент имел исход at. Исходы alt а2, ..., аг называются состояниями, а числа — вероятностями перехода
Вероятности перехода можно представлять двумя различными способами. Первый способ состоит в том, что вероятности перехода записываются в виде квадратной таблицы (см. выше, стр. 213). Для марковской цепи с состояниями ai, а2 и а3 такая таблица имеет вид:
/ Рп Рп Р1з\
Р = 1 Р21 Р22 Р2.3 I-
\Рз1 Рз2 P33J
Эта таблица является частным случаем матрицы. Матрицы играют важную роль при изучении марковских цепей, так же как и во многих других вопросах математики. Ими мы будем заниматься в следующей главе, содержащей также некоторое дальнейшее развитие учения о марковских цепях,
252
Гл. IV. Теория вероятностей
Второй способ представления вероятностей перехода состоит в построении диаграммы перехода. На фиг. 108 изображена такая диаграмма для одного частного случая. Стрелки, идущие от каждого состояния, указывают состояния, в которые это состояние может переходить в рассматриваемом процессе.
Матрица вероятностей перехода, соответствующая этой диаграмме, имеет вид
0,2
а, 0 1 о
П	1	1
Р=а2	0	2-	у
I	о	2
°з	з	0	з
Нули означают невозможность соответствующих переходов.
Заметим, что в матрице Р сумма элементов каждой строки равна 1. Это должно
г/з
Ф и г. 108
быть справедливым для любой матрицы вероятностей перехода В самом деле, элементы i-й строки представляют вероятности всех возможностей рассматриваемого процесса, находящегося в состоянии а{.
Вопрос, который интересует нас в первую очередь при изучении марковских цепей, состоит в следующем. Пусть процесс начинается из состояния i Какова вероятность того, что через п шагов он перейдет в состояние /? Обозначим эту вероятность через pty (не следует смешивать pW с л-й степенью числа р;7). Более того, нас интересует эта вероятность для всех возможных начальных состояний i конечных состояний /. Эти числа удобно
и всех возможных
представить также в виде матрицы. Например, для марковской цепи с тремя состояниями эти вероятности можно записать в виде матрицы
рл) =
л(п)
Ри
Р(2?
Р^ Р(з§
Р®
Р® № №
Пример 1. Для марковской цепи с вероятностями перехода, указанными на фиг, 108, найдем вероятности различ
§ 15. Марковские цепи
253
ных возможных состояний через три шага для случая, когда процесс начинается из состояния а\. Мы находим эти вероятности путем построения дерева и соответствующей вероятностной меры, как это осуществлено на фиг. 109,
Ф и г. 109
Вероятность , например, есть сумма всех весов, приписанных введенной нами вероятностной мерой тем путям нашего дерева, которые оканчиваются состоянием а3:р$= = 1 • 7г • 7г +1 '7г • 7з — 712- Подобным же образом р$ = = 1 -lli- 7г = ’Л и Рп = 1 • 7г • 7з = 7б- Построив меру дере-
ва в предположении, что начальным состоянием является а2, мы можем найти р^, р$ и р$. Аналогично определяются P31’ Р32 и Рзз* Проделав это (см. упр. 7), мы можем записать результаты в форме матрицы
at
Р(3> = а2
<z3
«1		а3
1	1	7
								
6	4	12
7	7	37
36	24	72
4	7	25
27	18	54,
Сумма элементов каждой строки по-прежнему равна единице. Это соответствует тому факту, что из какого бы состояния ни начинать, через три шага мы обязательно достигнем либо первого состояния, либо второго, либо третьего. Отметим еще, что все элементы нашей матрицы положительны. Это соответствует возможности перехода через три шага из любого состояния в любое другое состояние, В следующей главе мы дадим простой способ вычисления матрицы Р(п)
254
Гл. IV. Теория вероятностей
Пример 2. Допустим, что нас интересует вопрос, какая из двух партий — республиканцев или демократов — соберет больше голосов в данном штате на выборах. Мы хотим сделать предсказания, рассчитанные на длительный срок, и потому не рассматриваем специфических условий избирательной кампании в том или ином году. Наши предсказания будут основаны только на истории предшествующих выборов, каждый раз дающих перевес либо республиканцам, либо демократам. Ясно, что знание результатов предшествующих выборов должно влиять на наши предсказания, относящиеся к будущему времени. В качестве первого приближения мы принимаем, что при оценке вероятности того или иного исхода выборов играет роль лишь знание результата выборов, непосредственно предшествующих рассматриваемым. В этих условиях мы приходим к марковской цепи с двумя состояниями Р и Д и матрицей вероятностей перехода:
Р
Р / 1 — а
Д\ b
Числа а и Ь могут быть оценены по известным нам результатам предшествующих выборов следующим образом. Зап можно принять долю тех прошлых лет, исход которых был в пользу республиканцев, в то время как в следующем году он оказывался уже в пользу демократов, а в качестве b — долю противоположных перемен.
Можно получить несколько лучшее приближение, если учитывать результат не одной, а двух предшествующих избирательных кампаний. В этом случае состояниями будут пары РР, РД, ДР и ДД, указывающие исходы двух последовательных предшествующих кампаний. Например, состояние РР означает, что последние две кампании окончились победой республиканцев. Если следующие после победы республиканцев выборы ознаменуются победой демократов, то мы будем иметь состояние РД. Если исходами выборов каких-либо последовательных семи лет служат ДДДРДРР, то в нашем процессе осуществляется переход от состояния ДД к ДД, от ДД к ДР, от ДР к РД от РД к ДР, и, наконец, от ДР к РР. Отметим, что первая буква состояния, к которому мы переходим, совпадает со второй буквой состояния, от которого мы исходим, так как эти буквы относятся к одному и тому же году выборов. Мат-
§ 15. Марковские цепи
255
риЦа вероятностей перехода будет теперь иметь вид:
РР	ДР	РД	ДД
РР (1 — а	0	а	0
ДР ь	0	1 — b	0
РД 0	1 —с	0	с
ДД о	d	0	\—d
Здесь снова нужно	оценить	числа	а, Ь, с и d. Изучение
этого примера будет продолжено в § 9 гл. V-
Пример 3. Следующий пример марковской цепи использовался в физике в качестве простой модели диффузии газов. Позднее мы увидим, что аналогичная модель применима к идеализированной задаче об изменяющихся популяциях.
Представим себе п черных шаров и п белых шаров, которые распределены по двум урнам таким образом, что в каждой урне имеется п шаров. Отдельный эксперимент состоит в том, что из каждой урны вынимается наугад по одному шару, после чего шар, вынутый из первой урны, перекладывается во вторую урну, а шар, вынутый из второй урны, — в первую. В качестве состояния мы будем рассматривать число черных шаров в первой урне. Всякий раз, когда это число известно, известен и точный состав каждой урны. А именно, если в урне 1 имеется / черных шаров, то в урне 2 должно быть п — j черных шаров; п — j белых шаров должно быть в урне 1 и / белых шаров в урне 2. Пусть процесс находится в состоянии /. После обмена шаров он перейдет либо в состояние / — 1 (если из урны1 1 был вынут черный шар, а из урны 2 — белый), либо в прежнее состояние / (если вынутые шары были одного цвета), либо в состояние j + 1 (если из урны 1 был вынут белый шар, а из урны 2 — черный). Вероятности перехода будут равны (см. упр. 12):

Лй = 0 ПРИ k*j~ 1> Л /-1-1-
Физик может интересоваться, например, предсказанием состава урн после того, как было произведено некоторое
256
Гл. IV. Теория вероятностей
число обменов Очевидно, любое предсказание, относящееся к ранней стадии этого процесса, должно зависеть от первоначального состава урн. Так, если с самого начала все черные шары находились в урне 1, то мы должны ожидать, что в течение некоторого времени в урне 1 черных шаров будет оставаться больше, чем в урне 2. С другой стороны, можно ожидать, что после большого числа обменов влияние первоначального распределения шаров будет постепенно исчезать. В § 8 гл V мы увидим, что так и будет на самом деле.
Упражнения
1 Нарисуйте диаграммы состояний для марковских цепей, вероятности перехода которых заданы следующими матрицами:
1	1	1
3	3	3
1	1	1
У	J	’з •
3	3	2
0 10	0
10 0	0
Напишите матрицы вероятностей перехода, соответствующие диаграммам состояний, изображенным на фиг, 110.
t/г
Фиг. НО
§ 15. Марковские цепи
257
3. Найдите матрицу Р^ для марковской цепи, определенной посредством матрицы вероятностей перехода
_1_
2
J_
3
2
2
_2 3
Отв.:
5
12
7
18
7
12
11
18
Р =
4.	Какую матрицу вероятностей перехода имеет марковская цепь примера 3 для случая двух белых и двух черных шаров?
5.	Найдите матрицы P(3),PW для марковской цепи с матрицей вероятностей перехода
\0 1/
То же самое для марковской цепи с матрицей
(° :)•
6.	Рассмотрим марковскую цепь с двумя состояниями czi и аг и матрицей вероятностей перехода
X Х\
з з \
1 1 Г
2 2 J
С помощью особого устройства случайного выбора мы выбираем состояние, с которого начинается процесс. Это устройство выбирает Ci с вероятностью -g- и а2 с вероятностью-g-. Найдите вероятность того, что после первого шага этот процесс перейдет в состояние йь То же самое для случая, когда это устройство выбирает at с вероятностью -g- и а2 с веро-2
ЯТНОСТЬЮ -д-.
Гл 5 4 1
[Ome.. -J2-, -g-.J
7.	Для марковской цепи с вероятностями перехода, указанными на фиг. 108, постройте вероятностную меру, приписанную соответствующему дереву логических возможностей, и найдите следующие величины:
Р%,Р^Р% и <<<
8.	Одна вычислительная машина использует только цифры 0 и 1. В некотором цикле операций предполагается передача одной какой-либо цифры. Одиако для каждой операции имеется определенная вероятность р того, что цифра, передаваемая в процессе этой операции, вследствие ошибки изменится на вторую цифру. Для представления процесса передачи мы образуем марковскую цепь, принимая в качестве состояний цифры 0 и 1. Какой будет матрица вероятностей перехода?
0. Для марковской цепи из упр. 8 нарисуйте дерево и введите вероятностную меру в предположении, что процесс начинается из состояния 0 и
17 Зак, 994.
258
Гл. IV. Теория вероятностей
проходит цикл из трех операций. Какова вероятность того, что после трех операций машина выдаст верную цифру, т. е. О? Какова вероятность того, что в процессе передачи ни разу не произойдет изменение цифры О на цифру 1?	[Отв.: (1—р)3 + Зр2(1 — р); (1—р)3.]
10.	Предположим, что мужчин можно разделить по их профессиям на работников умственного труда, квалифицированных рабочих и неквалифицированных рабочих. Допустим, что 80% сыновей работников умственного труда становятся работниками умственного труда, 10% становятся квалифицированными рабочими и 10% — неквалифицированными рабочими. Пусть из сыновей квалифицированных рабочих 60% становятся квалифицированными рабочими, 20% — работниками умственного труда и 20% — неквалифицированными рабочими. Наконец, 50% сыновей неквалифицированных рабочих пусть будут неквалифицированными рабочими, и по 25% пусть приходится на долю двух других категорий. В предположении, что каждый мужчина имеет одного сына, постройте марковскую цепь, чтобы проследить за несколькими поколениями какой-то семьи. Выпишите матрицу вероятностей перехода. Найдите вероятность того, что внук неквалифицированного рабочего станет работником умственного труда.	[Отв.: 0,375.]
11.	В упр. 10 мы предположили, что у каждого мужчины есть сын. Теперь допустим, что для мужчины вероятность иметь сына равна 0,8. Образуем марковскую цепь с четырьмя состояниями. Первые три состояния пусть будут те же, что и в упр. 10, а четвертое состояние отвечает случаю, когда мужчина не имеет сына, и процесс иа этом кончается. Это состояние представляет те семьи, в которых мужская линия вымерла. Выпишите матрицу вероятностей перехода и найдите вероятность того, что внук неквалифицированного рабочего будет работником умственного труда.
[Отв.: 0,24.]
12.	Объясните, почему вероятности перехода в примере 3 имеют значения, выписанные на стр. 255.
ЛИТЕРАТУРА ДЛЯ ДОПОЛНИТЕЛЬНОГО ЧТЕНИЯ
Гнеденко Б. В. и ХинчинА. Я., Элементарное введение в теорию вероятностей, М., Физматгиз, 1961.
Я г л о м И. М. и Я г л о м А. М., Вероятность и информация, гл. I, М., Физматгиз, 1960.
Кальбертсон Дж. Т., Математика и логика цифровых устройств, гл. III, М., Учпедгиз (в печати).
Д ы н к и н Е. Б. и У с п е н с к и й В. А., Математические беседы, раздел Ш, М.—Л., Гостехиздат, 1952.
ЯгломА. М. и Я г л ом И. М., Неэлементарные задачи в элементарном изложении, раздел I, цикл задач 6, М„ Гостехиздат, 1954.
Феллер В., Введение в теорию вероятностей и ее приложения, М., ИЛ, 1952.
Гнеденко Б. В., Курс теории вероятностей, М., Физматгиз, 1961.
Глава V
ВЕКТОРЫ И МАТРИЦЫ
§ 1. ВЕКТОРЫ-СТОЛБЦЫ И ВЕКТОРЫ-СТРОКИ
Вектором-столбцом называется упорядоченная система чисел, записанных в виде одного столбца. Вот примеры таких векторов:
Отдельные числа этих столбцов называются компонентами вектора. Число компонент вектора служит одной из его отличительных характеристик. Первые два из выписанных выше векторов имеют по две компоненты, следующие два имеют по три компоненты и последний — четыре компоненты. В общем случае n-компонентный вектор-столбец (мы его будем также называть п-мерным вектором) запишется так:
«1
«2
1«л)
Аналогично вектором-строкой называется упорядоченная система чисел, записанных в виде одной строки. Примерами векторов-строк могут служить векторы:
(1, 0), (—2, 1), (2, —3, 4, 0), (—1, 2, —3, 4, —5).
Каждое число, входящее в состав такой строки, снова назовем компонентой вектора-строки. Число компонент вектора-строки снова является одной из важнейших его характеристик. В приведенных примерах первые два вектора будут двухкомпонентными или «двумерными», третий вектор — четырехкомпонентным
17*
260
Гл. V. Векторы и матрицы
(четырехмерным) и четвертый — пятикомпонентным (пятимерным).
Два вектора-строки или два вектора-столбца тогда и только тогда считаются равными, когда равны их соответствующие компоненты. Таким образом, если
(1 \
« —(1, 2), V — ( 0 ), ® = (1, 2), х — (2, 1),
\ /а J
то мы видим, что и = W, но и + V и и ф X.
Если и и v — трехмерные векторы-столбцы, то их сумму и + v мы определим посредством покомпонентного сложения, т. е. следующим образом:
(их \	/	\	/ Vi \
Й2 j —|— I *^2 j :=—2 I ^2 I I •
«з/	\^з/ ХйзЧ-г’з/
Аналогично определим сумму двух трехмерных векторов-строк и и V.
и + г) = («1, и2, «з)-Н®1>	®з) = (и1 + 'у1> «2 + ^2» «з+^з)-
Заметим, что сложение двух трехмерных векторов дает снова трехмерный вектор. Например, / 1\	/ 2\	/3\
I — 1 ]-|-	3 ] = 1 2 ]и(4,—7, 12)+(3, 14, —14) = (7, 7, —2).
\ 2/ \ —1/	\1/
Аналогичным образом определяется посредством покомпонентного сложения и сумма двух п-мерных векторов (строк или столбпов), которая представляет собой снова «-мерный вектор. Заметим, что сложение векторов мы определили лишь для случая, когда они являются либо оба векторами-столбцами, либо оба векторами-строками и если к тому же число их компонент одинаково.
Так как порядок, в котором складываются числа, не имеет значения, то то же самое можно сказать и про сложение векторов, так что
u-^-v — v + u,
где и и v — либо оба векторы-столбцы, либо оба векторы-строки. В этом состоит так называемый коммутативный закон сложения векторов. Числовым примером может служить равенство
1\	/ 2\	/3\	/ 2\	/	1\
-11-1-	3 1 = 21 =	3 ] + [ —1 .
2/	\ —1 /	\1/	\-1/	\	2/
§ 1. Векторы-столбцы и векторы-строки
261
После того как сложение определено для двух векторов, легко сложить три или более вектора, группируя их попарно, как это делают при сложении чисел. Например.
/IX /0\	/0\	/1	\	/о\	/1	\	/IX	/0\	/1\
О ) + ( 2 ] + ( о ) = 1 0 ) -Ь1 2 ) = ( 2 ] = [ 2 )+ 0 ] = 2 ]
\о/ \о/ \з/ \о / \3/ \3 J \0/ \3/ \3 )
и
(1, 0, 0) + (0, 2, 0) + (0, 0, 3) = (1, 2, 0)-|- (0, 0, 3) = = (1, О, 0)-Ь(0, 2, 3) = (1, 2, 3).
Вообще сумма любого числа векторов (строк или столбцов), имеющих одинаковое число компонент, будет вектором, у которого первая компонента равна сумме первых компонент этих векторов, вторая компонента равна сумме вторых компонент и т. д.
Умножение вектора v на число а мы определим посредством умножения на а каждой компоненты вектора V. В случае трехмерного вектора имеем
(яЛ / аиЛ
и2 | = 1 аи2 I
J \ CLll^ j
для векторов-столбцов и
(z® = a(®1, v2, T>3) = (at>i, я^з)
для векторов-строк. Если же и — n-мерный вектор (столбец или строка), то аи определяется аналогично посредством умножения на а каждой компоненты вектора и.
Если и — произвольный вектор, то противоположным ему вектором — и назовем вектор —и = (—1)и. Следовательно, в случае трехмерного вектора-строки
— и. = (— 1) (ир и2, а3) = (— Яр — и2, — «3).
Пользуясь определением противоположного вектора, мы сможем вычитать векторы, а, следовательно, складывать их «алгебраически». В случае трехмерных векторов-столбцов имеем:
(КД	(	/ «1 —
й2 I-I ®2 I —I й2-®2 )
йз/	\®2/	\й3 —^З/
Конкретные примеры на вычитание векторов имеются в упражнениях этого раздела
262
Гл. V. Векторы, и матрицы
Важную роль играет нулевой вектор, т. е. вектор, все компоненты которого равны нулю. Например,
/0\
0 = 1 0 j и 0 = (0, 0, 0) \0/
будут трехмерными нулевыми векторами. В тех случаях когда не может возникнуть путаницы, будем употреблять символ 0 для обозначения нулевого вектора (столбца или строки). Смысл его будет ясен из контекста. Нулевой вектор обладает тем важным свойством, что, каков бы ни был вектор и, всегда и + 0 = и. Докажем это для трехмерного вектора-столбца:
(#1\	f	/®i\
ttj j -f” I Q j == I ®2 Ч- ® | == I ^2 j ==
«3/	\0/	\«з+°/	\«3/
Одним из главных преимуществ векторной записи является то, что она дает возможность обозначить одной-единственной буквой, например и, V, ..., целую систему чисел и обращаться с этой системой, как с одной величиной. Векторная запись позволяет выражать в простой форме весьма сложные отношения. Много примеров этому читатель найдет в настоящей и в следующих двух главах.
Упражнения
1. Произведите указанные ниже действия над векторами
(е) u-j-v— и>;
§ t. Векторы-столбцы и векторы-строки
263
(f)	2и— 3v— w;
(g)	3u—v-|-2a>.
2.	Произведите указанные в п. (а) — (g) упр. 1 действия над векторами и = (7, 0, —3), v = (2, 1, —5), w == (1, —1. 0).
3.	(а) Покажите, что нулевой вектор ие изменится от умножения его на любое число.
(Ь) Покажите, что 0 + и = и, каким бы ни был вектор и.
4.	Докажите, что если и и v — два вектора (оба векторы-столбцы или оба векторы-строки) с одинаковым числом компонент, то и + 0 • о =• и и 0 • и + v = V.
5.	Если 2и — v — 0, то какое соотношение связывает компоненты мио?
[Отв.: Vi — 2и/.[
6.	Ответьте иа вопрос, поставленный в упр. 5, для случая равенства —За + 5о + и — 7v = 0, связывающего векторы и и v. То же самое для равенства 20и — Зи + 5и + 8и = 0.
7.	Найдите следующие суммы, а в тех случаях, когда это невозможно, объясните причину:
(Ь) (2, —1, —1) + 0 (4, 7, —2) = ?
(с) (5,6) + 7-21+(J) = ?
8. Найдите Ui, ut и и3, если
[Отв.: 0; —2; —2.]
9.	Найдите компоненты vt, v2, v3 вектора е, если
10.	Что можно сказать о компонентах ui, иг, и3 вектора и, если
264
Гл. V. Ёекторы и матрицы
11.	Что можно сказать о компонентах щ, и2> «з вектора и, если
О-
12.	Пусть каждому человеку поставлен в соответствйе трехмерный вектор-строка, компоненты которого равны возрасту, росту и весу этого человека. Имеет ли смысл сложение двух векторов, сопоставленных двум разным людям? Имеет ли смысл умножение такого вектора На число?
13.	Пусть каждому человеку, выходящему из магазина с самообслуживанием, поставлен в соответствие вектор-строка, компоненты которого показывают для каждого вида товаров, имеющихся в этом магазине, количество товаров, купленных этим человеком. Ответьте на те же вопросы, что и в упр 12.
14.	Каждому магазину с самообслуживанием поставим в соответствие вектор-столбец, компоненты которого показывают цены на все запасенные товары. Имеет ли смысл сложение векторов, сопоставленных различным магазинам? Имеет ли смысл умножение таких векторов на числа? Укажите различие ситуаций, данных в упр, 12, 13 и 14.
§ 2. ПРОИЗВЕДЕНИЕ ВЕКТОРОВ. ПРИМЕРЫ
Читатель может спросить: зачем нужно было вводить два рода векторов — векторы-столбцы и векторы-строки, — если их свойства аналогичны? Ответить на этот вопрос можно по-раз* ному. Во-первых, во многих приложениях имеют дело с величинами двух родов, которые исследуются одновременно, и поэтому одну из них удобно представить в виде вектора-строки, а другую— в виде вектора-столбца. Во-вторых, существует один способ комбинирования векторов-строк и векторов-столбцов, который очень удобен для определенных типов вычислений. Покажем это на следующем простом примере из области экономики.
Пример 1. Смит зашел в бакалейную лавку, чтобы купить по дюжине яиц и апельсинов, по полдюжине яблок и груш и три лимона. Представим его покупки посредством вектор а-строки:
х = [6 (яблок), 12 (яиц), 3 (лимона), 12 (апельсинов), 6 (груш)] =
= (6, 12, 3, 12, 6).
Пусть поштучные цены на эти продукты будут: яблоки — 4 цента, яйца — 6 центов, лимоны — 9 центов, апельсины — 5 центов и груши — 7 центов за штуку. Мы можем предста-
§ 2 Произведение векторов Примеры
265
вить эти цены посредством вектора-столбца:
4
6
9
5
7
цента за яблоко
центов за яйцо
центов за лимон
центов за апельсин
центов за грушу.

Теперь, очевидно, встает вопрос: какова вся сумма, которую должен уплатить Смит за покупки? Мы хотим умножить вектор количества продуктов х на вектор у цен так, чтобы результат равнялся счету, который был предъявлен Смиту. Очевидно, наше умножение должно иметь следующую форму:
к  у = (6, 12, 3, 12, 6)
4
6
9
5
7
= 6-4 + 12-6+3-9 + 12-5 + 6-7=
= 24 + 72 + 27 + 60 + 42 = 225 центов, т. е. 2,25 долл.
Именно такой расчет и производит кассир, предъявляющий счет Смиту.
Содержащееся в этом примере определение умножения вектора-строки на вектор-столбец мы примем и в общем случае:
Определение. Пусть и — вектор-строка и v— вектор-столбец с тем же числом п компонент; произведение uv мы положим равным
wv = «1®! + u2v2 + ... +
Заметим, что мы всегда пишем сначала вектор-строку, а потом вектор-столбец, и что это единственный тип умножения векторов, который мы будем рассматривать. Приведем два примера умножения векторов:
3\
1 =2-3 + 1(-1) + (-1);4=1.
4/
(2, 1, -1) •
(I, 0) -
= 1 -0+0-1 =0 + 0 = 0.
Обратим внимание на то, что результат такого умножения векторов всегда будет некоторым числом.
266
Гл. V. Векторы и матрицы
Пример 2 Рассмотрим сверхупрощенную экономику с тремя отраслями промышленности, скажем, угольной, электрической и сталелитейной, и с тремя потребителями 1, 2 и 3. Пусть каждый потребитель расходует некоторую долю продукции, выпускаемой каждой отраслью, и пусть каждая отрасль расходует некоторую долю продукции, выпускаемой двумя остальными. Мы предполагаем, что расходуемые количества положительны или равны нулю, так как расходование отрицательного количества продукции непосредственно не может быть интерпретировано. Нужды каждого потребителя и каждой отрасли могут быть представлены посредством трехмерного вектора (строки) спроса, у которого первая компонента означает количество угля, требуемое этим потребителем или этой отраслью, вторая компонента означает количество требуемой электроэнергии, а третья компонента — количество требуемой стали в некоторых подходящих единицах. Например, векторами спроса трех потребителей могут быть
^ = (3, 2, 5), d3 = (0, 17, 1), d3 = (4, 6, 12);
а векторами спроса каждой отрасли могут быть
dy = (0, 1, 2), <Z9 = (20, 0, 8), 4/с = (30, 5, 0), где индексы «у», «э» и «с» служат для обозначения угля, электричества и стали. Тогда спрос на эти товары со стороны всех потребителей может быть представлен суммой dx + d3 + d3 = (3, 2, 5) + (0, 17, 1) + (4, 6, 12) = (7, 25, 18). Аналогично общий спрос на эти товары со стороны промышленности опять может быть представлен суммой
dy + d9 + <Zc = (50, 6, 12).
Следовательно, полный общий спрос может быть представлен суммой
(7, 25, 18)+ (50, 6, 12) = (57, 31, 30).
Предположим теперь, что единица угля стоит 1 доллар, единица электричества 2 доллара и единица стали 4 доллара. Тогда эти цены можно представить посредством век-
тора-столбца р = 1 2 j Рассмотрим сталелитейную про-\4/
мышленность: она продает 30 единиц стали по 4 доллара за единицу, так что ее общий доход равен 120 долларам. Стоимость того, что потребляется ею в процессе производства, можно представить произведением векторов
§ 2. Произведение векторов. Примеры
267
/1\
dc • /> = (30, 5, 0) • ( 2 1 = 30-|- 10 ==40 долларов.
\4/
Х-(а,Ь)
Итак, прибыль в сталелитейной промышленности равна 120 — 40 = 80 (долларов). В упражнениях к этому параграфу требуется найти прибыль в других отраслях.
Эта модель экономики нереальна в двух отношениях. Во-первых, мы не взяли здесь реальных цифр для различных входящих в нее величин. Во-вторых, и это еще более важно, мы не учли того факта, что чем больше отрасль промышленности производит, тем больше она требует Хг вложений. Последнее усложнение будет рассмотрено в гл. VII.
Рассмотрим теперь прямоугольную систему координат на плоскости (фиг. 111). Двумерный вектор х = (а, Ь) можно рассматривать как точку этой плоскости, положение которой относительно осей координат определено, как показано на чертеже. Чтобы найти точку х, нуж-
но выйти из начала координат и О '-----------.-------•
продвинуться вдоль оси *1 на расстояние а, а затем продвинуться	Фиг. 111
вдоль линии, параллельной оси х2, на расстояние Ь. Если у нас имеются две такие точки, скажем, х — (а,Ь) и у — (c,d), то х + у, х — у, у — х и — х — у будут точками, геометрический смысл которых виден на фиг. 112.
Понятие умножения вектор-строки на число также можно интерпретировать геометрически. На фиг. 113 изображены точки, соответствующие вектору х= (1, 2) и векторам 2х,-|-х, —хи — 2х. Заметим, что все эти точки лежат на одной прямой, проходящей через начало координат. Другой векторный величиной, имеющей геометрический смысл, является вектор г = ах + + (1—а) у, где а — любое вещественное число, заключенное между 0 и 1. На фиг. 114 мы видим, что все точки г лежат на отрезке прямой, проходящей через точки х и у. Если а =	. то
соответствующая точка будет серединой этого отрезка. Таким образом, если х = {а, Ь) и у = (с, d), то точка -K-x-|--i-y = j(c, й)4 j(c, а) = (—g—’ —2—) служит серединои отрезка прямой, концами которого служат точки х и у.
268
Гл. V. Векторы и матрицы
Упражнения
1. Найдите указанные ниже величины, где
х = (О, 1, 2),
и = (1, —1, 4),
$ 2. Произведение векторов Примеры
269
Й/—1 \
• у=I — । • \ 2/
(a)	u-v-f-x-y = ?	[Отв.: 12.]
(b)	(—« + 5x)-(3v —2у) = ?
(с)	5и • v 10 [х • (2v — у)] = ?	[Отв.: 55.]
(d)	2[(и — х)-(«4-у)] = ?
2.	Постройте точки, соответствующие векторам-строкам х = (3,4) и у = (—2,7), Найдите и постройте точки, отвечающие следующим векторам:
(а) ^% + уУ,
(Ь) х-[-у, (с) х — 2у, (d)4x+4y-(е) Зх— 2у, (f) 4у — Зх.
3.	Пусть х = (1,—1,2) и у— (0,1,3)—точки пространства; найдите середину отрезка прямой, соединяющего х с у.	^g, 0, gj.j
4.	Пусть и — трехмерный вектор-строка, v — вектор-столбец с тем же числом компонент и а — число. Докажите, что a(u-v) = (аи)  v = и • (аи),
5.	Предположим, что Брауи, Джонс и Смит пришли в бакалейный магазин и купили следующие продукты:
Браун: два яблока, шесть лимонов и пять груш;
Джонс: две дюжины яиц, два лимона и две дюжины апельсинов;
Смит: десять яблок, дюжину яиц, две дюжины апельсинов и полдюжины груш,
(а)	Сколько различных видов продуктов они купили?	[Отв.: 5.]
(Ь)	Запишите покупку каждого из них в виде вектора-строки с числом компонент, равным ответу на вопрос пункта (а).
(с)	Используя вектор цен, указанный в примере 1, определите счет, предъявленный магазином каждому из этих лиц.
[Отв.: 0,97 доллара, 2,82 доллара, 2,74 доллара.]
(d)	С помощью сложения векторов запишите общий итог их покупок в виде вектора-строки.
(е)	Найдите двумя различными способами общую сумму, израсходованную ими в бакалейном магазине.	[Отв.: 6,53 доллара.]
6.	Докажите, что умножение векторов обладает следующими двумя свойствами:
(1) и • (а  v) = а (и • v), (11) и • (v -|- w) = и • v -|- и • w, где и — трехмерный вектор-строка, v и w — трехмерные векторы-столбцы на — некоторое число.
7.	Изготовление книги включает в себя несколько стадий; сначала ее набирают, затем печатают и, наконец, делают к ней обложку и переплетают. Допустим, что наборщик берет 6 долларов в час, бумага стоит 'Д цента за лист, печатник берет 11 центов за каждую минуту работы его пресса,
270
Гл. V. Векторы U матрицы
обложка стоит 28 центов и переплетчик берет 15 центов за переплетение каждой книги. Допустим теперь, что издатель хочет напечатать книгу, для которой требуется 300 часов работы наборщика, 220 листов бумаги иа один экземпляр и пять минут работы печатного пресса на каждый экземпляр,
(а)	Напишите пятимериый вектор-строку, дающий объем материалов и работы по первой книге. Напишите другой вектор-строку, дающий объем материалов и работы по второму, третьему, ... экземпляру книги. ’ Напишите пятимерный вектор-столбец, компоненты которого дают цены различных материалов и работ по каждой книге в том же порядке, в каком они представлены в двух предыдущих векторах.
(Ь)	Используя умножение векторов, найдите стоимость издания одного экземпляра книги.	[Отв.: 1801,53 долларов.]
(с)	Используя сложение и умножение векторов, найдите стоимость печатания первого издания тиражом 5000 экземпляров.
[Отв.: 9450 долларов.]
(d)	Предполагая, что набор, изготовленный для первого издания, был использован снова, найдите стоимость печатания второго издания в количестве 5000 экземпляров.
[Отв.: 7650 долларов.]
8.	Произведите следующие вычисления, относящиеся к примеру 2.
(а)	Найдите сумму, которую должна уплатить каждая отрасль промышленности и каждый потребитель за приобретенные ими товары.
(Ь)	Найдите прибыль, полученную в каждой отрасли промышленности, (с) Определите общую денежную сумму, выплачиваемую всеми отраслями и потребителями.
(d)	Какая доля от общей денежной суммы, определенной в (с), выплачивается всеми отраслями промышленности? Какая доля выплачивается потребителями?
9.	Подрядчик-строитель получил заказы на пять домов в стиле ранчо, семь домов в стиле Кейп-Код1) и двенадцать домов в колониальном стиле. Напишите трехкомпонентиыЙ вектор-строку х, компоненты которого указывают, какое число домов каждого типа должно быть построено. Допустим, что для одного дома в стиле ранчо требуется 20 единиц леса, для дома в стиле Кейп-Код— 18 единиц и для дома в колониальном стиле — 25 единиц. Напишите вектор-столбец и, компоненты которого указывают количество леса, необходимое для строительства дома каждого типа. Найдите общее количество требуемого леса, перемножив между собой векторы х и и.	[Отв.: 526.]
10.	Пусть х = (х>, х2) и пусть векторы а и b равны:
Определите Xi и х2, если х • а = —1 и х • Ъ =« 7.
[Отв.: Xi — —31, ха = 23.]
11.	Пусть х = (xb х2) и пусть векторы а и Ъ равны
Определите Xi и ха, если х • а =• Xi и х • Ь — х2.
*) Кейп-Код — песчаный мыс в Атлантическом океане на юго-востоке штата Массачусетс, популярное дачное место С этим районом в США связывают определенный тип дачных домов.
§ 3. Матрицы и их комбинации с векторами
271
§ 3. МАТРИЦЫ И ИХ КОМБИНАЦИИ С ВЕКТОРАМИ
Матрицей называется прямоугольная таблица, имеющая вид fаи ап — а\п \
д _ а21	®22 • • • а2п I
' aml апЛ • • • атп /
Здесь буквы atj означают какие-то действительные числа, а m и п целые числа: m является числом строк, а п — числом столбцов нашей матрицы. Такую матрицу называют (/n X ^-матрицей. Если m = п, то матрицу называют квадратной (а число m = п ее порядком). Вот несколько примеров матриц:
(1, 2, 3),
/1 0 0 0\
0 10 0]
0 О 1 О ’ \0 0 0 1/
/ 1 —1 \ -
2	2/’
7 8	9	10\
—1 14	2 —6 I.
3—5	7	О/
Первым примером служит трехмерный вектор-строка, являющийся (1 X 3)-матрицей, вторым примером служит трехмерный вектор-столбец, являющийся (3 X 1)-матрицей; третьим примером служит квадратная (2 X 2)-матрица; т. е. квадратная матрица второго порядка; четвертым — квадратная матрица четвертого порядка и последним (3 X 5)-матрица.
Две матрицы, имеющие одинаковые размеры (т.е. имеющие одинаковое число строк и одинаковое число столбцов), называются равными тогда и только тогда, когда равны их соответственные элементы.
Вспомним, что в § 15 гл. IV матрица появилась естественным образом при рассмотрении марковского стохастического процесса. Чтобы дать другой пример того, как матрицы возникают на практике и как они используются в соединении с векторами, мы рассмотрим следующий пример.
Пример 1. Предположим, что подрядчик-строитель получил заказ на 5 домов в стиле ранчо, 7 домов в стиле Кейп-Код и 12 домов в колониальном стиле. Представим этот заказ посредством вектора-строки к — (5, 7, 12). Подрядчику, конечно, известны виды «сырья», идущего на
272
Гл. V. Векторы и матрицы
каждый тип домов. Пусть этим сырьем будет сталь, лес, стекло, краска и рабочая сила. Элементы приведенной ниже матрицы дают количество каждого вида сырья и рабочей силы, идущих на каждый тип домов, выраженное в подходящих единицах. (Эти цифры взяты произвольно и не соответствуют реальным данным.)
	Сталь	Лес	Стекло	Краска	Рабочая
					сила
Ранчо	7 5	20	16	7	17 \
Кейп-Код	( 7	18	12	9	21 ) = /?.
Колониальный	\ 6	25	8	5	13 J
Каждая строка является пятимерным вектором-строкой, дающим количества сырья каждого вида и рабочей силы, требуемые для данного типа домов, а каждый столбец— трехмерным вектором-столбцом, дающим количество данного сырья (или рабочей силы), требуемые для каждого типа домов. Ясно, что это — очень компактный способ записи всей интересующей нас информации.
Предположим теперь, что подрядчик хочет узнать, сколько потребуется сырья каждого вида и рабочей силы для выполнения заказа. Обозначим нашу матрицу через R. Подрядчик хотел бы образовать нечто вроде произведения xR, так чтобы это произведение указывало, какие он должен сделать заказы. Это произведение должно иметь вид
/5 20
xR = (5, 7, 12)1 7 18
\6 25
16 7 17\
12 9 21 ] =
8 5 13/
= (5-5 + 7-7+12-6, 5-20 + 7-18+12-25,
5-16 + 7-12 + 12-8, 5-7 + 7-9+12-5,
5-17 + 7-21 + 12-13) = (146, 526, 260, 158, 388).
Итак, мы видим, что подрядчик должен заказать 146 единиц стали, 526 единиц леса, 260 единиц стекла, 158 единиц краски и 388 единиц рабочей силы. Заметим, что наш ответ представляет собой пятимерный вектор-строку и что каждый элемент этого вектора получается путем умножения вектора х на соответствующий столбец матрицы R.
Подрядчика интересует также, сколько он должен уплатить за материалы и рабочую силу. Предположим, что единица стали стоит 15 долларов, единица леса 8 долларов,
§ 3. Матрицы и их комбинации с векторами
273
единица стекла 5 долларов, единица краски 1 доллар и единица рабочей силы 10 долларов. Тогда эти цены можно записать в виде вектора-столбца:
15
8
5
1
10
Стоимость домов каждого типа определяется произведением Ry. Это произведение должно иметь вид:
15
/5 20 16 7 17\
= ( 7 18 12 9 21 I
\6 25 8 5 13/
8
5
1
10
/5- 15+20- 84-16 -5 + 7-1 + 17 • 10
I 7 - 15+18-8 +12-5 + 9- 1 + 21 • 10 Х6-15 + 25-8+ 8-5 + 5-1 + 13-10
Итак, стоимость сырья и рабочей силы равна 492 долларам для дома в стиле ранчо, 528 долларам для дома в стиле Кейп-Код и 465 долларам для дома в колониальном стиле.
Наконец, подрядчик хочет узнать, какова общая стоимость сырья и рабочей силы, требуемых для постройки всех домов. Легко видеть, что она равняется величине xRy, которую можно найти двумя путями:
(15)
л/?у = (х/?)у = (146, 526, 260, 158, 388)
= 11 736,
10
или
/492\
xRy = х (Ry) = (5, 7, 12) • I 528 1 = 11 736.
\465/
Общая стоимость строительства равна 11 736 долларам.
15 Зак. 994,
274
Г л. V. Векторы и матрицы
Мы распространим это определение на общий случай умножения матрицы на вектор-строку или на вектор-столбец.
Определение. Пусть А—(m X л)-матрица,х— т-мерный вектор-строка и и — n-мерный вектор-столбец. Произведения хА и Аи мы определяем следующим образом:
xA = (xlt х2, ...» хт)
= (Xlall 4" -KAl + • • • 4“ xrrflmU
ап а12 ... а1п \
Ojl	^22 • • • a2n I __
к ат1 ат2 • • • атп /
х1а12 4“ х2а22 + • . . +
• • • > х1а1п 4“ х2аЪп 4“ • • • 4" хтатп)'
Ли =
аИ аЛ2 • • • а1п
#21	#22 > - - &2п
ат1 ат2 • •  атп
«1
«2
(а11и1 4“ й12 «2 4"
ОцЧ! 4" а22 42 4“
amlUl 4~ ат2и2 4“
•4-«1л«л
.4~«2лИл
Читатель научится легко обращаться с этими формулами, если заметит, что каждый элемент в произведении хА или Аи получается путем умножения вектора х или и на некоторый столбец или строку матрицы А. Отметим, что умножать вектор-строку на матрицу можно только в том случае, когда число строк этой матрицы равно числу компонент этого вектора, и что результат будет другим вектором-строкой; аналогично при умножении матрицы на вектор-столбец число столбцов этой матрицы должно равняться числу компонент этого вектора, и результат такого умножения будет другим вектором-столбцом.
Вот некоторые численные примеры умножения векторов и матриц:
/3 1\
(1,0,— 1) I 2 3 ) = (1 • 34-0 - 2—1 - 2, 1-14-0-3 — 1-8) =
\2 8/	=(Ь-7);
/3 1 2\( 1Л\ /3 —14- 4\_ / 6\ \2 3 8/\ 1 ) = \2 —34-16/ = \15/:
7 \ 2/	7	7
§ 3. Матрицы и их Комбинации С бёкТдрамй
275
Заметим, что если к — /n-мерный вектор-строка и А— (тХп)-матрица, то хА будет n-мерным вектором-строкой; аналогично если и — n-мерный вектор-столбец, то Аи будет m-мерным вектором-столбцом. Это можно было видеть и на предыдущих примерах.
Пример 2. В упр. 6 § 15 гл. IV мы рассмотрели марковскую цепь с матрицей вероятностей перехода

2 з
2
2
2
3
1
2
Начальное состояние выбиралось с помощью случайной выборки, которая выдавала каждое из состояний at и аг с вероятностью Пусть выбор начального состояния характеризуется вектором Р'0)==(у> у), где первая компонента означает вероятность выбора состояния ai, а вторая компонента— вероятность выбора начального состояния а^. Вычислим произведение р(0)Р. Мы имеем:
^р=(2 4)
2
3
2
2
2
3
2
2
м , 1 2. ।	/5 _7\
\6 т” 4 ’ 3 + 4/ —\12’ 12/
Воспользовавшись методами гл. IV, можно показать, что после одного шага вероятность того, что процесс перейдет в состояние at, равна и вероятность того, что он перей-дет в состояние аг, равнаПусть р(1)— вектор, первая компонента которого есть вероятность того, что после одного шага процесс окажется в состоянии ai, а вторая компонента есть вероятность перехода после одного шага в состояние а2. В нашем примере мы имеем
р“’Че- Й)=р<“'л
Вообще формула p(J) = р*°>Р верна для любого марковского процесса с матрицей вероятностей перехода Р и вектором начальных вероятностей р(0),
18*
276
Гл. V. Векторы и матрицы
Упражнения
1.
Произведите следующие действия: / 1 —1 \ / (а)(-2	2)(
/ 1 Ц—2
3
—1
14 2 —6
/1
(f) (0, 2, —3) • I 3 -1
\0	3
(с)
1
7
—8
9
10
—1
2
О
3
—б |
7
О
-;у
3\
—1 !=?
17
7 —8
14
10
—6
О
[Отв.: (11, —П).]
[Отв.: О, 0.]
?
9
2
7
= ?
[Отв.: (axt 4- сх2, bxt -|- dx2).]
(g) (-V1. Х2
(1 0 0 \ / U] \
О 1 0 j. I и2 j = ?
О О 17 \ us J /1 О Ох
б)	Ui> *2> *з) I 0 1 0 j = ?
\о о 17
2.	Какое число имеет свойство, аналогичное свойству матрицы в п. (i) и (j) предыдущего упражнения?
3.	Отметим, что в п. (d) упр, 1 в результате умножения вектора-строки, ни одна из компонент которого не равна нулю, на матрицу, ни одна из компонент которой не равна нулю, получается нулевой вектор-строка. Найдите другой аналогичный пример. То же самое для п. (е) упр. 1.
4.	Найдите указанные величины в тех случаях, когда это возможно.
(a) (xj, х2) ( у 3 ) =	0)' Найдите вект°Р х- [Отв.: (3, 1).]
(а Ъ\	/а Ь\
] = (6, 3). Найдите матрицу (	) •
с d J	\с а /
§ 3. Матрицы и их комбинации с векторами
277
Определяется ли в этом случае решение однозначно?
<“> (~2
Сколько решений
вы можете указать?
Г	/4Л —3\ t	1
I Отв.: и = I	,	I, где к — любое число. I
L	\ « )	J
5.	Найдите указанные ниже величины.
( 0 2\
(а) (1, —1)1	4 )= (1’ —найдите а.	[Отв.: а = 2.]
указать?
найдите и. Сколько решений вы можете
и
, где k— любое число.
(_5 -\
3 7 1\и2 ) \ /
J 8/
; найдите и. Сколько решений имеется?
6.	Используя упр. 5 предыдущего параграфа, постройте (3 X 5) -матрицу, строки которой означают соответственно различные покупки Брауна, Джонса и Смита. Умножением справа на пятикомпонентный вектор-столбец цен найдите трехкомпонентный столбец, элементы которого показывают счет, предъявленный каждому из них. Умножением слева на вектор-строку х — (1,1,1) и справа на вектор цен найдите общую сумму, из-
расходованную ими в магазине,
7. Допустим, что в примере 1 настоящего параграфа подрядчик должен построить 7 домов в стиле ранчо, 3 в стиле Кейп-Код и 5 в колониальном стиле. Пересчитайте, используя матричное умножение, общую стоимость сырья двумя различными способами, как это было сделано и в этом при-
мере.
8.	Пусть в примере 2 настоящего раздела вектор начальных вероятностей имеет вид р^ = (v» т)" Найдите вектор рЮ. Отв.: I -д-).
= (т* "т)’ Зайдите вектор р^.
9.	Пусть для марковского процесса с матрицей вероятностей перехода
вектор начальных вероятностей имеет вид р<в> —	. -g-. -g-J • Постройте
дерево логических возможностей процесса и соответствующую вероят-
278
Гл. V. Векторы и матрицы
костную меру. Вычислите р^ с помощью этой меры а также исходя из формулы р<1> = р<°>Р и покажите, что оба результата совпадают.
10.	Рассмотрим марковский процесс с двумя состояниями и матрицей вероятностей перехода
где а и b — неотрицательные числа. Предположим, что вектор начальных .	„(0) _ (М (0k	(0)
вероятностей для процесса имеет вид Р — \Pi <Рз )• где Р\ — начальная вероятность выбора состояния 1 и Р^ — начальная вероятность выбора состояния 2. Выведите формулу для компонент вектора р^.
[Отв.-. /»= {ар<°> + (1-6)^, (1-«)/0) + ^0)}.]
11.	В условиях примера 2 покажите, используя связанную с деревом логических возможностей вероятностную меру, что
р(2) = рМр.
12.	Следующая матрица показывает в надлежаще выбранных единицах содержание витаминов для трех пищевых продуктов:
Витамин:	А В С D
Продукт 1	/ 0,5	0,5	0	0 \
Продукт II	I 0,3	0	0,2	0,1 j.
Продукт III	\ 0,1	0,1	0,2	0,5 /
Сколько витаминов каждого типа мы потребляем, съедая 5 единиц продукта I, 10 единиц продукта II и 8 единиц продукта III? Предполагая, что мы платим только за содержание витаминов в каждом продукте из расчета соответственно 10, 20, 25 и 50 центов за единицу каждого витамина, найдите стоимость единицы каждого типа продуктов. Подсчитайте двумя способами общую стоимость принятой нами пищи.
/15\
Отв:. (6,3; 3,3; 3,6; 5,0); 113 1; 4,69 доллара.
\33/
§ 4. СЛОЖЕНИЕ И УМНОЖЕНИЕ МАТРИЦ
Две матрицы одного и того же размера, иначе говоря с одинаковым числом строк и одинаковым числом столбцов, могут быть сложены путем сложения их соответствующих компонент. Например, если А и В — две (2 X 3) -матрицы, то
#11 а12 а13 \ । / &11 ^12 ^13
#21 °22 ^23 /	\ ^21 ^22 ^23
#11 + &П а12 4“ ^12 #13 + ^13
#21	^21 а22	^22 ^23 4“ ^23
§ 4. Сложение и умножение матриц
279
Заметим, что сложение векторов (строк или столбцов) является частным случаем сложения матриц. Вот численные примеры сложения матриц:
	(1,	0, -	-2) + (0,		5, 0) =		= (Ъ	5,	-2);	
		/1 \0	Э\ ( — 1 1/4д о		0\_ —1/		о о о о II		' >	
7	0	0		—8	0	1		—1	0	1
-3	1	—6		4	5 —1			1	6	—7
4	0	7	-I-	0	3	0	=	4	3	7
0	—2	—2		—1	1 —1			—1	—1	—3
1	1	1		0 -	-4	2		1	—3	3
Другие примеры даны в упражнениях. Обращаем внимание читателя на то, что матрицы неодинакового размера складывать нельзя.
Если А — матрица и k — любое число, то произведение kA числа k на матрицу А мы определяем следующим образом:
kA = k
(<ZU «12 «21
«In «22 • - • «2л
!kan ka^i
\ ^ml am2 • • • ^mn
\kaml
^«12 • • • kCL^n ^«22 • • • ka^n
kdm2 • • • kumn
Заметим, что это просто покомпонентное умножение, уже встречавшееся нам при изучении векторов. Дадим примеры умножения матриц на число:
Умножение вектора на число является частным случаем умножения матрицы на число.
При некоторых условиях две матрицы могут быть перемножены, в результате чего получается некоторая новая матрица-
280
Гл. V. Векторы и матрицы
Пусть, например, А — (2 X 3)-матрица и В—(3 X 2)-матрица, Тогда произведение АВ определим так:

ап а12 а13
^21 0^22 ®23
/ anbn -f-ai2b21 + ^13^31 \ а21^11 “Ь а22^21 4“ а23^31
#11^12 “Ь #12^22 Н- а13^32 \ й21^12 + й22^22 + a^Sl )
Заметим, что это произведение является (2 X 2) -матрицей. Отметим также, что каждый элемент новой матрицы равен произведению одной из строк матрицы А на один из столбцов матрицы В; например, элемент, который стоит во второй строке и первом столбце, будет произведением
(#21 а22 ®2з)
I ^П\
I ^21 I = fl21^11 ~Ь ^22^12 + fl23^13’
\Й13/
В общем случае умножение матриц определяется следующим образом:
Определение. Пусть А—(m X k)-матрица и В — (k X п) -матрица; тогда матрица-произведение С = АВ есть (m X п) -матрица, компоненты которой равны
Clj — (ЙЛ а12 • • • alki
В этом определении важно обратить внимание на следующее: во-первых, умножение матрицы А на матрицу В возможно только в случае, если число столбцов матрицы А равно числу строк матрицы В; во-вторых, матрица-произведение С — АВ имеет то же число строк, что и Л, и то же число столбцов, что и В; наконец, элемент матрицы АВ, стоящий в z-й строке и j-м столбце, получается умножением i-й строки А на j-й столбец В. Заметим, что произведение вектора на матрицу является частным случаем умножения матриц.
§ 4. Сложение и умножение матриц
281
Приведем численный пример
’3 1 4\
2 0 5/
1 3 О О\
1 1 О О] = .0 0 11/
3-1+Ь1+4-0
2-1+0-1+5-0
3-3+1-1+4-0 3-0+1-0+4-1 3-0+1-0+4-1\
2-3+0-1+5-0 2-0+0-0+5-1 2-0+0-0+5-1/
4
2
10 4 4\
6 5 5/
Вот еще несколько примеров умножения матриц:
/2 —1\ /7 0\ / 16	3\
\0	3/\— 2 —3/	6 —9/
3 0 1\ /1	0 0\ / 4	1 1\
—1 2 0 ]•( 0 —1 0 1 = 1 -1 —2 0 1:
О 0 2/ \1	117X2	227
3 о 0\
10 0]
О 1 1/
4 10 4 4\
2 6 5 5/
Квадратная матрица n-го порядка
1 0 ... О О
О 1 ... О О
О 0 ... О 1
у которой элементы Оц, стоящие на «главной диагонали», равны 1, а остальные элементы — нули, обладает следующим свойством:
1А = А для любой (п X tn) ‘матрицы А, AI = А для любой (m X п)-матрицы А
(см. упр. 2). В частности, AI = IA = А для любой квадратной матрицы порядка п; и! = и для любого n-мерного вектора-строки и и 1х = х для любого n-мерного вектора-столбца х. Таким образом, в матричном умножении матрица I играет ту же роль, что и 1 при умножении обычных чисел. Такую матрицу I мы будем называть единичной.
Точно так же нулевая матрица (йе обязательно квадратная) О, все элементы которой равны 0, обладает тем свойством, что
2'82
Г л. V. Векторы и матрицы
АО = О или ОА = О или и то и другое вместе в зависимости от того, какое из произведений имеет смысл (см. упр. 4—6). Например, если А есть (2 X 3)-матрица, а О — нулевая (3 X 4)-матрица, то АО будет нулевой (2 X 4)-матрицей.
Теперь, естественно, встает вопрос о перемножении более чем двух матриц. Пусть А — (тХ Л'-матрица, В — (hX ^-матрица и С— (k X п) -матрица. Тогда мы можем, конечно, определить произведения (АВ) С и А(ВС). Оказывается, что эти два произведения равны. Это их обшее значение мы полагаем по «определению равным АВС, т. е.
АВС = А (ВС) = (АВ) С.
Правило, выраженное этим равенством, называется ассоциативным законом для умножения матриц. Мы не будем здесь доказывать этот закон. В упр. 8—9 читателю предлагается проверить его на частных примерах.
Если А и В — квадратные матрицы одинакового порядка, то можно умножить как А на В, так и В иа А. Однако неверно, что произведение АВ обязано быть равным произведению ВА. Например, если
л Ц « Z1 °\ л~\о О/ и В \1 о/
•то мы имеем
_/1 1\/1 0\_/2 0\
0/\1 0/ \0 О/
тогда как
/1 0\ /1 1\	/1 1\
0/\0 0/ \1 U
и, очевидно, АВ ВА.
Упражнения
Оте.:
О —4\
О —9 I.
13	7/ .
§ 4. Сложение и умножение матриц
283
2.	Пусть А—любая (3 X 3)-матрица и пусть I — единичная матрица-
,1 о О\
/=( о 1 о I.
\о о 1/
Проверьте, что AI = IA = А
3.	Постройте такую квадратную матрицу третьего порядка С, чтобы для любой квадратной матрицы третьего порядка А было справедливо равенство СА = 34.
4.	Пусть А — (3 X 3)-матрица и пусть О — нулевая матрица:
(О 0 0\
ООО].
ООО/
Проверьте, что АО = ОА = О при любой матрице А. Покажите также, что А + О= О+ А= А при любом А.
5. Докажите, что
О 0 Ох /0\ ООО ]х = | о ] ООО/ \о/
при любом трехмерном векторе-столбце х.
6.	Докажите, что
(О 0 0\
О О О ] == (О О 0) ООО/
для любого 3-мерного вектора-строки и.
/О 0\ о И ®\	„ /о
7,	Покажите, что если = у q 1 / И ~ \О 0 /' Т° && ~ \0 0/' "^а" ким образом, произведение двух матриц может быть нулевой матрицей, даже если ни одна из перемножаемых матриц не является нулевой матрицей. Найдите другой пример, иллюстрирующий то же обстоятельство,
284
Гл. V. Векторы и матрицы
8-	Известно, что умножение матриц подчиняется приведенным ниже алгебраическим законам, (Мы каждый раз предполагаем, что размеры матриц таковы, что все перечисленные операции имеют смысл.)
(1)	(Л-|В)С = АСВС, (2) А (В + С) = АВ + АС,
(3)	(сЛ) В = с (АВ) = А (сВ),
(4)	Л (ВС) = (АВ) С (ассоциативный закон для умножения матриц). Убедитесь в справедливости этих утверждений на примере следующих квадратных матриц 2-го порядка:
и числа с = '/г
9.	Проверьте ассоциативный примере:
л = Г“1 °
\ 7-20/’
закон для
/ 1
В = 1 —3
\ 1
умножения матриц на следующем
10.	Рассмотрим матрицы
( 1 ° В
\—1 17 57 /
1 1 1
2 2 2
3 3 3
ООО
/10—1\	/ —1 —1 \
С = 1 0—1 1 ], Г>=1 2 21.
\— 1 1 0/ X 1 1/
Эти матрицы имеют размеры 2x3, 4X3, 3X3 и 3X2 соответственно. Определите размеры следующих матриц:
(а) АС,
(b) DA,
(с) AD,
(d) ВС,
(е) СВ,
(f) DAC,
(g) ВС DA,	[Ome.: 4X3.]
11.	В условиях упр. 10 найдите:
(а)	компоненту, стоящую во второй строке и втором столбце матрицы АС;	[Оте.: 40.]
(Ъ)	компоненту, стоящую в четвертой строке и пятом столбце матрицы ВС;
(с)	компоненту, стоящую в последней строке и последнем столбце матрицы DA;	[Оте.: 58.]
(d)	компоненту, стоящую в первой строке и первом столбце матрицы СВ.
12.	Если А — квадратная матрица, то ее можно умножать саму на себя; следовательно, мы можем определить (используя ассоциативный закон)
Л2 = Л  Л,
Л3 = Л2 • Л = Л • Л • Л,
Л" = Л" 1 • Л = Л • Л ... Л (п сомножителей).
§ 4. Сложение и умножение матриц
285
Эти матрицы естественно называть «степенями» матрицы А, первую из них — квадратом, вторую — кубом и т. д. Вычислите указанные степени следующих матриц:
найдите А2, А3 и А4.
Отв.-.
1
15
%: ( 1 ’И 1 °11 16/ \63 61/ \2S5 25б/ J
(b) 1 и О — матрицы, определенные в упр. 2 и О2, О3 и О".
/О 0 0\
(с) А = j 1 О 0 |; найдите А2, А3 и Л”.
\2 —1 О/
4: найдите /2, /3, /",
найдите Ап.
13, Возведите в куб матрицу
О
О
2 £
3
Сравните полученный ответ с матрицей Р® примера 1 § 15 гл. IV и объясните этот результат.
14.	Рассмотрим марковский процесс с двумя состояниями и матрицей вероятностей перехода
(а)
(Ь)
(с)
(d)
/Ри \Р21
Р12
Рг2
Предположив, что этот процесс начинается из состояния 1, постройте дерево, отвечающее трем стадиям процесса, и определите вероятностную меру. Сделайте то же самое в предположении, что процесс начинается из состояния 2.
Используя деревья, построенные в п. (а), найдите величины pj]! P12> Р21 и Ри- Выпишите матрицу Р^3>.
Найдите куб Р3 матрицы Р.
Сравните ответы, полученные в п. (Ь) и (с), и покажите, что

15.	Покажите, что все степени матрицы
О I 0\ 0 0 11, 1 1 о/
начиная с пятой, содержат одни положительные элементы. Покажите, что этим свойством не обладает никакая меньшая степень той же матрицы.
286
Гл. V. Векторы и матрицы
16.	Пусть в примере 1 § 3 наряду с покупной ценой сырья подрядчик хочет учесть также цену перевозки сырья к строительному участку. Предположим, что эти цены задаются следующей матрицей Q:
Продажная цена Транспорт
	15	4,5	Сталь
	8	2	Лес
Q =	5	3	Стекло
	1	0,5	Краска
	ю	0	Рабочая сила.
В условиях этого примера:
(а) вычислив произведение RQ, найдите (3 X 2)-матрицу, элементы которой представляют собой покупные цены и цены перевозки материалов для каждого типа домов;
'(b) найдите произведение xRQ, являющееся двухкомпонентным вектором-строкой, первая компонента которого дает общую покупную стоимость, а вторая компонента дает общую стоимость перевозки;
'(c) Пусть г = Qj. Вычислите xRQz, т. е. общую стоимость материалов и перевозки для всех подлежащих постройке домов.
[Отв.: 14304 доллара.]
17	Пусть в одном учебном заведении зачеты, сдаваемые студентами, распределяются следующим образом: первокурсники сдают в течение года один зачет по дисциплине естественно-научного цикла и один зачет по дисциплине математического цикла; второкурсники сдают один зачет по дисциплине естественно-научного цикла, три зачета по дисциплинам математического цикла и одни зачет по бихевиористской дисциплине’); каждый студент третьего курса сдает три зачета по дисциплинам естественно-научного цикла, два зачета по дисциплинам математического цикла и два зачета по бихевиористским дисциплинам; наконец, каждый студент последнего — четвертого — курса сдает три зачета по бихевиористским дисциплинам. Известно, кроме того, что каждый зачет по дисциплинам естественно-научного цикла требует изучения трех книг, выступления с двумя докладами, выполнения двух домашних заданий и одной контрольной работы; каждый зачет по дисциплине математического цикла требует изучения пяти книг, выступления с четырьмя докладами, выполнения одной домашней работы и трех контрольных работ; каждый зачет по бихевиористской дисциплине требует изучения одной книги, выступления с четырьмя докладами и выполнения четырех контрольных работ; кроме того, мы полагаем, что изучение каждой книги требует 50 часов работы, подготовка к докладу (и выступление с ним) — 15 часов, выполнение домашней работы —10 часов, подготовка к контрольной работе и ее выполнение — 5 часов (все эти данные, разумеется, являются довольно фантастическими). Предполагая, что в учебном заведении имеется 500 первокурсников, 400 второкурсников, 300 третьекурсников и 200 выпускников:
’) См, подстрочное примечание на стр. 11.
§ 5. Системы линейных уравнений
28?
(а)	найдите общее число зачетов, сдаваемых в течение года по дисциплинам естественио-научиого цикла, математического цикла и по бихевиористским дисциплинам;
(Ь)	найдите общее число условий разного вида (число изученных книг, прочитанных докладов, выполненных заданий и контрольных работ), необходимых для сдачи зачетов всеми студентами;
(с)	найдите количество часов работы, необходимое для сдачи зачета по дисциплине естественно-научного цикла, математического цикла и по бихевиористской дисциплине;
(d)	двумя способами найдите общее число часов, затрачиваемое за год иа учебу всеми студентами.
§ 5. СИСТЕМЫ ЛИНЕЙНЫХ УРАВНЕНИЙ
В этом параграфе мы разовьем эффективный общий метод, позволяющий определять, имеет ли данная система линейных уравнений по крайней мере одно (общее) решение, и вычислять все возможные решения, если только они существуют. Метод, о котором мы собираемся рассказать, пригоден для произвольной системы линейных уравнений и удобен как при расчетах вручную, так и при вычислениях, производимых с помощью вычислительной техники.
Линейное уравнение
aixi ~Ь а2х% -ф- апхп == tp
мы запишем в следующем виде:
(ах, а^2.ап) х~ти,
где х —
х2
— вектор-столбец, или в еще более сжатой форме,
х3
обозначая через и вектор-строку (ai, а2,..,, ап),
(1)
UX = W.
Это уравнение представляет собой предикат в смысле § 4 гл. 11. Пространство логических возможностей для этого предиката состоит из всевозможных n-мерных векторов-столбцов, а множество истинности (которое в геометрии Иногда называют геометрическим местом) уравнения (1) состоит из всех решений этого Уравнения. При П = 2 множество всех решений этого уравнения называется прямой, при п = 3 — плоскостью и при л > 3— ей* Пер-Плоскостью.
288
Гл. V. Векторы и матрицы
Рассмотрим теперь систему линейных уравнений
ЩХ~Т0ъ
(2)	«2^ = ®’2>
«mx = wm.
Здесь у нас есть m предикатов. Обозначим множество истинности каждого из них соответственно через Sb S2, . . . , Sm. Теперь если нам надо найти общие решения для этой системы, то нам нужно просто построить множество истинности для конъюнкции всех этих предикатов. Как было показано в гл. II, для этого нужно построить пересечение
5 = Sj Г) s2 Г) S3 П ... П Sm
Множеств истинности отдельных предикатов.
В связи с тем что нам нужно определить множество истинности конъюнкции всех этих высказываний (уравнений), в системе (2) мы можем заменять эти высказывания другими, конъюнкция которых эквивалентна конъюнкции первоначальных высказываний. Другими словами, мы можем заменить эти высказывания такими, которые не изменят множество истинности их конъюнкции. Метод решения системы линейных уравнений, который мы собираемся изложить, заключается в следующем. Шаг за шагом мы будем заменять одну систему предикатов другой, эквивалентной ей системой с тем, чтобы после конечного числа шагов прийти к такой системе, множество истинности которой является очевидным. Это множество истинности должно полностью совпадать с множеством истинности исходной системы и может быть (а) пустым, если система уравнений не имеет общих решений; (Ь) содержать единственный элемент, если решение системы уравнений является единственным, или (с) содержать бесконечное множество решений. Приведенные ниже примеры демонстрируют каждую из этих возможностей.
Мы будем развивать этот метод прежде всего на конкретных примерах. Рассмотренная в примере 1 система имеет единственное решение, рассмотренная в примере 2 система — бесконечное множество решений, а рассмотренная в примере 3 система решений не имеет вовсе. Перечисленные здесь три ситуации являются единственно возможными, поскольку (как мы увидим в дальнейшем) из существования двух различных решений системы линейных уравнений следует и существование бесконечного множества ее решений.
§ 5 Системы линейных уравнений
289
Пример I. Рассмотрим следующие три линейных уравнения с тремя неизвестными:
(1)	Xj-i-4x2-|-3jC3=l,
(2)	2Х] + 5^2 + 4х3 = 4,
(3)	Xi — Зх2 — 2х3 = 5.
Эти уравнения можно записать в следующей форме: ихх — 1, «2х = 4, «Зх = 5,
/ ХЛ
где «j = (1, 4, 3), «2 = (2. 5, 4), я3 = (1, —3, —2),	х2 I,
\х3/ или даже в виде одного уравнения:
/1	4	3\ /хЛ	/Ц
I 2	5	4 j I х2 j = ( 4 I.
\1 —3 —2/ \xj	\5/
Одно из достоинств векторных и матричных обозначений заключается в том, что с их помощью можно записать большое число линейных уравнений в виде одного простого уравнения, подобного только что написанному.
Решать нашу систему линейных уравнений мы будем следующим методом. Сначала исключим переменную хг из уравнений (2) и (3), воспользовавшись для этого уравнением (1), для чего из (3) вычтем (1), а из (2) вычтем (1), предварительно умножив его на 2; в результате получим: (1')	xt	4х% + Зх3 = 1,
(2')	— 3x2 — 2х3 = 2,
(3')	— 7х2 — 5х3 = 4.
Разделив затем уравнение (2') на коэффициент при х2, т. е. на — 3, получим: х2 Ч-у х3 =— -д-. Воспользуемся этим уравнением для исключения х2 из двух других уравнений. Для этого умножим его на 4 и вычтем из (1'), а также умножим на 7 и сложим с (3'); мы получим:
1	11
(1")
(2")
(3")
, 2	_	2
х2 "Т" 3X3 	“д’»
2	.	- _ 1
3	Х3 —	-3 .
19 Зак. 994.
290
Гл. V. Векторы и матрицы
Наконец, разделим (3") на —т. е. на коэффициент при %з, и придем к уравнению х3 = 2; воспользуемся им для исключения х3 из первых двух уравнений:
(1'") (2'") (3'")
Xj —|— 0 4- 0 — 3, х2 —Н 0 = — 2, . х3 = 2.
Из этих уравнений сразу видно искомое решение: Xj = 3, х2 = —2 и х3 = 2 Для проверки правильности решения читатель должен подставить эти значения в первоначальные уравнения (1), (2), (3).
Пример 2. Рассмотрим следующую систему:
(4)	хх — 2х^ — Зх3 = 2,
(5)	Xj — 4х2 — 13х3 = 14,
(6)	— 3xi + 5х2 + 4х3 — 0.
Как и в предыдущем примере, воспользуемся первым из этих уравнений для исключения переменной xj из двух других уравнений. Имеем:
(4х)	Xj — 2х2 — Зх3 = 2,
(5х)	— 2х2 — 10х3 —12,
(6х)	— х2 — 5х3 = 6.
Действуя, как и раньше, разделим уравнение (5х) на —2 и получим уравнение х2 + 5х3 = —6. Воспользуемся им для исключения переменной х2 из двух других уравнений, а именно умножим его на 2 и сложим с (4х), после чего сложим его с (6х):
(4ХХ)	^ + 0+7x3 = -10,
(5")	х2 + 5х3 — —6,
(6")	**	0 = 0.
Обратим внимание на то, что мы полностью исключили последнее уравнение. Кроме того, мы видим, что переменной х3 в этих уравнениях можно придать какое угодно значение. Чтобы подчеркнуть это, перенесем члены, содержащие х3, в правую часть:
(4ХХХ)	х,=—10-7х3,
(5ХХХ)	х2 = - 6- 5х3.
§ 5. Системы линейных уравнений
291
Читатель должен проверить, подставляя полученные значения X] и *2 в уравнения (4), (5) и (6), что они являются решением при любом хз. Чтобы получить числовое решение, нужно подставить вместо х3 какое-нибудь число. Так, если мы положим Хз = 1, 0, —2 и произведем вычисления по формулам (4) и (5), то получим соответственно следующие числовые решения:
Х! = —17, Xj = —И, х3=	1,
Xj — — 10, х2 = — 6, х3 — 0, xt =	4,	х2 =	4,	х3 =— 2.
Читателю рекомендуется подставить все эти числа в (4), (5) и (6) для проверки того, что они образуют решение.
Итак, система уравнений в нашем втором примере имеет бесконечное множество решений, соответствующих разным числовым значениям Хз в уравнениях (4'") и (5'")
Пример 3. Изменим уравнение (6), поставив в его правой части вместо числа 0 число 2. Будем иметь:
(7)	хг — 2х2 — Зх3 — 2,
(8)	X] — 4Хз — 1 Зх3 =14,
(9)	— 3xj —|— 5х2 —|- 4х3 = 2.
Выполнив прежнюю процедуру исключения Xi из (8) и (9) посредством (7), мы получим:
(7')	хх — 2л2— Зх3 = 2,
(8')	— 2х2 — 10х3 =12,
(9')	— х2— 5х3 = 8.
Разделив (8') на —2 (коэффициент при х2), получим, как и раньше, х2 + 5х3 = —6. Воспользовавшись этим уравнением для исключения х2 из двух других уравнений, будем иметь:
(7")	x1H-0+7x3 = —10,
(8ff)	х2 -ф- 5х3 = — 6,
(9")	0=	2.
Мы видим, что последнее уравнение заведомо ложно. Так как наша процедура исключения неизвестных привела к ложному результату, мы приходим к выводу, что система уравнений (7), (8), (9) не имеет решения. Читатель должен всегда иметь в виду эту возможность при рассмотрении системы уравнений.
19*
292
Гл. V. Векторы и матрицы
В этих примерах число неизвестных было равно числу уравнений В следующем примере число уравнений меньше числа неизвестных, а в последнем примере — больше.
Пример 4. Рассмотрим такие два уравнения с тремя неизвестными;
(10) (11)	— 4xi Н~ Зх2 —]- 2х3 — — 2, 5xi — 4х2-р х3= 3.
Используя описанный выше метод исключения, разделим (10) на —4, умножим результат на 5 и вычтем из (11), что даст:
(ЮЭ	3 _ 1 —1 Xi	х2	х3 — 2 •
(П')	1 д.2. —1 4 -Л-2 "т" 2	2 ’
Умножим (11*) на —3 и сложим с (10'), после чего умножим (1Г) на —4. Тогда будем иметь:
(10") (И")	XiНН 0 — 11 *^з ““ — 1 * х2— 14х3 = — 2.
Мы можем теперь, придавая х3 любое значение, разрешить эти уравнения относительно Xi и х2. Чтобы подчеркнуть этот факт, перепишем их, следуя схеме, использованной в примере 2, так;
(10"') (11"')	X} 11 Xg 1 , х2= 14х3— 2.
Читатель должен произвести проверку, а также найти численное решение этой системы, выбирая частные значения для Хз.
Пример 5. Пример 4 наводит нас на мысль о возможности еще одного случая, когда число уравнений больше числа неизвестных. Рассмотрим следующую систему;
(12) (13) (14)	— 4X1 -j- Зх2 = 2, 5X1 — 4х2 = 0, 2xi— х2 = а,
§ 5. Системы линейных уравнений
293
где а — произвольное число Воспользовавшись уравнением (12) для исключения xt из двух других уравнений мы получим:
(12')	3	1 *1 —*2 = —у >
(13')	1 _	5 4 Х2~	2 ’
(14')	1	1	1 ~2	— Л + 1 •
Затем воспользуемся (13') для исключения х2 из остальных уравнений, что даст
(12")	Xj + 0 = —8, •
(13")	^ = - 10,
(14")	0 = а+6.
Эти уравнения напоминают случай, с которым мы встретились в примере 3, поскольку в случае, если не будет выполнено условие а = —6, мы придем к ложному результату Мы видим, что система уравнений (12), (13) и (14) имеет решение xj — —8 и х2 — —10, если а = —6. Если же —6, то система уравнений не имеет решения.
Рассмотренные примеры иллюстрируют все возможности, которые могут встретиться в общем случае. Система уравнений может не иметь ни одного решения, может иметь в точности одно решение и может иметь бесконечное число решений.
Использованная нами процедура позволяет преобразовать любую систему линейных уравнений в такую эквивалентную исходной систему уравнений, для которой уже легко решить вопрос как о существовании решений, так и об их вычислении. Читатель, знакомый с другими способами решения систем линейных уравнений, может задать вопрос: почему мы воспользовались именно этой процедурой, которая вовсе не всегда приводит к решению кратчайшим путем? Ответ на этот вопрос заключается в следующем: мы воспользовались ею, потому что она действенна во всех случаях, т. е. является канонической процедурой, применимой к любой системе линейных уравнений. Более быстрые методы обычно применимы лишь к таким системам уравнений, для которых существуют решения, и Даже в этом случае они могут не приводить к нахождению всех решений. А значение надежного стандартного метода, в особенности при вычислениях, использующих современные счетные машины, трудно переоценить.
294
Гл. V. Векторы и матрицы
Упражнения
1. Найдите все решения следующих систем уравнений:
(а)
(Ь)
(с)
4х( + 5х3 = 6, х2 — 6х3 = — 2, ЗХ] -|- 4х3 = 3;
Зх । — х2 ~— 2х3 ~ - 2, 2х2 — х3 =	1 >
Зх! — 5х2	= 3;
— Х| -|~ 2х2 -|~ Зх3 = О, х1 — 4х2 — 13х3 = О, — Зх[ -j- Зх2 -j- 4х3 = О.
[Отв.: Xi = 9, х2 = — 38, х3 = — 6.]
[Отв.: Решений нет.]
[Отв.: Х| = — 7х3, х2 = — 5х3.]
2.	Найдите все решения следующих систем уравнений:
(а)	Xi Х2 “Ь АГз — 0, —J— Зхд = 0, 4х2 -|- 4х3 == 0;
(Ь)	Х2+ Х3 = —2, 2xj -j- 4х2 + Зх3 = 3, 4х2 2х3 == 2j
(с)	со со* 1 m II 11 II СО СО .со 3 £ £ + 1 1 ч ч* + rf	со
3.	Найдите числа хь х2 и х3, которые служат решением системы уравнений, указанной в упр. 1 (с), и одновременно удовлетворяют следующему нелинейному уравнению:
X] (2х2 — 5х3) = 1.
4.	Найдите все решения следующих систем уравнений:
(а)
5Х] — Зх2 = — 7, — 2х] + 9х2 = 4,
2х| 4* 4х2 = — 2;
17	2
Отв.: х, =-----х2 = — .
(Ь) | Xi 2х2 — 1,
{ —	-|- 2х2 = — 2,
I 2xi4-3x2 = l;
[Отв.: Решений нет.]
(с)
5х, — Зх2 — 7хр 4- х4 = 10, — х^ 4~ 2х2 —j ' 6х3 — Зх4 —— — 3, х( + х2 + 4х» —г 5х4 = 0.
§ 5. Системы линейных уравнений
293
5.	Покажите, что система уравнений
— 4х, 4- Злг2 + ах3 = с,
5Xj — 4х2 -j- bx3 = d
имеет решение при любых значениях а, Ь, с и d.
6.	Какое условие нужно наложить на а, Ь и с, чтобы система уравнений
— 4х| 4~ Зх2 == а,
5xj — 4х2 = Ь,
— 3 Vj 4" 2х2  с
имела решение.	[Отв.: 2а 4 6 = с.]
7.	(а) Пусть х = (*i, х2) и пусть А означает матрицу
Найдите все решения уравнения хА = х.	[Отв.: х= (0,0).]
 (Ь) Пусть х— (xt,x2) и А означает матрицу
л = ( 3 6).
\—2 —5/
Найдите все решения уравнения хА — х.
[Отв.: х = (k,k), где k — любое число]
8.	Пусть х =•* (хь х2) и Р означает матрицу
С1 2\
3 з\
4	1 /
5	5 J
(а)	Найдите все решения уравнения хР = х.
(Ь)	Укажите решение, для которого х, 4 х2 = 1.
9.	Пусть х = (xit х2, х3) и А означает матрицу / 1 —2	0	\
>4 = 1 0	5	4	),
\0 —6 —4/
Найдите все решения уравнения хА = х.
|Ътв.: х = (—у Л, ^k, k
10.	Пусть х — (Xi, х2, х3) и Р означает матрицу
У где k — любое число.
111
3 3 3
Найдите все решения уравнения хР — х. Укажите единственное решение, ДЛЯ КОТОРОГО Х1 + х2 + х3 = 1,
296
Гл. V. Векторы и матрицы
11.	Найдите все решения системы
Ху 2х2	”t~ 4х( = 10.
2Ху — %2 “Н *^з —	== Е
Зх, -1— х% -}- 4лд Зл< = 11. — 2%i + 6л2 -|- 4%3 + Юл 4 = 18.
12.	Допустим, что мы закупаем три вида пищевых продуктов. В продукте I содержится одна единица витамина А, три единицы витамина В и четыре единицы витамина С. В продукте II содержатся соответственно две, три и пять единиц этих витаминов. В продукте III содержится по три единицы витаминов А и С, а витамин В отсутствует. Нам нужно иметь 11 единиц витамина А, 9 единиц витамина В и 20 единиц витамина С. (а) Найдите все возможные комбинации количеств этих трех продуктов, которые обеспечивают нас требуемым количеством витаминов.
(Ь) Если единица продукта I стоит 60 центов, а единица каждого из остальных продуктов стоит 10 центов, то существует ли решение, при котором требуемое количество продуктов стоит ровно 1 доллар?
[Отв.: Да; 1, 2, 2]
§ 6. ОБРАТНАЯ МАТРИЦА
Если А — квадратная матрица и В — другая квадратная матрица того же порядка, обладающая тем свойством, что АВ = I (где I — единичная матрица), то В называется матрицей, обратной к А. Матрица, обратная к А, если она существует, обозначается символом Л"1. Чтобы получить числовой пример, рассмотрим следующие матрицы А и Л-1:
/4 0
Л = ( 0 1
\3 0
Тогда
/40
д-1Л = 1-18 1
\— 3 0
5\	/4
—6 1, Л-1 = ( —18
4/	\- 3
— 5\ /4 0
24 | • I 0 1
4/ \3 0
5\
5 /
4.'
0 — 5\
1	24 I.
0	4/
1 0 0 X
О 1 о ) = /.
0 0 1/
Если перемножить эти матрицы в другом порядке, то в результате снова получится единичная матрица:
/4	0	5\ / 4	0	- 5\ /1	0	0\
ДД-1 = |о	1	-6 |( -18	1	24 1 = 10	1	0 ) = /.
\3	0	4/ \ - 3	0	4. \0	0	1 /
§ б. Обратная матрица
297
Можно показать, что и в общем случае если А — квадратная матрица, и А~1— обратная ей матрица, то
А~'А = АА~1 = 1.
Легко видеть, что квадратная матрица может иметь только одну обратную. В самом деле, пусть, кроме А~1, имеется еше матрица В, такая, что ВА = /. Тогда мы имеем
В = В1 = В (ЛЛ-1) = (В А) А~х = 1А~' = Л"1-
Нахождение обратной матрицы аналогично нахождению обратного для данного числа. Однако эта аналогия не является полной. Для каждого числа, отличного от нуля, имеется обратное к нему число, в то время как существуют ненулевые матрицы, для которых не существует обратных. Например, если
то
Отсюда следует, что ни А, ни В не могут иметь обратной матрицы. Чтобы доказать это, предположим, что для А существует обратная матрица Л-1. Тогда
В = (Л-1Л) В = Л"1 (АВ) = Л-1 • О = О,
что противоречит условию В±О. Аналогично доказывается, что не существует матрицы, обратной к В.
Попытаемся вычислить матрицу, обратную к (2 X 2)-матрице Л, т. е. найдем, каким условиям должна удовлетворять матрица В, чтобы выполнялось равенство BA = I. Допустим, что
J /1	0 \ _/ &11	Ьх2 \	fa\l	а12 \__
\ 0	1 J	\ Ь2Х	Ь22 /	\ &21	®22 /
/ ЬХХЛХХ -4~ ^’12<121 ^Па12 “Ь ^12°22 \
\ ^21^11 + ^22°21 ^21^12 + Ь22а22 J
Для выполнения этих равенств необходимо, чтобы удовлетворялись следующие уравнения:
(1)	= 1,
(2)	^па12+ЬцОя — О,
(3)	^2iaii + Ь22а2Х — О,
(4)	Ь2хах2 + Ь22а22 = 1,
298
Гл. V. Векторы и матрицы
В этих уравнениях числа b должны рассматриваться как неизвестные, а числа а как коэффициенты Неизвестные &ц и bi2 входят только в уравнения (1) и (2), а неизвестные 62i и Ь22— только в уравнения (3) и (4). Чтобы исключить неизвестное bi2 из уравнений (1) « (2), умножим уравнение (1) на а22, а уравнение (2) на a2i, что даст нам
^11^11^22 “Е ^12^21^22--^22’
ЙцЛ12^21 “Ь ^12^22^1 ~ 0.
Вычитая второе уравнение из первого, получим: Ьц (^11® 22 ^12^21) == ®22-
Если коэффициент при Ьц в этом уравнении не равен нулю, то можно разделить на него обе части и получить &ц в виде:
Ьп =------.
ellfl22-Я21а12
Аналогичным образом и остальные неизвестные можно выразить посредством формул:
й12=------=£1*----,
а11^22 ^21^12
bи=-------,
flllfl22-fl21a12
b — а“
22	ана22— a2lal2
Отметим, что знаменатель во всех последних формулах один и тот же. Эта величина является настолько важной, что ей дали специальное название — определитель матрицы А. Определитель матрицы А записывается так:
ап ап
«21	®22
--<Зц«22----
Таким образом, для обозначения определителя используются прямые вертикальные линии, тогда как матрица обозначается посредством круглых скобок.
Вот числовые примеры определителей:
§ б. Обратная матрица
299
Мы ввели понятие определителя только для (2 X 2) -матриц. Можно распространить его и на случай квадратных матриц более высокого порядка, но мы этим заниматься не будем.
Заметим, что мы можем находить обратную матрицу лишь в случае, когда определитель заданной (2 X 2) -матрицы не равен нулю. Используя полученные выше формулы, мы находим, что
обратной к матрице
3
является матрица
1
2
2
Для проверки этого достаточно умножить А на Л*1:
1 2\ (“~2	1 _/1 0\
3 4/ -J —	\0 1/
/ 1 —1\
С другой стороны, определитель матрицы I _1 равен ну-
лю, поэтому рассмотренные выше уравнения не могут быть решены и для этой матрицы не существует обратной. Аналогичное обстоятельство справедливо и в общем случае, так что может быть высказана следующая
’Теорема. Для того чтобы квадратная матрица имела обратную, необходимо и достаточно, чтобы определитель этой матрицы был отличен от нуля.
Эта теорема верна также для квадратных матриц более высокого порядка, но мы ее доказывать не будем.
Упражнения
1.	Найдите определители следующих (а) /1 6\.
\0 1/’ [Отв.: 1.]
(Ь)/1 0\
\0 1?
(с) /0 1\.
\1 0/ [Оте.: —1.]
(d)/0 1\.
\1 6?
матриц:
(е)
(О
(g)
/2 —3\.
\4 —б)’ [Отв.: 0.]
/ 2	2\
\—4 —4Д
Г1 %
\ 2 7) [Отв.: —13.]
300
Гл. V. Векторы и матрицы
2.	Для матриц, выписанных в упр. 1, найдите обратные матрицы в тех случаях, когда это возможно. Проверьте правильность ваших вычислений.
3.	Пусть А — квадратная матрица, имеющая обратную. Покажите, что решением уравнения Ах = b является х ** А~'Ь.
4.	Используя результат упр. 3, решите систему уравнений
+2j«2 = 1, ЗЛ] -|- 4х2 = 2.
(Указание. Обратная матрица была найдена в тексте этого параграфа.)
6. Пусть А — одна из матриц упр. 1 и пусть х
Ome.: xt = 0, х2 == . J j и b = f . Используя
обратные матрицы, найденные (в тех случаях, когда они существуют) в упр. 2, решите уравнение Ах = b (см. упр. 3).
6.	Пусть ab — cd=£ 0. Найдите матрицу, обратную к
7.	Пусть А — матрица из упр. 6 и пусть
Используя обратную матрицу, найденную в упр. 6, решите систему Ax—f.
8.	Пусть А — квадратная матрица, имеюшая обратную Л-1; покажите, что матрицей, обратной к А2, является матрица [Л-1]2 = Л-2. Покажите, что матрицей, обратной к А", является [Л“,1" = -Л "•
9.	Решите систему уравнений:
4х -|- 5г =7, у —6г = 2,
ЗлгЦ- 4z = — 1,
записав ее в виде Ах = Ь и воспользовавшись обратной к А матрицей, найденной в начале параграфа (см. упр. 3).
[Отв.: х = 33, у = —148, г - —25.]
10.	(а) Докажите следующее тождество:
(Ь) Покажите иа примере, что определитель суммы двух матриц не обязан быть равен сумме определителей этих матриц.
11.	Используя результат упр. 10 (а), покажите, что определитель произведения двух матриц может быть равен нулю только в том случае, если по крайней мере у одной нз этих матриц определитель равен нулю.
12.	Пусть А и В — матрицы порядка п, имеющие обратные:
(а) используя упр. 11, докажите, что матрица АВ имеет обратную.
(d) выразите матрицу, обратную к АВ, через Л-1 и В~>.
§ 7. Применение теории матриц к марковским цепям
301
§ 7. ПРИМЕНЕНИЕ ТЕОРИИ МАТРИЦ К МАРКОВСКИМ ЦЕПЯМ
Для простоты мы ограничимся рассмотрением марковских цепей с тремя состояниями, хотя аналогичная процедура будет годиться для любой марковской цепи.
В § 15 гл. IV мы видели, что каждой марковской цепи соответствует матрица вероятностей перехода. Например, в случае трех состояний at, а2 и аз эта матрица имеет вид:
6^2	^3
«1
аз
(Pll Р12 Р13
р21 Р22 Р?3
Рз1 Рз2 Рэв
Напомним, что сумма элементов каждой строки матрицы Р равна 1. Такая матрица называется стохастической
Определение. Квадратная матрица называется стохастической, если все ее элементы неотрицательны и сумма элементов каждой строки равна 1.
Чтобы получить марковскую цепь, нужно еще определить, с какого состояния начинается процесс. Предположим, что начальное состояние выбирается посредством некоторого случайного выбора, дающего состояние с вероятностью . Эти начальные вероятности могут быть записаны в виде вектора = — (р|0), р^, Д0)). Как и в упр. 14 § 4, мы можем построить меру дерева для какого угодно числа шагов. Пусть рИ—вероятность того, что процесс перейдет в состояние ау- через п шагов. Эти вероятности мы запишем в виде вектора pw = (p[n\ р^.
Определение. Вектор-строку р назовем вероятностным вектором, если все его компоненты неотрицательны и их сумма равна 1.
Очевидно. р(0) и р(п)— вероятностные векторы. Вероятностным вектором является также любая строка стохастической матрицы.
В общем случае для того, чтобы полностью определить марковскую цепь с г возможными состояниями, нужно задать некоторую стохастическую квадратную матрицу г-го порядка — матрицу вероятностей перехода и некоторый вероятностный r-мерный вектор — начальное состояние цепи (если это начальное состояние фиксировано, то одна из компонент соответствующего вектора равна 1, а остальные равны 0). Располагая этой информацией, мы можем построить дерево, задающее пространство логических возможностей для первых п шагов цепи (это дерево
302
Гл. V. Векторы и матрицы
будет иметь п уровней). Обозначим через/) /-ю функцию исхода. Наше дерево описывают п функций исхода f\, fn.
Пусть теперь нас интересуют какие-то вопросы, касающиеся исхода п-го шага. В этом случае на множестве Ы—{ах, а2, ...,аг] исходов соответствующего процесса можно построить следующую весовую функцию:
pH(aj) = P[fn = al]=p>J">.
Через р(л) мы обозначим вектор
= рЮ, .... /?<")).
Пример 1. В § 8 гл. IV мы описывали погоду на Земле Оз как марковскую цепь. Состояниями этой марковской цепи были дождь, ясная погода и снег. Матрица вероятностей перехода выглядела следующим образом:
Д Я С д/*/2 v4 ’/Л р=Я у2 0 */2 • с V/4 V4 V
Предположим, что мы начинаем с ясного дня. Рассмотрим процесс для первых трех шагов. В этом случае мы получим дерево и меру на нем в том виде, как это изображено на фиг. 115 (ср. с фиг. 96, стр. 214).
Для этого дерева и соответствующей ему вероятностной меры можно найти компоненты векторов р®, р<®. Например, определим р{3) (Д), другими словами, определим вероятность дождя на 3-й день. Пути, принадлежащие множеству истинности этого высказывания, помечены на фиг. 115 кружками в концах этих путей. Складывая веса этих путей, получим
Р(31(Д) — Р[/з — Д]—	1б+32“^ 16“^ 16 +16 — 32'
Точно так же, используя вероятностную меру, приписанную нашему дереву, можно определить и другие компоненты векторов р(1), р(2), р(3). Таким образом, мы получим
Рт = (Ч2.	0,	>/2),
р^={^	7в.	%),
^з)-ез/32, %2, ’732).
§ 7. Применение теории матриц к марковским цепям
303
Используя меру дерева, можно показать, что наши вероятно сти удовлетворяют следующим условиям:
=/f-I)Pn -ЬЛП_1)Р21 +^л-п/’зр р^=р^р12-^-р[п-^р22^-р^-1}р32, Р{зп> =/’(1Л-1’/’1з+^л"1)Лз+/’Г",)/’зз-
Легко понять смысл этих условий. Первое из них, например, выражает тот факт, что вероятность перехода в состояние ai через п
Фиг. 115
W(X)	f,(X)	f2(X)	f,(X)
1/6	И	а	Л
1/16	Л	Л	Я
t/16	л	л	с
Ц16	д	я	д
i/i6	Д	Я	С
//зг	ДСД
i/зг	ДСЯ
i/п	Д	С	С
t/16	СОД
i/зг	СДЯ
i/зг	С	Д	С
1/16	С	Я	Д
1/1в	СЯС
i/t6	с	с	д
1/16	с	с	я
1/8	с	с	с
шагов является суммой вероятностей перехода в каждое из трех возможных состояний через п — 1 шагов и последующего перехода в состояние си на n-м шаге. Аналогично интерпретируются и остальные условия.
Вспомнив определение умножения вектора на матрицу, мы можем записать эти условия в виде одного равенства
304
Гл. V. Векторы и матрицы
Подставляя вместо п числа 1, 2, 3 ..., мы получаем равенства: р(1)_р0р.	р(2)_р(1)р_.р(0)р2.	р(3) — р(2>р = р(Р)/ЭЗ
и т. д. В общем случае справедливо равенство
pW =р(0)/эя.
Итак, мы видим, что если вектор начальных вероятностей р(0) умножить на п-ю степень матрицы вероятностей перехода Р, то получится вектор р<"\ компонентами которого являются вероятности перехода в каждое из трех состояний через п шагов.
Допустим, например, что р(0) = (1, 0, 0); это равносильно предположению, что процесс начинается из состояния а\. Из предыдущего равенства видно, что в таком случае р(п) будет первой строкой матрицы Рп. Следовательно, элементы первой строки матрицы Рп дают нам для каждого из состояний вероятность того, что через п шагов процесс перейдет в это состояние в предположении, что начальным состоянием было а\. Точно так же, если взять р<0) = (0, 1, 0), то мы заключим, что вторая строка матрицы Рп указывает вероятности того, что процесс перейдет в одно из заданных состояний через п шагов при условии, что начальным было состояние а2. Аналогично третья строка дает эти вероятности при условии, что начальным состоянием процесса было а3.
В § 15 гл. IV мы рассматривали конкретные марковские цепи, начинавшиеся с данных фиксированных состояний. Там мы при-шли к матрице Р > t-я строка которой давала вероятности окончания процесса в различных состояниях при условии начального состояния at. Сравнивая эти рассмотрения с только что проведенными, мы видим, что матрица Р(л) является просто n-й степенью матрицы Р, т. е. Р^ = Рп. (Ср. с упр. 13 и 14 из § 4.) Таким образом, умножение матриц дает удобный способ для вычисления требуемых вероятностей.
Равенство	допускает еще одну интересную ин-
терпретацию. Вектор р(п) получается из вектора посредством преобразования, состоящего в умножении его на матрицу Р. Вектор получается из р(п-2~> посредством такого же преобразования и т. д. Обозначим это преобразование стрелкой; таким образом, мы имеем
р(0) _> p(l) -^p&i _> . , . _> р(л-1) р(п) # # .
В § 11 мы покажем, что это преобразование является так называемым линейным преобразованием множества векторов. Мы будем говорить, что это преобразование переводит вектор р(0) в вектор р(1), вектор в вектор р(2) и т. д.
§ 7. Применение теории матриц к марковским цепям
305
Пример 1 (продолжение), оказалось, что
Д
д
Р3 = Я
с
26
64
13
32
• 25
64
В примере с Землей Оз
Я с
13 251
64 64
6_ 13
32 32 '
13 26
64 64
Теперь мы видим, что вероятность хорошей погоды через три дня после дождя равняется Рд>== 54- Отметим, что во второй строке стоят вероятности любой погоды через три дня после ясного дня. Эти вероятности совпадают с теми, которые были вычислены с помощью дерева логических возможностей и соответствующей вероятностной меры.
Иногда можно найти вероятностный вектор t, который цри преобразовании Р переходит сам в себя, т. е. такой, что t — tP.
Определение. Вероятностный вектор t называется неподвижным вектором преобразования Р. если t = tP
Пример 2. Рассмотрим стохастическую матрицу
( 2_
3	3
2	1
2	2
0.667 0,333 \
0,500 0,500/
Если t = (0,6; 0,4), то мы видим, что
/Р = (0,6; 0,4)
2
3
2
2
2 з
2
2
= (0,6; 0,4) — /.
Следовательно, t является неподвижным вектором преобразования Р.
Если бы мы выбрали вектор t в качестве вектора начальных вероятностей р№), то мы имели бы р№=рФ>Р" = tPn — t^=p(°\ В этом случае вероятность перехода в любое данное состояние была бы одной и той же на всех ступенях данного процесса. Такой процесс называется стационарным марковским процессом
Как мы видели, при изучении марковских цепей важную роль играют степени матрицы Р. Для выяснения того, что происхо-
20 Зак. 994,
306
Гл. V. Векторы и матрицы
дит с этими степенями, продолжим рассмотрение нашего примера.
Пример 2 (продолжение). Вычисляя степени матрицы Р, мы находим
/0,611	0,389 \	_	/0,602	0,398 \
(	1	/эз	(	I	и т	л
\ 0,583	0,417/	\ 0,597	0,403/	д
Похоже на то, что с возрастанием п матрица Рп стремится к матрице
/0,6 0,4 \
Цо.б 0,4/
Можно показать, что так оно и есть на самом деле. Соответствующая ситуация будет подробнее рассмотрена в следующем параграфе. (Когда мы говорим, что Рп стремится к Т, то это означает, что элементы матрицы Рп неограниченно приближаются к соответствующим элементам матрицы Т.) Отметим, что каждая строка Т является неподвижным вектором t матрицы Р.
В заключение рассмотрим еще несколько примеров марковских процессов.
Пример 3. В каждом заезде определенная лошадь вы» игрывает заезд с вероятностью 2/s, делит первое и второе место с вероятностью */б и проигрывает заезд с вероятностью 2/б, независимо от исхода любого предыдущего заезда. В этом случае мы имеем процесс независимых испытаний, но его можно рассматривать также и с точки зрения теории марковских цепей. Матрица вероятностей перехода в этом случае выглядит следующим образом:
В Д
В /75 V5
Р=д( 78 Vs
П \75 Vs
п
7S\
75 •
75/
Пример 4. Пусть 80% сыновей выпускников Гарвардского университета поступают в Гарвард, а остальные в Иелл, 40% сыновей выпускников Иелльского университета поступают в Иелл, а остальные распределяются поровну между Гарвардом и Дартмутом и, наконец, 70% сыновей выпускников Дартмутского колледжа поступают в Дарт-
§ 7. Применение теории матриц к марковским цепям
307
мут, 20% в Гарвард, а 10% —в Иелл. Мы построили марковскую цепь с матрицей вероятностей перехода
Г
И Д
Г
Р=И д
0,8
0,3
0,2
0,2
0,4
0,1
0
0,3
0,7
Пример 5. Изменим теперь условия примера 4, предположив, что сын выпускника Гарварда всегда поступает в Гарвард. Тогда матрица вероятностей перехода примет вид:
ГИД
Г / 1	0	0 \
Р=И10,3 0,4 0,3 1.
Д \0,2 0,1 0,7/
Пример 6. Рассмотрим частный вид модели, которая используется для объяснения явления диффузии газов. Такая модель самого общего вида будет подробно изучена в § 10. Итак, в ящике находятся три шара. У ящика имеется два отделения. Каждую секунду выбирается один из трех шаров случайным образом и перекладывается из одного отделения в другое. В качестве состояния марковской цепи рассмотрим число шаров в первом отделении. В этом случае матрица вероятностей перехода имеет вид
0	12	3
010	1	00
1	7з	0	2/з	0
2	0	%	0	1/3 ’
3	0	0	1	0
Пример 7. У животных наследование признаков имеет простейший характер в том случае, когда признак опреде* ляется одной парой генов, каждый член которой может быть одного из двух типов, скажем G и g. Каждый индивидуум может обладать генами в одной из трех возможных комбинаций GG, gg, или Gg (что с точки зрения генетики эквивалентно gG). Очень часто комбинации GG и Gg внешне не
20*
308
Гл. V. Векторы и матрицы
различимы и тогда мы говорим, что ген G доминирует над геном g. В этом случае индивидуум с генами GG называется доминантным, индивидуум с генами gg называется рецессивным, а индивидуум с генами Gg — гибридом.
При скрещивании двух животных их потомство наследует по одному гену от каждого из родителей и в основу генетики кладется предположение о том, что эти гены выбираются случайным, независимым друг от друга образом. Это предположение определяет вероятность появления потомства каждого типа. Так, потомство двух доминантных родителей должно быть доминантным, потомство двух рецессивных родителей должно быть рецессивным, а потомство одного доминантного и одного рецессивного родителя должно быть гибридом. При скрещивании доминантного животного и гибрида их потомство должно получить ген G от первого родителя, а от второго родителя — с вероятностью ‘/г ген G и с вероятностью */г ген g. Отсюда вероятности получения либо гибридного потомства, либо доминантного потомства равны. В то же время при скрещивании рецессивного родителя с гибридом вероятность получения рецессивного или гибридного потомства одинакова. При скрещивании двух гибридов их потомство с вероятностью */г получает гены каждого типа от каждого из родителей. Поэтому вероятность получить гены GG равна V4, гены Gg — ’/2 и гены gg — */4-
Рассмотрим теперь процесс непрерывного скрещивания. В качестве одного из родителей в самом начале мы берем индивидуум с неизвестными генетическими признаками, а в качестве второго мы берем гибрид. Потомство этой пары вновь скрещивают с гибридом и т. д. Получившийся процесс является марковской цепью. Его состояниями являются доминантные, рецессивные индивидуумы и гибриды, что мы и будем обозначать буквами Д, Р и Г. Матрица вероятностей перехода в данном случае имеет вид
Д Г Р д/*/2 % 0\
*/4 ’/2 */4 «
Р V 0 >/2 V
Пример 8. Изменим условие примера 7 следующим образом: вновь получившееся потомство мы будем скрещивать с доминантным животным. В этом случае матрица
§ 7. Применение теории матриц к марковским цепям
309
вероятностей перехода будет иметь вид Д г Р Д / 1 о 0 \
Р=г 1/2 72 0 . Р \ 0 1 о J
Пример 9. В самом начале у нас есть два животных противоположного пола. Мы скрещиваем их, выбираем из их потомства два животных различного пола, скрещиваем их и т. д. Для того чтобы сделать этот пример более простым, предположим, что рассматриваемый признак не зависит от пола.
Здесь каждое состояние процесса определяется парой животных, поэтому состояниями этого процесса являются: at = (ДД), а2 = (ДГ), а3 = (ДР), о4 = (ГГ), а5 = (ГР) и а6 = (РР). Покажем, как вычисляются вероятности перехода на примере состояния а2.' Если процесс находится в этом состоянии, то у одного из родителей имеются гены GG, а у другого Gg. Таким образом, вероятность появления доминантного (соответственно гибридного) потомства равняется */г для каждого из потомков. Поэтому вероятность перехода в состояние (ц (вероятность выбрать двух доминантных животных) равна V4, вероятность перехода в состояние а2 равна 7г, а в состояние а4 — */4. Полная матрица вероятностей перехода в этом случае выглядит следующим образом:
	«1		as	а4	а5	а6	
6Z1	1	0	0	0	0	0	
	74	72	0	74	0	0	
	0	0	0	1	0	0	
а4	71в	74	78	74	74	716	
а5	0	0	0	74	72	74	
а6	0	0	0	0	0	1	
Рассмотрение этого	примера		будет продолжено в гл. VII.				
Упражнения
1.	На Земле Оз идет дождь.-Постройте дерево и соответствующую ему вероятностную меру для погоды в течение следующих трех дней. Определите р(1>, р(2>, р<3> и сравните полученные результаты с тем, что получится в результате возведения матрицы Р во вторую и в третью степени.
310
Г л. V. Векторы и матрицы
2.	Найдите Р2 и Р3 в условиях примера 3. Как будет выглядеть матрица Рп? (Отв.: Рп = Р]
3.	В условиях примера 4 определите вероятность, с которой внук выпускника Гарвардского университета поступает в Гарвард.
4.	В условиях примера 5 определите вероятность того, что внук выпускника Гарвардского университета поступает в Гарвард.	[Отв.: 1J
5.	Пусть в условиях примера 7 мы начинаем с гибрида. Найдите р^, р<2), р№. Как выглядит вектор р^?	[Отв.: pW = р(|>.]
6.	Найдите Р2, Р3, Р* и Р" для марковской цепи с матрицей вероятностей перехода
Проделайте то же самое для марковской цепи с матрицей вероятностей перехода
Для каждой из цепей объясните полученные результаты
7.	Вычислите первые пять степеней матрицы /°,8 0,2ч \ 0,2 0,8/
Пользуясь ими, угадайте, каков будет неподвижный вектор t. Проверьте этот результат.
8.	Покажите, что все стохастические матрицы вида / 1 — а а ч \ а 1—а)’
где 0 < а < 1, имеют один и тот же единственный неподвижный вектор.
9.	В упр. 7 вычислите рР, рР2, рР3, рР4 и рР5, где р = (0,7; 0,3). Сравните полученные результаты с неподвижным вектором t.
10.	Найдите неподвижный вектор матрицы
/ОД 0,9ч \0,6 0,4/
Возьмите р = (0,5; 0,5) и вычислите pS, pS2 и pS3.
[Отв.: pS = (0,35,	0,65), pS2 = (0,425, 0,575)
pS8 = (0,3875, 0,6125),	/=(0,4,	0,6).]
§ 8*. ЭРГОДИЧЕСКИЕ МАРКОВСКИЕ ЦЕПИ
Первым типом марковского процесса, который мы собираемся изучить достаточно подробно, будет регулярная марковская цепь.
Определение. Марковская цепь называется регулярной, если какая-либо степень ее матрицы вероятностей перехода не содержит нулевых элементов.
Очевидно, что любая матрица вероятностей перехода, не со
§ 8*. Эргодические марковские цепи
311
держащая нулей, определяет регулярную марковскую цепь. В примере с Землей Оз нулю равнялся элемент ряя матрицы вероятностей перехода, однако уже матрица Р2 не содержала нулей, так что рассматривавшийся там процесс является регулярной марковской цепью. В качестве примера нерегулярной марковской цепи можно указать цепь с матрицей перехода
/ 1 0 \
P~Vl2 ‘/2/
Любая степень этой матрицы будет содержать 0 в правом верхнем углу.
Регулярность марковских цепей имеет следующий вероятностный смысл: марковская цепь является регулярной, если в некоторый момент времени мы можем оказаться в любом из состояний этой цепи независимо от начального состояния процесса. Самый простой способ проверки цепи на регулярность заключается в том, что нужно проследить, являются ли элементы степеней матрицы перехода положительными или нет. При этом нет никакой необходимости вычислять истинные значения этих элементов. Вместо этого мы будем обозначать элемент через х, если он отличен от нуля, и через 0 в противном случае.
Пусть мы исследуем матрицу вероятностей перехода
[ ° 1 0\ Р = ( 0 0 11.
V/2 */2 0/
Для проверки на регулярность поступим следующим образом:
/0	х	0\	/0	0	х\
Р = 1 0 0 х I,	Р2 = 1 х х 0 ),
\х	х	0J	\0	х	х/
(О	х	х\	/х	х	х\
X X XI	P8 = f X X хр
X	X	XI	\х	X	X/
При исследовании на регулярность выгодно вычислять как можно более высокие степени Р. Поэтому каждый новый результат мы снова возводили в квадрат.
Отметим теперь две важные теоремы, относящиеся к регулярным цепям.
Теорема 1. Пусть Р есть матрица вероятностей перехода регулярной цепи. Тогда:
312
Гл. V. Векторы и матрицы
(1)	матрицы Рп сходятся к некоторой матрице Т (т. е. каждый элемент Рп стремится к соответствующему элементу Т);
(2)	строки матрицы Т образуют одинаковый вероятностный вектор t\
(3)	все компоненты t положительны.
Напомним, что элемент матрицы Рп описывает вероятность того, что процесс окажется в состоянии а^ после п шагов, исходя из начального состояния czz. Таким образом, в (1) утверждается, что для больших п долгосрочный прогноз может быть дан раз и навсегда независимо от значений п. Другими словами, pfl приблизительно равно ttj для всех больших п. В (2) мы утверждаем, что этот долгосрочный прогноз не зависит и от начального состояния. Другими словами, = зависит только от рассматриваемого состояния а7-, а не от начального состояния. Поэтому вероятность оказаться в состоянии а7- после большого числа шагов приблизительно равна t, независимо от начального состояния. Эти закономерности были проиллюстрированы на примере 2 из § 7.
Пример 1. Рассмотрим несколько степеней матрицы вероятностей перехода для примера с Землей Оз. С точностью до трех десятичных знаков эти матрицы будут иметь вид:
	д	Я	С
д.	/0,5	0,25	0,25
Р = Я 1	0,5	0	0,5
с	<0,25	0,25	0,5
д я с
Д /0,437 0,187 0,375 \
Я = Я I 0,375 0,250 0,375 );
С \ 0,375 0,187 0,437!
Д Я С
Д /0,402 0,199 0,398 \
Д4 = Я I 0,398 0,203 0,398 );
С \ 0,398 0,199 0,402/
Д Я С д Р8 = Я с
/0,400 0,200 0,400 \ I 0,400 0,200 0,400 . \ 0,400 0,200 0,400/
§ 8*. Эргодические марковские цепи
313
Таким образом, мы видим, что уже элементы восьмой степени матрицы Р с точностью до трех десятичных знаков составляют одинаковые строки. Поэтому вероятность дождя через восемь дней после дождливого дня с большой точностью равна вероятности дождя через восемь дней после ясного дня или через восемь дней после снега.
Следующая теорема позволяет определить элементы матрицы Т.
Теорема 2. Если Р есть матрица вероятностей перехода регулярной цепи, а Т и t определены как в теореме 1, то
(1) если р есть любой вероятностный вектор, то рРп стремится к t;
(2) вектор t является единственным вероятностным вектором, удовлетворяющим равенству tP = t.
Доказательство теоремы 1 мы опустим; однако мы укажем вывод теоремы 2 из теоремы 1.
Доказательство. Рассмотрим сначала вектор рТ. В первом столбце матрицы Т в каждой строке стоит элемент t\. Следовательно, при вычислении первой компоненты рТ каждая компонента р умножается на Л- В результате Л умножается на сумму компонент р, что дает t\. Проделав то же самое для других компонент, мы замечаем, что рТ равняется просто t. Но вектор рРп стремится к рТ; следовательно, он стремится к t. Таким образом, если любой вероятностный вектор многократно преоб разуется посредством Р, то он стремится к неподвижному вектору t. Этим доказывается пункт (1).
Так как степени Р стремятся к Т, то = Р‘  Р стремится к Т; но также стремится к Г и Т-Р\ следовательно, TP = Т. Рассмотрение какой-нибудь одной строки этого матричного равенства показывает, что tP = t, следовательно,/ — неподвижный вектор преобразования Р (то, что t — вероятностный вектор, еле дует из теоремы 1). Мы должны также доказать единственность вектора t. Пусть и — любой неподвижный вектор преобразования Р. В силу (1) иРп стремится к t. Но так как и — неподвижный вектор, то иРп = и. Следовательно, и, оставаясь неизменным, «стремится» к t. Это возможно лишь в том случае, если и = t. Таким образом, t—единственный неподвижный вектор, чем и завершается доказательство пункта (2).
Следующее обстоятельство является важным следствием из нашей теоремы. Если принять за р вектор р<0), указывающий начальное распределение вероятностей, го вектор рмрп=р№ укажет распределение вероятностей всех состояний на n-м этапе процесса, а этот вектор стремится к t. Следовательно, если матрица Р регулярна, то независимо от того, каковы были на
314
Гл. V. Векторы и матрицы
чальные вероятности, после большого числа шагов вероятность того, что процесс перейдет в состояние а} будет очень близка к tj (ср. с выводом, сделанным из теоремы 1).
Пример 2. Вернемся к примеру 2 из § 7 и примем р® = = (0,1; 0,9); посмотрим, как этот вектор распределения вероятностей изменяется при последовательных преобразованиях. Воспользовавшись матрицей Р и её степенями из примера 2 (стр. 305—306), мы получим, что р(1) = (0,5167, 0,4833), р<2> = (0,5861, 0,4139) и р<3» = (0,5977, 0,4023). Вспомнив, что /=(0,6; 0,4), мы видим, что эти векторы стремятся к t. Они изображены на фиг. 116.
Пример 3. Выведем формулу для неподвижного вектора стохастической (2 X 2) -матрицы с положительными элементами. Такая матрица имеет вид:
/1 —а а \
S =	,	...
\ b	1 — b /
где 0 < а < 1 и0<&<1.Так как S — регулярная матрица, она имеет единственный неподвижный вероятностный вектор t = (/i, /2) • Его компоненты должны удовлетворять
§ 8*. Эргодические марковские цепи
315
уравнениям:
/1(1 — #) ~t~ t2b —1\, +t2 (1 — b) = t2.
Эта система уравнений сводится к одному уравнению t\a = t2b. Это единственное уравнение имеет бесконечное множество решений. Но вследствие того, что t — вероятностный вектор, мы должны также иметь t\ + t2 = 1, и это новое условие дает нам точку [ЬЦа + Ь), аЦа + Ь)] в качестве единственного неподвижного вектора матрицы 5.
Много интересных свойств регулярных марковских цепей базируются лишь на том факте, что такие цепи имеют единственный вероятностный неподвижный вектор с положительными элементами. Это свойство характерно и для более широкого класса марковских цепей.
Определение. Марковская цепь называется эргодической, если из каждого ее состояния мы можем попасть в любое другое состояние.
Очевидно, что регулярная цепь всегда является эргодической. Это следует из того, что все элементы п-й степени матрицы вероятностей перехода оказываются положительными и, следовательно, из каждого состояния можно перейти в любое другое, по крайней мере за п шагов. С другой стороны, эргодическая цепь не обязательно должна быть регулярной. Пусть, например, из данного состояния мы можем попасть в одно из других состояний только за четное число шагов, а в какое-то еще состояние— только за нечетное число шагов. В этом случае любая степень матрицы перехода будет содержать нули Мы продемонстрируем эту возможность на примере несколько ниже.
Еще одну теорему мы приведем без доказательства.
Теорема 3. Пусть Р есть матрица вероятностей перехода эргодической цепи. Тогда:
(1)	существует единственный вероятностный вектор t такой, что tP = t\
(2)	все компоненты вектора t положительны;
(3)	пусть средняя доля времени, в течение которого процесс находится в состоянии ар для п шагов равна hjin>; тогда для любого е > 0 независимо от начального состояния имеем
л->оо
То, что мы говорили о векторе t после теоремы 2, справедливо лишь в частном случае регулярных цепей. В самом деле, на любом фиксированном этапе процесса вероятность оказаться в определенном состоянии для эргодической цепи может быть
316
Гл. V. Векторы и матрицы
равна 0. Однако теорема 3 доставляет нам некоторый вариант «закона больших чисел» (см. § 11 гл. IV) для всех эргодических цепей (в том числе и для регулярных).
Пример 1 (продолжение). Возвратимся еще раз к примеру с Землей Оз. Используем теперь теорему 2 для построения предельной матрицы Т. Нам известно, что строка матрицы Т должна быть вероятностным вектором, т. е. если t = 16, 6, 6), то
6+^2“Ь^з— !•
Кроме того, этот вектор должен быть неподвижным, т. е.
J 4
(fj, 6)
£ 2
£ 2
2 4
2
4
j_
2
J_
2
— (6>	6)-
j 4
Таким образом, мы получаем для компонент вектора t систему из следующих четырех уравнений:
Единственным решением этой системы является вектор / = (0,4; 0,2; 0,4).
Таким образом, Рп сходится к матрице /0,4 0,2 0,4 \ 7= 0,4 0,2 0,4 I \0,4 0,2 0,4/
независимо от начального состояния и вектор р” стремится к (0,4; 0,2; 0,4) при и -> оо. Это значит, что в конце концов 40% всех дней будут дождливыми, 20% ясными, а в остальные дни будет идти снег.
Пример 4. Последние 365 дней на Земле Оз наблюдалась следующая погода:
§ 8*. Эргодические марковские цепи
317
ССДССССЯДДДСЯДДДДДДСЯССЯДДССЯСССЯДЯСЯС сяссссддясядяддддяддясддясяддсяссссдяд сдяссссядддяссясясддсддяддддддсссссдд дяддссссссдядссяддддсдясссядддсдссддд ясдяссддддддддсядсяддясяддддддддддсс дясяссясссдяддясдддяддссясясссдядядядс СЯССССЯЯЯДЯССДДЯДССДСССДДДДДССДДЯДЯДДД ясясяссдсссядсссяддяддясддсссясядссясся сддяддядсядсддясдддсяссссссддддяссддя дядсдясяссдя дяссясссдяддяссс.
Итак, 140 дней шел снег, 77 дней было ясно, а 148 дней шел дождь. Отношение числа дней каждого типа к общему числу дней определяется вектором
д я с
/1 = (0,41 0,21 0,38).
Этот вектор весьма мало отличается от своего теоретичен ского прототипа
д я с
/' = (0,4 0,2 0,4).
Найти неподвижный вектор для регулярной марковской цепи, может быть, чрезвычайно трудно, если размеры матрицы вероятностей перехода достаточно велики. Однако часто удается чисто интуитивно предсказать значение компонент этого вектора. С этим мы столкнемся в примерах из § 10, где мы будем рассматривать различные задачи из физики. Здесь в качестве иллюстрации ситуации подобного рода мы рассмотрим более простой пример.
Пример 5. Белую мышь помещают в лабиринт, по-
казанный на фиг. 117. В этом лабиринте имеется девять помещений, соединенных между собой так, как изображено. Из одного отделения в другое мышь переходит случайным образом. Другими словами, если какое-то помещение можно покинуть разными способами, то мышь с одинаковой вероятностью выбирает любой из них. Передвижение мыши
318
Гл. V. Векторы и матрицы
может быть описано марковской цепью с матрицей вероятностей перехода следующего вида:
	1	2	3	4	5	6	7	8	9
1	0	72	0	0	0	V2	0	0	0
2	*/з	0	*/з	0	7з	0	0	0	0
3	0	*/2	0	‘/2	0	0	0	0	0
4	0	0	7з	0	7з	0	0	0	7з
Р—5	0	*/4	0	*/4	0	V4	0	V4	0
6	1/з	0	0	0	7з	0	7з	0	0
7	0	0	0	0	0	*/2	0	%	0
8	0	0	0	0	V2	0	*/2	0	72
9	0	0	0	*/2	0	0	0	’/2	0
То. что эта цепь не является регулярной, видно из следующего: из нечетных состояний процесс может переходить только в четные состояния, а из четных — только в нечетные. Поэтому, начавшись из состояния а\, процесс попеременно проходит через состояния с четными и с нечетными номерами. Следовательно, любая степень Р будет содержать нули либо в нечетных, либо в четных столбцах первой строки. С другой стороны, совершенно очевидно, что конструкция лабиринта такова, что в нем из любого состояния можно попасть в любое другое состояние, а значит, рассматриваемая цепь является эргодической.
Для того чтобы найти неподвижный вероятностный вектор для такой матрицы, нам пришлось бы решать систему из десяти уравнений с девятью неизвестными. Однако мы знаем, что компоненты неподвижного вектора должны быть пропорциональны той доли общего времени, которую мышь проведет в каждом из помещений. Поэтому мы можем предположить, что такой вектор «пропорционален» вектору
х == (2, 3, 2, 3, 4, 3, 2, 3, 2),
у которого i-я компонента равна числу входов в г-е помещение. Легко проверить, что и в самом деле хР = х, а, следовательно, единственный вероятностный вектор получается из этого вектора х с помощью такой нормировки, после которой сумма всех его компонент равняется 1. Таким вектором будет
л 1	1 1 12. 1 1
‘ — \12’ 8’ 12’ 8’ 6’ 8’ 12’ 8’ 12/
§ 8*. Эргодические марковские цепи
319
Упражнения
1. Какие из ।	следующих матриц регулярны?							
(а)	с;:	'А \ 'А/	>	(b)l	/ 0 Ьл	1 \ 7J		[Отв.: регулярная.]
(с)		0 ’ 2А-	| >	(d)|	(Vs ( 1	4/6\ 0 )		[Отв.: регулярная.]
(е)	р \ 0	’t)		(f) (	’0 1 л 0	j		[Отв.: не регулярная.]
	/’А	*А	0 \		/ */з	0	2А\	
(g)	0	*А	’А ;	(h)	°	1	0 1	[Отв.: не регулярная.]
	\'/з	*А	'lj		\ 0	*/s	4/6/	
2. Покажите,	что	квадратная		стохастическая			матрица	2-го порядка
/ 1 —а а \ \ b 1 — b)
регулярна тогда и только тогда, когда ни а, ни Ъ не равны 0 и когда оба они одновременно не равны 1.
3	Определите неподвижный вектор для матрицы упр. 2 в каждом из перечисленных там случаев.	/ b а \ 1
l0™"	7+т)-]
4.	Определите неподвижный вероятностный вектор t для каждой из следующих регулярных матриц:
(а)(/4 //)’’	[Owe.: i = (2/3, |/3).]
' 72	72 /
/ 3Л 'Л о х
(С) I 0 2/з 1/з I.	[Отв.: (*/7, з/7, 2/7)_]
V/, '/* */2/
5.	Предполагая, что процесс начинается из состояния at, вычислите р<1>, р№\ Р^ для каждой из матриц, фигурирующих в упр. 4 (а) и (Ь). Насколько эти векторы отличаются от неподвижных вероятностных векторов указанных матриц?
6.	Пусть р<0) =(§-• у)- Вычислите	и р& для каждой из матриц
упр. 4 (а) и 4 (Ь). Приближаются ли они к неподвижным векторам этих матриц?
7.	Рассмотрим марковскую цепь с двумя состояниями и матрицей вероятностей перехода
Д ।	^2
йги о/	*
320
Гл. V. Векторы и матрицы
Какова вероятность того, что после п шагов процесс перейдет в состояние ai, если он начался из состояния а2? Будет ли эта вероятность зависеть от начального положения при больших и? Если будет, то должна быть неприменимой теорема настоящего параграфа. Почему? Имеет ли эта матрица единственный неподвижный вектор? Является ли соответствующая цепь эргодической? (Ср. упр. 2.)
[Отв.: цепь является эргодической.] 8. Рассмотрим матрицу вероятностей перехода из упр. 2, где а = 0 и b = ’/з-Вычислите единственный неподвижный вероятностный вектор для этой матрицы и докажите, что цепь не является эргодической.
9.	Покажите, что матрицы
(а) Р =
1	0	0
1	1	1
4	2	4
0	0	1
(Ь)
1
2 2
0
0 0
» 4
О 1
имеют более чем один неподвижный вероятностный вектор. Найдите матрицу, к которой стремится Рп, и покажите, что у нее не все строки одинаковы.
10.	Покажите, что матрица
0	1	0
0	0	1
является регулярной.
11.	Докажите, что если матрица вероятностей перехода 3-го порядка обладает тем свойством, что сумма всех элементов в любом ее столбце равна 1, то (’/з, ’/з, */з) есть неподвижный вероятностный вектор этой матрицы. Сформулируйте аналогичное утверждение для матрицы вероятностей перехода л-го порядка. Объясните полученные результаты с точки зрения теории эргодических цепей.
(В упражнениях 12—16 мы будем ссылаться на примеры из § 7.)
12.	Покажите, что процессы, рассмотренные в примерах 5, 8 и 9 из § 7, не являются эргодическими цепями.
13.	Каким окажется неподвижный вероятностный вектор процесса независимых испытаний, если рассматривать этот процесс как марковскую цепь? Всегда ли такая цепь должна быть регулярной? Проиллюстрируйте это иа примере 3 из § 7
14.	Покажите, что цепь примера 4 из § 7 регулярна, и найдите ее неподвижный вероятностный вектор. Объясните полученный результат.
1Б. Покажите, что цепь примера 6 из § 7 является эргодической, но ие регулярной. Определите ее неподвижный вероятностный вектор. Покажите, что те же вероятности получаются и в том случае, если шары кладутся в ящик по одному, причем каждый из них помещается в первое отделение с вероятностью '/г-
16. Покажите, что цепь примера 7 из § 7 является регулярной. Используйте результат упр. 5 из § 7 для того, чтобы иайти неподвижный вероятностный вектор для этой цепи.
17. На фабрике есть две машины, из которых в любой момент времени работает только одна. Ежедневно работающая машина с вероятностью р выходит из строя. Починить машину может только один человек, который тратит 2 дня на починку одной машины и который может чинить их
§ 9*. Дальнейшие примеры марковских цепей	321
только по очереди. Рассмотрим теперь марковскую цепь, выбрав в качестве состояний пару чисел (х, у), где х есть число машин, находящихся в рабочем состоянии в конце данного дня, а у равняется 1, если к началу рабочего дня ни одна из машин еще не чинилась, н равняется 0 в остальных случаях. Матрица вероятностей перехода для этого случая имеет вид-
(2,0)		(1,0)	(1,1)	(ОД)	
(2,0)	Я	р	0	0	
(1,0)	0	0	q	р	
(1,1)	q	р	0	0	»
(0,1)	0	1	0	0	
где р + q = 1. Докажите, что		эта цепь является			регулярной и постройте
для нее неподвижный вероятностный вектор
§ 9*. ДАЛЬНЕЙШИЕ ПРИМЕРЫ МАРКОВСКИХ ЦЕПЕЙ
В этом параграфе мы применим результаты предыдущего параграфа к различным марковским цепям. Некоторые из этих марковских цепей рассматриваются здесь впервые, а некоторые взяты из примеров § 15 гл. IV.
Пример 1. Допустим, что президент Соединенных Штатов Америки сообщает какому-то лицу А о своем намерении выставить или не выставить свою кандидатуру на следующих выборах. Затем А передает эту новость В, который в свою очередь передает это сообщение С, и т. д., причем каждый раз это сообщение передается новому лицу. Пусть для каждого лица, получившего сообщение, имеется некоторая вероятность р > О того, что это сообщение будет им передано следующему лицу с изменением смысла на противоположный. Какова вероятность того, что n-е лицо, услышавшее сообщение, получит известие о том, что президент выставит свою кандидатуру? Мы можем рассматривать это как марковскую цепь с двумя состояниями, обозначенными через «да» и «нет». Процесс находится в состоянии «да» на я-м шаге, если n-е лицо, получившее сообщение, было поставлено в известность, что президент выставит свою кандидатуру, и в состоянии «нет», если его известили, что президент не выставит свою кандидатуру. Матрица Р вероятностей перехода будет иметь вид
да нет
да
нет
1— Р
Р
Р \-р
21 Зак. 994.
322
Гл. V. Векторы и матрицы
В этом случае матрица Рп определяет вероятность того, что п-е лицо передаст то или другое сообщение в предположении, что президент сказал «да» (первая строка), или в предположении, что президент сказал «нет» (вторая строка). Мы знаем, что эти строки стремятся к t. По фор-, . /1 1\ „
мулам предыдущего параграфа t —	Следователь-
но, для п-го лица вероятность услышать «да» стремится 1
к 2" независимо от первоначального решения президента.
Для большого числа людей мы можем ожидать, что приблизительно одна половина их узнает, что президент выставит свою кандидатуру, а другая половина — что не выставит, независимо от подлинного решения президента.
Изменим теперь наши предположения следующим образом. Будем считать для каждого лица вероятность а перемены в сообщении при передаче его следующему лицу «да» на «нет» отличной от вероятности Ь перемены «нет» на «да». Тогда матрица вероятностей перехода примет вид:
Да нет
да
1 — а b
нет а 1— b
В этом случае t = [b/(a + Ь), а/(а + Ь)]. Таким образом, вероятность того, что п-е лицо услышит о выставлении президентом кандидатуры, равна приблизительно Ь/(а + Ь). При большом п эта вероятность также нё зависит от подлинного решения президента и мы можем ожидать, что доля услышавших о выставлении президентом своей кандидатуры будет приблизительно равна ЬЦа + Ь), а доля услышавших противоположное приблизительно равна аЦа + Ь). Важно отметить, что из наших предположений следует, что не президент, а сами люди определяют вероятность того, что какое-либо лицо услышит «да» или «нет», а также долю людей, которые услышат то или другое из этих предсказаний.
Пример 2. Продолжим изучение примера 2 из § 15 гл. IV. Первое приближение, рассмотренное в этом примере, приводит к марковской цепи с двумя состояниями, и полученные результаты аналогичны результатам только что разобранного нами примера 1. Второе приближение привело к марковской цепи с четырьмя состояниями и матрицей
§ 9*. Дальнейшие примеры марковских цепей
323
вероятностей перехода
		РР	ДР	РД	ДД	
	РР	1 —а	0	а	0	
	ДР	b	0	1— Ь	0	
	РД	0	1 — с	0	с	•
	дд	0	d	0	\—d	
Если	все числа а, Ь, с и		d отличны от		0 или	1, то квадрат
этой	матрицы не содержит			нулей и	следовательно, эта	
матрица регулярна. Неподвижный вектор находится обычным способом (см. упр. 12). Это будет вектор
(bd	ad	ad	са \
bd 4- 2ad са ’ bd -\-2dd са ’ bd -J- 2ad 4- ca ’ bd 4- 2ad 4- cal'
Заметим, что вероятность состояния (РД) после большого числа шагов равна вероятности состояния (ДР). Это показывает, что при равновесии изменение от (Р) к (Д) должно иметь ту же самую вероятность, что и изменение от (Д) к (Р).
Неподвижный вектор позволяет найти вероятность того, что выборы в далеком будущем завершатся победой республиканцев. Эта вероятность находится путем сложения вероятностей состояния (РР) и состояния (ДР), что даст
bd 4- ad bd -\-2ad -{-са
Отметим, что для нахождения вероятности победы республиканцев в году, предшествующем некоторому году в далеком будущем, следует сложить вероятности состояния (РР) и состояния (РД). То, что при этом мы получаем тот же самый результат, соответствует тому факту, что предсказания далекого будущего существенно не зависят от индивидуального года, в отношении которого делается предсказание. Другими словами, процесс протекает так, как если бы он был стационарным.
Пример 3. Следующий пример показывает, что описанные идеи могут быть применены к ситуации, которая не кажется связанной с понятием вероятности, и тем не менее может быть исследована вероятностными методами.
Допустим, что в каждом городе каждый год четыре процента жителей переселяется в пригороды, а один процент жителей пригородов переселяется в город. Предполагая, что число жителей города и его пригородов остается
21*
324
Гл. V. Векторы и матрицы
постоянным, найдем окончательное распределение жителей между городом и пригородами. Ситуация описывается матрицей S, изображенной на фиг. 118.
переселение
население города население пригородов
в город
/	0,96
\	0,01
переселение в пригороды 0,04 \ 0,99 J
Фиг. 118
Обозначим через х<0) вектор (х’0), х®), где х)0)— доля городского населения в начале исследуемого периода и х J>0) — доля пригородного населения в это же время. Через х<п> = (х<"', х!,п)) обозначим вектор, дающий соответствующие доли спустя п лет. Тогда на основании тех же соображений, которые используются и в случае марковской цепи, мы получаем, что
х^ = х^8п.
Точно так же, поскольку наша матрица S может быть интерпретирована как регулярная матрица вероятностей перехода для некоторой марковской цепи и поскольку вектор х<°> есть вероятностный вектор, то мы можем применить теорему из теории марковских цепей и получить в результате, что вектор x(n> стремится к вектору t = (tu t2) — единственному неподвижному вектору стохастической матрицы S. Этим вектором будет вектор t= (0,2; 0,8). Следовательно, мы можем сделать вывод, что через много времени в самом городе будет приблизительно 20% населения и в пригородах — 80% независимо от первоначального распределения цаселения города и пригородов. Отметим, что по истечении длительного времени из города в пригороды будет ежегодно переселяться доля населения, равная 0,2 • 0,04 = 0,008, а из пригородов в город — доля, равная 0,8-0,01 = 0,008. Иными словами, при «равновесии», которое будет достигнуто через большой промежуток времени, из города в пригороды будет переселяться ровно столько народу, сколько из пригородов в город.
Пример 4. Предположим, что в условиях примера 3 нас интересует следующий вопрос. Допустим, что первоначально в городе и в пригородах имеется какое-то известное число республиканцев и демократов. Допустим также, что не происходит изменений в составе обеих партий и что в любой момент времени принятие решений о переселении не зави-
§ 9*. Дальнейшие примеры марковских цепей
325
быть представлены чис-
сит от партийной принадлежности. Какова при этих условиях вероятность того, что через много времени в этом городе будет заданное число республиканцев и демократов? Из предыдущего примера мы знаем, что в конечном счете происходит ежегодное переселение некоторого фиксированного числа людей из города в пригороды и того же самого числа из пригородов в город. Мы покажем, как можно решить поставленную задачу в одном очень простом частном случае.
Допустим, что когда равновесие достигнуто, имеется два человека в городе и 8 человек в пригородах, причем ежегодно один человек переселяется из города в пригороды и один из пригородов в город. Допустим далее, что всего имеется четыре республиканца и шесть демократов. Образуем марковскую цепь, принимая за состояние число городских жителей, являющихся республиканцами.
Таким образом, состояния могут лами 0, 1 и 2. Вероятности перехода могут быть вычислены следующим образом. Допустим, например, что мы рассматриваем состояние 1. Ситуация в этом случае представлена схематически на фиг. 119.
Чтобы перейти из состояния 1 в состояние 0, мы должны переселить одного республиканца из города и одного демократа из пригородов. Это произойдет с вероятностью 15	5
= -yg- • Чтобы перейти из состояния 1 в состояние 1, мы должны переселить из каждого места либо по одному республиканцу, либо по одному демократу. Вероятность такого переселения равна -g"’ТТ т 2’”8’==2’’ Остальные вероятности перехода находятся аналогично. Мы получаем матрицу вероятностей перехода
О 1 2 5 16
1
1
2
1
2
3
4
2
О
О
з
16
1 4
Р=1
I
О
2
326
Гл. V. Векторы и матрицы
Эта матрица регулярная, потому что ее квадрат содер-,	/1	8	2\
жит лишь положительные элементы, и / = (-3. 75’ ту)* (См. упр. 7.) Таким образом, вероятность того, что через много времени в городе не будет ни одного республиканца, равна приблизительно -у, что будет один республи-8	2
канец ^5 и что будет два республиканца -jg. Эти вероятности опять-таки не зависят от начального состояния.
Мы получим эти же предельные вероятности, если представим себе, что из группы, состоящей из десяти человек, среди которых имеется четыре республиканца и шесть демократов, выбираются наугад два человека, и находится вероятность наличия среди них ни одного, одного или двух республиканцев. (См. упр. 8.)
Интересно отметить, что здесь мы пришли к цепи, подобной цепи, используемой физиками в качестве грубой модели диффузии газов. (См. пример 1 из следующего параграфа).
Пример 5. Допустим, что перед вами две лотерейные машины, каждая из которых в случае выигрыша выплачивает одну и ту же сумму. Вам сообщили, что вероятность выиграть на машине А равна -у. а на машине В — только
Если вы собираетесь играть на одной из этих машин, то, естественно, вы захотите играть на А. Однако вам не указали, какая из этих машин А и какая В. Мы рассмотрим две системы игры, которые могут быть здесь использованы, и для каждой системы найдем долю попыток, при которых можно ожидать выигрыша.
При первой системе для принятия решения, играть ли следующий раз на той же самой машине или переменить машину, используется лишь результат последней игры. Предполагается, что при первой игре вы выбираете машину наугад. Если вы при этом выигрываете, то условная л	2
вероятность того, что вы играли на машине А, равна -у (почему?). Следовательно, если при первой игре вы выигрываете, то следующий раз вы играете на той же машине. Если же при первой игре вы проигрываете, то условная вероятность того, что вы играли на машине А, равна, как нетрудно подсчитать,-у. Следовательно, в этом случае вы
9*. Дальнейшие примеры марковских цепей
327
должны переменить машину. Поскольку вы руководствуетесь только предыдущим результатом. Каждая игра делается похожей на первую, так что вы всегда решаете Играть в следующий раз на прежней машине, если перед этим вы выиграли, и на другой машине, если перед этим вы проиграли.
Чтобы узнать, к чему может привести эта система, образуем марковскую цепь, взяв в качестве состояний машину А и машину В. Если вы играете на машине А, вероятность того, что вы будете играть на ней же в следующий раз, равна-g-> т. е. вероятности того, что вы выиграете. Другие вероятности перехода находятся подобным же образом, и мы получаем матрицу
А В
аЦ -1
А 2	2
(3	2 \
у> -g-l дает Для кй« ждой из машин вероятность того, что после Достаточно большого числа игр вы будете играть на этой машине. Таким образом, при этой системе можно ожидать, что вы бу-<	3	„
дете играть на машине А в-g- всех случаев Следовательно, вы будете выигрывать в доле всех игр, приблизительно о 3	1,2	1	2 t
равной 5-т+5--Т = -5=0,4.
Вторая система предполагает, что в принятии решения — менять или не менять машину — вы руководствуетесь исходами двух последних игр. Допустим, что после принятия каждого решения вы играете два раза и на основании исхода этих двух игр принимаете следующее решение. В этом случае условная вероятность того, что вы имели дело с машиной А, при условии, что исходом двух последних игр был «выигрыш — выигрыш», будет больше -g-- Она также больше -у и в случае, если исходом этих двух игр был «выигрыш — проигрыш» или «проигрыш — выигрыш». (См. упр. 10.) Следовательно, в каждом из этих случаев вы не меняете машину и при следующих двух играх. В случае «проигрыш — проигрыш» вероятность того, что вы имели дело с машиной А, меньше -g-, и вы меняете
328
Гл. V. Векторы и матрицы
машину. При такой системе игры матрица вероятностей перехода имеет вид:
А В
А
В
3	1
4	4
£ L
16" 16
Здесь А означает двукратную игру на машине А, а В — двукратную игру на машине В. Неподвижным вектором для этой матрицы будет (jg-» Таким образом, при та-9 кой системе вы будете играть на А приблизительно в
.	9	1,41
всех случаев и выиграете приблизительно в +	=
= -^- = 0,42 всех случаев. Итак, более сложная система увеличила среднее значение вашего выигрыша только на 0,02. При любой системе в самом лучшем случае можно рассчитывать на среднее значение выигрыша, равное у
Упражнения
1.	Покажите, что при разумных предположениях относительно значения р (или значений а и Ь) цепи, полученные в примере 1, являются регулярными.
(Указание. Используйте результат упр. 2 из § 8.)
2.	Используя результат упр. 3 из § 8, приближенно определите число людей, которым сообщено, что президент выставит свою кандидатуру на выборах. Объясните, почему это число не зависит от начального состояния,
3.	Пусть в примере2 а = у, b = с —н d =. Найдите неподвижный вектор. В какой доле будущих выборов можно ожидать победы республиканцев при этих предположениях?
4.	Пусть в примере 2 а = 1, Ь = 1, с = d п с отлично как от 0, гак и от 1. Покажите, что соответствующая матрица будет регулярной. Найдите неподвижный вектор. Какое ограничение эти предположения налагают на возможные последовательности исходов выборов?
>.44).]
5.	Пусть в примере 2 а = 0, a b, cud отличны как от 0, так и от 1. Будет ли соответствующая матрица регулярной? Покажите, что вектор (1, 0, 0, 0) является неподвижным вектором. Интерпретируйте этот вектор в терминах долгосрочного предсказания.
6.	Пусть в примере 2 а = О, d = 0, abac отличны как от 0, так и от 1. Что можно сказать в ?том случае о данной политической системе по истечении длительного времени?
[Отв.: Через некоторое время партия, стоящая у власти, будет продолжать оставаться у власти.]
§ 9*. Дальнейшие примеры марковских цепей
329
7.	Проверьте, что неподвижный вектор в примере 4 равен
М 8 _2_\ \ 3 ’ 15 ’ 15/
8.	Пусть из группы в десять человек, среди которых имеется четыре республиканца и шесть демократов, выбираются наугад двое. Найдите вероятность того, что (а) эти два человека являются республиканцами; (Ь) демократами, (с) один из них республиканец, а другой — демократ.
9.	Предположим, что некий коммивояжер ездит всегда из города А в город В и из города В в город С. Но из города С он ездит с вероятностью 1 1 „ „
-g- в город А и с вероятностью -g- в город В. Представьте поездки ком
мивояжера посредством вероятностей перехода?
марковской цепи. Будет ли регулярной матрица Если да, то найдите неподвижный вектор.
[Отв.: Да;< = (1,-|,|).]
10.	Предполагая в примере 5, что игра ведется по второй системе, найдите вероятность того, что игрок выбрал машину А при условии, что первые два исхода были «выигрыш — выигрыш». То же самое в случае каждой из трех остальных возможностей для первых двух исходов.
Г	4	4
I Оте.: „Выигрыш — выигрыш":	„выигрыш — проигрыш":-=•; „про-
L	о	/
4	4 1
игрыш — выигрыш":	„проигрыш—проигрыш": -гд--
/	Io J
11.	Пусть в примере 5 после каждых трех игр игрок принимает решение, на какой машине ои будет играть следующие три раза. Он меняет машину в том н только том случае, когда вероятность того, что он играл на машине А при условии трех последних исходов будет меньше -g-. В какой доле случаев игрок может ожидать выигрыша при такой системе? Лучше ли эта система, чем та система из примера 2, которая основана на учете результатов только двух предыдущих игр?	[Отв.-. 0,41; нет.]
12.	Показать, что вектор, указанный в примере 2. является неподвижным вектором матрицы вероятностей перехода.
13.	В упр. 10 из § 15 гл. IV найдите неподвижный вероятностный вектор и объясните полученный результат.
14.	Некий профессор старается не слишком часто опаздывать на лекции. Если он однажды опоздал, то в 90% случаев в следующий раз он приходит вовремя. Если он пришел вовремя, го в следующий раз в 30% случаев он опаздывает. Как часто в конечном счете он опаздывает на лекпии?
15.	У некоего профессора имеются три излюбленных вопроса, один из которых он задает на каждом экзамене (студенты хорошо знают его привычки!). Он никогда не задает один из этих вопросов два раза подряд. Если в прошлый раз им был задан вопрос № 1, то он бросает монету и задает вопрос № 2, если выпадает герб. Если это был вопрос № 2, он бросает две монеты и переходит к вопросу № 3, если выпадают два герба. Если это был вопрос № 3, то он бросает три монеты и переходит к вопросу № 1, если выпадают три герба. Какой из этих вопросов задает он в общем наиболее часто и как часто?
[Отв. Вопрос № 2; в 40% случаев.}
330
Гл. V. Векторы и матрицы
§ 10*. ПРИМЕРЫ МАРКОВСКИХ ЦЕПЕЙ В ФИЗИКЕ. ЭНТРОПИЯ
В физике, и в особенности при изучении газовых смесей, мы сталкиваемся со многими интересными примерами марковских цепей. В настоящем параграфе мы рассмотрим упрощенную модель молекулярного механизма перемешивания газов, предложенную двумя физиками и названную моделью Эренфеста. Кроме того, мы рассмотрим две простые модели явления диффузии. Хотя число молекул газа, рассматриваемое здесь и значительно меньше того, что наблюдается на практике, полученные результаты помогут объяснить экспериментально наблюдающиеся явления.
Пример 1. В первом примере мы рассмотрим простую модель перемешивания двух газов, которая уже рассматривалась выше (см. пример 3 из § 5 гл 4). Пусть у нас имеется 2п шаров, п белых и п черных, помещенных в две урны таким образом, что в каждой из урн находится по п шаров. Единичный эксперимент заключается в том, что из каждой урны случайным образом выбирается по одному шару, который и перекладывают в другую урну. Состояние процесса характеризуется числом / черных шаров в первой урне; при этом первая урна содержит п — j белых шаров, а вторая урна п — j черных шаров и j белых шаров. Вероятности перехода для рассматриваемой марковской цепи (ср. выше, стр. 255) равны:
pj,k — 0 для всех остальных значений k.
Легко видеть, что получившаяся марковская цепь является эргодической (более того, как показано в упр. 2, она является регулярной). В физике нас интересует процентное содержание шаров каждого типа в каждой из урн после большого числа шагов.
Для того чтобы ответить на этот вопрос, можно было бы вычислить неподвижный вектор, соответствующий матрице вероятностей перехода. Однако более интересно попытаться предугадать ответ. По-видимому, разумно предположить, что после большого числа обмена шарами они будут достаточно хорошо перемешаны и что вероятность найти какие-то определенные п шаров в урне 1 долж
§ 10*. Примеры марковских цепей в "физике. Энтропия
331
на быть такой же, как если бы мы просто наугад выбирали п шаров из 2п возможных и помещали их в урну 1. В этом случае вероятность того, что в этой урие окажется / черных шаров, равна
Можно проверить, что эти вероятности и в действительности удовлетворяют уравнениям, определяющим компоненты неподвижного вероятностного вектора матрицы вероятностей перехода. Частный случай этой задачи рассматривается в упр. 2.
Пример 2. В качестве второго примера рассмотрим модель поведения молекул газа, помещенных в объем, разделенный на две части тонкой проницаемой перегородкой. Как и раньше, мы сформулируем нашу задачу, исполь зуя в качестве модели урны с шарами.
Представим себе, что у нас есть две урны и 2п шаров, на этот раз одинакового цвета. Ежесекундно случайным образом выбирается один из 2п шаров и перекладывается из одной урны в другую. Если в первой урне находятся / шаров, то вероятность выбрать шар из первой урны равняется j/2n, а вероятность выбрать шар из второй урны — (2п — j)/2n. В качестве характеристики состояния системы выберем число / шаров в первой урне. Тогда из состояния / мы можем перейти непосредственно только либо в состояние / + 1, либо в состояние / — 1, причем вероятности перехода равны
п — 2п~} •
P]tk = Q при	/+1.
Эти величины задают матрицу вероятностей перехода эргодической, но не регулярной марковской цепи (см. упр. 3). Здесь, как и раньше, для физика представляет интерес вопрос о том, в какое состояние мы придем за большое число шагов. Как и в случае примера 1, мы можем интуитивно Предугадать правильный ответ После многих повторений описанного выше процесса можно ожидать, что независимо от начального распределения шаров процесс будет эквивалентен тому, как если бы мы клали шары по одному в случайным образом выбранную урну. Такой процесс является
332
Гл. V. Векторы и матрицы
процессом независимых испытаний. Вероятность того, что в первую урну попадет / шаров, здесь равна
(2")
(2)	Pj — 22л '
В § 6 гл. III мы определили энтропию рассматриваемой системы как log если система находится в состоянии /. Энтропия только на константу отличается от логарифма j-й компоненты неподвижного вероятностного вектора. Энтропия системы будет тем больше, чем ближе к равномерному распределение молекул между двумя областями рассматриваемого объема.
Прогнозируя состояние системы на длительный срок вперед, можно сказать, что состояние с большей энтропией в среднем является более вероятным, чем состояние с малой энтропией. В термодинамике это обстоятельство учитывается в связанных с вероятностями рассуждениях, где указывается, что система должна эволюционировать, переходя из состояния с низкой энтропией к состоянию с высокой энтропией. Так как соответствующая цепь является эргодической, то с течением времени мы можем из любого состояния попасть в любое другое состояние. Поэтому можно ожидать и перехода из состояния с высокой энтропией в состояние с низкой энтропией. Однако время, необходимое на то, чтобы перейти из состояния с высокой энтропией в состояние с низкой энтропией, намного больше, чем время, необходимое на переход из состояния с низкой энтропией в состояние с высокой энтропией.
Рассмотрим, например, частный случай описанной выше ситуации, предположив, что у нас имеется всего 4 шара. Тогда у процесса имеется 5 различных состояний, соответствующих тому, что в первую урну попадает 0, 1, 2, 3, 4 шара. Матрица вероятностей перехода в этом случае имеет
вид:
0
1
Р = 2
3
4
0 12 3 4
0 10 0
4	о	4	о
0	"2	°	2"
0	о	4	0
0	0	0	1
о о
о
X 4 о
§ 10*. Примеры марковских цепей в физике. Энтропия
333
Легко проверить, что неподвижным вектором этой матрицы является следующий вектор:
—(1 А А А А\ f ~ U6 ' 16 ' 16 ’ 16 ’ 16) 
Используя этот неподвижный вектор, мы можем сразу определить средний период повторения каждого из состояний. Так, если мы выйдем из состояния 0, то у нас уйдет в среднем 16 шагов на возвращение в это же состояние. Точно так же, исходя из состояния 1, необходимо сделать 2
в среднем 4 шага, из состояния 2— в среднем 2-д- шага до возвращения в первоначальное состояние. Среднее время повторения состояния 3 будет таким же, как и для состояния 1, а среднее время повторения состояния 4 — таким же, как и для состояния 0.
Энтропия системы равняется log 1 = 0, если система находится в одном из состояний 0 или 4, log 4, если система находится в состояниях 1или 3, и log 6, если система находится в состоянии 2. Найдем теперь среднее время перехода в состояние 0, т. е. в состояние с низкой энтропией. Для того чтобы определить это время, мы будем считать состояние 0 «поглощающим состоянием», т. е. будем считать, что из него система уже не переходит ни в какое другое состояние. (См. § 4 гл. VII.) При этом мы получим новую матрицу вероятностей перехода
0	1	|0 0 0 0]
1	2 4	о о СО О
см II а.	0	Ю|н- О ьэ| -о
3	0	-к о СО О
4	.0	0 0 10.
Для того чтобы определить среднее время перехода в «поглощающее состояние» 0, надо вычеркнуть из получен-
ной матрицы строку и столбец,	отвечающие состоянию 0,
мы получим матрицу	
0 3/4	0 0
V2 0	V2 0
Q ~ 0 3/4	0 V4 '
0 0	1 0
334
Гл. V. Векторы и матрицы
Образуем теперь матрицу N', обратную к матрице
ООО
1 О О
О 1 О
О 0 1
О */2 О О
3/4 О о %
3/4	О
О	1
о о
V4 о
1	—3/4	о	о
-V2	1	-У2	О
о	-3/4	1	-У4
0	0	11
эта матрица будет иметь вид
12 3 4
о 1®
8 3
я 2?
8 3
Я 2?
8 3
1
4
3
2 3
8^ 3
Вычислив произведение N'c, где с есть четырехмерный вектор-столбец, все компоненты которого равны 1, мы определим среднее число шагов, необходимое на то, чтобы попасть в поглощающее состояние, как функцию начального состояния; доказательство этого будет приведено в § 4 гл. VII. В нашем случае это произведение будет иметь вид
вектора:
6 4
8 16/3
8 20/з
8 20/з
1
4/з
5/з
8/з
15
18 4
20 4
О
214 о
Таким образом, для того чтобы прийти в состояние 0, исходя из состояния 1, системе требуется в среднем 15 шагов, а для того чтобы прийти в состояние 0 из состояния 3 — в среднем 20*/з шагов. Отметим, что все эти числа до-
§ 10*. Примеры марковских цепей в физике. Энтропия
335
статочно велики (даже для начального состояния 1). Таким образом, мы можем заключить, что процесс попадает в состояние с минимальной энтропией лишь после большого числа шагов.
Определим теперь среднее число шагов, необходимых для того, чтобы впервые попасть в состояние с максимальной энтропией, т. е. в состояние 2. Для этого будем считать состояние 2 поглощающим. В этом случае новой матрицей вероятностей перехода будет матрица
Далее последовательно имеем 0	10	0
п,,= V4	0	о	о
w	о	о	о	v4 ’
0	0	10.
(1—1 о о
0	0—1	1
0		1	3	4
0	4 3	4 3	0	0
1	1 3	4 3	0	0
N" = 3	0	0	4 3	1 3
4	0	0	4 3	4 3
336
Гл. К Векторы и матрицы
Отсюда следует
О
1
3
4
21
компоненты этого вектора имеют заметно меньшие значения, чем компоненты вектора N'c. Это указывает на то, что для достижения состояния с максимальной энтропией требуется гораздо меньше времени, чем на достижение состояний 0 или 4.
Пример 3. В качестве последнего примера рассмотрим область, разделенную на части так, как это показано на фиг. 120. Если молекула выхо-дит из одной из областей, она / \	с равной вероятностью может
/	\	попасть в любую из двух дру-
/ I Ц \	гих областей. Возвращаясь к
/	\ нашим задачам с урнами, мы
/	\ можем построить следующую мо-
III	дель такого перехода; у нас
имеется Зп шаров одинакового цвета, распределенных между фиг. 120	тремя урнами. Предположим, что
в первой урне находятся t, во второй — /, а в третьей — k шаров. Тогда с вероятностью t/Зя мы вынимаем шар из первой урны и с равной вероятностью кладем его в любую из двух оставшихся урн. Аналогично обстоит дело и для остальных урн. Для того чтобы описать этот процесс, мы хотим уменьшить возможное число его состояний и для этого объединить некоторые из элементарных состояний в одно новое состояние. Это позволит нам уменьшить размеры матрицы вероятностей перехода. Такое объединение состояний следует выполнять с достаточной осторожностью. (См. упр. 7, 8.)
В качестве состояния для нового процесса мы будем рассматривать тройку чисел (i, /, k), где	Это зна-
чит, что мы объединили в одно состояние все состояния, описывающиеся одинаковыми тремя числами независимо от того, в какой из областей находится интересующее нас число молекул. Теперь нам нужно исследовать различные
§ 10*. Примеры марковских цепей в физике. Энтропия 337
возможности перехода. Ясно, что процесс переходит из состояния в состояния (i—1, /+1, k) и (i—1, /, &+1) с вероятностью t/6n; в состояния (Z, /—1, &+1) и (i + 1, j—1, k) с вероятностью j/6n; наконец, в состояния (t + 1, j, k— 1) и (i, j + 1, k— 1) с вероятностью kfon.
Записывая состояния, в которые переходит процесс, мы предполагаем, что при необходимости числа в скобках переставляются таким образом, чтобы они располагались там в порядке убывания. Если мы хотим, как и раньше, предсказать значения предельных вероятностей, нам придется учесть объединение состояний. Если бы такого объединения не было, то можно было бы ожидать, что по истечении достаточно большого времени вероятность находиться в состоянии (Z, /, k) будет определяться выражением
З3"
Однако в том случае, когда несколько состояний объединяются в одно, необходимо складывать и отвечающие им вероятности. Если i = j = k = п, то никакого объединения состояний не произойдет; если i = j + k или i + j = k, то возможны три состояния, объединяемые в одно; наконец, если i Ф j Ф k, то шесть состояний объединяются в одно. Таким образом, мы получим предельные вероятности следующих трех типов. Если i = / — k = п, то вероятность соответствующего состояния равна
/ Зп \ \п, п, п) З3"
Если i = j 4=k или i ¥= j = k, то вероятность состояния
Равна	( Зп ч
\i, J, k) 3Зл-1	’
Если i=hj=!=k, то вероятность состояния равна
3Зп-1
Для того чтобы проиллюстрировать эту задачу, рассмотрим случай п = 2; другими словами, рассмотрим распределение шести шаров между тремя урнами. Перед объеди-
2'4 Зак. 994.
338
Гл. V. Векторы и матрицы
нением нам нужно было рассматривать 28 состояний, а после него — только 7. (См. упр. 4.) После объединения состояний матрица вероятностей перехода примет вид
	6,0,0	5,1,0	4,2,0	4,1, 1	3,3,0 3,2,1		2, 2,2
6, 0, 0	0	1	0	0	0	0	0
5, 1, 0	1 12	1 12	5 12	5 12	0	0	0
4, 2, 0	0	1 6	0	J_ 6	2 3	1 3	0
Р = 4, 1, 1	0	1 6	1 6	0	0	2 3	0
3, 3, 0	0	0	1 2	0	0	1 2	0
3, 2, 1	0	0	1 12	2 6	1 12	5 12	1 4
2, 2, 2	о	0	0	0	0	1	0
Неподвижный вероятностный вектор, вычисленный по указанным выше правилам, выглядит так:
_ /_1_ ± 10 10 20 40 10 \
\243’ 81’ 81’ 81’ 243 ’ 81’ 81 /'
Для системы, рассмотренной в этом примере, энтропия состояния определяется логарифмом числа возможных распределений молекул, при котором система окажется в рассматриваемом состоянии. Рассмотрим состояния до объединения. Для состояния с i шарами в урне 1, j шарами в урне 2 и k шарами в урне 3, энтропия будет равна
1	{ Зп \
В приведенном выше примере мы получим следующие энтропии для различных состояний:
Состояние	Энтропия состояния
6, 0, 0	log 1 = 0
5, 1, 0	log 6
4, 2, 0	log 15
3, 3, 0	log 20
4, 1, 1	log 30
3, 2, 1	log 60
2, 2, 2	log 90
§ /О*. Примеры марковских цепей в физике. Энтропия
ЗЗЭ
Наибольшей энтропией обладает состояние 2, 2,2. Заметим также, что, например, энтропия состояния 3, 3,0 меньше, чем энтропия состояния 3, 2, 1 и т. д.
Можно показать, что среднее количество шагов, необ* ходимое на то, чтобы перейти в состояние с наибольшей энтропией 2, 2, 2, не превышает 12 шагов, в то время как среднее число шагов, необходимое на то, чтобы перейти из состояния 2,2,2 в состояние 6,0,0, имеет порядок 280 шагов.
Как и в предыдущем примере, наибольшую энтропию имеет наиболее равномерное распределение. Доказательство этого основывается на свойствах полиномиальных коэффициентов. Проведем соответствующее доказательство для рассмотренного в этом примере случая. Доказательство того же положения для других, более сложных, случаев принципиально не отличается от рассматриваемого.
Теорема. Энтропия состояния системы (п,п,п) больше энтропии любого другого состояния.
Доказательство. Рассмотрим некоторое другое состояние (/, /, k), где i + j + k = 3>п. Переменив, если нужно, номера урн, мы можем считать, что ik и, конечно, что по крайней мере одно из этих неравенств является строгим. Мы знаем, что: энтропия системы в состоянии (п, п, п) равняется log Q 3” энтропия системы в состоянии (i, j, k) равняется logQ Легко видеть, что из состояния (п, п, п) в состояние (i, j, k) можно перейти за несколько шагов, каждый из которых состоит в уменьшении на 1 одного из характеризующих состояние трех чисел и в увеличении на 1 числа, стоящего слева от первого числа. Покажем, что на каждом таком шаге энтропия системы уменьшается. Рассмотрим переход из состояния (г, s, t) в состояние (г 4- 1, s, t—1). Отношение соответствующих полиномиальных коэффициентов равно
/ Зп \
\r, s, t) _(г4-1)! s!(/—1)! _ г+1 Зп \ ~ r!s!Z! ~ t
/4-1, s, t — 1)
где последнее неравенство вытекает из того, что r~^>t. Легко показать, что и остальные элементарные шаги также вызывают уменьшение энтропии. А поскольку из состояния (п, п, п) можно перейти в состояние (г, /, k) с помо
22*
340
Гл. V. Векторы и матрицы
щью одних таких шагов, на каждом из которых энтропия системы уменьшается, то энтропия состояния (i, j, k) должна быть меньше энтропии состояния (п, п, п).
Упражнения
1.	Покажите, что в задаче, разобранной в примере 1, Pjj = 0 только при j = 0 или дау матрицы Р- все диагональные элементы положительны. Воспользуйтесь этим для того, чтобы показать, что соответствующая марковская цепь является регулярной.
[Указание. Для доказательства эргодического характера марковской цепи, для которой матрица вероятностей перехода Р не. содержит нулевых элементов на главной диагонали, надо показать, что элементы матрицы Рг~1 (где г — число состояний) положительны.]
2.	В случае примера 1 постройте матрицу вероятностей перехода при условии, что п = 3. Покажите, что неподвижный вероятностный вектор этой матрицы определяется равенством (1), стр. 331.
3.	В случае примера 2 постройте матрицу вероятностей перехода при условии, что п = 3. Покажите, что соответствующая марковская цепь является эргодической, но не регулярной. Проверьте, совпадает ли предельный вероятностный вектор с вектором, заданным равенствами (2), стр. 332.
4.	Используйте результаты упр. 15 из § 6 гл. III для доказательства того, что число состояний в примере 3 до их объединения равно
(Зп + г— 1 \
\ За )‘
Используйте эту формулу для того, чтобы показать, что при п = 2, г = 3, число состояний равно 28. Чему будет равно это число при п = 3 и г = 3? При г = 3, п — 4?
5.	Обозначим через fm функции исхода m-го эксперимента в примере 2 Если m велико, то можно предположить, что
P[/m=j] = (2”)2-2".
Определите среднее значение fm*
[Указание. Сравните эту задачу с задачей об определении числа гербов, выпавших в процессе 2л бросаний монеты.]
6.	Пусть в примере 2 л = 2; предположим, что процесс начинается из состояния 4. Обозначим через fi, f3 первые три функции исхода этого процесса. Найдите среднее значение каждой из этих функций. Сделайте то же самое в предположении, что процесс начинается из состояния 2.
[Частичный отв.: если процесс начинается из состояния 4, то М [/.] = 3, М [Л]=272, м [/з] = 2‘/4.]
7.	Рассмотрим регулярную марковскую цепь с матрицей вероятностей перехода
12	3
10	0	1
/э = 2	'/з	7з	*/з .
3	I	72	о	72
Преобразуйте этот процесс в процесс с двумя состояниями, считая состояние (1, 2) старого процесса за первое состояние нового, а состояние
§ 11 *. Линейные функции и линейные преобразования
341
3 старого процесса за второе состояние нового. Покажите, что сообщение о том, что система находилась в состоянии (1,2) в течение двух последних шагов, содержит больше информации, чем сообщение о том, что система находилась в этом состоянии в течение последнего шага. Это будет означать, что такой объединенный процесс уже больше ие является марковским.
8.	Достаточное условие для того, чтобы марковская цепь после объединения ее состояний оставалась марковской, можно сформулировать следующим образом. Обозначим через Ei, Е2, ..., Ет множества объединенных между собой состояний. Вероятность перехода из состояния, принадлежащего Е / в состояние, принадлежащее множеству Ej, должна быть одинаковой для всех состояний, принадлежащих Ер Покажите, что для объединения, выполненного в примере 3, это условие выполняется. Покажите, что оно не выполняется в случае, рассмотренном в упр. 7,
§ 11*. ЛИНЕЙНЫЕ ФУНКЦИИ И ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ
Векторы и матрицы используются в науке прежде всего для представления нескольких различных величин в виде одной. Например, спрос на продукцию, производимую разными отраслями промышленности Соединенных Штатов Америки, можно представить посредством вектора-строки х. Мы рассматривали примеры, когда такая строка умножалась на вектор-столбец у и в результате получалось число х-у. Компоненты вектора у могут означать стоимость единицы продукции каждой отрасли. Тогда х-у показывает общую денежную стоимость требуемой продукции.
Этот пример типичен для случаев, которые могут встретиться в научном исследовании. Отметим, что здесь имеют место следующие два условия. Во-первых, если увеличить спрос в заданное число k раз, то в силу (kx) - у — k(xy) получим, что общая стоимость умножится на тот же самый множитель k. Во-вторых, если мы имеем сумму двух векторов спроса х и х', то (х + х') • у = (х • у) + (V • у), следовательно, отвечающие им общие стоимости также складываются.
Итак, мы видим, что посредством умножения на Вектор-стол-бец у каждый вектор-строка х переводится в некоторое число f (х), причем выполнены следующие два простых условия:
(i)	f(kx) — kf(x);
(ii)	f{x+x') =/(х)+/(-И-
Такое сопоставление каждой строке х некоторого числа/(х) мы назовем линейной функцией от х. Мы видим, что каждый вектор-столбец с п компонентами определяет некоторую линейную функцию от вектора-строки с п компонентами.
Линейные функции дают простейший тип зависимости К счастью, очень многие задачи можно решать, по крайней мере при
342
Гл. V. Векторы и матрица
ближенно, с помощью линейных функций. Хотя, вообще говоря, и не верно, что производство ста тонн стали обходится в десять раз дороже, чем производство десяти тонн, такое упрощение может служить разумным приближением. То же самое можно сказать о необходимом сырье, рабочей силе, стоимости перевозок и т. д. Обращение с линейными функциями настолько просто, что с ними стараются иметь дело всякий раз, когда для этого •есть основания.
Каждый вектор-столбец определяет некоторую линейную функцию. Верно и обратное: каждая линейная функция от векторов-строк может быть получена таким образом. Мы докажем это для линейных функций от трехмерных векторов-строк.
Предположим, что f ставит в соответствие каждому трехмерному вектору х некоторое число/(х) и обладает свойствами (i) и (ii). Рассмотрим три вектора специального вида:
ei = (1, 0, 0), е2=* (0, 1, 0), е3= (0, 0, 1).
Обозначим/(в!) через уи /(е2) через у? af(e3) через у3. Пусть /УА
у — I у2 )• Если х — (Xi, х2, Хз), то можно написать, что 'Уз'
х — Х1С1 + х2е2 + х3е3. Воспользовавшись свойствами (i) и (ii), мы получим
/ (X) =/(х1е1 -ь х2е24- х3е3) =
=/(-ЭД) +/(х2е2) +/(х3е3) = x1f(e1)-j-x2f(e2)+Хз/(е3) =
— Х1У14- Х2У2-ГХ3у3 = X • у.
Следовательно, вектор-столбец у определяет нашу линейную функцию f.
Пример 1. Одно учреждение закупает бумагу трех сортов: высшего, первого и второго. Количество покупаемой бумаги (в пачках) представлено вектором-строкой х = = (20, 50, 70). Цена за пачку каждого сорта представлена
/160 \
(в центах) вектором-столбцом у == I 140 I. Тогда/(х) — \ 120 /
= Х’У = 186 долларов означает общую стоимость заказа.
Пока у определяет линейную функцию от х. Но для покупателя, заказывающего 100 или более пачек одного сорта, обычно делается скидка. И если расчет производится по новым правилам, то тем самым вводится новая функция, отличная от/. Обозначим ее буквой g. Тогда g(2x) <2g(x),
§ 11 *. Линейные функции и линейные преобразования
343'
потому что на бумагу первого и второго сорта делается скидка. Следовательно, функция g— нелинейная.
Многие из функций, встречающихся в науке, являются почти линейными для значений компонент, принадлежащих некоторой ограниченной области, но перестают быть даже приближенно линейными вне этой области.
Иногда векторам-строкам ставятся в соответствие не просто числа, а системы чисел. Тогда говорят, что эти векторы преобразуются в другие векторы. Мы встречались с примером такого рода в § 3, когда вектор-строка, показывающая, сколько строится домов различного типа, преобразовывалась в вектор-строку, показывающую количество строительных материалов. Преобразование вектора называется линейным преобразованием, если каждая компонента получаемого в результате вектора является линейной функцией от преобразуемой^ вектора.
Из определения линейного преобразования непосредственно следует, что его можно представить с помощью некоторой системы векторов-столбцов, которая может быть также записана в виде матрицы. Обратно, каждая матрица определяет некоторое линейное преобразование векторов. Наконец, из (i) и (и)-следует, что всякое линейное преобразование Т обладает свойствами T(kx) = kT(x) и Т(х + х') = Т(х) + Т(х'), где х и х' — векторы, a k — число.
Пример 2. Допустим, что граждане Соединенных Штатов Америки разделены на пять групп соответственно их годовому доходу. Компоненты вектора-строки х означают число людей, принадлежащих каждой категории. Скажем, Х\ человек имеют доход в 100 000 долларов и выше, х2 человек имеют доход от 20000 до 100000 долларов и т. д. Если для каждой категории известно среднее число автомобилей, находящихся во владении одного человека, то можно записать эти пять чисел в виде вектора-столбца, и мы получим общее число личных автомобилей как линейную функцию от х. Подобным же образом мы можем получить общее число находящихся в частном владении яхт, домов, телевизоров. Каждая из этих четырех величин является линейной ф} нкцией от х (по крайней мере приближенно) и каждая определяется пятимерным вектором-столбцом, элементы которого указывают среднее число соответствующих предметов, находящихся во владении одного человека. Записав эти четыре вектора вместе в виде прямоугольной таблицы, мы получим некоторую (5X4)-матрицу. Эта матрица определяет линейное преобразование, переводящее х в четырехмерный вектор-строку, ком
344
Гл. V. Векторы и матрицы
поненты которого означают соответственно среднее число автомобилей, яхт, домов и телевизоров, каким владеет лицо с данным имущественным состоянием.
Упражнения
T. х = (хь х2, *3) • Для каждой из следующих функций проверьте, обладает лн она свойствами (i) и (ii):
(а)	/(х) = 3xj + хг — 2х3;	[Отв.: Да.]
(b)	f(x) = х,х2х3;
(с)	/ (х) = V (xt)2 + (х2)2 + (х3)2; [Отв.: Нет.]
(d)	/(х) = х2.
2.	х — (xi,x2). Для каждого из следующих преобразований х в у проверьте, будет ли оно линейным:
(а)	у( =2х] ~рЗх2 и у2 = X]—х2; [Оте.: Линейное.]
(Ь)	у, = х!-|-2х2 и у2 = — xtx2; [Отв.: Нелинейное.] (с)У1= х2	и у2 = —хр
Для каждого преобразования, оказавшегося линейным, напишите матрицу, представляющую это преобразование.
3.	Докажите, что функция f(x) = с, где х— двумерный вектор-строка, а с — константа, будет линейной функцией тогда и только тогда, когда с = 0.
4.	Докажите, что функция /(х) = axi + t>x2 + с, где х — двумерный вектор-строка, а а, Ь и с — константы, будет линейной функцией тогда и только тогда, когда с = 0.
5.	Докажите, что преобразование Т (х) = хА + с, где х и с — двумерные векторы-строки, а А — квадратная матрица второго порядка, будет линейным преобразованием тогда и только тогда, когда с = 0.
6.	Докажите, что f (х) = (наименьшей компоненте х) не есть линейная функция.
7.	Пусть х—12-мерный вектор-строка, компонентами которого служат числа рисунков в двенадцати математических книгах. Приведите пример (а) линейной функции от х,
[Отв.: Общее число рисунков во всех книгах.] (Ь) линейного преобразования х,
(с) нелинейной функции от х.
8.	Пусть компонентами вектора х служат: число научных книг, число прочих книг и число журналов, имеющихся в какой-то библиотеке. Установите, какие из следующих функций являются линейными функциями от х:
(а)	число всех изданий;	[Отв.: Линейная.]
(Ь)	число всех карточек в каталоге. (Следует считать, что на каждую книгу заведены две карточки, а на всякий журнал одна карточка.)
8. Если в (i) и (ii) понимать под х вектор-столбец, то мы получим определение линейной функции от вектора-столбца. Каким образом можно
$ 12*. Р-матрицы
345
представить такую функцию? Каким образом можно представить линейное преобразование вектора-столбца?
10. Покажите, что матрицу R, определенную в § 3, можно рассматривать и как преобразование вектора-строки и как преобразование вектора-столбца.
§ 12*. Р-МЛТРИЦЫ
В гл III перестановкой п объектов было названо расположение этих объектов в определенном порядке. Так, для множества {о, Ь, с} имеется шесть перестановок: abc, acb, bac, bca, cab и cba. Можно рассматривать перестановки и с несколько иной точки зрения Мы можем представлять себе, что первоначально наше множество было задано в определенном порядке, например abv. Тогда перестановку можно мыслить как некоторое изменение порядка в этом множестве. Например, одна из перестановок изменит порядок abc на Ьас, т. е. первый элемент ставит на второе место, второй — на первое место, а третий элемент оставляет на месте. Чтобы для числа всех перестановок получалось прежнее значение п!, мы должны учесть и «изменение порядка», ничего не меняющее, т. е. такую перестановку, которая «меняет» abc на abc. Будем считать наши п объектов компонентами некоторого вектора-строки. Каждая перестановка переводит любой вектор-строку в другой вектор-строку, имеющий те же самые компоненты, но, возможно, расположенные в измененном порядке.
Удобно описывать перестановки матрицами специального вида. Например, приведенное выше изменение порядка трех элементов можно получить, рассматривая произведение
/0
(Хр х2, х3) • I 1
\0
1 °\
0 0 1 = (х2, хг, х3).
0 1/
Здесь мы не обязаны считать xt числами. Это могут быть объекты любой природы, для которых умножение на 0 и на 1 и сложение определено, как для чисел. Тогда (3 X 3)-матрица может служить для представления нашей перестановки. Ее элементами являются только нули и единицы, причем в каждой строке и каждом столбце стоит точно одна единица.
Определение. Р-матрицей называется квадратная матрица, в каждой строке и в каждом столбце которой имеется в точности один элемент 1, а на всех остальных местах стоят элементы 0.
346
Гл. V. Векторы и матрицы
Примеры P-матриц указаны на фиг. 121, где имеется одна матрица порядка 2, две — порядка 3 и одна матрица порядка 4.
,0	/О 1 0\	/10 0\
Л = к 0), £ = 1 0 О 11, С = ( 0 1 0 1,
4	7	\1 0 0/	\0 0 1 /
0 10 0
_ 1 О О О D~ 0010-
0 0 0 1
Ф и г. 121
Теорема 1 Любая P-матрица порядка п определяет некоторую перестановку п объектов, и каждая такая перестановка имеет единственное представление с помощью Р-матрицы.
Рассмотрим п объектов Лд, х2, ..., хп, которые после какой-то перестановки располагаются в измененном порядке: Ух, Уъ  • •, Уп- Здесь каждый у является некоторым х и каждый х является некоторым у. Если yj — xit это означает, что объект, стоявший на i-м месте, переведен на /-е место. В этом случае мы полагаем Щ,— 1 и агй = 0 для k #= i. Проделав это для каждого I, мы получим P-матрицу А порядка п такую, что
;(1)	(%!, х2,	х„) А = (уь у2,	у„).
Тот факт, что в каждой строке (столбце) матрицы А стоит в точности одна 1 (т. е. что А является P-матрицей), вытекает из того, что при перестановке каждый элемент фигурирует в измененном расположении один и только один раз.
С другой стороны, если задана некоторая ^-матрица А, то задать перестановку мы можем с помощью произведения (1). То обстоятельство, что каждый столбец матрицы А содержит точно одну 1, означает, что каждый у, является некоторым х^ а то, что каждая строка матрицы А содержит точно одну 1, означает, что каждый Xi фигурирует в качестве только одного у,. Следовательно, компоненты вектора (уи у %, ...» у J представляют собой перестановку компонент вектора (xlt х2, хп), чем и завершается доказательство теоремы.
В последующем рассуждении мы ограничимся для иллюстрации случаем п — 4, но все полученные нами результаты будут
$ 12*. Р-матрицы
347
справедливы для любого п. На фиг, 122 мы видим четыре Р-мат-
рицы четвертого порядка			
	10 0 0		0 10 0
	0 10 0		0 0 0 1
7 =	0 0 10	, J—	0 0 10
	0 0 0 1		10 0 0
	0 10 0		0 0 0 1
	10 0 0		10 0 0
К=	0 0 0 1	, L =	0 0 10
	0 0 10		0 10 0
	ф	иг. 122	
Мы хотим исследовать произведение двух P-матриц. Если X = (ХЬ Х2, Х3, Х4), ТО х/ — (Х4, Х1, Х3, Х2) И хК = (х2, Х1, Х4, Хз) , Первая из этих перестановок переводит первую компоненту на второе место, вторую компоненту на четвертое место и четвертую компоненту — на первое место; третья компонента остается на месте. Вторая перестановка меняет местами две первые и две последние компоненты Что получится, если выполнить эти две перестановки одну за другой? Рассмотрим сначала Xj. После первого преобразования эта первая компонента делается второй компонентой, после второго преобразования вторая компонента делается первой. Следовательно, в результате xj возвращается на свое первое место. Компонента х2 сначала переводится на четвертое место, а затем вторым преобразованием переводится на третье место. Следовательно, х2 становится в итоге третьей компонентой. Компонента х3 сначала оставляется на месте, а затем преобразуется в четвертую компоненту. Компонента х4 при первом преобразовании переводится на первое место, а при втором преобразовании — на второе место. Следовательно, начав с вектора-строки х, после выполнения двух преобразований мы приходим к вектору (хь х4, х2, Хз).
Теперь рассмотрим произведение
1 000
_ 0 0 1 О JK~ 0 0 0 1-
0 10 0
Матрица JK снова является P-матрицей, и легко проверить, что она дает в точности описанную выше перестановку
348
Гл. V. Векторы и матрицы
Теорема 2. Произведение JK двух P-матриц одинакового порядка снова является P-матрицей. Эта матрица соответствует результату последовательного выполнения сначала перестановки J, затем перестановки К.
Эту теорему очень легко доказать, если воспользоваться известными свойствами произведения матриц. Мы хотим узнать, что представляет собой x(JK). На основании ассоциативного закона (см. § 4) это выражение совпадает с (х/)Д. Но xJ является результатом перестановки J, а (х/)К — результатом применения перестановки К к xJ. Тем самым теорема доказана.
Вернемся теперь снова к фиг. 122 и рассмотрим произведения U и П. Ясно, конечно, что IJ = Л — J. В этом случае теорема 2 говорит нам, что последовательное выполнение перестановки 1 и перестановки J (или наоборот) равносильно выполнению одной только перестановки J. Принимая во внимание, что перестановка I оставляет все компоненты вектора на месте, можно считать этот результат очевидным.
Рассмотрим теперь произведение JL, где J и L снова заимствованы из фиг. 122. Это произведение равно I, следовательно, L = Л1. По теореме 2 перестановка L, выполненная вслед за J, Дает тот же самый результат, что и перестановка I, т. е. вообще ничего не меняет. Таким образом, мы видим, что L = /-> уничтожает все изменения, произведенные перестановкой J. Обратим внимание на сходство в структуре 1 и L: вторая из этих матриц получается из первой путем поворота вокруг главной диагонали (т. е. диагонали, идущей от верхнего левого угла к нижнему правому углу). Другими словами, элемент матрицы L, стоящий в i-й строке и /-м столбце, равен элементу матрицы J, стоящему в j-й строке и l-м столбце.
Определение 2. Матрицей, транспонированной по отношению к квадратной матрице А, называется матрица А*, полученная путем поворота А вокруг ее главной Диагонали, т. е. такая, элементы которой а1} определены следующим образом; а*. - = а...
I] и
Теорема 3. Если А является P-матрицей, то А* — обратная к ней матрица Иначе говоря, А* осуществляет перестановку, уничтожающую действие перестановки А.
Мы должны показать, что А* уничтожает действие А; все остальное вытекает из предыдущих рассуждений и § 6. Предположим, что =1. Тогда яу; = 1; следовательно, перестановка А переводит компоненту Xj в i-e положение. Но затем вследствие a*j — 1 эта компонента переходит из t-ro положения в /-е. Следовательно, х}- возвращается в у-е положение, в котором она вначале находилась, Это происходит с каждой компонентой, и,
ff 12*. P-матрицы
349
таким образом, А* уничтожает действие А. Теорема доказана.
Определение 3. Множество объектов образует группу (по умножению), если
(i)	произведение двух элементов множества снова является элементом этого множества;
(ii)	во множестве имеется элемент I, называемый единичным элементом, такой, что для каждого А, принадлежащего множеству, 1А = А! = А;
(iii)	для каждого А, принадлежащего множеству, имеется элемент А~1, также принадлежащий этому множеству и такой, что АА~' = А~'А = /;
(iv)	для любых А, В, С, принадлежащих множеству, А(ВС) = АВ (С).
Определение 4. Множество объектов образует коммутативную группу, если, кроме предыдущих четырех свойств, выполняется следующее свойство:
(v)	Для любых А и В, принадлежащих множеству, АВ = ВА.
Теорема 4. Р-матрицы п-го порядка образуют группу (относительно умножения матриц). При п>2 эта группа некоммутативна.
Доказательство. Свойство (i) доказано в теореме 2. Свойство (ii) следует из того более общего факта, что IM = =MI = М для всякой матрицы М порядка п. Из теоремы 3 мы знаем, что А имеет обратную матрицу, а именно /Г1 = А*. Легко видеть, что А* снова будет P-матрицей (см. упр. 1). Отсюда вытекает (iii). Справедливость (iv) опять-таки следует из более общей теоремы, согласно которой умножение любых матриц подчиняется ассоциативному закону (см. § 4). С другой стороны, для любого п > 2 легко привести пример, когда АВ 4= ВА (см. упр. 3). Этим завершается доказательство теоремы.
Группа, образованная матрицами порядка п, известна под названием группы перестановок (или группы подстановок) п-й степени. Так как перестановками пользуются для изучения симметрии, то эту группу также называют симметрической группой п-й степени.
Упражнения
1.	Докажите, что матрица, транспонированная по отношению к Р-матрице, снова является Р-матрицей, т. е. что если Р удовлетворяет определению 1, то и Р* удовлетворяет этому определению,
2.	Выпишите все P-матрицы порядка 1 Выпишите все P-матрицы порядка 2. Покажите, что соответствующие две группы коммутативны.
3.	При п > 2 мы можем построить матрицу А, которая переставляет только Xi И хг, и матрицу В, которая переставляет только Xj и х$. Какие
350
Гл. V. Векторы и матрицы
перестановки производят матрицы АВ и В At Будут ли она одинаковыми? Воспользуйтесь этим для доказательства тоге, что rpyriHa перестаисвок любой степени п > 2 некоммутативна
4.	Напишите матрицы перестановок, переводящих (xi, х2, х3, х4) в:
(а)	(%2. х3. х4, х,);
(Ь)	(х„ х3, х2, х4);
(с)	(х2, х3, xlt xt);
(d)	(xlt x2, x3, x4).
	0	0	0	1
	1	0	0	0
Оте.', (а)				
	0	1	0	0
—	. 0	0	1	0
5.	Для следующих пар матриц найдите перестановки, ими представленные. Покажите для каждого случая, что АВ представляет перестановку А, производимую вслед за перестановкой В, и что ВА представляет перестановку В, производимую вслед за перестановкой А.
	/0	1	0\			/ 1	0	0\		
(а) Л =	0	0	1		в =	0	0	1	>	
	11	0	0/			<0	1	0/		
	/0	1	0\			/0	0	1 \		
(Ь) А =	0	0	1		в =	1	0	0	J	
	\ 1	0	о)			\0	1	о)		
	0	1	0	0		0	1	0	0	
(с) Л =	0 1	0 0	0 0	1 0		1 0	0 0	0 0	0 1	•
	. 0	0	1	0 .		0	0	1	0 .	
[Оте.: (а) хЛ = (х хВЛ = (х2, х„ х3).]		3>	Xj, х2);		хВ = (xj,		Х3,	х2); хАВ = (х3, х2, х,)		
6.	Докажите, что множество всех (3X3)-матриц не образует группы (относительно умножения матриц).
7.	Воспользовавшись теоремой 3, найдите матрицы, обратные к шести матрицам, фигурирующим в упр. 5. Проверьте полученные результаты путем умножения этих матриц на обратные к ним.
/0 0 1 \	/1 0 0\-
Ome.: (a) A~L= I 1 0 0 I; В'1 = I 0 0 1).
\0 1 0/	\0 1 0/
8.	Операцию деления обычно вводят, говоря, что Ь]а служит решением уравнения ах = Ь (или ха = Ь),
(а)	Докажите, что в группе уравнение АХ = В всегда имеет единственное решение.
£ 13*. Подгруппы группы перестановок
351
(Ь)	Докажите, что в группе уравнение ХА = В всегда имеет единствен-ное решение.
(с)	Покажите на примере, что эти два уравнения не обязаны иметь одно и то же решение.
9.	Во множестве чисел {1, 2. 3. 4} мы зададим «умножение» посредством следующей таблицы:
	X	1	2	3	4
	1	1	2	3	4
	2	2	4	1	3
	3	3	1	4	2
		4	3	2	1
					
(Эта таблица построена путем отбрасывания чисел, Кратных 5, Например, 2 X 4 = 8, но мы отбрасываем число 5, сохраняя только остаток 3 Подобным же образом, 3 X 4 = 12, но мы отбрасываем число 10, являющееся кратным числа 5, и сохраняем только остаток 2.) Докажите, что это множество с так определенным умножением представляет собой коммутативную группу.
10	Выпишите таблицу умножения для чисел множества {1, 2, 3, 4, 5, 6), построенного путем отбрасывания кратных числа 7. (См. упр. 9.) Докажите, что таким образом мы получим коммутативную группу.
11.	Напишите таблицу умножения для чисел множества {1, 2, 3, 4, 5, 6}, построенную путем отбрасывания кратных числа 6, (Ср. упр. 9 и 10.) Докажите, что в результате мы не получим группы. Почему числа 5 и 7 приводят к группе, а число 6 — нет?
12.	Выпишите все P-матрицы порядка 3 и обозначьте их буквами. Напишите таблицу умножения для этой группы. Каким образом из одной только этой таблицы можно увидеть, что выполнены свойства (i), (ii) и (ill)? Как можно увидеть, что свойство (v] не выполнено?
§ 13*. ПОДГРУППЫ ГРУППЫ ПЕРЕСТАНОВОК
Иногда в группе может содержаться меньшая группа. Здесь мы будем изучать некоторые подгруппы группы перестановок. Условимся, что всякий раз, когда мы говорим о группе, мы имеем в виду множество с конечным числом элементов. Это относится, в частности, к нижеследующим теоремам, так как некоторые из них не верны для групп с бесконечным числом элементов. Понятие группы имеет важные применения к бесконеч
352
Гл. V. Векторы и матрицы
ным множествам, но этот случай не рассматривается в нашей книге.
Определение 1. Если данное множество G (с заданным законом умножения элементов) образует группу и некоторое его подмножество Н также образует группу, то Н называется подгруппой G.
Теорема 1. Степени любого элемента группы образуют коммутативную группу.
Доказательство. Возьмем какой-нибудь элемент А заданной группы; нужно показать, что степени Ап обладают свойствами (i) — (v), перечисленными в предыдущем параграфе. Произведение двух степеней снова будет степенью: A’Ak=^A’+k. Следовательно, (i) выполняется. Заметим далее, что все степени не могут быть различными, так как в противном случае в группе оказалось бы бесконечно много элементов. Поэтому должно выполняться равенство Аз = Ak, скажем, с j > k. Но это значит, что А’~к — 1. Таким образом, I является некоторой степенью А, скажем I~Am. Следовательно, (ii) выполняется. Если т=1 или 2, то А будет обратным к самому себе (см. упр. 9). С другой стороны, если m > 2, то среди степеней А будет находиться Д'"-1, и ДДт-1 — Д'" —так что Д”2-1 будет элементом, обратным к А. Таким образом, и свойство (iii) выполняется. Выполнение ассоциативного закона (iv) следует из его выполнимости для всех элементов исходной группы. Наконец, коммутивность (v) следует из того, что А* Ак — Ai+k = Ak+i = AkAj. Этим самым все доказано.
Определение 2. Группа, состоящая из степеней одного элемента А, называется циклической группой, порожденной А.
Таким образом, чтобы образовать какую-нибудь циклическую подгруппу данной группы, нужно взять один элемент А и построить все его степени.
Пример 1. В группе перестановок степени 4 имеется 4! — 24 элементов. Рассмотрим циклическую подгруппу, порожденную / (см. фиг. 122). Мы находим, что J2 = L = /-*, так что /3 — JJ2 = I. Таким образом, наша циклическая подгруппа состоит из J, /2 —L и /3 = /.
Если продолжать брать более высокие степени, то получатся /4 = J, J6 — L, 7® = /, и т. д. Элементы повторяются, снова и снова проходя исходный «цикл». Отсюда и произошел термин «циклическая группа».
Пример 2. Чтобы получить большую циклическую подгруппу, возьмем матрицу М и все ее степени (см. фиг. 123).
§ 13*. Подгруппы группы перестановок
353
Эта подгруппа имеет четыре элемента, поэтому М~1 = = М* = М3 и Л44 = I.
	/0 1 0 0\		/0 0 1 0\	
	0 0 10		0 0 0 1	
м=\		М2 =		
	0 0 0 1		10 0 0	
	\1 0 0 о/		^0100/	
	/0 0 0 1\		/1 0 0 0\	
	Ч 0 0 0		0 10 01	
М3 =		А14 —		
	0 10 0		0 0 10	
	\0 0 1 о/		\0 0 0 1/	
Фиг. 123
Теорема 2. Если в группе выбрать любое подмножество, обладающее свойством (i), то это подмножество образует подгруппу.
Доказательство. Требуется установить, что это подмножество обладает также свойствами (ii)— (iv). Пусть А — любой элемент подмножества. Ввиду (i) АА = А2 также принадлежит подмножеству, а тогда и АА2 = Л3 принадлежит подмножеству и т. д. Следовательно, все степени А лежат в этом подмножестве. В числе этих степеней окажутся I и Л-1 Следовательно, свойства (ii) и (iii) выполняются. Свойство (iv) опять-таки следует из того, что оно присуще элементам всей группы. Теорема доказана.
Теперь мы располагаем практическим способом для нахождения подгрупп. Выбрав из элементов группы один или несколько элементов, мы образуем из них все возможные произведения, используя при этом каждый элемент нужное число раз. После того как будут получены все возможные произведения, среди них будет находиться и произведение любых произведений, так что свойство (i) будет выполнено. Тогда по теореме 2 мы имеем подгруппу. Эта подгруппа называется подгруппой, порожденной данными элементами. Один элемент порождает циклическую подгруппу. Некоторые очень интересные подгруппы порождаются двумя элементами.
Пример 3. Возьмем j2 (см. фиг. 122) и D (см. фиг. 121) и найдем порождаемую ими подгруппу. Прежде всего мы получим степени /, именно J, J2 = L и /3 = I, как и в примере 1. Затем мы имеем D и D2 — I. В произведениях, образованных с участием как /, так и D, достаточно рассматривать только J, J2 и D, так как следующая более высокая
23 Зак 994.
354
Гл. V. Векторы и матрицы
степень равна I, а затем эти степени повторяются. Теоретически следовало бы рассмотреть произведения вроде DJDJ2 и JDJDJDJ, но такие длинные произведения не дают ничего нового, что можно показать следующим образом. Во-первых, DJ = J2D, так что в длинном произведении всегда можно заменить DJ на PD и тем самым переместить все J в начало, а все D в конец. (См. упр. 14.) Поэтому единственные произведения, которые нужно добавить, имеют вид JaDb\ а так как J может появиться только в первой или во второй степени, a D— только в первой, из этих новых произведений останутся лишь JD и J2D. Следовательно, наша подгруппа состоит из шести элементов: J, /2, D, I, JD и J2D. Ввиду JD Ф DJ эта подгруппа не комму* тативна.
Найденные нами до сих пор подгруппы состоят из 3, 4 и 6 элементов. Каждое из этих чисел является делителем числа 24 — числа всех элементов рассматриваемой группы. Можно показать, что число элементов подгруппы всегда является делителем числа элементов самой группы, но мы не станем здесь доказывать этого факта.
Пример 4. Найдем подгруппу, порождаемую D и К-Так как D2 — I = К2, то в произведениях будут фигурировать только первые степени D и К. Кроме того, DK = KD-, следовательно, подгруппа будет иметь только четыре элемента: I, D, К и DK. Эта подгруппа коммутативная.
То обстоятельство, что данная подгруппа оказалась коммутативной, есть частный случай следующей теоремы:
Теорема 3. Если элементы А и В коммутируют (т. е. АВ = ВА), то любые два произведения, образованные из А и В, также коммутируют. Следовательно, подгруппа, порожденная А и В, будет коммутативной.
Доказательство. В любом произведении, составленном из А и В, скажем ААВВВАВАВ, мы можем, воспользовавшись соотношением АВ = ВА, собрать все А в начале и все В в конце. Следовательно, это произведение можно записать в виде А1В’. Второе такое произведение можно записать в виде AkBm. В их произведении (AlBJ) • (AkBm) снова можно собрать все А вначале. Следовательно, (AlBJ)  (AkBm) = Ai+bB>+m = Ak+lBm+>'= = (AkBm) • (A‘Bj), что и требовалось доказать.
Мы нашли коммутативные подгруппы двух типов: (1) циклическую подгруппу и (2) подгруппу, порожденную двумя коммутирующими элементами. Во втором случае удобно иметь способ для нахождения двух коммутирующих элементов. Мы изложим один метод нахождения таких пар.
§ 13*. Подгруппы группы перестановок
355
О п р е д е л е н и е 3. Эффективным множеством Р-матрицы называется множество всех тех компонент вектора-строки, которые не остаются на месте в результате перестановки.
Например, {хь х2} будет эффективным множеством для D, {xi, х2, х4} для /, {xb х2, xs, х4} для К, а эффективным множеством для I будет пустое множество.
Определение 4. P-матрица, эффективное множество которой содержит все компоненты, называется полной Р-матрицей.
Например, К является полной Р-матрицей.
Теорема 4. Две P-матрицы, эффективные множества которых не пересекаются, коммутируют.
Доказательство. Пусть эффективным множеством матрицы Ai является Xit а эффективным множеством матрицы А2 является Х2, так что Хл П Х2 = О. Тогда Л4Л2 произведет сначала некоторое изменение Хи а затем некоторое изменение Х2. Первое изменение не затрагивает Х2, поскольку Xj и Х2 не имеют общих элементов. Следовательно, мы получим тот же результат, если выполним сначала перестановку А2, а затем перестановку Ль
Теперь мы располагаем простым способом получения коммутативной группы, отличной от циклической: мы выбираем любые две матрицы (отличные от /) с непересекающимися эффективными множествами и находим порождаемую ими подгруппу.
Упражнения
1.	Выпишите все P-матрицы третьего порядка.
2.	Для каждой из шести матриц упр. 1 образуйте порождаемую этой матрицей циклическую подгруппу. Будут ли все эти подгруппы различными?
[Отв.: Пять различных групп; одна из одного элемента, три из двух, •	две из трех.]
3.	Докажите, что не существует никаких подгрупп группы перестановок степени 3, отличных от найденных в упр. 2 и от всей этой группы.
4.	Выпишите 24 P-матрицы четвертого порядка.
5.	Образуйте все циклические подгруппы группы матриц упр. 4. Сколько получается различных подгрупп? Сколько элементов имеет каждая из них?
[Отв.: 17 различных групп; одна из одного элемента; 9 из двух; 8 из
трех; 6 из четырех.]
6.	Покажите на примере, что подгруппами, найденными в упр. 5, не исчерпываются подгруппы группы перестановок 4-й степени (отличные от всей группы).
7	Докажите следующие свойства перестановок:
(а)	перестановка I порождает единичную подгруппу;
(Ь)	перестановка, которая лишь переставляет элементы одной или более пар, порождает подгруппу из двух элементов;
(с)	всякая другая перестановка порождает подгруппу, более чем с двумя элементами,
23*
356
Гл. V. Векторы и матрицы
8.	Докажите, что подгруппа, порожденная А и В, будет циклической тогда и холько тогда, когда или А является степенью В, или В является степенью А.
9.	Докажите, что если подгруппа, порожденная матрицей, состоит из одного или двух элементов, то эта матрица совпадает со своей обратной.
10.	Матрица М называется симметричной, если т{. = т.. для всех г и j. Докажите, что P-матрица тогда и только тогда будет симметричной, когда она совпадает со своей обратной.
11.	Найдите подгруппу, порождаемую У и К.
[Отв.: Подгруппа из 12 элементов.]
12.	Докажите следующие предложения об эффективных множествах:
(а)	Эффективное множество матрицы I пусто.
(Ь)	Эффективное множество P-матрицы, которая лишь переставляет какие-нибудь два элемента, состоит из двух элементов.
(с)	Для всех остальных P-матриц эффективное множество содержит по меньшей мере три элемента.
(d)	P-матрица является полной тогда и только тогда, когда число элементов ее эффективного множества равно ее порядку.
13.	Мы желаем образовать коммутативную подгруппу группы перестановок 4-й степени с помощью описанного выше метода. Мы хотим взять две матрицы (отличные от единичной) с непересекающимися эффективными множествами и получить порождаемую ими подгруппу.
(а)	Используя результат упр. 12, определите, сколько элементов должны иметь эти два эффективных множества.	[Отв.: 2; 2.]
(Ь)	Выберите нужную пару матриц.
(с)	Найдите подгруппу.
14.	Докажите следующие предложения, относящиеся к примеру 3:
(a) DJ = J2D\
(b)DJ2 — JD.	[Указание. Воспользуйтесь результатом (а).]
(с) В любом произведении, построенном хиз D. и J, можно собрать все J вначале.
15.	Если Ат = I и т— четное число, то Ат(2 будет элементом, обратным к самому себе. Докажите это. Что это означает в случае т = 2?
16.	Докажите, что циклическая группа, порожденная А2, является подгруппой циклической группы, порожденной А. В каком случае эти две группы будут различными?
ЛИТЕРАТУРА ДЛЯ ДОПОЛНИТЕЛЬНОГО ЧТЕНИЯ
У з к о в А. И., Векторные пространства н линейные преобразования, Энциклопедия элементарной математики, кн. II, Гостехиздат, М.—Л., 1951, стр. 9—126
ШрейерО и ШпернерГ., Введение в линейную алгебру в геометрическом изложении, ОНТИ, М.—Л., 1934.
Шилов Г, Е., Введение в теорию линейных пространств, Фнзматгиз, М., 1956.
Гельфанд И. М., Лекции по линейной алгебре, М., 1951
Мальцев А. И., Основы линейной алгебры, М., 1956.
Александров П. С., Введение в теорию групп, Учпедгиз, М., 1938.
Глава VI*
ЛИНЕЙНОЕ ПРОГРАММИРОВАНИЕ И ТЕОРИЯ ИГР
§ I. ВЫПУКЛЫЕ МНОЖЕСТВА
Образом линейного уравнения вида ах + by — с мы называем совокупность всех точек плоскости, координаты которых (х, у) удовлетворяют этому уравнению. Например, путем подбора можно обнаружить, что образ уравнения
(а)	2х4-3у = 6
представляет собой прямую, изображенную на фиг. 124. В частности, положив х = О, мы получим у = 2, так что образу уравнения 2х + Зу = 6 принадлежит точка (0, 2); подобным же образом, х = 1 дает у — 4/3, так что (1, 4/3) принадлежит этому образу; точно так же ему принадлежит и точка (3, 0) и т. д.
Рассмотрим теперь образы линейных неравенств с переменными х и у. Возьмем в качестве примера неравенство (b)	2*4-3y<6.
Какие точки (х, у) удовлетворяют этому неравенству? Можно найти много таких точек путем подбора. В частности, (1,1) принадлежит образу неравенства, так как 2-1 +3-1 = 5 < 6; с другой стороны, (1, 2) не принадлежит ему, так как число 2-1 +3-2 = 8 больше, чем 6. Между этими двумя точками мы находим точку (1, 4/3), лежащую на границе, т. е. принадлежащую образу уравнения (а). Мы замечаем, что при возрастании у точка покидает образ, с убыванием у она входит в образ. Так будет и во всех случаях. Если задана какая-то точка, принадлежащая образу (а), то уменьшение у даст число, меньшее чем 6, и, следовательно, полученная таким путем точка будет удовлетворять (Ь). Мы видим, что образ неравенства (Ь) состоит из всех точек, лежащих под прямой (а). На фиг. 124 этот образ изображен в виде заштрихованной области плоскости. Область, ограниченная прямой и лежащая по одну сторону от нее, называется открытой полуплоскостью.
358
Глава VI*. Линейное программирование и теория игр
Точно такой же анализ можно провести в случае неравенства
(с)	2%+Зу>6
и показать, что образом этого неравенства будет открытая полуплоскость, расположенная над прямой (а). Это может быть выведено также из того факта, что образы (а), (Ь) и (с) ие пересекаются и что объединением их является вся плоскость.
I
Фиг. 124
Если у нас имеется неравенство 2х + Зу <^6, то его образ будет объединением образов (а) и (Ь); следовательно, он является объединением открытой полуплоскости и ее границы, которое мы назовем замкнутой полуплоскостью. Подобный же анализ показывает, что ах + by = с всегда имеет в качестве образа прямую линию, ах + by < с — открытую полуплоскость, а ах + Ьу^.с — замкнутую полуплоскость.
Дадим несколько иное истолкование образов, которое придаст приведенным рассмотрениям большую ясность. Уравнение или неравенство относительно х и у можно мыслить как высказывание, истинность или ложность которого зависит от того, каковы х и у, т. е. какова точка (х, у). Таким образом, каждая точка плоскости представляет одну логическую возможность, а всю плоскость можно мыслить как множество И всех логических возможностей. Тогда «образ» будет просто множеством истинности соответствующего высказывания. Так как (а), (Ь) и (с) образуют полную систему альтернатив (см. § 8 гл. I), то их множества истинности не пересекаются, и объединением их будет U (см. § 1 гл. II); следовательно, они образуют разбиение множества И. Высказывание 2х-]-Зу эквивалентно (a)V(b), и,
§ 1. Выпуклые множества
359
следовательно, его множеством истинности будет объединение множеств истинности (а) и (Ь)_.
Предположим теперь, что мы рассматриваем системы неравенств и разыскиваем их совместные решения. Например, рассмотрим систему
(d)	х>0,
(е)	У>0,
(f)	2л: + 3у £6.
Здесь мы утверждаем, что истинны три высказывания, т. е. конъюнкция этих трех высказываний. Следовательно, множеством истинности будет пересечение трех соответствующих множеств истинности. Мы уже знаем, что образом (f) является замкнутая полуплоскость, заштрихованная на фиг. 124. Образом (d) является правая замкнутая полуплоскость, а образом (е) служит
верхняя замкнутая полуплоскость. Их пересечение представляет собой треугольник (вместе с его сторонами), заштрихованный на фиг. 125. Эта область содержит все точки, удовлетворяющие нашей системе неравенств.
Определение. Пересечение замкнутых полуплоскостей называется многоугольным выпуклым множеством.
Теорема. Точки, удовлетворяющие системе линейных неравенств типа , образуют многоугольное выпуклое множество.
Эта теорема вытекает из того факта, что каждое неравенство типа (но не <) имеет своим множеством истинности замкнутую полуплоскость и что система таких неравенств имеет своим множеством истинности пересечение этих полуплоскостей.
Упражнения
1.	Изобразите многоугольные выпуклые множества, которые задаются решениями следующих систем линейных неравенств. (Указание. Сначала
360
Глава VI*. Линейное программирование и теория игр
постройте отдельные, замкнутые полуплоскости и затем возьмите их пересечение.)
(а)	х<3, у<2, 2л-4-Зу	>0;	(Ь)	2x+3y5 —*+ У< х + У<	>6, ;2, '3;
(с)	2х + 3у<6, -* + у<2, х+ у<3;		(d)	© ©“ CN Л Л V/ ч ч	
(е)	х<2, *> — у <3, у > —	2, 3;	(f)	’Зх + 2у« Зх -j- 2у «	J —6, £6;
(g)	Зх -|- 2у Зх4-2у	>6, <6;	(h)	х— у5 х+ у«	>0, $.0;
(0 (к)	л <2, х>5; 2x-f-y>7, х<0, у<0;		(j)	Зх 2у 2х-]-Зу х>0, У>0.	>6, >6,
2.	Возьмем следующие множества:
2Z — вся плоскость;
А — полуплоскость, являющаяся образом неравенства 2х + у < 3;
В — полуплоскость, являющаяся образом неравенства — 2х + у > 3;
С — полуплоскость, являющаяся образом неравенства —2х + у < 3;
D — полуплоскость, являющаяся образом неравенства — 2х + у 3;
L — прямая, являющаяся образом равенства — 2х + у — 3;
О — пустое множество.
Покажите, что для этих множеств имеют место соотношения;
A = D, В = С, L = A\]B, C(]D = L, AQB = o, AftC = A, B[\D = B, A(jD = H, B[)C = U, А[)С = С, B\JD = D, A(JL = C, B(JL = D.
Можете ли вы указать другие соотношения?
3.	Какие из многоугольных выпуклых множеств, построенных в упр. 1, лежат в ограниченной части плоскости и какие простираются в бесконечность? Что служит границей первых множеств?
[Ome.: (с), (d), (f), (h) и (j) простираются в бесконечность; (g) есть прямая.]
4.	Для каждой из следующих полуплоскостей укажите неравенство, имеющее эту полуплоскость своим множеством истинности:
(а) Открытая полуплоскость, лежащая над осью х. [Оте.: у > 0.] (Ь) Замкнутая полуплоскость, лежащая иад биссектрисой угла, образованного осями координат,
§ 1. Выпуклые множества
361
Упражнения 5—9 относятся к ситуации, в которой одно семейство решает купить х книг и у альбомов Каждая книга стоит 4 доллара и каждый альбом стоит 3 доллара.
5.	Нельзя купить отрицательное число книг или альбомов. Запишите это условие в виде неравенств и изобразите их множества истинности.
6.	Имеется всего 6 книг и 6 альбомов, которые им нравятся. Учитывая это обстоятельство, видоизмените множество, построенное в упр. 5.
7.	Семейство собирается истратить ие более 24 долларов. Видоизмените множество, построенное в упр. 6.
8.	Оно решило истратить на книги, по крайней мере в два раза больше денег, чем на альбомы. Видоизмените множество в упр. 7.
9.	Семейство решило истратить на альбомы 9 долларов. Какая имеется свобода выбора возможностей?	[Отв.: Никакой.]
10.	Предположим, что следующие высказывания истинны: организм каждого человека требует по меньшей мере 0,02 г фосфора в день; каждому взрослому человеку требуется 0,01 г кальция; детям (но не младенцам) требуется 0,03 г кальция, а каждому младенцу — 0,04 г кальция Будем откладывать по оси у количества фосфора, а по оси х— количества кальция. Постройте выпуклые множества минимальных потребностей для взрослых, младенцев и детей. Укажите, какие из следующих утверждений истинны:
(а)	Потребности взрослых удовлетворены только тогда, когда удовлетворены потребности детей.
(Ь)	Если удовлетворены потребности детей, то удовлетворены и потребности младенцев.
(с)	Потребности детей удовлетворены только тогда, когда удовлетворены потребности младенцев.
[Отв.: (а) Истинно. (Ь) Ложно, (с) Ложно.]
11.	Предположим, что минимальные количества фосфора и кальция, требующиеся людям, даются следующей таблицей:
	Фосфор	Кальций
Взрослые	0,02	0,01
Дети	0,03	0,03
Младенцы	0,01	0,02
Пусть по оси у откладываются количества фосфора, а по оси х — количества кальция. Постройте выпуклые множества минимальных норм для взрослых, детей (не младенцев) и младенцев. Определить, какие из следующих утверждений истинны:
(а)	Если удовлетворены потребности детей, то удовлетворены и потребности взрослых.
(Ь)	Потребности младенцев удовлетворены только тогда, когда удовлетворены потребности детей.
(с)	Потребности взрослых удовлетворены только тогда, когда удовлетворены потребности младенцев.
(d)	Потребности как взрослых, так и младенцев удовлетворены только тогда, когда удовлетворены потребности детей,
(е)	Можно удовлетворить потребности взрослых, не удовлетворив потребности младенцев.
362
Глава VI*. Линейное программирование и теория игр
§ 2. МАКСИМУМЫ И МИНИМУМЫ ЛИНЕЙНЫХ ФУНКЦИЙ
Многоугольное выпуклое множество может располагаться в конечной части плоскости или простираться в бесконечность* Эти возможности были проиллюстрированы в упр. 1 предыдущего параграфа. Множества, заключающиеся в конечной части плоскости, подобно множеству, изображенному на фиг. 125, состоят из замкнутой ломаной и точек внутри нее. Удобно называть такое множество многоугольником; таким образом, многоугольник представляет собой многоугольное выпуклое множество, расположенное в конечной части плоскости. Так как каждый такой многоугольник представляет собой выпуклое множество (см. упр. 8 этого параграфа), то мы будем называть его выпуклым многоугольником.
Многоугольник с п сторонами имеет и п углов. Например, треугольник, изображенный на фиг. 125, имеет три угла (0, 0), (3, 0) и (0, 2). Вершина получается в результате пересечения двух прямых, следовательно, вершина многоугольника является пересечением границ двух полуплоскостей.
Теперь мы можем интерпретировать различные точки выпуклого многоугольника в терминах системы неравенств. Всякая вершина угла лежит на двух граничных прямых, поэтому для нее два из этих неравенств превращаются в равенства. Точка, лежащая на стороне и не являющаяся вершиной, принадлежит одной граничной прямой; следовательно, для нее одно неравенство превращается в равенство. Внутренняя точка многоугольника должна, очевидно, соответствовать тому случаю, когда все неравенства являются строгими неравенствами, т. е. такими, для которых выполнено не только условие < но и условие <•
Приведенное описание годится для общего случая. В случаях, когда, например, в одной точке пересекаются три прямые или некоторые неравенства являются лишними, могут быть сделаны очевидные видоизменения.
Пример 1. Рассмотрим систему уравнений (d) — (f) из предыдущего параграфа. В вершине (0, 0) неравенства (d) и (е) обращаются в равенства х = 0 и у = 0. Для вершины (0, 2) в равенства обращаются (d) и (f), для вершины (3, 0) — (е) и (f). Что же касается граничных точек, отличных от вершин, то для стороны, принадлежащей оси у-ов, (d) обращается в равенство; для стороны, принадлежащей оси х-ов, в равенство обращается (е), а для наклонной стороны — (f). Для внутренних точек треугольника не выполняется ни одно из этих равенств.
.$ 2. Максимумы и минимумы линейных функций
363
Пример 2. Найдем многоугольное выпуклое множество, определенное следующей системой неравенств:
2х -f- у -f- 9 О,
— х -|- Зу ~4— 6 О,
х-\-2у—3<0,
уже грубый набросок соответствующего чертежа показывает, что это множество будет треугольником. Следовательно, мы можем иайти вершины, заменяя каждые два из этих неравенств равенствами и решая полученные системы уравнений. Первые два дадут (—3, —3), первое и третье — (21	3 \
-g-. —g]• Следовательно, искомый многоугольник будет треугольником с вершинами в этих точках.
Пример 3. Предположим, что в некоторой деловой задаче х и у являются величинами, которые мы можем выбирать по усмотрению в пределах ограничений, имеющих форму неравенств. Будем считать, что выбор х и у ограничен системой неравенств, заданной в предыдущем примере. Предположим, что величины х и у обусловливают прибыль, равную х + 2у долларов. Каковы наибольшее и наименьшее значения возможной прибыли? Мы должны найти минимальное и максимальное значение х + 2у для точек (х, у) треугольника. Испробуем сначала вершины. В точке (—3, —3) мы должны иметь прибыль, равную —9, т. е. убыток в 9 долларов. В точке (—7, 5) мы имеем прибыль „	/21	3 \
в 3 доллара и в точке I -g, -g) — также прибыль в 3 доллара. Что можно сказать об остальных точках треугольника? Последнее неравенство эквивалентно неравенству х + 2у 3. Следовательно, прибыль не может превышать 3 доллара. Если первое неравенство мы умножим на -у 3
второе на у и сложим эти неравенства, то получим х-|-2у>- — 9; следовательно, убыток не может превышать 9 долларов. Это показывает, что как наибольшая прибыль, так и наибольший убыток достигаются в вершинах. Ниже мы покажем, что это верно и в общем случае.
Пусть имеется выпуклый многоугольник и функция ах + by (понимаемая как линейная функция от точек плоскости). Мы хотим доказать, что максимальное (минимальное) значение функции ах + by всегда принимается ею в некоторой вершине многоугольника. Сначала мы покажем, что значения функции ах + by
364 Глава VI*. Линейное программирование и теория игр
на любом отрезке прямой лежат между значениями этой функции в двух граничных точках отрезка (возможно, совпадая со значением в граничной точке).
Будем представлять каждую точку плоскости посредством вектора-строки (х, у), компоненты которого равны координатам этой точки. Тогда, очевидно, наша функция будет линейной функцией, представимой вектором-столбцом Пусть граничными точками отрезка будут р — (х, у) и q = (х', у'). В гл. V мы видели (ср. фиг. 114), что промежуточные точки можно записать в виде tp + (1-- t)q, где 0<£<1. Если значения функции в точках р и q равны соответственно А и В (для определенности пусть В-С Л), то вследствие линейности этой функции в промежуточной точке /р+(1—t)q она принимает значение
Наименьшее значение В, /'принимаемое в вершине
Наибольшее значение А. принимаемое в вершине^
Р
tA + (1 —t)B. Это значение равно В + (Л — B)t — числу, которое не меньше чем В и не больше чем А.
Теперь мы в состоянии доказать факт, проиллюстрированный на примере 3.
Теорема. Линейная функция, определенная на выпуклом многоугольнике, принимает максимальное (минимальное) значение в некоторой вершине этого многоугольника.
Доказательство этой теоремы иллюстрируется фиг. 126. Пусть наибольшее из значений, принимаемых функцией в вершинах многоугольника, принимается ею в вершине р и равно А, а наименьшее из таких значений принимается в вершине q и равно В. Пусть, далее, г — произвольная точка многоугольника. Проведем прямую через р и г до пересечения с точкой и, лежащей на стороне многоугольника, которая соединяет, скажем, вершины s и t. (Эта прямая может пересечь границу многоугольни
£ 2 Максимумы U минимумы линейных функций
365
ка в вершине $; наш анализ от этого не изменится.) По предположению значение функции в любой из вершин должно лежать между В и Л. Согласно предыдущему результату, значение функции в точке и заключено между теми значениями, которые она принимает в точках s и t и, следовательно, также между В и А. Опять, согласно предыдущему результату, значения функции в точке г заключено между ее значениями в р и в и и, следовательно, также между В и А. Так как г—произвольная точка многоугольника, то наша теорема доказана.
Допустим, что вместо линейной функции ах + by рассматривается функция ах + Ьу ф- с. Прибавление константы с сводится к изменению каждого значения этой функции, включая ее максимальное и минимальное значения, на величину с. Следовательно, рассуждение о том, где эта функция принимает максимальное и минимальное значения, может быть проведено, как и в случае линейной функции, и мы имеем следующую (более общую) теорему:
Теорема. Функция ах + by + с, определенная на выпуклом многоугольнике, принимает свое максимальное (минимальное) значение в некоторой вершине этого многоугольника.
Метод нахождения максимума или минимума функции ах + by + с на выпуклом многоугольнике состоит в следующем. Мы находим вершины этого множества, которых имеется конечное число; подставляем их координаты в функцию; наибольшее из полученных таким образом значений будет максимумом этой функции, а наименьшее — минимумом. Иллюстрацией этого метода может служить пример 3, разобранный выше.
Упражнения
1.	(а) Нарисуйте выпуклый многоугольник, полученный в примере 2.
(Ь)	Нарисуйте выпуклое множество, заданное неравенствами 2х-|- у + 9<0,
— х + Зу + 6 -+ о, лЦ-2у — 3<0.
(с)	Какое имеется соотношение между этими двумя множествами?
2.	Найдите вершины выпуклых многоугольников, заданных в пп. (а) (Ь) и (е) упр. 1 предыдущего параграфа.
[Отв.: (а) (3—2), (3, 2), (—3. 2); (е) (2, 3)'. (—2, 3), (2, —3),
(—2, —3) ]
3.	(а) Покажите, что три прямые, заданные уравнениями
2х+ у + 9 = 0, — х + Зу + 6 = 0, л + 2у —3 = 0,
366 Глава VI*. Линейное программирование и теория игр
разбивают плоскость на семь выпуклых областей. Обозначим эти области римскими цифрами I—VII.
(Ь)	Для каждой из семи областей, найденных в п. (а), напишите систему трех неравенств, имеющую эту область своим образом.
[Указание. Две из этих систем неравенств рассмотрены в упр. 1.]
(с)	Имеется еще один способ получения системы неравенств из системы трех уравнений, заданных в п. (а). Что служит образом этой последней системы неравенств?	[Отв.: Пустое множество б?.]
4.	(а) Найдите максимум и минимум функции
fix, у) = -2х + 5у + 17
на каждом из выпуклых многоугольников, заданных в пунктах (а), (Ь) и (е) упр. 1 из § 1.	[Отв.: (а) 33. 1; (е) 36. —2.]
Найдите минимум, ec.iH он существует, функции
f[x, у) = 5л4-3у—6
на каждом из многоугольных выпуклых множеств, заданных в пп. (h), (i) и (j) упр. 1 из § 1.
[Отв.: (h) Нет ии минимума, ии максимума; (j) минимум равен 3.]
5.	(а) Найдите вершины выпуклого многоугольника, заданного посредством неравенств
2х-}- У4-9>0,
— х4-3у 4-6>0,
х4-2у — 3<0, х+ У
[Указание. Используйте некоторые результаты примера 2 в тексте.]
(Ь) Найдите максимум и минимум функции fix, у} = 7х + 5// — 3 на выпуклом многоугольнике, заданном в п. (а).
[Отв.: максимум = 0; минимум = —39 ]
6.	Выпуклый многоугольник имеет своими вершинами точки (—1, 0), (3, 4), (0, —з) и (1, 6). Найдите систему неравенств, которая определяет этот выпуклый многоугольник.
7.	Рассмотрим многоугольное выпуклое множество Р, определенное посредством неравенств
— 1<х<4, о у < 6.
Найдите четыре различные системы условий на константы а и Ь, при которых функция f(x, у) = ах + by имела бы максимум в одной и только одной из четырех вершин множества Р. Найдите условия, при которых f имела бы минимум в каждой из этих точек.
[Отв.: Например, максимум будет в (4, 6), если а>0 и b > 0J 8. Множество точек называется выпуклым, если всякий раз, когда оно содержит две точки, оио содержит также и весь отрезок прямой, их соединяющий. Покажите, что:
(а)	если две точки принадлежат множеству истинности какого-нибудь линейного неравенства, то любая точка соединяющего их отрезка также принадлежит этому множеству истинности;
(Ь)	каждое многоугольное выпуклое множество является выпуклым множеством в указанном смысле.
§ 3. Задачи линейного программирования
367
9.	Приведите пример четырехугольника, ие являющегося выпуклым множеством.
10.	Докажите, что для любых трех векторов р, q и г множество всех точек вида ар + bq + сг (а>>0 Ь^О, с>-0, а + 6 + с=1) есть выпуклое множество. Какую геометрическую фигуру представляет этот образ?
[Отв.: В общем случае это будет треугольник.]
§ 3. ЗАДАЧИ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ
Важный класс практических задач составляют те задачи, в которых требуется найти максимум или минимум функции вида ах + by + с, определенной на выпуклом множестве точек. Мы проиллюстрируем эти так называемые задачи линейного программирования на следующих примерах.
Пример 1. Некий предприниматель заказывает телевизионной компании рекламу своей продукции; при этом он хочет воспользоваться выступлением комического артиста для того, чтобы привлечь зрителей. Всего на передачу ему отпускается полчаса и он должен распределить время. Пусть х есть число минут, отводимое на рекламу, а у — число минут, отводимое на выступление артиста. По самому своему определению величины х и у неотрицательны. Предположим, что заказчик настаивает на том, чтобы передача рекламы продолжалась не менее трех минут, а телевизионная компания требует, чтобы передача рекламы продолжалась не более 15 минут. По условию продолжительность передачи рекламы плюс продолжительность выступления артиста составляет полчаса, т. е. х + у = 30. Последнее уравнение может быть записано в виде двух неравенств х + у^ЗХ) и х + у < 30. В итоге мы получаем следующую систему неравенств:
х>3, х < 15. у>0, х-\-у >>30, х+у <30.
«Многоугольник», определенный этими неравенствами, представляет собой отрезок прямой, изображенный на фиг. 127. Вершинами его служат точки (3, 27) и (15, 15).
У заказчика имеется два мотива: он хочет по возможности уменьшить стоимость передачи и увеличить число людей, которые смотрят ее. Предположим, что минута выступления артиста стоит 200 долларов, а минута рекла
368
Глава VI*. Линейное программирование и теория игр
мы — 50 долларов. Тогда функцией стоимости будет С = 50х + 200у. Кроме того, предположим, что каждая минута выступления артиста увеличивает число телезрителей на 70 000, а каждая минута рекламы увеличивает это число на единицу. Тогда для N (общего числа зрителей) мы получаем формулу
N = х + 700001/. .
Заказчик хочет минимизировать С и максимизировать N. Путем подстановки координат вершин нашего «многоугольника» вместо х и у мы находим, что точка (15. 15 минут рекламы и выступления артиста, меньшую стоимость равную 3750 долларам. С другой стороны, т. е. три 27 минут ста, дает зрителей, Эти результаты полном согласии смыслом.
Пример 2. Допустим теперь, что комический артист отказывается (из-за недостатка в шутках) выступать в продолжение более чем 22 минут. Чтобы заполнить остающееся время, в передачу включают выступление оркестра. Теперь мы имеем х + у < 30 для числа минут, отводимого на рекламу и выступление артиста, 30 — х — у для числа минут, отводимого на выступление оркестра. Мы получаем следующие неравенства:
15), т. е. 15 минут дает наи-передачи,
точка (3, 27), минуты рекламы и выступления арти-макримальное число именно 1 890 003.
находятся в со здравым
л- 15, У>0, у <22,
Многоугольник, соответствующий этим неравенствам, показан на фиг. 128. Он имеет пять вершин (3, 0), (15, 0), (15, 15), (8, 22) и (3, 22). Предположим, что выступление оркестра в течение одной минуты стоит 250 долларов; тогда функцией стоимости будет
С — 50х 200у -|- 250 (30 — х — у) = 7500 — 200% — 50у.
§ 3. Задачи линейного программирования
369
Точкой минимальной стоимости служит (15, 15); соответствующая стоимость передачи равна 3750 долларам. Так как х + у = 30, то мы видим, что при этом решении оркестр не участвует в передаче.
Обращаясь к вопросу о максимальном числе зрителей, допустим вначале, что оркестр не пользуется никаким успехом у телезрителей. Тогда функция N будет такой же, что и в примере 1. Точкой максимума зрителей служит точка (8, 22), дающая 1 540 008 зрителей. Снова х + у = 30. так что оркестр опять не играет.
У
Точка максимума зрителей, если ~ оркестр пользуется успехом
Точка минимальной стоимости, если оркестр играет бесплатно
(з.о)
Точка максимума зрителей, если оркестр не пользуется успехом
у-Точка минимальной стоимости, / если выступление оркестра (1515) ° течение одной минуть/
' стоит Z50 долларов
Отрезок точек минимальной стоимостц. если выступление оркестра стоит столько же, сколько выступление артиста
/- Точка минимальной стоимости, /если выступление оркестра в тече-/ нии одной минуты стоит 150долларов
о
(15.0)
X
Фиг. 128
Допустим теперь, что оркестр пользуется успехом у зрителей. Для определенности предположим, что каждую минуту. когда играет оркестр, число зрителей увеличивается на 10000. Тогда наша функция N принимает вид:
N= х + 70 000у -|- 10 000 (30 — х — у) =
= — 9999х 4- 60 ОООу + 300 000.
Здесь точкой максимума зрителей будет точка (3, 22), дающая наибольшее число зрителей, равное 1 590 003. Отметим, что в этом случае оркестр играет 5 минут.
Пример 3. Предположим теперь, что заказчик находит затруднительной оплату подобной передачи и хочет отказаться от своего заказа. Чтобы сохранить заказ, телевизионная компания снижает стоимость выступления оркестра до 150 долларов в минуту. Функция стоимости принимает тогда вид
С = 50х + 200у + 150(30 —л —у)= -100л + 50у ф-4500.
24 Зак.
370	Г лава VI*. Линейное программирование и теория игр
В этом случае точкой минимальной стоимости будет (15,0). Это означает, что комический артист не участвует в передаче, которая теперь состоит из 15 минут рекламного текста и 15 минут оркестровой музыки. Минимальная стоимость равна 3000 долларов.
Допустим, что эта стоимость все еще слишком высока для заказчика, и телевизионная компания предлагает организовать выступление оркестра бесплатно при условии, что заказчик продолжает платить за рекламу. Функция стоимости в этом случае будет иметь вид
С = 50х-|-200у.
Здесь точкой минимума стоимости будет (3, 0). Это означает, что программа состоит из 27 минут оркестровой музыки и трех минут рекламы. Минимальная стоимость передачи равна 150 долларам.
Пример 4. Предположим, что в условиях примера 2 как выступление оркестра, так и выступление комического артиста обходится в 200 долларов за минуту. Тогда функция стоимости запишется так:
С = 50х + 200у + 200 (30 — х — у) = — 150х + 6000.
Здесь появляется нечто новое, так как обе вершины (15, 15) и (15, 0) дают одинаковую минимальную стоимость в 3750 долларов. Заметим, что в одном случае 15 минут отводится на выступление артиста и совсем не отводится времени на музыку, а в другом случае 15 минут отводится на музыку и совсем не отводится времени на выступление артиста. Какое из этих решений следует принять? Поскольку нас интересует лишь стоимость передачи, то это не имеет значения: оба решения одинаково хороши. Более того, если мы произвольно распределим 15 минут между выступлением оркестра и выступлением артиста, это также приведет нас к некоторому решению, дающему минимальную стоимость. Таким образом, каждая точка (15, у), где 0 <!/ < 15, дает нам решение вопроса о минимальной стоимости передачи.
Мы обнаружили общий принцип: всякий раз, когда наша функция принимает одно и то же значение в каждой из двух вершин, то она принимает это же значение во всякой точке отрезка прямой, соединяющего вершины. Это следует из того, что значение на отрезке прямой всегда лежит между значениями, принимаемыми в его концевых точках (см. предыдущий параграф). Следовательно, если обе вершины дают минимальное (или максимальное) значение рассматриваемой функции, то то
§ 3 Задачи линейного программирования	371
же самое имеет место и для каждой точки соединяющего их отрезка.
Вышеприведенные примеры показывают, что любая вершина или даже любая точка отрезка, соединяющего две из них (и, следовательно, любая точка многоугольника), может служить решением задачи линейного программирования в зависимости от того, каковы фактические данные и чего хотят достичь. Эти фактические данные полностью определяются заданием значений рассматриваемой функции в вершинах многоугольника.
Нижеследующие упражнения могут быть решены тем же способом. Сначала надо найти вершины выпуклого многоугольника, затем подставить их координаты в функцию, которую требуется минимизировать или максимизировать, и, наконец, определить, какая вершина (или вершины) дает решение задачи.
Упражнения
1.	Допустим, что в примере 2 комический артист и оркестр, каждый в отдельности, обходятся дороже, чем реклама. Покажите, что если заказчик хочет минимизировать стоимость передачи, то будут истинны следующие высказывания:
(а)	если комический артист обходится дороже, чем оркестр, то он не должен участвовать в передаче;
(Ь)	если оркестр обходится дороже, чем комический артист, то он ие должен участвовать в передаче;
(с)	если комический артист и оркестр обходятся одинаково, то в точке минимальной стоимости 15 минут отводится на рекламу, а остальные 15 минут делятся в любой пропорции между оркестром и артистом.
2.	В известном детском стишке говорится: «Хилый Джек не ест сала. Его жена Джилл не ест постного мяса...» Допустим, что Джек съедает в день не меиее одного фунта постного мяса, а Джилл требуется в день 0,4 фунта сала Предположим, что они покупают только говядину, на 10% состоящую из сала и на 90% — из постного мяса, и свинину, на 40% состоящую из сала и иа 60%—из постного мяса. Джек и Джилл хотят удовлетворить свои потребности, затратив наименьшее количество денег.
(а)	Пусть х — количество говядины, а у — количество свинины, покупаемые ими в день. Постройте выпуклое множество точек, представляющих те покупки, которые обеспечивают каждодневный рацион мяса и сала.
(Ь)	Наложите ограиичеиие на покупки, превращающие это множество в выпуклый многоугольник.
(с)	Покажите, что если фунт говядины стоит 1 доллар, а фунт свинины стоит 50 центов, то самая дешевая закупка продуктов будет состоять только нз свинины. Найдите эту минимальную стоимость покупки.
[Отв.: 0,83 доллара.]
24*
372
Глава V/*. Линейное программирование и Теория игр
(d)	Покажите, что если фунт говядины стоит 75 центов, а фунт свинины 50 центов, то точки, минимизирующие стоимость покупки, заполняют целый отрезок. Найдите минимальную стоимость.
[Отв.: 0,83 доллара.] (е) Покажите, что если говядина и свинина стоят по 1 доллару за фунт, то единственная точка минимальной стоимости представляет покупку, включающую как говядину, так и свинину. Найдите минимальную стоимость.	[Отв.: 1,40 доллара]
(f) Покажите, что ограничения, наложенные в п. (Ь), не изменяют ответов на пп. (с)—(е).
3.	В условиях упр. 2 (d) покажите, что для всех точек минимальной стоимости, кроме одной, количество сала превышает минимальный рацион, тогда как количество постного мяса всегда равно минимальному рациону Джека. Покажите, что для всех точек минимальной стоимости, кроме одной, количество говядины не равно нулю.
4.	В условиях упр. 2 (е) покажите, что как Джек, так и Джилл получают в точности минимальный рацион.
Б. Пусть фунт свинины стоит 1 доллар. До какой величины должна понизиться цена на говядину, чтобы Джек и Джилл перестали покупать свинину?	[Отв.: 0,25 доллара.]
6.	Пусть в условиях упр. 2 Джек решил уменьшить свой минимальный рацион постного мяса до 0,6 фунта. Как изменится выпуклое множество? Как изменятся ответы к пп. (с), (d) и (е) упр. 2?
7.	Один фермер-птичник занимается разведением кур, уток и индеек и имеет на своей ферме помещение для 500 птиц. Он хочет, чтобы общее число птиц равнялось 500, но чтобы число уток ни в какой момент не превышало 300. Предположим, что выкормить курицу стоит 1,5 доллара, утку 1 доллар и индейку 4 доллара. Предположим, что фермер может продать кур по 3 доллара, уток — по 2 доллара и индеек — по Т долларов за штуку. Он хочет решить, какой вид птиц следует разводить для получения максимальной прибыли.
(а)	Пусть х — число кур и у — число уток, которых фермер хочет выкормить. Тогда 500 — х— у равно числу выкармливаемых им индеек. Каково выпуклое множество возможных значений х и у, удовлетворяющих описанным ограничениям?
(Ь)	Найдите выражение для стоимости выкармливания х кур, у уток и 500 — х — у индеек. Найдите выражение для общей суммы, которую фермер получит за этих птиц. Вычислите прибыль, которую он получит при этих условиях.
(с)	Покажите, что если Т »= 6 долларов, то для получения максимальной прибыли фермер должен разводить одних только индеек. Какова максимальная прибыль?	[Отв.: 1000 долларов.]
(d)	Покажите, что если 7 = 5 долларам, то фермер должен разводить одних кур. Найдите максимальную прибыль. [Отв.: 750 долларов.]
(е)	Покажите, что если Т = 5,5 доллара, то фермер может разводить любую комбинацию кур и уток. Найдите максимальную прибыль.
[Отв.: 750 долларов.]
8.	Проделайте упр. 7 для случая, когда цена курицы равна 2 долларам, а Т равно (а) 6 долларам. (Ь) 5 долларам, (с) 4,5 доллара и (d) 4 долларам.
8.	В условиях упр. 7 покажите, что если цена индеики падает ниже 5,5 доллара, то фермер должен разводить только кур. Покажите также, что если эта цена превышает 5,5 доллара, то он должен разводить только индеек.
§ 4. Строго детерминированные игры
373
10.	Пусть /—линейная функция точки (х, у), где (х, у)—вероятностный вектор.
(а)	Запишите ограничения на х и у.
(Ь)	Найдите множество истинности этой системы условий.
(с)	Для каких вероятностных векторов функция f может достигнуть максимума?	[Отв.: (1,0) или (0,1).]
Упражнения 11—20 относятся к следующей задаче. На одной птицеферме имеется 10 кур и 32 яйца. В данный период времени курица может использоваться либо для высиживания 4 цыплят, либо для снесения 6 яиц. Фермер хочет использовать имеющийся в его распоряжении материал в течение двух периодов времени, после чего продать всех кур и все яйца. (Продукция первого периода может быть использована во втором!) Как должен фермер использовать своих кур, чтобы получить максимальный доход?
II.	Допустим, что в первый период х кур высиживают цыплят, а 10 — х несутся. Какие ограничения на х налагаются имеющимся числом кур и яиц? (Мы предполагаем, что яйца могут сохраняться и, следовательно, могут использоваться лишь частично.)	[Отв.:	х С 8.]
12.	Сколько кур будет к концу первого периода, считая первоначальных кур и вновь высиженных? Сколько будет яиц, считая первоначальные и вновь снесенные, но без тех, которые использовались для высиживания цыплят?
13.	Предположим, что во втором периоде у кур высиживают цыплят, а остальные несутся. Какие ограничения на у налагаются имеющимся числом кур и яиц? Сколько кур будет нестись?
14.	Постройте выпуклый многоугольник, определенный посредством ограничений на х и у.
[Указание. Он имеет пять сторон.]
1Б.	Сколько янц и сколько кур будет иметься к концу второго периода?
[Отв.: 152 + 14х— Юг/; 10 + 4х + 4у.[ 16. Пусть яйца продаются по 5 центов, а куры — по 25 центов. Выразите доход фермера через х и у.	[Отв.: 1010 + 170х + 501/ центов ]
17.	При каких х и у этот доход будет наибольшим? Чему равен максимальный возможный доход?	[Отв.: х = 8, у = 3; 25,20 долларов.]
18.	Для варианта, указанного в решении упр. 17, определите число яиц и кур на каждой стадии. Чем характеризуется это решение?
[Отв.: Каждый раз высиживается максимально возможное число цыплят.] 19. Пусть яйца продаются по 5 центов, а куры — по 35 центов. Какие х и у дают максимальный доход? Чему он равен?
[Отв.: 2, 18; 31,50 долларов.] 20. Определите число яиц и кур и сравните с результатами упр. 18.
§ 4. СТРОГО ДЕТЕРМИНИРОВАННЫЕ ИГРЫ
Мы переходим теперь от линейного программирования к теории стратегических игр. Хотя на первый взгляд эти две теории совершенно различны, однако на самом деле между ними существует тесная связь. В задаче линейного программирования речь идет об одном человеке, который старается максимизировать или минимизировать функцию от двух или более перемен
374 Глава VI*. Линейное программирование и теория игр
ных, заданную на многоугольном выпуклом множестве Теория игр рассматривает ситуации, в -которых участвуют два человека (а иногда и более), причем их поведение влияет на исход некоторого события, не определяя его полностью. Отдельные участники игры обычно преследуют различные цели. Теория игр позволяет находить для таких игр решение, основанное на принципе, что каждый игрок старается действовать так, чтобы обеспечить себе некоторый итог независимо от действий противника.
Большинство развлекательных игр, как, например, крестики и нолики, шашки, триктрак1), шахматы, покер, бридж и другие карточные игры, можно рассматривать как стратегические игры.
Азартные игры вроде игры в кости, рулетки и т. д. обычно не относятся к разряду стратегических игр, так как человек, играющий в них, всего лишь «играет со случаем»2).
Упомянутые стратегические игры слишком сложны, чтобы их можно было полностью проанализировать. Вместо этого мы специально построим некоторые более простые игры, быть может недостаточно занимательные с точки зрения игрока, но доступные исследованию и могущие служить для иллюстрации общей теории.
В этом и следующем параграфах мы рассмотрим несколько простых примеров игр. В § 6 будет дано общее определение матричной игры.
Пример. Рассмотрим следующую карточную игру. Имеется два игрока, назовем их А и В. Игрок А получает красную пятерку и черную пятерку, а игрок В черную пятерку и красную тройку. Игра, которая ими ведется, состоит в следующем. По данному сигналу игроки одновременно показывают одну из своих двух карт; если эти карты одного цвета, то игрок А выигрывает (положительную) разность числа очков на картах: если же карты различного цвета, то игрок В выигрывает (положительную) разность числа очков. Очевидно, стратегическое решение, принимаемое каждым игроком, заключается в выборе того, какую карту ему следует открыть.
Эту игру удобно представить посредством матрицы, которая изображена на фиг. 129. (В теории игр принято записывать матрицы в виде разграфленных таблиц.) Строки представляют возможные выборы игрока А, столбцы —
*) Триктрак — старинная французская игра (аналогичная широко популярной у нас на Кавказе и в Средней Азии игре «иарды»), в которой противники передвигают фишки по специально разграфленной доске, бросая перед каждым ходом кости, результат выпадения которых указывает возможные ходы.
2) К этой же категории «чисто случайных игр» относится и известная карточная игра «пьяница».
§ 4 Строго детерминированные игры
375
игран В
ч5 игрой А
к.5
i. 5	к.3
0	— 2
0	2
Фиг. 129
возможные выборы игрока В. Число, находящееся в строке с номером i и столбце с номером /, представляет выигрыш игрока А при выборе игроком А i-й строки, а игроком В /-го столбца. Если какой-нибудь элемент положителен, это означает, что игрок В уплачивает игроку А. Отрицательный «выигрыш» игрока А означает, что А уплачивает игроку В. Например, если А выбирает 1-ю строку (ходит ч. 5), а В выбирает 1-й столбец (ходит ч. 5), то А выигрывает разность чисел 5 и 5, т. е. 0. Если А выбирает 1-ю строку, но В выбирает 2-й столбец (ходит к. 3), то В выигрывает разность 2 минус 0, представленную элементом —2 нашей матрицы. Стратегические особенности игры полностью описываются этой матрицей.
Игра, описанная посредством фиг. 129, называется матричной игрой. Любую (2 X 2)-матрицу
можно рассматривать как матрицу, задающую игру с двумя противниками, если считать, что один игрок распоряжается строками, а другой — столбцами и что элементы матрицы определяют размер выигрыша. В § 6 мы увидим, что матрицу с любым числом строк и столбцов также можно использовать для задания некоторой матричной игры.
Какого образа действий должны придерживаться игроки в матричной игре, представленной на фиг. 129? Игроку В хочется сделать результатом игры элемент — 2 матрицы. Для этого он должен выбрать второй столбец матрицы; но тогда игрок А может выбрать вторую строку, и В вместо того, чтобы выиграть 2, проиграет 2. С другой стороны, если В выберет первый столбец (т. е. пойдет ч.5), то он обеспечит себе ничейный исход при любом ходе А. Очевидно, А ничего не проиграет, а, возможно, выиграет, если выберет вторую строку. Следовательно, так он и должен поступить. Зная, что А так именно и поступит, В укрепляется в своем решении выбрать первый столбец. Итак, оптимальные процедуры для игроков состоят в том, что А должен пойти к. 5, а В должен пойти ч.5. Если оба игрока сыграют таким образом, то никто из них не выиграет у другого. Таким образом, эта игра является безобидной.
Указание вида: «Пойти ч. 5» или «Пойти к. 3» называется стратегией. Если игрок А применит стратегию «Пойти к.5»
376
Глава VI*. Линейное программирование и теория игр
в игре, матрица которой дана на фиг. 129, то независимо от поведения В он обеспечит себе самое меньшее нулевой элемент матрицы. Подобным же образом, если В применит стратегию «Пойти ч. 5», то независимо от поведения А он обеспечит себе самое большее нулевой элемент матрицы, т. е. самое большее нулевой проигрыш. Так как А не может обеспечить себе независимо от действий В более чем нулевой выигрыш, а В не может обеспечить себе независимо от действий А менее чем нулевой проигрыш и так как эти два числа равны, то мы называем предыдущие стратегии оптимальными стратегиями в рассматриваемой игре Мы также называем нуль ценой нашей игры. Это число служит исходом игры при использовании каждым игроком своей оптимальной стратегии.
Определение. Будем говорить, что игра с (2 X 2)-матрицей строго детерминирована, если эта матрица содержит элемент, скажем V, который одновременно является минимальным элементом в содержащей его строке и максимальным элементом в содержащем его столбце. Тогда оптимальные стратегии игроков состоят в следующем:
для игрока А: «Выбрать строку, содержащую -а»,
для игрока В: «Выбрать столбец, содержащий ®».
Ценой этой игры называется число V. Игра называется безобидной, если ее цена равна нулю.
В § 6 будет показано, что определенные здесь стратегии оптимальны в упомянутом выше смысле и что значение v является наилучшим из всех возможных для каждого игрока.
Игра, заданная изображенной на фиг. 129 матрице, — строго детерминированная, так как 0, стоящий в левом нижнем углу матрицы, является минимальным элементом второй строки и максимальным элементом первого столбца. Заметим, что в этом примере оптимальные стратегии, получаемые из нашего общего определения, совпадают со стратегиями, найденными выше. Цена этой игры, согласно определению, равна нулю; следовательно, игра является безобидной.
Для строго детерминированной игры решение находится особенно легко, потому что каждый игрок знает оптимальную стратегию своего противника и, следовательно, знает, что ему делать. Не для всех игр с (2 X 2)-матрицей решение находится столь же просто, в чем мы убедимся в следующем параграфе.
На фиг. 130 показаны три игры, заданные матрицами. Игра, представленная изображенной на фиг. 130, а матрицей, — строго детерминированная и безобидная. Оптимальные стратегии для
§ 4. Строго детерминированные игры	377
этой игры состоят в выборе игроком А первой строки, а игроком В — первого столбца. Игра, представленная изображенной на
	0	1		5	2		0	1
	—3	10		—7	—4		2	0
а	б							в	
Фиг. 130
фиг. 130,6 матрицей, — строго детерминированная, но не безобидная, так как ее цена равна 2. [Каковы для нее оптимальные стратегии?] Наконец, игра, представленная фиг. 130, в, не является строго детерминированной. Разбор подобных игр послужит темой следующего параграфа.
Упражнения
1.	Определите, какие из игр являются строго детерминированными и какие являются безобидными. В тех случаях, когда игра строго детерминирована, найдите оптимальные стратегии игроков.
[Отв.: (а) Строго детерминированная и безобидная; А выбирает 1-ю строку, В выбирает 1-й столбец; (Ь) не строго детерминированная; (е) строго детерминированная, но не безобидная; А выбирает
378 Глава VI*. Линейное программирование и теория игр
1-ю строку, В выбирает 2-й столбец; (j) строго детерминироваииая, ио не безобидная; каждый из игроков может применять любую стратегию.]
2.	Пусть в примере 2 игрок А получает карты к. 5 и ч. 3, а игрок В — ч. 3 и к. 3. Укажите матричную игру, соответствующую этим условиям. Будет ли она строго детерминированной? Будет ли она безобидной? Найдите оптимальные стратегии игроков.	[Отв.: Да. Да. Оба ходят ч. 3.]
3.	Игроки показывают одновременно один или два пальца, и В платит А сумму, равную общему числу показанных пальцев. Напишите матрицу этой игры. Докажите, что эта игра является строго детермииированиой и найдите цену и оптимальные стратегии.
4.	Игроки показывают (одновременно) один или два пальца, и В платит А сумму, равную произведению чисел показанных пальцев, а А платит В сумму, равную общему числу показанных пальцев. Постройте матрицу игры (элементы матрицы указывают чистый выигрыш А). Найдите цену и оптимальные стратегии.
[Отв.: v = 1, А должен показывать одни палец. В может показывать одни или два пальца.]
5.	Докажите, что строго детерминированная игра является безобидной тогда и только тогда, когда существует элемент, равный нулю, и такой, что оба элемента содержащей его строки неотрицательны, а оба элемента содержащего его столбца не положительны.
6.	Рассмотрим игру с матрицей
(а)	Покажите, что эта игра является строго детерминированной при любом значении а.
(б)	Найдите цену G.	[Отв.: 2.]
(с)	Найдите оптимальные стратегии игроков.
(d)	Если а = 1 000 000, то, очевидно, А хотел бы иметь это число в качестве своего выигрыша. Существует ли для него способ обеспечить себе такой выигрыш? К чему привела бы попытка А добиться его?
(е)	Покажите, что цена этой игры равна лучшему, чего может добиться А.
Рассмотрим игру с матрицей
7.
G =
Покажите, что эта игра строго детерминирована при каждом наборе значений для а, с и d. Покажите, что такой же результат справедлив в случае матрицы с одинаковыми элементами какого-нибудь столбца, 8 Найдите необходимые и достаточные условия для того, чтобы игра с матрицей	—
а О
G = ----------
О Ъ
была строго детерминированной.
(Указание. Они выразятся соотношениями между числами а и b и числом 0.)
§ 5. Не строго детерминированные игры
379
9.	Допустим, что в примере, рассмотренном в тексте, игрок А получает карты ч. х и к. у, а игрок В карты ч. и и к. v, где х, у, и и v — целые положительные числа. Пусть матрица игры, в которую они играют, имеет вид:
Игрок В
ч.и кл
ч.х х — и v — х
Игрок А -------------------------
к.у и — у у — v
(а)	Покажите, что если х — и, х и у то эта игра строго детерминирована и безобидна.
(Ь)	Покажите, что если у = v, у > х и у < и, то эта игра строго детерминирована и безобидна.
10.	Рассмотрим строго детерминированную игру с (2 X 2)-матрицей G. Пусть и и v — элементы этой матрицы, каждый из которых является минимальным элементом в содержащей его строке и максимальным элементом в содержащем его столбце. Покажите, что тогда и = v.
§ Б. НЕ СТРОГО ДЕТЕРМИНИРОВАННЫЕ ИГРЫ
Как видно из конкретных примеров предыдущего параграфа, некоторые матричные игры не являются строго детерминированными, т. е. соответствующая им матрица не содержит элемента, который был бы одновременно минимальным в своей строке и максимальным в своем столбце. Не строго детерминированные матричные игры с (2 X 2)-матрицей можно охарактеризовать следующим образом.
Теорема. Игра с матрицей
не является строго детерминированной тогда и только тогда, когда выполнено одно из следующих двух условий:
(i) а < Ь, а < с, d < b и d < с;
(ii) а> Ь, а~> с, d~>b и d~> с.
[Эти соотношения означают, что элементы, принадлежащие главной диагонали матрицы, должны быть меньше (больше) каждого из двух элементов другой диагонали.]
Доказательство. Если выполняется какое-либо из условий (i) или (ii), то, как нетрудно проверить, ни один элемент матрицы не может быть одновременно минимальным в той
380
Глава VI*. Линейное программирование и теория игр
строке, которой он принадлежит, и максимальным в том столбце, которому он принадлежит; следовательно, игра не будет строго детерминированной.
Чтобы доказать вторую часть теоремы, вспомним, что, согласно упр. 7 предыдущего параграфа, игра является строго детерминированной, если в соответствующей ей матрице равны два элемента какой-либо строки или столбца Следовательно, можно предположить, что никакие два элемента одной и той же строки или одного и того же столбца не равны.
Допустим теперь, что а < Ь. Тогда а < с, иначе элемент а будет минимальным элементом своей строки и максимальным элементом своего столбца. Кроме того, с > d, иначе элемент с будет минимальным элементом своей строки и максимальным элементом своего столбца. Наконец, d<b, иначе элемент d будет минимальным элементом строки и максимальным элементом столбца. Следовательно, предположение а < b приводит к отмеченному выше случаю (i)
Аналогично предположение а>Ь приводит к случаю (ii). Теорема доказана.
Пример 1. Рассмотрим карточную игру из примера, приведенного в предыдущем параграфе, и предположим, что игрок А имеет ч. 5 и к. 3, а игрок В имеет ч. 3 и к. 5. Правила игры остаются прежними. Матрица игры имеет вид:
Игрок В
ч.З к.5
ч.5	2	0
Игрок А	——------------
к.З	0	2
Очевидно, эта игра не является серого детерминированной.
Пример 2. Вернемся к примеру 1 из § 2 гл. III. Напоминаем, что Джонс прячет билет в 1 или в 2 доллара, а Смит называет одно из чисел 1 или 2 и в случае правильного ответа выигрывает билет. Матрица этой игры имеет вид:
Число, названное Смитом
I 2
Билет в 1 долл.	—1	0
Выбор Джонса	-----------
Билет в 2 долл. 0	—2
Эта игра также не является строго детерминированной
§ 5. Не строго детерминированные игры
381
Как следует играть в случае, когда игра не является строго детерминированной? Убедимся прежде всего в том, что ни для какого игрока ни один выбор не может рассматриваться как безусловно оптимальный. В примере 1 А хотел бы выиграть 2. Но если он определенно выбирает ч. 5, а В узнает об этом, то может сделать ход к. 5, сведя тем самым выигрыш А к нулю. Если же А выбирает к. 3, то В может свести его выигрыш к нулю, открыв карту ч. 3. Подобным же образом, если выбор В становится известным А, то А может выиграть 2. Итак, каждый игрок должен каким-то образом помешать другому игроку узнать, с какой карты он собирается пойти.
Мы также замечаем, что когда эта игра играется один раз, то между двумя стратегиями нет разницы, если только стратегия одного игрока не отгадана его противником. Пусть теперь эта игра играется много раз. Как должен действовать А? Очевидно, он не должен ходить все время одной и той же картой, иначе В может заметить, как ведет себя А, и воспользоваться этим. Поэтому А должен ходить иногда одной картой, а иногда — другой. Теперь мы сформулируем ключевой вопрос: «Как часто А должен ходить каждой из своих карт?» Исходя из симметрии задачи, можно ожидать, что каждой картой он должен ходить так же часто, как и другой, т. е. в половине всех игр. (В дальнейшем мы увидим, что такой образ действий в самом деле является оптимальным.) В каком порядке он должен это делать? Например, должен ли он попеременно ходить ч. 5 и к. 3? Это опасно, потому что если В заметит эту систему, то он обратит это в свою пользу, зная каждый раз заранее ход А. Таким образом, А должен ходить ч. 5 в половине всех случаев, но следуя какой-то неотгадываемой системе. Единственный надежный способ заключается в том, чтобы ходить случайным образом Можно, например, бросать монету (не показывая ее В) и ходить ч. 5, если выпадет герб, и к. 3, если выпадет цифра. Тогда В не сможет отгадать решения А, поскольку А сам не знает его заранее. Таким образом, рациональный путь игры для каждого игрока состоит в смешении стратегий, т. е. в выборе иногда одной, иногда другой стратегии. Эти стратегии должны выбираться случайным образом с некоторой фиксированной вероятностью выбора каждой из них.
Под смешанной стратегией для игрока А мы будем понимать указание вида «Выбирать 1-ю строку с вероятностью pi и вторую строку с вероятностью р2», где по предположению А^-0, р2^>0 и pi + р2 = 1. Аналогично смешанной стратегией для игрока В будет указание вида «Выбирать первый столбец с вероятностью qi и 2-й столбец с вероятностью <72», где qY О, <?2>-0 и qi + <?2 = 1, Вектором смешанной стратегии для
382
Глава VI*. Линейное программирование и теория игр
И
игрока А будет вектор-строка вероятностей (рь р2), а для игрока В вектором смешанной стратегии будет вектор-столбец вероятностей
гт	2	-	X1 1\
Примерами смешанных стратегии могут служить l-g-, -g)
(5 4 5
фактически осуществить подобную вероятностную стратегию. Смешанная стратегия (-g • у) реализуется без груда, так как дело сводится к простому бросанию монеты. Несколько труднее реализовать
I 5 4 5
отсутствия в обиходе случайного устройства, которое выдавало бы эти вероятности. Однако легко получить такое устройство, например, с помощью диска с подвижной стрелкой, -g- пло-
. Читатель может спросить, каким образом игрок может
ввиду
смешанную стратегию
щади которого заштриховано, как это
Фиг. 131	изображено на фиг. 131. Игрок В про-
сто приводит во вращение стрелку (конечно, не показывая ее А). Тогда, если стрелка останавливается на незаштрихованной части, он выбирает первый столбец, если же она останавливается на заштрихованной части, то он выбирает второй столбец и, таким образом, реализует требуемую стратегию Варьируя заштрихованную площадь диска, можно реализовать и другие смешанные стратегии.
Рассмотрим не строго детерминированную игру с матрицей
d
После того как мы убедились в том, что игроки должны применять смешанные стратегии, нужно еще решить, как выбирать оптимальную смешанную стратегию.
Определение. Для не строго детерминированной игры с матрицей G число v называется ценой этой игры, а векторы
§ 5. Не строго детерминированные игры
383
Р° — (P(i’» /’г>) и т° = ( (0) ]— оптимальными стратегиями игроку /
ков А и В, если имеют место следующие неравенства:
(1)	р°а=(рю Р^с bd)>(v,v)-,
(2)
(Если z и w— векторы, то неравенство z^-w означает, что каждая компонента z больше соответствующей компоненты w или равна ей.) Игра называется безобидной, если v = 0.
Пусть А выбирает смешанную стратегию р = (рь р2) и (независимо) В выбирает смешанную стратегию q — j • Тогда игрок А выигрывает сумму а с вероятностью pieji, сумму b с вероятностью Р1^2, сумму с с вероятностью p2q\ и сумму d с вероятностью p2q2. Следовательно, среднее значение его выигрыша (см. § 14 гл. IV) имеет величину
аР\Р\ + bpxq2 + cp2<7i + dp2q2=pG q.
Аналогично находится и среднее значение выигрыша игрока В. Оно равно этому же выражению, но с обратным знаком.
Чтобы оправдать данное выше определение, мы должны показать, что если для матрицы G существуют v, рР, q° с указанными свойствами, то игрок А может сделать среднее значение своего выигрыша равным v или большим V, а игрок В может сделать это среднее значение равным v или меньшим V. Пусть q — любая стратегия для В. Умножив (1) справа на q, мы получим соотношение p^Qq^-^T), v)q~v, которое показывает, что при любой игре игрока В игрок А может обеспечить себе выигрыш, среднее значение которого по меньшей мере равно v. Аналогично пусть р будет любой вектор стратегии для А. Умножив (2) слева на р, мы получим соотношение pGq°^.p^ j = которое показывает, что при любой игре игрока А игрок В может сделать среднее значение выигрыша А равным самое большее V. Именно в этом смысле стратегии р° и q° являются оптимальными. Мы видим далее, что если оба игрока играют оптимальным образом, то для игрока А среднее значение выигрыша равно V, а для игрока В среднее значение выигрыша равно —V. (Ср. упр. 10.)
Теперь мы должны решить вопрос о существовании стратегий р° и qP в не строго детерминированной игре. Тогда как при более сложных играх нахождение оптимальных стратегий оказывается трудной задачей, решение этого вопроса в случае не
384
Глава VI*. Линейное программирование и теория игр
строго детерминированной игры с (2 X 2)-матрицей может быть получено по следующим формулам:
(3)	0 	d — с Pi a + d — b — c'
(4)	Q 	 л — b a+d—b—c ’
(5)	Q 		d 	 Ь a + d — b — c'
(6)	q   CL —* C a + d — b — c'
(7)		 ad — be a+d—b—c
Легко проверить (см. упр. 11), что найденные по формулам (3) — (7) векторы р, q и число v удовлетворяют условиям (1) — (2). В действительности неравенства (1) и (2) в этом простом случае переходят в равенства. Этот факт не имеет места в общем случае не строго детерминированных игр, матрица которых имеет большее число строк или столбцов.
Знаменатель каждой из формул (3) — (7) представляет собой разность между суммами элементов по двум диагоналям. Так как для не строго детерминированной игры элементы по одной диагонали должны превосходить элементы по другой диагонали, то знаменатель не может обратиться в нуль. В числителе дроби для v стоит выражение, в котором читатель узнает определитель
а b
с d
— ad — be.
Воспользуемся этими формулами для исследования приведенных ранее примеров.
Пример 1 (продолжение). Решение легко находится пу-™ /1 1 \ тем подстановки числовых данных. Мы получаем (у!
(1 ч
! I в качестве
I /
оптимальной стратегии для В. Следовательно, для получения оптимальных результатов каждый игрок должен применять стратегию бросания монеты. Цена игры равна + 1. Это означает, что условия этой игры благоприятствуют игроку А, так что для А среднее значение выигрыша при одной такой игре равно 1.
§ 5. Не строго детерминированные игры
385
Пример 2. (продолжение). Из наших формул мы получаем (у, yj в качестве оптимальной стратегии для А и
3 \
! I в качестве оптимальной стратегии для В. Цена игры “3 /
2
равна —у. Таким образом, условия игры благоприятствуют Смиту. Смит должен перед началом игры внести 66 у цента. Это служит ответом на вопрос, поставленный в гл. III.
Упражнения
1. Найдите оптимальные стратегии каждого игрока и цены в следующих играх:
2. Представьте в матричной форме игру со сравнением монет (ср. упр. 1 к § 2 гл. III), найдите ее цену и оптимальные стратегии. Каким образом игроки реализуют эти стратегии на практике?
25 Зак. 994.
386
Глава VI*. Линейное программирование и теория игр
3.	Рассмотрим следующую игру. Каждый из двух игроков показывает один или два пальца, и если общее число показанных пальцев четно то игрок А получает сумму, равную этому числу, а если нечетно, то игрбк В получает сумму, равную этому числу,
(а)	Покажите, что матрица игры имеет следующий вид:
Игрок В
1	2
1	2	—3
Игрок А -------------- •
2—3	4
(Ь)	Найдите оптимальные стратегии игроков и цену игры.
Гп / 7	5 \	1 1
[Отв" \12 ’ 12/’ v~~ 12 J
4.	Рассмотрим следующую «военную» задачу. Бомбардировщики атакуют объект, защищаемый истребителями. При этом бомбардировщики могут каждый раз атаковать либо «высоко», либо «низко». Низкая атака делает бомбежку более меткой. Точно так же истребители могут каждый раз искать бомбардировщиков либо «высоко», либо «низко». Бомбардировщикам приписываются 6 очков, если они уклонятся от истребителей, и О очков, если истребители их обнаружат. Кроме того, бомбардировщикам приписывается три дополнительных очка за меткость, если они летят низко.
(а)	Напишите матрицу игры,
(Ь)	Найдите оптимальные стратегии игроков.
(с)	Каким образом командиры бомбардировщиков и истребителей могут принимать решения с помощью бросания монет?
[Отв.: (с) Командир бомбардировщика должен бросать одну монету, чтобы решить, лететь ди ему высоко или низко. Командир истребителя должен бросать две монеты и лететь высоко, если выпадут два герба.]
5.	Обобщите задачу из упр. 4, приписав бомбардировщикам х очков за уклонение от истребителей и у очков за низкий полет, (Предполагается, что х и у положительны.)
(а)	Напишите матрицу игры.
(Ь)	Покажите, что если у > х, то игра строго детерминирована, и найдите оптимальные стратегии.
(с)	Покажите, что если у < х,. то игра не строго детерминирована. Найдите оптимальные стратегии.
(d)	Объясните эти результаты, уделяя особенное внимание стратегии - бомбардировщиков.
6.	Докажите, что если игра с матрицей
а	ь
с	d
§ ff. Матричные игры
387
не строго детерминированная, то она будет безобидной тогда и только тогда, когда
Ia b
= ad — Ьс — О.
с d
7.	Докажите, что в формулах (3)—(7) pi > 0, рг > 0, qt > 0 и qz > 0. Должно ли v быть больше нуля?
8.	Воспользовавшись результатами упр. 8 предыдущего параграфа, найдите необходимые и достаточные условия для того, чтобы матрица
G =
О Ь
была матрицей не строго детерминированной игры. Найдите оптимальные стратегии для каждого игрока и цену игры, когда она не строго детерминирована.
[Отв.: Числа а- и b должны быть либо оба положительными, либо оба отрицательными. д, = ЬЦа b); р2 = а/(а -J- b); qt = b/(a -|- Ь)\ q2 = а/(а 6); v — аЬЦа £>).]
9.	Допустим, что игрок А получает карты ч. х и к. у, а игрок В карты ч. и и к. v (где х, у, и и v — положительные числа). Пусть они играют в игру с матрицей
Игрок В
ч.и к.»
ч.х хи — XV
Игрок А -----------------------
к.у — уи yv
Покажите, что эта игра всегда будет не строго детерминированной и безобидной.
10.	Покажите, что если G, р°, и v определены, как выше, то v = p^Gq0.
11.	Проверьте, что значения (3)—(7) удовлетворяют условиям (1) и (2).
§ 6. МАТРИЧНЫЕ ИГРЫ
В этом разделе мы рассмотрим один большой класс игр и проведем его изучение при весьма общих предположениях. Наши игры являются играми между двумя игроками, и они будут проводиться согласно строго определенным правилам. Каждый игрок производит некоторые действия, определенные правилами игры. В конце игры может оказаться, что один игрок должен заплатить другому игроку некоторую сумму денег. Игра может быть повторена много раз
В течение такой игры игрок может быть поставлен перед необходимостью принять много стратегических решений. Под
25*
388
Глава VI*. Линейное программирование и теория игр
(чистой) стратегией для игрока мы понимаем полную систему правил о том, как он должен принимать эти решения. Мы покажем это на примере игры в крестики и нолики (сходные замечания применимы к любой игре, в которой игроки по очереди делают ходы). Рассмотрим стратегию того игрока, который ходит первым. Его первое решение касается выбора начального хода. В его распоряжении девять квадратов, и стратегия должна сказать, какой из них он должен выбрать. Пусть, например, ему рекомендуется заполнить квадрат в верхнем левом углу Его противник может ответить одним из восьми возможных способов, и далее стратегия первого игрока должна учитывать каждую из восьми альтернатив. Она должна включать восемь правил, как, например, «Если противник выберет центральный квадрат, то выбирайте квадрат в правом нижнем углу». На каждый такой ход противник может отвечать одной из нескольких альтернатив, и стратегия первого игрока снова должна предусматривать ответный ход на каждую из них и т. д. Следовательно, стратегия учитывает каждое мыслимое положение и предписывает, какой ход делать в каждом случае.
Стратегию можно мыслить как такую систему инструкций, даваемую машине, при которой машина смогла бы играть в точности так же, как играли бы мы.
Занумеруем стратегии первого игрока числами 1, 2, ,т, а стратегии второго игрока числами 1, 2, ..., п. Так как каждый игрок должен играть согласно одной из своих стратегий, то наша игра может осуществиться одним из тп способов, и если каждый игрок выбирает определенную стратегию, то исход определен. Допустим, что если первый игрок выбирает стратегию t, а второй — стратегию /, то первый выигрывает сумму, равную а1}. Мы располагаем эти числа ai} в виде (т X п) -матрицы, называемой матрицей игры. Тогда мы можем представить себе, что игра заключается в выборе первым игроком строки и выборе вторым игроком столбца. Следовательно, мы видим, что всякую игру с определенными правилами можно мыслить как матричную игру.
Обратно, всякую матрицу можно рассматривать как матрицу некоторой игры с двумя игроками. Это будет игра, в которой игрок А выбирает одну из m строк, а игрок В одновременно выбирает один из п столбцов рассматриваемой (m X п) -матрицы. Исход игры состоит в том, что В платит А сумму, равную элементу матрицы, который стоит в пересечении выбранной строки и выбранного столбца. (Как и раньше, отрицательный элемент означает, что А платит В.)
В игре с (m X п)-матрицей игрок А имеет т чистых стратегий, а игрок В имеет п чистых стратегий. Как мы видели в пре
§ 6. Матричные игры
389
дыдущем параграфе, кроме чистых стратегий следует рассматривать смешанные стратегии игроков. Мы распространим это понятие на случай игры с (m X л)-матрицей.
Определение, /n-мерный вектор-строка р называется вектором смешанной стратегии для игрока А., если этот вектор является вероятностным вектором; аналогично n-мерный вектор-столбец q называется вектором смешанной стратегии для игрока В, если этот вектор является вероятностным вектором. (Напомним, что в гл. V мы назвали вектор вероятностным, если у него все компоненты неотрицательны, а их сумма равна 1.) Пусть V и V' обозначают векторы
у
У
V = (у, У, .у) й	V — ;
пг компонент
у.
п компонент,
где v — некоторое число. По условию v называется ценой игры, а р° и 9° — оптимальными стратегиями игроков в том и только в том случае, если имеют место следующие неравенства:
V,
V'.
В §§ 4 и 5 мы рассмотрели несколько примеров матричных игр, а также их решения. Заметим, что мы не доказали существование цены игры и оптимальных стратегий игроков в случае произвольной матричной игры Этот вопрос будет рассмотрен в следующем параграфе.
Теорема. Если матричная игра имеет цену и оптимальные стратегии, то эта цена игры единственна.
Доказательство. Допустим, что v и w — различные цены игры с матрицей G. Пусть векторы-строки V = (о, V, ..., у) и W' = (щ, w..w) имеют по m компонент, а векторы-столбцы
w
имеют по л компонент. Пусть, далее, р° и ср— оптимальные векторы смешанной стратегии, отвечающей пене V, так что
(a)	p°G V,
(b)	V.
3S0
Глава VI*. Линейное программирование и теория игр
Аналогично пусть р1 и р’ — оптимальные векторы смешанной стратегии, отвечающей цене w, так что (с)
(d)	Gq1 < W'.
Если теперь умножить (а) справа на q', мы получимp^Gq1 >-
Vql — v. Аналогично, умножая (d) слева на р°, мы получим p°Gqx^-w. Эти два неравенства показывают, чтову^щ.
Затем мы умножим (Ь) слева на р1 и (с) справа на <р и получим неравенства rv~^-plGq{> и plGq°^>w, из которых следует, ЧТО
Но из неравенств v тю и v'^rw следует, что и — w, т. е. что рассматриваемая игра имеет единственную цену.
Теорема. Для игры с матрицей G, ценой v и оптимальными стратегиями р° и имеет место соотношение
V = p°GqQ.
Доказательство. По определению о, р° и р° удовлетворяют условиям
p°G>V и Gq°^V'.
Умножая первое из этих неравенств справа на р°, мы получим p°Gq0^v. Аналогично, умножая второе неравенство слева на р°, мы получим p°G(f Из этих двух неравенств следует равенство v=p°Gq°, которое нам и требовалось доказать.
Только что доказанная теорема важна тем, что она позволяет интерпретировать цену игры как среднее значение в смысле теории вероятностей (см. § 14 гл. IV). Коротко эту интерпрета-
цию можно охарактеризовать следующим образом: если игра неоднократно повторяется, причем каждый раз игрок А применяет смешанную стратегию р°, а игрок В — смешанную стратегию т°, то цена v игры будет средним значением выигрыша игрока А. Из закона больших чисел следует, что при достаточно большом числе игр средняя величина выигрыша игрока А, приходящаяся на одну игру, будет (с большой вероятностью) сколь угодно близкой к цене V.
В качестве примера рассмотрим игру в сравнение монет, т* е« игру с матрицей
Оптимальными стратегиями в этой игре служат: для А — выбор каждой строки с вероятностью тр а для В — выбор каждого
§ 6. Матричные игры
391
столбца с вероятностью у (См. упр. 2 предыдущего пара
графа.) Цена игры равна нулю. Заметим, что единственно возможными выплатами в каждой отдельной игре является + 1 и —1. Ни одно из этих значений не равно-цене игры (нулю). Однако если игра повторяется многократно, то средняя величина выигрыша (в расчете на одну игру) будет стремиться к нулю, т. е. к цене этой игры.
Теорема. В игре с матрицей G, ценой v и оптимальными стратегиями р° и q° цена v представляет собой наибольшее среднее значение выигрыша, которого может добиться игрок А. Аналогично v есть наименьшее среднее значение проигрыша, которого может добиться игрок В.
Доказательство. Пусть р — любая смешанная стратегия для А и пусть q° — оптимальная стратегия для В. Умножив соотношение Gq° V слева на р, мы получим pGcf С т. Последнее соотношение показывает, что если В выбирает оптимальную стратегию, то самое большее, чего может добиться А, это среднего значения v выигрыша. Теперь пусть р° — оптимальная стратегия для А; тогда для каждого q мы имеем p°Gq V, так что А действительно может обеспечить себе среднее значение V. Вторая часть теоремы доказывается аналогично.
Эта теорема дает интуитивное обоснование для определения цены и оптимальных стратегий игры. Таким образом, цена — это «наилучшее», чего игрок может добиться, а оптимальные стратегии являются средством достижения этого «наилучшего».
Определение. Игра с матрицей G называется строго детерминированной, если G содержит элемент gij, который является минимальным элементом в i-й строке и максимальным элементом в /-м столбце.
Если игра строго детерминированная, то путем перестановки и изменения нумерации строк и столбцов матрицы G можно добиться того, чтобы элемент gn был минимальным в первой строке и максимальным в первом столбце.
Теорема. Пусть игра с матрицей G строго детерминирована, причем G приведена к только что указанному виду Тогда цена v этой игры, будет равна gn, а оптимальными стратегиями для игроков будут
1
g° = (l, 0, 0, ...» 0) и q° =
0
0
0
392
Глава VI*. Линейное программирование и теория игр
[Эти оптимальные стратегии попросту означают, что А должен выбрать ту строку, которая содержит элемент gn (первую строку), а В должен выбрать тот столбец, который содержит элемент gn (первый столбец). Сравните эти оптимальные стратегии с теми, которые были найдены в § 4 для случая строго детерминированных (2 X 2)-игр.]
Доказательство. Предположим, что игра с матрицей G строго детерминирована и что строки и столбцы G расположены и занумерованы таким образом, что элемент gn — минимальный в первой строке и максимальный в первом столбце. Положим и = gn, и пусть р° и q° будут стратегиями, о которых говорится в формулировке теоремы. Мы имеем:
P°G — (gn> gi2> •••, gin)>(£и, £и, •••, gn)= V,
где мы воспользовались тем фактом, что элемент gn является минимальным в первой строке. Подобным же образом, используя тот факт, что элемент является максимальным в первом столбце, мы получим
gn
g21
« f *
gml
Из этих двух соотношений и данного выше определения матричной игры мы заключаем, что v есть цена игры, а р° и q°— опта* мальные стратегии.
Теорема. Если gn и Sij— два элемента матрицы G, являющиеся минимальными в тех строках и максимальными в тех столбцах, которым они принадлежат, то и — gu — gXj — ga = gZ;..
Доказательство. Используя тот факт, что gu и gZ;- являются минимальными в тех строках и максимальными в тех столбцах, которым они принадлежат, мы находим, что
giy^gi/^gii, ёц gn glp
'(Эти неравенства верны и в случае, когда i = 1 или / = 1.) Из этих двух систем неравенств мы получаем gij = gy — gn = gn = *= v, что и доказывает теорему.
Пример 1. Мы доказали единственность цены игры. Но может случиться, что игра имеет более чем одну пару опти
§ 6. Матричные игры
393
мальных стратегий. Например, рассмотрим игру с матрицей
1	5	1	7
—2	8	0	—9
1	12	1	3
Мы видим, что эта игра —строго детерминированная с ценой 1. Оптимальными стратегиями будут (1, 0, 0) и (0, 0, 1) для игрока А и
для игрока В.
Следующая теорема показывает, что для этой игры имеются еще и другие оптимальные стратегии.
Теорема. Если р° и р1— две оптимальные стратегии для игрока А в игре с матрицей G, то стратегия
p^apP+ll—ajp1,
где а — любое число, удовлетворяющее условию 0 <С а 1, также будет оптимальной стратегией для А.
Аналогично если q° и q1 — оптимальные стратегии для игрока
В в игре с матрицей G, то стратегия
q = aq®— a) qx,
где й'—любое число, удовлетворяющее условию	Ъ
также будет оптимальной стратегией для В.
Доказательство. Мы докажем только первое утверждение, а второе оставим в качестве упражнения (см. упр. 3). Легко показать, что р — вероятностный вектор. По предположению р°О V и ргО V. Следовательно,
pG = [ap°+(\ — ajp^G—apOGA-tl —
>aV+(l — a) V= V.
Отсюда видно, что p также является оптимальной стратегией, и теорема доказана,
394
Глава VI*. Линейное программирование и теория игр
Из этой теоремы следует, что в нашем примере стратегии вида с(1, 0, 0) + (1 — а) (0, 0, 1) = (а, 0, 1 — а) являются оптимальными для А. Так, например, (-g-* у) и (f ’ т) — две оптимальные стратегии такого вида.
Упражнения
1. Найдите цену и все оптимальные стратегии для следующих игр:
15	2	—3
6	5	7
—7	4	0
Отв.-. и = 5; (0, 1, 0);
Отв.-, (a) v = 5; (а, 1 — а, 0);
0
1
0
§ 6. Матричные, игры
395
3.	Покажите, что если д° и ql — оптимальные стратегии для игрока В в игре с матрицей G, то стратегия
q = aq" + (1 — a) q',
где постоянная а удовлетворяет условию 0< а < 1, также является оптимальной.
4.	Проверьте, что стратегииР° = (у, у, -уj ид°~
2 3
2 3
2
3
являются опти-
мальными в игре с матрицей
1	0	0
0	1	0
0	0	1
Чему равна цена этой игры?
5.	Обобщите результат упр. 4 на случай игры, матрицей которой служит единичная (п X я)-матрица.
6.	Допустим, что игрок А разыскивает игрока В в одном из трех городов X, Y и Z. Расстояние между X и Y равно 5 милям, расстояние между Y и Z равно 5 милям и расстояние между Z и X равно 10 милям. Предположим, что В может направиться в один и только в один из этих трех городов и что если А направится в тот же город, то А «задерживает» В, в противном же случае В «ускользает». Будем приписывать игроку А 10 очков, если он задерживает В, а игроку В число очков, равное расстоянию его от А, если В ускользает,
(а)	Выпишите матрицу этой игры.
(Ь)	Покажите, что оба игрока имеют одинаковые оптимальные стратегии, а именно появляться с равной вероятностью в городах X и Z и
1
с вероятностью -j- — в городе Y.
(с)	Найдите цену этой игры.
7.	Рассмотрим следующую игру с двумя играющими. Каждый игрок показывает от одного до пяти пальцев, и общее число показанных пальцев делится на 3. Если сумма делится на 3 без остатка, то никаких выплат не производится. Если остаток равен 1, то игрок А выигрывает сумму, равную общему числу показанных пальцев, а если остаток равен 2, то игрок В выигрывает сумму, равную общему числу показанных пальцев.
(а) Выпишите матрицу этой игры. (Указание. Это будет (5 X 5)-матрица.) . (Ъ) Проверьте, что стратегия, состоящая в том, чтобы показывать один
или пять пальцев с вероятностью -g-, два или четыре пальца с ве-
396 Глава VI*. Линейное программирование и теория игр
2	1
роятностью -7т и три нальиа с вероятностью -х-, является оптималь-У	о
ной для каждого игрока.
(с) Безобидная ли это игра?	[Отв.- Да ]
8.	Рассмотрим игру со следующей матрицей:
а	0	0
0	ь	0
0	0	с
г(а) Покажите, что если числа а, Ь и с не все одного знака, то эта игра — строго детерминированная с ценой нуль.
(Ь)	Покажите, что если все числа а, b и с одного знака, то вектор
(be	са	ab \
ab + Ьс са ’ ab 4- Ьс 4- ей ’ ab 4~ Ьс 4- са )
доставляет оптимальную стратегию для игрока А.
(с)	Найдите оптимальную стратегию для игрока В в случае (Ь).
(d)	Найдите цену этой игры в случае (Ъ) и покажите, что она будет положительной, если все числа а, b и с положительны, и отрицательной, если все они отрицательны,
9.	Два игрока договорились играть в следующую игру. Первый игрок будет показывать 1, 2 или 4 пальца. Одновременно второй игрок будет показывать 2, 3 или 5 пальцев. Если общее число показанных пальцев равно 3, 5 или 9, то первый игрок получает такую же сумму, В противном случае ие производится никакой выплаты.
(а)	Напишите матрицу этой игры.
(Ь)	Воспользуйтесь результатами упр. 8 для решения этой игры.
(с)	Какую сумму согласится внести первый игрок перед началом игры? [CW:
10.	Рассмотрим (симметричную) игру с матрицей
0	— а	— ь
а	0	— с
ь	с	0
(а)	Покажите, что если а и b оба положительны или оба отрицательны, то эта игра строго детерминирована.
(Ь)	Покажите, что если b и с оба положительны или оба отрицательны, то эта игра строго детерминирована.
(с)	Покажите, что если а > 0. b < 0 и с > 0, то для игрока А оптимальной будет стратегия
с	— b	а
а — b 4* с ’ а — Ь 4* с ’ а — £4"с
§ 7. Еще о матричных играх: основная теорема
397
(d)	В условиях п. (с) найдите оптимальную стратегию для игрока В. (е) Покажите, что если а < О, Ь > 0 и с < 0, то стратегия, заданная
в п. (с), будет оптимальной для А. Какая стратегия будет оптимальной для игрока В?
(f)	Докажите, что цена этой игры всегда равна нулю.
11 В известной детской игре каждый из двух игроков произносит слово «камень», «ножницы» или «бумага». Если один произносит «камень», а другой «ножницы», то первый выигрывает монету. Аналогично «ножницы» выигрывают у «бумаги», а «бумага» у «камня». Если оба игрока называют один и тот же предмет, то игра считается сыгранной вничью, (а) Выпишите матрицу этой игры.
(Ь) Используйте результаты упр. 10 для решения этой игры.
12. Пусть в условиях упр. 11 выплаты будут разными для разных случаев. Пусть когда «камень» разбивает «ножницы», выплачивается один цент, когда «ножницы» режут «бумагу», выплачивается два цента, и когда «бумага» покрывает «камень», выплачивается три цента.
'(а) Напишите матрицу игры.
(Ь) Используйте результаты упр, 10 для решения этой игры.
[Отв.:	«камень», -к- «ножницы», -тг «бумага»; v = 0J
О	Л	о
§ 7. ЕЩЕ О МАТРИЧНЫХ ИГРАХ: ОСНОВНАЯ ТЕОРЕМА
Продолжим изучение основных свойств матричных игр. Сначала мы посмотрим, что произойдет с игрой, если каждый элемент ее матрицы умножить на неотрицательную константу или если к каждому элементу матрицы прибавить одну и ту же константу. Затем мы приведем основную теорему существования для матричных игр.
Теорема. Если k — неотрицательное число, т. е. k~^> 0, и если v — цена игры с матрицей G, то kv будет ценой игры с матрицей kG и всякая стратегия, оптимальная в игре с матрицей G, будет также оптимальной в игре с матрицей kG. (Напоминаем, что матрица kG получается из матрицы G путем умножения каждого элемента на число k.)
Доказательство. Пусть р° — оптимальная стратегия для игрока А в игре с матрицей G, т. е. p°G > V. Тогда мы имеем: p<>(kG) = k(p°G)>kV.
Аналогично если q°— оптимальная стратегия для игрока В в игре с матрицей G, то
(kG)q^k(Gq^^kV.
Эти два неравенства показывают, что kv есть цена игры с матрицей kG и что оптимальные стратегии в игре с матрицей G являются также оптимальными в игре с матрицей kG,
398
Глава VI*. Линейное программирование и теория игр
Следует обратить внимание на то, что при доказательстве этой теоремы существенно использовалась неотрицательность k, так как умножение неравенства на отрицательное число влечет изменение смысла неравенства на противоположный. Следующий пример показывает, что приведенная теорема не верна для отрицательных k.
Пример. Пусть k = — 1 и пусть
Мы видим, что каждая из этих игр является строго детерминированной и что цена первой игры равна 2, тогда как цена второй игры равна 0 (т.е. числу, не равному (—1) -2 = = — 2). Кроме того, в игре с матрицей G оптимальная стратегия для А состоит в выборе первой строки с вероятностью 1, а оптимальная стратегия для В — в выборе первого столбца с вероятностью 1, и ни одна из этих стратегий не оптимальна в игре с матрицей (— 1)G.
Теорема. Пусть v — цена игры с (m X п)-матрицей G, Е—(m X п)-матрица, все элементы которой равны 1, и k— любая константа. Тогда каждая стратегия, оптимальная в игре с матрицей G, будет также оптимальной в игре с матрицей G + kE, а цена последней игры будет равна v + k. (Матрица G + kE получается из матрицы G путем прибавления к каждому элементу числа k.)
Доказательство. Пусть р° и q°— оптимальные стратегии в игре с матрицей G; тогда р°О >> V и Gq° V'. Мы имеем:
р° (G 4- kE) = p°G -Ь р° (kE)=р°О + k (р°Е) >
>(®, V, ...»	k, k) = (V-\-k, T)-[-k, .... v-]~k).
Аналогично получим
(G -4- kE) q° =Gq°+k (Eq°) <
Эти неравенства показывают, что ценой игры с матрицей G + kE служит v + k и что каждая стратегия, оптимальная в игре с матрицей G, будет также оптимальной в игре с матрицей G + kE,
§ 7. Еще о матричных играх: основная теорема
399
Матричные игры не представляют большого интереса до тех пор, пока мы не знаем, при каких условиях такие игры имеют решение. Основная теорема теории игр говорит о том, что каждая матричная игра имеет решение. Доказательство этой теоремы в общем случае слишком сложно, чтобы можно было его приводить в этой книге, и мы ограничимся рассмотрением случая (2 X 2)-матриц.
Основная теорема. Для игры с любой (m X п) -матрицей существует цена о и оптимальные стратегии: р° для игрока А и q° для игрока В. Другими словами, каждая матричная игра имеет решение.
Доказательство для случая (2X2)-матриц. Для случая строго детерминированной игры цена и оптимальные стратегии были найдены в § 4. Если игра не является строго детерминированной, то оптимальные стратегии и цена определяются по формулам (3) — (7) из § 5. Так как всякая игра является либо строго детерминированной, либо не строго детерминированной, то мы разобрали все случаи
Упражнения
1.	Для матриц G, данных в упр. 1 из § 6, найдите цены игр с матрицами kG и G + kE, где k принимает значения 3, 0 и —2.
2.	Пусть G— любая матрица и k = 0. Найдите все оптимальные стратегии для каждого игрока в игре с матрицей kG.
[Отв.: Любая стратегия будет оптимальной.] 3. Пусть G — любая матрица и пусть k > 0. Покажите, что каждая стратегия, оптимальная в игре с матрицей kG, будет также оптимальной в игре с матрицей G.
^Указание. Умножьте матрицу kG на  j
4.	Покажите, что если G — любая матрица и k — любая константа, то каждая стратегия, оптимальная в игре с матрицей G + kE будет оптимальной также в игре с матрицей G.
5.	Допустим, что перед началом матричной игры игрок В уплачивает игроку А сумму в размере k долларов. В таком случае мы будем говорить, что В произвел внеигровой платеж k в пользу А. (Если k отрицательно, то это будет внеигровой платеж игрока А в пользу игрока В.) (а) Покажите, что если В произвел внеигровой платеж k в пользу А, после чего А и В сыграли в игру с матрицей G, то это равносильно игре с матрицей G + kE.
(b)	Найдите цену игры с матрицей G — vE, где v — иена игры с матрицей G.
(с)	Используя результаты пп. (а) н (Ь) покажите, что любую Матричную игру с матрицей G и ценой v можно превратить в безобидную игру, если потребовать, чтобы В произвел внеигровой платеж- —V в пользу А.
6.	Покажите, что любую матрицу G путем прибавления одного и того же числа к каждому элементу этой матрицы и путем умножения каждого
400
Глава VI*. Линейное программирование и теория игр
элемента на положительное число можно превратить в матрицу безобидной матричной игры, причем каждый элемент этой матрицы будет заключен между —I в I,
7.	Покажите, что после преобразований, указанных в упр. 6, множество оптимальных стратегий для каждого игрока не изменится. Как изменяется после таких преобразований цена игры?
8.	Рассмотрим игру с матрицей
где а > Ь.
(а)	Покажите, что эта матрица может быть получена из единичной матрицы путем умножения ее на подходящее число и сложения с матрицей ЪЕ.
(Ь)	Решите эту игру, воспользовавшись результатами упр. 4 из § 6. [Отв.: v = а/3 + 2о/3.]
9.	Допустим, что элементы матричной игры переписаны в новых единицах (например, доллары вместо центов). Покажите, что денежная цена игры от этого не изменится,
10.	Рассмотрим игру в сравнение монет, матрица которой имеет вид
1 —1
—1 1
Если элементы этой матрицы представляют выигрыш или проигрыш од* ного пенни, то согласились ли бы вы сыграть в эту игру хотя бы один раз? Если элементы представляют выигрыш или проигрыш одного доллара, то согласились ли бы вы сыграть в эту игру хотя бы один раз? Если они представляют выигрыш или проигрыш одного миллиона долларов, то стали бы вы играть в нее хотя бы один раз? Покажите, что в каждом из этих случаев цена равна нулю, а оптимальные стратегии будут одними и теми же. Обсудите практическое применение теории игр в свете этого примера.
§ 8.	ИГРЫ, МАТРИЦЫ КОТОРЫХ ИМЕЮТ ТОЛЬКО ДВЕ СТРОКИ ИЛИ ТОЛЬКО ДВА СТОЛБЦА
После (2 X 2)-игр наиболее простыми матричными играми являются (2 X и)- и (т X 2)-игры, т. е. такие игры, при которых один из игроков имеет в своем распоряжении в каждой игре только два выбора. Здесь мы рассмотрим решения таких игр.
Пример 1. Допустим, что Джонс прячет в руке одну из следующих четырех ассигнаций: 1 или 2 доллара США или
§ 8. Игры с матрицами из двух строк или двух столбцов 401
1 или 2 канадские доллара. Смит произносит: «США» или «Канада», и получает эту ассигнацию, в случае если он сказал правильно. Матрица этой игры имеет вид:
Смит произносит США Канада
1 долл. США 2 долл. Джонс выбирает 1 долл. Канада 2 долл.	—1	0
	-2	0
	.0	—1
	0	-2
Очевидно, Джонс предпочтет выбирать каждый раз ассигнацию (канадскую или США) в 1 доллар, а не в 2 доллара, так как тем самым он может уменьшить свой проигрыш и заведомо не увеличит его. Это можно наблюдать на приведенной матрице, так как каждый элемент второй строки не превосходит соответствующего элемента первой строки и каждый элемент четвертой строки не превосходит соответствующего элемента третьей строки. В сущности мы можем выкинуть вторую и четвертую строку и свести эту игру к игре со следующей (2 X 2) -матрицей:
Смит произносит США Канада
США	1 долл.	—1 О
Джонс выбирает	-------------.
Канада 1 долл. О	—1
Новая матричная игра является не строго детерминиро-/1 Ц тт
ванной с оптимальными стратегиями I -% > у) для Джонса и
i I для Смита. Цена этой игры равна • Это означает, 2 /
что Смит должен перед началом игры уплатить Джонсу 50 центов.
Определение. Будем говорить, что i-я строка матрицы мажорирует l-ю строку, если каждый элемент f-й строки больше
26 Зак. 994
402
Глава VI*. Линейное программирование и теория игр
соответствующего элемента /-й строки (или равен ему). Аналогично будем говорить, что /-й столбец мажорируется k-м столбцом, если каждый элемент /-го столбца меньше или равен соответствующего элемента k-ro столбца.
Любую мажорирующую строку, а также любой мажорирующийся столбец матрицы игры можно удалить, не оказывая влияния на решение этой игры. Мы видим, что в примере 1 в первоначальной матрице игры 1-я строка мажорирует 2-ю строку и 3-я строка мажорирует 4-ю строку.
Пример 2. Рассмотрим снова карточную игру, описанную в § 4, только пусть на этот раз А получает ч. 5 и к. 3, а В получает ч. 6, ч. 5, к. 4 и к. 5. Выпишем матрицу этой игры:
ч. 6 ч. 5	к.-4 к. 5
ч. 5	1	0	-1	0
к. 3	—3	ьэ	1	2
Мы видим, что 3-й столбец мажорируется 4-м столбцом. Это означает, что игрок В никогда не должен играть к. 5. Таким образом, наша игра может быть сведена к игре со следующей (2 X 3)-матрицей:
ч. 5
к. 3
ч. 6 ч. 5 к. 4
1	0 -1
—3 —2	1
Больше нельзя удалить никакой строки и никакого столбца. Следовательно, чтобы решить эту игру, мы должны использовать новую технику. Можно показать (мы не будем этого делать), что решение (2 X п)- или (m X 2) -игры сводится к решению некоторого числа (2 X 2) -игр. Каждая из последних получается путем вычеркивания столбцов (или строк) первоначальной матрицы игры до тех пор, пока не останется (2 X 2)-матрица; соответствующая игра называется игрой, производной от первоначальной игры. Можно показать, что оптимальная стратегия каждого игрока является оптимальной в одной из производных игр и что цена игры является ценой одной из производных игр. Следовательно, наша задача сводится к решению всех про-
§ 8. Игры с матрицами из двух строк или двух столбцов 403
цена будет ценой всей игры. (2 X 3)-игра имеет
изводных (2 X 2)-игр и испытанию каждой стратегии для каждого игрока, а также каждой цены, для того чтобы определить, какие из стратегий будут оптимальными стратегиями и какая
Предыдущая
изводные игры:
ч.б ч.б
следующие три пре-
ч.б к.4
ч.5	к.4
ч.б	1	0	ч.б	1	-1	4.5	0	—1
к.З	-3	—2	к.З	—3	1	к.З	—2	1
Первая из них является строго детерминированной игрой, остальные не обладают этим свойством. Оптимальными стратегиями игрока А в каждой из этих производных игр /1 АЧ /2	1\	/3	1\ „
служат соответственно (1, 0),(-д-> у I и (у. у). Оптимальными стратегиями для В служат соответственно (1\
3 I
I
3 /
1
-уИ
0
1
Х\ 2 \ 1 / 2 /
Цены этих игр равны 0, —у и —Применяя эти три A-стратегии к первоначальной игре, мы видим, что при первой стратегии А может проиграть 1, при второй он может проиграть у, а при третьей он не может проиграть более чем у. Следовательно, стратегия (у. у! будет для него оптимальной и — у будет ценой игры. Чтобы применять В-стратегии в производных (2 X 2)-играх ко всей игре, мы должны сначала продолжить их стратегий. Тогда они примут вид:
до четырехкомпонентных
Легко проверить, что последняя ной для В.
26*
стратегия будет оптималь-
404
Глава VI*. Линейное программирование и теория игр
Решение всех	или (m X 2)-матричных игр можно
отыскать тем же путем. Сначала следует определить, является ли игра строго детерминированной. Если она не является строго детерминированной, то надо удалить все мажорирующие строки и мажорирующиеся столбцы. Затем остается решить все возможные производные (2 X 2)-игры, полученные путем вычеркивания одной или более строки или столбца. Цена первоначальной игры находится как цена одной из этих (2 X 2)-игр, а оптимальные стратегии первоначальной игры выбираются из оптимальных стратегий производных игр (которые, как правило, должны быть продолжены путем добавления нулей).
Пример 3. Рассмотрим (3 X 2)-игру с матрицей
Эта игра — строго детерминированная, так как элемент 3 является минимальным в своей строке и максимальным в своем столбце. Цена игры равна 3, а оптимальными стратегиями служат р° == (0, 0, 1) и р° = ( 0).
Пример 4. Вот другой числовой пример.
Здесь четвертый столбец мажорируется вторым и первый столбец мажорируется третьим. Игра сводится тогда к игре
с матрицей
Цена новой игры равна —4-» а оптимальными стратегия-(( 2х
3 \
1 I; последняя страте-3 /
§ 8. Игры с матрицами из двух строк или двух столбцов
405
ГИЯ
продолжается до стратегии
£ 3
которая является
Д
3 оптимальной для первоначальной игры.
Упражнения
1. Найдите решения игр с матрицами:
[з
Отв.\ v —
Отв.-, v = 5; (0, 0
10	112
0	—1	—2	—3	—10
406
Г.л. VI*. Линейное программирование и теория игр
2.	Найдите решения игр с матрицами:
(Ь)
0
1
12
11
12
О О о
3.	Найдите решение игры с матрицей
Поскольку для игрока В имеется более чем одна оптимальная стратегия, найдите для этого игрока семейство оптимальных стратегий. (См. § 6, упр. 3.)
4.	Пусть в карточной игре, разобранной в примере 2, игрок А имеет ч, 9,-ч. 5, к. 7 и к. 3, а игрок В имеет ч. 8 и к. 4. Выпишите отвечающую этой игре матрицу и найдите решение соответствующей игры.
[Отв.: v = 1; А показывает ч. 4 и к. 7, каждую из этих карт с ве-
роятностью -g-» В показывает каждую из своих карт с вероятно-1
СТЬЮ -g- .
5.	Допустим, что Джонс прячет в руке один, два, три или четыре серебряных доллара, а Смит отгадывает «четный» или «нечетный». Если Смит отгадывает правильно, он выигрывает ту сумму, которую прятал Джонс, в противном случае ои обязан уплатить такую же сумму Джонсу. Задайте соответствующую матричную игру. Найдите для каждого игрока такую оптимальную стратегию, в которой все его (чистые) стратегии имеют положительный вес. Безобидная ли это игра?
§ 8. Игры с матрицами из двух строк или двух столбцов
407
6.	Рассмотрим следующую игру. Игрок А объявляет «один» или «два»; после этого оба игрока пишут независимо друг от друга одно из этих двух чисел. Если сумма этих трех чисел оказывается нечетной, то R платит А эту нечетную сумму в долларах; если же она оказывается четной, то А платит В эту четную сумму в долларах.
(а)	Каковы стратегии для А?
(Указание. Он имеет четыре стратегии.)
(Ь)	Каковы стратегии для В?
(Указание. Каждая такая стратегия должна указывать В, что ему делать после того, как объявлено «два». Следовательно, В имеет четыре стратегии.)
(с)	Выпишите матрицу этой игры.
(d)	Ограничимся случаями, когда игрок А объявляет «два», и оставим только те стратегии В, в которых число, записываемое В, не зависну от числа, объявляемого А. Решите игру с полученной (2 X 2)-матрицей.
(е)	Продолжите смешанные стратегии предыдущего пункта до стратегий первоначальной игры и покажите, что это будут оптимальные стратегии.
'(f) Благоприятствует ли эта игра игроку А? Если да, то в какой степени?
7.	Рассмотрим игру, отличающуюся от игры из упр. 6 тем, что четную сумму получает А, а нечетную сумму получает В. Ответьте на те же вопросы, что и в упр. 6 (за исключением того, что в п. (Л) игрок А ограничивается объявлением числа «один»). Какая игра более благоприятствует А? Смогли бы вы предсказать это, не прибегая к теории игр?
8.	Ответьте на вопросы упр. 7 из § 6 в случае, когда выплаты производятся следующим образом. Если общее число показанных пальцев четно, то А получает одну единицу, а если оно нечетно, то В получает одну единицу, Предположим, что каждый игрок показывает только один или два пальца; тогда матрица этой игры будет такой же, что и для игры в сравнение монет. Покажите, что оптимальные стратегии этой игры после их продолжения становятся оптимальными стратегиями всей игры.
В Рассмотрим следующую игру. Каждый игрок показывает от одного дэ трех пальцев; игрок А всегда платит В сумму, равную числу пальцев, показанных игроком В; если В показывает в точности на один палец больше или на два пальца меньше, чем А, то В платит А некоторую положительную сумму х (где х не зависит от числа показанных пальцев), (а) Выпишите матрицу игры для произвольного х.
1
(Ь)	Покажите, что при х = -% игра будет строго детерминированной.
[5 1
Отв.: v = — -g-. I
(с)	Покажите, что если х — 2, то имеется пара оптимальных стратегия, при которых первый игрок показывает один или два пальца, а второй игрок показывает два или три пальца.
(Указание. Решите некоторую производную (2X2)-игру Найдите цену этой игры.)	£ Отв.: v =---j
(d)	Покажите, что если х ~ 6, то одной из оптимальных стратегий для А будет использование смешанной стратегии (> у) • Покажите,
408
Глава VI*. Линейное программирование и теория игр
что оптимальной смешанной стратегией для В будет выбор каждой из его трех стратегий с вероятностью -=-. Найдите цену этой игры, о
10.	Другой вариант предыдущей игры заключается в следующем. Каждый ' игрок показывает от одного до трех пальцев; если общее число показанных пальцев окажется четным, то игрок А получает сумму, равную числу пальцев, показанных игроком В; если же общее число показанных пальцев нечетно, то В получает сумму, равную числу пальцев, показанных А,
(а)	Выпишите матрицу этой игры.
(Ь)	Сведите эту игру к игре с (2 X 2)-матрицей.
(с)	Найдите оптимальные стратегии для каждого игрока и покажите, что эта игра — безобидная,
11.	Две компании, большая и маленькая, изготовляющие один и тот же продукт, хотят выстроить по новому магазину в одном из четырех городов,
3	4
Фиг. 132
/	г
расположенных вдоль шоссе. Примем все население этих четырех городов за 100%. Пусть распределение Населения и расстояния между городами таковы, как это показано на схеме, изображенной на фиг. 132. Предположим, что на долю большой компании приходится 80% всего оборота в каждом городе, находящемся от ее магазина на меньшем расстоянии, чем магазин маленькой компании; 60% оборота в городе, лежащем на равных расстояниях от этих двух магазинов; 40% оборота в городе, лежащем ближе к магазину маленькой компании,
(а)	Выпишите матрицу игры.
(Ь)	Проверьте, имеются ли мажорирующие строки н мажорирующиеся столбцы.
(с)	Найдите оптимальные стратегии и цену этой игры и объясните полученные результаты.
[Отв.: Обе компании должны построить магазины в городе 2; большая компания захватывает 60% оборота.]
12.	Решите поставленные в упр. 11 вопросы для случая, когда на долю большой компании приходится соответственно 90, 75 и 60% всего товарооборота.
13.	Мы приняли без доказательства, что любая (2 X п) -игра может быть решена путем рассмотрения только ее производных (2x2)-игр. Проверьте, что это имеет место для случая игры вида
В
а	0	1
0	ь	1
§ 9. Упрощенный покер
409
(а)	Покажите, что если или то столбец 3 мажорирует другой столбец. Решите игру.
(Ь)	Решите три производные (2 X 2)-игры, если а> 1 и b > 1.
(Указание. Две из них строго детерминированы.)
(с)	Покажите, что если а > 1, b > 1, но ab < а + Ь, то для обоих игроков оптимальными стратегиями служат оптимальные стратегии не строго детерминированной производной игры.
(d)	Покажите, что если ab > а + Ь, то А имеет своей оптимальной стратегией ту же стратегию, что и в п. (с), ио В имеет в качестве своей оптимальной стратегии некоторую чистую стратегию.
(е)	Используя предыдущие результаты, покажите, что в каждом случае цена игры равна наименьшей из цен трех производных игр,
§ 9. УПРОЩЕННЫЙ ПОКЕР
Чтобы показать, каким образом игра, определенная правилами, может быть представлена в виде матричной игры, мы проделаем это для упрощенного варианта одной хорошо известной карточной игры. Пример, изучением которого мы сейчас займемся, является упрощением (принадлежащим А. В. Таккеру) игры в покер, рассмотренной на стр. 211—219 книги Дж. фон Неймана и Оскара Моргенштерна «Теория игр и экономическое поведение» (J. von Neumann, О. Morgenstern, The Theory of Games and Economic Behavior, Princeton, 1944 (3-е изд., Princeton, 1953).
Колода, используемая в упрощенном покере, состоит из карт всего лишь двух типов, причем тех и других имеется поровну. Карты одного типа мы назовем «старшими», а другого — «младшими». Например, можно использовать обычную колоду из 52 карт, считая старшими карты красной масти, а младшими — карты черной масти. Каждый игрок «ставит» денежную сумму, равную по величине а, и получает одну-единственную карту. Под распределением карт мы будем понимать пару карт, первая из которых сдана игроку А, а вторая — игроку В. Таким образом, (С, С) означает распределение, при котором каждый игрок получает старшую карту. Возможны четыре распределения, а именно
(С, С), (С, М), (М, С), (М, М).
Если колода достаточно велика, то с большой степенью точности можно считать (см. упр. 1), что эти распределения карт равно-1 вероятны, т. е. что вероятность каждого из них равна
После сдачи карт игрок А делает первый ход, имея в своем распоряжении две альтернативы: он либо «открывает карту», либо «повышает ставку» путем прибавления суммы Ь. Если А открывает карту, то В также открывает карту. При этом игрок
410
Глава VI*. Линейное программирование и теория игр
с более сильной картой забирает обе ставки, в случае же одинаковых карт (обе старшие или обе младшие) каждый игрок получает назад свою ставку. Если А повышает свою ставку, то В имеет в своем распоряжении две альтернативы: он либо «пасует», либо «играет» путем прибавления к имеющимся ставкам суммы Ъ. Если В пасует, то А забирает ставки (не показывая своей карты). Если же В играет, то более сильная карта забирает обе ставки, а в случае одинаковых карт ставки делятся поровну. В этом и заключаются все правила игры.
Чистой стратегией для игрока будет команда, содержащая точное указание того, как ему поступать в каждой мыслимой ситуации, которая может возникнуть в ходе игры. Примером чистой стратегии для А служит: «Повысить ставку, если вы получаете старшую карту, и открыть карту, если вы получаете младшую карту». Сокращенно мы будем записывать эту стратегию как «повысить — открыть». Легко видеть, что А имеет четыре чистые стратегии: «повысить — повысить», «повысить — открыть», «открыть — повысить» и «открыть — открыть». Аналогично В имеет четыре чистые стратегии: «спасовать — спасовать», «спасовать — играть», «играть — спасовать», «играть — играть».
Если чистые стратегии каждого игрока фиксированы, то в зависимости от распределения карт имеется в точности четыре возможности для протекания игры. Например, предположим, что А выбрал стратегию «открыть—повысить», а В выбрал стратегию «спасовать — спасовать». В случае распределения (С, С) игрок А открывает карту, и ставки возвращаются назад, так что никто не выигрывает; в случае (С, М) игрок А открывает карту и забирает ставки, что делает его выигрыш равным а; в случае (М, С) игрок А повышает ставку, а игрок В пасует, так что А выигрывает а; наконец, в случае (М, М) игрок А повышает ставку, а игрок В пасует, так что А выигрывает а. Так как вероятность каждого такого распределения
1	.	За
равна-j-, то среднее значение выигрыша игрока А равно -4-.
Вычислим теперь среднее значение выигрыша, отвечающее стратегии «открыть — повысить» для А и стратегии «играть — спасовать» для В. В случае распределения (С, С) игрок А открывает карту и не выигрывает ничего; в случае (С, М) игрок А открывает карту и выигрывает а; в случае (М, С) игрок А повышает ставку, а игрок В играет и выигрывает а + й; наконец, в случае (М, М) игрок А повышает ставку, игрок В пасует, и А выигрывает а. Математическое ожидание выигрыша игрока А равно (а — Ь)/4,
§ 9. Упрощенный покер
411
Продолжая в том же духе, мы можем вычислить ожидаемый исход игры для каждого из 16 возможных выборов пар стратегий. Получающаяся матрица выплат имеет вид:
Старшая		спасовать	спасовать	играть	играть
	младшая	спасовать	играть	спасовать	играть
открыть	открыть	0	0	0	0
открыть	повысить |	За “Г	2а 4	а — b 4	ь 4
повысить	открыть |	В |tJ<	а-\-Ь 4	0	ь 4
повысить	повысить |	4а Т	За + Ь 4	а — Ь 4	0
Таким образом, осуществлен перевод игры, определенной нашими правилами, в матричную игру.
Так как а и Ь — положительные числа, то мы видим, что в написанной матрице четвертая строка мажорирует вторую, а третья строка мажорирует первую. Аналогично третий столбец мажорируется первым и вторым столбцами. Мы можем свести эту (4 X 4)-матрицу к следующей (2 X 2)-матрице:
	Старшая		Консервативная: играть	Блефовая: играть
		младшая	пасовать	играть
Консервативная:	повысить	открыть	0	ь 4
Блефовая:	повысить	повысить	а — b 4	0
Стратегию «повысить — открыть» мы называем «консервативной» для А, так как представляется благоразумным повышать ставку в случае старшей карты и открывать младшую. Стратегию «повысить — повысить», которая диктует повышение ставки и в случае младшей карты, мы называем «блефовой», так как эта стратегия соответствует обычному пониманию блефа1). По-
’) «Блефовать» — термин, употребляемый в игре в покер (с принципиальной стороны весьма близкой к описанной здесь игре); он означает повышение ставки без сильной карты на руках в надежде запугать противника и вынудить его к отказу от игры (к «пасу»).
412
Глава VI*. Линейное программирование и теория игр
добным же образом стратегию «играть — пасовать» мы назвали «консервативной», а стратегию «играть — играть» — блефом для игрока В.
Пример 1. Пусть а = 4 и b = 8. Тогда предыдущая матрица принимает вид:
Консервативная Блефовая
Консервативная Блефовая
Игра здесь строго детерминированная и безобидная. Оптимальная стратегия для каждого игрока — консервативная.
Пример 2. Пусть а — 8 и b = 4. Тогда матрица игры имеет вид:
Консервативная Блефовая
Консервативная	0	1
Блефовая	1	0
Здесь цена игры равна • Это означает, что игра благоприятствует игроку А. Оптимальная стратегия для каждого игрока — блефовая с вероятностью и консервативная
1
с вероятностью •
В последнем примере мы столкнулись с интереснейшим результатом теории игр: для осуществления оптимальной стратегии необходимо в части играемых партий идти на блеф.
Упражнения
1.	Пусть для игры в упрощенный покер берется обычная колода в 52 карты, причем старшими считаются карты красной масти, а младшими — карты черной масти. Вычислите с точностью до четырех десятичных знаков вероятность вынуть красную карту при условии, что одна красная карта уже была вынута. Пользуясь этим результатом, исследуйте, насколько точным является предположение об одинаковой вероятности четырех распределений карт. Как может быть улучшена точность этого предположения?
2.	В найденной выше (4 X 4) -матрице положим а = 4, 6 = 8. Путем вычеркивания мажорирующих строк и мажорирующихся столбцов свели ее к (2 X 2)-матрице. Будет ли эта матрица такой же, что и в примере 1? То же самое при а = 8, Ъ = 4 и для примера 2.
3.	Покажите, что если а -С Ь, то упрощенный покер является строго детерминированной и безобидной игрой. Покажите также, что оптимальные стратегии обоих игроков — консервативные.
§ 9. Упрощенный покер
413
4.	Покажите, что если а > Ь, то упрощенный покер благоприятствует игроку А Покажите также, что при оптимальном образе действий каждый игрок должен блефовать с положительной вероятностью, и найдите оптимальные стратегии.
Б. При а > Ь исследуйте, каким образом можно сделать игру безобидной, 6. Покажите, что при Ь^а оптимальная стратегия для игрока А не единственна. Покажите также, что, хотя он имеет две «оптимальные» стратегии, стратегия «повысить — открыть» в определенном смысле предпочти-' тельнее другой.
7.	Покажите, что при а = 8, b = 4 оптимальную стратегию игрока А можно описать следующим образом: «В случае старшей карты всегда повышать 1 ставку, в случае младшей карты повышать ставку с вероятностью -g- »• Опишите аналогично оптимальную стратегию игрока В.
В упражнениях, приводимых ниже, рассматривается один вариант упрощенного покера. Для реального покера характерно, что чаще всего игроки получают плохие карты и очень редко — хорошие. Можно сделать нашу модель покера более реальной, если ввести предположение, что сдача младшей карты вероятней сдачи старшей карты. Мы будем
1 считать, что вероятность сдачи старшей карты равна всего лишь -g-. Правила игры остаются такими же, как и выше.
8.	Найдите вероятность распределений карт (С, С), (С, М), (М, С) и (М, М).
9.	Стратегии обоих игроков — те же, что и в тексте. Следовательно, мы имеем аналогичную (4 X 4)-матрицу игры. Вычислите тем же способом, что и в тексте, но используя результат упр. 8, элемент, стоящий в строке «открыть — повысить» и столбце «пасовать — пасовать». То же самое для элемента строки «открыть — повысить» и столбца «играть — пасовать».	[Отв.: 24а/25; (16—46)/25.]
10.	Вычислите остальные элементы и выпишите матрицу игры.
11.	Покажите, что две строки мажорируют другие строки и два столбца мажорируются другими столбцами.
12.	Покажите, что получающаяся в результате (2 X 2)-игра будет строго детерминированной тогда и только тогда, когда 6>-4с. Чему при этом условии равна цена игры?
13.	Пусть, как и в тексте, а = 4, 6 = 8. Решите игру и сравните решение с решением в тексте.
[Отв.: Каждый игрок должен в половине случаев блефовать; о=-д=-;
в первом варианте при этих условиях блеф не использовался, и игра была безобидной.]
14.	Пусть, как и в тексте, а = 8, 6 = 4. Решите игру и сравните решение с решением в тексте.
[Отв.: Каждый игрок играет более консервативно; условия игры несколько более благоприятствуют игроку А, нежели в первом варианте.]
15.	Игроки договорились о том, что размером первоначальной ставки являются 4 доллара. Они обдумывают, какой им выбрать размер повышающей ставки. На каком значении для 6 должен настаивать игрок А?
(Указание. Он не хочет, чтобы игра б^ла безобидной. Какими должны быть соответствующие значения 6? Найдите цену (2X2)-игры для любых таких 6 и найдите максимальную цену путем испытания нескольких значений для 6,)
414 Глава VI*. Линейное программирование и теория игр
ЛИТЕРАТУРА ДЛЯ ДОПОЛНИТЕЛЬНОГО ЧТЕНИЯ
ЧарнсА., Купер В., Хендерсон А., Введение в линейное программирование, М., Изд. Моск. гос. эконом, ин-тута, 1960.
Гасс С., Линейное программирование, М., Физматгиз, 1961.
Ю д и н Д. Б., Г о л ь ш т е й н Е. Г., Задачи и методы линейного программирования, М., «Сов. радио», 1961.
Венцель Е. С., Элементы теории игр, М., Физматгиз, 1961.
Вильямс Дж. Д., Совершенный стратег или Букварь по теории стратегических игр, М., «Сов. радио», 1960.
Мак-Кинси Дж., Введение в тероию игр. М., Физматгиз, 1960.
Лью с Р. Д., Райфа X.. Игры и решения. Введение и критический обзоо.
М., ИЛ, 1961.
Линейные неравенства (сборник переводов), М., ИЛ, 1959.
Матричные игры (сборник переводов), М., Физматгиз, 1961,
Глава VII*
ПРИМЕНЕНИЕ К БИХЕВИОРИСТКИМ ПРОБЛ ЕМАМ
§ 1. СОЦИОМЕТРИЧЕСКИЕ МАТРИЦЫ
Матрицы, все элементы которых равны либо 0, либо 1, использовались социологами для анализа структуры отношений доминирования в группах индивидуумов (животных или людей). Для обозначения того, что индивидуум At «доминирует» над индивидуумом А2, мы будем применять запись Ai^>A2. Например, по способности склевывать корм на птичьем дворе курица Aj может доминировать над курицей А2, т. е. At^>A2 означает, что «курица At проворнее курицы А2». Другой пример: пусть At и А2— спортивные команды, а отношение	означает, что
«команда At сильнее команды А2 (г. е. выигрывает у этой команды)».
Мы будем говорить, что отношение является отношением доминирования, если оно обладает следующими двумя свойствами:
(i) Неверно, что Al'^>Ai. Иными словами, никакой индивидуум не может доминировать над самим собой.
(ii) Для каждой пары индивидуумов А[ и А2 либо Д}^> А2, либо А» А, но не могут иметь место оба эти отношения. Иначе говоря, в каждой паре индивидуумов в точности один индивидуум доминирует над другим.
Было замечено, что способность кур склевывать пищу описывается отношением доминирования. Также и в любом спортивном состязании, проводимом в один круг и без ничьих (вроде состязания по бейсболу1)), отношение команд, устанавливаемое результатами состязания, есть отношение доминирования.
Читатель может удивиться отсутствию условия транзитивности: требования, чтобы из А^Э>А2 и А^А следовало А^>А-
>) Или по волейболу,
416 Гл. VII*. Применение к бихевиористским проблемам
Стоит, однако, обдумать эти вопросы более тщательно, чтобы убедиться в неосновательности требования транзитивности отношения доминирования. Действительно, если, скажем, команда А выигрывает у команды В, а команда В выигрывает у команды С, то отсюда еще вовсе не всегда следует, что команда А обязательно должна выиграть у команды С. Почти в каждом футбольном сезоне можно наблюдать примеры отклонения от этого правила.
Для изображения отношений доминирования удобно пользоваться так называемыми направленными графами. Два таких графа изображены на фиг. 133 Индивидуумы изображаются точками и обозначаются буквами, а отношение доминирования
Фиг. 133
между двумя индивидуумами — направленным отрезком прямой (отрезком со стрелкой), соединяющим эти две точки. Граф на фиг. 133, а изображает случай, когда Ai доминирует над А2, А2 доминирует над А3 и Аз доминирует над Аь Аналогично на фиг. 133, б А] доминирует над А2 и А3, а А2 доминирует над А3 Эти графы изображают две существенно различные ситуации, связанные с отношением доминирования, которые могут иметь место в случае трех индивидуумов (ср. упр. 1).
Еще один способ описания отношений доминирования заключается в использовании так называемых матриц доминирования, у которых каждый элемент равен либо 0, либо 1. На фиг. 134 приведены две такие матрицы. Мы пометили строки и столбцы буквами, служащими для обозначения индивидуумов. Элемент 1 в строке, помеченной А;, и столбце, помеченном А,-, означает, что индивидуум А( доминирует над индивидуумом Ау, т. е. Az^> Аналогично элемент 0 служит для указания того, что Az не доминирует над Aj. Читатель может проверить, что слу-
§ 1. Социометрические матрицы
417
чаи доминирования, представленные на фиг. 133, а и 133,6,— те же, что и на фиг. 134, а и 134,6.
Aj А2 Д3	yij А2 А2
AX[Q	1	0\	Д/0	1	1\
Д О	0	1 ]	Д О	О	II.
Лд\1	о	о/	аДо	о	о/
а	б
Фиг. 134
Так как матрица доминирования отражает отношение доминирования, то можно проследить, какие ограничения накладывают на нее приведенные выше условия (i) и (ii). Условие (i) означает просто, что все элементы матрицы, стоящие на главной диагонали (диагонали, идущей слева направо и вниз), должны быть нулями. Условие (ii) означает, что если некоторый элемент, расположенный над главной диагональю, равен 1, то симметричный ему относительно главной диагонали элемент будет равен нулю, и наоборот. Чтобы сформулировать эти условия более точно, предположим, что имеется п индивидуумов и матрица доминирования D с элементами dZy. Тогда наши условия примут вид:
(i) du = Q для i = 1, 2, ..., п.
(ii) Если i j, то dtj = 1 тогда и только тогда, когда *Д7 = 0.
Единицы, стоящие в i-й строке, соответствуют тем индивидуумам, над которыми доминирует At Единицы, стоящие в /-м столбце, соответствуют тем индивидуумам, которые доминируют над Aj.
Матрица доминирования — квадратная, поэтому всегда можно найти ее степени D2, Ds и т. д. Пусть Е = D2; рассмотрим элемент, стоящий в г-й строке и /-м столбце матрицы Е. Мы имеем:
eij — dndij-\-di2d2j-\- ... -\-dindnj.
Слагаемое вида dlkdk] не равно нулю только в том случае,-когда не равны нулю оба сомножителя, т. е. когда оба они равны 1. Но если dik — 1, то индивидуум доминирует над Ak, -а если dkj=l, то индивидуум Ak доминирует над А}. Другими словами, At^>AkА}. Доминирование такого типа мы будем называть двучленным доминированием. (Чтобы быть последова.-тельными, мы будем называть At^§>Aj одночленным доминированием.) Теперь можно сказать, что- элемент е1} равен числу
27 Зак. 994.
418
Гл. VII*. Применение к бихевиористским проблемам
двучленных доминирований индивидуума Лг умом Aj.
Пусть, например, D есть матрица
/О 1 1 1\
( ° ° 1 1 ] 0 0 0 11'
\о о о о/
Тогда D2 есть матрица
(О 0 1 2\ 0 0 0 1| О О О О I 0 0 0 0/
над индивиду-
Итак, мы видим, что в этом примере At имеет одно двучленное доминирование над А3 и два двучленных доминирования над Л4. Точно так же Лг имеет одно двучленное доминирование над Л4. Символически это может
А	быть записано следующим об-
разом:
Л4	Л2	Л3,
Ai Аг Л4, АЭ>ДзЭ>А, Д»л3э>л4.
Фиг 135
Эти отношения доминирования представлены направленным графом на фиг. 135. Читатель должен проследить на нем выписанные двучленные доминирования.
В следующем параграфе будет доказана
Теорема. Пусть на множестве из п индивидуумов А ь Л2, ...
Ап определено отношение доминирования^*. Тогда существует по крайней мере один индивидуум, который может доминировать одночленным или двучленным образом над каждым из остальных индивидуумов данной группы. Аналогично существует по крайней мере один индивидуум, над которым доминирует одночленно или двучленно каждый из остальных индивидуумов.
На языке матриц эту теорему можно сформулировать следующим образом. Пусть S = D + D2. Тогда существует по крайней мере одна строка (а также столбец) матрицы S, всеэлемен-
§ 1. Социометрические матрицы
419
ты которой, кроме элемента, стоящего на главной диагонали, отличны от нуля.
Для иллюстрации этой теоремы рассмотрим случай доминирования, представленный на фиг. 136. Матрица доминирования D и ее квадрат D2 имеют вид:
(О 1 0 1 \	/0	1	2	0 \
О 0 1 0 ]	(1	0	0	0|
1000 Г	I 0 1 0 1 I
0110/	\1	0	1	0 /
Соответствующая матрица S равна	
	/0 2 2 1\ '10 10]
	1 1 0 1 ’ \1 1 2 0/
Мы видим, что Дь А3 и А4 могут доминировать одночленно или двучленно над каждым из остальных индивидуумов, но Л2 не может доминировать таким образом над А4. Точно так же над каждым из индивидуумов At, Д2 и А3 доминирует одночленно или двучленно каждый из осталь-ных индивидуумов, тогда как над А4 не может доминировать таким образом Л2. Полезно про-	.г ♦
верить справедливость этих вы-сказываний на направленном гра- д фе, изображенном на фиг. 136. 3	*
В качестве последнего приме-	Фиг. 136
нения матриц доминирования
мы дадим определение ранга индиввдуума. Рангом индивидуума при данном отношении доминирования называется число всех одночленных и двучленных доминирований, которые этот индивидуум может осуществить. Число всех одночленных доминирований, осуществляемых индивидуумом А{, равно сумме элементов i-й строки матрицы £>, а число всех двучленных доминирований, осуществляемых Ait равно сумме элементов i-й строки матрицы D2. Следовательно, ранг индивидуума At равен сумме элементов i-й строки матрицы
S — D^-D2.
27=
420
Гл. VII*. Применение к бихевиористским проблемам
Легко убедиться, что в примере, изображенном на фиг. 136, различные индивидуумы имеют следующие ранги:
ранг Д равен 5;
ранг А2 равен 2;
ранг Л3 равен 3;
ранг А4 равен 4
Пример. Понятием ранга индивидуума можно пользоваться для оценки результатов спортивных соревнований. Пусть, например, один тур какого-то матча дал следующие результаты:
команда А выиграла у команд В и D;
команда В выиграла у команды С;
команда С выиграла у команды А;
команда D выиграла у команд С и В.
Легко видеть, что этот случай доминирования совпадает с тем, который представлен на фиг. 136. В соответствии с проведенным выше анализом мы можем расположить эти команды в следующем порядке по их рангу: A, D, С и В.
Необходимо заметить, что данное здесь определение ранга индивидуума не является единственно возможным. В упр. 10 этого параграфа используется другое определение ранга, которое приводит к другим результатам. Прежде чем воспользоваться тем или другим из этих определений, социолог должен решить, какое из них лучше отвечает его целям (если вообще годится хоть одно из них).
Упражнения
1. Покажите, что сравнение способности трех кур склевывать корм дает лишь два существенно различных типа отношений доминирования, а именно те, которые даны на фиг. 133.
{Указание. Воспользуйтесь направленными графами.1
2. Найдите матрицы доминирования D, которые соответствуют направленным графам, изображенным на фиг. 137
.0110
8. Вычислите матрицы О2 и S = D 4- D2 для примеров, перечисленных в упр. 2, и определите ранг каждого из индивидуумов.
	0	1	1	0		0	2	1	1	
	0	0	0	0		0	0	0	0	; 4, 0, 4, 4.J
[Отв.: (b) £>2 =	0	1	0	1	: s =	1	2	0	1	
	1	1	0	0		1	2	1	0	
§ 1. Социометрические матрицы
42!
4 Определите ранг каждого индивидуума в ситуации доминирования, заданной матрицей доминирования
1° 1
1 о о о
1 о О 1 о о о о О 1 1 о О 1
О 1 1 1 1 о
О 1 о о
О 1 О 1
1 1 О 1 1 о 1 1 о о
О 1 о о
[Отв.: Эти ранги равны соответственно 14, 14, 14, 14, 4, 10, 6.]
Б. Найдите все существенно различные типы отношений доминирования, возможные при сравнении способности четырех кур склевывать корм.
[Отв.: Возможны четыре существенно различных типа.]
6.	Пусть £> — матрица доминирования. Дайте интерпретацию для элементов столбцов матрицы S — D + D2. Дайте также интерпретацию сумм элементов столбцов матрицы S.
7.	Пусть D — матрица доминирования Дайте интерпретацию элементов матрицы D3; дайте также интерпретацию сумм элементов строк или элементов столбцов матрицы D3; то же самое сделайте для элементов и для сумм элементов строк (или столбцов) матрицы S(3> =• D + D2 + D?,
28 Зак. 994/
422
Гл VII*. Применение к бихевиористским проблемам
[Ошв.-. Элементы i-й строки матрицы В3 дают трехчленные доминирования, осуществляемые индивидуумом Ац сумма элементов i-строки матрицы D3 дает число всех трехчленных доминирований, осуществляемых Ар Элементы матрицы S дают число одночленных, двучленных и трехчленных доминирований, осуществляемых Ар а сумма элементов i-й строки матрицы S дает число всех таких доминирований.]
8.	Пусть D — матрица доминирования. Дайте интерпретацию элементов матрицы
S("> = Г)-|-£)2 + £)34- ... +D".
Дайте также интерпретацию сумм элементов строк (или столбцов) этой матрицы.
9.	Теннисный матч между четырьмя игроками дал следующие результаты: Смит выиграл у Брауна и у Джонса;
Джонс выиграл у Брауна;
Тейлор выиграл у Смита, у Брауна и у Джонса.
Путем нахождения ранга каждого игрока разделите между ними первое, второе, третье и четвертое места. Согласуется ли такое разделение с вашей интуицией?
[Отв.: Ранг Тейлора = 6, ранг Смита = 3, ранг Джонса = 1 и ранг Брауна — 0.]
‘0. Будем для обозначения ранга индивидуума, определенного в основном тексте, применять запись «раин». Определим теперь новый ранг индивидуума — «ранг2» — следующим образом. Если D — матрица доминирования для группы объектов из п Индивидуумов, то ранга индивидуума А равен сумме элементов i-и строки матрицы
Для каждой из спортивных Команд разобранного В Тексте Примера найдите ранга. Покажите, что для одной и той же команды рани и ранга могут не совпадать. Прокомментируйте полученные результаты.
11.	Найдите ранга каждого Из игроков, фигурирующих в упр. 9. Для каждого игрока рассмотрите связь между его рангом] и рангома.
9	’	5
[Отв.: Ранга Тейлора равен ту, ранга Смита равен ту, ранга Джонса равен 1 и ранга Брауна равен 0.]
12.	Интерпретируйте элементы следующей матрицы:
••• +-wDm-
Дайте Также интерпретацию суммы элементов ее строки или столбца.
13.	Используя результат упр. 5, докажите, что если о результатах матча между четырьмя игроками судить по рангам игроков, то случится одно из двух: либо разные игроки займут в таблице разные места, либо одно место (первое или второе) разделится между тремя игроками. В последнем Случае Покажите, пользуясь соображениями симметрии, что не существует рационального метода, который позволил бы отдать предпочтение тому или иному из игроков (без проведения дополнительной игры).
14.	В разобранном в тексте примере замените глагол «выиграть» глаголом «проиграть». Приведет ли это к изменению порядка команд в зависимости от их ранга иа противоположный? Решите тот же вопрос в применении к ситуации, описанной в упр. 9,
[Отв.: Нет; С, В, A, D; да.]
§ 2. Коммуникационные сети
423
§ 2. коммуникационные сети
Коммуникационной сетью называется множество из п лиц (назовем их Ль Л2,	Л„) с некоторым числом связей между
ними. Каждая такая связь устанавливает сообщение между двумя лицами и может быть либо односторонней, либо двусторонней. Двустороннюю связь может, например, осуществлять телефон или радио, одностороннюю связь — курьер, сигнальная лампочка, взрыв, и т. д. Мы снова будем употреблять символ ^>, но теперь Л/^>Д;. означает, что индивидуум А( может сообщаться с индивидуумом Aj (в направлении or At к А}). Единственное требование, которое мы теперь налагаем на символ ^>, заключается в следующем:
(i)	Ни для какого i не может иметь места Ai'^>Ai, т. е. никакой индивидуум не может (или не имеет надобности) сообщаться с самим собой
Заметим, что мы опустили второе из условий, принятых в предыдущем параграфе: мы теперь не требуем, чтобы для каждой пары индивидуумов по меньшей мере один мог сообщаться с другим. Допускается также, что как At^> А}, так и А}~^> А„ т. е. допускается двусторонняя связь.
Для изображения коммуникационных сетей мы будем, как и в предыдущем разделе, пользоваться направленными графами. На фиг. 138 изображены два таких графа. Стрелки здесь указывают, в каком направлении может быть передано сообщение. Две стрелки означают, что сообщение может быть передано в обоих направлениях.
Как и раньше, мы можем также представлять коммуникационные сети при помощи матриц С, у которых каждый элемент 28*
124
Гл. VII*. Применение к бихевиористским проблемам
равен либо 0, либо 1, и которые мы будем называть коммуникационными матрицами. Элемент, принадлежащий i-й строке и j-му столбцу матрицы С, должен быть равен 1, если А1 может передать сообщение Л,, и равен 0 в противном случае. Коммуникационные матрицы, соответствующие коммуникационным сетям, изображенным на фиг. 138, приведены на фиг. 139.
(О	1 0	0\	/0	1	0	0\
1	0 1	О |	1	0	0	0 |
0 0 0 11 с = 1 0 1 о о '
0	10	0/	\0	1	о	о/
а	б
Фиг. 139
Заметим, что в матрицах, приведенных на фиг. 139, все диагональные элементы матрицы равны 0. Это обстоятельство имеет место для всех коммуникационных матриц, так как условие (1), выраженное на языке матриц, означает, что са — 0 для всех I. Легко видеть, что любая матрица, у которой каждый элемент равен либо 0, либо 1 и все элементы главной диагонали равны нулю, является коммуникационной матрицей некоторой сети.
Квадрат коммуникационной матрицы может быть интерпретирован аналогично интрепретации квадрата матрицы доминирования. Если С — коммуникационная матрица, то элемент, стоящий в i-й строке и /-м столбце матрицы С2, означает число двухзвенных сообщений, ведущих от At к А}-. Например, квадрат матрицы, фигурирующей на фиг. 139, а, равен
/1 0 1 0\
( 0 1 0 1 |
10 10 11 \1 0 1 о/
Элемент 1, стоящий в верхнем левом, углу, показывает, что А может сообщаться сам с собой, используя два звена связи. Действительно, коммуникационной сетью в этом случае может быть Д А2 '^> At. Мы видим также, что, например, А4 может посылать двузвенные сообщения как Alf так и Аз. Эти и другие двузвенные связи, представленные матрицей С2, можно видеть на графе, изображенном на фиг. 138, а.
Как и в § 1, нас будет интересовать сумма матриц С и С2. Пусть S = С + С2. Следующая теорема является обобщением теоремы, сформулированной в § 1 (см. упр. 7 настоящего параграфа).
§ 2. Коммуникационные сети
425
Теорема. Пусть коммуникационная сеть из п индивидуумов такова, что между каждыми двумя индивидуумами возможна по крайней мере односторонняя связь. Тогда существует по меньшей мере один индивидуум, который может послать каждому из остальных индивидуумов однозвенное или двузвенное сообщение. Аналогично существует по меньшей мере один индивидуум, который может получать от каждого из остальных индивидуумов однозвенное или двузвенное сообщение.
На языке матриц эта теорема формулируется так: Пусть С — коммуникационная матрица описанной выше сети; тогда в матрице S = С + С2 имеется по меньшей мере одна строка, все элементы которой (за исключением, быть может, элемента, находящегося на главной диагонали) не равны нулю. Аналогично имеется по меньшей мере один столбец с этим же свойством.
Доказательство. Мы докажем только первое утверждение теоремы, потому что второе доказывается аналогично.
Покажем прежде всего, что если индивидуум А] не может послать однозвенное или двузвенное сообщение индивидууму Д, где i Ф 1, то число индивидуумов, которым А{ может послать однозвенное сообщение, по меньшей мере на единицу больше числа индивидуумов, которым может послать однозвенное сообщение Аг. Доказательство этого утверждения мы разобьем на два шага. Прежде всего из условия теоремы следует, что
(а)	Если Д не может послать At однозвенное сообщение, т. е. если неверно, что Д^>Д, то At'^>A1.
(b)	Если Ai не может послать А, двузвенное сообщение, т. ё. если для всех k неверно, что Д^> Ak~^Alt то из A1'^>Ak следует также, что и Д Ak.
В самом деле, если Д^Д, то неверно, что Ak^> At. Следовательно, по условию теоремы, Д^Д.
Утверждение (Ь) говорит, что если At может передать однозвенное сообщение какому-нибудь индивидууму, то тому же самому индивидууму может передать однозвенное сообщение также и Д. Отсюда и из (а) следует, что А{ может передать по крайней мере на одно однозвенное сообщение больше, чем At.
Вернемся к доказательству теоремы. Пусть Щ, r2,	—
суммы элементов строк матрицы С. Переименовав, если нужно, Д, ..., Д, мы можем добиться того, чтобы наибольшей из этих сумм была сумма л, т. е. чтобы было л при k = 1, 2, ..., п. Покажем, что Ai может передать однозвенное или двузвенное сообщение каждому из остальных индивидуумов. Доказательство имеет косвенный характер. Предположим противное, т. е, что имеется индивидуум Д, i> 1, которому Ai не может передать однозвенное или двузвенное сообщение. В таком случае, как мы уже знаем, число индивидуумов, которым А{ может
426
Гл. VII*. Применение к бихевиористским проблемам
передать однозвенное сообщение, по крайней мере на единицу больше числа индивидуумов, которым может передать однозвенное сообщение А\. Но отсюда следует, что г»> и— а это противоречит нашему предположению о том, что rt>-rz. Это противоречие и доказывает теорему.
Из нашего доказательства так же следует, что индивидуум, которому отвечает наибольшая сумма элементов строки матрицы С, может передавать однозвенное или двузвенное сообщение каждому из остальных индивидуумов. Аналогично индивидууму, для которого сумма элементов столбца наибольшая, может передать однозвенное или двузвенное сообщение каждый из остальных индивидуумов.
Пример. Сеть, изображенная на фиг. 140, удовлетворяет условию нашей теоремы. Поэтому для нее верно и заключение этой теоремы. Коммуникационная матрица этой сети имеет вид
0 1 1 0\
0 0 10]
0 10 11’
110 0/
Здесь максимальную сумму элементов, равную 2, имеют первая, третья и четвертая строки. Следовательно, Ai, Аз и А4 могут передавать однозвенное *	или двузвенное сообщение ка-
/ \	ждому индивидууму. (Укажите
/	\	на фиг. 140 пути, реализующие
/	‘	Хк	эти передачи.) Но Аг может пе-
У j. Xu	редать только трехзвенное сооб-
\	щение Аь Сумма элементов вто-
.	рого столбца является макси-
г	4 мальной и равна 3. Следователь-
Ф и г. 140	но, А2 может получать однозвен-
ное или двузвенное сообщение от каждого индивидуума. (На самом деле здесь можно обойтись далее одними лишь однозвенными сообщениями.) Оказывается, что А3 и А4 тоже могут получать однозвенное или двузвенное сообщение от каждого индивидуума, но Ai не может, как это было замечено выше.
Ни одна из сетей, изображенных на фиг. 138, не удовлетворяет условию теоремы, причем сеть, изображенная на фиг. 138, а, удовлетворяет заключению теоремы, а сеть, изображенная на фиг. 138,6, не удовлетворяет ему. (См. упр. 4.), '
§ 2. Коммуникационные сети
427
Упражнения
1. Напишите коммуникационные матрицы для коммуникационных сетей, изображенных иа фиг. 141,
Отв.’, (а)
0 0 10
10 0 0
110 0
10 11
графы, соответствующие
2. Вычертите направленные кационным матрицам:
следующим коммуни-
/О 1
(а) | 0 О \ 1 1
1 \
1 ); (Ь) о/
О 1
1 о о о
1 1
О 1
О 1
О 1
1 о
(С)
0 10 1
10 10
10 0 1
0 110
(Й)
0 0 0 0
0 0 0 0
10 0 0
0 0 10
3.	Какие из коммуникационных сетей, соответствующих матрицам, выписанным в упр. 2, удовлетворяют условию теоремы этого параграфа?
[Отв.: (а) и (с).]
4.	Покажите, что для сети, изображенной на фиг 138, а, верно заключение теоремы, а для сети, изображенной на фиг. 138, б, оно не верно.
5.	Для каждой коммуникационной матрицы из числа выписанных в упр. 2 найдите матрицу S и с ее помощью укажите индивидуумы, которые могут передавать сообщения (однозвенные или двузвенные) каждому из
428
Гл. VII*. Применение к бихевиористским проблемам
остальных, а также индивидуумы, которым может быть передано однозвенное или двузвенное сообщение от каждого индивидуума. В некоторых случаях таких индивидуумов может и не быть. (См. упр. 3.)
[Отв.: (а) Каждый. (Ь) Каждый, (d) Нет ни тех, ни других.]
6.	Найдите все коммуникационные сети для трех индивидуумов, удовлетворяющие условию теоремы настоящего параграфа. Сколько среди них существенно различных сетей?	[Отв.: Семь.]
7.	Покажите, что теорема, сформулированная в предыдущем параграфе, является следствием теоремы, доказанной в настоящем параграфе.
8.	Объясните смысл элементов матрицы С3, где С — некоторая коммуникационная матрица. То же самое для матрицы С4.
[Отв.: Элемент, принадлежащий i-й строке и /-му столбцу матрицы С3, дает число возможных трехзвенных сообщений, связывающих А, и Aj. Соответствующий элемент матрицы С4 дает число всех возможных четырехзвенных сообщений, связывающих и Лу.]
9.	Какой смысл имеют элементы матрицы S(m' = С 4- С2 + С3 + ... + Ст, где С коммуникационная матрица?
10.	Докажите второе утверждение теоремы настоящего параграфа.
11.	Докажите истинность следующего высказывания: для того чтобы в коммуникационной сети, связывающей трех индивидуумов, сообщение, посланное любым из индивидуумов, могло быть получено любым другим индивидуумом, необходимо и достаточно, чтобы каждый индивидуум мог посылать сообщения по меньшей мере одному индивидууму и мог получать сообщения по меньшей мере от одного индивидуума.
12.	Покажите, что условие упр. 11 имеет следующую матричную форму: каждая строка и каждый столбец коммуникационной матрицы должен содержать по крайней мере один ненулевой элемент.
13.	Будет ли истинным утверждение упр. 11 для коммуникационной сети из двух индивидуумов? Из четырех или более?	[Отв.: Да; нет.]
§ 3. СТОХАСТИЧЕСКИЕ ПРОЦЕССЫ В ГЕНЕТИКЕ
Вернемся к схеме наследования определенных признаков, затронутой в примерах 7—9 из § 7 гл. V. Там шла речь о наследственных признаках, определяемых одной парой генов, передаваемых потомству каждым из родителей; эти гены могут быть двух существенно разных типов, которые мы обозначили буквами G и g. Данная особь может иметь эти гены или в комбина* ции GG, или в комбинации Gg (что генетически не отличается от комбинации gG), или в комбинации gg. Если особи, несущие Гены GG и Gg, неразличимы по внешнему виду (что очень часто имеет место), то говорят, что ген G доминирует над геном g. Особь называется доминантной по данному признаку, если она имеет комбинацию генов GG, рецессивной, если она имеет комбинацию gg, и гибридной, если она имеет комбинацию Gg.
Основное допущение генетики заключается в том, что выбор генов, отбираемых по одному гену из пары генов каждого из родителей, происходит случайно и независимо. Это допущение дает возможность определить вероятность появления потомства
§ 3. Стохастические процессы в генетике
429
каждого типа. Потомок двух доминантных особей заведомо будет доминантным, потомок двух рецессивных особей — рецессивным, а потомок рецессивной и доминантной особей — гибридом. Потомок доминантной особи и гибридной особи унаследует от первой особи ген G, а от второй особи с одинаковой вероятностью, равной-g-, ген G или g Следовательно, в этом случае с одинаковой вероятностью можно получить доминантное или гибридное потомство. Аналогично при скрещивании рецессивной особи с гибридной с одинаковой вероятностью можно получить рецессивное или гибридное потомство. Наконец, при скрещивании двух гибридов вероятность наследования потомком от каждого из родителей гена G или гена g равна у. Следовательно, вероятность признака GG равна -4-. вероятность признака Gg
1	1 i
равна -g- и вероятность признака gg равна (см. выше, стр. 307—309).
Пример 1. Рассмотрим следующий процесс последовательных скрещиваний. На первом шаге особь, генетический характер которой неизвестен, скрещивается с гибридом. Потомок снова скрещивается с гибридом и т. д. Этот процесс представляет собой марковскую цепь с состояниями «доминант», «гибрид» и «рецессив». Как видно из предыдущего абзаца, матрица вероятностей перехода имеет вид:
Д г Р
1
2
2 4
0
д
Р = Г
р
2	2
2	4
1	1
2	2
(1)
Ввиду того что все элементы матрицы Р2 положительны (см. упр. 1), существует, и притом единственный, неподвижный вероятностный вектор, т. е. такой вероятностный вектор р, что рР — р (см. § 8, гл. V). Решив систему трех уравнений, мы найдем этот неподвижный вектор: р =
/1 1 1\ „ л
= l-j-, -g-, I. Следовательно, к какому бы типу ни принадлежала первая особь, вероятность появления доминантной особи после большого числа скрещиваний равна приблизи
430
Гл. VII*. Применение к бихевиористским проблемам
тельно , вероятность появления гибридной особи равна 1 «. - 1
-g-и вероятность появления рецессивной особи равна -у.
Пример 2. Если последовательные скрещивания производить каждый раз не с гибридом, а с доминантной особью, то результат получится совершенно иной. Матрица вероятностей перехода здесь равна
Z1 0
А А
2 2
\0 1
о о о
(2)
Никакая ее степень не состоит из одних положительных элементов, поэтому общая теорема § 8 гл. V здесь не применима. Решение уравнения рР' = р показывает, что вектор (1, 0, 0) является единственным неподвижным вероятностным вектором, но не все его компоненты положительны. Итак, можно сказать почти с полной уверенностью, что по истечении достаточно длительного времени мы получим доминантное потомство. Это легко проверяется. В самом деле, если даже мы начнем с рецессивной особи, то особь, получившаяся в результате первого скрещивания, уже не обязана быть рецессивной. Она может оказаться гибридной, но вероятность того, что п раз подряд будет получаться гибрид, равна (-g-) и с возрастанием п стремится к нулю. А как только мы получим доминантную особь, то все последующие особи будут доминантными. Исследование скрещивания с рецессивной особью может быть проведено совершенно аналогично (см. упр. 2).
Эти результаты можно интерпретировать на процессе скрещивания большого числа особей. Если особи данной популяции скрещивать с гибридами, их потомки тоже скрещивать с гибридами и т. д., то в конечном счете мы будем иметь приблизительно -j- доминантных особей, гибридов и у рецессивных особей. Если же скрещивать их с доминантными особями, то после достаточно большого числа скрещиваний мы можем ожидать появления одних лишь доминантных особей.
В примере 1 можно поставить более трудный вопрос. Пусть, как и в примере 1, Р — регулярная матрица; состояния обозначим через а1г ..., ам. Процесс проходит через все состояния.
§ 3. Стохастические процессы в генетике
431
Если мы имеем состояние at, то через сколько в среднем ша* гов процесс возвратится в состояние at? Можно поставить и более общий вопрос: сколько, в среднем, шагов потребуется на переход из состояния at в состояние а р
Среднее здесь понимается в том смысле, который придается выражению «среднее значение» в теории вероятностей. Пусть pi означает вероятность того, что процесс перейдет впервые в состояние а, за один шаг, рг — за два шага и т. д.; тогда среднее значение числа шагов равно
Pi  1 Р2 2+ ....
(См. § 14 гл. IV.) В общем случае вычисление этой величины оказывается трудным.
Имеется, однако, гораздо более простой способ нахождения среднего значения. Пусть среднее значение числа шагов, необходимое для перехода из состояния в состояние а]у равно m,i}. Но как можно попасть из oz в ар Прежде всего мы с вероятностью plk переходим за один шаг из состояния at в состояние ак. Если k = j, то переход в состояние aj уже осуществлен. Если же k -р j, то на переход в состояние а} потребуется в среднем еще тк] шагов. Следовательно, Шц равно сумме всех pikmkj, где kpj, плюс 1:
= Pn^ij-^- •••
+ ••• +Anmny + 1-
Обозначим через М матрицу, получающуюся из матрицы М путем замены каждого ее диагонального элемента п1ц нулем, и через С — квадратную матрицу, у которой все элементы равны 1. Тогда наши уравнения можно будет записать одним мат* ричным равенством
М = РМр-С.	(3)
Решив эту систему уравнений, мы найдем (См. упр. 8.)
Умножим обе части равенства (3) на Рп. Учитывая то, что РС = С и, следовательно РпС = С (см. упр. 9), мы получим
РпМ=Рп+1М+С.	(4)
Мы знаем, что если Р — регулярная матрица, то Рп стремится к матрице, все строки которой одинаковы и равны неподвижному вектору р. Следовательно, уравнения, полученные приравниванием строк матриц, стоящих в обеих частях равенства (4), стре-
432
Гл. V/1*. Применение к бихевиористским Проблемам
мятся к одному и тому же векторному уравнению рМ=рМ-\-(\,	1),	(5)
или
р(М—М) = (\,	1).	(6)
Но все элементы матрицы М — М, за исключением диагональных, равны 0. Следовательно, наше уравнение просто означает, что Piinu = 1 для всех i, т. е. что	• Таким образом, сред-
нее число шагов, необходимое на возвращение из состояния а{ в состояние at, есть величина, обратная предельной вероятности перехода в состояние at. В примере 1 это означает, что если на данном шаге мы имеем доминантную особь, то следующий раз мы получим доминантную особь в среднем через четыре шага; если мы имеем гибрид, то следующий раз мы получим гибрид в среднем за два шага, и если мы имеем рецессивную особь, то снова мы ее получим в среднем через четыре шага.
Пример 3. Более интересным, но также и более сложным оказывается процесс, при котором особи данной популяции скрещиваются между собой, затем скрещиваются между собой потомки, и т. д. Пусть в нашей популяции имеется доля d доминантных особей, доля h гибридов и доля г рецессивных особей. Тогда d + h + r=\. Если популяция очень многочисленна и скрещивание носит случайный характер, то (по закону больших чисел) можно ожидать, что доля скрещиваний двух доминантных особей равна d2, доля скрещиваний доминантных особей с гибридными равна 2dh, и т. д. Следовательно, можно получить простые формулы для (приближенной) доли потомков различных типов. В качестве примера найдем долю доминантных особей.
Доминантная особь может произойти либо от двух доминантных родителей, либо от доминантного и гибридного, либо от двух гибридов. В первом случае потомство всегда будет доминантным, во втором случае вероятность появле-1
ния доминантного потомства равна-g-, а в третьем случае эта вероятность равна -%. Следовательно, доля доминантного потомства равна
d2 + у • 2dh 4-1 h2 == d24-dh 4-| h2.
Если для данного поколения представить доли d, h и г
§ 3. Стохастические процессы в генетике
433
в виде вектора-строки, то наш процесс можно мыслить как некоторое преобразование Т, которое переводит один вектор-строку в другой вектор-строку:
(d, h,r)T~
= ((P+dh+^h2, dh-\~rh+2dr-^-~h2, r2+rh+^h^.
(7) (См. упр. 4.) К сожалению (см. упр. 3), преобразование Т не является линейным. Однако мы знаем, что результатом п скрещиваний является распределение (d, h, г) Тп, так что если бы удалось найти простую формулу для Тп, то это привело бы к простой формулировке результатов. К счастью, это удается сделать.
Вычислим Тг, т. е. посмотрим, что произойдет, если применить наше преобразование дважды. Потомство первого поколения распределится соответственно формуле (7). Подставим теперь в эту формулу вместо d первую компоненту, а вместо h и г соответственно вторую и третью компоненту правой части; вычислим d2 + dh h2 и т. д. К нашему удивлению оказывается, что Т2 — Т. (См. упр. 5.) Следовательно, Тп = Т.
Итак,
(d, h, f)T—(d, h, r)Tn,
а это значит, что и через много поколений распределение типов в популяции останется точно таким, каким оно было в потомстве первого поколения. Поэтому можно сказать, что процесс достигает состояния равновесия за один шаг. Однако следует помнить, что наши доли взяты приближенно и что хорошее приближение может быть получено лишь для очень большой популяции.
Этот результат очень интересен с точки зрения генетики. Он показывает, что если в популяции не происходит ни отбора, ни мутаций, то вся «эволюция» завершается за одно поколение.
С математической точки зрения этот процесс интересен тем, что он дает пример квадратичного преобразования, являющегося более сложным, нежели изучавшиеся нами до сих пор линейные преобразования.
Упражнения
Вычислите Р, Р3, Р* и Р5, где Р—матрица из Примера 1. Проверьте, что все элементы матрицы Р2 положительны и что степени Р приближаются к предельной матрице. (См. § 8 гл. V.)
434
Гл. VII*. Применение к бихевиористским проблемам
2.	Выпишите матрицу, аналогичную матрице Р' примера 2, которая получается в случае последовательных скрещиваний с рецессивными особями. Найдите неподвижный вероятностный вектор и объясните его смысл.
3.	Докажите, что преобразование Т не является линейным. [Указание. Покажите на примере, что Т не удовлетворяет одному из условий линейности, сформулированных в § 11 гл. V.]
4.	В основном тексте была найдена первая компонента правой части формулы (7). Проверьте, что и две другие компоненты указаны в (7) правильно.
5. Вычислите Т2, подставив в (7) вместо d первую компоненту правой части (7), вместо h — вторую и вместо г — третью. Используя тот факт, что d + h + г = 1, докажите равенство Т2 = Т.
5.	Вектор (d, h, г) является неподвижным вектором преобразования Т, если (d, Л, r)T = (d, h, г). Выпишите условия, которым должен удовлетворять такой вектор и приведите три примера неподвижных векторов. Каков генетический смысл такого распределения?
4 А
9 ’ 9
[Отв.: Например, (А-,
7.	Вторая строка матрицы Р равна неподвижному вектору. Что означает, этот факт?
8.	В условиях примера 1 решите систему 9-ти уравнений, эквивалентную (3), и проверьте, что тц = А . [Частичный отв-: тп = 4, тц = 2, тц — 8.1
Pl
9.	Используя определение стохастической матрицы (см. § 7 гл. V), докажите что PC = С.
10.	Докажите, что если Р — регулярная стохастическая (п X п) -матрица, в которой сумма элементов каждого столбца равна 1, то для того, чтобы вернуться из любого состояния в то же самое состояние, потребуется в среднем п шагов. (Ср. упр. 11 из § 8 гл. V.)
11.	На Земле Оз идет дождь. Через сколько дней Волшебник с Земли Оз может рассчитывать устроить пикник? (См. § 7 гл. V.)	[Отв.: 4J
В последующих упражнениях дается простой способ исследования нелинейного преобразования Т, о котором идет речь в основном тексте.
12.	Пусть п — доля генов G в данной популяции, a q = 1 —р— доля генов g. Выразите р и а через d, h и г, Г„	, , 1 ,	1,1
[Отв.: p^d + ^-h, q = r +
13.	Предположим, что мы берем все гены, имеющиеся в данной популяции, тщательно их перемешиваем и каждого потомка наделяем парой генов, выбранных наугад. Покажите, используя результат упр. 12, что получающееся в результате распределение доминантных, гибридных и рецессивных особей в точности совпадает с распределением, данным в (7).
[Отв.: (d, h, r)T = (р2, 2pq, q2).]
14	Введем обозначение (d, h, r)T = (d', h’, f). Используя результат упр. 13, покажите, что h'2 = 4а'г'.
15.	Покажите, что необходимым условием равновесия является h2 = 4dr.
16.	Покажите, что если Л2 => 4dr, то р2 = d, q2 = г и 2pq = h, т. е. что это условие является также и достаточным для равновесия.
17.	Покажите, используя результаты упр. 14—16, что данная популяция достигает состояния равновесия за одно поколение.
§ 4. Марковские цепи с поглощением и генетика
435
§ 4. МАРКОВСКИЕ ЦЕПИ С ПОГЛОЩЕНИЕМ И ГЕНЕТИКА
Существует принципиальное различие между результатами двух первых примеров предыдущего параграфа. В примере 1 процесс мог спустя много времени находиться в любом из трех возможных состояний, и все, что мы о нем знали, — это вероятность каждого из этих трех состояний. Мы смогли найти эти вероятности, используя факт существования единственного неподвижного вероятностного вектора, все компоненты которого положительны. В этом примере вся интересующая нас информация о процессе представлена неподвижным вектором.
В примере 2 неподвижный вектор указывал нам лишь то, что в конце концов процесс должен будет перейти в первое состояние и уже не покидать его. Характерный признак этого первого состояния заключается в том, что если процесс однажды переходит в это состояние, то он уже не может из него выйти. Такое состояние называется поглощающим.
Определение. Состояние марковской цепи называется поглощающим, если из него невозможно перейти ни в какое дру
гое состояние.
Определение. Марковская цепь называется цепью с поглощением, если (1) она имеет по меньшей мере одно поглощающее состояние и (2) из каждого состояния возможен переход в поглощающее состояние (возможно, ие за один шаг).
Пример 1. Рассмотрим блуждание частицы по прямой;
положим, что в каждый момент времени частица с вероят-1
ностью сдвигается на один шаг налево или на один шаг
направо. Участок, по которому двигаются частицы, мы ограничим двумя барьерами, поглощающими частицы (можно представить себе, что частица прилипает к барьеру). Для
определенности положим, что весь участок частица может пройти за 4 шага, так что ее положение может иметь одно из пяти значений: 0? 1, 2, 3 и 4. Матрица вероятностей перехода в этом случае имеет вид
О 1 0(1 0 1 Т 0 2 0 ~
3 0 0
4(0 0
2
0
1
2
о
2
О
з 41
0	0
0	о
0 1 )
136
Гл. VII*. Применение к бихевиористским проблемам
Мы видим, что состояния 1, 2 и 3 не являются поглощающими, а состояния 0 и 4 — поглощающие; далее из каждого непоглощающего состояния можно за конечное число шагов добраться до одного из поглощающих состояний, т. е. состояний 0 или 4. Таким образом, рассмотренная здесь марковская цепь является цепью с поглощением. Соответствующий случайный процесс называется процессом случайного блуждания.
Теорема. Для марковской цепи с поглощением вероятность того, что через п шагов процесс закончится в одном из поглощающих состояний, с возрастанием п стремится к 1.
Таким образом, здесь можно почти с полной уверенностью ожидать, что процесс завершится переходом в одно из поглощающих состояний.
Мы укажем лишь основную идею доказательства этой теоремы. По условию (2), из каждого непоглощающего состояния а, возможен переход в поглощающее состояние. Обозначим через Пу минимальное число шагов, требуемых для перехода из состояния aj в какое-нибудь поглощающее состояние, а через Р] вероятность того, что процесс не перейдет из состояния а,- в какое-нибудь поглощающее состояние за п,- шагов. Тогда pj < 1. Пусть п равно наибольшему из всех Пу, а р — наибольшей Из всех Ру. Вероятность того, что процесс не перейдет в поглощающее состояние за п шагов, будет не больше р, вероятность того, что он не перейдет в поглощающее состояние за 2п шагов— не больше р2, и т. д. Так как р < 1, то эти вероятности стремятся к нулю.
Мы рассмотрим три интересных вопроса, касающихся марковских цепей с поглощением:
(а)	Какова вероятность того, что процесс завершится переходом в данное поглощающее состояние?
(Ь)	Сколько в среднем требуется шагов на переход процесса в какое-нибудь поглощающее состояние?
(о) Сколько в среднем раз проходит процесс через каждое непоглощающее состояние?
Ответы на все эти вопросы зависят, вообще, говоря, от того, из какого состояния начинается процесс. Так, если поглощающих состояний по меньшей мере два, ai и а2, то ответ на вопрос (а) будет зависеть от начального состояния процесса: ясно, что если процесс начинается из состояния tZj, то с вероятностью 1 он в этом состоянии и окончится, а если он начинается из а2, то вероятность того, что он окончится в состоянии ах, равна 0, Ответы же на вопросы (Ь) и (с) будут зависеть от на
§ 4. Марковские цепи с поглощением и генетика
437
чального состояния также и в том случае, если поглощающее состояние— единственное. Так если процесс начинается из поглощающего состояния, то ответом на оба эти вопроса будет служить число 0; если же процесс начинается из непоглощающего состояния а, то на переход в какое-то поглощающее состояние потребуется по меньшей мере один шаг, и по меньшей мере в одном непоглощающем состоянии (а именно в а} он будет находиться по меньшей мере один раз. (См. упр. 1.)
Пусть Р — матрица вероятностей перехода для марковской цепи с поглощением и а — какое-то поглощающее состояние. Мы хотим найти вероятность того, что процесс окончится в а (эта вероятность зависит от начального состояния). Пусть dt— вероятность того, что процесс, начавшись из состояния az, окончится в а. Образуем вектор-столбец d, i-й компонентой которого служит Из состояния процесс переходит в состояние а} с вероятностью р,у. Если этот переход осуществился, то после него процесс перейдет в состояние а с вероятностью df. Следовательно, вероятность перехода из щ в а через состояние а$ равна Ptjdj. Сумма всех таких членов дает полную вероятность перехода из aL в а. Таким образом, получаем:
dt —Pndi -+ Pi2d2 + • • • 4- Pin.dn’
где i = 1, 2, ..., n. Но эта сумма представляет собой i-ю компоненту вектора Pd. Следовательно, нашу систему уравнений можно кратко записать в виде одного векторного уравнения
d = Pd.	(1)
Мы видим, что d можно рассматривать как «неподвижный вектор» матрицы Р с той лишь разницей, что здесь вместо век-гора-строки фигурирует вектор-столбец. Для марковских цепей с поглощением уравнение (1) часто имеет своим решением более чем один вероятностный вектор. Мы выбираем единственное нужное нам решение при помоши следующего условия:
Компонента вектора d, отвечающая состоянию а, равна 1; компонента d, отвечающая любому другому поглощающему состоянию, равна 0.	(2)
Это условие позволяет находить для каждого поглощающего состояния единственный неподвижный вектор d. Различие между такими векторами определяется лишь условием (2).
Займемся теперь решением вопроса (с), из которого будет непосредственно следовать ответ на вопрос (Ь); после этого мы дадим также еще одно решение вопроса (а), тесно связанное с решениями вопросов (Ь) и (с). Пусть процесс начинается из
29 За», эи
438
Гл. VII*. Применение к бихевиористским проблемам
непоглощающего состояния at. Сколько раз следует ожидать его прохождения через непоглощающее состояние о,? [Здесь слово «ожидание» мы употребляем в смысле среднего значения (математического ожидания) соответствующей величины; см. § 14 гл. IV.] Обозначим это число через tl}. Из состояния а, процесс переходит в состояние с вероятностью pik. Если ak — поглощающее состояние, то процесс уже никогда не придет в состояние ар а если ak — непоглощающее состояние, то в дальнейшем процесс пройдет через состояние в среднем tkj раз. Следовательно, мы должны взять сумму piktbj по всем непоглощающим состояниям ak. Но это еще не дает полного ответа на наш вопрос, ибо если i = j, то мы должны учесть также исходное состояние а}- т. е. прибавить к нашей сумме 1. Итак, для непоглощающих состояний at и
*ц=Рп^+ ••• +Pi.n-mtn-m,j (+Ъ если Z=j);
суммирование производится по всем непоглощающим состояниям.
Эту систему уравнений можно записать в виде одного матричного уравнения. Образуем с этой целью матрицу Q, получаемую из Р вычеркиванием всех строк и столбцов, соответствующих поглощающим состояниям; если число поглощающих состояний равно т, то Q будет ((и — m)X(n— m))-матрицей. Так как элементы интересующей нас матрицы Т определены лишь для непоглощающих состояний at и то квадратная матрица Т будет иметь тот же порядок, что и матрица Q. Написанная выше сумма представляет собой произведение i-й строки матрицы Q на у'-й столбец матрицы Т, следовательно, она равна элементу матрицы QT, стоящему в i-й строке и у-м столбце. Если i = у, то к этой сумме следует прибавить 1, т. е. соответствующую компоненту единичной матрицы (напомним, что при i Ф j компонента единичной матрицы равна нулю!). Таким образом, мы получаем матричное уравнение
T=^QT + I.	(3)
Уравнение (3) можно записать иначе:
I — T — QT — (I — Q) Т.
Умножив обе части слева на (/ — Q)-1, мы получим
T =	(4)
Это и есть решение уравнения (3)'.
Компоненты матрицы Т = (/ — Q)-1 дают ответ на вопрос (с). Они помогают также ответить и на вопрос (Ь). Пусть мы хотим узнать, через сколько в среднем шагов процесс, находящийся ₽
§ 4. Марковские цепи с поглощением и генетика
430
непоглощающем состоянии alt перейдет в какое-нибудь поглощающее состояние. Каждое прохождение процесса через какое-нибудь непоглощающее состояние составляет один шаг. Следовательно, общее число шагов, при которых процесс переходит в какое-нибудь непоглощающее состояние, равно числу шагов, требуемых для достижения поглощающего состояния. Но это общее число шагов есть не что иное, как среднее число прохождений процесса, начавшегося из состояния alt через все непоглощающие состояния, равное в свою очередь сумме всех элементов i-й строки матрицы Т = (/ — Q)-1. Следовательно, суммы элементов строк матрицы Т дают ответ на вопрос (Ь).
Запишем последнее условие в векторной форме. Пусть i, означает среднее значение числа шагов, затрачиваемых на переход из непоглощающего состояния at в какое-нибудь поглощающее состояние, и пусть t означает вектор-столбец, i-я компонента которого равна tt. Как мы знаем, компонентами t являются суммы соответствующих строк матрицы (4). Обозначая через с вектор-столбец, все компоненты которого равны 1, мы можем записать t в виде
(5)
Вернемся, наконец, к вопросу (а). Пусть О; есть непогло-щающее состояние нашей марковской цепи, а аг—поглощающее состояние; нас интересует вопрос о вероятности Ьа того, что процесс, начавшийся в состоянии at, закончится в состоянии ар Вероятность перехода за один шаг из состояния сг в состояние at равна ри; если же процесс за первый шаг перейдет в состояние ak (вероятность этого равна pzft), то он либо так и останется в этом состоянии (если состояние ak — поглощающее), либо перейдет затем в состояние at с вероятностью bkl (если состояние ak— непоглощающее). Таким образом, мы получаем
^ZZ = Az + AAz+A2^2z + ••• + Pl, n-nfin-m, t (суммирование производится по всем непоглощающим состояниям).
Последнее равенство можно записать также в матричной форме. Пусть R— ((п — m) Хт)-матрица, получаемая из матрицы вероятностей перехода Р вычеркиванием отвечающих поглощающим состояниям строк и отвечающих непоглощающим состояниям столбцов; так как элементы Ьи интересующей нас матрицы В определены лишь для непоглощающего состояния сц и поглощающего состояния alt то порядок матрицы R совпадает с порядком матрицы В. В таком случае мы имеем
29*
440 Гл. VH*. Применение к бихевиористским проблемам
где матрица Q имеет тот же смысл, что и выше, или
(I — Q)B = R
или наконец
B = (I— Q)~'R = TR.	(6)
Последняя формула и дает ответ на вопрос (а).
Резюмируем полученные результаты. Пусть нам известна (п X п)-матрица Р вероятностей перехода, характеризующая марковскую цепь с поглощением; обозначим далее через Q ((и — /л) X (п— т))-матрицу, получаемую из Р вычеркиванием строк и столбцов, отвечающих поглощающим состояниям, и через /?—((л—/и) X т)-матрицу, получаемую из Р вычеркиванием строк, отвечающих поглощающим состояниям, и столбцов, отвечающих непоглощающим состояниям. Образуем, наконец, еще матрицу Т = (1 — Q)-1 (ввиду фундаментальной важности этой матрицы в теории марковских цепей с поглощением ее называют иногда фундаментальной матрицей цепи) и (п — tri) -мерный вектор-столбец с, все компоненты которого равны 1. В таком случае (с) элемент матрицы Т указывает среднее число прохождений цепи через непоглощающее состояние tzj в предположении, что исходным является непоглощающее состояние аг,
(Ь) компонента it вектора-столбца t=Tc указывает среднее число шагов, через которое наш процесс попадет в поглощающее состояние, если он исходит из непоглощающего состоя
ния аг,
(а) элемент Ьц матрицы В = TR указывает вероятность того, что процесс закончится в поглощающем состоянии av если он начался в непоглощающем состоянии а;.
Пример 1 (продолжение). При случайном блуждании,
описанном выше, имеем
1
1 0
Q = 2 1
3 0
и, следовательно,
1
2
2
2
о
1
2
3
о
i
2
о
U
2
2
1
2
2
о
2 2
1
§ 4. Марковские цепи с поглощением U генетика
441
Вычисляя Т — (1—Q) получаем ' 2
1
2
1
3
2 2
1
3^ 2
1
2
2
1
2
2
1
Т = 2
3
Таким образом, если «блуждание» начинается из состояния 2, то до конца процесса частица в среднем побывает в первом состоянии 1 раз, во втором состоянии — 2 раза и в третьем состоянии — 1 раз.
Далее,
2
1
2
1
1
2 2
3 £ 2
1
3^ 2
1
i — Tc = 2 1
3\
4 I
3/
Поэтому среднее число шагов, которые сделает частица до поглощения, равно 3, если она исходит из первого состояния, 4, если частица исходит из второго состояния, и 3, если частица исходит из третьего состояния. Так как частица, исходящая из второго состояния, должна обязательно перейти в первое или в третье состояние, то нетрудно понять, что, исходя из второго состояния, она сделает в среднем на один шаг больше, чем исходя из первого или из третьего состояний.
Наконец, ясно, что в этом случае
О 4
1 Ч 0
/? = 2 0 0.’
3 °
Отсюда получаем
442 Гл. VII*. Применение к бихевиористским проблемам
Поэтому если частица исходит из второго состояния, то она имеет равные шансы очутиться в нулевом или в четвертом состояниях; если же она исходит из первого состояния, то она с вероятностью 3/4 поглотится барьером 0 и лишь с вероятностью 'Д — барьером 4.
Перейдем теперь к примерам, заимствованным из генетики.
Пример 2. Вернемся к примеру 2 предыдущего параграфа. Матрица Р', выписанная на стр. 430, соответствует марковской цепи с одним поглощающим состоянием at. Легко видеть, что решением уравнения d = P'd может служить любой вектор-столбец, все компоненты которого равны между собой. Из условия (2) следует, что первая компонента вектора должна равняться 1. Поэтому и все остальные компоненты равны 1. Итак,
Это значит, что из какого бы состояния ни начался данный процесс, вероятность его перехода в состояние сц равна 1, что согласуется с нашей теоремой, поскольку данный процесс имеет лишь одно поглощающее состояние.
Напишем теперь «урезанную» матрицу
Тогда
1	/2 0\
Мы видим, что если процесс начался из состояния а^, то можно ожидать, что через это состояние он пройдет дважды (включая начальное положение). Если же начальным является состояние аз, то можно ожидать, что через это состояние он пройдет только один раз, а именно в начале. Это вполне очевидно, потому что процесс не может вернуться в состояние аз. Начав процесс из состояния а3, мы можем ожидать прохождения его через аз два раза.
ff 4. Марковские цепи с поглощением и генетика
443
Наконец,
Следовательно, можно ожидать, что переход в состояние <7] произойдет из состояния 02 за два шага, а из состояния а3 за три шага.
Пример 3. Построим теперь более сложный пример марковской цепи с поглощением. Сначала мы скрещиваем две особи противоположного пола; затем отбираем в их потомстве две особи противоположного пола и также их скрещиваем, и т. д. Для простоты будем предполагать, что фигурирующий в нашем рассмотрении признак не зависит
от пола.
Состояние процесса определяется парой особей. Следовательно, состояниями будут: ах = (Д, Д), а2 = (Д, Г), Оз = (Д, Р), а4 = (Г, Г), а5 = (Г, Р) и а6 = (Р, Р).
Покажем на примере состояния а2, как вычисляются вероятности перехода. Когда процесс находится в этом состоянии, то один из родителей обладает комбинацией генов GG, а другой — комбинацией Gg. Поэтому вероятности появления доминантного и гибридного потомства одинаковы и равны */2. Следовательно, вероятность перехода в состояние а\ (выбор двух доминантных особей) равна 'Л, вероятность перехода в состояние а2 равна V2 и вероятность перехода в а4 равна ’А. Матрица вероятностей перехода для этого процесса имеет следующий вид (см. стр. 309):
а2
а3
Р' =
аЛ 1 2 4
О j_ 16
«2	а3	о4	а5	ае
0	0	0	0	0
|	о	1	о	о
0 0 10 0 1	1	1	JL	1
4	8	4	4	16
а5 О
а6 О
0 0 0 0 1
Поглощающими состояниями здесь, естественно, будут состояние (Zi = (ДД) и а6 = (РР). Вероятности поглощения в состоянии ai находятся путем решения уравнения d = P"d при условии dj = J ja = 0, в результате чего мы
444
Гл. VII*. Применение к бихевиористским проблемам
получаем вектор (ср. ниже, стр. 445)
1
2
4
2
2 d= .
2
2
4
О
Так как сумма двух таких векторов d должна равняться вектору с (см. упр. 12), то отсюда следует, что другой вектор, дающий вероятности поглощения в аб, равен с — d.
С генетической точки зрения поглощение означает, что в результате большого числа скрещиваний либо ген G, либо ген g должен исчезнуть. Вид найденного нами вектора d позволяет обнаружить также следующий интересный факт: если процесс начинается из какого-то состояния, то вероятность того, что процесс завершится на чисто доминантном потомстве, характеризуемом наличием одних лишь генов G, равна доле генов G для исходного состояния. Выпишем теперь «урезанную» матрицу
а3
Q" = а4
и найдем также матрицу
2 2
О
2
4
1—Q" =
<Z2 1
2
О
2 4
«з О
а4
2
4
1
2
4
2 4
О £ 4
2 2
_2
4
—1
2
4
2 4
О
_2
4
1
2
6^2
«5
О
О
«5
О
О
2
8
о
о
о
1
8
О
§ 4. Марковские цепи с поглощением и генетика
445
и матрицу
2
3
4
3
4^
3
2_
3
Далее можно определить вектор
T = u — QT1
J
6
4
3
2 з
_1_
6
£ 3
£ 3
£ 3
4
3
_2
3
£
3
£ 3
8
3 .
1
1
1
1
t = T
4 —
* 6
4
4
4
указывающий, что если начать процесс из любого состояния, отличного от состояния (Д, Д) или (Р, Р), то можно ожидать, что приблизительно через пять или шесть шагов мы придем либо в (Д, Д), либо в (Р, Р). (Компоненты вектора t указывают точную величину среднего значения числа шагов.) Матрица Т доставляет более подробную информацию, а именно она показывает, сколько раз можно ожидать появления потомков каждого из типов (Д, Г), (Д, Р), (Г, Г) и (Г, Р), если начать процесс из данного непоглощающего состояния. Наконец, мы можем составить
матрицу	8	1	_4	2
	3	6	3	Т
	4	4	8	4
	3	3	3	3
B = TR =	4	1	8	4
	3	3	3	3
	2	1	4	8_
	3	6	3	3
4
О £ 16
О
о
о £ 16 1 4
2 4
£ 2
1
2
_1_ 4
1 4
1 2
2
3 4
столбцы которой (несущественно отличающиеся от выписанных выше векторов d и с — d) дают вероятности завершения процесса в состоянии сц или а&. А все вместе эти величины дают превосходное описание того, что можно ожидать при данном процессе.
446
Гн. VII*. Применение к бихевиористским проблемам
Упражнения
1.	Видоизмените пример с Землей Оз (см. § 8 гл. IV, стр. 213) так, чтобы состояние Д стало поглощающим. При этом матрица вероятностей перехода будет иметь вид
Д	Я	С
Д	/ 1	0	0 \
Я	7г	0	7» .
С	\	7<	*/2 '
Найти фундаментальную матрицу Т, а также вектор Тс и матрицу TR. Объясните полученные результаты.
2.	В модели, описывающей процесс диффузии газов (см. пример 6 из § 7 гл. V, стр. 307), положим, что состояния 0 и 3 являются поглощающими. Найдите фундаментальную матрицу Т полученной марковской цепи с поглощением, а также вектор Тс и матрицу TR. Интерпретируйте получен-
ные результаты.
Г	/ 9 6 \
I 5 5 \	/3\
Отв.: 7 = I £ ^)’/===Гс==(.з) \ 5 5/
в = тд =
(2 5
2
5
2. \
5 I
А / 5 /
3.	В примере со случайным блужданием (пример 1 этого параграфа) положим, что вероятность сдвига вправо по прямой равна 2/з, а вероятность сдвига влево — всего */з- Найдите Т, Тс, TR. Сравните полученные результаты с найденными в тексте.
4.	Число х выбирается случайным образом из чисел 1, 2, 3, 4 и 5. После того как х выбрано, следующее число выбирается случайным образом средн тех из наших чисел, которые не больше х. Процесс завершается, когда выбранным окажется число 1. Состояния соответствующего марковского процесса (цепи) задаются числами, которые могут быть выбраны. Покажите, что в этом случае
2 3 4 5
2
Т =
3
4
5
10 0 0
1	у2	о	о
1	’/2	7з	О
1	’/2	*/з	71	.
где I есть единичная матрица четвертого порядка. Каково среднее число выборов числа?	^0/ив.: -jg-.j
5-	Обобщите результаты упр. 4, сделав заключение о виде фундаментальной матрицы для того случая, когда в начале процесса выбирается наугад одно целое число х из чисел 1, 2, 3, . . ., л. Каково будет среднее число выборов числа в том случае, если на первом этапе процесса мы выбираем целое положительное число, не превосходящее 10?
6.	Три танка ведут бой, каждый с двумя другими. Танк А уничтожает танк, по которому он ведет огонь, с вероятностью ‘/г; танк В — с вероятностью */з; танк С — с вероятностью */б- Танки открывают огонь одновременно и каждый танк стреляет по сильнейшему нз не уничтоженных к этому моменту противников. Образуйте марковскую цепь, принимая за состояние наличие к данному моменту тех или иных из наших танков.
$ 4. Марковские цепи с поглощением и генетика
447
Найдите матрицу Т, вектор Тс, матрицу TR и интерпретируйте полученные результаты.
7.	Примените к примеру со случайным блужданием первый метод определения вероятности для процесса окончиться именно в данном поглощающем состоянии; сравните полученные результаты с найденными в тексте.
8.	Докажите, что для марковских цепей с поглощением
(а)	вероятность перехода в данное поглощающее состояние ие зависит от начального положения тогда и только тогда, когда поглощающее состояние единственно;
(Ь)	среднее значение числа шагов, требуемых для достижения какого-нибудь поглощающего состояния, ие зависит от начального состояния тогда и только тогда, когда каждое состояние поглощающее.
9.	Проверьте, что обратная матрица (/—Q')*1 найдена в тексте правильно.
10.	Проверьте, что обратная матрица (/ — Q")-1 найдена в тексте правильно.
11.	Решите уравнение d = P'd, где Р’— матрица из примера 2 предыдущего параграфа.
12.	Найдите два решения уравнения d = P"d, одно из которых'соответствует поглощению в ai, а другое — поглощению в ав. Проверьте, что сумма их равна с (т. е. вектору, все компоненты которого равны 1).
13.	Рассмотрим все векторы d, представляющие собой вероятности поглощения в данном поглощающем состоянии. Интерпретируйте сумму двух таких векторов. Интерпретируйте сумму всех таких векторов. Чему равна последняя сумма?
14.	Найдите два различных неподвижных вероятностных вектора матрицы Р".
[Отв.: (1, 0, 0, 0, 0, 0); (0, 0, 0, 0, 0, !).]
15.	Матрицу Т можно вычислить также следующим способом: находятся вероятности перехода из состояния я/ в состояние а/ за п шагов, после чего суммируются полученные вероятности, отвечающие всем возможным значениям п; полученная сумма и будет равна /у.
(а)	Покажите, что для п — 0 эти вероятности представляются матрицей I.
(Ь)	Покажите, что для п > 0 шагов эти вероятности представляются матрицей Q”.
(с)	Покажите, что Т = / + Q + Q2+Q3+... .
(d)	Найдите сумму этого ряда, обращаясь с ним как с обыкновенной геометрической прогрессией.
(е)	Проверьте, что полученный ответ совпадает с (4).
16.	Для нахождения вектора t существует более простой способ, чем приведенный в тексте. Пусть ti означает среднее значение числа шагов, требующихся для перехода из состояния а/ в какое-нибудь поглощающее состояние. Это число равно сумме произведений patj, распространенной по всем непоглощающим состояниям яу, плюс 1.
(а)	Обоснуйте утверждение о том, что /г = 1 + сумма pijtj, распространенная по всем непоглощающим состояниям.
(Ь)	Запишите систему этих уравнений в виде одного векторного уравнения.
(с)	Разрешите это уравнение относительно t.
(d)	Проверьте, что решение будет даваться вектором (5),
17.	Допустим, что гибриды характеризуются высоким процентом смертности. Пусть, скажем, половина гибридов погибает, не достигнув зрелого возраста, тогда как число погибающих до достижения зрелости доминантных и рецессивных особей настолько мало, что им можно пренебречь.
(а)	Внесите изменения в матрицу R" примера 3, учитывающие эти обстоятельства,	~	’
448
Г л. VII*. Применение к бихевиористским проблемам
(Ь)	Какие состояния являются поглощающими?
(с)	Проверьте, что рассматриваемая цепь является цепью с поглощением.
(d)	Найдите векторы d, представляющие вероятности поглощения в различных поглощающих состояниях,
Отв.: Для состояния «| имеем d =
1 в/ю V2 V» 7ю о
(е)	Найдите матрицу Т и интерпретируйте ее.
(f)	Найдите вектор t и интерпретируйте его.
Отв.: t =
65
26
117
26
91
26
65
26
Остальные задачи относятся к вопросу о наследовании цветовой слепоты, являющейся признаком, сцепленным с полом. Имеется пара генов С и N, первый из которых обусловливает цветовую слепоту, а второй нормальное зрение Ген N является доминантным. Но у мужчин имеется только один ген, и если он оказывается геном С, это влечет цветовую -слепоту. Мужчина наследует один ген из пары генов своей матери, тогда как женщина наследует по одном}' гену от каждого из родителей. Следовательно, мужчина может принадлежать к типу С или N, тогда как женщина может принадлежать к типу СС или к типу CN, или к типу NN. Мы рассмотрим процесс скрещивания, аналогичный процессу, рассмотренному в примере 3.
18.	Перечислите состояния процесса. [Указание. Всего имеется шесть состояний.]	'
19.	Вычислите вероятности перехода.
20.	Покажите, что рассматриваемая цепь является цепью с поглощением, и дайте интерпретацию поглощающих состояний.
[Отв.: В одном из состояний исчезает ген N, в другом утрачивается ген С.]
21.	Докажите, что вероятность окончательного перехода в состояние, имеющее только ген С, равна доле генов С в начальном состоянии.
22.	Найдите фундаментальную матрицу Т и интерпретируйте ее элементы. 23. Найдите вектор t и интерпретируйте его компоненты.
(5 \
6 \
I; если в начальном состоянии имеются как гены С так 6 ) 9/
и гены N, то после пяти или шести скрещиваний можно ожидать исчезновения одного из этих генов.]
24. Найдите матрицу В = TR и интерпретируйте ее элементы.
§ 5. Модель обучения Истиза
449
§ 5. МОДЕЛЬ ОБУЧЕНИЯ ИСТИЗА
Этот параграф посвящен математической модели обучения, предложенной У. К. Истизом (W. К. Estes). Мы не станем развивать самую общую теорию обучения, а лишь рассмотрим некоторые частные случаи.
Целью этой теории является объяснение определенных типов обучения, примером которых может служить следующий эксперимент. В Т-образный лабиринт (см. § 2, гл. III, стр. 129) помещают крысу, которая может бежать либо направо, либо налево. С какой-то стороны экспериментатор кладет пищу, и если крыса бежит в эту сторону, она получает вознаграждение. Опыт повторяется много раз, причем используется определенная последовательность расположений пищи слева или справа. Смысл таких опытов заключается в попытке предсказать поведение крысы для различных последовательностей расположения пищи. Например, если пищу всегда класть справа, то научит ли это крысу бежать каждый раз направо?
Аналогичный эксперимент, но уже производимый Над человеком, заключается в следующем. Испытуемому демонстрируется монета то со стороны, на которой изображен герб, то со стороны, на которой указана ценность монеты («цифра»), и каждый раз ему предлагают угадать, что появится в следующий раз. Испытуемый старается угадать правильно как можно большее число раз. Опять-таки экспериментатор располагает выбором последовательностей Г и Ц Смысл таких опытов заключается в выяснении того, каким образом испытуемый будет распознавать характер последовательности.
В модели Истиза предполагается, что существует конечное число так называемых «раздражителей», каждый из которых в любой фиксированный момент времени связан либо с реакцией Ro, либо с реакцией Ri испытуемого. Эти связи, вообще говоря, могут меняться от эксперимента к эксперименту.
Существует определенная, не зависящая ни от эксперимента, ни от раздражителя вероятность 6 того, что в данном эксперименте данный раздражитель подействует на испытуемого или будет воспринят испытуемым. Имеется в виду, что воспринятые субъектом раздражители, связанные с Ro, побуждают субъекта реагировать посредством Ro, а воспринятые им раздражители, связанные с Ri, — реагировать посредством Rt.
Предполагается, что восприятия различных раздражителей образуют процесс независимых испытаний (см § 8 гл. IV). В частности, если, например, имеются три раздражителя а, b и с, то вероятность того, что а будет воспринят, b не воспринят и с воспринят, должна равняться 6(1 —6)6.
450
Гл. VII*. Применение к бихевиористским проблемам
Предполагается также, что экспериментатор оказывает на испытуемого одно из двух возможных «направляющих» воздействий Ло или Ль Такое воздействие может иметь место или до, или после того, как испытуемый будет реагировать на эксперимент, но мы будем считать, что испытуемый узнает о выборе экспериментатора лишь после того, как сам выберет, как следует реагировать ему. На большинство экспериментов испытуемый хотел бы реагировать посредством ₽п, если экспериментатор оказывает воздействие Ло, и посредством Rit если экспериментатор оказывает воздействие Ль Мы будем говорить, что испытуемый «угадывает правильно», если его выбор согласуется с выбором экспериментатора, т. е. если он реагирует посредством Ro в ответ на Ло и посредством R\ в ответ на Ль В некоторых экспериментах (например, в описанном выше эксперименте с крысой) испытуемый (крыса) получает поощрение, если он угадывает правильно выбор экспериментатора.
Мы делаем два основных допущения.
Допущение А. Вероятность того, что субъект прореагирует посредством Ri, равна доле воспринятых раздражителей, связанных с Ri. Если не был воспринят никакой раздражитель, то предполагается, что ответы Ro и Ri равновероятны.
Допущение В. Если в данном эксперименте экспериментатор выбрал Ло, то все связанные с Ri раздражители из числа воспринятых становятся связанными с Ro. Если же экспериментатор выбрал Ль то связанные с Ro раздражители из числа воспринятых становятся связанными с Ri.
Заметим, что в каждом отдельном эксперименте фактически играют роль лишь те раздражители, которые были восприняты, и лишь у таких раздражителей могут под действием этого эксперимента измениться связи. Однако при различных экспериментах будут восприняты, вообще говоря, различные множества раздражителей, так что воспринятым в каком-то эксперименте может оказаться каждый раздражитель.
Из допущений А и В видно, что будущие выборы субъекта зависят от выбора экспериментатора. Следовательно, мы должны описать метод, применяемый экспериментатором при выборе им Ло или Ль Следующие схемы являются типичными для тех, которые встречались в реальных экспериментах.
(i)	Выбирать Ло с вероятностью р независимо от выбора, производимого субъектом.
(ii)	Делать выбор, согласованный с выбором субъекта (т. е. выбирать Ло, если субъект выбрал Ro, и выбирать Ль если субъект выбрал Ri).
(iii)	Выбирать Ло, если в предыдущем эксперименте субъект
§ 5. Модель обучения Истиза
451
прореагировал посредством Ro. Выбирать Ло и Л] с одинаковой вероятностью, если он прореагировал посредством /?ь
Мы можем описать некоторый общий класс схем типа только что приведенных следующим образом. Допустим, что экспериментатор выбирает А] с вероятностью а, если в предыдущем эксперименте субъект прореагировал посредством Ro, и выбирает Ло с вероятностью Ь, если в предыдущем эксперименте субъект прореагировал посредством Rt. Выборы экспериментатора для каждого выбора субъекта можно описать посредством матрицы
А)	А
Ro /1 — а	а \
/?Д b \—ь)‘
Этот класс схем содержит рассмотренные примеры: (i) представляет случай, когда 1 — а = b = р, (ii) представляет случай, когда а = О, b = 0, и (iii) представляет случай, когда
а = О, b = .
В настоящем и следующем параграфах мы будем рассматривать случай двух раздражителей (назовем их г и s). В случае большего числа раздражителей исследование проводится аналогично, хоть оно и становится несколько более сложным. Многие результаты не зависят от числа используемых раздражителей. На фиг. 142 представлены с помощью дерева различные стадии одного эксперимента. Верхние индексы 0 и 1 означают, что раздражитель, к которому они относятся, связан соответственно с Ro или Ri, Предположим, что первоначально г обусловливает Ri, а $ обусловливает Ro, т. е. за начальную точку мы принимаем {г1, s0}.
•в. С последовательностью таких экспериментов мы можем следующим образом связать марковскую цепь. Примем за состояние число раздражителей, связанных в данный момент с Rt. Таким образом, мы имеем всего три состояния: 0, 1 и 2. Ввиду того что все наши вероятности зависят только от числа воспринятых раздражителей, {г1, s0} и {r°, s1} можно мыслить как одно и то же состояние. Это оправдывает выбор нами в качестве состояния числа раздражителей, обусловливающих Ri. Вероятности перехода находятся следующим образом. Чтобы найти pi,о. мы отыскиваем на нашем дереве все пути, ведущие к {г°, 5°}, и складываем их вероятности. Проделав это, мы получим:
А,о = |б2(1-о) + |б2&+б(1-е)й
29*
452
Гл. VII*. Применение к бихевиористским проблемам
При помощи того же дерева можно найти р1Л и р112. Чтобы найти другие вероятности перехода, мы должны построить ана-
логичное дерево в предположении, что в начальном положении никакой элемент не связан с Ri, а также в предположении, что
Начальные
Восприятия Выборы Выборы
измененные
Фиг 142
Вероятность выбора ветвей 1/гвг[1-а)
1/гвга
1/гВгЬ 1/гвг(1-Ь) В(1-О)Ъ еа-в)(1-ь) В(1-В)(1-а) 6(1-В)а (1-в)г
оба элемента связаны с 7?ь (См. упр. 1.) Проделав это, мы по-			
лучим	полную матрицу вероятностей перехода:		
	0	1	2
0	(1-9)2я-Н-а	26(1—8)а	е2«
	102(1__а) +	(i—e)2_|_e(i—0)(i—a)4-	162(1-&) +
Р = 1			
	+4 0(2-ЩЬ	+ 8(1-8) (1-Ь)	+ 18(2-8)0
2	№Ь	28(1 — 8) b	(1	—8)2й+(1— Ь)
В следующем параграфе мы изучим эту марковскую цепь более детально.
Упражнения
1.	Постройте дерево, показывающее возможные связи после одного эксперимента для случая, когда в начале эксперимента оба раздражителя были связаны с R\. Сделайте то же самое для случая, когда в начале эксперимента ни один раздражитель не связан с Ri.
§ б. Предельные вероятности в модели Истиза
453
2.	Используя построенные в упр. 1 деревья, проверьте, что вероятности перехода po,j и p2tj указаны в тексте правильно.
3.	Какова вероятность того, что реакцией испытуемого будет 7?i, если в начале эксперимента с каждой реакцией связан один раздражитель? Чему равна эта вероятность, если в начале эксперимента оба раздражителя связаны с реакцией /?i?	г , i	1	-
[Ome.: -g-; -gH-6 —g- 62-J
В следующих упражнениях найдите матрицу вероятностей перехода при указанных конкретных условиях. Выясните, будет ли получающаяся марковская цепь цепью с поглощением или регулярной. Интерпретируйте каждый из указанных случаев в терминах реальных экспериментов. Для регулярных процессов найдите предельные вероятности. Для процессов с поглощением найдите среднее значение числа шагов, предшествующих поглощению, при—каждом из возможных начальных состояний. (См. § 4, упр. 16.)
4.	а = 1, b = 1, 0 = '/г-	[Отв.: Цепь регулярная; (0,3; 0,4; 0,3).]
5.	а = 1, b = 0.
[Отв.: Цепь с поглощением; ta = (3 — 20)/(26 — О2);	= 1/6.]
1	3
6.	а = -г-, b = -j-, 6 = 0,1.
4	4
7.	а = 0, 6 = у, 6 = 1.
8.	л=1, 6 = 1, 6 = 1.
9.	а = 0, 6 = 0.
10.	6 = 0.
11.	Рассмотрим случай 6 — 1, 0 < а < 1 и 0 < 6 < 1. Покажите, что матрица вероятностей перехода не будет отвечать ни регулярной цепи, ни цепи с поглощением.
12.	В условиях упр. И покажите, что если процесс начинается из состояния 0 или из состояния 2, то он никогда не придет в состояние 1. Следовательно, это состояние можно отбросить. Покажите, что если это сделать, то полученная в результате марковская цепь с двумя состояниями будет иметь регулярную матрицу вероятностей перехода. Найдите предельные вероятности	/6 а \ 1
I у и —]- b и -]— b f J
13.	В условиях упр. 11 покажите, что имеется предельная вероятность пребывания в каждом из состояний, не зависящая от начального состояния. Найдите предельные вероятности. Сравните ответ с результатом упр. 12.
§ 6. ПРЕДЕЛЬНЫЕ ВЕРОЯТНОСТИ В МОДЕЛИ ИСТИЗА
Теперь перейдем к изучению предельных вероятностей выбора испытуемым и экспериментатором каждой из возможных альтернатив. Мы интересуемся в первую очередь воздействием, оказываемым раздражителями. Если испытуемый не воспринимает ни одного из раздражителей, то они не оказывают
454
Гл. VII*. Применение к бихевиористским проблемам
никакого воздействия Поэтому все наши вероятности мы будем вычислять в предположении, что субъект воспринимает по меньшей мере один раздражитель. Это сводится к простому исключению всех экспериментов, в которых испытуемый не воспринял ни одного раздражителя. В настоящем параграфемы будем предполагать, что такое исключение проделано, и при всяком упоминании эксперимента будет подразумеваться, что в таком эксперименте испытуемый воспринимает по меньшей мере один раздражитель.
При таком соглашении, если наш процесс находится в данном эксперименте в состоянии 0, то вероятность того, что реакцией субъекта будет Ro, равна 1 (в силу допущения А). Если он находился в состоянии 1, то, по соображениям симметрии, эта вероятность равна ’/г, и если он находился в состоянии 2, то (в силу допущения А) эта вероятность равна 0.
Матрица Р будет регулярной тогда, и только тогда, когда все величины а, Ь, 6 и 1—6 не равны нулю (см. упр. I). Если эта матрица — регулярная, то существует предельная вероятность попадания в каждое из состояний. Эти вероятности можно представить посредством вектора р = (ро, Pi, Р2), который может быть найден из уравнения
рР=Р-
Решив это уравнение, мы получим
60 + 262 (1 — в)
А —(а +6)6_|_2(a + fc)2(l —в)’
.	4а6(1 — 6)
Р1~ (а + 6)64-2(а-|-6)2(1 — 6) '
аб + 2а2 (1 — в)
Р2~ (а-рб)в+2(« + 6)2(1 — в) '
Отсюда предельная вероятность того, что реакцией испытуемого будет /?0, равна
1 • Ро + ^' Р\ + Ъ- Р2 = -^±ъ>
а предельная вероятность того, что реакцией испытуемого будет Ri, равна а/(а + Ь).
Для нахождения вероятности того, что экспериментатор сделает выбор До, мы должны взять сумму произведений вероятностей выборов испытуемого на вероятность того, что экспериментатор выберет До при условии, что испытуемый сделал тот или другой выбор. Следовательно, предельная вероятность того, что экспериментатор сделает выбор До, равна:
b (1 — a) ab ____ Ь
a-[-b	а -|- b ’
§ 6. Предельные вероятности в модели Истиза
455
Как мы видим, предельная вероятность того, что реакцией испытуемого будет /?0, равна предельной вероятности того, что экспериментатор выберет Ло. С помощью этих вероятностей мы можем найти предельную вероятность того, что испытуемый уга* дает правильно. (См. упр. 3.)
Если же предположить, что экспериментатор делает выбор Ло с вероятностью р, не зависящей от выбора испытуемого, то испытуемый может максимизировать среднее значение числа правильных реакций, реагируя всегда посредством Ro, если р > у, и посредством Rit если р<у (См. упр. 5.) Наша схема предсказывает менее рациональный выбор со стороны субъекта. Это не должно казаться неудовлетворительным в случае экспериментов с крысой, но от экспериментов с людьми можно было бы ожидать лучших результатов. К несчастью, эксперименты подтвердили, что прогнозируемые нашей схемой результаты близки к истинным даже в том случае, когда испытуемыми являются люди.
Следующий интересный эксперимент проделывался У. К. Ис-тизом и др. над испытуемыми различных типов. В половине всех случаев, когда испытуемый выбирал Ro, он получал поощрение, если же он выбирал Ru то поощрения не получал. Можно было бы ожидать, что испытуемый научится выбирать Ro, однако это было не так. Но что предсказывает теория? Если выбирается Ro, то в половине случаев это влечет поощрение. Следовательно, а = ^. Если же выбирается Ri, то никакого поощрения не следует. Следовательно, 1 — b = 0, или Ъ — 1. Теория предсказывает, что предельная вероятность выбора испытуемым реакции 2
Ro равна Ы(а + Ь) = -^. Это хорошо согласуется с данными экспериментов.
Рассмотрим теперь случай поглощения. Точнее, мы рассмотрим случай а = 0 и b = 1. Это означает, что экспериментатор всегда выбирает Ло« Матрица вероятностей перехода будет тогда иметь вид-
/1	° о \
р = 1 0	1 — 0 о ].
\02 20(1 —6) (1 — 0)2/
Для изучения этой марковской цепи мы воспользуемся методами, разработанными в § 4. Мы имеем одно поглощающее состояние, а именно 0. Следовательно, мы знаем, что в конечном счете процесс перейдет в это состояние и останется в нем.
456
Гл. VII*. Применение к бихевиористским проблемам
Согласно допущению А (см. предыдущий параграф), пребывание в этом состоянии означает, что испытуемый с вероятностью 1 реагирует посредством Ro. Таким образом, поглощение можно интерпретировать как тот факт, что испытуемый «обучается» тому, что экспериментатор всегда выбирает Ао.
Мы видели, что для марковской цепи с поглощением можно найти среднее значение числа пребываний процесса в каждом состоянии до поглощения, предполагая заданным некоторое предельное состояние. Пусть /у означает среднее значение числа прохождений процесса через состояние /, если он начинается из состояния i. Прежде чем вычислять /у, посмотрим, какими сведениями об эксперименте обогатит нас знание этих величин. Мы видим, что каждый раз, когда процесс находится в состоянии 1, субъект выбирает R\ с вероятностью и, следовательно, реагирует ошибочно с вероятностью 4-. Каждый раз, когда процесс находится в состоянии 2, субъект с вероятностью 1 реагирует посредством R\, т. е. ошибочно. Таким образом, среднее значение числа ошибочных реакций субъекта до того времени, как он обучится, равно
(1)	j tn + ti2 для Z = l, 2
в предположении, что процесс начинается из состояния i.
Мы находим tn способом, изучавшимся в § 4 Сначала образуем «урезанную» матрицу Q, получаемую из Р выбрасыванием столбца и строки, соответствующих поглощающему состоянию:
/ 1—0	0 \
Q==\26(l—0) (1—6)7
Затем нах-одим Т — {1 — Q) *:
О
1 6(2—0)
Затем, используя (1), мы получаем 1/26 в качестве среднего значения числа ошибочных реакций, если процесс начинается из состояния 1, и 1/0 в качестве среднего значения числа ошибочных реакций, если процесс начинается из состояния 2.
Конечно, в реальном эксперименте начальное состояние не должно быть известно. Однако нельзя назвать неразумным предположение о том, что при первом эксперименте раздражи-
§ 6. Предельные вероятности в модели Истиза
457
телп связываются с Ro и Ri случайным образом. Это должно означать, что из состояния 0 процесс начинается с вероятностью 1	1	1	о
у. из состояния 1 с вероятностью *2 и из состояния 2 с ве-
роятностью -у- При таком предположении мы получим, что среднее значение числа ошибочных реакций субъекта до того времени, как он обучится, равно
W	2 28	4	0	26
Упражнения
I.	Докажите, что матрица Р из § 5 будет регулярной тогда и только тогда, когда все числа а, Ь, 0 и 1 — 0 отличны от нуля.
[Указание. Покажите, что если хотя бы одно из этих чисел равно 0, то матрица не будет регулярной.]
2.	Путем вычисления 1 • ро + Чг • Pi + 0  р2 проверьте, что для испытуемого вероятность реакции Ro равна Ь/ (а + Ь).
3.	Покажите, что предельная вероятность согласования выбора испытуемого с выбором экспериментатора равна
а (1 — fr) + й (1 — о) а -|- Ъ
4.	Допустим, что экспериментатор выбирает Ао всегда с некоторой фиксированной вероятностью р, не зависящей от выбора испытуемого. Какую долю правильных реакций можно ожидать от испытуемого?	[Отв.: 1 — 2р + 2р2.]
5.	В условиях упр. 4 предположим, что испытуемый всегда реагирует посредством Ro- Покажите, что если р > -ту. т0 ПРИ таком методе испытуемый прореагирует правильно в среднем большее число раз, нежели при методе, предсказанном нашей схемой.
6.	Рассмотрим случай а = ’/2, b = 0 и 0 — ту. Для каждого возможного начального состояния найдите среднее значение числа прохождений процесса через каждое состояние до перехода в поглощающее состояние.
[Отв.: too = 3; foi = 2; tio = */г; tn = 3.]
7.	Проделайте то же самое, что и в упр. 6, для случая о = О и b = 0.
8.	В условиях упр. 6 и 7 для каждого возможного начального состояния найдите среднее значение числа ошибочных реакций испытуемого.
9.	В условиях упр. 6 и 7 найдите, аналогично тому, как это было сделано в (2), среднее значение числа ошибочных реакций испытуемого в предположении, что в первом эксперименте связи имеют случайный характер.
[Отв.: 4, 2, 0; 0. 0, 0.]
10.	Если испытуемый выбирает Ro, ои получает поощрение с вероятностью р; если он выбирает Ri, то он ие получает никакого поощрения. (См. при-
мер с р = j в основном тексте.) Найдите а и Ь. Чему равна предельная вероятность того, что испытуемый выберет Rot Как часто он
30 Зак. 994.
458
Гл. VII*. Применение к бихевиористским проблемам
получает поощрение? Как часто получал бы он поощрение если бы выби-п , „	3 11
рал всегда /?0? Сравните эти два значения для Р = f • *2 • f •
[Ome.: 1/(2 —р); р/(2 —р); р.]
II.	Пользуясь формулами настоящего параграфа, вычислите ро, pi, рг для случаев, рассмотренных в упр. 4—9 предыдущего параграфа. Проверьте, что для регулярных матриц эти величины дают предельные вероятности, найденные в этих упражнениях Что означают ро, pi, рг для цепей с поглощением?
§ 7. ПРАВИЛА БРАКОСОЧЕТАНИЯ В ПЕРВОБЫТНЫХ ОБЩЕСТВАХ
В некоторых первобытных обществах мы находим строгие правила относительно того, в каких случаях допустимы браки. Эти правила направлены на предотвращение браков между слишком близкими родственниками. Они допускают точную математическую формулировку в терминах Р-матриц Наше изложение этой темы частично основано на работах Андре Вейля и Роберта Р. Буша.
Правила бракосочетания, о которых идет речь, характеризуются следующими аксиомами.
Аксиома 1. Каждому члену данного общества приписывается определенный брачный тип.
Аксиома 2. Двум индивидуумам разрешается вступать в брак только в том случае, если они принадлежат к одному и тому же брачному типу.
Аксиома 3. Тип индивидуума определяется полом индивидуума и типом его родителей.
Аксиома 4. Два мальчика (или две девочки), родители которых принадлежат к разным типам, сами принадлежат к разным типам.
Аксиома 5. Правило, разрешающее или не разрешающее мужчине вступать в брак со своей родственницей, зависит только от вида родства.
Аксиома 6. В частности, мужчине не разрешается жениться на своей сестре.
Аксиома 7. Для любых двух индивидуумов можно указать таких их потомков, которым разрешается вступать друг с другом в брак.
Пример. Предположим, что имеются три брачных типа, 6, /г и /з. Двое родителей в данной семье должны принадлежать к одному и тому же типу, поскольку лишь в этом случае они могли вступить в брак. Таким образом, для браков имеются только три логические возможности.
§ 7. Правила бракосочетания в первобытных обществах
459
В каждом случае мы должны установить, каким будет тип сына или дочери. Этот тип зададим таблицей:
Тип родителей Тип их сына Тип их дочери
/1	/2	/3
Z3	ti	/2
Мы должны еще проверить выполнимость всех аксиом. Некоторые аксиомы проверяются легко (см. упр. 1); другие аксиомы проверить труднее. Ниже мы докажем одну общую теорему, из которой будет следовать, что наше правило удовлетворяет всем аксиомам.
Для полного исследования проблемы мы должны располагать простым и единообразным методом записи отношений род* ства С этой целью мы будем применять родословное дерево, каким пользуются антропологи. Общепринятыми являются следующие символы:
Брак
| Потомок
I-----1 Братья или сестры
На фиг. 143 изображены четыре родословных дерева, представляющих четыре вида отношения «двоюродные» между мужчиной и женщиной.
б	о
Фиг. 143
Пример (продолжение). Разрешает ли наше правило брак между мужчиной и дочерью брата его отца? Это отношение родства изображено на фиг. 143 а. Для исходной
30’
460
Гл. VII*. Применение к бихевиористским проблемам
пары родителей (дедушки или бабушки) возможны три типа. На фиг. 144 разобраны все три случая. Мы видим, что в каждом случае мужчина и женщина принадлежат к различным типам. Следовательно, такие браки никогда не разрешаются. А может ли мужчина вступить в брак
Фиг. 144
с дочерью брата своей матери? Это отношение изображено на фиг. 143, г. Соответствующие три случая разобраны на фиг. 145. Мы видим, что такие браки всегда разрешаются.
Ф и г. 145
Теперь мы подготовлены к тому, чтобы дать нашим правилам математическую формулировку. Общество устанавливает несколько, скажем п, брачных типов (аксиома 1). Назовем их
tz, ..., tn. Наше правило состоит из двух частей, одна из которых касается сыновей, а другая — дочерей. Рассмотрим брачный тип сыновей. Родители должны принадлежать к одному и тому же брачному типу (аксиома 2). Сыну мы обязаны приписать тип, зависящий только от общего типа родителей (аксиома 3). Если родители принадлежат к типу Ц, то сам он будет принадлежать к типу tj. Кроме того, если какой-то юноша имеет родителей, принадлежащих к типу, отличному от tj, то он должен будет принадлежать к типу, отличному от tj (аксиома 4). Это определяет некоторую перестановку множества брачных типов (см. § 12, гл. V); тип сына получается из типа родителей посредством некоторой перестановки, определенной
§ 7. Правила бракосочетания в первобытных обществах
461
существующими в данном обществе брачными правилами. Поэтому мы образуем вектор типов t = (tlt ..tn) и описываем перестановку, о которой идет речь, P-матрицей S порядка п. Если типом родителей служит i-я компонента вектора t, то типом их сыновей служит i-я компонента вектора tS. Путем аналогичного рассуждения мы приходим к матрице D, определяющей тип дочерей.
Мы показали, что математическое выражение первых четы-
рех аксиом состоит в том, что вводится вектор-строка t и две P-матрицы S и D. Последние три аксиомы налагают некоторые ограничения на выбор матриц S и £>; этим вопросом мы займемся в следующем параграфе.
Мы неоднократно видели, каким образом векторные и матричные обозначения позволяют заменять системы уравнений одним уравнением. В настоящей проблеме эти обозначения по-
зволяют нам представить данный вид отношений родства для
всех брачных типов посредством единственной диаграммы. Фактически это можно сделать, ничего не зная о том, сколько имеется типов в данном обществе или в чем состоят брачные правила. Проиллюстрируем это на примере фиг. 145. Пара, соответствующая верхушке дерева, принадлежит к одному из типов, представленных нашим вектором t. Сын принадлежит к типу tS, а дочь — к типу tD. Далее, сын сына принадлежит к типу /SS, дочь сына — к типу tSD, и т. д. Таким
образом, три (или больше — при
большем числе брачных типов) диаграммы, изображенные на фиг. 145, заменяются единственной «векторной» диаграммой, воспроизведенной на фиг. 146.
Пример (продолжение). Наш вектор t имеет вид — (6, ^2, ^з) и
/О 1 0\	/0 0 1\
£> = ( 0 0 1), S = ( 10 0 1.
\1 0 0/	\0 1 о/
Как мы видели из фиг. 145, мужчине всегда разрешается вступать в брак с дочерью брата его матери. Можно ли усмотреть это из фиг. 146? Брак будет разрешаться всегда, если вектор tDS всегда равен tSD, что эквивалентно
462
Гл. VII*. Применение к бихевиористским проблемам
матричному равенству DS—SD. Для наших S и D это ра-венство оказывается верным. Но на фиг. 146 мы можем усмотреть нечто большее. Сколько бы ни было типов, рассматриваемый тип брака всегда разрешается тогда и только тогда, когда SD = DS, т. е. когда матрицы S и D перестановочны.
Итак, на одном примере мы видели, каким образом свойства матриц S и D определяют виды родства, при которых разрешается вступать в брак. Этот вопрос будет служить предметом изучения в следующем параграфе.
Упражнения
I.	Проверьте, что правило, фигурирующее в примере, удовлетворяет аксиомам 1, 3 и 4.
2.	Проверьте, что выписанные в тексте матрицы S и D представляют данное в примере правило.
3.	Постройте диаграмму для отношения родства брат — сестра.
4.	Используя диаграмму, построенную в упр. 3, покажите, что в условиях примера браки брата с сестрой никогда не разрешаются.
5.	Какому условию должны удовлетворять матрицы S и D, чтобы браки брата с сестрой всегда разрешались?	[Отв.: S = О ]
В первобытном обществе Кариера ’) имеется четыре брачных типа, приписываемых согласно следующим правилам:
Тип родителей Тип сына Тип дочери
t3	t4
^4	^3
ti	^2
Упражнения 6—11 относятся к этому обществу,
6.	Найдите t, S и D для общества Кариера.
7.	Покажите, что в обществе Кариера никогда не разрешаются браки между братом и сестрой.
8.	Покажите, что матрицы S и D перестановочны. Что это говорит нам по поводу браков между двоюродным братом и сестрой в обществе Кариера?
9.	Покажите, что в обществе Кариера никогда не разрешаются браки между двоюродными братом и сестрой, если они находятся в отношении родства, представленном на фиг. 143, а и б.
10.	Покажите, что в обществе Кариера всегда разрешаются браки между двоюродными братом и сестрой, если они находятся в отношении родства, представленном на фиг. 143, в.
11.	Найдите группу (см. § 13 гл. VJ, порожденную матрицами S и D для общества Кариера.
') Общество Кариера (Kariera society) — одно из сообществ аборигенов Австралии,
§ 8. Составление правил бракосочетания
463
В первобытном обществе Тарау *) имеется также четыре брачных типа. Сын всегда принадлежит к тому же типу, что и его родители, Тич дочери задается следующим правилом:
Тип родителей Тип дочери
?3	^2
ts
Остальные упражнения относятся к этому обществу,
12.	Найдите t, S и D для общества Тарау.
13.	Покажите, что в обществе Тарау никогда не разрешаются браки между братом и сестрой.
14.	Покажите, что матрицы S и D перестановочны. Что это говорит нам по поводу браков между двоюродными братом и сестрой в обществе Тарау?
15.	Покажите, что в обществе Тарау никогда не разрешаются браки между двоюродными братом и сестрой, если они находятся в отношении родства, представленном на фиг. 143, а и б.
16.	Покажите, что в обществе Тарау никогда не разрешаются браки между доюродными братом и сестрой, если они находятся в отношении родства, представленном на фиг. 143, в.
17.	Найдите группу (см. § 13 гл. V), порожденную матрицами S и D для общества Тарау,
§ 8. СОСТАВЛЕНИЕ ПРАВИЛ БРАКОСОЧЕТАНИЯ
В предыдущем разделе мы видели, что правила бракосоче-тания в первобытном обществе определены посредством вектора t и матриц S и D. Аксиомы совершенно не затрагивают числа типов, и мы увидим, что в качестве числа типов может фигурировать любое число п > 1. Что же касается матриц 5 и D, то, как мы увидим, их выбор строго ограничен. Это говорит о том, что создание правил бракосочетания в существовавших первобытных обществах требовало большой изобретательности.
Теперь мы должны рассмотреть последние три аксиомы. Для аксиомы 5 нам нужно иметь простой способ описания вида родства. Фамильное дерево служит для нас основным инструментом, но мы хотели бы заменить его подходящей матрицей.
Рассмотрим фиг. 146. Вместо того чтобы, начиная с дедушки и бабушки, находить типы внука и внучки, мы можем начать с внука и подниматься до дедушки и бабушки, после чего спу-ститься до внучки. Для этого мы должны выяснить, что означает «подниматься» в терминах наших матриц. Если родители
1)	Общество Тарау, или Тарая (Tarau society), существует в Восточной Индонезии,
464
Гл. VH*. Применение к бихевиористским проблемам
принадлежат к типу t, то их сын принадлежит к типу tS. Сле довательно, если сын принадлежит к типу t, то его родители принадлежат к типу tS~l (см, § 12 гл. V). Аналогично, если дочь принадлежит к типу I, то ее родители принадлежат к типу tD~x. На фиг. 147 изображен этот новый вариант фиг 146.
Легко видеть, что такую процедуру можно проделать для любого вида родства. Вид родства определяет матрицу М, обладающую тем свойством, что если мужчина в рассматриваемом
виде родства принадлежит к типу t, то женщина принадлежит к типу tM. На фиг. 147 мы видим, что для «дочери брата матери» М = S lD~lSD. Будем называть М матрицей родства. Всякая такая матрица представляет собой произведение, образованное из матриц S, D и обратных к ним матриц, и, следовательно, является элементом группы, порожденной матрицами S и D.
Рассмотрим аксиому 5. По заданному отношению родства между мужчиной и женщиной мы образуем матрицу М этого род-
Фиг. 147
ства. Мужчине разрешается вступать в брак со своей родственницей тогда и только тогда, когда оба они принадлежат к одному и тому же типу, т. е. когда определенная компонента t совпадает с соответствующей компонентой tM. Иными словами, эта компонента не должна измениться от перестановки М, что
доказывает нашу первую теорему:
Теорема 1. Мужчине разрешается вступать в брак с женщиной, находящейся с ним в определенном отношении родства, в том и только том случае, если его брачный тип не принадлежит эффективному множеству матрицы этого родства (см. § 13 гл. V, стр. 355).
Вторая теорема выводится из первой без труда:
Теорема 2. Браки между лицами, состоящими в родстве определенного вида, разрешаются всегда, если эффективное множество матрицы этого родства пусто; такие браки не разрешаются никогда, если эффективное множество этой матрицы является универсальным множеством.
Теорема 3. Аксиома 5 означает, что в группе, порожденной матрицами S и D, каждый элемент, кроме I, является полной Р-матрицей (см. § 13 гл. V, стр. 355).
$ 8. Составление правил бракосочетания
465
Доказательство. Аксиома 5 утверждает, что для любого данного отношения родства брак либо всегда разрешается, либо никогда не разрешается. Следовательно, по теореме 2 эффективное множество матрицы этого родства должно быть либо пустым множеством, либо универсальным. Первое означает, что эта матрица равна I, а второе означает, что она является полной Р-матрицей. Следовательно, всякая матрица родства должна либо совпадать с /, либо являться полной Р-матри-цей. Эти матрицы являются элементами группы, порожденной S и D. Обратно, если дан любой элемент группы, порожденной S и D, который, очевидно, может быть записан в виде произведения, построенного из S и D, то мы можем нарисовать фамильное дерево, имеющее эту матрицу своей матрицей родства. Следовательно, множество матриц родства совпадает с множеством элементов этой группы. Это означает, что все элементы группы, кроме I, должны быть полными P-матрицами, что и доказывает теорему.
Теорема 4. Аксиома 6 означает, что S lD является полной Р-матрицей
Эта теорема непосредственно следует из того факта, что матрица родства брат — сестра имеет вид S 'D.
Теорема 5. Аксиома 7 означает, что для любых i и j в группе, порожденной S и D, имеется матрица, переводящая ti в tj.
Доказательство. Выберем двух индивидуумов, принадлежащих соответственно к типам tt и t}. Должен существовать потомок первого из этих индивидуумов, которому разрешалось бы вступить в брак с некоторым потомком второго индивидуума. Следовательно, эти два потомка должны принадлежать к одному и тому же типу. Это означает, что существуют такие перестановки М\ и Л12, что переводит ti в тот же тип, в какой М2 переводит tj. Тогда М\М2 переводит tt в tj. Отсюда следует наша теорема.
Итак, мы преобразовали аксиомы 5—7 в следующие три условия, накладываемые на матрицы S и D: (1) Группа, порожденная S и D, состоит из матрицы I и из полных Р-матриц; (2) S^D является полной Р-матрицей; (3) Для каждой пары типов в группе, порожденной S и D, имеется перестановка, которая переводит один тип в другой.
Определение. Группа P-матриц называется регулярной, если (а) она является полной, т. е. каждый элемент этой группы, отличный от /, является полной Р-матрицей, и (Ь) для каждых двух объектов, выбранных из множества п объектов,
466
Гл. VII*. Применение к бихевиористским проблемам
в группе имеется матрица, которая переводит один из этих объектов в другой.
Основная теорема. Для того чтобы выполнялись все наши аксиомы, надо, чтобы (различные!) P-матрицы S и D порядка п порождали регулярную группу перестановок.
Доказательство. Выписанные выше условия (1) и (3) означают в точности то, что группа, порожденная 5 и D, регулярна. Но в регулярной группе каждый элемент, отличный от I, является полной перестановкой; следовательно, условие (2) требует лишь, чтобы матрица S~'D была отлична от /. Но так как S~XD = I равносильно тому, что S = D, то мы должны потребовать только, чтобы D #= 3. Теорема доказана.
Важно уметь распознавать регулярные группы Р-матриц. Здесь на помощь нам приходит одна очень простая и хорошо известная теорема: подгруппа группы перестановок п-й степени является регулярной тогда и только тогда, когда она имеет п элементов и является полной.
Это приводит нас к относительно простой процедуре. Сначала выбираем п. Затем мы должны взять группу P-матриц порядка п, состоящую из п элементов и являющуюся полной, и отобрать два различных элемента, которые порождают эту группу. При п > 1 это всегда возможно (см. упр. 11). Одна из отображенных матриц принимается за S, а другая за D. Так как для любого п существует лишь небольшое число регулярных групп перестановок, то наш выбор будет весьма ограничен.
Пример. Будем искать все возможности для общества с четырьмя брачными типами. Прежде всего, мы должны отыскать регулярные подгруппы симметрической группы 4-й степени, т. е. группы перестановок четырех объектов, состоящие из четырех элементов и являющиеся полными.
Среди таких подгрупп имеются циклические группы. Любые две из них имеют одинаковую структуру и, следовательно, приводят к эквивалентным правилам. Допустим, что мы выбрали группу перестановок, порожденную матрицей
/О 1 0 0\
_ ° 0 1 0 |
Р==1 0 0 0 11'
\1 0 0 0/
Эта группа состоит из Р, Р2, Р3 и I. Каждый из элементов Р и Р3 порождает эту группу, и, следовательно, оба элемента играют в ней одинаковую роль. Поэтому можно считать, что одной из отобранных матриц является Р Это дает нам следующие возможности: (Р, Р2), (Р, Р3) и (Р, /).
§ 8. Составление правил бракосочетания
467
Мы должны еще решить, какая из них будет S и какая D. Во втором случае это безразлично, так как Р и Р2, играют в группе одинаковую роль, но в первом и третьем случаях это влияет на результат. В итоге мы получаем пять возможностей:
1.	5 = Р, =
2.	S = P2, D = P\
3.	S = P, D = P3;
4.	S = P, D — I ;
5.	5 = I, D — P. (Это соответствует обществу Tapay *)•)
Имеется только одна нециклическая полная подгруппа с четырьмя элементами, состоящая из I и трех перестановок, которые переставляют две пары элементов. Эта группа дает по существу лишь один новый случай, так как все три перестановки играют в ней одинаковую роль.
6.	Общество Кариера ’).
Итак, окончательно, мы имеем всего шесть возможностей, причем две из этих шести возможностей иллюстрируются примерами реальных первобытных обществ.
Упражнения
1.	На фиг. 147 указана матрица одного вида двоюродного родства Найдите матрицы трех остальных видов двоюродного родства.
2.	Докажите, что брак между лицами, состоящими в некотором родстве, разрешается в том и только том случае, если матрица этого родства равна /.
3.	Докажите, используя результат упр. 2, что ни в каком обществе не разрешается брак между двоюродным братом и сестрой, родство которых указывается фиг. 143, а и б.
4.	Какое из выписанных в примере в тексте шести правил бракосочетания разрешает брак между мужчиной и дочерью сестры его отца? [Отв.-. 3, 6.]
5.	Покажите, что все указанные в примере шесть правил разрешают браки между мужчиной и дочерью брата его матери.
6.	Имеется восемь видов троюродного родства между мужчиной и женщиной. Нарисуйте родословное дерево для каждого вида.
7.	Найдите матрицу родства для каждого из восьми видов родства, фигурирующих в упр. 6.
8.	Существует ли какой-нибудь вид троюродного родства, при котором брак запрещался бы всеми возможными правилами?	[Отв.-. Да.]
0. Для каждого вида троюродного родства (кроме найденных в упр. 8) выясните возможность брака при каждом из шести возможных правил, указанных в примере в основном тексте.
10.	Рассмотрим перестановку п объектов, которая 7-й элемент (где 7 = 1, 2.
п— 1) переводит в (i + 1) -й, а последний элемент ставит на первое место. Покажите, что циклическая группа, порожденная этой перестановкой, является регулярной.
>) См. упражнения к § 7.
468	Гл. VII*. Применение к бихевиористским проблемам
11.	Используя результат упр. 10, покажите, что общество может иметь любое число п брачных типов, если только п > 1.
12.	В примере предыдущего параграфа докажите, что S и D порождают регулярную группу перестановок.
13.	Докажите, что следующие матрицы задают правило, удовлетворяющее всем аксиомам:
	0	1	0	0	0	0		0	0	0	1	0	0
	0	0	1	0	0	0		0	0	0	0	0	1
s =	1	0	0	0	0	0	, D =	0	0	0	0	1	0
	0	0	0	0	0	1		0	0	1	0	0	0
	0	0	0	1	0	1		0	1	0	0	0	0
14. Докажите, что правило, указанное в упр. 13, не разрешает никаких браков между двоюродными братом и сестрой.
§ 9. МОДЕЛЬ РАСШИРЯЮЩЕЙСЯ ЭКОНОМИКИ
Настоящая модель является видоизменением модели, предложенной Дж. фон Нейманом. Она предназначена для изучения экономики, которая расширяется в некотором фиксированном темпе, сохраняя в других отношениях равновесие. При этом делаются некоторые предположения о поведении экономики при равновесии. Они представляют собой идеализацию, и следует надеяться, что в дальнейшем модель будет заменена лучшей. В настоящее время многие экономисты рассматривают модель фон Неймана как удовлетворительное приближение к действительности. Нам эта модель нужна лишь для того, чтобы показать, как методы конечной математики могут быть применены в экономических задачах.
Экономика включает в себя п товаров и пг процессов. Товаром может быть сталь, уголь, дома, обувь и т. д. Товары являются продукцией производственных процессов в этой экономике. Для измерения товаров можно брать любые единицы измерения, если эти единицы фиксированы раз и навсегда. Ради удобства мы допускаем возможность рассматривать произвольные кратные этих единиц. Например, мы будем говорить не только о 2,75 тонны стали, но также и о 2,75 дома. Последняя цифра может быть интерпретирована как некоторое среднее.
В процессе производства в качестве сырья используются определенные товары (будем называть их входами) и производится один или несколько товаров (будем называть их выходами). Примерами такого процесса может служить превращение стали, леса, стекла и т. д. в дом. Конечно, этот процесс может быть использован для изготовления более чем одного дома, вследствие чего можно говорить об интенсивности его использования. Одним из наших основных допущений является уело-
$ 9. Модель расширяющейся экономики
469
вие линейности, означающеее, что на k домов каждого вида сырья потребуется в k раз больше, чем на один дом. Это позволяет для каждого процесса выбрать произвольную «единицу интенсивности», и процесс определен полностью, если известны все необходимые входы и все произведенные выходы для этой единичной операции.
’ Процессу номер i, используемому с единичной интенсивностью, потребуется в качестве входа определенное количество товара /. Это количество мы будем обозначать через а^_ (В частности, если в процессе i не используется товар j, то = 0.) Через btj мы будем обозначать количество товара /, производимого в процессе i. Мы допускаем, что в данном процессе производится несколько различных товаров (например, основной выход и побочные продукты). Но, конечно, допускаются и такие процессы, в которых производится всего лишь один товар. Тогда для рассматриваемого i все bij, кроме одного, равны нулю. Все atj и бу— неотрицательные числа.
Обозначим (m X п)-матрицу с компонентами atj через А, a (m X п) -матрицу с компонентами бу через В. Вся экономика может быть описана посредством этих двух матриц.
Нам остается рассмотреть фактор времени. Обычно считают, что экономика работает по стадиям, или циклам. Продолжительность одной такой стадии как раз достаточна для того, чтобы входы ац превратились в выходы Ьц. Тогда в следующей стадии эти выходы в свою очередь могут быть использованы как входы. В качестве длины этого.цикла может быть выбран любой удобный для изучения данной экономики промежуток времени. Это может быть месяц, год или несколько лет
Пример. Пусть нашей экономической системой является птицеферма. Товарами здесь служат куры и яйца; в качестве единиц естественно принять одну курицу и одно яйцо. Процессов у нас два: несение яиц и высиживание цыплят. Предположим, что если курицу использовать для несения яиц, то за один месяц она снесет их около 12 штук, если же курицу использовать для высиживания цыплят, то за это же время она высидит в среднем четырех цыплят. Исходя из этой информации, мы можем построить матрицы А и В, Длину нашего цикла будем считать равной одному месяцу. «Курица» будет товаром 1, «яйцо» будет товаром 2, «несение» будет процессом 1 и «высиживание» будет процессом 2. Единицей интенсивности процесса будет то, что может произвести одна курица за один месяц. Вход процесса 1 состоит из одной курицы, т. е. из одной единицы товара 1. Выход будет состоять из дюжины яиц плюс наседка. (Про нее нельзя забывать, потому что эта курица
470
Гл. VII* Применение к бихевиористским проблемам
может быть использована снова в следующем цикле.) Следовательно, этот выход состоит из одной единицы товара 1 и двенадцати единиц товара 2. Вход процесса 2 состоит из одной курицы и четырех яиц, а выход состоит из пяти кур (одна первоначальная плюс четыре высиженные). Следовательно, наши матрицы имеют вид:
курица яйцо
несение яиц
А —
высиживание цыплят
курица яйцо
несение яиц	/	1
высиживание цыплят \ 5
12
0
Предположим, что сначала у нашего фермера имеется три курицы и восемь яиц, из которых он хочет вывести цыплят. Тогда две курицы ему понадобятся для высиживания цыплят из этих восьми яиц и одна курица будет нестись. Следовательно, он использует процесс 1 с интенсивностью 1, а процесс 2 — с интенсивностью 2. Мы записываем это с помощью вектора интенсивности х — (1, 2). Заметим. что входами служат компоненты вектора хА. Одна курица снесет 12 яиц. Кроме того, фермер будет иметь трех прежних кур плюс восемь новых. Следовательно, выход равен 11 единицам товара 1 и 12 единицам товара 2. Эти числа являются компонентами вектора хВ. Из 11 кур только три могут быть использованы для высиживания цыплят, следовательно, на этот раз фермер использует вектор интенсивности (8, 3). Легко проверить, что (см. упр. 1) выходы будут (8, 3)В = (23, 96). Теперь у фермера имеется 96 яиц и только 23 курицы, так что не все яйца могут быть использованы.
Теперь сделаем другое предположение, а именно, что наш фермер начинает с двух кур и четырех яиц. В этом случае он использует интенсивность (1, 1). Одна курица снесет 12 яиц, а число кур вместе с четырьмя высиженными станет равным шести. Этот результат представлен произведением (1, 1) -В — (6, 12). В результате первого цикла фермер утроил количество кур и яиц. В следующем цикле он может использовать интенсивность (3, 3); что даст ему (3, 3)В = (18, 36), т, е, снова утраивает как количество
§ 9. Модель расширяющейся экономики
471
кур, так и количество яиц. Таким образом, он может продолжать использовать оба эти процесса в одинаковой пропорции и в каждом цикле утраивать свой выход. Такая экономика удерживается в равновесии.
Из разобранного примера видно, что интенсивности процессов естественно представлять посредством вектора-строки: если интенсивность использования i-ro процесса равна Х{, то вектор х = (хь ..., хт) называется вектором интенсивности. Посредством умножения матриц без труда находится общее коли чество каждого необходимого товара и каждого произведенного товара. Вектор хА имеет в качестве своей /-й компоненты сумму ...	здесь ххах) дает количество /-го товара,
используемого в процессе 1, x2a2j—количество этого товара, используемого в процессе 2, и т. д. Следовательно, /я компонента вектора хА показывает общее количество /-го товара, потребляемое в качестве входа. Аналогично хВ дает общее количество раз
личных товаров на выходе.
Теперь мы должны установить цены на различные товары. Пусть у, означает цену одной единицы товара /; число у, должно быть неотрицательным числом, но может быть нулем. (Последнее означает, что данный товар продается столь дешево, что «практически ничего не стоит».) Предполагается, что k
У1
единиц товара j стоят ky. Вектор-столбец у =
называется
Уп}
вектором цен. Рассмотрим произведения Ау и By. Вектор Ау имеет в качестве своей i-й компоненты величину аауг + •  • ... -j- ainyn; произведение ЯлУ: равно количеству товара 1, потребляемого в процессе i единичной интенсивности, умноженному на цену одной единицы товара 1, т. е. стоимости товара 1, используемого в этом процессе; ai2y2 есть стоимость используемого товара 2 и т. д. Следовательно, i-й компонентой вектора Ау будет полная стоимость входов в процессе i единичной интенсивности. Аналогично By дает стоимость выходов.
Наконец, рассмотрим произведения хАу и хВу. Так как х есть (1 X пг) -матрица, А и В суть (m X п)-матрицы и у есть (п X 1)-матрица, то каждое из этих произведений является (1 X 1)-матрицей, т. е. числом. Анализ, подобный предыдущему, показывает, что хАу представляет собой общую стоимость входов, если экономика работает с интенсивностью х и ценами у, а хВу — стоимость всех произведенных товаров. (См. упр. 2.)
Пример (продолжение). Допустим, что курица стоит 10 денежных единиц, а яйцо стоит 1 единицу; тогда
472
Гл. VII*. Применение к бихевиористским проблемам
/10\ о у — J • Здесь
/10\	/22\
лУ=к14) » Ву^во)-
Это означает, что процесс 1 несения яиц умножает наше вложение в 2,2 раза, а процесс 2 (высиживание) приносит свыше 3,5 доллара на каждый вложенный доллар. Это вынуждает использовать кур исключительно для высиживания цыплят, что приводит к сокращению количества яиц, вызывая резкое изменение цен. Допустим теперь, что курица стоит только в шесть раз больше, чем яйцо, т. е.
/6\	/ 6\	/18\
У =	)• Т°гда Ду —I до ) и 5у==( до )• В этом слу-
чае каждый процесс утраивает наше вложение и это не вызовет колебания цен. Следовательно, фермер может использовать свои процессы таким образом, чтобы сохранялось равновесие, и при этом структура цен была стабильной.
Последний фактор, который остается рассмотреть, — это расширение экономики. Мы предполагаем, что все расширяется в некотором постоянном отношении, т. е. что имеется фиксированный коэффициент расширения а такой, что если в данном цикле процесс используется с интенсивностью х, то в следующем цикле он будет использоваться с интенсивностью ах, затем а2х и т. д. С деньгами происходит также нечто подобное расширению: благодаря получению процентов у денежных единиц превращаются в конце цикла в fy денежных единиц. Мы снова предполагаем, что коэффициент дохода р фиксирован в находящейся в равновесии экономической системе раз и навсегда. Эти коэффициенты обычно бывают больше единицы, но последнее вовсе не обязательно. Случай а = 1 представляет стационарную экономику, случай а < 1 — сокращающуюся экономику.
На этом заканчивается обзор основных понятий. Теперь мы должны сформулировать наши предположения, касающиеся поведения экономики, находящейся в равновесии. Эти предположения играют роль аксиом.
Прежде всего мы должны гарантировать, чтобы в каждом цикле каждый товар производился в количестве, достаточном для обеспечения входов следующего цикла. Если в данном цикле экономика функционирует с интенсивностью х, то в следующем цикле она будет функционировать с интенсивностью ах.
§ 9 Модель расширяющейся экономики
473
Выходы в этом цикле будут иметь вид хВ, а входы в следующем цикле — ахА; следовательно, должно иметь место
Аксиома 1.	хВ ахА.
(Когда мы пишем неравенство, связывающее два вектора, то • подразумеваем, что это неравенство выполняется для каждой компоненты векторов.) Разумеется, подобные же требования мы должны выдвинуть и в дальнейшем. Например, выходы во втором цикле представлены вектором ахВ, а входы, необходимые для третьего цикла, — вектором <х2хА. Но если мы запишем условие ахВ >-а2хА, то а сократится, и мы снова придем к условию аксиомы 1. Следовательно, эта аксиома обслуживает все циклы.
Первое условие обеспечивает возможность расширения экономики в постоянном отношении а. Мы должны также обеспечить финансовое равновесие экономики. Допустим, что стоимость выхода некоторого процесса превосходит стоимость входа более чем в (3 раз. Тогда мы должны быть готовы обеспечить более высокий процент дохода всякому лицу, желающему вложить капитал в наш процесс. Это привело бы к увеличению (3. Следовательно, при равновесии этого не должно быть; никакой процесс не может приносить больший процент дохода, чем тот, который доставляется вложением капиталов в этот процесс. Если мы оперируем с процессами единичной интенсивности, то вектор Ау дает стоимости входов, а вектор By — стоимости выходов. Для любого процесса последние не могут превышать первые более чем в (3 раз:
Аксиома 2. By ^.^Ау.
Следующее предположение касается сверхпродукции. Если данный товар мы производим в количестве, превышающем количество этого товара, используемое всей экономикой, то цены резко падают, так как предприниматели стараются избавиться от своей продукции. Обычно делают упрощающее предположение, что такие товары являются бесплатными, т. е. полагают их цену равной нулю. Разность векторов хВ — ахА = х(В — аА) (неотрицательная в силу аксиомы 1!) дает количество сверхпродукции, так что /-я компонента этой разности будет положительна тогда и только тогда, когда имеет место перепроизводство товара /. Если этим товарам приписывается цена нуль, то в произведении предыдущего вектора на вектор у каждая ненулевая компонента первого вектора умножается на множитель нуль; следовательно, произведение этих двух векторов равно 0:
Аксиома 3. х(В — aA)i/=0
Теперь мы обратимся к вопросу, стоит ли применять данный процесс. В соответствии с аксиомой 2 никакой процесс не может дать больше прибыли, чем простое вложение капитала. Но если он дает хоть сколько-нибудь меньше, то вместо того, чтобы
31 Зак. 994.
474	Гл VII*. Применение к бихевиористским проблемам
применять его, лучше инвестировать наш капитал. Поэтому мы образуем разность By — $Ау левой и правой части неравенства аксиомы 2, и если i-я компонента этой разности отрицательна, то процесс i применять не стоит: ему должна быть приписана интенсивность 0. Рассуждение, аналогичное тому, которое использовалось в случае аксиомы 3, показывает, что умножение нашей разности на х должно дать нуль:
Аксиома 4. х(В — рА)у = 0.
Наше заключительное предположение состоит в том, что эко
номика производит некоторую полезную продукцию, т. е. что стоимость всех производимых товаров является положительной величиной:
Аксиома 5.	хВу > 0.
Если для данной экономики (данных А и В) найдены векторы х и у и числа аир, удовлетворяющие нашим пяти аксиомам, то мы говорим, что для этой экономики найдено некоторое
возможное равновесное решение.
Пример (продолжение). Мы видели, что если х = (1,1), то экономика расширяется в постоянном отношении а = 3. Можно проверить, что аксиома 1 удовлетворяется. Действительно, хВ оказывается равным ахА. Аналогично мы
отметили денежное равновесие при у —
В этом случае
процесс умножает вложенный в него капитал с коэффициентом дохода (3 = 3. Можно проверить выполнимость аксиомы 2. Действительно, в этом случае By равно @Ау. Из этих двух равенств мы можем также заключить, что х(В — аА) и (В — (ЗА) у тождественно равны нулю; следовательно, выполняются аксиомы 3 и 4. Наконец хВу — 48; общая стоимость произведенных товаров положительна, так что выполняется и аксиома 5. Следовательно, эти значения х, у, а ир обеспечивают равновесие экономики. Можно также показать, что это суть единственно возможные значения для а и р и что х и у должны быть пропорциональны приведенным (что можно просто мыслить как переход к другим единицам).
В разобранном примере мы нашли для экономики одно и только одно состояние равновесия и нашли, что в этом случае а = р. Это вызывает несколько очень естественных вопросов: (1) Возможно ли равновесие для каждой экономики? (2) Если да, то будет ли оно единственным? (3) Всегда ли коэффициент расширения должен быть тем же самым, что и коэффициент дохода? В следующем параграфе мы получим следующие ответы на эти вопросы: (1) Для каждой экономики, удовлетво
§ 9. Модель расширяющейся экономики
475
ряющей некоторому условию (этому условию, несомненно, удовлетворяют все существующие экономики), возможно равновесие. (2) Равновесий может быть более одного, хотя число различных возможных коэффициентов расширения конечно. (В рассмотренном примере имелась по существу одна возможность для х и у, однако в общем случае это неверно.) .(3) В случае равновесия коэффициент дохода всегда равен коэффициенту расширения.
Упражнения
I.	В разобранном в тексте примере, полагая х — (1, 2), проверьте для трех циклов, что хА и хВ правильно дают входы и выходы.
2.	Интерпретируйте хАу и хВу:
(а)	используя данные выше интерпретации векторов хА и хВ;
(Ь)	используя данные выше интерпретации векторов Ау и By;
(с)	покажите, что результаты пп. (а) и (Ь) совпадают.
3.	Пусть в примере текста две курицы несутся, а три высиживают цыплят. Найдите х, хА и хВ. Подставьте эти величины в условие аксиомы 1 и найдите наибольший возможный коэффициент.	[Отв.: а = 2.]
4.	Пусть в примере одна курица стоит 80 центов, а одно яйцо стоит 5 центов. Найдите х, хА н хВ. Подставьте эти величины в условие аксиомы 2 и найдите наименьший возможный коэффициент дохода. [Отв.: р = 4.]
5.	Покажите, что х, у, а и р, найденные в двух предыдущих упражнениях, не приводят к равновесию, доказав, что не выполняются аксиомы 3 и 4.
6.	Покажите, что если а = р = 3, то единственно возможные х и у пропорциональны указанным выше. [Указание. Покажите, что аксиомы вынуждают нас принять Xi = Хг и yi = 6у2.]
Остальные задачи относятся к следующей экономической системе. На птицеферме имеется порода кур, представители которой несут в месяц
„1	16
в среднем по 16 яиц и высиживают в месяц в среднем 3-g- = -g- цыплят.
7.	Выпишите матрицы А н В
8.	Пусть три из наших кур несутся, а пять высиживают цыплят. Найдите х, хА и хВ. Чему равен коэффициент а?
[Отв.: х = (3, 5); хА = (8, 16); хВ = (24, 48); а = 3.]
Я. Пусть курица стоит 40 центов, а яйцо стоит 5 центов. Найдите у, Ау и By. Чему равно р ?
10.	Проверьте путем подстановки в пять аксиом, что х, у, а и Р, найденные в предыдущих упражнениях, обеспечивают равновесие экономики.
11.	Пусть мы начинаем с 16 кур и 32 яиц. Подберите такие интенсивности, чтобы экономика находилась в равновесии, и найдите результат первых трех месяцев.	[Оте.: х= (6, 10); 432 курицы и 864 яйца.]
12.	Пусть мы начинаем с 16 кур и 32 янц, причем только пять кур используются для высиживания цыплят, а остальные несутся. Покажите, что через три месяца мы получим меньшее число кур, чем мы их получила бы в условиях равновесия, (См. упр, 11.)
31*
476	Г л. VII*. Применение к бихевиористским проблемам
§ 10. СУЩЕСТВОВАНИЕ ЭКОНОМИЧЕСКОГО РАВНОВЕСИЯ
Возникает вопрос, всегда ли можно удовлетворить аксиомам, т. е. допускает ли наша модель экономики равновесие.
Разумеется, нас интересуют лишь такие экономические системы, которые могут реально существовать. Это значит, что рассматриваемые товары должны быть товарами, которые как-то производятся и которые не могут быть произведены из ничего. Следовательно, в каждом процессе должен затрачиваться по меньшей мере один сырьевой материал и для каждого товара должен существовать по меньшей мере один процесс, производящий этот товар. Резюмируем это.
Ограничение. В каждой строке матрицы Айв каждом столбце матрицы В имеется по меньшей мере один положительный элемент.
Теорема. Если А и В удовлетворяют указанному выше условию, то равновесие возможно.
Мы приведем набросок доказательства.
Согласно аксиоме 3, хВу = ахАу, тогда как, согласно аксиоме 4, хВу = fixAy. Следовательно, ахАу = рхАу. Далее, из аксиомы 5 следует, что хВу не равно нулю, поэтому хАу также не равно нулю. Отсюда а = (3. Итак, при равновесии коэффициент расширения обязательно равен коэффициенту дохода.
Если а = р, то аксиомы 3 и 4 становятся эквивалентными. Перепишем, используя наш результат, первые две аксиомы в следующем виде:
Аксиома 1'. х(В— аА)^>0.
А к с и о м а 2'.	(В — аА) у < 0.
Если первое неравенство умножить справа на у, а второе умножить слева на у, то станет очевидным, что аксиома 3 (а следовательно, и аксиома 4) вытекает из этих двух аксиом. Следовательно, мы должны заботиться лишь об удовлетворении аксиом 1', 2' и 5.
Идея доказательства заключается в том, что наша задача интерпретируется как некоторая задача теории игр. Это делается вопреки тому, что в рассматриваемой модели нет речи ни о какой игре. Математические результаты теории игр используются просто как средство.
Аксиомы 1' и 2' наводят нас на мысль рассматривать матрицу В — аА как матрицу некоторой игры. Тогда векторы х и у можно рассматривать как смешанные стратегии двух игроков. Эти векторы неотрицательны, но суммы их компонент не обязаны быть равными 1. Однако мы знаем, что умножение вектора х на константу можно рассматривать как переход к дру
§ 10. Существование экономического равновесия
477
гим единицам интенсивности, а умножение вектора у на константу — как переход к другим единицам различных товаров. Следовательно, можно считать, не умаляя общности, что суммы компонент векторов х и у равны 1, и мыслить эти векторы как смешанные стратегии. Тогда первые две аксиомы означают, что цена этой игры равна нулю и что х и у образуют пару оптимальных стратегий двух игроков. Таким образом, наша первая задача заключается в выборе такого а, чтобы цена «игры» с матрицей В — аА была равна нулю.
Пример 1. Будем рассматривать пример предыдущего параграфа как игру с матрицей
/1 —а М=В — аД = (
\5— а
12
—4а
Если за смешанную стратегию для первого игрока (кото-рыи распоряжается строками) принять х = ( у I, то хМ = [3 — а, 2(3 — а)]. Если а < 3, то обе компоненты положительны; следовательно, цена этой игры больше нуля. Если за смешанную стратегию второго игрока (который
распоряжается столбцами) принять вектор
6(3 —а)ч
10(3 —а)/
Если а > 3, то обе компоненты отрицательны и, следовательно, цена игры отрицательна. Итак, единственным значением а, при котором еще цена игры может равняться нулю, является а = 3, а из предыдущего мы знаем, что в этом случае цена действительно равна нулю и что х и у являются оптимальными стратегиями. (См. упр. 1.)
Теперь мы должны показать, что рассмотренный пример является типичным в том смысле, что всегда можно найти а, при котором цена игры с матрицей В — аА равна нулю. Эту матрицу можно записать в виде суммы В + а(—Л) и представить игру как комбинацию игры с матрицей В и игры с матрицей (—Д).
Согласно нашему ограничению, каждый столбец матрицы В имеет положительный элемент. Вектор стратегии у второго игрока имеет по крайней мере одну. положительную компоненту. Следовательно, по меньшей мере одна компонента произведения By должна быть положительной; поэтому цена игры с матрицей В положительна. Так как каждая строка матрицы А имеет положительный элемент, то каждая строка матрицы (—Д)
478	Гл. VII*, Применение к бихевиористским проблемам
должна иметь отрицательный элемент. Следовательно, по крайней мере одна компонента вектора х(—Л) должна быть отрицательной, и цена игры с матрицей (—Л) отрицательна.
В выражении В + а(—Л) при очень малом а вторым членом можно пренебречь. Следовательно, при таком а цена игры будет положительной. Будем теперь увеличивать а. Это равносильно тому, что к некоторым элементам матрицы В + а(—Л) прибавляются большие отрицательные величины, т. е. эти элементы убывают. Следовательно, цена игры все время убывает. При очень большом а первым членом можно пренебречь и, следовательно, комбинированная игра имеет отрицательную цену. Для некоторого промежуточного значения а цена этой игры должна равняться нулю.
Пример 1 (продолжение). Цена игры с матрицей М при различных а показана на фиг. 148. Так как цена игры с матрицей В равна , а цена игры с матрицей (— Л) равна 1 (см. упр. 2), то при малых а цена игры с матрицей М близка к При больших а она будет близкой к 2 — а,
Мы знаем, что имеется по крайней мере одно а, при котором цена игры с матрицей В — аЛ равна нулю. Всякое такое а вместе с парой х, у оптимальных стратегий дает систему величин, для которой выполнены аксиомы 1' и 2'. Выполнение аксиомы 5 пока что остается под вопросом.
Если р и q — два значения а, при’которых цена игры равна нулю, то этим же свойством обладает каждое число, заключенное между р и q. Это следует из того, что, как мы видели, с возрастанием а цена игры не может возрастать. Следовательно, в рассматриваемом случае дело обстоит так, как это представлено на фиг. 149. Можно показать, однако, что в большинстве
§ 10. Существование экономического равновесия
479
своем эти значения соответствуют экономикам, которые не производят ничего полезного, т. е. случаю, когда не выполнена аксиома 5. При выполнении аксиомы 5 новые а могут получаться лишь за счет введения по меньшей мере одного нового процесса. Но так как процессов имеется лишь конечное число, то в интервале между р и q может быть лишь конечное число различных возможных а. Если р — наименьший из возможных коэффициентов расширения, a q — наибольший, то р и q таковы, что может быть удовлетворена аксиома 5. Между ними находится конечное число дополнительных а.
Пример 2. В химической промышленности нас интересует изготовление соединений Р, Q и /?. Мы предполагаем, что основные химикалии имеются в изобилии и в данном рассмотрении стоимостью их можно пренебречь. Но для изготовления соединения Р необходимо иметь в наличности единицу как Р, так и Q, а для изготовления Q необходимо иметь Р и R. Соединение R является побочным продуктом обоих процессов изготовления. Числовые данные таковы:
Р Q R Изготовление Р /1 1 О Изготовление Q \ 1 0 1, Р Q R Изготовление Р /6 0 1 Изготовление Q \0 3 2
Тогда
[ 6 — а
М=В— =
\ —а Пусть
/1
Л=к2’2') и У =
Тогда
хМ — (% — а, i (3 — а),	(3 — a)j
-а 1 \
3 2— а )
6
J_
3 *
1
2
A(S-«) и Му = I 9
480	Гл. VII*. Применение к бихевиористским проблемам
Отсюда мы видим, что при а < 3 для игрока, распоряжающегося строками, гарантирована прибыль, а при а > 3 для игрока, распоряжающегося столбцами, гарантирована прибыль. Таким образом, случай а = 3 является единственной возможностью. Для этого случая цена игры действительно
равна нулю, а векторы х и у являются оптимальными стратегиями. Последнее видно из того, что все компоненты векторов хМ и Му равны нулю. Таким образом, имеется единственный случай равновесия, а именно при а = (3 = 3.
Мы видим также, что смешанная стратегия является единственной. Это означает, что оба процесса должны использоваться с одной и той же интенсивностью. Однако
не единственна. Вместо нее можно взять стра-
стратегия у тегию
Г
2
2 О
или
0
4
3^ 4
или любую комбинацию ty' + (1 — t)y", 0 Г/С 1 Наша стратегия у получается при t = -g- . Следовательно, воз
можны различные структуры цен, приводящие к одному и тому же коэффициенту расширения.
Пример 3. Эта «экономика» представляет схематически производство в некотором обществе необходимых предметов и предметов роскоши. Все товары делятся на два типа, N (необходимые товары) и R (предметы роскоши). Для изготовления N требуются только необходимые товары (поскольку все, что требуется для изготовления необходимых товаров, является необходимым). Для изготовления R может потребоваться сырье обоих типов. Пусть наша экономика функционирует следующим образом:
Изготовление необходимых товаров /1 0\
Изготовление предметов роскоши \0 1/
NR
Изготовление необходимых товаров /4 0
- Изготовление предметов роскоши \0 2
Тогда
/4 —а 0 \
— о )•
\ —а 2— а /
§ iO Существование экономического равновесия
481
Запасшись некоторым терпеньем, можно определить цены игр с матрицей М для различных значений а, что даст нам кривую, изображенную на фиг. 149. (См. упр. 4.) Следовательно, а должно лежать между 2 и 4. При а = 4 мы
1
О
влетворяющие всем нашим аксиомам, тогда как при а = 2 мы имеем
имеем оптимальные стратегии х = (1, 0) и у =
I, УДО-
Для промежуточных значений а аксиома 5 не выполняется. (См. упр. 5—7.) Следовательно, возможны два случая равновесия: (1) Общество решает производить только необходимые товары, и в этом случае производство их будет быстро расти. (2) Установив достаточно высокие цены на предметы роскоши, общество достигает равновесия, при котором производятся товары обоих типов, но от этого заметно снижается коэффициент расширения.
Итак, мы получили исчерпывающие ответы на все три вопроса, поставленные в конце предыдущего параграфа. Эти ответы дают математическое решение ряда экономических задач.
Упражнения
1.	В примере 1 проверьте, что при а = 3 цена игры с матрицей М равна 0 и что приведенные х и у являются оптимальными стратегиями.
2.	В примере 1 решите (2 X 2)-игры В и —А, т. е. найдите их йены и пары оптимальных стратегий.
3.	В примере 1:
(а)	Покажите, что для каждого а игра с матрицей М является не строго детерминированной.
(Ь)	Найдите цену игры с матрицей М для любого а.
[Отв.: (5 + «) (3 — а)/(4 - а).]
15
(с)	Покажите, что при а = 0,01 эта цена очень близка к
(d)	Покажите, что при а = 100 эта цена очень близка к —98.
(е)	Покажите, что при положительном а эта цена равна нулю тогда и только тогда, когда а = 3.
4.	В примере 3 найдите цену игры с матрицей М для а— 0, 1, 2, 3, 4, 5 и 6. (Указание. Некоторые из этих игр являются строго детерминированными).	[Отв.: 1,33; 0,60; 0; 0; —1,00; —2,00.]
5.	В примере 3 проверьте, что при а — 4 приведенные стратегии являются оптимальными и выполняется аксиома 5.
6.	В примере 3 проверьте, что при а = 2 приведенные стратегии являются оптимальными и выполняется аксиома 5,
482 Гл. VII*. Применение к бихевиористским проблемам
1.	В примере 3 найдите для а = 3 единственные оптимальные х и у и покажите, что аксиома 5 не выполняется. Докажите, что то же самое имеет место для каждого 2 < а < 4.
В остальных задачах рассматривается следующая экономика. Имеется четыре товара и пять процессов; матрицы А и В имеют вид
0 0 11
0 0 2 2
0 4 0 2
2 110
0 10 2
	0	0	4	2
	0	0	5	7
в =	6	5	4	0
	0	4	0	3
	3	0	6	0
Пусть также х
8.	Проверьте, что А и В удовлетворяют ограничению, сформулированному в начале этого раздела.
9.	Найдите М = В—а А.
10.	Найдите хМ, х'М, Му и Му'.
11.	При каком условии все компоненты вектора х'М положительны? При каком условии все компоненты вектора Му' отрицательны? Какие при этом имеются возможности для а?	[Отв.:а <2;а <3; 2 О 3.|
12.	Покажите, что для всех остальных возможных значений а цена игры с матрицей М равна нулю, а х и у являются оптимальными стратегиями.
13.	Покажите, что при наибольшем возможном значении а векторы х и у' дают оптимальные стратегии, удовлетворяющие аксиоме 5.
14.	Покажите, что при наименьшем возможном значении а векторы х’ и у дают оптимальные стратегии, удовлетворяющие аксиоме 5.
15.	Покажите, что если а заключено между двумя его предельными возможными значениями, то
(а)	последние две компоненты вектора хМ положительны и, следовательно, второй игрок может использовать только две первые свои стратегии;
(Ь)	последние три компоненты вектора Му отрицательны и, следовательно, первый игрок может использовать только две первые свои стратегии;
(с)	для этих случаев аксиома 5 не выполняется.
16.	Процесс номер пять находится в особом положении. Почему?
[Отв.: Он никогда не применяется.]
17.	Используя результаты упр. 8—16, покажите, что для этой экономики возможны в точности два случая равновесия. Интерпретируйте каждый
£ 10. Существование экономического равновесия
483
случай и укажите разницу между двумя способами функционирования экономики.
[Отв.: За счет снижения коэффициента расширения экономика может производить больше различных товаров Чтобы это имело место, дополнительные виды товаров должны цениться (относительно) очень высоко.]
ЛИТЕРАТУРА ДЛЯ ДОПОЛНИТЕЛЬНОГО ЧТЕНИЯ
Duncan L. R., Perry A. D., A method of matrix analysis of group structure, Psychometrica, 14, 1949, стр. 95—116.
Estes W. K., Burke C. J., Application of a statistical model to simple discrimination learning in human subjects, Journ. Exp. Psychol., 50. 1955, стр. 81—88.
Буш P. P., M о с т e л л e p Ф., Стохастические модели обучения. M., Физмат-гиз, 1962.
Weil A., Sur 1’etude de certains types de lois de marriage (Systeme Murngin), в приложении к первой части книги Levi-Strauss С., Les structures elementaire de la parente, Paris, 1949, стр. 278—285.
Kemeny J., Morgenstern O., Thompson G. L., A generalisation of the von Neumann model of an expanding economy, Econometrica. 24. 1956. стр. 115—135.
К e m e n у J. G., S n e 11 J. L., Finite Markov Chains, Princeton, 1959.
К e m e n у J. G„ Snell J. L., Mathematical Models in the Social Sciences, Boston — New York, 1962.
ОГЛАВЛЕНИЕ
От редактора русского издания	5
Предисловие . .	.......	11
ГЛАВА I. СОСТАВНЫЕ ВЫСКАЗЫВАНИЯ	.	15
§ 1.	Цель теории............................  .	...	15
§ 2.	Простейшие связки .	. ....	19
§	3.	Другие связки......................................... 24
§ 4*	. Высказывания с заданными таблицами истинности .	29
§	5	Логические возможности..................................... 33
§	6.	Деревья логических возможностей . .	42
§ 7.	Логические отношения.................................. .	.	48
§ 8*	.	Систематический анализ логических отношений .	...	52
§	9.	Варианты импликации..................................... .57
§	10.	Правильные аргументы.................................... .60
§ 11*.	Косвенный метод доказательства....	.	.	65
§ 12*.	Применения к переключательным	схемам .	.	.	67
Литература для дополнительного чтения ......... . . 72
ГЛАВА II. МНОЖЕСТВА И ПОДМНОЖЕСТВА ...	73
§ 1	Введение...................... .	.73
§ 2.	Операции над подмножествами................................ 78
§ 3	Соотношение между множествами и составными высказываниями 83
§ 4*	. Абстрактные законы операций над множествами............. 88
§ 5*	. Предикаты ....	................................. 90
§ 6.	Функции ....	...	.	.	95
§ 7.	Числовые функции..................  .	. .	101
§ 8*. Базис пространства логических возможностей .	104
§ 9*. Кванторы................................ .	.	. . Цо
§ 10. Двоичные числовые системы..................................114
Оглавление
485
§ 11*. Голосующие коалиции.............
Литература для дополнительного чтения .
ГЛАВА III. РАЗБИЕНИЯ И СОЧЕТАНИЯ.............
§ 1. Разбиения.......................
§ 2*. Приложения.......................
§ 3. Число элементов множества ....
§ 4. Перестановки......................
§ 5. Число упорядоченных разбиений -
§ 6- Некоторые свойства чисел ” j ....
§ 7. Биномиальная и полиномиальная теоремы . . .
§ 8*. Вес при голосовании ......................
Литература для дополнительного чтения . . .
. . . 120
. . . 123
• 124
. . . 124
. . 128
. . . 132
. . . 137
. . 142
. . 148
. . . 154
. . . 158
. . . 161
ГЛАВА IV. ТЕОРИЯ ВЕРОЯТНОСТЕЙ.................................. -	162
§ 1.	Введение.................................................  162
§ 2.	Свойства вероятностной меры.................... . . 166
§ 3.	Симметричная мера.............................. . . 171
§ 4*. Два примера, не подкрепляемых интуицией.................. .	176
§ 5. Условная вероятность................................... . . 181
§	6*.	Меры как площади..........................................190
§ 7. Конечные стохастические процессы. Деревья, веса путей и веса ветвей...........................................................197
§	Тр	и типа стохастических	процессов......................  209
§ 9.	Независимые испытания с двумя исходами.................. .	216
§ 10.	Биномиальная мера и ее пуассоновская аппроксимация	....	220
§ И.	Закон больших чисел.............. ....	...	226
§ 12*	.	Проблема выбора решения............................ 231
§ 13.	Процесс независимых испытаний более чем	с	двумя исходами .	238
§ 14.	Среднее значение.................................... 244
§ 15.	Марковские цепи........................................ ,	251
Литература для дополнительного чтения	. . 258
ГЛАВА V. ВЕКТОРЫ и матрицы .................................. .	259
§	1.	Векторы-столбцы и векторы-строки.	.	.	259
§	2.	Произведение векторов, примеры.............	264
§	3.	Матрицы и их комбинации с векторами	.	271
§	4.	Сложение и умножение матриц. 278
§	5.	Системы линейных уравнений .	287
§	6.	Обратная матрица...................................................... 296
§	7.	Применение теории матриц к марковским	цепям	301
§ 8*	. Эргодические марковские цепи.......... .	... ЗЮ
§ 9*.	Дальнейшие примеры марковских цепей.......................................321
486
Оглавление
§ 10	*. Примеры марковских цепей в физике. Энтропия . .	... 330
§ 11	*. Линейные функции и линейные преобразования.............341
§ 12	*. Р-матрицы..............................................345
§ IS	’*. Подгруппы группы перестановок.................... ...	351
Литература для дополнительного чтения..................... ....	356
ГЛАВА VI*. ЛИНЕЙНОЕ ПРОГРАММИРОВАНИЕ И ТЕОРИЯ ИГР...............357
§ 1.	Выпуклые множества...................................... 3.57
§	2.	Максимумы и минимумы линейных функций	...	....	362
§	3.	Задачи линейного программирования........... .	.	367
§	4.	Строго детерминированные игры................... ...	373
§ 5.	Не строго детерминированные игры......................... 379
§ 6.	Матричные игры............................................387
§ 7.	Еще о матричных играх: основная теорема...................397
§	8.	Игры, матрицы которых имеют только две строки или только
два столбца...............................................400
§ 9.	Упрощенный покер..........................................409
Литература для дополнительного чтения...........................414
ГЛАВА VII*. ПРИМЕНЕНИЕ К БИХЕВИОРИСТСКИМ ПРОБЛЕМАМ..............415
§	1.	Социометрические матрицы........................ ...	415
§	2.	Коммуникационные сети............................  .	423
§	3.	Стохастические процессы в генетике.......... . .	428
§	4.	Марковские цепи с поглощением и генетика.............435
§	5.	Модель обучения Истиза.......................... ...	449
§	6.	Предельные вероятности в модели Истиза...............453
§	7.	Правила бракосочетания в первобытных обществах.......458
§	8.	Составление правил бракосочетания....................463
§	9.	Модель расширяющейся экономики.................. ...	468
§	10.	Существование экономического равновесия..............476
Литература для дополнительного чтения........................ .	483
Дж. Кемени, Дж. Снелл, Дж. Томпсон
ВВЕДЕНИЕ
В КОНЕЧНУЮ МАТЕМАТИКУ
Редактор В. В. Гольдберг Художник Н. А. Зарин Технические редакторы Е. И. Шилина и Л. М. Харьковская Корректор 7, А. Палладина
Подписано к печати с матриц 17/XII 1964 г. Бумага 60x92*/i6=15,3 бум. л.
30,5 печ. л. Уч.-изд. л. 27,7. Изд. № 1/3214. Цена 2 р. 14 к. Зак. 994.
ИЗДАТЕЛЬСТВО «МИР» Москва, 1-й Рижский пер., 2
Ленинградская типография № 2 имени Евгении Соколовой Главполиграф пром а Государственного комитета Совета Министров СССР по печати.
Измайловский проспект, 29.
vp~4°